Перегиб ИИстартап из Пало-Альто, основанный Мустафа Сулейман, сооснователь DeepMind, и Рид Хоффман, соучредитель LinkedInсегодня объявила о запуске новой фундаментальной модели под названием Перегиб-2,5. Эта новая модель, основанная на проделанной до сих пор работе, значительно превосходит оригинальную Inflection-1 компании и значительно приближается к модели. GPT-4 на OpenAIособенно когда дело касается предметов КОРЕНЬ. Перегиб-2.5 приводит в действие Чат-бот компании Piсозданный для конкуренции с ChatGPT и Gemini, и доступен для тестирования на мобильных устройствах и в Интернете.
Содержание
Значительные улучшения, но все еще отстают от GPT-4.
С момента своего создания, Перегиб ИИ сосредоточилась на разработке «чуткого, отзывчивого и уверенного в себе» ИИ, который действует более индивидуально и разговорно, чем другие модели, включая серию GPT. Компания использовала уникальную эмпатическую настройку, чтобы придать модели Пи отличительную индивидуальность и неповторимость. эквалайзер (эмоциональный коэффициент) исключительный.
Inflection-2.5 представляет собой новейшую попытку в быстро развивающемся пространстве ИИ противостоять доминированию OpenAI, которая продолжает уточнять свой подход к разработке ИИ для человечества. Недавно Anthropic представила Claude 3 Opus, став первой моделью, превзошедшей GPT-4.
Улучшения производительности
С появлением улучшенной модели Перегиб-2,5, стартап, который привлек $1,3 миллиарда в июне 2023 года, разрабатывает интеллектуальный аспект модели, охватывающий такие области, как физика и математика. В Сообщение блогаКомпания заявила, что пользователи, разговаривающие с Pi, работающим на Inflection-2.5, могут обсуждать широкий спектр тем: от общего хобби до программирования, от проверки ответов на тест по биологии до составления корпоративного плана.
Миллионы пользователей, миллиарды сообщений. Откройте для себя новый и улучшенный Pi, в котором полезный интеллект сочетается с дружеским сочувствием.
Теперь на основе нашей базовой модели мирового класса: Inflection-2.5.
С точки зрения производительности в тестах улучшенная модель в целом показывает заметные улучшения по сравнению с Inflection-1 и приближается к GPT-4, хотя и отстает.
Например, в эталонный MMLUкоторый измеряет производительность при выполнении задач различной сложности – от школьного до профессионального, Inflection-2.5 получил награду оценка 85,5расположившись сразу за л'87,3 ГПТ-4. Аналогичным образом, в тестах STEM модель работала почти так же хорошо, как модель OpenAI, с 63 балла на экзамене по венгерской математике (по сравнению с 68 по GPT-4) и 85-м процентилем по GRE по физике по сравнению с 97-м по GPT-4.
В тесте GSM8K, состоящем из 8500 высококачественных школьных задач по математике, модель Inflection получила оценку 86,3 по сравнению с 92 у ГПТ-4. В нулевом тесте HumanEval, предназначенном для оценки возможностей генерации кода, он набрал 73,8 балла по сравнению с 79,3 балла у GPT-4.
Эффективно обученная модель с веб-поиском
Хотя производительность не превосходит производительность GPT-4, Inflection AI подчеркнула, что это «производительность на уровне 94% от уровня GPT-4было достигнуто с помощью гораздо более эффективного обучения, чем модель большого языка OpenAI (LLM).
По данным компании, для Inflection-2.5 требовалось только 40% флопов Обучение GPT-4 (расчет) для получения этих результатов.
Кроме того, как и GPT-4, модель также включает возможность веб-поиска в режиме реального времени, предоставляя пользователям самую актуальную информацию о текущих событиях. Это будет значительное улучшение, учитывая, что компания позиционирует Пи как виртуального помощника для всех. Однако важно отметить, что качество результатов восстановления веб-данных может немного отличаться, поскольку ни один тест не использует его.
Как получить доступ к Inflection-2.5?
Inflection AI уже выпустила новую модель чат-бота Pi. Это значит, что любой, кто пользуется помощником, может начать тестировать его возможности.
Компания не рассказала, какую пользу пользователи получают от улучшенной модели, но заявила, что изменение оказало значительное влияние на настроения пользователей, взаимодействие и лояльность, ускорив органический рост пользователей чат-бота.
В настоящее время чат-бот Pi, доступный на Android, iOS, в Интернете и в виде настольного приложения, имеет один миллион активных пользователей в день и шесть миллионов активных пользователей в месяц. С искусственным интеллектом было обменено более четырех миллиардов сообщений, средняя продолжительность разговора составила 33 минуты.