Генеральный директор OpenAI Сэм Альтман объявил «красный код», чтобы сосредоточить ресурсы компании на улучшении ChatGPT, согласно внутренней записке, опубликованной Уолл Стрит Джорнал и Информация.

Записка сигнализирует о реакции OpenAI на растущую конкуренцию со стороны Google, чья модель Gemini 3 превзошла ChatGPT в нескольких тестах производительности с момента запуска в прошлом месяце, согласно собственным оценочным данным Google и сторонним таблицам лидеров.

Что нового

Альтман сообщил сотрудникам, что повседневная работа ChatGPT нуждается в улучшении. Конкретные области включают функции персонализации, скорость и надежность ответа, а также способность чат-бота отвечать на более широкий круг вопросов.

Компания использует систему цветовой кодировки для обозначения уровней приоритета. Это усилие было повышено до «красного кода» над предыдущим обозначением «оранжевого кода» для улучшений ChatGPT.

Согласно меморандуму, ожидается запуск новой модели рассуждения на следующей неделе, хотя OpenAI публично об этом не объявила.

Продукты с задержкой

В результате несколько продуктовых инициатив откладываются.

По данным компании, интеграция рекламы, которую OpenAI тестировала в бета-версиях приложения ChatGPT, сейчас приостановлена. Информация. Агенты искусственного интеллекта, предназначенные для покупок и здравоохранения, также задерживаются, а также улучшения ChatGPT Pulse.

Альтман поощрял временные переводы команд для поддержки разработки ChatGPT и организовал ежедневные звонки тем, кто отвечает за улучшения.

Конкурентный контекст

С технической стороны Google Близнецы 3 и связанные модели показали высокие оценки по критериям рассуждения. Google заявляет, что Gemini 3 Deep Think превосходит более ранние версии по производительности Последний экзамен человечестваэталонный тест передового уровня, созданный исследователями безопасности искусственного интеллекта, и другие сложные тесты. Эти результаты отражены в собственных данных Google. Страница тестов Gemini 3 Pro и в независимых таблицах лидеров, отслеживающих эффективность моделей.

ЧИТАТЬ  Видео: Волатильность Google Super Bowl, Reddit обвиняет Google, поиск быстрее и просмотрите исправление ошибок

OpenAI еще не опубликовала сопоставимые публичные тестовые данные для своей следующей модели рассуждения, поэтому сравнения основаны на текущих результатах GPT 5, а не на будущей системе, упомянутой в записке.

Google также продолжает инвестировать в инструменты генерации изображений, такие как генераторы изображений Nano Banana и Nano Banana Pro, которые входят в состав более широкой линейки продуктов искусственного интеллекта наряду с Gemini 3.

Контекст сравнительного анализа

«Последний экзамен человечества» призван стать более сложным преемником таких насыщенных тестов, как MMLU. Он поддерживается Центром безопасности и масштабирования ИИ, обзор доступен на сайте проекта, а результаты отслеживаются в нескольких таблицах лидеров, в том числе Официальная таблица лидеров Scale и сторонние информационные панели, такие как Искусственный анализ.

Google Документация по тестированию Gemini 3 Pro указывает более высокий балл на последнем экзамене человечества, чем несколько конкурирующих моделей, включая GPT 5. Это основание для сообщения о том, что Gemini 3 «превзошел» ChatGPT в этом конкретном тесте.

OpenAI опубликовала хорошие результаты по другим тестам рассуждения для своей серии GPT 5, но записка, похоже, реагирует на недавнюю волну данных о производительности Gemini 3, а не на один тест.

Трафик и контекст использования

Несмотря на техническое давление, OpenAI по-прежнему лидирует в использовании помощников.

В недавнем сообщении на LinkedIn глава ChatGPT Ник Терли заявил, что ChatGPT — «ИИ-помощник №1 в мире», на который приходится «около 70% использования помощников» и примерно «10% поисковой активности». Вы можете прочитать его полный комментарий здесь.

Отдельная отчетность от торговых точек, включая Файнэншл Таймс указывает на то, что OpenAI имеет более 800 миллионов пользователей в неделю, большинство из которых находятся на бесплатном уровне, в то время как база пользователей Gemini быстро растет с более низкой начальной точки.

ЧИТАТЬ  Поиск в Google меняет внешний вид результатов, насыщенных событиями

В записке Альтмана признается недавний прогресс Google и предупреждается о «временных экономических препятствиях», а также говорится, что OpenAI «быстро догоняет».

Знакомая книга игр

Обозначение «красный код» перекликается с ответом Google на ChatGPT несколько лет назад.

Руководство Google объявило «красный код» после вирусного запуска ChatGPT. Генеральный директор Сундар Пичаи перенаправил команды Google Research, Trust and Safety и других отделов, чтобы они сосредоточились на разработке продуктов искусственного интеллекта.

Эта срочность привела к ускоренной разработке продуктов искусственного интеллекта Google, кульминацией которой стал запуск Bard в начале 2023 года и его последующее развитие в Gemini.

Теперь роли поменялись. Постоянные инвестиции Google в инфраструктуру искусственного интеллекта позволили создать модель, которая получила более высокие оценки, чем ChatGPT, по нескольким важным критериям, что побудило OpenAI принять аналогичную структуру реагирования на кризисы для своего флагманского продукта.

Ответ компании

Ник Терли, руководитель ChatGPT OpenAI, в своих недавних публикациях рассказал о конкурентной среде. LinkedIn и X, где он назвал ChatGPT лучшим помощником по искусственному интеллекту в мире.

«Новые продукты запускаются каждую неделю, и это здорово», — написал он в одном из постов, заявив, что конкуренция подталкивает OpenAI двигаться быстрее и продолжать совершенствовать ChatGPT.

Он добавил, что цель OpenAI — сделать ChatGPT «более функциональным», одновременно расширяя доступ и делая его «более интуитивным и персональным».

OpenAI публично не прокомментировала саму просочившуюся записку.

Заглядывая в будущее

Запуск новой модели рассуждения OpenAI даст первое представление о том, как компания выполняет директиву Альтмана. Задержка рекламных агентов и агентов искусственного интеллекта позволяет предположить, что качество ChatGPT стало единственным приоритетом компании на ближайшую перспективу, по крайней мере, внутри компании.

ЧИТАТЬ  Google Реклама API версии 16 уже доступна

Для маркетологов и специалистов по SEO более непосредственное влияние, вероятно, окажет то, как ChatGPT обрабатывает сложные запросы, исследовательские задачи и дополнительные вопросы, как только новая модель будет запущена. Любые измеримые изменения в качестве ответов, скорости или персонализации будут важно отслеживать наряду с продолжающимся развертыванием Google Gemini 3.


Рекомендованное изображение: Mijansk786/Shutterstock



Source link