«Искусственный интеллект быстро развивается, и ОпенАИ своим выпуском устанавливает новый, более серьезный ориентир Предварительный просмотр ChatGPT-4o1. Эта модель представляет собой значительный прогресс в сложных рассуждениях и обещает изменить наш подход к SEO и цифровому маркетингу». © Предварительный просмотр ChatGPT-4o1

Сразу после выхода SEO-команда Webpraktik протестировала версию 4о1 и рада рассказать, на что способна новая модель, чем она отличается от своих предшественников и чем она помогает SEO-специалисту.

За 1,5 часа тестирования мы исчерпали все лимиты, но оно того стоило. Вероятно, мы не видели подобного прорыва с момента выпуска ChatGPT-4. Команда Сэма Альтмана в очередной раз превзошла саму себя и создала продукт, значительно опережающий конкурентов.

ЧатGPT-4o1

На скриншоте: ChatGPT-4o1 рисует графический интерфейс для приложения, которого десять минут назад не существовало в природе

Ключевые особенности ChatGPT-4o1-превью

Это не просто улучшение по сравнению с предыдущей моделью, но и квантовый скачок в способности искусственного интеллекта мыслить и адаптироваться сложным образом.

Продвинутое сложное мышление

Главной особенностью новой модели является поколение длинные цепочки мыслей до того, как будет дан ответ, что существенно повышает глубину и качество выводов.

ЧатGPT-4o1

Вот как выглядит самая продвинутая система рассуждений — того, чего мы достигали раньше с помощью сверхдлинных подсказок и пошаговых инструкций.

Разница также заметна в повседневных задачах SEO. Например, вот запрос на создание метатегов для 4o1-mini:

ЧатGPT-4o1

Простые задачи выполняются буквально за секунды без особых объяснений и подсказок.

Ничего волшебного здесь нет, но в мелочах модель не ошибается. Нам еще предстоит увидеть какие-либо галлюцинации или попытки отклониться от задачи или войти в бесконечный цикл. И да, сделать полную версию 4о1 галлюцинацией нам так и не удалось (хотя мы очень старались).

ЧИТАТЬ  GPTBot — новый поисковый робот OpenAI

ЧатGPT-4o1

Ранние версии ChatGPT-4 были буквально сумасшедшими от вопросов на узкие, конкретные темы. Чтобы ответить на этот вопрос, «четверка» придумала квест-историю о празднике. коммунизм Талос и восстание священников, хотя ничего подобного в самой игре не было. 4о и 4о1 легко справляются со схожими задачами

Такой подход существенно увеличивает нагрузку на серверы, но позволяет выполнить задачу с поразительной точностью. Согласно тестам OpenAI, новая модель справляется с задачами олимпийского уровня. в 6 раз лучше старого. Это огромная разница между разрешением 13% в предыдущей версии и 83% в предварительном просмотре 4o1.

Обучение с подкреплением и адаптивность

Использование алгоритма масштабирования Обучение с подкреплениемМодель постоянно развивается и улучшает свои результаты по мере взаимодействия с пользователем.

  • Адаптивность. С каждой новой задачей ChatGPT-4o1-preview становится более точным и адаптируется к конкретным потребностям и стилю пользователя.

  • Эффективность. Обработка сложных запросов быстро экономит время и ресурсы и повышает общую производительность.

И вы это чувствуете: с каждым запросом нейросеть все точнее понимает, что вам нужно.

ЧатGPT-4o1

Такая структура ответа типична для новой версии: сначала простой ответ по условиям задачи, затем по мере уточнения пользователем вопроса модель также начинает усложнять ответ, собирая все больше данных и ветвей.

Из-за лимита запросов нам не удалось полностью протестировать полную версию ChatGPT-4o1 на работу с цепочками подсказок, но нейросеть написала рабочее Python-приложение на основе JS-скрипта всего за два запроса, а их куча по третьему запросу Предложены и реализованы улучшения.

В целом, мы видим ряд автоматизаций для отдела SEO, которые можно реализовать в новой версии:

  1. Автоматическая проверка текстов по спецификациям/предопределенным шаблонам. 4o недостаточно для этой задачи, 4o1 может быть достаточно для качественных примеров и подсказок.

  2. Переход от использования Google App Script к простым приложениям Python. Даже с 4o и MS Copilot программирование еще никогда не было таким простым. Вам больше не нужно ставить задачи программистам по написанию внутренних скриптов и работе с API.

  3. Упрощение работы с внутренними документами. Как минимум обновите все старые инструкции.

  4. Первичная аналитика. Загрузите набор необработанных данных (например, копию CSV-файла с позициями), который позволит вам быстро оценить закономерности и направления.

  5. Улучшены описания продуктов, метатеги, SEO-текст. Постепенно заменяя 4o-mini на 4o1-mini для больших задач, вы можете улучшить результаты на страницах, использующих сгенерированный текст.

И это именно то, что лежит на поверхности. После реализации мультимодальности мы обязательно проверим выгрузку данных из BI-отчетов и метрик напрямую с помощью таблиц и скриншотов.

Сравнение предварительной версии ChatGPT-4o и ChatGPT-4o1

Чтобы наглядно понять улучшения, представленные в новой модели, давайте на практических примерах сравним ее производительность с предыдущей версией.

Задача 1. Разработка маркетинговой стратегии нового продукта.

Расследование:

ЧатGPT-4o1

Все четыре модели (включая две Mini) сумели написать таблицу. Но Предварительный просмотр ChatGPT-4o1 Я смог более четко организовать время и задачи:

ЧатGPT-4o Когда тема была раскрыта, она показалась заметно слабее.

Задача 2. Анализ конкурентов

Расследование:

ЧатGPT-4o1

Результат 4o1 ниже.

А вот как выглядит решение 4о.

Версия 4о1 раскрывает проблему глубже, а многочисленные итерации и размышления позволяют добиться более интересного результата. Для задач с одним действием 4о1 может привести к еще худшим результатам, чем 4о. Весь его потенциал раскрывается на расстоянии и в туманных технических характеристиках.

Например, при тестировании кода по запросу «Улучшение интерфейса» модель сама добавила индикатор выполнения или функционал запуска из командной строки после запроса «Оптимизация кода».

ЧатGPT-4o1 более креативен по сравнению с предыдущими версиями, когда задача ставится без четких границ. И это, пожалуй, самое большое достижение OpenAI в сентябрьском обновлении: их модель сделала еще один шаг навстречу человечности.

Подводные камни

Несмотря на очевидные преимущества очередного (хотя и ожидаемого) прорыва OpenAI, есть и неприятные моменты. Их всего несколько:

  • 4o1-preview ограничен 30 запросами в неделю. Доступ к тестированию имеют только платные пользователи Plus и Enterprise. Ожидается, что в будущем ограничения будут сняты. Также есть планы открыть доступ к o1-mini всем бесплатным пользователям ChatGPT, но когда – неизвестно.

Причина – цена работы с новой моделью.

ЧатGPT-4o1

Для сравнения вот прайс-лист на работу через API с GPT-4o

ЧатGPT-4o1

Если сравнивать работу по API, то цена новой модели в 12 раз выше 4о. Пока цена на логический вывод не упадет, новую нейросеть можно использовать либо как редактор, просматривающий работу агентов нижнего уровня, либо для экспериментов/работы над высокобюджетными проектами.

  • Никакой мультимодальности. Нейронная сеть работает только с текстом; Например, для работы с изображениями или таблицами нужно запустить 4o. Это также предотвращает эксперименты с аналитикой: большая часть интересующих меня данных — это таблицы Excel или скриншоты графиков.

  • Нет доступа в Интернет. Что означает «база данных ограничена до конца 2023 года»? Есть возможность запросить информацию из интернета у 4о и передать собранные данные в окно 4о1, но это, мягко говоря, не совсем практично.

  • Он плохо шутит. Один из моих любимых тестов на цензуру — «Придумай по этому поводу шутку». Три стереотипа в баре«4o1 успешно справился, начав говорить что-то вроде: «Все люди — братья, давайте жить вместе». В целом цензура не беспокоит, но здесь нужно гораздо больше экспериментов.

Диплом

Новое обновление — это прорыв в переходе с GPT-3.5 на 4. Улучшено всё: анализ, работа с текстами, понимание запроса пользователя. И тех, кто бездумно переписывает из статьи в статью»НОВЫЕ НЕЙРОНАЛЬНЫЕ СЕТИ НАУЧИЛИСЬ ДУМАТЬ!» не так уж далеки от истины.

4о1 до сих пор не выдает идеальные тексты, не группирует большую семантику, не может определить причины проблем с сайтом по диаграмме (и вообще пока не работает с диаграммами). Ее специальность — создание новых инструментов и шаблонов, которые облегчают вашу работу.

Создавайте сценарии, создавайте шаблоны технических спецификаций и организуйте таблицы Google Sheets с помощью сложной функциональной системы. Новая модель специально разработана для этого.



Source

ЧИТАТЬ  Как использовать ИИ для подготовки рассылок