«Искусственный интеллект быстро развивается, и ОпенАИ своим выпуском устанавливает новый, более серьезный ориентир Предварительный просмотр ChatGPT-4o1. Эта модель представляет собой значительный прогресс в сложных рассуждениях и обещает изменить наш подход к SEO и цифровому маркетингу». © Предварительный просмотр ChatGPT-4o1
Сразу после выхода SEO-команда Webpraktik протестировала версию 4о1 и рада рассказать, на что способна новая модель, чем она отличается от своих предшественников и чем она помогает SEO-специалисту.
За 1,5 часа тестирования мы исчерпали все лимиты, но оно того стоило. Вероятно, мы не видели подобного прорыва с момента выпуска ChatGPT-4. Команда Сэма Альтмана в очередной раз превзошла саму себя и создала продукт, значительно опережающий конкурентов.
На скриншоте: ChatGPT-4o1 рисует графический интерфейс для приложения, которого десять минут назад не существовало в природе
Содержание
Ключевые особенности ChatGPT-4o1-превью
Это не просто улучшение по сравнению с предыдущей моделью, но и квантовый скачок в способности искусственного интеллекта мыслить и адаптироваться сложным образом.
Продвинутое сложное мышление
Главной особенностью новой модели является поколение длинные цепочки мыслей до того, как будет дан ответ, что существенно повышает глубину и качество выводов.
Вот как выглядит самая продвинутая система рассуждений — того, чего мы достигали раньше с помощью сверхдлинных подсказок и пошаговых инструкций.
Разница также заметна в повседневных задачах SEO. Например, вот запрос на создание метатегов для 4o1-mini:
Простые задачи выполняются буквально за секунды без особых объяснений и подсказок.
Ничего волшебного здесь нет, но в мелочах модель не ошибается. Нам еще предстоит увидеть какие-либо галлюцинации или попытки отклониться от задачи или войти в бесконечный цикл. И да, сделать полную версию 4о1 галлюцинацией нам так и не удалось (хотя мы очень старались).
Ранние версии ChatGPT-4 были буквально сумасшедшими от вопросов на узкие, конкретные темы. Чтобы ответить на этот вопрос, «четверка» придумала квест-историю о празднике. коммунизм Талос и восстание священников, хотя ничего подобного в самой игре не было. 4о и 4о1 легко справляются со схожими задачами
Такой подход существенно увеличивает нагрузку на серверы, но позволяет выполнить задачу с поразительной точностью. Согласно тестам OpenAI, новая модель справляется с задачами олимпийского уровня. в 6 раз лучше старого. Это огромная разница между разрешением 13% в предыдущей версии и 83% в предварительном просмотре 4o1.
Обучение с подкреплением и адаптивность
Использование алгоритма масштабирования Обучение с подкреплениемМодель постоянно развивается и улучшает свои результаты по мере взаимодействия с пользователем.
- Адаптивность. С каждой новой задачей ChatGPT-4o1-preview становится более точным и адаптируется к конкретным потребностям и стилю пользователя.
- Эффективность. Обработка сложных запросов быстро экономит время и ресурсы и повышает общую производительность.
И вы это чувствуете: с каждым запросом нейросеть все точнее понимает, что вам нужно.
Такая структура ответа типична для новой версии: сначала простой ответ по условиям задачи, затем по мере уточнения пользователем вопроса модель также начинает усложнять ответ, собирая все больше данных и ветвей.
Из-за лимита запросов нам не удалось полностью протестировать полную версию ChatGPT-4o1 на работу с цепочками подсказок, но нейросеть написала рабочее Python-приложение на основе JS-скрипта всего за два запроса, а их куча по третьему запросу Предложены и реализованы улучшения.
В целом, мы видим ряд автоматизаций для отдела SEO, которые можно реализовать в новой версии:
- Автоматическая проверка текстов по спецификациям/предопределенным шаблонам. 4o недостаточно для этой задачи, 4o1 может быть достаточно для качественных примеров и подсказок.
- Переход от использования Google App Script к простым приложениям Python. Даже с 4o и MS Copilot программирование еще никогда не было таким простым. – Вам больше не нужно ставить задачи программистам по написанию внутренних скриптов и работе с API.
- Упрощение работы с внутренними документами. Как минимум обновите все старые инструкции.
- Первичная аналитика. Загрузите набор необработанных данных (например, копию CSV-файла с позициями), который позволит вам быстро оценить закономерности и направления.
- Улучшены описания продуктов, метатеги, SEO-текст. Постепенно заменяя 4o-mini на 4o1-mini для больших задач, вы можете улучшить результаты на страницах, использующих сгенерированный текст.
И это именно то, что лежит на поверхности. После реализации мультимодальности мы обязательно проверим выгрузку данных из BI-отчетов и метрик напрямую с помощью таблиц и скриншотов.
Сравнение предварительной версии ChatGPT-4o и ChatGPT-4o1
Чтобы наглядно понять улучшения, представленные в новой модели, давайте на практических примерах сравним ее производительность с предыдущей версией.
Задача 1. Разработка маркетинговой стратегии нового продукта.
Расследование:
Все четыре модели (включая две Mini) сумели написать таблицу. Но Предварительный просмотр ChatGPT-4o1 Я смог более четко организовать время и задачи:
ЧатGPT-4o Когда тема была раскрыта, она показалась заметно слабее.
Задача 2. Анализ конкурентов
Расследование:
Результат 4o1 ниже.
А вот как выглядит решение 4о.
Версия 4о1 раскрывает проблему глубже, а многочисленные итерации и размышления позволяют добиться более интересного результата. Для задач с одним действием 4о1 может привести к еще худшим результатам, чем 4о. Весь его потенциал раскрывается на расстоянии и в туманных технических характеристиках.
Например, при тестировании кода по запросу «Улучшение интерфейса» модель сама добавила индикатор выполнения или функционал запуска из командной строки после запроса «Оптимизация кода».
ЧатGPT-4o1 более креативен по сравнению с предыдущими версиями, когда задача ставится без четких границ. И это, пожалуй, самое большое достижение OpenAI в сентябрьском обновлении: их модель сделала еще один шаг навстречу человечности.
Подводные камни
Несмотря на очевидные преимущества очередного (хотя и ожидаемого) прорыва OpenAI, есть и неприятные моменты. Их всего несколько:
- 4o1-preview ограничен 30 запросами в неделю. Доступ к тестированию имеют только платные пользователи Plus и Enterprise. Ожидается, что в будущем ограничения будут сняты. Также есть планы открыть доступ к o1-mini всем бесплатным пользователям ChatGPT, но когда – неизвестно.
Причина – цена работы с новой моделью.
Для сравнения вот прайс-лист на работу через API с GPT-4o
Если сравнивать работу по API, то цена новой модели в 12 раз выше 4о. Пока цена на логический вывод не упадет, новую нейросеть можно использовать либо как редактор, просматривающий работу агентов нижнего уровня, либо для экспериментов/работы над высокобюджетными проектами.
- Никакой мультимодальности. Нейронная сеть работает только с текстом; Например, для работы с изображениями или таблицами нужно запустить 4o. Это также предотвращает эксперименты с аналитикой: большая часть интересующих меня данных — это таблицы Excel или скриншоты графиков.
- Нет доступа в Интернет. Что означает «база данных ограничена до конца 2023 года»? Есть возможность запросить информацию из интернета у 4о и передать собранные данные в окно 4о1, но это, мягко говоря, не совсем практично.
- Он плохо шутит. Один из моих любимых тестов на цензуру — «Придумай по этому поводу шутку». Три стереотипа в баре«4o1 успешно справился, начав говорить что-то вроде: «Все люди — братья, давайте жить вместе». В целом цензура не беспокоит, но здесь нужно гораздо больше экспериментов.
Диплом
Новое обновление — это прорыв в переходе с GPT-3.5 на 4. Улучшено всё: анализ, работа с текстами, понимание запроса пользователя. И тех, кто бездумно переписывает из статьи в статью»НОВЫЕ НЕЙРОНАЛЬНЫЕ СЕТИ НАУЧИЛИСЬ ДУМАТЬ!» не так уж далеки от истины.
4о1 до сих пор не выдает идеальные тексты, не группирует большую семантику, не может определить причины проблем с сайтом по диаграмме (и вообще пока не работает с диаграммами). Ее специальность — создание новых инструментов и шаблонов, которые облегчают вашу работу.
Создавайте сценарии, создавайте шаблоны технических спецификаций и организуйте таблицы Google Sheets с помощью сложной функциональной системы. Новая модель специально разработана для этого.