ChatGPT-4o1: первые впечатления SEO-специалиста • Продвижение Web 2.0

«Искусственный интеллект быстро развивается, и ОпенАИ своим выпуском устанавливает новый, более серьезный ориентир Предварительный просмотр ChatGPT-4o1. Эта модель представляет собой значительный прогресс в сложных рассуждениях и обещает изменить наш подход к SEO и цифровому маркетингу». © Предварительный просмотр ChatGPT-4o1

Сразу после выхода SEO-команда Webpraktik протестировала версию 4о1 и рада рассказать, на что способна новая модель, чем она отличается от своих предшественников и чем она помогает SEO-специалисту.

За 1,5 часа тестирования мы исчерпали все лимиты, но оно того стоило. Вероятно, мы не видели подобного прорыва с момента выпуска ChatGPT-4. Команда Сэма Альтмана в очередной раз превзошла саму себя и создала продукт, значительно опережающий конкурентов.

На скриншоте: ChatGPT-4o1 рисует графический интерфейс для приложения, которого десять минут назад не существовало в природе

Содержание

1 Ключевые особенности ChatGPT-4o1-превью
- 1.1 Продвинутое сложное мышление
- 1.2 Обучение с подкреплением и адаптивность
2 Сравнение предварительной версии ChatGPT-4o и ChatGPT-4o1
- 2.1 Задача 1. Разработка маркетинговой стратегии нового продукта.
- 2.2 Задача 2. Анализ конкурентов
3 Подводные камни
4 Диплом

Ключевые особенности ChatGPT-4o1-превью

Это не просто улучшение по сравнению с предыдущей моделью, но и квантовый скачок в способности искусственного интеллекта мыслить и адаптироваться сложным образом.

Продвинутое сложное мышление

Главной особенностью новой модели является поколение длинные цепочки мыслей до того, как будет дан ответ, что существенно повышает глубину и качество выводов.

Вот как выглядит самая продвинутая система рассуждений — того, чего мы достигали раньше с помощью сверхдлинных подсказок и пошаговых инструкций.

Разница также заметна в повседневных задачах SEO. Например, вот запрос на создание метатегов для 4o1-mini:

Простые задачи выполняются буквально за секунды без особых объяснений и подсказок.

Ничего волшебного здесь нет, но в мелочах модель не ошибается. Нам еще предстоит увидеть какие-либо галлюцинации или попытки отклониться от задачи или войти в бесконечный цикл. И да, сделать полную версию 4о1 галлюцинацией нам так и не удалось (хотя мы очень старались).

ЧИТАТЬ Какие цифровые агентства с большей вероятностью примут участие в соревнованиях. Рабочая зона исследования

Ранние версии ChatGPT-4 были буквально сумасшедшими от вопросов на узкие, конкретные темы. Чтобы ответить на этот вопрос, «четверка» придумала квест-историю о празднике. ~~коммунизм~~ Талос и восстание священников, хотя ничего подобного в самой игре не было. 4о и 4о1 легко справляются со схожими задачами

Такой подход существенно увеличивает нагрузку на серверы, но позволяет выполнить задачу с поразительной точностью. Согласно тестам OpenAI, новая модель справляется с задачами олимпийского уровня. в 6 раз лучше старого. Это огромная разница между разрешением 13% в предыдущей версии и 83% в предварительном просмотре 4o1.

Обучение с подкреплением и адаптивность

Использование алгоритма масштабирования Обучение с подкреплениемМодель постоянно развивается и улучшает свои результаты по мере взаимодействия с пользователем.

Адаптивность. С каждой новой задачей ChatGPT-4o1-preview становится более точным и адаптируется к конкретным потребностям и стилю пользователя.

Эффективность. Обработка сложных запросов быстро экономит время и ресурсы и повышает общую производительность.

И вы это чувствуете: с каждым запросом нейросеть все точнее понимает, что вам нужно.

Такая структура ответа типична для новой версии: сначала простой ответ по условиям задачи, затем по мере уточнения пользователем вопроса модель также начинает усложнять ответ, собирая все больше данных и ветвей.

Из-за лимита запросов нам не удалось полностью протестировать полную версию ChatGPT-4o1 на работу с цепочками подсказок, но нейросеть написала рабочее Python-приложение на основе JS-скрипта всего за два запроса, а их куча по третьему запросу Предложены и реализованы улучшения.

В целом, мы видим ряд автоматизаций для отдела SEO, которые можно реализовать в новой версии:

Автоматическая проверка текстов по спецификациям/предопределенным шаблонам. 4o недостаточно для этой задачи, 4o1 может быть достаточно для качественных примеров и подсказок.

Переход от использования Google App Script к простым приложениям Python. Даже с 4o и MS Copilot программирование еще никогда не было таким простым. – Вам больше не нужно ставить задачи программистам по написанию внутренних скриптов и работе с API.

Упрощение работы с внутренними документами. Как минимум обновите все старые инструкции.

Первичная аналитика. Загрузите набор необработанных данных (например, копию CSV-файла с позициями), который позволит вам быстро оценить закономерности и направления.

Улучшены описания продуктов, метатеги, SEO-текст. Постепенно заменяя 4o-mini на 4o1-mini для больших задач, вы можете улучшить результаты на страницах, использующих сгенерированный текст.

И это именно то, что лежит на поверхности. После реализации мультимодальности мы обязательно проверим выгрузку данных из BI-отчетов и метрик напрямую с помощью таблиц и скриншотов.

Сравнение предварительной версии ChatGPT-4o и ChatGPT-4o1

Чтобы наглядно понять улучшения, представленные в новой модели, давайте на практических примерах сравним ее производительность с предыдущей версией.

Задача 1. Разработка маркетинговой стратегии нового продукта.

Расследование:

Все четыре модели (включая две Mini) сумели написать таблицу. Но Предварительный просмотр ChatGPT-4o1 Я смог более четко организовать время и задачи:

ЧатGPT-4o Когда тема была раскрыта, она показалась заметно слабее.

Задача 2. Анализ конкурентов

Расследование:

Результат 4o1 ниже.

А вот как выглядит решение 4о.

Версия 4о1 раскрывает проблему глубже, а многочисленные итерации и размышления позволяют добиться более интересного результата. Для задач с одним действием 4о1 может привести к еще худшим результатам, чем 4о. Весь его потенциал раскрывается на расстоянии и в туманных технических характеристиках.

Например, при тестировании кода по запросу «Улучшение интерфейса» модель сама добавила индикатор выполнения или функционал запуска из командной строки после запроса «Оптимизация кода».

ЧатGPT-4o1 более креативен по сравнению с предыдущими версиями, когда задача ставится без четких границ. И это, пожалуй, самое большое достижение OpenAI в сентябрьском обновлении: их модель сделала еще один шаг навстречу человечности.

Подводные камни

Несмотря на очевидные преимущества очередного (хотя и ожидаемого) прорыва OpenAI, есть и неприятные моменты. Их всего несколько:

4o1-preview ограничен 30 запросами в неделю. Доступ к тестированию имеют только платные пользователи Plus и Enterprise. Ожидается, что в будущем ограничения будут сняты. Также есть планы открыть доступ к o1-mini всем бесплатным пользователям ChatGPT, но когда – неизвестно.

Причина – цена работы с новой моделью.

Для сравнения вот прайс-лист на работу через API с GPT-4o

Если сравнивать работу по API, то цена новой модели в 12 раз выше 4о. Пока цена на логический вывод не упадет, новую нейросеть можно использовать либо как редактор, просматривающий работу агентов нижнего уровня, либо для экспериментов/работы над высокобюджетными проектами.

Никакой мультимодальности. Нейронная сеть работает только с текстом; Например, для работы с изображениями или таблицами нужно запустить 4o. Это также предотвращает эксперименты с аналитикой: большая часть интересующих меня данных — это таблицы Excel или скриншоты графиков.

Нет доступа в Интернет. Что означает «база данных ограничена до конца 2023 года»? Есть возможность запросить информацию из интернета у 4о и передать собранные данные в окно 4о1, но это, мягко говоря, не совсем практично.

Он плохо шутит. Один из моих любимых тестов на цензуру — «Придумай по этому поводу шутку». Три стереотипа в баре«4o1 успешно справился, начав говорить что-то вроде: «Все люди — братья, давайте жить вместе». В целом цензура не беспокоит, но здесь нужно гораздо больше экспериментов.

Диплом

Новое обновление — это прорыв в переходе с GPT-3.5 на 4. Улучшено всё: анализ, работа с текстами, понимание запроса пользователя. И тех, кто бездумно переписывает из статьи в статью»НОВЫЕ НЕЙРОНАЛЬНЫЕ СЕТИ НАУЧИЛИСЬ ДУМАТЬ!» не так уж далеки от истины.

4о1 до сих пор не выдает идеальные тексты, не группирует большую семантику, не может определить причины проблем с сайтом по диаграмме (и вообще пока не работает с диаграммами). Ее специальность — создание новых инструментов и шаблонов, которые облегчают вашу работу.

Создавайте сценарии, создавайте шаблоны технических спецификаций и организуйте таблицы Google Sheets с помощью сложной функциональной системы. Новая модель специально разработана для этого.

Source

ЧИТАТЬ Эта облачная память не представляет ваши данные в ИИ - и стоит меньше одного кофе в месяц