Последние результаты тестов Previsible показывают удивительное снижение точности SEO по сравнению с лучшими моделями искусственного интеллекта.
ТЛ;ДР:
- Последние флагманские модели искусственного интеллекта (Claude Opus 4.5, Gemini 3 Pro) статистически снизили производительность при выполнении стандартных задач SEO, показав снижение точности примерно на 9% по сравнению с предыдущими версиями.
- Это не сбой – это особенность того, как модели теперь оптимизированы для глубоких рассуждений и «агентских» рабочих процессов, а не для «разовых» ответов.
- Чтобы пережить этот сдвиг, организации должны перестать полагаться на необработанные подсказки и перейти к «контекстным контейнерам» (пользовательские GPT, Gems, Projects).
Содержание
Миф «новее = лучше» мертв
В прошлом году повествование было линейным: дождитесь выхода следующей модели, получите лучшие результаты. Эта траектория сломалась.
Мы только что пробежали AI SEO-тест в новейших флагманских версиях — Claude Opus 4.5, Gemini 3 Pro и ChatGPT-5.1 Thinking — и результаты вызывают тревогу.
Впервые в эпоху генеративного искусственного интеллекта новейшие модели значительно хуже справляются с задачами SEO, чем их предшественники.

Мы не говорим о погрешности. Мы наблюдаем почти двузначную регрессию:
- Закрыть работу 4.5: Набрал 76%, падение с 84% в версии 4.1.
- Близнецы 3 Про: Набрал 73%, что на 9% меньше, чем у версии 2.5 Pro, которую мы тестировали ранее в этом году.
- Чат GPT-5.1 Мышление: Набрал 77% (на 6% ниже стандартного GPT-5). Это подтверждает, что добавление слоев рассуждений создает задержки и шум при выполнении простых задач SEO.


Почему это важно: Если ваша команда обновила вызовы или запросы API до «последней модели», вы, вероятно, платите больше за худшие результаты.
Диагноз: Агентный разрыв.
Почему это происходит? Зачем Google и Anthropic выпускать «тупые» модели?
Ответ кроется в их новых целях оптимизации.
Мы проанализировали точки сбоя в нашем наборе данных, который в значительной степени ориентирован на техническое SEO и стратегию (что составляет почти 25% нашего тестового набора).
Эти новые модели не оптимизированы для «однократной» подсказки (задавания вопроса и получения мгновенного ответа).
Вместо этого они оптимизированы для:
- Глубокие рассуждения (Система мышления 2): Они слишком много думают о простых наборах инструкций, часто галлюцинируя сложность там, где ее нет.
- Массивный контекст: Они ожидают, что им будут предоставлены целые базы кода или библиотеки, а не отдельные фрагменты URL-адресов.
- Безопасность и ограждения: Они с большей вероятностью откажутся от запроса на технический аудит, потому что он «похож» на атаку на кибербезопасность или нарушает расплывчатую политику безопасности. Мы часто наблюдаем этот шаблон отказа в новых архитектурах Claude и Gemini.
Мы находимся в агентном разрыве. Модели пытаются быть автономными агентами, которые «думают», прежде чем говорить.
Однако для прямых, логических задач SEO (таких как анализ канонического тега или сопоставление намерений ключевых слов) этот дополнительный «мыслительный» шум снижает точность.
Получите информационный бюллетень, на который полагаются поисковые маркетологи.
Исправление: перестаньте подсказывать, начните проектировать
Эпоха сырых подсказок закончилась.
Вы больше не можете полагаться на базовую модель (готовую к использованию) для решения критически важных задач SEO.
Если вы хотите восстановить и превзойти этот контрольный показатель точности в 84 %, вам придется изменить свою инфраструктуру.
1. Откажитесь от интерфейса чата для рабочих процессов
Не позволяйте своей команде работать в окне чата по умолчанию.
В исходной модели отсутствуют конкретные ограничения, необходимые для стратегии высокого уровня.
- Смена: Переместите все повторяющиеся задачи в «Контекстные контейнеры».
- Инструменты: Пользовательские GPT от OpenAI, Claude Projects от Anthropic и Gemini Gems от Google.
2. Жестко запрограммируйте контекст (RAG lite).
Снижение оценок по стратегическим вопросам говорит о том, что без строгого руководства новые модели дрейфуют.
- Стратегия: Не просите модель «разработать стратегию». Вы должны предварительно загрузить в среду рекомендации по бренду, исторические данные о производительности и методологические ограничения.
- Почему это работает: Это заставляет модель основывать свои мыслительные способности на вашей реальности, а не галлюцинировать общие советы.
3. Точная настройка или «заморозка» моделей для технического SEO
Для двоичных задач (таких как проверка кодов состояния или проверка схемы) модели «мышления» являются излишними и подвержены ошибкам.
- Стратегия: Придерживайтесь старых, стабильных моделей (таких как GPT-4o или Claude 3.5 Sonnet) для задач, основанных на коде, или настройте модель меньшего размера специально в соответствии с вашими правилами технического аудита.
Ключевые выводы
- Понизить версию до обновления: На данный момент модели предыдущего поколения (Claude 4.1, GPT-5) превосходят новейшие версии (Opus 4.5, Gemini 3) в простых логических задачах SEO. Не обновляйтесь только потому, что номер версии выше.
- Ваншот мертв: Одиночные подсказки без улучшенных контекстных окон значительно чаще терпят неудачу в новую эпоху «Рассуждения».
- Контейнеризируйте все: Если это повторяемая задача, она принадлежит пользовательскому тегу GPT, проекту или Gem. Это единственный способ смягчить «дрейф рассуждений» новых моделей.
- Сильнее всего пострадали технологии и стратегия: Наши данные показывают, что эти категории больше всего страдают от регрессии модели. Дважды проверьте все автоматизированные технические аудиты, проводимые для API новой модели.
Стратегический прогноз
Мы говорим с тех пор, как наш Апрельский тест: Вы не можете использовать эти модели «из коробки» для чего-либо критически важного.
SEO под руководством человека в эпоху агентов
Переход от «чат-ботов» к «агентам» не устраняет необходимость в специалистах по SEO, а повышает ее.
Сегодняшние модели искусственного интеллекта — это не готовые к использованию решения, а инструменты, требующие квалифицированных операторов.
Точно так же, как вы не ожидаете, что неподготовленный медицинский работник успешно проведет искусственную операцию, вы не можете передать сложную модель подсказку и ожидать высококачественных результатов SEO.
Успех в эту новую эпоху будет зависеть от человеческих команд, которые понимают, как:
- Архитектор систем искусственного интеллекта.
- Встраивайте их в рабочие процессы.
- Применяйте их суждения для исправления, управления и оптимизации результатов.
Лучшие результаты SEO будут достигнуты не только за счет лучших подсказок.
Они исходят от практиков, которые знают, как создавать ограничения, учитывать стратегический контекст и точно управлять моделями.
Если вы не создадите высокопроизводительную систему, модель потерпит неудачу.
Содействующие авторы приглашаются для создания контента для Search Engine Land и выбираются за их опыт и вклад в поисковое сообщество. Наши авторы работают под контролем редакции, а материалы проверяются на качество и актуальность для наших читателей. Search Engine Land принадлежит Семраш. Автора не просили делать какие-либо прямые или косвенные упоминания о Семраш. Мнения, которые они выражают, являются их собственными.

