Видимость ИИ играет решающую роль для оптимизаторов, и это начинается с контроля сканеров ИИ. Если сканеры ИИ не смогут получить доступ к вашим страницам, вы будете невидимы для систем обнаружения ИИ.

С другой стороны, неконтролируемые сканеры с искусственным интеллектом могут перегружать серверы чрезмерными запросами, что приводит к сбоям и неожиданным счетам за хостинг.

Строки пользовательского агента важны для контроля того, какие сканеры AI могут получить доступ к вашему веб-сайту, но официальная документация часто устарела, неполна или полностью отсутствует. Вот почему мы составили проверенный список сканеров ИИ на основе реальных журналов наших серверов в качестве полезного справочного материала.

Каждый пользовательский агент проверяется на соответствие официальным спискам IP-адресов, если таковые имеются, для обеспечения точности. Мы будем поддерживать и обновлять этот список, чтобы обнаруживать новые сканеры и изменения в существующих.

Полный список проверенных сканеров искусственного интеллекта (декабрь 2025 г.)

имя Цель Скорость сканирования SEJ (страниц/час) Список проверенных IP-адресов Запретить файл robots.txt Полный пользовательский агент
GPTBot Сбор данных обучения ИИ для моделей GPT (ChatGPT, GPT-4o) 100 Официальный список IP Пользовательский агент: GPTBot
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; GPTBot/1.3; +
Пользователи ChatGPT AI-агент для просмотра веб-страниц в режиме реального времени, когда пользователи взаимодействуют с ChatGPT 2400 Официальный список IP Пользовательский агент: Пользователь ChatGPT
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko); совместимый; Пользователи ChatGPT/1.0; +
Поисковый бот OAI Индексирование поиска AI для функций поиска ChatGPT (не для обучения) 150 Официальный список IP Пользовательский агент: OAI-SearchBot
Позволять: /
Запретить: /private-folder
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, например Gecko) Chrome/131.0.0.0 Safari/537.36; совместимый; OAI SearchBot/1.3; +
КлодБот Сбор данных обучения ИИ для моделей Клода 500 Официальный список IP Пользовательский агент: ClaudeBot
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; ClaudeBot/1.0; +claudebot@anthropic.com)
Пользователь Клода AI-агент для доступа в Интернет в режиме реального времени, когда пользователи Claude просматривают сайты <10 Нет в наличии Пользовательский агент: Клод-Пользователь
Запретить: /sample-папка
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Claude-User/1.0; +Claude-User@anthropic.com)
Клод SearchBot Индексирование поиска AI для функций поиска Claude <10 Нет в наличии Пользовательский агент: Клод-SearchBot
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Claude-SearchBot/1.0; +
Google CloudVertexBot AI-агент для Vertex AI Agent Builder (только по запросу владельцев сайтов) <10 Официальный список IP Пользовательский агент: Google-CloudVertexBot
Позволять: /
Запретить: /private-folder
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, например Gecko) Chrome/141.0.7390.122 Mobile Safari/537.36 (совместимый; Google-CloudVertexBot; +
Google расширенный Токен, который контролирует использование для обучения ИИ контента, сканируемого роботом Googlebot. Пользовательский агент: Google Extended
Позволять: /
Запретить: /private-folder
Глубокие исследования Близнецов Агент по исследованию искусственного интеллекта для функции Deep Research Google Gemini <10 Официальный список IP Пользовательский агент: Gemini Deep Research
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Gemini Deep Research; + Chrome/135.0.0.0 Safari/537.36
Google Чат Gemini, когда пользователь просит открыть веб-страницу <10 Google
Бингбот Включает ответы ИИ для поиска Bing и чата Bing (второй пилот). 1300 Официальный список IP Пользовательский агент: BingBot
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; bingbot/2.0; + Chrome/116.0.1938.76 Safari/537.36
Applebot расширенный Не ползает но контролирует, как Apple использует данные Applebot. <10 Официальный список IP Пользовательский агент: Applebot-Extended
Позволять: /
Запретить: /private-folder
Mozilla/5.0 (Macintosh; Intel Mac OS)
PerplexityBot Поисковая индексация AI для системы ответов Perplexity 150 Официальный список IP Пользовательский агент: PerplexityBot
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; PerplexityBot/1.0; +
Пользователи в недоумении AI-агент для просмотра в режиме реального времени, когда пользователи Perplexity запрашивают информацию <10 Официальный список IP Пользовательский агент: Пользователь Perplexity
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Perplexity-User/1.0; +
Мета ВнешнийАгент Сбор данных для обучения искусственному интеллекту для студентов Metas LLM (Lama и т. д.) 1100 Нет в наличии Пользовательский агент: метавнешний агент
Позволять: /
Запретить: /private-folder
мета-внешний агент/1.1 (+
Мета-веб-индексер Привыкший Улучшите мета-поиск ИИ. <10 Нет в наличии Пользовательский агент: Meta-WebIndexer
Позволять: /
Запретить: /private-folder
мета-вебиндексер/1.1 (+
Байтпаук Данные обучения искусственного интеллекта для программ LLM ByteDance для таких продуктов, как TikTok. <10 Нет в наличии Пользовательский агент: Байтспайдер
Позволять: /
Запретить: /private-folder
Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, например Gecko) Mobile Safari/537.36 (совместимый; Bytespider;
Амазонский бот Обучение искусственному интеллекту для Alexa и других сервисов Amazon AI 1050 Нет в наличии Пользовательский агент: Amazonbot
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Amazonbot/0.1; + Chrome/119.0.6045.214 Safari/537.36
DuckAssistBot Поисковая индексация AI для поисковой системы DuckDuckGo 20 Официальный список IP Пользовательский агент: DuckAssistBot
Позволять: /
Запретить: /private-folder
ДакАссистБот/1.2; (+
Пользователь MistralAI Получение котировок Mistral в реальном времени для помощника Le Chat <10 Нет в наличии Пользовательский агент: Пользователь MistralAI
Позволять: /
Запретить: /private-folder
Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; MistralAI-User/1.0; +
Вебз.ио Извлечение данных и парсинг веб-страниц, используемые другими компаниями по обучению искусственному интеллекту. Ранее известный как Омгили. <10 Нет в наличии Пользовательский агент: вебзио
Позволять: /
Запретить: /private-folder
вебзио (+
Диффбот Извлечение данных и парсинг веб-страниц используются компаниями по всему миру. <10 Нет в наличии Пользовательский агент: Диффбот
Позволять: /
Запретить: /private-folder
Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 (.NET CLR 3.5.30729; Diffbot/0.1; +
ICC-сканер Сбор данных с помощью искусственного интеллекта и машинного обучения <10 Нет в наличии Пользовательский агент: сканер ICC
Позволять: /
Запретить: /private-folder
ICC Crawler/3.0 (совместим с Mozilla; ;
CCBot Веб-архив с открытым исходным кодом, используемый в качестве обучающих данных несколькими компаниями, занимающимися искусственным интеллектом. <10 Официальный список IP Пользовательский агент: CCBot
Позволять: /
Запретить: /private-folder
CCBot/2.0 (
ЧИТАТЬ  SEO-манипуляции – вот как вы распознаете незаконные действия

Все приведенные выше строки пользовательского агента были проверены по журналам сервера журнала поисковой системы.

Популярные сканеры AI-агентов с неопознаваемым пользовательским агентом

Мы обнаружили, что не были идентифицированы:

  • you.com.
  • Оператор агента ChatGPT.
  • Чат второго пилота Bing.
  • Грок.
  • ДипСик.

Невозможно отследить доступ этого сканера к веб-страницам, кроме как путем определения явного IP-адреса.

Мы создали страницу-ловушку (е.Г., /specific-page-for-you-com/) и использовали чат на странице, чтобы предложить you.com посетить сайт, чтобы мы могли найти соответствующую запись о посещении и IP-адрес в журналах нашего сервера. Ниже приведен скриншот:

Скриншот автора, декабрь 2025 г.

А как насчет агентских браузеров с искусственным интеллектом?

К сожалению, ИИ-браузеры, такие как Comet или Atlas, не отличаются от ChatGPT строкой пользовательского агента, и вы не можете идентифицировать их в журналах сервера и не можете смешивать их с посещениями обычных пользователей.

Строка пользовательского агента браузера Chatgpts Atlas из записей журнала сервера
Строка пользовательского агента браузера Atlas ChatGPT из записей журнала сервера (скриншот автора, декабрь 2025 г.)

Это разочаровывает оптимизаторов, поскольку отслеживание посещений веб-сайта браузером агента важно для отчетов POV.

Как проверить, что сканирует ваш сервер

Некоторые хостинговые компании предлагают пользовательский интерфейс (UI), который упрощает доступ и просмотр журналов сервера, в зависимости от того, какую услугу хостинга вы используете.

Если ваш хостинг не предлагает этого, вы можете получить файлы журналов сервера (обычно по адресу: /var/log/apache2/access.log (для серверов на базе Linux) через FTP или запросите его у службы поддержки вашего сервера, чтобы отправить вам.

Получив файл журнала, вы можете просмотреть и проанализировать его либо в Google Sheets (если файл в формате CSV), в анализаторе журналов Screaming Frog, либо, если ваш файл журнала находится в формате CSV. менее 100 МБвы можете попытаться проанализировать его с помощью Gemini AI.

Как проверить легитимность по сравнению с поддельными ботами

Поддельные сканеры могут подменять законных пользовательских агентов, чтобы обойти ограничения и агрессивно сканировать контент. Например, любой может выдать себя за ClaudeBot со своего ноутбука и инициировать запрос на сканирование с терминала. В журнале вашего сервера вы увидите это, когда Claudebot сканирует его:

curl -A 'Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)' 

Проверка может помочь сэкономить пропускную способность сервера и предотвратить сбор нелегального контента. Самый надежный метод проверки, который вы можете использовать, — это проверка IP-адреса запроса.

ЧИТАТЬ  Надежные настройки электронной почты для защиты вашей учетной записи

Проверьте все IP-адреса и найдите совпадение, если это один из официально заявленных IP-адресов, перечисленных выше. Если да, вы можете удовлетворить запрос; в противном случае заблокировать.

Различные типы брандмауэров могу помочь тебе Он блокирует IP-адреса, проверенные в белом списке (которые позволяют проходить законным запросам ботов) и блокирует все другие запросы, которые выдают себя за сканеров AI в строках их пользовательских агентов.

Например, в WordPress вы можете использовать Бесплатный плагин Wordfence внести в список разрешенных законные IP-адреса из официальных списков (как указано выше) и добавить пользовательские правила блокировки, как показано ниже:

Правило белого списка является более эффективным и позволяет законным сканерам проходить и блокировать все запросы на выдачу себя за другое лицо, поступающие с разных IP-адресов.

Однако обратите внимание, что это возможно подделать IP-адреси в этом случае вы не сможете заблокировать пользовательский агент бота и IP-адреса, если они подделаны.

Вывод: сохраняйте контроль над сканерами ИИ, чтобы обеспечить надежную видимость ИИ.

Поисковые роботы с искусственным интеллектом теперь являются частью нашей веб-экосистемы, а перечисленные здесь боты представляют собой основные платформы искусственного интеллекта, которые в настоящее время индексируют Интернет, хотя этот список, вероятно, будет расширяться.

Регулярно проверяйте журналы своего сервера, чтобы узнать, что на самом деле поступает на ваш веб-сайт, и убедитесь, что вы случайно не блокируете сканеры ИИ, если видимость в поисковых системах ИИ важна для вашего бизнеса. Если вы не хотите, чтобы сканеры ИИ имели доступ к вашему контенту, заблокируйте их через robots.txt, используя имя пользовательского агента.

Мы обновляем этот список по мере появления новых сканеров и обновления существующих. Поэтому мы рекомендуем вам добавить этот URL-адрес в закладки или периодически возвращаться к этой статье, чтобы обновлять список сканеров искусственного интеллекта.

Дополнительные ресурсы:


Рекомендованное изображение: BestForBest/Shutterstock

Source