Видимость ИИ играет решающую роль для оптимизаторов, и это начинается с контроля сканеров ИИ. Если сканеры ИИ не смогут получить доступ к вашим страницам, вы будете невидимы для систем обнаружения ИИ.
С другой стороны, неконтролируемые сканеры с искусственным интеллектом могут перегружать серверы чрезмерными запросами, что приводит к сбоям и неожиданным счетам за хостинг.
Строки пользовательского агента важны для контроля того, какие сканеры AI могут получить доступ к вашему веб-сайту, но официальная документация часто устарела, неполна или полностью отсутствует. Вот почему мы составили проверенный список сканеров ИИ на основе реальных журналов наших серверов в качестве полезного справочного материала.
Каждый пользовательский агент проверяется на соответствие официальным спискам IP-адресов, если таковые имеются, для обеспечения точности. Мы будем поддерживать и обновлять этот список, чтобы обнаруживать новые сканеры и изменения в существующих.
Содержание
- 1 Полный список проверенных сканеров искусственного интеллекта (декабрь 2025 г.)
- 2 Популярные сканеры AI-агентов с неопознаваемым пользовательским агентом
- 3 Как проверить, что сканирует ваш сервер
- 4 Как проверить легитимность по сравнению с поддельными ботами
- 5 Вывод: сохраняйте контроль над сканерами ИИ, чтобы обеспечить надежную видимость ИИ.
Полный список проверенных сканеров искусственного интеллекта (декабрь 2025 г.)
| имя | Цель | Скорость сканирования SEJ (страниц/час) | Список проверенных IP-адресов | Запретить файл robots.txt | Полный пользовательский агент |
|---|---|---|---|---|---|
| GPTBot | Сбор данных обучения ИИ для моделей GPT (ChatGPT, GPT-4o) | 100 | Официальный список IP | Пользовательский агент: GPTBot Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; GPTBot/1.3; + |
| Пользователи ChatGPT | AI-агент для просмотра веб-страниц в режиме реального времени, когда пользователи взаимодействуют с ChatGPT | 2400 | Официальный список IP | Пользовательский агент: Пользователь ChatGPT Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko); совместимый; Пользователи ChatGPT/1.0; + |
| Поисковый бот OAI | Индексирование поиска AI для функций поиска ChatGPT (не для обучения) | 150 | Официальный список IP | Пользовательский агент: OAI-SearchBot Позволять: / Запретить: /private-folder | Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, например Gecko) Chrome/131.0.0.0 Safari/537.36; совместимый; OAI SearchBot/1.3; + |
| КлодБот | Сбор данных обучения ИИ для моделей Клода | 500 | Официальный список IP | Пользовательский агент: ClaudeBot Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; ClaudeBot/1.0; +claudebot@anthropic.com) |
| Пользователь Клода | AI-агент для доступа в Интернет в режиме реального времени, когда пользователи Claude просматривают сайты | <10 | Нет в наличии | Пользовательский агент: Клод-Пользователь Запретить: /sample-папка | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Claude-User/1.0; +Claude-User@anthropic.com) |
| Клод SearchBot | Индексирование поиска AI для функций поиска Claude | <10 | Нет в наличии | Пользовательский агент: Клод-SearchBot Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Claude-SearchBot/1.0; + |
| Google CloudVertexBot | AI-агент для Vertex AI Agent Builder (только по запросу владельцев сайтов) | <10 | Официальный список IP | Пользовательский агент: Google-CloudVertexBot Позволять: / Запретить: /private-folder | Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, например Gecko) Chrome/141.0.7390.122 Mobile Safari/537.36 (совместимый; Google-CloudVertexBot; + |
| Google расширенный | Токен, который контролирует использование для обучения ИИ контента, сканируемого роботом Googlebot. | Пользовательский агент: Google Extended Позволять: / Запретить: /private-folder | |||
| Глубокие исследования Близнецов | Агент по исследованию искусственного интеллекта для функции Deep Research Google Gemini | <10 | Официальный список IP | Пользовательский агент: Gemini Deep Research Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Gemini Deep Research; + Chrome/135.0.0.0 Safari/537.36 |
| Чат Gemini, когда пользователь просит открыть веб-страницу | <10 | ||||
| Бингбот | Включает ответы ИИ для поиска Bing и чата Bing (второй пилот). | 1300 | Официальный список IP | Пользовательский агент: BingBot Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; bingbot/2.0; + Chrome/116.0.1938.76 Safari/537.36 |
| Applebot расширенный | Не ползает но контролирует, как Apple использует данные Applebot. | <10 | Официальный список IP | Пользовательский агент: Applebot-Extended Позволять: / Запретить: /private-folder | Mozilla/5.0 (Macintosh; Intel Mac OS) |
| PerplexityBot | Поисковая индексация AI для системы ответов Perplexity | 150 | Официальный список IP | Пользовательский агент: PerplexityBot Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; PerplexityBot/1.0; + |
| Пользователи в недоумении | AI-агент для просмотра в режиме реального времени, когда пользователи Perplexity запрашивают информацию | <10 | Официальный список IP | Пользовательский агент: Пользователь Perplexity Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Perplexity-User/1.0; + |
| Мета ВнешнийАгент | Сбор данных для обучения искусственному интеллекту для студентов Metas LLM (Lama и т. д.) | 1100 | Нет в наличии | Пользовательский агент: метавнешний агент Позволять: / Запретить: /private-folder | мета-внешний агент/1.1 (+ |
| Мета-веб-индексер | Привыкший Улучшите мета-поиск ИИ. | <10 | Нет в наличии | Пользовательский агент: Meta-WebIndexer Позволять: / Запретить: /private-folder | мета-вебиндексер/1.1 (+ |
| Байтпаук | Данные обучения искусственного интеллекта для программ LLM ByteDance для таких продуктов, как TikTok. | <10 | Нет в наличии | Пользовательский агент: Байтспайдер Позволять: / Запретить: /private-folder | Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, например Gecko) Mobile Safari/537.36 (совместимый; Bytespider; |
| Амазонский бот | Обучение искусственному интеллекту для Alexa и других сервисов Amazon AI | 1050 | Нет в наличии | Пользовательский агент: Amazonbot Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; Amazonbot/0.1; + Chrome/119.0.6045.214 Safari/537.36 |
| DuckAssistBot | Поисковая индексация AI для поисковой системы DuckDuckGo | 20 | Официальный список IP | Пользовательский агент: DuckAssistBot Позволять: / Запретить: /private-folder | ДакАссистБот/1.2; (+ |
| Пользователь MistralAI | Получение котировок Mistral в реальном времени для помощника Le Chat | <10 | Нет в наличии | Пользовательский агент: Пользователь MistralAI Позволять: / Запретить: /private-folder | Mozilla/5.0 AppleWebKit/537.36 (KHTML, как Gecko; совместимо; MistralAI-User/1.0; + |
| Вебз.ио | Извлечение данных и парсинг веб-страниц, используемые другими компаниями по обучению искусственному интеллекту. Ранее известный как Омгили. | <10 | Нет в наличии | Пользовательский агент: вебзио Позволять: / Запретить: /private-folder | вебзио (+ |
| Диффбот | Извлечение данных и парсинг веб-страниц используются компаниями по всему миру. | <10 | Нет в наличии | Пользовательский агент: Диффбот Позволять: / Запретить: /private-folder | Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 (.NET CLR 3.5.30729; Diffbot/0.1; + |
| ICC-сканер | Сбор данных с помощью искусственного интеллекта и машинного обучения | <10 | Нет в наличии | Пользовательский агент: сканер ICC Позволять: / Запретить: /private-folder | ICC Crawler/3.0 (совместим с Mozilla; ; |
| CCBot | Веб-архив с открытым исходным кодом, используемый в качестве обучающих данных несколькими компаниями, занимающимися искусственным интеллектом. | <10 | Официальный список IP | Пользовательский агент: CCBot Позволять: / Запретить: /private-folder | CCBot/2.0 ( |
Все приведенные выше строки пользовательского агента были проверены по журналам сервера журнала поисковой системы.
Популярные сканеры AI-агентов с неопознаваемым пользовательским агентом
Мы обнаружили, что не были идентифицированы:
- you.com.
- Оператор агента ChatGPT.
- Чат второго пилота Bing.
- Грок.
- ДипСик.
Невозможно отследить доступ этого сканера к веб-страницам, кроме как путем определения явного IP-адреса.
Мы создали страницу-ловушку (е.Г., /specific-page-for-you-com/) и использовали чат на странице, чтобы предложить you.com посетить сайт, чтобы мы могли найти соответствующую запись о посещении и IP-адрес в журналах нашего сервера. Ниже приведен скриншот:
А как насчет агентских браузеров с искусственным интеллектом?
К сожалению, ИИ-браузеры, такие как Comet или Atlas, не отличаются от ChatGPT строкой пользовательского агента, и вы не можете идентифицировать их в журналах сервера и не можете смешивать их с посещениями обычных пользователей.

Это разочаровывает оптимизаторов, поскольку отслеживание посещений веб-сайта браузером агента важно для отчетов POV.
Как проверить, что сканирует ваш сервер
Некоторые хостинговые компании предлагают пользовательский интерфейс (UI), который упрощает доступ и просмотр журналов сервера, в зависимости от того, какую услугу хостинга вы используете.
Если ваш хостинг не предлагает этого, вы можете получить файлы журналов сервера (обычно по адресу: /var/log/apache2/access.log (для серверов на базе Linux) через FTP или запросите его у службы поддержки вашего сервера, чтобы отправить вам.
Получив файл журнала, вы можете просмотреть и проанализировать его либо в Google Sheets (если файл в формате CSV), в анализаторе журналов Screaming Frog, либо, если ваш файл журнала находится в формате CSV. менее 100 МБвы можете попытаться проанализировать его с помощью Gemini AI.
Как проверить легитимность по сравнению с поддельными ботами
Поддельные сканеры могут подменять законных пользовательских агентов, чтобы обойти ограничения и агрессивно сканировать контент. Например, любой может выдать себя за ClaudeBot со своего ноутбука и инициировать запрос на сканирование с терминала. В журнале вашего сервера вы увидите это, когда Claudebot сканирует его:
curl -A 'Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)' Проверка может помочь сэкономить пропускную способность сервера и предотвратить сбор нелегального контента. Самый надежный метод проверки, который вы можете использовать, — это проверка IP-адреса запроса.
Проверьте все IP-адреса и найдите совпадение, если это один из официально заявленных IP-адресов, перечисленных выше. Если да, вы можете удовлетворить запрос; в противном случае заблокировать.
Различные типы брандмауэров могу помочь тебе Он блокирует IP-адреса, проверенные в белом списке (которые позволяют проходить законным запросам ботов) и блокирует все другие запросы, которые выдают себя за сканеров AI в строках их пользовательских агентов.
Например, в WordPress вы можете использовать Бесплатный плагин Wordfence внести в список разрешенных законные IP-адреса из официальных списков (как указано выше) и добавить пользовательские правила блокировки, как показано ниже:
Настройка IP для белого списка в Wordfence
Заблокировать настройку пользовательского агента в Wordfence
Правило белого списка является более эффективным и позволяет законным сканерам проходить и блокировать все запросы на выдачу себя за другое лицо, поступающие с разных IP-адресов.
Однако обратите внимание, что это возможно подделать IP-адреси в этом случае вы не сможете заблокировать пользовательский агент бота и IP-адреса, если они подделаны.
Вывод: сохраняйте контроль над сканерами ИИ, чтобы обеспечить надежную видимость ИИ.
Поисковые роботы с искусственным интеллектом теперь являются частью нашей веб-экосистемы, а перечисленные здесь боты представляют собой основные платформы искусственного интеллекта, которые в настоящее время индексируют Интернет, хотя этот список, вероятно, будет расширяться.
Регулярно проверяйте журналы своего сервера, чтобы узнать, что на самом деле поступает на ваш веб-сайт, и убедитесь, что вы случайно не блокируете сканеры ИИ, если видимость в поисковых системах ИИ важна для вашего бизнеса. Если вы не хотите, чтобы сканеры ИИ имели доступ к вашему контенту, заблокируйте их через robots.txt, используя имя пользовательского агента.
Мы обновляем этот список по мере появления новых сканеров и обновления существующих. Поэтому мы рекомендуем вам добавить этот URL-адрес в закладки или периодически возвращаться к этой статье, чтобы обновлять список сканеров искусственного интеллекта.
Дополнительные ресурсы:
Рекомендованное изображение: BestForBest/Shutterstock

![Полный список сканеров для пользовательских агентов AI [Dec 2025]](https://cdn.searchenginejournal.com/wp-content/uploads/2025/10/allowlist-ips-wordfence-774.png)

