Google обновил свою центральную документацию поиска, чтобы проверить Googlebot, добавив документацию о посещениях ботов, инициированных пользователями, информацию, которая отсутствовала в предыдущей документации Googlebot, что создавало путаницу в течение многих лет, поскольку некоторые издатели блокировали диапазоны IP-адресов законных посещений.

Недавно обновленная документация по ботам

Google добавил новую документацию, в которой классифицируются три различных типа ботов, которых должны ожидать издатели.

Это три категории ботов Google:

  • Googlebot — поисковый робот
  • Гусеничные сканеры специального назначения
  • Сборщики, запускаемые пользователем (GoogleUserContent)

Последнее, GoogleUserContent, долгое время сбивало с толку издателей, потому что у Google не было никакой документации по этому поводу.

Вот что Google говорит о GoogleUserContent:

«Выборщики, инициируемые пользователями

Инструменты и функции продукта, в которых конечный пользователь инициирует выборку.

Например, Google Site Verifier действует по запросу пользователя.

Поскольку выборка была запрошена пользователем, эти сборщики игнорируют правила robots.txt».

В документации указано, что обратная маска DNS покажет следующий домен:

«***-***-***-***.gae.googleusercontent.com»

В прошлом некоторые представители SEO-сообщества говорили мне, что активность ботов с IP-адресов, связанных с GoogleUserContent.com, инициировалась, когда пользователь просматривал веб-сайт с помощью функции перевода, которая раньше была в результатах поиска. которого больше нет в поисковой выдаче Google.

Я не знаю, правда это или нет. Достаточно было знать, что это был визит из Google, инициированный пользователями.

В новой документации Google объясняется, что активность ботов с IP-адресов, связанных с GoogleUserContent.com, может быть вызвана инструментом Google Site Verifier.

Но Google не говорит, что еще может вызвать бота с IP-адресов GoogleUserContent.com.

Другим изменением в документации является ссылка на googleusercontent.com в контексте IP-адресов, присвоенных доменному имени GoogleUserContent.com.

Это новый текст:

«Убедитесь, что имя домена — googlebot.com, google.com или googleusercontent.com».

Еще одним новым дополнением является следующий текст, который был расширен со старой страницы:

«В качестве альтернативы вы можете идентифицировать Googlebot по IP-адресу, сопоставив IP-адрес сканера со списками диапазонов IP сканеров и сборщиков Google:

Googlebot

Специальные поисковые роботы, такие как AdsBot

Пользовательские выборки»

Документация по идентификации бота Google

В новой документации наконец-то есть что-то о ботах, использующих IP-адреса, связанные с GoogleUserContent.

ЧИТАТЬ  Рейтинги и обзоры популярных продуктов Google Store

Поисковые маркетологи были сбиты с толку этими IP-адресами и предположили, что эти боты были спамом.

Обсуждение справки Google Search Console от 2020 года показывает, насколько людей смущала активность, связанная с GoogleUserContent.

Многие в этом обсуждении справедливо пришли к выводу, что это был не робот Googlebot, но затем ошибочно пришли к выводу, что это фальшивый бот, притворяющийся Google.

Пользователь написал:

«Поведение, которое я вижу с этих адресов, очень близко (если не идентично) к законному поведению робота Googlebot, и оно затрагивает несколько наших сайтов.

…Если это не так, то это, по-видимому, указывает на то, что кто-то изо всех сил старается выглядеть как Google на наших сайтах, это, по-видимому, указывает на широко распространенную деятельность злонамеренных ботов, что вызывает обеспокоенность».

После нескольких ответов человек, начавший обсуждение, приходит к выводу, что активность GoogleUserContent была спамом.

Они написали:

«…Упомянутые роботы Google имитируют официальных пользовательских агентов, но имеющиеся доказательства указывают на то, что они поддельные.

Я их пока заблокирую».

Теперь мы знаем, что действия ботов с IP-адресов, связанных с GoogleUserContent, не являются спамом или хакерскими ботами.

Они действительно из Google. Издателям, которые в настоящее время блокируют IP-адреса, связанные с GoogleUserContent, вероятно, следует разблокировать их.

Текущий список IP-адреса User Trigger Fetcher доступны здесь.

Прочтите обновленную документацию Google:

Проверка робота Googlebot и других поисковых роботов Google

Избранное изображение Shutterstock/Asier Romero





Source link