Вот хорошее замечание Джона Мюллера из Google о технических особенностях индекса Google. Джон сказал на Твиттер «Содержимое страницы не нужно индексировать, чтобы страница была проиндексирована».
Джон добавил, что это также относится к использованию пар hreflang, по его словам, «или к использованию с парами hreflang, если они эквивалентны». «Это совершенно нормально и не является признаком проблемы», — добавил он.
Вот эти твиты:
Я не совсем понимаю, о чем вы спрашиваете… Содержимое страницы не нужно индексировать, чтобы страница была проиндексирована, или для ее использования с парами hreflang, если они эквивалентны. Это совершенно нормально и не является признаком проблемы.
— Джона Мюллера в основном нет ? (@JohnMu) 29 ноября 2022 г.
Одним из примеров является страница, сканирование которой запрещено файлом robots.txt. Другой случай, когда страница известна как часть набора hreflang, а URL-адрес заменен. Или когда вы ищете старый URL-адрес, который был перенаправлен.
— Джона Мюллера в основном нет ? (@JohnMu) 29 ноября 2022 г.
Что это значит? Технически, Google не должен индексировать содержимое, эти слова, HTML, изображения и т. д. на этой странице, чтобы страница попала в индекс Google. Google может просто обработать URL-адрес этой страницы, и URL-адрес этой страницы может быть проиндексирован, а может и не иметь контента или HTML. Таким образом, URL-адреса существующих страниц могут быть в индексе Google, с содержанием или без него.
В конечном счете, вы хотите, чтобы ваш контент был проиндексирован, чтобы Google действительно мог решить, должна ли эта страница в индексе Google ранжироваться по вашему желаемому запросу. Но это всего лишь формальность, с точки зрения того, как Джон ссылается на это, и мне это нравится.
Обсуждение форума на Твиттер.