В мае Гэри Иллис из Google дал интервью на конференции SERP Conf 2024 в Болгарии и ответил на вопрос о причинах «сканируется, но не индексируется». Он упомянул несколько причин, которые помогут отладить и исправить эту ошибку.

Несмотря на то, что интервью состоялось в мае, видео интервью не получило широкого освещения, и немногие люди его видели. Я услышал об этом только благодаря всегда великой Олесе Коробке (@Гириджа) недавно обратил внимание на интервью в посте в Facebook.

Несмотря на то, что интервью состоялось в мае, информация по-прежнему актуальна и полезна.

Причина сканирования: в настоящее время не индексируется.

«Сканировано в настоящее время не проиндексировано» — это ссылка на отчет об ошибке в отчете об индексировании страницы Google Search Console, который указывает, что страница была просканирована Google, но не проиндексирована.

Во время прямого эфира кто-то задал следующий вопрос:

«Может ли тот факт, что страница была просканирована, но не проиндексирована, потому, что она слишком похожа на другой контент, который уже был проиндексирован?

Google говорит, что уже существует достаточно других вещей, а ваши вещи недостаточно уникальны?»

Документация Google Search Console не дает ответа на вопрос, почему Google может просканировать страницу, но не проиндексировать ее. Так что это закономерный вопрос.

Гэри Иллис ответил, что одной из причин может быть то, что уже существует другой подобный контент. Однако он добавил, что были и другие причины.

Он ответил:

«Да, это может быть возможным значением. Сканирование, но не индексирование означает, что в идеале мы должны разбить эту категорию на более мелкие фрагменты, но это очень сложно из-за внутренней структуры данных.

Это может быть по-разному, дедупликация — это одна из тех вещей, когда мы сканируем страницу, а затем решаем не индексировать ее, потому что в нашем индексе уже есть версия или очень похожая версия этого контента, и они предоставляют более качественные сигналы.

Но да, это может быть несколько вещей».

Общее качество сайта может повлиять на индексацию.

Затем Гэри указал на еще одну причину, по которой Google может сканировать сайт, но не индексировать его. Он сказал, что это может быть проблема с качеством сайта.

ЧИТАТЬ  Презентация Google Testing AI с небольшой ссылкой «Подробнее»

Затем Иллиес продолжил свой ответ:

«И общее качество сайта может быть очень важным, учитывая, сколько из этих просканированных, но неиндексированных URL-адресов вы видите в Search Console. Если количество этих URL-адресов очень велико, это может указывать на общие проблемы с качеством.

И я часто видел, как это происходило с февраля, когда мы внезапно решили проиндексировать огромное количество URL-адресов на сайте только потому, что… наше восприятие сайта изменилось».

Другие причины сканирования, но не индексирования

Далее Гэри привел дополнительные причины, по которым URL-адреса могут сканироваться, но не индексироваться. Он сказал, что это может быть связано с тем, что восприятие сайта Google изменилось, но это также может быть техническая проблема.

Гэри объяснил:

«…И одна из возможностей заключается в том, что если вы увидите, что это число увеличивается, восприятие сайта Google изменилось. Это может быть вещью.

Но может случиться и так, что, например, на сайте возникла ошибка, а затем одна и та же страница была отправлена ​​на каждый URL-адрес сайта. Это также может быть одной из причин, почему это число увеличивается.

Так что да, там может быть много всего».

Выводы

Гэри предоставил ответы, которые должны помочь устранить неполадки, почему веб-страница может сканироваться, но не индексироваться Google.

  • Контент аналогичен контенту, который уже ранжируется на страницах результатов поисковых систем (SERP).
  • Точно такой же контент существует на другом сайте с лучшими сигналами.
  • Общие проблемы с качеством сайта
  • Технические проблемы

Хотя Иллиес не уточнил, что он имел в виду под другим сайтом с лучшими сигналами, я почти уверен, что он описывает сценарий, когда один сайт объединяет свой контент с другим сайтом, а Google решает отдать должное другому сайту за рейтинг контента, а не за рейтинг. оригинальный издатель.

ЧИТАТЬ  Поиск Google хочет, чтобы вы сообщали о неточных названиях сайтов

Посмотрите, как Гэри отвечает на этот вопрос на 9-й минуте записанного интервью:

Рекомендованное изображение: Shutterstock/Роман Самборский

Source