В подкасте Google «Search Off the Record» недавно была освещена проблема SEO, которая может привести к исчезновению веб-сайтов из результатов поиска.

В последнем эпизоде ​​член поисковой команды Google Аллан Скотт рассказал о «мародирующих черных дырах», возникающих в результате группировки похожих страниц с ошибками.

Система Google может случайно сгруппировать похожие страницы с ошибками, в результате чего в эти группы будут включены обычные страницы.

Это означает, что Google не может повторно сканировать эти страницы, что может привести к их деиндексации даже после исправления ошибок.

В подкасте объясняется, как это происходит, какое влияние это оказывает на поисковый трафик и как владельцы сайтов могут предотвратить потерю своих страниц.

Как Google борется с дублированным контентом

Чтобы понять черные дыры контента, сначала нужно понять, как Google обрабатывает дублированный контент.

Скотт объясняет, что это происходит в два этапа:

  1. Кластеризация: Google группирует страницы с одинаковым или очень похожим содержанием.
  2. Канонизация: Google затем выбирает лучший URL из каждой группы.

После кластеризации Google прекращает повторное сканирование этих страниц. Это экономит ресурсы и позволяет избежать ненужной индексации дублированного контента.

Как страницы ошибок создают черные дыры

Проблема «черной дыры» возникает, когда страницы ошибок группируются вместе, поскольку они имеют схожий контент, например общие сообщения «страница не найдена». Обычные страницы со случайными ошибками или временными сбоями могут застревать в этих кластерах ошибок.

Система дублирования предотвращает повторное сканирование страниц внутри кластера. Это затрудняет выход из «черной дыры» неправильно сгруппированных страниц даже после исправления первоначальных ошибок. Это может привести к деиндексации этих страниц, что приведет к потере органического поискового трафика.

ЧИТАТЬ  Google Analytics 4: пошаговое руководство по отслеживанию офлайн-конверсий

Скотт объяснил:

«Только те вещи, которые находятся на вершине кластера, скорее всего, выйдут наружу. Что меня действительно беспокоит, так это сайты с временными ошибками… Если их невозможно восстановить, ваш рендеринг может сломаться. В этом случае мы проверим ваш сайт и предположим, что он сломан».

Как избежать черных дыр

Чтобы избежать проблем с «черными дырами дублированного контента», Скотт дал следующий совет:

  1. Используйте правильные коды состояния HTTP: для страниц ошибок используйте правильные коды состояния (например, 404, 403 и 503) вместо статуса 200 OK. Группировать можно только страницы, отмеченные знаком 200 OK.
  2. Создавайте уникальный контент для пользовательских страниц ошибок: если у вас есть настраиваемые страницы ошибок, использующие статус 200 ОК (обычно в одностраничных приложениях), убедитесь, что эти страницы содержат определенный контент, чтобы предотвратить группировку. Например, укажите в тексте код и имя ошибки.
  3. Будьте осторожны с тегами noindex.: не используйте теги noindex на страницах с ошибками, если вы не хотите, чтобы они были навсегда удалены из результатов поиска. Этот тег указывает не только на коды состояния ошибок, но и на то, что вы хотите удалить страницы.

Следуя этим советам, вы можете быть уверены, что обычные страницы случайно не перепутаются со страницами с ошибками, сохранив их в индексе Google.

Регулярная проверка сканирования и индексации вашего сайта может помочь выявить повторяющиеся проблемы на ранней стадии.

В итоге

Подкаст Google «Search Off the Record» выявил потенциальную проблему SEO, когда страницы с ошибками могут рассматриваться как дублирующийся контент. Это может привести к тому, что обычные страницы с ошибками будут сгруппированы и удалены из индекса Google, даже если ошибки исправлены.

ЧИТАТЬ  Требования Google Ads: обновление для ЕЭЗ и Великобритании

Чтобы избежать проблем с дублированием контента, владельцам сайтов следует:

  1. Используйте правильные коды состояния HTTP для страниц ошибок.
  2. Убедитесь, что настраиваемые страницы ошибок имеют четкое содержание.
  3. Следите за охватом сканирования и индексацией вашего сайта.

Следование передовым техническим практикам SEO необходимо для поддержания высокой эффективности поиска, как подчеркивает поисковая команда Google.

Полную дискуссию можно услышать в видео ниже:


Рекомендуемое изображение: Назарий_Нещеренский/Шаттерсток

Source