В недавнем выпуске подкаста Google Search Off the Record Аллан Скотт из команды Dups объяснил, как Google решает, какой URL считать основным при наличии повторяющихся страниц.
Он рассказал, что Google рассматривает около 40 различных сигналов, чтобы выбрать основной URL-адрес из группы похожих страниц.
Содержание
- 1 Около 40 сигналов для выбора канонического URL
- 2 Балансировка сигналов
- 3 Лучшие практики канонизации
- 4 Ошибки, которых следует избегать
- 4.1 1. Неправильные или конфликтующие канонические теги.:
- 4.2 2. Канонические цепи или петли
- 4.3 3. Совместное использование тегов noindex и canonical
- 4.4 4. Канонизация для перенаправления или запрета индексации страниц.
- 4.5 5. Игнорирование чувствительности к регистру
- 4.6 6. Пропуск пагинации и параметров
- 5 Ключевые выводы
Около 40 сигналов для выбора канонического URL
Дублирование контента является распространенной проблемой для поисковых систем, поскольку многие веб-сайты имеют несколько страниц с одинаковым или похожим контентом.
Чтобы решить эту проблему, Google использует процесс, называемый канонизацией. Этот процесс позволяет Google выбрать один URL-адрес в качестве основной версии для индексации и отображения в результатах поиска.
Google обсудил важность использования таких сигналов, как теги rel=»canonical», карты сайта и 301 редирект для канонизации. Однако количество сигналов, участвующих в этом процессе, больше, чем вы можете ожидать.
Скотт рассказал во время подкаста:
«Я не уверен, какое точное число сейчас, потому что оно то увеличивается, то уменьшается, но я подозреваю, что оно где-то около 40».
Некоторые из известных упомянутых сигналов включают в себя:
- теги rel=»canonical»
- 301 редирект
- HTTPS против HTTP
- Карты сайта
- Внутренние ссылки
- Длина URL-адреса
Вес и важность каждого сигнала могут различаться, а некоторые сигналы, такие как теги rel=»canonical», могут влиять как на процесс кластеризации, так и на процесс канонизации.
Балансировка сигналов
Учитывая так много сигналов, Аллан признал, что при определении канонического URL-адреса в случае конфликта сигналов возникают проблемы.
Он заявил:
«Если ваши сигналы конфликтуют друг с другом, система начнет использовать меньшие сигналы».
Это означает, что, хотя сильные сигналы, такие как теги rel=»canonical» и редиректы 301, имеют решающее значение, другие факторы могут вступить в игру, когда эти сигналы неясны или противоречивы.
В результате процесс канонизации Google включает в себя деликатную балансировку для определения наиболее подходящего канонического URL.
Лучшие практики канонизации
Четкие сигналы помогают Google определить предпочтительный канонический URL.
Лучшие практики включают в себя:
- Правильно используйте теги rel=»canonical».
- Внедрите 301 редирект для постоянно перемещаемого контента.
- Убедитесь, что HTTPS-версии страниц доступны и связаны между собой.
- Отправьте файлы Sitemap с предпочтительными каноническими URL-адресами.
- Следите за тем, чтобы внутренние ссылки были последовательными.
Эти сигналы помогают Google найти правильные канонические URL-адреса, улучшая сканирование, индексацию и видимость вашего сайта в поиске.
Ошибки, которых следует избегать
Вот несколько распространенных ошибок, на которые следует обратить внимание.
1. Неправильные или конфликтующие канонические теги.:
- Указ на несуществующую страницу или 404 страницу
- Несколько канонических тегов с разными URL-адресами на одной странице.
- Указывая полностью на другой домен
Исправить: дважды проверяйте канонические теги, используйте только один на страницу и используйте абсолютные URL-адреса.
2. Канонические цепи или петли
Когда страница A указывает на страницу B как каноническую, а страница B указывает обратно на A или другую страницу, создается цикл.
Исправить: убедитесь, что канонические URL-адреса всегда указывают на окончательную, предпочтительную версию страницы.
3. Совместное использование тегов noindex и canonical
Отправка смешанных сигналов поисковым системам. Noindex означает, что страница вообще не индексируется, что делает канонические значения неактуальными.
Исправить: используйте канонические теги для консолидации и noindex для исключения.
4. Канонизация для перенаправления или запрета индексации страниц.
Указание канонических символов на перенаправленные или неиндексируемые страницы сбивает с толку поисковые системы.
Исправить: Канонические URL-адреса должны иметь статус 200 и индексироваться.
5. Игнорирование чувствительности к регистру
Несогласованный регистр URL-адресов может привести к проблемам с дублированием контента.
Исправить: Обеспечьте единообразие регистра URL и канонического тега.
6. Пропуск пагинации и параметров
Разбивка на страницы и URL-адреса с большим количеством параметров могут привести к дублированию при неправильном обращении.
Исправить: используйте канонические теги, указывающие на первую страницу или «Просмотреть все» для нумерации страниц, и сохраняйте согласованность параметров.
Ключевые выводы
Маловероятно, что полный список из более чем 40 сигналов, используемых для определения канонических URL-адресов, будет опубликован.
Тем не менее, это все равно была содержательная дискуссия, заслуживающая внимания.
Вот основные выводы:
- Google использует около 40 различных сигналов для определения канонических URL-адресов, при этом теги rel=»canonical» и 301 редирект являются одними из самых сильных показателей.
- Когда сигналы конфликтуют, Google прибегает к второстепенным сигналам, чтобы принять решение.
- Четкая и последовательная реализация сигналов канонизации (теги, редиректы, карты сайта, внутренние ссылки) имеет решающее значение.
- Распространенные ошибки, такие как канонические цепочки, смешанные сигналы или неправильная реализация, могут сбить с толку поисковые системы.
Полную дискуссию можно услышать в видео ниже:
Рекомендованное изображение: чатиянон/Shutterstock