Джон Мюллер из Google объяснил разницу между кластеризацией и канонизацией в поиске Google. Он сказал: «Кластеризация — это, по сути, взятие страниц, которые, по нашему мнению, одинаковы. А затем канонизация из этих страниц — какая из них является лучшей». Джон сказал это на 3:03 минута интервью.
Об этом говорилось в превосходном интервью Search Off The Record с Алланом Скоттом из команды Google Search, который специально занимается дублированием в Google Search. Мартин Сплитт и Джон Мюллер из Google взяли интервью у Аллана.
Аллан объяснил в начале видео: «Когда люди думают о канонизации, они как бы представляют себе один черный ящик, который делает все волшебные вещи вместе. И очень сложно обрабатывать запросы от людей, которые говорят: «Ну, почему канонизация неправильно?» И поэтому я склонен подталкивать людей думать об этом так, будто канонизация — это один шаг. У меня есть куча URL-адресов, и я хочу знать, какой из них является каноническим, но есть и другие шаги, которые как, если не более важно, например, первый из них — кластеризация».
Аллан продолжил объяснять: «Обычно, когда люди приходят к нам и жалуются на канонизацию, мы сразу же говорим: «О, это проблема кластеризации, потому что эти две страницы не должны находиться в одном кластере, не говоря уже о случаях канонический выбор». Например, если вы хотите предложить мне проблему канонизации, то это значит, что эти две страницы находятся в одном кластере, но на самом деле это не так, как будто мы выбрали не ту. Самый ужасный случай — а угоны самолетов, мы видим это и действуем очень быстро, потому что это просто катастрофы».
Именно тогда Джон Мюллер подытожил ответ следующим образом: «Кластеризация — это, по сути, отбор страниц, которые мы считаем одинаковыми. А затем канонизация на основе этих страниц — какая из них является лучшей? Это примерно так?» На что Аллан ответил: «Именно. Да».
Затем Алан привел такой пример: «Итак, например, rel=»canonical» — это своего рода магический фактор, который пересекает обе эти линии. rel=»canonical» фактически сначала попытается поместить две страницы в один кластер. Это может быть или может не получиться, но если две страницы находятся в одном кластере и между ними стоит rel=»canonical», то это тоже канонический сигнал выбора.
Это началось примерно в начале этого видео, если вы хотите его послушать:
Обсуждение на форуме Х.