Разбираем, что такое кластеризация семантики, какие есть методы и зачем она нужна.
Кластеризация семантического ядра — это объединение ключевых слов или фраз в группы (кластеры) по контексту и признакам объектов, к которым они относятся. На один кластер должна приходиться только одна страница и на одну страницу — один кластер.
Кажется, что сгруппировать собранную семантику в тематические группы вполне можно, полагаясь на здравый смысл. Нетрудно сообразить, что запросы «купить квартиру в новостройке» и «купить новую квартиру» относятся к одной группе, а «купить вторичку» — к другой. Но так бывает не всегда.
Кластеризация — второй шаг в создании сайта. Первый — сбор семантики. Обе этих задачи нужно сделать еще до создания сайта, иначе не на чем будет строить его структуру. Это особенно важно для крупных контентных сайтов, каталогов товаров и сайтов с большим выбором услуг.
Статья по теме: Сначала SEO, потом сайт: как проектировать семантику [Конспект вебинара]
Когда есть семантическое ядро, разбитое на кластеры, можно проектировать структуру и страницы: какие создать разделы, как их перелинковать, из чего собрать каталог и что публиковать в блоге.
В этой статье разберем, почему не стоит использовать семантику без кластеров, какие методы группировки есть и как кластеризовать запросы онлайн, не скачивая дополнительный софт.
Содержание
- 1 Чем кластеризация полезна для SEO
- 2 Интент запроса при кластеризации
- 3 Методы кластеризации
- 4 Кластеризация вручную
- 5 Что делать потом
Чем кластеризация полезна для SEO
Кластеризация решает две задачи — распределение семантики по сайту для повышения его позиций в выдаче и создание структуры, которая улучшит пользовательский опыт. Что еще:
-
Внутренняя перелинковка — кластеризация помогает создать систему ссылок, чтобы удерживать пользователей на сайте и увеличивать конверсии. Например, на карточке товара в интернет-магазине можно добавить блок «Вам может быть интересно» с похожими или сопутствующими товарами;
-
Проработка структуры сайта — группировка запросов покажет, насколько наполнены разделы сайта, верно ли определены целевые страницы, нет ли перекоса в сторону одного типа запросов;
-
Расширение контента — после кластеризации запросов станет понятно, каких страниц не хватает на сайте, а какие темы уже охвачены. На основе слов из кластера составляют ТЗ для копирайтера;
-
Исключение ненужных запросов — в результате кластеризации можно выявить запросы, которые не приносят трафик и не соответствуют целям пользователей;
-
Тестирование разных рекламных объявлений — можно создать несколько в рамках одной группы слов, чтобы понять, какие работают эффективнее.
Интент запроса при кластеризации
Интент — это намерение или потребность пользователя, которая выражена в его запросе. Он помогает определить, какие слова объединить в один кластер, чтобы удовлетворить потребность наиболее точно, то есть при делении слов на группы важно, чтобы они были близки не только по смыслу и теме.
Какие бывают интенты:
-
Информационные — пользователь хочет узнать, как что-то сделать или почему что-то происходит, например, «как установить смеситель»;
-
Навигационные — пользователь ищет конкретный сайт или бренд;
-
Транзакционные — пользователь намерен что-то купить, заказать, оформить. Например, «заказать цветы с доставкой Омск»;
-
Общие запросы — ничего не говорят о намерении пользователя, выглядят как «велосипед» или «вечернее платье».
Например, интернет-магазин продает товары для дома. Чтобы оптимизировать его контент, нужно понять, с какой потребностью приходят пользователи.
Вот несколько примеров поисковых запросов, которые они могут делать:
-
«как выбрать кофеварку»;
-
«купить кофеварку DeLonghi»;
-
«сравнение кофеварок DeLonghi и Breville»;
-
«отзывы о кофеварке DeLonghi».
Все эти запросы связаны с кофеварками, но интенты различаются:
Запрос 1: Информационный интент. Пользователь ищет информацию о том, как выбрать кофеварку, можно добавить статью в блог.
Запрос 2: Транзакционный интент. Пользователь хочет купить кофеварку DeLonghi, ему нужно показать карточку товара.
Запрос 3: Информационный интент. Пользователь хочет сравнить две модели кофеварок, можно подготовить обзор со сравнением.
Запрос 4: Информационный интент. Пользователь ищет отзывы о конкретной модели кофеварки.
Несмотря на общую тему, запросы с транзакционным интентом и информационным интентом должны находиться в разных кластерах.
Методы кластеризации
Основных методов кластеризации три: по логике, по семантической схожести, по топам выдачи. Выбор метода кластеризации поисковых запросов для сайта зависит от нескольких факторов от тематики и размера сайта.
Тематика
Например, если сайт в основном состоит из новостных статей, имеет смысл использовать кластеризацию по темам для группировки статей по новостным категориям. Коммерческим сайтам важнее интент. Можно использовать кластеризацию по этапам воронки продаж — эти группы запросов используют в рекламе.
Размер и сложность сайта
Сайты с большим количеством страниц могут требовать более сложных методов кластеризации, в то время как для маленьких сайтов будет достаточно простой группировки по темам.
Можно комбинировать несколько методов. К примеру, сначала строят группы по интенту, а потом по этапам воронки продаж. Можно добавить принцип важности услуги или товара для компании — объединить сопутствующие позиции, выделить самые значимые товары.
На скриншоте фрагмент сбора семантического ядра для сайта туристической компании, которая продает путевки в детские лагеря по всей России. Для ключей определили намерение пользователя и подходящую страницу, на которую должен вести запрос, в соответствие с этим можно составлять группы запросов.
Рассказываем подробнее, какие методы существуют.
Логическая кластеризация
Этот метод основывается на идее, что поисковые запросы, которые связаны по смыслу или логике, должны быть сгруппированы вместе. Суть заключается в понимании значения и контекста каждого поискового запроса. Это отличается от более простых методов кластеризации, например, на основе синтаксической близости, где не учитывают значение этих слов, синонимы, разговорные варианты, контекст или смысловые оттенки. В логической кластеризации важно понимать интент запроса и его тип.
В качестве примера возьмем запросы, связанные со страхованием автомобиля:
-
«страхование авто»;
-
«ОСАГО»;
-
«автострахование цена»;
-
«калькулятор страховки»;
-
«застраховать машину»
Если использовать логическую кластеризацию и сосредоточиться на интенте запросов, окажется, что люди, которые вводят их в поисковую строку, ищут одно и то же — страховку для автомобиля. Поэтому, несмотря на морфологические различия, они должны быть объединены в один кластер.
Сложность этого метода в том, что максимально качественной группировки можно добиться только вручную, так что логическая кластеризация лучше всего подходит для небольших сайтов, где возможно проанализировать каждый запрос. При автоматической кластеризации обязательно нужно просмотреть результаты, чтобы найти кластеры, которые соответствуют одному интенту запроса, чтобы не создавать дублирующие друг друга страницы.
Кластеризация по словоформе
Это процесс группировки запросов на основе их структурного или грамматического сходства. Разные запросы могут иметь одно и то же слово в основе, даже если у них разный контекст.
Например, есть список запросов:
-
«купить последний iPhone»;
-
«iPhone»;
-
«сравнить iPhone и Samsung Galaxy»;
-
«почта на iPhone»;
-
«приложения для iPhone».
Все эти запросы содержат слово «iPhone», но интенты у них разные: покупка, ремонт, сравнение, настройка и поиск приложений. Запросы в кластерах, полученных таким методом, потом нужно делить по типам: информационные, транзакционные, навигационные. Если этого не сделать, пользователи будут находить страницы, близкие по теме, но не решающие их задачу.
Кластеризация по топам выдачи
В рамках этого метода кластеризацию обычно проводят автоматически — с помощью сервисов, которые анализируют выдачу поисковых систем. Если по списку запросов отображаются одни и те же страницы, значит, эти запросы можно поместить в один кластер.
Проверить выдачу можно в бесплатном инструменте для анализа ТОПа.
Например, проверим список запросов:
-
«ремонт ручек на окнах»;
-
«замена ручки на окне»;
-
«стоимость ремонта ручки на окне»;
-
«как отремонтировать ручку на окне»;
-
«сломалась ручка на окне что делать»;
-
«ручка на окне не крутится ремонт»;
-
«ручка на окне застряла ремонт».
Вводим список запросов, выбираем ПС, регион, устройство и глубину проверки — для примера хватит десяти позиций.
Инструмент показывает список страниц по запросам с заданными условиями и подсвечивает совпадающие домены или страницы. В примере видно, что на каждый запрос есть три-четыре страницы, то есть полного совпадения нет. Если страница, для которой собрали эти запросы, информационная, можно использовать их вместе. Для коммерческой страницы запросы надо делить на разные кластеры.
Трудность может возникнуть с распределением запросов в нише с низкой конкуренцией и низкой частотностью, где мало релевантных ответов и не на что опираться при анализе выдачи. В этом случае кластеризовать слова придется вручную.
В автоматической кластеризации есть два подхода, которые определяют, может ли одно слово относиться сразу к нескольким кластерам или только к одному — soft и hard.
Soft кластеризация
Подходит для блогов, информационных проектов, небольших сайтов-визиток.
За основу берут один из запросов, как правило, самый частотный. С ним сравнивают остальные ключи — смотрят, сколько у них общих URL с основным, и если количество соответствует заданному, ключ попадает в группу. Получается, все запросы должны иметь совпадения URL с главным ключом, а между собой — не обязательно. В результате soft кластеризации одно слово может попасть в несколько кластеров, потому что предполагается, что некоторые ключевые слова могут быть релевантны в нескольких контекстах или темах.
Допустим, у нас есть следующие ключевые слова:
-
«кроссовки для бега»;
-
«кроссовки Nike»;
-
«беговые кроссовки Nike»;
-
«спортивная обувь Nike»;
-
«спортивная обувь для бега».
В процессе софт-кластеризации можно сгруппировать их следующим образом:
Кластер 1 (Кроссовки): «кроссовки для бега», «кроссовки Nike», «беговые кроссовки Nike».
Кластер 2 (Бег): «кроссовки для бега», «беговые кроссовки Nike», «спортивная обувь для бега».
Кластер 3 (Nike): «кроссовки Nike», «беговые кроссовки Nike», «спортивная обувь Nike».
Hard кластеризация
Подходит для коммерческих проектов в конкурентных тематиках, где каждое ключевое слово или фраза имеют уникальное и четко определенное значение. В отличие от мягкой кластеризации, где одно ключевое слово может принадлежать к нескольким кластерам, в хард-кластеризации одно слово — один кластер.
В этом методе сравнивают общие URL у всех ключей. Запросы помещают в одну группу, если набирается определенное количество общих URL для всех запросов группы. То есть в мягком методе ключи имеют общие URL с основным запросом, а в жестком все ключи в группе должны иметь общие URL.
Кластеризация hard более точная. Кластеры, сформированные по методу soft, часто объединяют различные по смыслу ключи. Это слишком широкая семантика, с которой еще нужно много работать — вычищать нерелевантные запросы, дробить и перегруппировывать.
Возьмем другие ключевые слова, связанные с обувью:
-
«кроссовки Nike»;
-
«кроссовки Adidas»;
-
«туфли Gucci»;
-
«туфли Prada»;
-
«сапоги Timberland»;
-
«сапоги UGG».
В процессе хард-кластеризации можно сгруппировать их следующим образом:
Кластер 1 (Кроссовки): «кроссовки Nike», «кроссовки Adidas».
Кластер 2 (Туфли): «туфли Gucci», «туфли Prada».
Кластер 3 (Сапоги): «сапоги Timberland», «сапоги UGG».
Минус этого подхода в том, что результаты поисковиков меняются, и готовая кластеризованная семантика через некоторое время может устареть из-за смены топа в выдаче.
Комбинация soft и hard
В некоторых случаях подходы можно комбинировать. Вот пара примеров.
Крупные сайты с разнообразным контентом — ритейлеры или маркетплейсы, которые продают товары и ведут блог. В этом случае можно использовать хард-кластеризацию для товарных страниц и софт-кластеризацию для блога или образовательного контента, где одна и та же тема может быть рассмотрена в нескольких статьях.
Сайты с несколькими языковыми версиями. Если на сайте есть контент на нескольких языках, можно использовать софт-кластеризацию для группировки ключевых слов по темам на каждом языке, но для страниц продуктов или услуг, которые имеют точные переводы на каждом языке, лучше использовать хард-кластеризацию.
Что такое порог кластеризации
Порог определяет минимальное количество общих URL для создания кластера. При низком пороге в группе может оказаться много лишних запросов, при слишком высоком группы могут не сформироваться.
Для каждой тематики есть свой подходящий порог. Рассмотрим подробнее.
Низкий порог
Если вы устанавливаете низкий порог, то запросы с небольшим количеством общих URL-адресов могут попасть в один кластер. Это может быть полезно, чтобы создать более детализированные и точные кластеры, где запросы схожи между собой по теме или содержанию. Но при этом в группе может оказаться много лишних запросов, которые не соответствуют потребности пользователя.
Для информационных ресурсов, таких как сайты с обзорами книг или кулинарные блоги, высокая точность не нужна. Здесь важнее получить максимальное количество сгруппированных кластеров для создания статей с советами, обзоров или рецептов.
Например, у вас есть сайт о Москве, и вы устанавливаете низкий порог кластеризации. Запросы «московские парки», «прогулки по Москве-реке» и «лучшие видовые площадки Москвы» могут быть сгруппированы в один кластер, так как они имеют много общих URL-адресов и относятся к общей теме.
Когда использовать:
-
Создание категорий и подкатегорий в меню сайта;
-
Общий анализ семантики сайта;
-
Учет «хвостов» и длинных запросов;
Высокий порог
Запросы должны иметь много общих URL-адресов, чтобы попасть в один кластер. Это создает кластеры меньшего размера, где запросы объединяются только тогда, когда они тесно связаны между собой. При высоком пороге запросы «московские парки» и «лучшие видовые площадки Москвы» попадут в отдельные кластеры, так как они имеют меньше общих URL-адресов и относятся к разным активностям.
Для продвижения по коммерческим конкурентным запросам, где важна высокая релевантность, используют hard-кластеризацию с высоким порогом. Например, запросы «джинсы Levis 501» и «джинсы Levis 502», хоть и относятся к одному предмету одежды одного производителя, не могут попасть в один кластер, потому что это разные модели, и для них нужны разные страницы.
Когда использовать:
-
Увеличение релевантности страниц;
-
Сокращение количества кластеров;
-
Сегментация разделов сайта;
-
Удаление неподходящих запросов;
Подход и порог можно комбинировать в зависимости от задачи, но, как правило, порог устанавливают для hard-кластеризации.
Проводить кластеризацию вручную методом анализа топов по каждому запросу неэффективно, а в случае с семантическим ядром на несколько тысяч запросов — нереально. Вот несколько платных и бесплатных сервисов, в которых можно кластеризовать ядро.
PromoPult
Ссылка: инструмент «Кластеризация запросов»
Возможности:
-
До 10000 запросов за раз;
-
Кластеризация по методу Hard;
-
Яндекс и Google;
-
Точность в диапазоне от 1 до 10;
-
Результаты хранятся в системе неограниченное время, есть выгрузка в XSLX-файл;
-
Собирает частотность;
-
Проверяет количество главных страниц в выдаче;
Цена: первые 100 запросов бесплатно, далее от 0,06 до 0,11 рублей за запрос.
Rush Analytics
Возможности:
-
Более 70 языков;
-
Яндекс и Google;
-
Soft и hard кластеризация;
-
Подбор релевантных URL;
-
Три алгоритма кластеризации.
Цена: 0,215 рублей за запрос.
Пиксель Тулс
Возможности:
-
Группировка от 2 до 500 запросов;
-
Яндекс и Google;
-
Порог от 1 до 10;
-
Можно исключить новостные агрегаторы;
-
Можно добавить домены-исключения;
-
Сбор частотности;
-
Сбор позиций;
-
Загрузка результатов файлом.
Цена: тарифы от 950 рублей за месяц, проверка запросов включена в тариф.
Be1
Возможности:
-
До 400 запросов;
-
Группировка по топам Яндекса:
-
Выбор региона;
-
Настройка порога кластеризации;
-
Загрузка результата в файле CSV.
Цена: бесплатно.
Arsenkin
Возможности:
-
До 100 запросов;
-
Яндекс и Google;
-
Выбор региона;
-
Способ и порог группировки;
-
Глубина проверки до ТОП-30;
-
Исключение доменов по списку;
-
Проверка частотности;
-
Исключение главных страниц;
-
Поиск релевантной страницы.
Цена: от 0,004 до 0,03 рублей за запрос (лимит) в зависимости от тарифа.
Keys.so
Возможности:
-
До 100 000 запросов;
-
Глубина проверки до ТОП-50;
-
Настройка минимальной частотности главного ключа в группе;
-
Настройка минимальной суммарной частотности в группе;
-
Широкие настройки отчета;
-
Загрузка результата в файле CSV.
Цена: от 5300 рублей за тариф на месяц.
Топвизор
Возможности:
-
Кластеризация в рамках проекта для сайта;
-
Яндекс и Google;
-
Выбор регионов;
-
Глубина проверки до ТОП-10;
-
Способ и порог группировки;
-
Указание частотности и предполагаемой цены клика;
-
Загрузка результата в файле CSV.
Цена: от 0,21 до 0,3 рублей в зависимости от тарифа, платные тарифы от 990 рублей в месяц.
Кластеризация вручную
Простую кластеризацию для маленького семантического ядра можно сделать вручную с помощью Excel или Google Таблиц. Вот пошаговый процесс:
1. Сбор поисковых запросов
Сначала нужно собрать все поисковые запросы, которые вы хотите кластеризовать. Это могут быть запросы, которые вы получили из Google Search Console или Вебмастера, список поисковых подсказок или даже вручную собранные запросы.
Узнать, по каким запросам продвигается сайт, можно в сервисе PR-CY. Выберите отчет «Анализ сайта» и в нем раздел «Поисковые запросы». Сервис покажет список запросов, позицию и адрес релевантной страницы.
Это запросы, которые уже у вас есть. Чтобы расширить семантику, можно таким же образом проверить конкурентов и выбрать ключи, которых у вас нет.
2. Проверка частотности
Загрузите список запросов в бесплатный инструмент проверки частотности по Яндексу.
В результате вы получите список запросов и частотность для каждого. Можно выбрать регион и точность проверки — общая, в кавычках, точная.
3. Создание таблицы
Загрузите результат проверки. У вас будет два столбца — со списком слов и частотностью. Дальше можно использовать полученную таблицу или перенести данные в Google Sheets, чтобы поделиться с коллегами.
3. Анализ запросов
Проанализируйте каждый запрос и определите общие темы или категории. В примере запросы относятся к теме международных грузоперевозок. Их можно поделить на страны, «доставка из…», «доставка в…», тип перевозки — по земле, по морю, по железной дороге.
4. Создание кластеров
Добавьте столбец с названием кластера и еще два — для слов, которые будут входить в кластеры, и для частотности, чтобы потом сосчитать суммарную по группе. Это можно сделать формулой.
Этот процесс требует внимательного анализа и может потратить много вашего времени, особенно для больших наборов данных, но ручная проверка семантики даст понимание, что именно и как ищут ваши пользователи.
Что делать потом
После завершения нужно убедиться, что кластеризация сделана верно. Вот, что стоит проверить после и ручной, и автоматической кластеризации:
Релевантность кластеров
Убедитесь, что запросы внутри каждого кластера действительно связаны между собой по смыслу. Иногда кластеры могут содержать лишние или несвязанные запросы.
Полнота кластеров
Удостоверьтесь, что все связанные запросы действительно включены в кластер. Запросы можно ошибочно отнести к другим кластерам или «потерять».
Корректность критериев кластеризации
Проверьте, что выбранные критерии для кластеризации соответствуют вашим целям — по способу и порогу.
Проверка дубликатов
Найдите и удалите дубликаты и кластеров, и слов внутри них.
Обновление и мониторинг
Не забывайте, что запросы могут меняться со временем. Регулярно обновляйте кластеры и следите за изменениями в выдаче.
Анализ результатов
Оцените, как кластеризация запросов повлияла на производительность вашего сайта или других метрик, которые вам важны.