Как делать кластеризацию и группировку запросов?
Ссылка на инструмент: https://arsenkin.ru/tools/clustering/.
API: https://help.arsenkin.ru/api/clustering-dev
Кластеризация и группировка запросов – это разбиение списка поисковых запросов на тематические группы. Каждая группа запросов должна соответствовать одной странице сайта, на которой будут продвигаться эти ключевые фразы. Она необходима, чтобы:
- Сформировать понятную и логичную структуру;
- Понять, какие запросы необходимо продвигать вместе и на одну страницу, а какие отдельно;
- Привязать запросы к уже существующим страницам на сайте и сделать продвижение эффективным.
- Упростить распределение ключевых фраз по страницам сайта и в итоге получить качественный SEO-трафик из поисковых систем.
Группировка производится на основе поисковой выдачи (ТОП-10, ТОП-20, ТОП-30 – на ваш выбор). За счет этого, при группировке мы учитываем все синонимы и переформулировки. Если выдача по поисковому запросу будет низкого качества, то и кластеры могут быть сформированы некачественно. Требуется учитывать данный факт при использовании инструмента.
Функционал инструмента «Кластеризация запросов»
1) Список ключевых слов (на вход можно указать от 2 до 70 000 ключевых фраз). Этого достаточно для большинства пользователей. Многие сервисы не в состоянии даже обработать запросы в 30 000 запросов, а у нас всё получается.
2) Выбор поисковой системы — необходимо выбрать из выпадающего списка поисковую систему. На выбор Яндекс и Google.
3) Регион в Яндексе и Google — выберите необходимый город после выбора поисковой системы. Город влияет на состав выдачи.
4) Методы группировки — в инструменте предоставлено два вида группировки:
SOFT - используется за основу самый частотный ключ, а к нему подбираются все остальные, сравнивая по количеству общих URL. Например, основная фраза [купить чемодан], к ней добавляется [купить чемодан в москве], [купить чемодан на колесах] и т.п. Если количество совпадений соответствует выбранной степени группировки, запросы объединяются в группу. В полученной группе все запросы будут связаны с популярным запросом, но могут быть не связаны между собой.
HARD - выбирается самый популярный запрос и сравнивает с ним остальные запросы по количеству общих URL в ТОПе, дополнительно сравнивая все запросы между собой и все URL в полученных парах.
На основе конкурента - этот метод позволяет сгруппировать семантику на основе релевантных страниц конкурента.
5) Степень группировки — это количество одинаковых страниц в поисковой выдаче, по которым будет осуществляться группировка. Например, если выбрана степень группировки 3, будет производиться поиск совпадений по трем страницам в выдаче и собираться запросы в одну группу (при условии совпадения критериев).
6) Глубина проверки — выбирается глубина выдачи для анализа. На выбор можно проверить ТОП-10, ТОП-20, ТОП-30. По-умолчанию установлено значение – ТОП-10.
7) Дополнительные параметры для проверки и сбора данных. На выбор можно:
- Собрать точную частоту для ключевой фразы (общая частота собирается по умолчанию для выбранного региона). +1 лимит за каждый запрос.
- Исключить список доменов из кластеризации. Помогает удалить крупные сайты из учета группировки запросов.
- Исключить главные страницы при кластеризации (вместо них будут браться запросы за топ-10).
- Бесплатно собрать позиции и релевантные страницы в поисковой системе Google (при нахождении в топ-100) для вашего сайта. К сожалению, для Яндекса эту опцию мы убрали.
8) Рядом с кнопкой «Начать кластеризацию» вы можете увидеть текущее количество лимитов на выполнение задачи:
Например, для кластеризации 2 запросов требуется 4 лимита в сервисе. За использование дополнительных параметров так же будут списываться лимиты. Актуальные цены рекомендуем посмотреть на странице тарифов в сравнительной таблице: https://arsenkin.ru/tools/tariffs/all/#comparisontarrifs.
9) История проверок — вся история проверок будет храниться в блоке «История проверок». История хранится 30 дней.
10) После окончания сбора данных, вам будет предоставлена возможность скачать результаты в CSV файле.
С примером выходного файла можете ознакомиться по ссылке - https://arsenkin.ru/skin/file/example-clustering.csv.
Вопросы и ответы
Почему в группе «Некластеризовано» остаётся много запросов?
Инструмент автоматически группирует ключевые фразы в соответствии с их схожестью в поисковой выдаче по запросам. Вместо того чтобы сравнивать сами ключевые слова, алгоритмы анализируют URL-адреса страниц сайтов, которые появляются в результатах ТОП. Если в группе остается большое количество нераспределенных ключевых фраз, это может означать, что текущие настройки не позволяют эффективно объединять фразы в кластеры.
Рекомендация: экспериментируйте с различными параметрами кластеризации. Например, начните с установки степени группировки - 3 или 4, а затем, основываясь на качестве полученных результатов, изменяйте показатель степени группировки в меньшую или большую сторону.
Почему в методе группировки «SOFT» не могу снять галочку с «Собрать частоту: ключевая фраза»?
При применении метода SOFT сначала происходит сравнение выдачи B с выдачей A, где за основу всегда берется запрос с наибольшей частотой. И для определения этой частотной фразы нам нужно снимать частотность в Яндекс Вордстат. При методе SOFT все запросы в группе будут связаны с самым частотным запросом, но остальные запросы между собой могут оставаться несвязанными.
Какая частотность снимается для Google?
Для поисковой выдачи Google мы собираем частотность Яндекс Вордстат (регион: весь мир). На текущий момент нет возможности собирать частотность через Google ADS.
Какая стратегия лучше: SOFT или HARD?
SOFT хорошо подходит для больших семантических ядер, когда важно собрать более широкие группы и не потерять слабые связи между запросами. HARD используют для нишевых проектов или при высокой конкуренции — он формирует более «жёсткие» кластеры, где запросы действительно тесно связаны.
Как работать с «мусорными» запросами?
Если запросы нерелевантны или слишком редки, их можно исключить на этапе подготовки семантики. Иногда такие ключи стоит хранить отдельно — они могут пригодиться для статейного контента или FAQ-разделов сайта.
Можно ли использовать результаты для контекстной рекламы?
Да, результаты кластеризации можно применять и для контекста. Кластеры удобно использовать как основу для рекламных групп: каждый кластер = группа объявлений с релевантным текстом и посадочной страницей.
Как оценить качество кластеризации?
Основной критерий — релевантность: все ли запросы внутри кластера логично вести на одну страницу. Если внутри группы встречаются запросы, которые подразумевают разные интенты (например, «купить» и «что это такое»), значит, настройки стоит пересмотреть.
Можно ли автоматически разбивать кластеры по типу страниц (карточки, категории, статьи)?
Инструмент формирует только тематические кластеры. Но по логике ключей можно самостоятельно определить, для чего они больше подходят: «купить» — карточки, «цена» или «категория» — разделы, информационные запросы — статьи.
Что делать, если выдача сильно меняется со временем?
Поисковые результаты действительно меняются. Для стабильных ниш можно обновлять кластеры раз в полгода-год. В динамичных тематиках (новости, тренды, e-commerce) обновление имеет смысл делать чаще — например, раз в квартал.
Какие типичные ошибки совершают новички при кластеризации?
- Выбирают слишком высокую степень группировки → кластеры не формируются.
- Берут минимальную глубину → часть связей теряется.
- Не проверяют вручную результаты → в одном кластере могут оказаться разные интенты.
- Используют только один метод, не пробуя альтернативы.