Автоматический подбор семантики и кластеризация
18 декабря 2015
Автор: Nikolay Khivrin

Автоматический подбор семантики и кластеризация

В MegaIndex.com мы начали тестирование нового приложения, которое позволяет все за несколько секунд подобрать семантику для сайта и выполнить её кластеризацию.

https://ru.megaindex.com/a/keywords

Приложение работает в несколько этапов:

Этап 1. Поиск основных конкурентов

На этом этапе мы анализируем видимость Вашего сайта по запросам в поисковых системах Яндекс и Google, и выбираем список основных конкурентов, которые максимально плотно пересекаются с Вашим сайтом в результатах поиска.

К недостатком такого подхода поиска конкурентов можно отнести следующие:
1. Крупные информационные порталы часто ранжируются по Вашим запросам. (Мы решили эту проблему, внеся в алгоритм понижающий коэффициент для сайтов конкурентов, которые имеют в доле пересечения совсем небольшой относительный объем запросов. Таким образом, можно исключить сайта типа ru.wikipedia.org или avito.ru)

2. Если Ваш сайт ещё не ранжируется в поисковых системах, то список конкурентов можно задать самостоятельно или определить его по одному из Ваших основных конкурентов.



Этап 2. Сбор семантики по конкурентам

Когда список основных конкурентов составлен (обычно мы рекомендуем добавить порядка 10 сайтов), можно переходить к сбору семантики. Вам нужно выбрать порог для запросов, по которым будет ранжироваться минимальное число конкурентов (допустим 5 из 10 конкурентов по каждому запросу).

На выходе будет сформирована таблица запросов, которые будут упорядочены по совокупному числу видимых показов всех указанных конкурентов. Таким образом, если по запросу ранжируется 10 конкурентов на первых местах, он получит больший приоритет, чем запрос с 5 конкурентами со слабым ранжированием.



Этап 3. Кластеризация

Это самый сложный этап, который мы научились делать практически в реальном времени (время кластеризации всего несколько секунд). Весь секрет быстрого выполнения алгоритма в том, что у нас уже заранее собраны данные по ранжированию сайтов по запросам в поисковых системах. Наш алгоритм проанализирует адреса релевантных страниц в результатах поиска и составит кластеры по заданному критерию.

Уровень совпадения релевантных страниц при кластеризации можно изменять. Базовое значение составляет 4 из 10 результатов поиска. Кластеризацию можно проводить по результатам поиска Яндекс и Google.



Пока система находится в beta-тестировании.

В данный момент наша команда работает над:
— очисткой списка запросов от мусора
— возможностью добавления собственных запросов для кластеризации
— расширением ограничения по количеству запросов, которые можно кластеризовывать в реальном времени (сейчас только 1000 запросов)

В ближайшее время в MegaIndex.com появится полный инструментария для запуска кампании по продвижению составленных кластеров при помощи ссылок, социальных сетей и других технологий.

А пока Вы просто можете составить семантику и кластеризовать её https://ru.megaindex.com/a/keywords

Обсуждение

Для добавления комментария, пожалуйста, авторизуйтесь