Построение рейтинга видимости
12 May 2013
Автор: Nikolay Khivrin

Построение рейтинга видимости

Довольно важной задачей для любого маркетолога является оценка того, на сколько эффективно задействован тот или иной канал продвижения? Какая часть Ваших потенциальных клиентов узнает о Вашей компании или продукте? В рамках поискового продвижения эти показатели можно оценить с достаточно высокой точностью, выбрав соответствующую модель. Далее я хочу поделиться той моделью, которую мы сейчас реализуем для нового рейтинга MegaIndex.

Ранее я писал о том, как мы делаем рубрикацию поисковых запросов. В результате неё мы получаем множество тематик, которые представлены в виде дерева. Данная модель позволяет рассматривать как широкие тематики (пример "Товары и услуги"), так и вполне конкретные (пример "такелажные работы")

Теперь рассмотрим математическую модель для построения рейтинга видимости сайтов внутри каждой тематики. Для начала нужно определить, что такое "видимость сайта".
Видимость сайта — это вероятность того, что пользователь увидит ссылку на сайт в результатах поиска по конкретному запросу или группе запросов. Если мы говорим о группе запросов, соответствующих тематике, то это вероятность того, что по случайному запросу в тематике сайт будет замечен случайным пользователем.

Видимость сайта по запросу

Если мы рассматриваем один запрос, то определить видимость по нему довольно просто. Безусловно она зависит от формата отображения выдачи в поисковых системах и типа устройства, на котором пользователь просматривают саму поисковою выдачу. Однако эти параметры можно усреднить, получив незначительную погрешность результатов.

В рамках модели примем следующие значения:
Позиции 1-3: 100%
Позиции 4-5: 70%
Позиции 6-10: 50%
Позиции 11-20: 10%
и т.д.

Фактически мы задаем функцию, которая определяет значение видимости в зависимости от позиции сайта по запросу Vid(word[pos])

Если у нас имеется несколько поисковых систем, то видимость по одному запросу можно представить как:
Vid(word) = Vid(word[pos][1]) * (rate[1]) + Vid(word[pos][2]) * (rate[2]) +… + Vid(word[pos][N]) * (rate[N])
word[pos][i] — позиция сайта по запросу в поисковой системе i
rate[i] — популярность поисковой системы i от 0 до 1.

Например, если взять две поисковые системы Яндекс и Google с соответствующими долями 67% и 33%, то формула будет иметь следующий вид:
Vid(word) = Vid(word[pos][yandex]) * 0.67 + Vid(word[pos][google]) * 0.33

Например, мы анализируем сайт и запросу "пластиковые окна", который занимает 3 место в Яндекс и 10 место в Google:
Vid(word) = Vid(3) * 0.67 + Vid(10) * 0.33 = 100% * 0.67 + 50% * 0.33 = 83.5%

Видимость сайта по группе запросов

Теперь поставим задачу анализа видимости сайта по группе запросов, которые образуют тематику. Каждый запрос имеет определенную статистику, выраженную в среднем количестве запросов в месяц по соответствующей фразе. Необходимо посчитать взвешенную видимость по группе запросов в соответствие с популярностью каждого запроса.
Vid(group) = (Vid(word1) * wordstat(word1) + Vid(word2) * wordstat(word2) +… + Vid(wordN) * wordstat(wordN)) / (wordstat(word1) + wordstat(word2) +… + wordstat(wordN))
Рассмотрим простой пример тематики, состоящий из двух запросов:
— пластиковые окна (63035 запросов в месяц, видимость сайта 83.5%)
— пластиковые окна цены (16199 запросов в месяц, видимость сайта 50%)
Vid(group) = (83.5% * 63035 + 50% * 16199) / (63035 + 16199) = 76.65%

Понятно, что любая тематика состоит не из двух запросов, а из значительно большего количества. В базе MegaIndex есть тематики в которых даже более 100 000 запросов.
Также понятно, что нельзя собрать все запросы тематики для анализа.
Однако опыты показывают, что если тематика состоит из большого числа запросов, то видимость по двум различным подгруппам запросов из одной тематики совпадает с высокой точностью.
Например, если в тематике 1000 запросов, то видимости сайта по случайным 500 запросам и другим 500 запросам практически совпадают. Таким образом можно утверждать, что для определения видимости сайт достаточно выбрать несколько запросов из тематики. Как правило достаточно 100-200 запросов для получения погрешности в 2-3% от полученного значения по сравнению с расширением тематики до 1000 и 10000 запросов.

Для того, чтобы посчитать видимость сайта в категории верхнего уровня (в такой категории вложено несколько тематик), нужно взять все запросы из вложенных тематик этой категории.

Пример построения рейтинга в тематике "Грузовые автоперевозки":
Рейтинг сайтов грузовые автоперевозки

Обсуждение

Для добавления комментария, пожалуйста, авторизуйтесь