12 May 2013
7,002 0

Построение рейтинга видимости

Довольно важной задачей для любого маркетолога является оценка того, на сколько эффективно задействован тот или иной канал продвижения? Какая часть Ваших потенциальных клиентов узнает о Вашей компании или продукте? В рамках поискового продвижения эти показатели можно оценить с достаточно высокой точностью, выбрав соответствующую модель. Далее я хочу поделиться той моделью, которую мы сейчас реализуем для нового рейтинга MegaIndex.

Ранее я писал о том, как мы делаем рубрикацию поисковых запросов. В результате неё мы получаем множество тематик, которые представлены в виде дерева. Данная модель позволяет рассматривать как широкие тематики (пример "Товары и услуги"), так и вполне конкретные (пример "такелажные работы")

Теперь рассмотрим математическую модель для построения рейтинга видимости сайтов внутри каждой тематики. Для начала нужно определить, что такое "видимость сайта".
Видимость сайта — это вероятность того, что пользователь увидит ссылку на сайт в результатах поиска по конкретному запросу или группе запросов. Если мы говорим о группе запросов, соответствующих тематике, то это вероятность того, что по случайному запросу в тематике сайт будет замечен случайным пользователем.

Видимость сайта по запросу

Если мы рассматриваем один запрос, то определить видимость по нему довольно просто. Безусловно она зависит от формата отображения выдачи в поисковых системах и типа устройства, на котором пользователь просматривают саму поисковою выдачу. Однако эти параметры можно усреднить, получив незначительную погрешность результатов.

В рамках модели примем следующие значения:
Позиции 1-3: 100%
Позиции 4-5: 70%
Позиции 6-10: 50%
Позиции 11-20: 10%
и т.д.

Фактически мы задаем функцию, которая определяет значение видимости в зависимости от позиции сайта по запросу Vid(word[pos])

Если у нас имеется несколько поисковых систем, то видимость по одному запросу можно представить как:
Vid(word) = Vid(word[pos][1]) * (rate[1]) + Vid(word[pos][2]) * (rate[2]) +… + Vid(word[pos][N]) * (rate[N])
word[pos][i] — позиция сайта по запросу в поисковой системе i
rate[i] — популярность поисковой системы i от 0 до 1.

Например, если взять две поисковые системы Яндекс и Google с соответствующими долями 67% и 33%, то формула будет иметь следующий вид:
Vid(word) = Vid(word[pos][yandex]) * 0.67 + Vid(word[pos][google]) * 0.33

Например, мы анализируем сайт и запросу "пластиковые окна", который занимает 3 место в Яндекс и 10 место в Google:
Vid(word) = Vid(3) * 0.67 + Vid(10) * 0.33 = 100% * 0.67 + 50% * 0.33 = 83.5%

Видимость сайта по группе запросов

Теперь поставим задачу анализа видимости сайта по группе запросов, которые образуют тематику. Каждый запрос имеет определенную статистику, выраженную в среднем количестве запросов в месяц по соответствующей фразе. Необходимо посчитать взвешенную видимость по группе запросов в соответствие с популярностью каждого запроса.
Vid(group) = (Vid(word1) * wordstat(word1) + Vid(word2) * wordstat(word2) +… + Vid(wordN) * wordstat(wordN)) / (wordstat(word1) + wordstat(word2) +… + wordstat(wordN))
Рассмотрим простой пример тематики, состоящий из двух запросов:
— пластиковые окна (63035 запросов в месяц, видимость сайта 83.5%)
— пластиковые окна цены (16199 запросов в месяц, видимость сайта 50%)
Vid(group) = (83.5% * 63035 + 50% * 16199) / (63035 + 16199) = 76.65%

Понятно, что любая тематика состоит не из двух запросов, а из значительно большего количества. В базе MegaIndex есть тематики в которых даже более 100 000 запросов.
Также понятно, что нельзя собрать все запросы тематики для анализа.
Однако опыты показывают, что если тематика состоит из большого числа запросов, то видимость по двум различным подгруппам запросов из одной тематики совпадает с высокой точностью.
Например, если в тематике 1000 запросов, то видимости сайта по случайным 500 запросам и другим 500 запросам практически совпадают. Таким образом можно утверждать, что для определения видимости сайт достаточно выбрать несколько запросов из тематики. Как правило достаточно 100-200 запросов для получения погрешности в 2-3% от полученного значения по сравнению с расширением тематики до 1000 и 10000 запросов.

Для того, чтобы посчитать видимость сайта в категории верхнего уровня (в такой категории вложено несколько тематик), нужно взять все запросы из вложенных тематик этой категории.

Пример построения рейтинга в тематике "Грузовые автоперевозки":
Рейтинг сайтов грузовые автоперевозки
27 апреля 2013
2,896 0

Новый формат прямых эфиров на MegaIndex.tv

Запуск профессиональной социальной сети MegaIndex.org позволит нам проводить прямые эфиры на MegaIndex.tv на новом уровне интерактивности.

Если в рамках текущего формата люди могут общаться исключительно в рамках чата, который доступен под плеером прямого эфира, то новая социальная сеть дает значительно большие возможности.

Во-первых, можно будет видеть комментарии к трансляции, которые поступают от конкретных пользователей социальной сети. Можно будет непосредственно познакомиться со зрителями онлайн и завести правильные контакты.

Во-вторых, слушатели получат возможность общения и обсуждения передач между собой. Таким образом, не нужно больше засорять чат сообщениями, которые адресованы конкретным людям.

В-третьих, наши докладчики будут вести аккаунт в MegaIndex.org, что позволит адресовывать им вопросы как перед прямым эфиром, так и после него.

В будущем будут доступны видео-звонки в прямой эфир через функционал социальной сети, что позволит данным мероприятиям становиться эффективней и удобнее для наших слушателей, даже по сравнению с оффлайновыми конференциями и семинарами.
27 апреля 2013
2,982 0

Новая передача на MegaIndex.tv "Дежурный по рынку"

В пятницу в прямом эфире провели с Василием Ткачевым и Наилем Байковым передачу "Дежурный по рынку". Запись передачи уже доступна в архиве на MegaIndex.tv

В рамках нового формата мы планируем вместе с известными экспертами на рынке обсуждать актуальные проблемы, которые появляются на рынке. Передача будет выходить по пятницам, что говорит о её свободном и непринужденном формате.
27 апреля 2013
3,163 0

День электронное торговли на MegaIndex.tv

24 апреля на MegaIndex.tv в прямом эфире прошли три передачи об электронной торговле.

Тимофей Шиколенков рассказал об особенностях региональной доставки

Андрей Кистенев рассказал об особенностях работы с Почтой России

И Тимур Шаков раскрыл тему работы с поставщиками
27 апреля 2013
1,286 0

День электронное торговли на MegaIndex.tv

24 апреля на MegaIndex.tv в прямом эфире прошли три передачи об электронной торговле.

Тимофей Шиколенков рассказал об особенностях региональной доставки:

/>/>/>

/>/>/>
19 апреля 2013
4,966 0

Видимость в контекстной рекламе

MegaIndex с 2008 года сканирует позиции сайтов в результатах поиска почти по всем запросам, которые стабильно набираются в поисковых системах несколько раз за месяц.
Инструмент анализа видимости сайтов сейчас является одним из самым популярных продуктов MegaIndex. Каждый день делается более 10 000 анализов через наш интерфейс и более 150 000 анализов через наше API.

Месяц назад я решил, что неплохо бы расширить функционал и собирать не только позиции сайтов, но и результаты по контекстной рекламе. Тем более, что результатов по контекстной рекламе не нужно сохранять 100 штук, что делаем данную задачу не такой требовательной к вычислениям.

В итоге, сегодня мы имеем возможность расширить функционал анализа видимости и показывать не только позиции сайтов в выдаче, но и их место в контекстной рекламе.

Пример отчета с видимостью по контекстной рекламе:



Таким образом MegaIndex становится первым инструментом, который позволит анализировать контекстные рекламные кампании и их динамику во времени. Полнофункциональный запуск аналитического сервиса планируется на следующей недели.
19 апреля 2013
5,846 0

Рубрикация поисковых запросов

В базе запросов MegaIndex на сегодня 23 000 000 фраз. В это количество входят все фразы из подсказок Яндекс и Google, все запросы с wordstat больше 0 и запросы наших пользователей.

1. Если рассматривать это как простой список запросов, то эти данные фактически бесполезны.
Использовать этот массив можно в том случае, если сделать его полную рубрикацию. Под полной рубрикацией я понимаю разделение запросов на категории, в рамках которых конкурируют отдельные продукты или услуги.
Например нам не нужна в базе категория «Банки», а нужны «Ипотечный кредит», «Автокредит», «Потребительский кредит» и т.д…

2. Кроме этого, нужно сделать так, чтобы категории были выстроены в виде иерархической структуры. Что это значит? А то, что на каждом уровне пользователь увидит не более 15 вариантов, при этом он однозначным образом сможет добраться до интересующей его категории. Например, Бизнес -> Финансы -> Forex

Например, в Яндекс Каталоге уже есть достаточно неплохая рубрикация, но есть две проблемы:
— она недостаточно разделена. Следовательно, внутри одной категории могут быть совсем неконкурирующие товары или услуги
— их категоризация не удовлетворяет первому пункту

Создать алгоритм, который мог бы составить такое дерево, по моему убеждению невозможно. Однако можно сделать подготовительные вычисления, которые помогут людям легко найти все возможные категории.

Что можно сделать?
1. Выявить популярные слова в запросах
2. Выявить кластеры запросов автоматически

С первым пунктом все понятно. Подключаем морфологический анализатор и делаем прогон всей базы запросов, а потом делаем группировку по фразам.
А вот вторая задача значительно сложнее. Её решение лежит в плоскости того, что по запросам одной тематики (кластера), поисковыми системами ранжируются одни и те же сайты. Остается собрать позиции, что мы и так делаем регулярно, и сделать анализ базы на поиск кластеров.
Сам алгоритм поиска кластеров не такой простой, как кажется. Есть тематики, где ограниченное количество сайтов ранжируется почти по всем запросам этой категории. А есть тематики, где распределение запросов по сайтам-конкурентам достаточно размазанное. Это как правило большие тематики (с большим количеством запросов). Например, у интернет-магазина плитки может различаться ассортимент по коллекциям и фабрикам. Для этого приходится придумывать алгоритмы автоматического обучения для подбора параметров кластеризации.

На выходе получают почти готовые тематики.

Кроме того, есть и базовый метод поиска запросов по маске. Например, все запросы, которые включаются слова «окна» и «пластиковый» в различных морфологических формах.

По факту, реализация этих методов позволяет разобрать базу запросов на 5000-10000 тематик за вполне разумное время.

Скоро обновление базы по категоризации запросов появится в MegaIndex.

После прочтения материала может возникнуть вопрос, зачем столько усилий для решения обычной прикладной задачи?
Все дело в том, что такая категоризация позволит решить целый пласт аналитических и необходимых для продвижения задач:
— точное определение тематик сайтов (необходимо для использования в закупке ссылок)
— анализ динамики продвижения сайтов в каждой категории
— быстрый поиск основных конкурентов
— эффективных подбор семантического ядра
и т.д.

Безусловно стоит ждать и появление новых сервисов, которые будут использовать эти данные.
18 апреля 2013
2,374 0

SEO на РИФ+КИБ 2013

SEO не является основным направлением РИФ, но пара секций обычно есть каждый год.

Утро 18 апреля началось с секции по поиску, на которой представителя Яндекса, Google и Mail.ru как всегда не сказали ничего интересного. Основным вопросом была степень необходимого цензурирования результатов поиска.

Секция, которую организовывал Тимофей Квачев, была откровенно слабой. Главный вопрос из зала, а зачем эти доклады:
http://2013.russianinternetforum.ru/p/details.php?ID=1175

Следующая секция со Станиславом Ставским, Михаилом Сливинским, Сергеем Людкевичем, Евгением Трофименко и Константином Скобеевым более интересна.
Пока смотрю доклады: http://2013.russianinternetforum.ru/p/details.php?ID=1164


Доклад Станислава Ставского о западном SEO достаточно живой. По его мнению, черное SEO там хорошо работает, однако об этом не говорят.

Основной тезис Михаила Сливинского, что интернет-магазину нужно прежде всего работать над ассортиментом и удобством навигации. Безусловно он прав, так как в его Wikimart остальное почти все уже сделано. Однако эти рекомендации пока не совсем главное для среднего рядового сайта.



Михаил Сливинский:
1. Половина сниппетов содержат все слова из запроса
2. Опытные пользователи не читают сниппеты, а новички прочитывают
3. Улучшение сниппета ведет к повышению конверсии в продажи
4. В Wikimart постоянные AB тесты по ранжированию товаров
5. 30% отказов являются положительными
6. По поведению пользователя можно предсказать его интент
7. Лучший контент для e-commerce — изображения
8. Начинайте заниматься рекомендательными системами



Константин Скобеев:
1. Сеошник не должен заниматься юзабилити, я за разделение труда
2. Булое SEO = юзабилити + PR + контент маркетинг
Но так работать долго, дорого и "беспощадно" для бизнеса.
3. Если сайт оштрафован, юзабилити не выведет из под санкций



Исследование Евгения Трофименко:


Результаты, полученные в исследовании, лично у меня вызывают большие сомнения. Суть его состояла в том, чтобы определить какими параметрами обладают хорошие доноры. Но в ходе исследования Евгений сказал, что только 20% доноров пересекаются и сайтов с хорошими показателями продвижения. Следовательно эффект очень сильно зависит от пары донор-акцептор.

Организаторами секции выступала компания Ашманов и партнеры, которая в этом году не выставляла своего докладчика. Уважаю такой поступок!
3 апреля 2013
3,353 0

Первый опыт работы с индусами

Чтобы выйти на западные рынки нам потребовались люди, которые хорошо знают английский. И при этом мы хотели сделать первый опыт с небольшими вложениями. Ответ очевиден, искать персонал в Индии, Пакистане или Бангладеше. Рабочая сила там даже дешевле, чем в отдаленных деревнях СНГ.

Местные фрилансеры относятся к своей работы достаточно добросовестно и иногда даже проявляют креатив. Но есть одна проблема — английский для них все равно не родной язык.

В результате можно сделать проект, который потом будет значительно проще откорректировать специалистами, английский для который является нативным.

Пока мы на пути к завершению реализации сервиса аудита http://audit.megaindex.com/, локализация которого потребовала определенных корректировок ядра системы. Но уже сегодня российский сервис аудита сайтов работает на единой платформе и базе, что позволяет легко развивать сервис.
3 апреля 2013
3,362 0

Перезагрузка MegaIndex.tv

Сегодня наконец заново запустили MegaIndex.tv. Было два эфира в Константином Шурыгиным и Виктором Нагайцевым. К прямой трансляции подключалось более 1000 человек. Старт удался, а завтра уже новые передачи.
3 апреля 2013
3,373 3

Кейс использования Amazon Web Services

Сегодня первый раз транслировали видео-поток через Amazon AWS. Впечатления остались хорошие, а стоимость услуги почти смешная. При этом не нужно держать физических серверов, искать мощные каналы и решать прочие ненужные проблемы.

Стоимость аренды сервера: