Что происходит в поисковой системе при использовании конструкции [ключевая фраза] vs? Как работает алгоритм?
Как извлечь пользу для раскрутки сайта?
Разберемся с вопросом далее.
VS ключевые фразы
В чем особенность ключевых фраз с vs? Интентом является сравнение. Пользователь вводит ключевую фразу и vs, после чего ожидает в подсказках поисковой системы список из различных предложений чего-то схожего.

Крайне удобная опция. Причины по которым прием с использованием фразы сравнения vs стал широко востребованным в следующем:
- Быстрое изучение нового. Если появляется для изучения новый объект, то vs помогает разобраться в том, что это такое. Как? К примеру, попались на глаза сервисы с такими абстрактными названиями как hadoop или hive, spark. В списке подсказок, появляющемся после vs, можно увидеть аналогичные более известные продукты;
- Простота в использовании;
- Точность результатов в поисковых подсказках.
Прием эффективен при поиске альтернатив. Аналогичной ключевой фразы нет. Если ввести versus или or, то результаты будут менее связанными.
Рассмотрим пример с or. Ключевая фраза:
bert or
Сравним с vs. Ключевая фраза:
bert vs
Результат следующий:

В случае с использованием vs поисковая система обрабатывает интент и выдает список алгоритмов, которые похожи на Google BERT.
Рекомендованный материал в блоге MegaIndex на тему BERT по ссылке далее — Разрушаем главные мифы про новый алгоритм Google BERT.
А что будет, если:
- Выгрузить список всех вариантов, которые выводятся после vs, исключая мусор;
- Прописать к каждому найденному варианту vs, чтобы найти еще больше схожих вариантов;
- Составить карту связей между всеми вариантами.
В результате применение такой методологию у оптимизатора появляется вариант собрать семантическую структуру.
Получаем результат:

Практическое применение широкое:
- Создание структуры сайта;
- Создание рекомендательной системы;
- Расширение полноты ответа сайта.
Все применения ведут к улучшению ранжирования страниц в поисковой выдаче. Так например система релевантных рекомендаций позволяет повысить фактор Dwell Time и так далее.

Польза очевидна, поэтому давайте разберемся как строить такие графы.
Автоматизация сбора vs-данных из поисковых подсказок
В Google есть специальная ссылка для выгрузки данных по подсказкам.
Выглядит так:
http://suggestqueries.google.com/complete/search?&output=toolbar&gl=us&hl=en&q=[ключевая фраза]
Выгрузка бесплатная.
Разберемся с параметрами:
- output=toolbar указывает на то, что данные будут предоставлены в формате XML;
- gl=us задает код страны;
- hl=ru задает язык.
В параметре q указывается ключевая фраза.
Пример:
http://suggestqueries.google.com/complete/search?&output=toolbar&gl=us&hl=en&q=tensorflow%20vs%20
Результат:

При выгрузке данных следует использовать очистку данных. Лучше чистить получаемые данные сразу на этапе сканирования. Почему? Просто чтобы потом не заниматься очисткой большого массива данных.
Исходя из практики сформирован следующий список правил. После vs следует удалять результаты, текст которых:
- Содержит исходную ключевую фразу. Например, ищете tensor и после vs размещается tensor;
- Содержит несколько вариантов vs.
В результате получается собрать семантические связи между множеством запросами.
Формирования графа
После парсинга запросов и взвешивания связей получится построить сетевой граф.
Пример графа:

На изображении размещено большинство базовых технологий, о которых надо знать тем, кто занимается искусственным интеллектом.
В результате получается логическая группировка множества технологий.
Как делать визуализацию? Через сервисы. К примеру, для создания приведенного выше графа достаточно использовать бесплатный таблицы Google и бесплатную версию flourish.studio.
Как автоматизировать создание графов? К примеру, использовать пакет Python networkx. В пакете есть специальная функция для построения графов. Название функции — ego_graph.
Для удобства приведу готовый шаблон кода для построения графа. Код:
import networkx as nx # SAMPLE DATA FORMAT #nodes = [('tensorflow', {'count': 13}), # ('pytorch', {'count': 6}), # ('keras', {'count': 6}), # ('scikit', {'count': 2}), # ('opencv', {'count': 5}), # ('spark', {'count': 13}), ...] #edges = [('pytorch', 'tensorflow', {'weight': 10, 'distance': 1}), # ('keras', 'tensorflow', {'weight': 9, 'distance': 2}), # ('scikit', 'tensorflow', {'weight': 8, 'distance': 3}), # ('opencv', 'tensorflow', {'weight': 7, 'distance': 4}), # ('spark', 'tensorflow', {'weight': 1, 'distance': 10}), ...] #BUILD THE INITIAL FULL GRAPH G=nx.Graph() G.add_nodes_from(nodes) G.add_edges_from(edges) #BUILD THE EGO GRAPH FOR TENSORFLOW EG = nx.ego_graph(G, 'tensorflow', distance = 'distance', radius = 22) #FIND THE 2-CONNECTED SUBGRAPHS subgraphs = nx.algorithms.connectivity.edge_kcomponents.k_edge_subgraphs(EG, k = 3) #GET THE SUBGRAPH THAT CONTAINS TENSORFLOW for s in subgraphs: if 'tensorflow' in s: break pruned_EG = EG.subgraph(s) ego_nodes = pruned_EG.nodes() ego_edges = pruned_EG.edges()
Как быть, если ключевая фраза относится к двум нишам? Задачу решает функция k_edge_subgraphs.
Функция k_edge_subgraphs находит группы вершин, которые невозможно разделить, выполнив k или меньшее число действий. Из практики, оптимальными пороговыми значениями являются k=2 и k=3.
В результате граф будет очищен от примесей.
Сервисы
Есть готовый сервис для создания графа на базе подсказок из поисковой системы, но без учета тематики найденных фраз.
Ссылка — VS keywords.
Сервис бесплатный.
Еще есть специальные сервисы по оптимизации поисковых подсказок. Оптимизатор можете изменять предлагаемые поисковой системой подсказки.
Принцип действия заключается в следующем:
- Заказчик добавляет в сервис требуемые ключевые фразы, которые требуется вывести в подсказки поисковой системы;
- На основе статистики Google Keyword Planner или Yandex.Wordstat заказчик задает количество запросов, которое требуется для вывода подсказки в поисковой строке;
- Задания распределяются по исполнителям;
- Популярность продвигаемых поисковых запросов растет;
- В поисковых подсказках начинают выводиться требуемые ключевые фразы.
Ссылка на сервис — ВПодсказке.
Пример использования сервиса доступен по ссылке — видео.
Выводы
Методология с использованием vs запросов позволяет выявлять семантические структуры.
Схема простая. Для выявления структуры сначала следует выгрузить vs-данные. Затем итерационно собрать все тематические фразы с заданной глубиной парсинга.

Поисковая система размечает найденные элементы как близкие семантически. Практическое применение широкое.
Выше рассмотрен пример выявления структуры семантических связей по названию технологии. Но использовать название бренда в ключевой фразе не обязательно. Методология работает и в отношении блюд, сериалов и всего прочего.
Наилучшим образом связи проработаны в сегменте на английском. Поэтому если на русском связей найдено мало, то следует использовать переводчик.
Остались вопросы? Использовали ли данную методологию раньше? Какими необычными приемами пользуетесь при поиске в интернете? Напишите в комментариях.
Обсуждение
Её кстати даже уже начали переводить и публиковать от своего имени различные зарубежные псевдо-специалисты
https://medium.com/applied-data-science/the-google-vs-trick-618c8fd5359f
Судя по индексации "псевдоспециалисты" начали её переводить за 9 дней до публикации на ru.megaindex.com ??
>Практическое применение широкое.
>Методология работает и в отношении блюд, сериалов и всего прочего.
Зачем эта канитель? Практическое применение? Просто чтобы знать?))
Опишите хотя бы 1-2 реальных кейса???????
В статье есть три практических применения, ознакомьтесь.
На грубость не обращайте внимания.
Вы дали фундамент,а они хотят чтобы вы и дом построили.
Люди перестали думать.Голова только чтобы кушать и шапку носить.
Спасибо за примеры.Не доскональны но хороши.Опираясь на них можно построить свою стратегию.Спасибо с ув.Dante
но))) ...чем меньше уровень логики и мышления,тем хуже для клиента для которого создаёться,что-то интересное в цифровом мире.Ведь ты пишешь не рецепты кухни. Ты пишешь практические советы. Столкнулся с этим на практике.Пример для позетива.-)) Звонят мне из Варшавы и говорят( из офиса Google):
У пана есть сайт и пан хочет позиционирование?! да! А что пан хочет? Хочу ТОП- 0.)) А ЧТО ЭТО ???
Дмитрий- пишите и пишите давайте советы.Вы достойны,чтобы вас слушали и вы не имете конкуренции за ТОПВы не даёте пропасть молодому поколению фрилансеров,програмистов и копирайтеров...Спасибо.
Планшет или смартфон
Планшет или ноутбук
Ну и так далее. Дело за малом: теперь бы кто сервсис такой как выше запилил. :)
Было интересно!
Как все это связано с рабочим сайтом вообще? Хорошо, я вот хочу добавить материал на нужную мне тему. Конкретно - использование Excel на практике. Введу этот запрос. Дальше что? Как это мне поможет в моей работе? Народ, вы тоже поймите, что людям нужна конкретная помощь, а не общие славословия на тему, как все это чудесно. Я так же могу подобрать КС с разной частотностью на яндексвордстат, все будет проще и наглядней. Чем конкретно отличается предложенный Вами способ? Только, пожалуйста, не надо снова общих фраз. Мы в свое время так труды Ленина сдавали и на собраниях, уж там все научились лить воду часами, ничего в итоге толком не сказав. Это мы и сами умеем. Вы суть скажите, хорошо? Без общих фраз.