Поисковый алгоритм HITS простым языком: что важно знать и что делать
29 августа 2019

Поисковый алгоритм HITS простым языком: что важно знать и что делать

Google и Yandex применяют алгоритмы подобные HITS при ранжировании в поисковой выдаче.

Алгоритм HITS — что это? Как использовать полученные знания на практике для поисковой оптимизации сайта? Исходящие ссылки на какие сайты могут принести пользу при продвижении?

Разберемся с вопросами далее.

Принцип работы Google HITS простым языком


Целью алгоритма является ранжирование страниц на основе авторитетности.

Весь принцип действия заключается в следующих шагах.

Сначала поисковая система отбирает список страниц, которые являются наиболее релевантными ключевой фразе.

На данном этапе задействован текстовый алгоритм ранжирования. Данный набор страниц называется корневым.

Страницы в корневом наборе называются авторитетными страницами.

Далее полученный набор расширяется путем добавления в список таких страниц:

  • Страницы, на которые размещены ссылки с страниц из корневого набора;
  • И страницы, на которых размещены исходящие ссылки на документы из базового набора.

Goolge HITS ссылки

Такие страницы называются хабами.

Итак, сформированы такие наборы страниц:

  • Корневой;
  • Базовый.

Goole HITS наборы

Итак, алгоритм HITS влияет на ранжирование сайтов в поисковой выдаче.

Исходя из принципа работы Google HITS, Ссылки с авторитетных сайтов имеют значение, даже если такие ссылки закрыты в nofollow.

Рекомендованный материал в блоге MegaIndex на тему nofollow ссылок по ссылке далее — Nofollow ссылки в SEO: все что нужно знать + Комментарии Google

На сайте следует размещать исходящие ссылки на авторитетные ресурсы, например сайты как Wikipedia, Google. Ссылки должны быть прямыми и открытыми к индексации.

Найти все исходящие ссылки с сайта можно применяя специальные инструменты, например инструмент для поиска исходящих ссылок от MegaIndex.

Ссылка на сервис — Поиск исходящих ссылок.

Пример отчета:

Поиск исходящих ссылок с сайта

Алгоритм HITS связан с конкретными запросами и рассчитывается не на всем корпусе, а лишь на базовом наборе документов.

HITS является одним из алгоритмов, используемых поисковыми системами при ранжировании сайта в результатах поисковой выдачи. Есть ряд других метрик, влияющих на ранжирование сайта. К примеру, поисковые системы оценивают трафик на сайте. Такие данные агрегируются с разных источников.

Yandex алгоритмы поискового ранжирования

Рекомендованные материалы в блоге MegaIndex по теме поисковых алгоритмов по ссылке далее — Исследование алгоритмов поисковых систем.

Выводы


Для поисковой системы исходящие ссылки являются так называемыми рекомендациями. В Google, Yandex оценка значимости рекомендаций проводится с применением HITS или подобных поисковых алгоритмов. Поисковая система оценивает список сайтов, на которые ссылается страница.

Используя подобный алгоритм поисковые системы могут расширять исходное множество страниц, которые с высокой степенью вероятности являются релевантными ключевой фразе.

Применение алгоритма предоставляет возможность найти релевантные страницы даже среди тех, на которых нет прямого вхождения ключевой фразы в тексте.

Алгоритм поисковой системы оценивает качество сайта, а также принадлежность к тематике. Исходя из принципа работы HITS следует вывод, что важно ссылаться на авторитетные сайты, такие как Wikipedia или Google.

Применяя HITS поисковые системы с легкостью находят те сайты, которые массово продают и/или покупают ссылки.

Доклада на тему определения качества ссылок для дальнейшей сегментации на группы из токсичных и естественных ссылок. Видео:



Исходя из полученных сведений про алгоритм Google HITS, главные выводы относящиеся к практике в следующем:

  • Следует размещать внешние ссылки на сайт с авторитетных страниц, даже если такие ссылки закрыты в nofollow;
  • Следует размещать исходящие ссылки на страницы сайтов с высоким авторитетом, например такие сайты как Wikipedia. Такие ссылки должны быть открытыми к индексации.

Сайты с закрытыми исходящими ссылками на авторитетные сайты ранжируются хуже, нежели аналогичные сайты с открытыми ссылками.

Поисковый алгоритм Google Hits

Остались ли у вас вопросы, замечания или комментарии по теме алгоритма Google HITS?

Обсуждение

Art.Bodnaruk
08:21 29 августа 2019
Имеет ли значение, в каком именно месте сайта будет размещаться ссылка на вики, к примеру?
Дмитрий Угниченко
10:43 2 сентября 2019
Ссылка должна быть размещена в главном содержимом, в тексте статьи.
Art.Bodnaruk
08:21 29 августа 2019
Такие ссылки как-то улучшают позиции сайта в выдаче?
Дмитрий Угниченко
10:43 2 сентября 2019
Такие ссылки являются одним из множества факторов, которые посредственно оказывают влияние на формирование результатов.
Вклад ссылок минимальный, но есть.
cross-fire
13:49 30 августа 2019
Хлам
Дмитрий Угниченко
10:53 2 сентября 2019
HITS описываются в патенте Google. Патенты Google не хлам. Напишите, если есть идеи по интересным темам.
Moscow.xyz
13:54 30 августа 2019
Да это бред! Эту шляпу поисковые системы использовали лет так 10 назад
Дмитрий Угниченко
10:43 2 сентября 2019
Поисковые системы использовали и используют даже те технологии, которые были реализованы еще на стадии создания поисковых систем, например - PageRank. Далее технологии совершенствуются.
s10s2010
14:02 30 августа 2019
Мммда инфа
demimurych
14:15 30 августа 2019
Этот алгоритм не использовали и не используют. И не смогут использовать в ближайшие годы.
Когда рисуется схема из 5 связей все просто. Но как только в связях начинают участвовать больше узлов графа, становится как то не по себе от количества варнаков.
А если быть более точным то при 66 узлов графа. Задачу невозможно решить и за миллиард лет.
Как следствие, могут применяться разные алгоритмы оптимизации обхода такого графа. Но в этом случае, нам уже глубоко пофиг на принцип, о причине того, что нам становится нужно знать прицнип алгоритма оптимизации - то есть весовые критерии по окторым было принято решение об отсечении других узлов.
В комбинаторике эта задача называется - задачей коммивояжера.
Дмитрий Угниченко
12:00 2 сентября 2019
Алгоритм может быть тюнингован. Чтобы понимать используется алгоритм или нет следует или знать наверняка, например из заявления Google Search Team, или проводить масштабные эксперименты. В данном случае берем за базу патент поисковой системы Google. Спасибо за отклик! Интересно было читать.
arinaja
14:31 30 августа 2019
Поздновато публикуете. Не закрытые в noindex ссылки на авторитетные источники давным-давно повышают значимость контента.
Дмитрий Угниченко
10:44 2 сентября 2019
Данный пост создан для того, чтобы решить две задачи:
- Дать рекомендации для новой аудитории, часть из которой не являются оптимизаторами;
- Добавить пост в поисковые системы, чтобы в дальнейшем в поисковой выдаче можно было найти данную информацию.
web-77
14:33 30 августа 2019
все как обычно и как было 10 лет назад - ставим ссылки на сайт и с сайта на всякий случай и начинаем колдовать с семантикой сайта.
metronat
15:28 30 августа 2019
Хорошая статья. Каждый может проверить ее на своем сайте и посмотреть влияют ли на ранжирование исходящие ссылки допустим на Википедию. А то пишут некоторый сразу, мол фигня полная.
l2toplist
00:24 31 августа 2019
размещаю ссылки в rel nofollow никаких проблем, так как путаете noindex с nofollow, это говорит роботу, что не обязательно переходить по данной ссылке.
Дмитрий Угниченко
10:39 2 сентября 2019
Ссылка на авторитетные источники не обязательно закрывать в nofollow.
l2toplist
15:06 2 сентября 2019
ну это понятно, но как быть если ресурс создан для любого автора, правила должны быть одни для всех, другое дело, если размещают статьи свои копирайтеры.
meb-in
01:00 31 августа 2019
Господи какая отборная околесица и хлам! Отписался от рассылки, и эту достал из папки спам.
Дмитрий Угниченко
10:53 2 сентября 2019
Спасибо за отклик. Приведенная информация базируется на принципах действия поискового алгоритма HITS. Данный принципе есть в патенте Google. Патенты Google не хлам.
Напишите, если есть идеи по интересным темам.
archosaur2
04:18 31 августа 2019
Ссылки на банки, сервисы платежей, документацию на сторонних сайтах - абсолютно, никак, не влияют ни на что.
Единственное влияние - они делают пользователю удобно и он вернется к вам на сайт повторно.
Вся эта тягомотина про закрытые/открытые ссылки уже поднадоела. Роботам без разницы какая ссылка, они ходят по любым, если не верите, откройте логи сервера, и увидите что бот пришел к вам с закрытых ссылок.
master66
13:20 31 августа 2019
Ну то что боты ходят с абсолютно любых ссылок это факт и факт известный.Но если так размышлять и дальше - то есть смысл размещать ссылки где угодно и как угодно. Есть ли какие то строгие ограничения на это? Вот к примеру заспамленный гест - будет толк если там свой линк разместить?
Дмитрий Угниченко
11:00 2 сентября 2019
Толку не будет. Не любые поисковые краулеры ходят по всем ссылкам. Yandex, например, не ходит по любым ссылкам. Google - да. Но речь про исходящие ссылки на авторитетные сайты, которые должны быть использованы для создания тематической связи.
Дмитрий Угниченко
10:43 2 сентября 2019
В патенте про 'content-based links between information resources' описывается связь и влияние. Речь идет не про банки, сервисы, документации. Речь идет про ссылки на авторитетные источники по теме.
stanislav_441
16:06 1 сентября 2019
Можете объяснить простым языком, что такое базовый набор и что такое корневой?
Дмитрий Угниченко
11:02 2 сентября 2019
В корневой набор входят страницы, которые отбираются поисковым алгоритмом как лучшие. В данном случае может использоваться только 1 алгоритм - например, алгоритм текстового ранжирования.
В базовый набор входят страницы, которые по ссылкам связаны с корневым набором.
Для добавления комментария, пожалуйста, авторизуйтесь