Алгоритм BM25

BM25 —семейство функций ранжирования документов, которые оценивают число ключевых запросов в каждом из документов.
 
Алгоритм имеет формулу, которая показывает релевантность страниц в зависимости от количества и расположения слов (во всех блоках текста, исключая ссылки) относительно других документов.
bm25

Функция называется BM25 (англ. "best match"), часто ее называют также Okapi BM25, по названию поисковой системы Okapi, где она была использована впервые.

 

В SEO Okapi BM25 — одна из функций ранжирования, используемая поисковиками для определения соответствия страницы заданному ключевому слову.

Т.е. если на странице нет фразы, соответствующей поисковому запросу, то не удастся попасть в ТОП в сравнении с конкурентами, которые ее используют.

 

Пример.
Есть несколько запросов состоящих из нескольких слов:
  •     купить смартфон Samsung
  •     купить смартфон Samsung Galaxy
Пусть сравниваются два документы и первый документ не содержит слова Galaxy.
Согласно расчетов, оценка релевантности это сумма релевантностей каждого из слов.
формула
 
Релевантность каждого из слова равна его IDF * на второй множитель.
Релевантность всего поискового запроса равна сумме релевантностей всех слов.
Таким образом, отсутствие слова или другими словами его частота, равная 0, дает релевантность 0.
Поэтому если по двум первым словам score будет одинаково то более релевантным будет тот документ, который содержит слово Galaxy.
(источник https://habrahabr.ru/post/162937/)

 

Рекомендуем провести проверку релевантности текста в нашем приложении "Анализ текста".

 

Более подробно: https://ru.wikipedia.org/wiki/Okapi_BM25

 

Рекомендуем посмотреть видео по теме: