Данный термин описывается в патентах Google.
Разберемся со следующими вопросами:
- Что такое IR score?
- От каких данных зависит метрика?
- Что следует сделать на практике для улучшения ранжирования?
Что такое IR score?
Термин IR score происходит от Information Retrieval score.
В патентах на поисковые алгоритмы Google термин IR score упоминается множество раз.
Речь идет как о факторах on-page, так и о факторах off-page.
IR score является числовым значением, описывающим соответствие ключевой фразы найденной страницы.
Речь идет не только о вхождении ключевой фразы на странице сайта, но и расположении в верстке. Итоговая релевантность страницы рассчитывается на основе внутренних и внешних факторов. В упрощенном виде:
Total Score = IR score * PageRank
IR score упоминается в разных патентах Google. Например, термин прописан в таких патентах как:
- Deriving and using document and site quality signals from search query streams;
- Ranking blog documents;
- Modifying search result ranking based on implicit user feedback.
В патенте на поведенческие факторы Google указывает на то, что рассчитывает и сохраняет такие результаты как:
- Значения IR score для страниц, на которые были клики из поисковой выдачи (IR scores of clicked results);
- Значения IR score для всех страниц, до кликов в поисковой выдаче (IR scores of all results shown before click).
В данном патенте Google использует IR score для определения категорий поисковых запросов. Также для данной цели используются накопленные поведенческие данные. Итак, в данном патенте метрика применяется для определения категорий запросов и влияет на поисковую выдачу посредством так называемой системы корректировки ранжирования.
Рекомендованный материал в блоге MegaIndex по теме патентов Google по ссылке далее — Google запатентовал поведенческие факторы: что нужно знать и что делать?
От каких данных зависит IR score?
Патенты находятся в открытом доступе и частично описывают IR score. Числовое значение IR score является фактором, зависящим и от содержания страницы сайта и от ссылочного анкор-листа страницы.
Что касается содержания страницы, то числовое значение IR score зависит не только от наличия ключевых фраз на странице, но и от их расположения в зонах документа.
Если на разных сайтах размещена информация про один и тот же продукт, как оценить какая из страниц имеет более высокий показатель IR?
Итак, метрика IR является числовым значением, описывающим соответствие ключевой фразы странице сайта.
IR score страницы сайта зависит от следующих нюансов:
- Размещены ли ключевые фразы в зоне main content;
- Размещены ли ключевые фразы в первых абзацах;
- Размер шрифта;
- Цвет шрифта;
- Используются ли ключевые фразы в теге Title;
- Используются ли ключевые фразы в тегах H1-H6;
- Используются ли ключевые фразы в анкорах, ссылающихся на страницу.
Вопросы и ответы
Действительно ли поисковые системы используют PageRank и IR score на практике?
Google PageRank использовался на практике и используется сейчас. Числовое значение данного фактора раньше можно было получить используя Google Toolbar, но в последствии открытый доступ к данным был закрыт.
Сейчас при продвижении для оценки сайтов используются аналоги, такие как:
- Majestic Trust Flow;
- Majestic Citation Flow;
- MOZ Trust Rank;
- MOZ Domain Rank;
- MegaIndex Trust Rank;
- MegaIndex Domain Rank.
Данные по Google IR score не были в открытом доступе.
Содержание патента не означает обязательного применения метрики на практике, но упоминание IR score сразу в ряде патентов Google указывает высокую вероятность использования данного показателя на практике при ранжировании страниц.
Из патента Google:
Как проверить какие ключевые фразы встречаются на странице больше, а какие меньше?
Проверить вхождения по ключевым фразам можно используя сервисы. Например, сервис по аудиту сайтов от MegaIndex.
Инструмент показывает вхождение по ключевым фразам и n-граммам.
Сервис бесплатный.
Ссылка на сервис — MegaIndex Аудит.
Пример отчета для indexoid:
Для детального анализа текста есть специальные инструменты.
Ссылка на сервис — Анализ текста.
Как рассчитывается PageRank?
Как IR score, метрика PageRank упоминается в патентах Google. Очевидно, что аналогичные метрики используются в поисковых системах Yandex и Bing.
Конкретные формулы с коэффициентами в документах не публикуются, но известен общий принцип, лежащий в основе расчета числового значения подобной метрики.
Статический вес перетекает от страницы к странице по ссылкам и зависит от веса страниц акцепторов.
Большое значение указывает на высокий авторитет страницы.
Пример передачи веса:
Выводы
Исходя из полученных знаний, что следует сделать на практике для улучшения ранжирования?
IR score является значением, которое показывает, насколько документ сайта релевантен поисковому запросу.
Детали всех показателей и коэффициентов IR score не раскрываются и можно только предполагать, сколько сигналов ранжирования может использоваться для расчёта. Но ряд сигналов в патенте все же упоминается.
Используйте следующие рекомендации:
- Контент должен быть доступен на первом экране пользователя;
- Оптимальный вариант, если ключевые фразы размещаются, среди прочего, в первых абзацах основного содержания страницы сайта;
- Ключевые фразы должны быть размещены в тегах Title, H1-H6, так как вхождения в данных тегах страницы имеют большее значение, чем совпадения в нижней части страницы сайта;
- Размешайте связанные ключевые фразы на странице в близости друг к другу;
- Ключевые фразы должны быть оформлены с использованием оптимального шрифта и размера;
- Ключевые фразы должны быть оформлены с использованием оптимального цвета шрифта;
- Ключевые фразы должны быть оформлены с использованием оптимального фона шрифта;
- Ключевые фразы должны использоваться в анкор-листе страницы.
В дополнение к использованию оценки IR score, поисковая система может анализировать структуру сайта, хотя в патентах отмечается, что бывают случаи, когда структура сайта может быть недоступной, ненадежной или ограниченной по объему, что ограничивает использование и ценность.
Поэтому следует создавать структуру с учетом поисковой оптимизации. Рекомендованный материал в блоге MegaIndex по теме создания структуры сайта по ссылке далее — Как создать структуру сайта с учетом требований SEO?
Важно заметить, что в патентах также описывается возможность использования так называемых user profile terms. Если у поисковой системы есть данные о профиле пользователя, то согласно данным из патента поисковая система может расширять запрос дополнительными ключевыми фразами.
In particular, the IR score is personalized by adding to each search query a set of terms obtained from the user profile. The added terms (herein called the user profile terms) are treated as optional terms, not required for satisfying the query, but which contribute to the IR score of the document if the terms are found within the content of a document that satisfies the search query. For instance, the IR score of a document will be increased if any of the user profile terms are located in the title of the document, in the URL of the document, or in the first K words of the document, where K is a predefined value.
Если user profile terms размещены на странице, то такие ключевые фразы улучшают числовое значение IR score. По данной причине при продвижении сайта на страницах важно использовать слова, задающие тематику.
Так слова должны использовать в следующих зонах страниц:
- Title;
- URL;
- Первые K слов на странице, где K является предопределенным числовым значением поисковой системы.
Обсуждение