Google запатентовал поведенческие факторы: что нужно знать и что делать?
3 апреля 2019
Автор: User

Google запатентовал поведенческие факторы: что нужно знать и что делать?

Google получил новый патент на поведенческие факторы ранжирования.

Что запатентовал Google? Какие сигналы ранжирования описаны в патенте? Что следует сделать?

Разберемся с содержанием патента далее.

Google запатентовал поведенческие факторы


Что произошло? 12 марта 2019 года Google получил патент под названием Modifying search result ranking based on implicit user feedback.

Из названия ясно, что в патенте речь идет про технологию, которая используется для изменения ранжирования результатов поиска на основе неявной обратной связи с пользователем.

Ссылка на патент — Modifying search result ranking based on implicit user feedback.

Исходя из закона об авторском праве, патенты должны находиться в открытом доступе. Так у поисковых оптимизаторов появляется шанс разобраться в тонкостях ранжирования, которые поисковая система может использовать на практике.

В патенте описывается процесс сбора и анализа поведенческих факторов. Наиболее интересным элементом является так называемый Rank Modifier Engine, то есть система корректировки ранжирования.

Что такое Rank Modifier Engine?


Итак, исходя и описанной в патенте технологии существует две системы ранжирования сайтов:

  • Корневая система ранжирования страниц сайтов;
  • Система корректировки ранжирования (Rank Modifier Engine).

Система корректировки ранжирования работает отдельно и автономно от основной системы ранжирования.

Процесс выглядит следующим образом:

Система корректировки ранжирования в Google на основе поведенческих факторов ранжирования

Основная система ранжирования получает так называемую меру релевантности страницы из системы корректировки ранжирования. В результате позиции в поисковой выдаче изменяются.

Но какую информацию обрабатывает система корректировки ранжирования и как именно? Разберемся далее.

Как работает система корректировки ранжирования?


В патенте описываются сигналы, которые поисковая система может использовать при ранжировании сайтов. Разберемся с главными нюансами.

В патенте речь идет про следующие сигналы ранжирования:

  • Кликовые поведенческие факторы. Речь про факторы, связанные с поведением пользователя на странице поисковой выдачи. В патенте описывается анализ кликстрима, расчет CTR документа по запросу и прочее;
  • Фактор длины клика. Согласно патенту, анализируется время, проведенное пользователем на выбранной странице сайта (a time the user spent on the document). В среде поисковых оптимизаторов метрика именуется как dwell time. Под временем, потраченным пользователем на странице сайта, подразумевается время, прошедшее от клика на ссылку в органических результатах до возвращения к поисковой выдаче и выбора нового документа.
  • Язык и страна пользователя. Использование данного фактора указывает на дифференцирование результатов выдачи в зависимости от языка и предполагаемой страны. К примеру, результаты выдачи для запросов на русском языке и на украинском языке могут отличаться по причине использования разного языка в интерфейсе. Значит, от правильной настройки мультиязычности на сайте зависят позиции в поисковой выдаче. Если перелинковка настроена не верно, то по запросам с одинаковым интентом могут быть потеряны позиции. Если на сайте используется множество языков и перелинковка настроена правильно, то по схожим запросам будет выводиться один и тот же сайт, но ссылки будут разными.

Кликовые факторы ранжирования в патенте расписаны подробно. Срезы по длине клика следующие:

  1. Запрос-документ;
  2. Запрос-документ-язык;
  3. Запрос-документ-язык-страна.

По длине клики разбиваются на такие группы:

  • Короткие;
  • Средние;
  • Длинные;
  • Последний клик.

Итак, определено понятие последнего клика.

Последним кликом называется клик, после которого пользователь не возвращается на страницу с результатами выдачи.

Что можно считать коротким, что средним и что длинным кликом? Значение для каждой из групп зависит от запроса. Итак, для каждого запроса есть свои значения, и конкретные цифры определяются исходя из поведения пользователей на практике.

Как результат, исходя из данных о длине клике поисковым алгоритмом оценивается то, насколько хорошо страница отвечает на поисковый запрос.

В патенте приводится следующий пример:

  • Короткий клик может считаться плохим показателем для страницы. Страница плохо отвечает на поисковый запрос. Пример значения — 0,1;
  • Средний клик характеризует страницу как потенциально полезную. Пример значения — 0,5;
  • Длинный клик характеризует страницу как хорошую. Пример значения — 1,0;
  • Последний клик характеризует страницу как вероятно хорошую. Пример значения — 0,9.

При анализе кликов меньший вес назначается кликам тех пользователей, которые чаще остальных выбирают высоко ранжируемые страницы. Иными словами, если пользователь постоянно выбирает результаты из топ-3, то значимость клика снижается.

Помимо оценки поведения на выдаче, пользователей также разделяют на обычных и опытных. Как результат, при учете кликов определенного пользователя используется весовой коэффициент. Значение зависит от индивидуального поведения в интернете.

Пользователь может быть классифицирован на основе запросов, которые отправляют в поисковую систему. В частности, предполагается, что пользователь является опытным в нише, если вводит множество запросов по определенной нише.

Какой вывод можно сделать? Значит, использование мотивированного трафика из специальных сервисов заведомо ниже по эффективности, нежели привлечение целевой аудитории в выдачу из социальных сетей или оптимизация сниппетов и прочее.

Какие еще нюансы по анализу выдачи известны из патента? На основе полученных данных поисковой системе требуется получить информацию о том, какие страницы лучше отвечают на запрос, и какие хуже. Но если использовать данные напрямую, то ввиду естественного распределения страницы из топ-3 будут получать больше переходов из поисковой выдачи, и, как следствие, выдача не будет изменяться.

Как тогда решить вопрос определения релевантных страниц, исходя из полученных данных? Решение заключается в следующем. При расчете значения релевантности используются составные показатели.

Примеры составных показателей:

  • Отношение числа длинных кликов к коротким;
  • Отношение числа длинных кликов ко всем кликам для конкретного документа по конкретному запросу (доля длинных кликов).

В качестве защиты от шума к подобным отношениям может быть добавлен параметр сглаживания.

Параметр сглаживания обладает следующим свойством — если общее количество кликов невелико, то результат будет стремиться к нулю.

Сигнал не будет учитываться, да и все. Я выдвигал гипотезу о таком подходе поисковой системы в комментариях к статье про поведенческие факторы. Ссылка на статью — Фактор ранжирования Dwell Time — что это и как его оптимизировать для роста позиций в выдаче? Теперь гипотеза подтверждена патентом.

Как результат, благодаря составным показателям, страницы получающие относительно небольшое количество кликов, но длинных в итоге могут получить больший вес меры релевантности, нежели страницы, находящиеся в топ-3 и получающие относительно большое количество кликов, но коротких.

Итак, на меру релевантности влияет соотношение:

количество длинных кликов/общее количество кликов*100

Параметры сглаживания могут варьироваться в зависимости от языка или страны.

Как происходит влияние на ранжирование? Исходя из патента, вычисленные значения меры релевантности (в явном или преобразованном виде) предлагается применять в качестве повышающего коэффициента к значениям релевантности, вычисленным алгоритмом ранжирования.

Значит, поведенческие факторы влияют на результаты ранжирования страниц в органической выдаче поисковой системы.

Схема из содержания патента:

Патент Google на поведенческие факторы

Вопросы и ответы


Используются ли поведенческие факторы в Yandex?


Да. Поведенческие факторы используются в Yandex. Есть подтверждения.

В поисковой системе поведенческие факторы именуются как пользовательские факторы ранжирования документов.

Поведенческие факторы ранжирования в Yandex

Признает ли Google использование поведенческих факторов?


Официальных заявлений об использовании поведенческих факторов ранжирования в поисковой системы Google нет.

Представители Google отрицали использование таких факторов. Заявления исходили не от инженеров из Google Search Team, а от службы поддержки. В заявлении было сказано, что поведенческие и социальные факторы с точки зрения разработчиков алгоритма ранжирования Google являются очень плохими и слишком шумными сигналами и поэтому не учитываются в алгоритме.

С высокой вероятностью данная информация не является достоверной и была вброшена намеренно с целью ввода поисковых оптимизаторов в заблуждение.

Другой представитель Google дезавуировал заявление:

Я не думаю, что он говорил о факторах напрямую.

Еще заявление от Google:

Если люди переходят на ваш сайт и заполняют формы или подписываются на услуги или рассылку, это значит, что вы действуете в верном направлении. Я бы рассматривал это как позитивный момент в целом, но это не значит, что Google учитывает эти действия в ранжировании и использует эту информацию для автоматического продвижения сайта.

Доступ к информации об использовании факторов ранжирования является ограниченным. Использование поведенческих факторов как сигнала ранжирования подтверждает:

  • Официальные документы, такие как патенты;
  • Практика.

На практике улучшение поведенческих факторов посредством улучшения сниппетов и дизайна влияет на ранжирование страницы сайта в поисковой выдаче.

Специальные сервисы по оптимизации поведенческих факторов также могут оказывать влияние на ранжирование сайтов. Для продвижения на подобных сервисах используется мотивированный трафик. Ссылка на такой сервис по оптимизации поведенческих факторов — SERP Click.

Выводы


Поведенческие факторы ранжирования в Google действительно используются при ранжировании сайтов. Об этом свидетельствуют соответствующие патенты и практика. Но если нет желания вникать в детали патента, то и не стоит.

Итак, получено еще одно подтверждение, что задача удержания пользователей на сайте является одной из основных задач в поисковой оптимизации.

Аналогичные выводы из содержания патента представлены в статье Сергея Людкевича.

Что делать? Просто используйте следующие рекомендации:
  • Увеличьте количество переходов на сайт из поисковой выдачи за счет создания эффективных сниппетов. Например, проведите анализ сниппетов тематических сайтов, продвигаемых в регионах с высокой конкуренцией;
  • Используйте специальную разметку для создания расширенных сниппетов в поисковой выдаче, чтобы привлечь трафик;
  • Задерживайте пользователя на странице разными способами. Оптимизируйте Dwell Time, например используя формат страницы single-page content вместо пагинации.

Рекомендованные материалы в блоге MegaIndex:


С чего начать? Например, используйте приложение Анализ сниппетов от MegaIndex, чтобы провести анализ сниппетов тематических сайтов, продвигаемых в регионах с высокой конкуренцией.

Ссылка на сервис — Анализ Сниппетов.

Анализ сниппетов сайтов

Есть API для получения сниппетов по домену. Для выгрузки данных через API надо использовать метод visrep/site_ser.

Пример запроса на выгрузку сниппетов из поисковой системы Google для сайта indexoid.

http://api.megaindex.com/visrep/site_ser?key=[ключ]&domain=indexoid.com&ser_id=1&count=10

Как переиндексировать страницу, чтобы обновить сниппет страницы на новый? Если сниппеты страниц откорректированы и требуется провести индексацию страницы заново, просто добавьте URL в сервис по оптимизации социальных сигналов GetSocial или Search Console.

А какие вы используете способы для удержания внимания пользователей на сайте?

Остались ли у вас вопросы, мнения, комментарии по теме патента Google на поведенческие факторы ранжирования?

Обсуждение

Art.Bodnaruk
Как понимать какое соотношение коротких и длинных кликов является нормальным для сайта и это не станет причиной понижения позиций?
denys_f
Очень просто: кликаешь на реф ссылку SERP Click или эту GetSocial перереходешь смотрешь что хрень, возвращаешься обратно, чувствуешь что где то налили много воды и хайпанули на инфе высосанной из пальца, но поведенческие факторы уже накручены - ну вот где то так и работает!
User
Такие сервисы являются вспомогательными не обязательными элементами.
User
Лучше, если доля длинных кликов выше. Точные значения рассчитать будет крайне сложно. Лучше ориентироваться такие показатели ключевой эффективности как:
1. Если много коротких кликов, и страница отвечает на запрос — то хорошо. Будет присвоен последний клик;
2. Если ответ подразумевает углубленное изучение вопроса, больше длинных кликов — лучше.
Dante-Diabolic
Довольно странный подход к измерению ПФ, либо что-то не так поняли из патента. На мой взгляд, более правильным был бы подход наоборот (то есть, с конца схемы, с компонента, далее - прогноз, сбор данных по свежатине, вычитание от эталона, присваивание сайту id-позиции, ну как-то так). И что значит "удержание"? Ну есть группа запросов, на которые нужно получить быстрый ответ. А есть группы магазов, которые так же следует поделить на подгруппы, есть услуги, которые ищут сейчас и присматриваются годами. И потом, у Альтертрейдер есть хорошая статья по поведенческим факторам, которая, в общем, дает исчерпывающие ответы и идеи о применении каких-то своих метод для измерения, хоть и была написана в 12 году.
И поясните пожалуйста вашу формулу меры релевантности, а то непонятно, что на что умножается и где промежуточные сведения и кликах, и их вершины.
User
Ссылка на патент приведена выше. Информацию можно сверить. Запросы разбиваются исходя из анализа поведения пользователей на выдаче. Написано выше:
"Что можно считать коротким, что средним и что длинным кликом? Значение для каждой из групп зависит от запроса. Итак, для каждого запроса есть свои значения, и конкретные цифры определяются исходя из поведения пользователей на практике."
User
Есть разная информация, без анализа на практике и лишь предполагаемая.
А есть патенты.
User
Я использую для анализа либо опыт из практики, либо инсайды, либо патенты.
Dante-Diabolic
Это понятно. Но формулу-то не пояснили?
User
Формула не является публичной. Если бы формула была опубликована, много пользы бы не прибавилось, так как коэффициенты обладают свойством изменчивости и изменяются нейронной сетью.
risenab
Если статью сжать, получится примерно следующее:
1. Теперь Гугл конкретно занялся "контентным SEO" (в кавычках написал, потому что разговорный вариант, грубо говоря) и ввел новые "правила" (что ж, и не такое видали...).
2. От качества контента и его полноты (полнота раскрытия проблемы) зависит то, сколько пользователь останется на странице (в принципе, как и раньше, вот только теперь этот фактор, как я понял, имеет куда большую значимость, чем раньше).
3. Появился фактор последнего клика (это когда человек, к примеру, открыл до вашего сайта ещё 3, не нашел решения, и вот открывает ваш, находит ответ и больше не ищет информацию на своему вопросу) - это значит, что последний сайт, который посетил юзер, помог решить проблему (при том условии, что юзер пробыл на сайте не 5 секунд, а хоть какое-то время). А это значит, что сайт полезен. А если сайт полезен, то как обычно - его в ТОП (старая схема в новой обёртке).
4. Продвигать "мелким" контентом (2000-2500 символов без пробела, в которых написано "кратенько и обо всём") сайты теперь не вариант - проблему нужно раскрывать полностью, так что минималка для любой новостной статьи теперь уж точно 3500, а это означает увеличение объёма работ и повышение цены на контент как минимум на 5 тысяч рублей. Из этого пункта следует, что сайты бытовых услуг (мелкие сайты) пострадают больше всего (т.к. зачастую не готовы платить больше 5-7 тысяч в месяц веб-мастерам).
В общем, что и ожидалось. Но не думал, что так быстро это введут. Прогноз был где-то ещё на 5-8 месяцев запаса =_=...
aleksandr
Скорее, времена "простыней" и "небоскребов" уходят. Никто с мобилы длинные заумные тексты читать не будет - и не читает. Быстро получить ответ на интересующий вопрос - и совершить соответствующее интенту действие, вот и вся балалайка.
И да, я по своим проектам заметил: куда лучше заходят небольшие (300-400 слов) тексты с хорошей силосованной структурой, чем длинные монографии, пусть и высокого качества.
risenab
В тоже время длинный контент, грамотно написанный (к примеру руководство к чему либо, либо контент, обозревающий и решающий проблему), имеющий объём от 3 до 5 тысяч символов без пробела достаточно хорошо держится в Google в ТОП-3. Часто наблюдаю такую тенденцию. А для того, чтобы "пользователь с мобилы" не грыз тонну информации, можно спокойно сделать оглавление с разметкой (частое явление на сайтах в ТОП-е). Яндекс, к слову, тоже перешел на систему "длиннопост лучше" (в коем то веке). Так что вариантов нет, рано или поздно от малых статей придётся отказаться. И сейчас ПС делают для этого всё возможное.
User
Все зависит от запроса. Есть речь идет про рецепт, то не надо делать большой текст и расписать происхождение каждого ингредиента и историю.
В большинстве случаев, документ должен покрывать запрос пользователя и дополнительные возможны запросы, о которых пользователь может даже не знать, до перехода на документ из выдачи, но об этих запросах знает поисковая система.
User
Спасибо за развернутый отклик!
archosaur2
Эти параметры работали как минимум 5 лет назад, никаких там «теперь», все норм люди оптимизируют с учетом пф, а сейчас гугл просто зафиксировал что то юридически, возможно их вынудили или прошли изменения в законах.
Так что не думайте что «вот сейчас все поменялось», это глупости, машина гугла отлаживается оч долго и быстро менять ее невозможно.
risenab
"работали как минимум 5 лет назад" - никто не спорит. Однако нужно понимать, что эти факторы могут менять свою значимость для поисковой выдачи из года в год. Как пример - ссылки в 2009 году и 2019 году. Разница колоссальна! А если товарищи из Google решили запатентовать работу некоторых факторов, то тут уже не просто "фактор", а достаточно продуманный алгоритм, который в значительной степени может повлиять на выдачу.
User
В поисковых системах обновления действительно происходят. Да, обновления не происходят в один миг. Но обновления происходят. Утверждения о том, что ничего не меняется годами и появился только HTTPS и мобилопригодность является мифом.
Albert
Получается, что очевидные, чёткие, ясные страницы сайта, напрямую отвечающие поисковому запросу, на которых посетитель не будет тыкаться во все виды ссылок вокруг контента, ходить по другим разделам и всячески "вовлекаться" в нутро сайт, а сразу найдет нужную информацию и закроет страницу - плохие. Хм.
User
На самом деле происходит не так. Тоже думал про данный момент. Есть четкий ответ.
Если пользователь не находит ответ, то ищет ответ на другой странице.
Если пользователь найдет ответ на другой странице быстро и страница является последней, то срабатывает опция "последний клик".
User
И, алгоритм разбивает запросы на группы. Если страница должна содержать короткий ответ, не надо усложнять. Поисковая система обладает данными о том, что клик должен быть короткий.
В патенте:
"Thus, in the discontinuous weighting case (and the continuous weighting case), the threshold(s) (or formula) for what constitutes a good click can be evaluated on query and user specific bases. For example, the query categories can include “navigational” and “informational”, where a navigational query is one for which a specific target page or site is likely desired (e.g., a query such as “BMW”), and an informational query is one for which many possible pages are equally useful (e.g., a query such as “George Washington’s Birthday”). Note that such categories may also be broken down into sub-categories as well, such as informational-quick and informational-slow: a person may only need a small amount of time on a page to gather the information they seek when the query is “George Washington’s Birthday”, but that same user may need a good deal more time to assess a result when the query is “Hilbert transform tutorial”."
drondo124
Да здравствует ипучий гугл ... не прошло и недели после мартовского обновления нате поведенческий кушайте не обляпайтесь... короче делается все чтоб контекст рулил...
User
Kill Google before Google kill internet
User
Таки да. Поисковая система всячески хочет закрыть трафик на своем сайте. Сюда же можно отнести расширенные ответы и Accelerated Mobile Pages Project.
stanislav_441
Было бы интересно, если бы вы сравнили ПФ в Яндексе и в Гугле. Есть ли вероятность, что осенне-весенние апдейты в Гугле связаны с ПФ?
User
Самый последний адпейт был связан с E-A-T факторами. Подробности - https://ru.megaindex.com/blog/google-florida
demimurych
В гугле сейчас нет никаких поведенческих факторов, кроме клика в поиске. Который с момента появления поиска играл значимую роль. Ничего кроме этого в гугле нет.
Я могу говорить об этом с такой уверенностью потому, что для того, чтобы эти факторы учитывать нужно отправлять массу персонализированной информации о поведении посетителя на странице - персонализированной информации.
Никакая статистика поведения посетителя на сайте ни счетчиком гугла, ни браузером Google Chrome не отправляться.
Это легко проверяется как анализом трафика на уровне того что отправляют скрипты, так и на системном уровне снятием всего трафика от браузера. Что делают 24x7 многие специалисты.
Добавьте к этому тот факт, что Google работает в правовом поле громадного количества стран, где это прямо запрещено (отправка персонализированной информации), то есть за подобными вещами постоянно следят.
Так же стоит помнить - наличие патента не означает его внедрение.
Описанное выше в деталях патента, это общее фантазерство на тему как бы это могло быть реализовано. Зачем так делают? В силу особенности патентной системы, юристы кампаний стараются максимально обезопасить компанию от возможных патентных преследований.
risenab
"В гугле сейчас нет никаких поведенческих факторов, кроме клика в поиске. Который с момента появления поиска играл значимую роль. Ничего кроме этого в гугле нет" - абсолютно согласен. Однако если смотреть глубже, то они как раз таки и будут переучивать этот самый "клик в поиске" работать иначе. Также стоить учитывать и тот фактор, что Гугл не сразу врубит эту систему. Где-то полгода она будет работать в фоновом режиме и самообучаться, пытаясь научиться определять короткий и длинные клики. Ещё около полугода понадобится на отладку. Тем самым, где-то через год нам как раз таки и стоит ожидать включение в работу нового алгоритма ранжирования сайтов. И лучше большинству SEO-шников готовиться к этому заранее.
User
На самом деле реальность иная. Здесь много тезисов. Если взять хотя бы то, что информация защищается законом, то насколько видно из патента, информация анонимная, и никак не входит в список персональных данных, поскольку нет идентификатора пользователя. Если бы подобная информация и была защищены законом, то вы бы согласились на ее обработка еще при установке браузера.
hiranoor75
regards
Jessicakally605
a lot of
kellybabae020
more
charleydon03
true
jessibella60
Clearly
honeybella75
too much
Alinganggara94
that this post is awesome
Alinganggara94
blog
Alinganggara94
blog
l2toplist
переносим все ссылки в футер, печатаем текст типо этого и вуаля поведенческие накручены )
Для добавления комментария, пожалуйста, авторизуйтесь