Закон Ципфа

Среди критериев оценки качества текста основным считается его естественность. Проверку этого показателя можно провести с помощью математического метода, который обнаружил американский лингвист Джордж Ципф.

Проверка по закону Ципфа - это метод оценки естественности текста, определяющие закономерность расположения слов, где частота слова обратно пропорциональна его месту в тексте.

 

Первый закон Ципфа "ранг - частота"

С = (Частота вхождения слова х Ранг частоты) / Число слов.

Если взять соотношение слова на ранг частоты, то величина (С) будет неизменной, причем это верно для документа на любом языке, внутри каждой языковой группы значение будет постоянным.
 
закон ципфа
 
Значимые для документа слова, определяющие его тематику, находятся в середине гиперболы. Слова, используемые наиболее часто, также как и низкочастотные, не несут решающего смыслового значения.
 
 

Второй закон Ципфа "количество - частота"

Частота слова и его число в тексте также связаны друг с другом. Если построить график, где Х - частота слова, Y – число слов данной частоты, форма кривой будет неизменной.

Принцип написания хорошего текста предполагает, что его необходимо сделать наиболее понятным при использовании наименьшего количества слов.

Закон показывает общее свойство для любого языка, т.к. всегда будет определенное количество наиболее часто встречающихся слов.
 
график 2

 

Проверить SEO-текст на естественность нужно обязательно, если при написании использовались ключевые слова, чтобы он был интересным и понятным для большой аудитории читателей. Также этот показатель имеет значение при ранжировании сайтов поисковыми системами, которые определяют соответствие текста ключевым запросам, распределяя слова по группам важных, случайных и вспомогательных.

 

Подробнее:
  • Зависимость между частотой встречаемости слова в тексте f, и его местом в частотном словаре (рангом) r, обратно пропорциональная. Чем больше ранг слова (чем дальше оно находится от начала словаря), тем меньше частота его встречаемости в тексте.
  • График такой зависимости - гипербола, которая при небольших значениях рангов очень резко спадает, а затем, в области малых значений частоты встречаемости, f, тянется очень далеко, постепенно, но очень незаметно, уменьшаясь по мере роста ранга, r. 
  • Если частота встречаемости одного слова 4 на миллион, а частота другого - 3 на миллион, не имеет значения, что ранги этих слов различаются в тысячу раз. Эти слова употребляются настолько редко, что многие носители языка их даже не слышали.
  • Однако эта дальняя область примечательна тем, что слово, находящееся здесь, может очень легко многократно уменьшить значение своего ранга. Даже самое маленькое увеличение частоты встречаемости слова резко сдвигает его положение к началу частотного словаря.
  • В терминах этого закона мерой популярности слова является его положение в частотном словаре языка. Более популярное слово находится ближе к началу словаря, чем менее популярное.
  • Он отражает зависимость частоты использования слова в языке от его места в частотном словаре. Популярные слова языка употребляются чаще. С математической точки зрения, график этой зависимости является гиперболой с резким подъемом по мере приближения к началу координат и длинным, пологим, почти горизонтальным, «хвостом». БОльшая  часть слов языка размещается именно в этом «хвосте». Здесь место слова в частотном словаре, если и изменяет частоту использования этого слова в языке, то совсем не на много.
  • Но как только положение слова в частотном словаре достигает того места на гиперболе, где по мере приближения к началу координат начинается существенный подъем кривой, ситуация изменяется. Теперь небольшое изменение частоты встречаемости слова уже не приводит к значительным изменениям его ранга, то есть положение слова в частотном словаре перестает изменяться. Значит, рост популярности слова затормозился. Для того, чтобы он продолжался, следует предпринять специальные меры для того, чтобы повысить частоту встречаемости слова. Например, если слово – название товара, необходимо потратить средства на рекламную компанию (источник: http://www.proza.ru/2016/11/05/859)


Провести проверку естественности текста Вы сможете в нашем приложении "Анализ текста".

 

Более подробно: https://ru.wikipedia.org/wiki/Закон_Ципфа

 

Рекомендуем посмотреть видео по теме.