Главная > Энциклопедия кибернетики. Т.2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

ЦИПФА ЗАКОН

— закономерность распределения слов в тексте вида , где количество появлений слова в тексте. К этому надо добавить условие, что миним. значение равно единице и количество слов с минимальным значением пропорционально общему количеству слов в тексте. Нормальное значение параметра а величина С определяется из условия где N — количество слов в тексте. Параметр наз. рангом слова в тексте.

Известные попытки теоретического объяснения Ц. з. основаны на том, что величины интерпретируются как проявление некоторых вероятностей, имеющих силу для однородного ансамбля текстов. Существует несколько схем такого вывода: на основе «компромисса» между говорящим и слушающим, из соображений миним. стоимости оптимального кода, из термодинамических соображений наиболее вероятного распределения при данной суммарной «сложности» текста.

Ц. з. отражает не статистические свойства ансамблей (и тем более не языка в целом), а выражает некие фундаментальные свойства замкнутых связных текстов. На таких текстах Ц. з. выполняется гораздо лучше, чем на больших однородных совокупностях текстов. Известны аналоги Ц. з. в информатике, социологии и биологии (напр., распределение статей по данной тематике в разных изданиях, людей по доходам, родов по количеству видов и т. п.).

Лит.: . Ю. А. Шрейдер.

1
Оглавление
email@scask.ru