ЦИПФА ЗАКОН
— закономерность распределения слов в тексте вида

, где

количество появлений

слова в тексте. К этому надо добавить условие, что миним. значение

равно единице и количество слов с минимальным значением

пропорционально общему количеству слов в тексте. Нормальное значение параметра

а величина С определяется из условия

где N — количество слов в тексте. Параметр

наз. рангом слова в тексте.
Известные попытки теоретического объяснения Ц. з. основаны на том, что величины
интерпретируются как проявление некоторых вероятностей, имеющих силу для однородного ансамбля текстов. Существует несколько схем такого вывода: на основе «компромисса» между говорящим и слушающим, из соображений миним. стоимости оптимального кода, из термодинамических соображений наиболее вероятного распределения при данной суммарной «сложности» текста.
Ц. з. отражает не статистические свойства ансамблей (и тем более не языка в целом), а выражает некие фундаментальные свойства замкнутых связных текстов. На таких текстах Ц. з. выполняется гораздо лучше, чем на больших однородных совокупностях текстов. Известны аналоги Ц. з. в информатике, социологии и биологии (напр., распределение статей по данной тематике в разных изданиях, людей по доходам, родов по количеству видов и т. п.).
Лит.:
. Ю. А. Шрейдер.