§ 2. Асимптотические свойства энтропии
Энтропия системы событий
относительно выборки
обладает рядом свойств, аналогичных
свойствам энтропии
-членных
цепочек, рассматриваемых в теории информации. В этом параграфе будет
сформулировано и доказано несколько утверждений относительно асимптотического
поведения и оценок энтропии, которые понадобятся при выводе необходимых и
достаточных условий равномерной сходимости.
Лемма 1. Последовательность
имеет при
предел с
.
Приводимое доказательство
совпадает с доказательством аналогичного утверждения для энтропии
-членных цепочек в
теории информации [66].
Доказательство. В самом деле,
поскольку
, то
существует нижний предел
.
Тогда для любого
найдется
такое, что
. (11.6)
Произвольное
представим
в виде
,
где
и
.
Далее, в силу (11.2), (11.4) и
(11.5)
.
Поэтому
.
Воспользовавшись
теперь условием (11.6), получим
.
Далее,
поскольку при
также
и
, имеем
и
ввиду произвольности
.
Лемма доказана.
В теории информации величину
называют энтропией
на символ. Сохраним этот термин и для величины
. Несмещенной оценкой этой
величины служит случайная величина
.
Покажем, что эта случайная
величина стремится по вероятности при
к тому же пределу, что и
(аналогичное
утверждение для эргодических источников доказывается и в теории информации, но
на этот раз доказательства различны).
Лемма 2. Пусть
, тогда
сходится
к
по
вероятности, т. е.
.
Более
того, если обозначить
,
,
то
.
Доказательство. Оценим
сначала
.
Поскольку
,
найдется
такое, что
.
Рассмотрим случайную
последовательность
.
Таким
образом,
есть
среднее арифметическое случайной величины
, полученное в серии независимых
испытаний длины
.
Математическое ожидание
равно
, поэтому математическое
ожидание
также
равно
;
случайная величина
ограничена
и потому
обладает центральными моментами любого порядка. Пусть
и
– ее центральные моменты
соответственно второго и четвертого порядка. Очевидно, что
и
меньше 1. Тогда центральный
момент четвертого порядка величины
есть
.
Применяя неравенство Чебышева для
моментов четвертого порядка, получим при любом
.
Далее,
в силу (11.3)
,
т.
е.
.
Поэтому,
тем более,
.
Полагая
и учитывая,
что
,
получим
, (11.7)
где
через
обозначено
.
Наконец, для произвольного
положим
, где
, а
.
В силу (11.2)
.
Поэтому
.
Усиливая
неравенство, получим
. (11.8)
Предположим,
что
настолько
велико, что
.
Тогда
из (11.7) и (11.8) следует, что
. (11.9)
Поскольку
при
имеет
место
, то
.
Кроме
того,
.
Действительно,
достаточно оценить сумму, начиная с достаточно больших
, для которых выполняется
(11.9). Тогда
.
Остается
показать, что
при
. Пусть
таково, что для всех
.
Из свойств математического ожидания
и того факта, что
есть
математическое ожидание
, имеем
.
Обозначая
первую часть равенства
, а вторую
и полагая
, получим
. (11.10)
Далее,
пусть
–
произвольное число. Тогда
или,
иначе,
. (11.11)
Объединяя
(11.10) и (11.11), имеем
.
Переходя
к пределу при
,
и,
поскольку
произвольно,
а
,
.
Лемма доказана.
Замечание 1. В отличие от
последовательности
,
которая
в силу результата § 4 главы X при
стремится либо к нулю, либо к единице,
последовательность
может
стремится к любому пределу с
.
Например, пусть
– сегмент
. В качестве системы
рассмотрим все
измеримые множества
,
которые включаются в сегмент
. Распределение
положим равномерным. Тогда на
последовательности
(без
повторов) будут индуцироваться множествами
те и только те подпоследовательности,
которые целиком укладываются в сегмент
. Значит, их число равно
,
где
– число
элементов последовательности, принадлежащих
. При этом
и,
следовательно,
.
Заметим, однако, что поскольку
всегда
,
то
предел
может
быть отличен от нуля только в том случае, когда
или,
что то же самое,
.
Замечание 2. Значение функции
при любом
служит оценкой сверху
для величины
,
т.е.
.
Доказательство
этого утверждения аналогично доказательству леммы 1.
Отсюда следует, что если
, то
,
т.
е. индекс
равен
с вероятностью
1.