Главная > Теория распознавания образов (статистические проблемы обучения)
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 4. Доказательство необходимости условий равномерной сходимости

Пусть теперь

.

В силу основной леммы (§ 5, гл. X), если только

,                   (11.14)

то и

.

Таким образом, достаточно показать справедливость (11.14) при некотором .

1. Рассмотрим сначала для пояснения общего доказательства частный случай, когда

.

В этом случае, как было указано в замечании 2 § 2,

и, поскольку  есть математическое ожидание величины

,

то

.

Следовательно, для всякого  с вероятностью 1

,

т. е. с вероятностью 1 всякая выборка такова, что на ней индуцируются системой  все возможные подвыборки. В частности, для выборки  можно найти такое , что  для  и  для . Тогда ,  и, следовательно, с вероятностью 1

.

Тогда и подавно для всех

.

Идея доказательства утверждения б) в общем случае основана на том, что при

почти из всякой выборки длины  можно выделить подвыборку, на которой индуцированы все подвыборки и длина которой растет пропорционально .

2. Для этого нам понадобится следующая

Лемма 3. Если при некотором   и  для некоторой выборки  оказывается, что

,

то найдется подвыборка

длины , где  ( – основание натуральных логарифмов), такая, что

.

Доказательство. В силу леммы § 4 главы X требуемая подвыборка заведомо существует, если

.

Чтобы убедиться в последнем, достаточно проверить неравенство

.             (11.15)

Поскольку при наших условиях  и , то можно воспользоваться оценкой функции , полученной в замечании 1 § 4 главы X:

.

В свою очередь это неравенство можно усилить, применяя формулу Стирлинга:

.

Нетрудно убедиться, что функция  монотонно возрастает по  при . Следовательно, справедливо также неравенство

,

так как

.

Поэтому отношение (11.15) будет установлено, если справедливо неравенство

.

Логарифмированием и сокращением на  это неравенство преобразуется к следующему виду:

.                        (11.16)

При  справедливо неравенство

.

Оно непосредственно следует из того, что функция  достигает максимума в точке  и равна при этом . Поэтому (11.16) следует из неравенства

.

Подставляя сюда значение , непосредственно убеждаемся в справедливости выражения

.

Лемма доказана.

Напомним, что, согласно лемме 2 § 2, при

оказывается, что с ростом

стремится к единице . Следовательно, при достаточно больших  с вероятностью, сколь угодно близкой к единице,

                      (11.17)

и, согласно только что доказанной лемме, в каждой выборке, удовлетворяющей условию (11.17), найдется подвыборка длины

,

на которой система  индуцирует все подвыборки. Длина этой подвыборки возрастает пропорционально .

3. Схема доказательства (утверждения б)). Сравнение частот выпадения событий в двух полувыборках может вестись следующим образом: берется выборка длины  и случайным образом делится на две полувыборки равной длины, после чего подсчитывается и сравнивается число появления каждого события класса  на первой и второй полувыборках.

Рассмотрим несколько измененную схему. Допустим, что выборка двойной длины  удовлетворяет условию (11.17), т. е.

.

Тогда в ней можно указать подвыборку  длины

,

на которой индуцированы все подвыборки. Теперь разделим случайно на две полувыборки сначала подвыборку , а затем (независимо) остаток . Пусть  и  – две полувыборки, на которые распалась . По построению найдется событие  такое, что все элементы  принадлежат , а все элементы  не принадлежат . Для этого события «разбаланс» частот достигает наибольшего значения. Допустим, что в оставшейся части последовательности элементы из  встречаются  раз. При случайном разбиении остатка примерно  из них попадет в первую полувыборку и столько же во вторую. Тогда

и, следовательно,

.

Поскольку число  не зависит от длины выборки, то равномерной сходимости нет.

Измененная схема не вполне эквивалентна исходной, так как в действительности подвыборка  и остаток не обязательно делятся точно пополам при делении полной выборки , но при достаточно больших  (а значит, и ) это условие почти всегда выполняется достаточно точно. Приводимое дальше формальное доказательство позволяет строго учесть все сделанные здесь допущения и приближения.

4. Доказательство утверждения б). Итак, пусть

.

При доказательстве достаточных условий (§ 6 главы X) было установлено, что

,                       (11.18)

где  – всевозможные перестановки последовательности . Обозначив через  подынтегральное выражение, сократим область интегрирования:

.

Оценим величину , полагая, что

,

т.е.

.

При этом выберем  так, чтобы в соответствии с леммой 3 при достаточно больших  существовала подвыборка  длины , на которой система  индуцирует все возможные подвыборки (т. е. ), и положим . Примем, что , и заметим, что числа  и  не зависят от .

Сгруппируем перестановки  так, что в каждую группу  входят перестановки, соответствующие одному и тому же разбиению на первую и вторую полувыборку. Очевидно, что

зависит только от  и в пределах каждой группы постоянна. Поэтому

.

Сумма берется по всем возможным разбиениям  на первую и вторую полувыборки.

Пусть, далее,  – та самая подвыборка длины , на которой  индуцирует все возможные подвыборки. Обозначим ее дополнение в  через  (длина  равна ).

Разбиение  будет полностью задано, если заданы разбиение  подвыборки  на часть, попадающую в первую полувыборку, и часть, попадающую во вторую полувыборку, и соответствующие разбиение  подвыборки .

Обозначим для данного разбиения число элементов из , попадающее в первую полувыборку, через  и представим  в следующей форме:

.

Здесь суммирование по  ведется в пределах . Суммирование по  ведется по всем разбиениям  таким, что к первой полувыборке относится точно  элементов из , суммирование по  – по всем разбиениям  таким, что к первой полувыборке относится  элементов из .

Для фиксированного , т. е. разбиения подвыборки , найдется такое , что все элементы , относимые этим разбиением к первой полувыборке, принадлежат , а все элементы , отнесенные ко второй полувыборке, не принадлежат . Это следует из того, что  индуцирует на  все подвыборки. При этом

и, следовательно,

.

Пусть, далее,  – число элементов подвыборки , принадлежащих , и  – число элементов подвыборки , принадлежащих  и отнесенных разбиением  к первой полувыборке. Тогда для фиксированных , ,

,

,

.

Соответственно

Наконец, сгруппируем разбиения , соответствующие одному и тому же  (при фиксированных  и ). Число таких разбиений равно

.

Тогда оценка для  примет вид

.

После элементарных преобразований получим

,                   (11.19)

где суммирование по  ведется в пределах, задаваемых выражением

.                    (11.20)

Положим теперь  и рассмотрим величину , отличающуюся от правой части (11.19) лишь иными пределами суммирования,

,

где  и  пробегают значения, удовлетворяющие следующим неравенствам:

,                (11.21)

.            (11.22)

При  и , удовлетворяющих (11.21) и (11.22), автоматически выполняется (11.20). Действительно, при этом

.

Поскольку было принято, что , , ,

то

.

Так как область суммирования в выражении для  вкладывается в область суммирования (11.19), то

.

Далее, для всякого  найдется , зависящее только от  и , такое, что для всех

             (11.23)

(суммирование ведется по , удовлетворяющим (11.21)) и

                     (11.24)

(суммирование ведется по , удовлетворяющим (11.22)).

Действительно,

есть вероятность вынуть  черных шаров из урны, содержащей  черных и  белых шаров, когда вынимается случайно  шаров без возвращения. При этом математическое ожидание числа черных шаров в выборке равно  и правая часть формулы (11.23) выражает вероятность того, что число черных шаров в выборке отклонится от математического ожидания более чем на . Поскольку для схемы без возвращения справедлив закон больших чисел, формула (11.23) верна, начиная с достаточно больших .

Аналогично

есть вероятность вынуть  черных шаров из урны, содержащей  черных и  белых шаров, когда вынимается  шаров, опять-таки без возвращения. Математическое ожидание черных шаров в выборке равно

и, следовательно, формула (11.24) выражает закон больших чисел в этом случае.

Тогда, учитывая что число разбиений  подвыборки  для фиксированного  равно , получим при

.

Окончательно для  и

.

Поскольку, согласно лемме 2,

,

имеем

.

Ввиду произвольной малости

.

Теорема доказана.

1
Оглавление
email@scask.ru