§ 6. Две теоремы о равномерной сходимости
В этом параграфе мы докажем две из трех основных теорем, оценивающих скорость равномерной сходимости средних к математическим ожиданиям. Мы рассмотрим случай, когда множество функций
состоит из конечного числа элементов, и случай, когда множество функций может быть покрыто конечной
-сетью в метрике С или
При доказательстве обеих теорем будет существенно использован следующий факт: пусть некоторая функция
а такова, что для нее выполняется условие
Тогда, если ограничение (7.16) задается для моментов
то справедливо неравенство
где
Если ограничение (7.16) задается для
то справедливо неравенство
Заметим, что при
значение
в (7.17) близко к единице. Большое значение величина
принимает лишь, когда
близко к 2.
Эти оценки будут получены как следствие из теоремы 7.6, приведенной в § 7.
Теорема 7.4. Пусть выполнено условие (7.15), а класс функций
состоит из конечного числа
элементов.
Тогда, если в ограничении
то с вероятностью
одновременно для всех функций из класса
выполнятся неравенства
вела же
то с вероятностью
одновременно для всех функций
выполнятся неравенства
где
Доказательство. Пусть в условии
Воспользуемся неравенством
Оценим второй сомножитель правой части неравенства (7.22) с помощью (7.17). Получаем оценку
которая может быть записана в виде следующего эквивалентного утверждения: с вероятностью
одновременно для всех
справедливы неравенства
Первое утверждение теоремы доказано.
Аналогично для случая
следует воспользоваться оценкой (7.19), используя которую в правой части
неравенства (7.22) получим оценку скорости равномерной сходимости, которая в эквивалентной форме и является утверждением теоремы.
Теорема 7.5. Пусть выполнено условие (7.15), и пусть множество
может быть покрыто конечной
-сетью. Тогда с вероятностью
можно утверждать, что качество функции
доставляющей минимум эмпирическому риску, оценивается величиной
где обозначено:
ближайший к
элемент
-сети,
Замечание. Теорема 7.5 справедлива для любого 8, задающего
-сеть, выбранного априорно, т. е. до того, как реализовалась случайная выборка.
В частности, 8 может быть выбрано из условия минимума выражения
где с — некоторая константа. Разумно в качестве с выбирать величину, близкую к минимуму функционала
Априорная информация о величине
используется, таким образом, для выбора подходящей величины 8.
Доказательство этой теоремы, по существу, повторяет доказательство теоремы 7.2.
1°. Выберем произвольную
-сеть. При
согласно теореме 7.4, с вероятностью
одновременно для всех элементов
-сети выполнятся неравенства
2°. Согласно оценке (7.11), полученной при доказательстве теоремы 7.2, значения функционалов
для функций
отстоящих друг от друга в метрике С или
на величину, меньшую
уклонятся на величину, не превосходящую
3°. Будем различать два случая: случай, когда
и случай, когда
В первом случае из (7.23) и (7.24) следует, что с вероятностью
справедлива оценка
Во втором случае с вероятностью
оценка
4°. Разрешим неравенство (7.25) относительно
Учитывая (7.23), убеждаемся, что оценка (7.26) справедлива и в случае (7.25а).
Аналогично доказывается теорема и для
Замечание. Так же как и в теореме 7.2, оценка (7.26) будет меньше (меньше величина
если
-сеть строится в метрике
т. е. в случае, когда используется информация о плотности