§ 8. Оценка уклонения эмпирически оптимального решающего правила
В главе X будет получена оценка
скорости равномерной сходимости. Оказывается, что
. (5.9)
Оценка имеет тот же вид, что и
для конечной системы событий, но вместо числа событий
в правой части неравенства
стоит функция роста. Таким образом, функция роста служит мерой разнообразия
класса событий.
Если емкость класса бесконечна
, оценка (5.9) тривиальна,
так как правая часть неравенства больше единицы при всех
.
Если же емкость
конечна, оценка
приобретает вид
. (5.10)
Правая часть неравенства
стремится к нулю при
и притом тем быстрее, чем меньше
. Можно потребовать,
чтобы вероятность
не
превышала заданное значение
.
Это во всяком случае произойдет,
если
.
Это равенство можно разрешить
относительно
.
Таким образом, справедливо утверждение: с вероятностью, не превышающей
, максимальное по
классу
уклонение
частоты выпадения событий от вероятности не превосходит
. (5.11)
Отсюда, в силу сказанного в § 2,
непосредственно следует, что с вероятностью, превышающей
, качество эмпирически
оптимального решающего правила отличается от качества истинно оптимального не
более чем на
,
т. е.
,
где
– длина
обучающей выборки, а
– емкость класса решающих правил, из
которого осуществляется выбор. В частности, для линейных решающих правил в
пространстве размерности
.
Таким образом, при заданной длине
обучающей выборки качество решающего правила, выбранного алгоритмом, тем ближе
к наилучшему в классе, чем меньше емкость класса
. Но следует помнить, что качество
наилучшего в классе
решающего
правила, вообще говоря, напротив, тем выше, чем шире класс
.
Разрешая равенство (5.11)
относительно
,
можно оценить для фиксированной точности и надежности достаточную длину обучающей
последовательности (см. главу XIII). Оказывается, что качество эмпирически
оптимального решающего правила с вероятностью, превышающей
, отличается от наилучшего в
классе
не
более чем на
,
если только длина обучающей выборки достигает
. (5.12)
Следовательно, достаточная длина
выборки пропорциональна емкости класса решающих функций. В частности, для
линейных решающих функций в
-мерном спрямляющем пространстве
достаточная длина пропорциональна размерности
.