§ 4. Два механизма минимизации среднего риска
В этом параграфе мы будем полагать, что нам известна абсолютная оценка величины возможных потерь
Наша цель состоит в том, чтобы по случайной независимой выборке
сконструировать такой эмпирический функционал
точка минимума которого с заданной вероятностью доставляет функционалу среднего риска
значение, близкое к минимальному.
Существует «естественный» способ построения такого эмпирического функционала. Надо восстановить по выборке (2.19) плотность распределения вероятностей а затем подставить в (2.20) восстановленную плотность вместо
Полученный таким образом функционал не зависит от неизвестной плотности и принципиально может быть минимизирован.
Казалось бы, проблема минимизации среднего риска по эмпирическим данным сводится к восстановлению плотности распределения вероятностей. Задача же восстановления по случайной независимой выборке плотности распределения вероятностей является центральной в матемц
тической статистике, и, таким образом, решение одной из частных проблем статистики — минимизация среднего риска по эмпирическим данным — ставится в зависимость от решения ее центральной проблемы.
В следующем параграфе мы подробно рассмотрим постановку задачи о восстановлении плотности распределения вероятностей, цель же этого параграфа — установить, что существуют два различных механизма, позволяющих решать задачу минимизации среднего риска по эмпирическим данным. Один из этих механизмов действительно опирается на то, что восстанавливаемая плотность приближается к истинной, в то время как другой механизм имеет совершенно иную теоретическую основу.
Итак, пусть Рассмотрим два типа эмпирических функционалов: эмпирический функционал типа
где эмпирическая плотность, восстановленная по выборке и эмпирический функционал
Эмпирический функционал (2.22) принято называть функционалом эмпирического риска.
Формально функционал эмпирического риска является частным видом эмпирического функционала (2.21). В самом деле, если в качестве аппроксимирующей плотности в (2.21) использовать плотность
где
размерность вектора ), то при окажется, что Здесь использован факт
Однако имеет смысл выделять функционал (2.22), так как успех в минимизации среднего риска путем
минимизации функционалов (2.21) и (2.22) может определяться разными причинами. В первом случае успех может быть обеспечен за счет близости восстановленной плотности к истинной, тогда как во втором случае плотность при малых не приближается к и тем не менее возможны условия, когда точка минимума функционала эмпирического риска доставляет функционалу (2.20) значение, близкое к минимальному.
Действительно, пусть плотность близка к т. е.
и пусть минимум эмпирического функционала достигается при а минимум среднего риска при Тогда справедлива цепочка неравенств
откуда следует близость минимумов функционалов (2.20) и (2.21).
Покажем теперь, что аппроксимирующая плотность (2.23) при не приближается к истинной. Пусть ограниченная функция. Разобьем множество на два подмножества: множество малой меры, содержащее все элементы выборки, и множество
Нетрудно проверить, что для достаточно малого 8 может быть выбрано такое множество что
Таким образом, успех минимизации среднего риска (2.20) методом минимизации функционала эмпирического риска (2.22) определяется не близостью плотностей, как в первом случае, а иным механизмом. Ниже в § 6 мы покажем, что этот механизм опирается на свойство равномерной сходимости эмпирических средних к математическим ожиданиям по некоторому множеству событий.