§ 8. Восстановление плотности методом Парзена
Идея метода Парзена восстановления плотности состоит в следующем. Справедливо тождество
Рассмотрим некоторую параметрическую последовательность функций, сходящуюся к 6 (я):
Такая последовательность существует. Например, она может быть следующей:
Для всякой непрерывной плотности существует такая величина что замена в подынтегральном выражении на функцию К мало повлияет на результат, т. е.
Заменим теперь математическое ожидание величиной среднего по выборке. При достаточно большом объеме выборки это также мало повлияет на результат
Выражение в правой части и используется как формула для оценки плотности:
Проблема же состоит в том, чтобы установить:
1) Каким должен быть закон образования величины чтобы с ростом объема выборки оценка стремилась к истинной плотности вероятностей?
2) Как выбирать константу если объем выборки ограничен?
Ответа на второй вопрос нет. Что же касается асимптотических свойств метода, то в 1962 г. Парзен, а в 1965 г. Надарая получили условия, обеспечивающие сходимость оценки (9.77) к искомой равномерно непрерывной плотности. Оказывается, для сходимости в метрике С последовательности (9.77) по вероятности к искомой плотности достаточно, чтобы
(результат Парзена), а для сходимости с вероятностью единица достаточно, чтобы при любом положительном сходился ряд
(результат Надарая).
Заметим, что требования (9.78), (9.79) к выбору констант оказались тождественными требованиям (9.75), (9.76) к выбору констант регуляризации при решении некорректной задачи (9.70). А это означает, что, обойдя постановку некорректной задачи, по существу, не удается избежать трудностей, связанных с ее решением.