ГЛАВА I. ЗАДАЧА ВОССТАНОВЛЕНИЯ ЗАВИСИМОСТЕЙ ПО ЭМПИРИЧЕСКИМ ДАННЫМ
§ 1. Проблема минимизации среднего риска по эмпирическим данным
Всякий раз, когда возникает проблема выбора функциональной зависимости, рассматривается одна и та же схема: среди множества возможных зависимостей необходимо найти такую, которая наилучшим образом удовлетворяет заданному критерию качества.
Формально это означает, что на векторном пространстве задан класс функций (класс возможных зависимостей) и определен функционал — критерий качества выбираемой зависимости
Требуется среди функций найти такую которая доставляет минимум функционалу (1.1) (будем полагать, что наилучшему качеству соответствует минимум функционала и что минимум (1.1) в существует).
В том случае, когда класс функций и функционал заданы явно, отыскание функции минимизирующей является предметом исследования вариационного исчисления.
В этой книге рассмотрен иной случай, когда на определена плотность распределения вероятностей а функционал задан как математическое ожидание
Проблема же состоит в том, чтобы минимизировать функционал (1.2), если плотность неизвестна, но зато дана выборка
полученная в результате случайных независимых испытаний согласно
Ниже в §§ 2, 3, 4 мы убедимся в том, что к минимизации функционала (1.2) по эмпирическим данным (1.3) сводятся все основные задачи восстановления функциональных зависимостей, а пока заметим, что проблемы, возникающие при минимизации функционала (1.1) и минимизации функционала (1.2) по эмпирическим данным (1.3), существенно различаются.
При минимизации функционала (1.1) проблема состоит в организации поиска в классе функции минимизирующей (1.1). При минимизации же функционала (1.2) по эмпирическим данным (1.3) основная проблема заключается не в организации поиска функции в а в формулировке конструктивного критерия, согласно которому должен проводиться выбор функции. (Сам функционал (1.2) не может служить критерием выбора, так как в нем плотность неизвестна.)
Таким образом, в первом случае ищется ответ на вопрос: «Как найти минимум функционала в заданном классе функций?», в то время как во втором: «Что следует минимизировать для того, чтобы выбрать в функцию, гарантирующую «малую» величину функционала (1.2)?»
Минимизация функционала (1.2) по эмпирическим данным (1.3) является задачей математической статистики. Назовем ее задачей минимизации среднего риска по эмпирическим данным.
При постановке задачи минимизации среднего риска будем класс функций задавать в параметрическом виде Здесь а — параметр, принадлежащий множеству конкретное значение которого определяет конкретную функцию а класса Найти нужную функцию в этом случае, значит установить нужное значение параметра а. Изучение лишь параметрического класса функций не является сколько-нибудь серьезным ограничением в постановке задачи, так как множество которому принадлежит параметр а, произвольно: оно может быть множеством скалярных величин, множеством векторов или множеством абстрактных элементов.
функциональной зависимости. Исследованию этой задачи и посвящена книга. В ней будут рассмотрены три основные задачи восстановления функциональных зависимостей:
— задача обучения распознаванию образов,
— задача восстановления регрессии,
— задача интерпретации результатов косвенных экспериментов.
В следующих параграфах мы убедимся, что все они сводятся к минимизации функционала (1.5) по эмпирическим данным (1.6).