Основные утверждения главы 1
1. Одной из центральных задач прикладной статистики является задача минимизации среднего риска по эмпирическим данным: требуется минимизировать функционал
если плотность распределения вероятностей неизвестна, но задана функция потерь и случайная независимая выборка
полученная согласно плотности
2. Постановка задач обучения распознаванию образов, восстановления регрессии, интерпретации результатов косвенных экспериментов сводится к схеме минимизации среднего риска по эмпирическим данным: требуется минимизировать функционал
используя выборку
В задаче обучения распознаванию образов у — со — число, которое может принимать только два значения — нуль и единица, некоторое параметрическое множество характеристических функций.
В задаче восстановления регрессии у — действительное число, некоторое параметрическое множество интегрируемых с квадратом функций.
В задаче интерпретации результатов косвенных экспериментов у — число, некоторое параметрическое множество непрерывных функций, которые связаны со своими прообразами соотношением
Задача решения операторного уравнения
может быть некорректно поставленной.
3. Отыскать точный минимум функционала по эмпирическим данным, вообще говоря, невозможно. Можно лишь найти функцию, доставляющую функционалу значение, близкое к минимальному. Такое решение может быть найдено не наверное, а лишь с определенной вероятностью.
В соответствии с содержательными постановками задач рассматриваются различные понятия близости функций.
— В задаче обучения распознаванию образов две функции считаются близкими, если близки соответствующие величины функционалов.
— В задачах восстановления регрессии и интерпретации результатов косвенных экспериментов приняты два определения близости функций: близость в метрике и в метрике С.
4. Приближенные методы минимизации функционала обеспечивают отыскание решений, близких к искомому, в задаче обучения распознаванию образов. В задаче восстановления регрессии близость к минимальному значению функционала гарантирует близость функции к искомой лишь в смысле метрики В метрике С функции могут не быть близкими. Наконец, в задачах интерпретации результатов косвенных экспериментов прообраз а функции а, доставляющей функционалу значение, близкое к минимальному, вообще говоря, не является близким к решению операторного уравнения ни в метрике ни в метрике С.
5. Предлагается решать задачу восстановления зависимостей методом минимизации функционала а в тех случаях, когда близость функционала к минимуму не гарантирует близости функции к искомой, найти дополнительные условия, при которых возможна такая гарантия.