Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 7. Три пути решения задачи о минимизации среднего риска
Существуют три традиционных пути решения задачи минимизации среднего риска. Первый путь связан с идеей
восстановления функции распределения вероятностей. Предположим, что наряду с
функцией распределения Зная эти функции, можно с помощью
формулы Байеса определить вероятность принадлежности вектора
В формуле (2.3)
– нормирующий множитель. Нетрудно понять, что минимальные
потери будут получены при такой классификации векторов, при которой вектор
(т. е. если более вероятно, что он принадлежит к первому классу, чем ко второму) и относится ко второму классу в противном случае. Иначе говоря, учитывая (2.3),
вектор
или, что то же самое, оптимальная классификация векторов производится с помощью характеристической функции
Такие
характеристические функции иногда называют дискриминантными. Таким образом,
знание плотностей условных распределений Первый путь заключается в том, чтобы сначала восстановить по выборке неизвестные функции распределения векторов первого и второго классов, а затем по восстановленным функциям распределения построить дискриминантную функцию. Однако следует заметить, что в этом случае решение сравнительно простой задачи – построение дискриминантной функции – подменяется решением значительно более сложной задачи – задачи о восстановлении функции распределения. Ведь восстанавливаемые функции распределения вероятностей составляют исчерпывающие сведения о классах векторов, в то время как нужная нам дискриминантная функция отражает только одну из характеристик взаимного расположения векторов различных классов. Поэтому, вообще говоря, решать
задачу обучения распознаванию образов, восстанавливая неизвестные функции
распределения вероятностей, нерационально. Исключения составляют случаи, когда
задачи о восстановлении многомерных функций распределений сильно вырождаются.
Например, когда функция распределения такова, что координаты вектора
В
этом случае задача о восстановлении двух
Второй путь связан с организацией
рекуррентной процедуры поиска параметра Если бы функция распределения
вероятностей
Процедура спуска представляла бы собой следующее правило:
где
Прямым обобщением градиентного
метода поиска минимума функции
где
вектор-функцию В (2.6) вектор
(эти
условия обеспечивают возможность, во-первых, подойти к точке минимума из сколь
угодно «далекой» точки пространства Теория таких итерационных методов
поиска минимума направлена на то, чтобы выяснить, каким условиям должны
подчиняться функция двух групп переменных Второй путь как раз и связан с
построением итерационной процедуры (2.6) для поиска минимума Наконец, третий путь связан с идеей замены неизвестного функционала
функцией
построенной
по случайной и независимой выборке Функция Идея метода состоит в том, чтобы
найти значение параметров Такой метод решения задачи
называется методом минимизации эмпирического риска. Теория метода минимизации
эмпирического риска призвана ответить на вопросы, когда (для каких функций Развитие методов обучения распознаванию образов пошло по всем трем путям минимизации среднего риска.
|
1 |
Оглавление
|