§ 5. Упорядочение классов решающих правил
Последнее замечание предыдущего
параграфа можно записать следующим образом. Пусть – множество всех возможных задач. Тогда
из этого множества может быть выделена система вложенных подмножеств
(6.1)
такая,
что вероятность встретить
задачу из образует
систему неравенств
. (6.2)
Суть
замечания состоит в том, что при переходе от к количество задач должно резко
возрастать, в то время как величины
монотонно
уменьшаются.
Задание системы вложенных
множеств (6.1) и вероятностей (6.2) составляют априорные сведения о тех
задачах, которые предстоит решать.
Огрубление байесовой стратегии
обучения мы начнем с того, что будем использовать априорную информацию,
заданную не двумя условиями (6.1) и (6.2), а одним условием (6.1), полагая, что
уменьшаются.
Особенностью байесовой стратегии является то, что она с большим весом учитывает
гипотезы, априори более вероятные. Поэтому, учитывая, что монотонно уменьшаются,
следующую стратегию можно понимать как некоторую квазибайесову стратегию.
К обучающей последовательности
применяется сначала алгоритм, рассчитанный на задачи из класса . Только в том случае,
если он дает неудовлетворительные результаты, применяется алгоритм,
рассчитанный на задачи из класса , и т. д.
Назовем такую стратегию методом
упорядоченной минимизации риска.
Схема реализации этого метода
такова. В классе решающих правил вводится упорядочение, т. е. строится
система вложенных множеств
.
Затем
в классе ищется правило, минимизирующее эмпирический риск. Если найденное
решающее правило оценивается как неудовлетворительное, то ищется правило,
минимизирующее эмпирический риск в классе , и т. д. Процедура поиска оканчивается,
когда будет найдено удовлетворительное решающее правило.
Заметим, что решения, полученные
методом упорядоченной минимизации риска, вообще говоря, отличаются от решений,
полученных методом минимизации эмпирического риска.
В первом случае выбирается
правило, минимизирующее эмпирический риск лишь в классе функций , в то время как во
втором случае правило минимизирует эмпирический риск в .
Метод упорядоченной минимизации
риска удобно рассматривать как двухуровневую процедуру обучения. На первом
уровне к обучающей последовательности применяется алгоритмов , каждый из которых выбирает решающее
правило, минимизирующее эмпирический риск в классах . На втором уровне из отобранных решающих
правил выбирается то, которое минимизирует заданный критерий выбора.
Для конструктивного задания
алгоритмов метода упорядоченной минимизации риска необходимо определить:
1.
Каков критерий выбора решающего правила (т. е. задать алгоритм второго уровня).
2.
Как вводить упорядочение класса решающих правил .
Теория метода упорядоченной
минимизации риска должна ответить на вопрос, какова эффективность метода
(например, по сравнению с методом минимизации эмпирического риска).