Глава VIII. НЕСКОЛЬКО ОБЩИХ ЗАМЕЧАНИЙ
§ 1. Еще раз о постановке задачи
Почему же задача обучения
распознаванию образов вот уже более пятнадцати лет вызывает такой большой
интерес у ученых различных специальностей? Конечно, отвечая на вопрос, можно
было бы сослаться на ту пользу, которая может быть достигнута при использовании
идей и методов распознавания.
Однако основная притягательная
сила задачи обучения распознаванию образов не в этом. Вот уже более пятнадцати
лет ученые пытаются понять, какую же задачу они решают. Иногда удается
нарисовать общую, а потому поверхностную схему, в которую укладывается
постановка задачи распознавания образов, например такую, какая проводится в
данной книге. При несколько прямолинейном взгляде на мир можно утверждать, что
задача обучения распознаванию образов является примитивной задачей о
минимизации среднего риска. Примитивной потому, что решающие правила, среди которых
отыскивается нужное,– просто характеристические функции. Более того, это,
возможно, просто линейные дискриминантные функции.
Если стать на традиционную в
математике точку зрения о том, что задание класса функций, в котором ищется
нужная функция, является внешним моментом в постановке задачи, то задача
обучения распознаванию образов есть частный случай задачи о минимизации
среднего риска. Правда, оказалось, что для решения такой частной задачи
соответствующая математическая теория была недостаточно развита. Поэтому в
связи с задачей обучения распознаванию образов были проведены исследования некоторых
вопросов теории вероятностей и математической статистики, таких как теория
стохастической аппроксимации, теория равномерной сходимости частот появления событий
к их вероятностям. Однако необходимость в развитии этих вопросов могла
появиться и сама по себе, а вовсе не в связи с задачей распознавания образов.
Что же нового ищут в задаче
обучения распознаванию образов исследователи? Какую специфику они пытаются
вложить в формализацию понятия обучения?
Вероятно, в разное время
основными в исследовании обучения оказывались разные аспекты этой проблемы.
Всего 15–17 лет назад во времена первых работ Розенблатта обучение казалось
таинственным феноменом, присущим живым существам, и методика работ по
исследованию обучения напоминала нынешние работы по бионике; считалось, что
надо подсмотреть у живых существ технологию обучения и перенести ее, как
алгоритмы, на ЭВМ.
Затем была поставлена задача
обучения распознаванию образов как задача минимизации риска. Следствием такой
постановки оказалось появление огромного количества алгоритмов, поток которых и
в настоящее время все еще достаточно широк. Однако вскоре удалось установить
одну и ту же природу этих алгоритмов обучения (связанную либо с идеей
стохастической аппроксимации, либо с идеей минимизации эмпирического риска).
Такая общность в природе алгоритмов немедленно была связана с мыслью о
появлении кризиса идей в теории распознавания.
Как же понимается задача об обучении
распознаванию образов сейчас? В чем специфика постановки задачи, в чем ее
отличие от общей задачи минимизации риска? Очевидно, что вся специфика задачи
обучения распознаванию образов должна проистекать из того, что класс решающих
правил чрезвычайно прост. Применительно к такому простому классу решающих
правил надо найти тонкие свойства методов минимизации риска, такие свойства,
которые присущи только этому классу и никак не являются общими свойствами
методов минимизации риска. В этом смысле единственная глава, которая была
посвящена обучению распознаванию образов,– это глава VI.
К сожалению, в настоящее время
еще не найдена такая постановка задачи, которая в рамках классической теории
минимизации среднего риска определила бы специфику задачи обучения. Таким
образом, оказалось, что содержание книги отражает в большей части не то, что
составляет сейчас предмет исследования, а скорее то, где этот предмет должен
находиться. Тем не менее можно попытаться описать тот круг вопросов, который,
очевидно, должен составлять специфику задач обучения.