1.3. МОДЕЛЬ КЛАССИФИКАЦИИ
Рассмотренный пример содержит многие элементы наиболее распространенной абстрактной модели распознавания образов — модели классификации. Модель эта состоит из трех частей — датчика, выделителя признаков и классификатора. Датчик воспринимает воздействие и преобразует его к виду, удобному для машинной обработки. Выделитель признаков (называемый также рецептором,
фильтром свойств, детектором признаков или препроцессором) выделяет из входных данных предположительно относящуюся к делу информацию. Классификатор на основе этой информации относит эти данные к одной из нескольких категорий.
Обсуждение принципа действия или конструкции датчика не входит в задачи данной книги. Выделение признаков и классификация, напротив, представляет для нас интерес. С точки зрения теории провести черту между этими двумя действиями можно весьма условно. Идеальный выделитель признаков предельно упрощает работу классификатора, тогда как при наличии всемогущего классификатора не требуется помощь выделителя признаков. Различие это хотя и весьма важно, но делается оно, исходя скорее из практических, нежели теоретических соображений.
Вообще говоря, задача выделения признаков более специализирована по сравнению с задачей классификации. Хороший выделитель признаков, предназначенный для сортировки древесины, принесет, по-видимому, малую пользу при сравнении отпечатков пальцев или классификации клеток крови. Однако большое число технических приемов было развито в связи с задачей извлечения полезной информации из изображения. Часть II данной книги как раз посвящена описанию этих методов и их свойств.
Задача классификации по существу представляет собой задачу разбиения пространства признаков на области, по одной для каждого класса. Разбиение это в принципе надо производить так, чтобы не было ошибочных решений. Если этого сделать нельзя, то желательно уменьшить вероятность ошибки, или если ошибки имеют различную цену, то сделать минимальной среднюю цену ошибки. При этом задача классификации превращается в задачу статистической теории принятия решений, широко применяемую в различных областях теории распознавания образов. Этому и ряду других вопросов, относящихся к теории классификации, посвящена часть I данной книги.