Глава 4. КЛАССИФИКАЦИЯ ОБРАЗОВ С ПОМОЩЬЮ ФУНКЦИЙ ПРАВДОПОДОБИЯ
4.1. ВВЕДЕНИЕ
В этой главе мы приступаем к рассмотрению статистического подхода к распознаванию образов. Как явствует из названия, этот подход предусматривает построение классификации, исходя из статистических свойств классов образов.
Как и в других областях, связанных с регистрацией и интерпретацией физических явлений, статистический анализ начинает играть важную роль в распознавании в тех случаях, когда случайные факторы оказывают влияние на порождение образов, относящихся к различным классам. Рассмотрим, например, задачу разделения электрокардиограмм (ЭКГ) на два класса — нормальные и анормальные. Выборки образов, представляющие эти два класса, формируются из ЭКГ, квалифицированных врачом как нормальные и анормальные. Очевидно, что соответствующие выборки будут характеризоваться некоторым статистическим распределением, так как, в частности, ЭКГ, отнесенные к группе нормальных, будут отличаться существенной изменчивостью (случайностью). Последняя вызывается различием физических данных отдельных пациентов, электрическими помехами, влияющими на работу записывающих устройств, и дюжиной других переменных факторов, всегда присутствующих в биологических экспериментах.
Эта глава знакомит читателя с постановкой задач распознавания образов в рамках статистической теории. При помощи статистического анализа представляется возможным построить классификационное правило, являющееся оптимальным в том смысле, что его использование обеспечивает в среднем наименьшую вероятность совершения ошибки классификации. Это классификационное правило, оптимальное в статистическом смысле, обычно принимается в качестве стандартов, с которым часто сравнивается качество других алгоритмов классификации.