Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
ГЛАВА 2. ОТБОР И УПОРЯДОЧЕНИЕ ПРИЗНАКОВ2.1. Отбор и упорядочение признаков (теоретико-информационный подход)Как указывалось в § 1.1, отбор признаков является важной задачей в распознавании образов, существенно связанной с качеством классификации. Кроме того, в системах последовательного распознавания образов при последовательных измерениях важное значение имеет упорядочение признаков. Цель упорядочения признаков заключается в том, чтобы при следующих друг за другом шагах последовательного процесса классификации для каждого следующего измерения избирался наиболее «информативный» признак, и тем самым процесс мог быть завершен раньше. Задачу упорядочения признаков можно рассматривать как задачу отбора признаков, если на каждом шаге последовательного процесса классификации отбираемое подмножество признаков содержит лишь один признак. Оценка «добротности» признаков может быть сделана с точки зрения теории информации. В качестве критерия «добротности» признака предлагались как расхождение, так и средняя информация о классах образов, определяемых признаками Концепция расхождения тесно связана с мощностью критерия различения между двумя классами образов с гауссовым распределением вектора признаков X, Использование меры информации и расхождения в качестве критерия для отбора признаков или их упорядочения также подразумевается при сравнении средних рисков, когда для классификации используется байесово решающее правило. Люисом [I] в качестве критерия для отбора и упорядочения признаков была предложена функция в виде энтропии или средней информации. Положим, что каждый признак Для выбора (1) Если (2) Если (3) Процент правильного распознавания при использовании Так как никакая статистика в виде одного числа в общем случае не удовлетворяет (2) или (3), то предполагается некая статистика, удовлетворяющая (2) и (3) не во всех ситуациях, но в достаточно широком диапазоне ситуаций. Требование, чтобы
Логарифмическая функция выбрана, чтобы удовлетворить требованию (2) аддитивности
Таким образом,
Согласно Применение расхождения в качестве критерия для отбора признаков и их упорядочения предложили Мэрилл и Грин [2]. Пусть для
Пусть отношение правдоподобия равно
и пусть
Подставляя (2.4) в (2.6), получим
и
Согласно [3] определим расхождение между
Тогда из (2.8) и (2.9)
Из (2.10) следует, что если К равно единичной матрице между и
или
Вероятность ложного распознавания
Из (2.7), (2.8) и (2.10) следует, что
Пусть
Тогда
Из (2.14) видно, что Для числа классов образов, большего двух, критерий максимизации минимума расхождения или среднего расхождения между любыми двумя классами был предложен для задач обнаружения сигнала и распознавания образов
Для распределений, данных в (2.4),
Пусть
Тогда
следовательно,
Ближайшая верхняя граница
Как показывает (2.20), эту границу можно достигнуть, беря различные комбинации признаков из данного множества признаков или путем постепенного увеличения числа признаков При применении п. к. о. в. или о. п. к. о. в. знание, какие классы образов обладают большей вероятностью быть истинными (на входе системы распознавания), используется для определения «добротности» признаков. Пусть
Так как
то (2.21) можно записать в виде
Следует отметить, что
Другой подход для отбора признаков и их упорядочения, основанный на обратном программировании, будет рассмотрен в главе 4.
|
1 |
Оглавление
|