Глава 3. ПРОВЕРКА ГИПОТЕЗ
Цель распознавания образов состоит в том, чтобы определить, к какому классу принадлежит данный объект. В процессе наблюдения или измерения получают множество чисел, которые составляют вектор наблюдений. Этот вектор служит входом решающего правила, с помощью которого может быть отнесон к одному из заданных классов.
Предположим, что вектор наблюдений представляет собой случайный вектор с условной плотностью вероятности, зависящей от принадлежности этого вектора к определенному классу. Если условная плотность вероятности известна для каждого класса, то задача распознавания образов становится задачей статистической проверки гипотез.
§ 3.1. Проверка простых гипотез
В этом параграфе мы рассмотрим задачу проверки гипотез для случая двух альтернатив. Такая задача возникает, когда множество классов, к которым может принадлежать данный объект, состоит лишь из двух классов Условные плотности вероятности и априорные вероятности предполагаются известными.
3.1.1. Байесовское решающее правило, минимизирующее ошибку решения.
Пусть X — вектор наблюдений и задача заключается в том, чтобы определить его принадлежность классу или Решающее правило, основанное непосредственно на вероятностях, можно записать следующим образом:
Апостериорные вероятности можно вычислить с помощью теоремы Байеса по априорным вероятностями
ловным плотностям т. е.
Так как в обе части неравенства (3.1) входит одна и та же плотность вероятности то решающее правило (3.1) можно записать в виде
или
Величину называют отношением правдоподобия. Это от пошение является основной величиной, используемой в теории проверки гипотез. Величину называют пороговым значением отношения правдоподобия для данного решающего правила. Иногда вместо отношения правдоподобия удобно использовать величину . В этом случае решающее правило (3.4) примет вид
Направление неравенства изменилось, потому что использовалось отрицательное значение логарифма. Уравнения (3.4), или (3.5), называют байесовским критерием, минимизирующим ошибку решения.
Обычно решающее правило (3.5) или любое другое решающее правило не обеспечивает безошибочпой классификации. Поэтому для того, чтобы оценить качество решающего правила, необходимо вычислить вероятность ошибки, т. е. вероятность того, что объект ошибочно относится к данному классу.
Определим области и так, что если Тогда, если то объект X будем относить к классу Вероятность ошибки решения можно вычислить следующим образом:
Если объект принадлежит классу то ошибочное решение имеет место, когда Аналогично, если объект принадлежит классу то ошибочное решение имеет место, когда .
Таким образом, вероятность ошибки
Следует различать два типа ошибок: одни появляются как результат неправильной классификации объектов класса а другие возникают из-за неправильной классификации объектов класса Общая ошибка определяется как взвешепная сумма этих ошибок.
Как будет показано в следующем параграфе, вычисление вероятности ошибочного решения сводится по существу к интегрированию плотности распределения вероятностей в -мерном пространстве. Иногда удобнее интегрировать плотность вероятности отношения правдоподобия которая является одномерной. Интегралы, которые вычисляются в этом случае, имоют вид
Нижний предел интегрирования в (3.8) равен нулю, поскольку отношение правдоподобия всегда положительно.
Пример 3.1. Если — нормальная случайная величина с вектором математического ожидания и ковариационной матрицей то решающее правило (3.5) приобретает вид
Уравнепие (3.10) показывает, что решающая грапица является квадратичной формой относительно вектора X. В случае равных ковариационных матриц граница
становится линейной функцией относительно вектора
На рис. 3.1 показаны двумерные примеры для случая, когда
Рис. 3.1. Решающие границы для нормальных распределений. а)