Главная > Прикладные методы анализа данных и знаний
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

§ 2. Статистические решающие правила

Будем считать, что распределения генеральных совокупностей всех  образов известны и подчиняются нормальному закону с одинаковыми и единичными матрицами ковариаций [5,21]. Поверхности равной плотности вероятностей в этом случае представляют собой гиперсферы одинакового для всех образов радиуса. Аналитически такие распределения описываются следующими уравнениями:

                       (1)

в одномерном случае и

         (2)

в многомерном случае.

Нормирующий коэффициент  выбирается таким образом, чтобы интеграл по всему -мерному евклидову пространству переменных  был равен единице. Положительная постоянная  в выражении (1) заменяется в (2) положительно определенной (симметрической) матрицей

Скалярная величина , и скалярная переменная  заменены соответственно векторами

Выполнение условий, наложенных на , приводит формулу (2)к виду

                (3)

Анализ этого выражения показывает, что  — математическое ожидание многомерного вектора , а  — матрица, обратная матрице ковариаций компонент этого вектора, т. е. , , где  — положительно определенная ковариационная матрица вектора .

Учитывая, что  — положительно определенная квадратичная форма и матрицы ковариаций всех           образов равны между собой, т. е. , получаем, что отношение вероятности  присутствия в точке  образа  к вероятности  присутствия в  образа  (отношение правдоподобия) имеет вид

Удобно пользоваться логарифмом отношения правдоподобия:

                (4)

В соответствии с критерием Байеса, если , то точка  принадлежит области образа , а если , то  считается относящейся к образу . Следовательно, оптимальная граница проходит по точкам, в которых . Уравнение (4) запишем в следующем виде:

                        (5)

Если параметры  независимы, то матрицы ковариаций  и обратные им матрицы  диагональны:

При этом уравнение (5) принимает вид

  (6)

Введя очевидные обозначения, получим уравнение (6) в форме, обычной для представления гиперплоскостей:

                  (7)

Теперь, подставив в уравнение (7) координаты контрольной точки , мы получим значение величины  и по ее знаку определим, по какую сторону от разделяющей границы находится точка  и, следовательно, какому из двух конкурирующих образов  или  она принадлежит.

Вид линейной решающей границы для двумерного случая показан на рис. 12, а. В многомерном пространстве разделяющая граница представляет собой гиперплоскость, которая перпендикулярна отрезку прямой, соединяющей математические ожидания, и делит этот отрезок пополам. Результат распознавания по описанному правилу будет точно таким же, если вычислить расстояния  от точки  до математических ожиданий  всех  образов и выбрать тот образ, расстояние до которого окажется наименьшим. Этот метод, известный под названием корреляционный [101], не требует хранения в памяти машины аналитического описания распределений образов или уравнения разделяющих гиперплоскостей. Достаточно помнить только координаты математических ожиданий образов.

Рис. 12

Если принять, что матрицы ковариаций разных образов не одинаковы, то поверхности равной плотности вероятности будут иметь вид эллипсоидов разной ориентации и размеров (см. рис. 12, б). Решающее правило при этом использует разделяющую поверхность второго порядка и имеет следующий вид:

           (8)

Считаем, что точка  с координатами  относится к -му образу, если .

Стратегия, при которой учитываются только апостериорные вероятности  и, называется стратегией идеального наблюдателя [158]. Реальный же наблюдатель в процессе принятия решений учитывает и другие факторы. В частности, если реализацию -го образа по ошибке отнести к -му образу, то это приведет к потерям . При ошибочном распознавании представителя -го образа в качестве реализации -го образа потери равны . Если эти потери не одинаковы, например, если , то выгоднее разделяющую границу сдвинуть в сторону центра -го образа (пунктирная линия на рис. 12, а). При этом суммарные потери меньше, чем при использовании стратегии идеального наблюдателя.

В середине 50-х годов у одного из наших туристов, вернувшихся из Индии, были обнаружены признаки заболевания чумой. Были приняты экстренные меры, направленные против распространения этого заболевания: изолированы на несколько дней и тщательно обследованы не только туристы данной группы, но также все их родственники, друзья и сослуживцы, с которыми успели повидаться эти туристы после поездки. Затраты на это мероприятие были немалыми, но они были несравненно меньшими по сравнению с затратами, которые потребовались бы для ликвидации возможного очага эпидемии чумы. Если бациллоносителей считать представителями образа , а здоровых людей — образа , то стоимость «пропуска цели»  гораздо больше стоимости «ложной тревоги» . В этом случае лучше обследовать лишнюю сотню здоровых людей (т. е. отнести их по ошибке к образу ), чем оставить незамеченным одного реального бациллоносителя из образа , отнеся его по ошибке к образу здоровых .

При прочих равных условиях целесообразно обращать внимание на априорную вероятность появления образа . Если, например, реализации образа  встречаются чаще, чем реализации образа , то для минимизации ошибок разделяющая поверхность должна быть сдвинута в сторону центра более редкого образа . Учет этих дополнительных соображений приводит уравнение решающего правила к следующему виду: реализация  относится к образу , если

                     (9)

Если это неравенство не выполняется, то контрольная реализация  считается принадлежащей образу .

 

Categories

1
Оглавление
email@scask.ru