Главная > Искусственный интеллект (Э. Хант)
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

4.1.1. Применение бейесовского правила в параллельной классификации образов

При применении бейесовского правила в параллельной классификации роль гипотез играют названия классов, а роль экспериментального наблюдения — описание классифицируемого объекта. Напомним, что каждый классифицируемый объект принадлежит точно одному классу, а наблюдаемые величины образуют совокупность х измерений объекта. Два различных объекта из двух разных классов могут дать одинаковые векторы описания. Рассмотрим конкретный пример. Пусть задача состоит в разделении спортсменов на категории „баскетболист" и „футболист", исходя из их роста и веса. Вообще говоря, можно было бы считать низкорослых людей большого веса футболистами, а высоких и худых — баскетболистами. Однако это правило не безошибочно. Если известны только рост и вес человека, в лучшем случае можно сказать, каким видом спорта он наиболее вероятно предпочитает Заниматься.

Пусть х обозначает событие „наблюдается объект с описанием — событие „классифицируемый объект принадлежит классу Устройство классификации образов должно относить объект с описанием х классу тогда и только тогда, когда

В процедуре распознавания образов пространство описаний разбивается на такие области что (17) удовлетворяется для всех точек из и только для них. Затем объекты классифицируются в соответствии с областью, в которую попадает х.

В этом простом принципе неявно содержатся некоторые понятия, противоречащие нашим интуитивным представлениям. Не обязательно объекты, „типичные" для класса будут отнесены к этому классу. Должны учитываться как вероятность того, что данное наблюдение порождается этим классом, так и вероятность того, что класс вообще исследовался. Для примера представим, что врачу надо провести обследование всех тех служащих какой-то компании, которые, по его мнению, имеют серьезные психические отклонения. Если компания большая, то о тщательном обследовании каждого служащего в отдельности не может быть и речи.

Рис. 4.1. Гипотетические распределения тестовых очков. (Площади под кривыми для каждой группы одинаковы.)

Разумной альтернативой было бы провести простой анкетный персональный тест, а затем обследовать тех, чьи результаты выглядят подозрительно. В терминах распознавания образов служащие являются классифицируемыми объектами, а очки, полученные в тестах, образуют одномерное пространство описаний. Теперь допустим, что предыдущее обследование показало, что тестовые очки, соответствующие психическим отклонениям, имеют нормальное распределение со средним 130 и среднеквадратичным отклонением 10, а тестовые очки для психически здоровых людей распределены нормально со средним 110 и среднеквадратичным отклонением 20. Примерные кривые распределений для каждой группы изображены на рис. 4.1. Ясно, что с помощью этого теста можно различить две указанные группы. Однако чтобы применить его для классификации, надо учесть, что здоровых людей, скажем, в 10 раз больше, чем людей с психическими отклонениями. Это означает, что кривую на рис. 4.1, соответствующую распределению для случаев психических отклонений, надо сжать так, чтобы площадь под ней составляла 0,1 от площади под

кривой распределения для здоровых людей, но чтобы форма первой кривой осталась прежней (рис. 4.2). Теперь нас интересует вопрос: какова область тестовых измерений, в которой абсолютное количество случаев психических отклонений превышает абсолютное количество здоровых? Ответ на этот вопрос также показан на рис. 4.2. Служащие должны считаться „психически ненадежными" (и, следовательно, должны быть подвергнуты обследованию) только в том случае, если их очки превышают критическое значение С, отмеченное на рисунке.

Рис. 4.2. Гипотетические распределения, скорректированные с учетом размеров групп. (Площадь под кривой для здоровых в 10 раз больше площади под кривой для случаев психических отклонений.)

И это остается в силе несмотря на то, что С больше 130, т. е. „наиболее типичного результата" для психически больных. Одним из следствий такой минимизации общего количества неверных классификаций явилась классификация более половины психически больных как здоровых!

Можно ли считать предыдущий результат нетипичным? Совсем нет! Он непосредственно вытекает из формулы Бейеса. В самом деле, запишем (16) в наших обозначениях, принятых при распознавании образов:

Это выражение явно зависит как от так и от априорных вероятностей для классов Полученный результат в рассмотренном только что примере может показаться обескураживающим.

Создается впечатление, что мы ошибаемся в существе дела. В нашем анализе формула Бейеса использовалась для минимизации числа ошибочных классификаций без учета относительных стоимостей ошибочных классификаций конкретного типа. В рассматриваемом примере, быть может, более серьезной ошибкой будет не обследовать действительно психически ненадежного человека, чем потратить время на обследование людей без психических отклонений. Существует простой способ учета таких соображений при бейесовской классификации. Пусть описывает цену неправильного отнесения при классификации члена класса к классу Если процедура распознавания относит точку х к области то ожидаемые потери из-за ошибочной классификации точки х равны

Для минимизации ожидаемых потерь вследствие ошибочной классификации области определяются так, чтобы минимизировать (19) по всем точкам пространства D. С помощью (19) можно также определить границу между двумя соседними областями Уравнением границы будет

Часто бывает интересно исследовать форму этой границы; такое исследование может дать нам неформальное понимание существа процедуры классификации.

1
Оглавление
email@scask.ru