2.5. КЛАССИФИКАТОРЫ, РАЗДЕЛЯЮЩИЕ ФУНКЦИИ И ПОВЕРХНОСТИ РЕШЕНИЙ
2.5.1. СЛУЧАЙ МНОГИХ КЛАССОВ
Допустимы различные способы описания классификаторов. Один из способов, дающий нечто вроде канонической формы классификатора, состоит в представлении его посредством системы разделяющих функций .
Рис. 2.3. Схема классификатора образов.
Говорят, что классификатор ставит в соответствие вектор признаков х классу , если справедливо неравенство
Классификатор, таким образом, рассматривается как устройство, вычисляющее с разделяющих функций и выбирающее решение, соответствующее наибольшей из них. Такое представление классификатора изображено в виде блок-схемы на рис. 2.3.
Это естественный и простой способ представления байесовского классификатора. В общем случае положим так как наибольшая из разделяющих функций будет тогда соответствовать наименьшему условному риску. В случае классификации с минимальным уровнем ошибки задачу можно еще упростить, принимая так что наибольшая по величине разделяющая функция будет соответствовать наибольшей апостериорной вероятности.
Ясно, что выбор разделяющих функций не единствен. Всегда можно, не влияя на решение, умножить разделяющие функции на положительную константу или прибавить к ним какую-либо константу. Более того, если заменить каждую из на
где f — монотонно возрастающая функция, то результирующая классификация не изменится. Это обстоятельство может привести к существенным аналитическим и расчетным упрощениям.
Рис. 2.4. Примеры областей решений и их границ.
В частности, при классификации с минимальным уровнем ошибки любой из следующих вариантов приводит к одинаковым результатам, хотя некоторые и могут оказаться намного проще других с точки зрения понятности или удобства вычислений:
Решающие правила остаются эквивалентными независимо от разнообразия этих форм записи разделяющих функций. Действие любого из решающих правил состоит в том, чтобы разбить пространство признаков на с областей решений Если оказывается, что для всех то считаем, что х находится в области и, согласно решающему правилу, со значением х следует сопоставить состояние Области разделяются границами областей решений — такими поверхностями в пространстве признаков, вдоль которых совпадают наибольшие (для каждой точки х. - Ред.) из разделяющих функций (рис. 2.4). Для соприкасающихся областей уравнение разделяющей их границы имеет вид
Хотя данное уравнение в зависимости от выбранного вида разделяющих функций может принимать различную форму, границы областей решений остаются, конечно, одними и теми же. Для точек, лежащих на границе, задача классификации определяется не единственным образом. В случае байесовского классификатора для каждого из решений получаем одно и то же значение условного риска, так что не важно, как будет разрешена эта неопределенность. Вообще говоря, данная проблема разрешения неопределенности при непрерывных функциях плотности условного распределения является чисто теоретической задачей.
2.5.2. СЛУЧАЙ ДВУХ КЛАССОВ
Хотя два класса — это лишь частный случай многих классов, обычно его исследуют отдельно.
Рис. 2.5. Схема классификатора образов для двух классов.
Вместо использования двух разделяющих функций и сопоставления значений х и состояния при чаще принято определять одну разделяющую функцию:
и применять следующее правило: принять решение если ; в противном случае — принять решение Классификатор для
двух классов может, таким образом, рассматриваться как устройство, вычисляющее единственную разделяющую функцию и классифицирующее х в соответствии с алгебраическим знаком результата (рис. 2.5). Из всевозможных видов записи разделяющей функции, дающей минимальный уровень ошибки, особенно удобны два: