Главная > Принципы распознавания образов
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

Глава 5. ОБУЧАЕМЫЕ КЛАССИФИКАТОРЫ ОБРАЗОВ. ДЕТЕРМИНИСТСКИЙ ПОДХОД

5.1. ВВЕДЕНИЕ

Подходы к построению классификаторов образов, изучавшиеся нами до сих пор, основаны на непосредственных вычислениях, т. е. разделяющие границы, полученные в результате реализации этих подходов, определяются заданной выборкой образов, по которой путем непосредственных вычислений отыскиваются соответствующие коэффициенты. Примеры такого рода мы встречали в третьей главе, когда требовалось определять центры кластеров или «стандартные» образы до построения классификаторов, и в четвертой главе, когда структура байесовского классификатора для нормально распределенных образов полностью определялась вектором математического ожидания и ковариационной матрицей каждого класса.

В настоящей главе мы приступаем к изучению классификаторов, решающие функции которых строятся по заданной выборке образов с помощью итеративных, «обучающих» алгоритмов. Как отмечалось в гл. 2, когда тип решающей функции выбран, задача заключается в определении коэффициентов. Алгоритмы, представленные в этой главе, позволяют определять коэффициенты искомого решения посредством обучения по заданным множествам образов при условии, что эти обучающие множества разделяются выбранными решающими функциями.

В § 2.4 было показано, что решение задачи о разделении на два класса эквивалентно решению системы линейных неравенств. Таким образом, если заданы два множества образов, принадлежащих соответственно классам то решение ищется в виде вектора весов обладающего тем свойством, что для всех образов класса выполняется условие и для всех образов класса — условие . Если образы класса умножить на —1, то эквивалентное условие становится общим для всех образов. Обозначив через общее количество пополненных выборочных образов (см. гл. 2) обоих классов, нашу задачу можно свести к отысканию вектора весов

w, обеспечивающего справедливость системы неравенств

где

— нулевой вектор. Если образы обладают хорошим размещением в том смысле, как это было введено в гл. 2, матрица X удовлетворяет условию Хаара, т. е. всякая подматрица -матрицы X имеет ранг (Чини [1966]).

Если вектор весов удовлетворяющий условию (5.1.1), существует, то неравенства называются совместными; в противном случае они несовместны. На языке распознавания образов мы говорим, что классы соответственно разделимы или неразделимы. Читателю следует иметь в виду, что формулировка условия (5.1.1) предполагает, что все образы одного из классов умножены на —1 и, кроме того, все образы пополнены в соответствии с процедурой, описанной в гл. 2.

В принципе для решения (5.1.1) можно воспользоваться и детерминистским, и статистическим подходами. Детерминистский подход служит основой алгоритмов, рассматриваемых в данной главе. Как и следует из названия, эти алгоритмы конструируются независимо от каких-либо предположений о статистических свойствах классов образов. Статистические алгоритмы, представляемые в гл. 6, отражают, с другой стороны, попытку найти аппроксимацию плотностей распределения и использовать их затем в качестве байесовских решающих функций в соответствии с соотношением (4.2.23). Однако, завершив изучение обоих подходов, мы заметим поразительное сходство между статистическими и детерминистскими алгоритмами.

Categories

1
Оглавление
email@scask.ru