МЕТОД РАЗДЕЛЕНИЯ В ПРОСТРАНСТВЕ ПРИЗНАКОВ
Разделяющая функция и решающее правило. Как и в метрических методах распознавания, состояние изделия характеризуется точкой в пространстве признаков.
Предполагается, что области диагнозов не пересекаются и поэтому возможно построить разделяющую поверхность.
Рассмотрим распознавание двух состояний (дифференциальная диагностика или дихотомия).
При наличии нескольких диагнозов распознавание может быть сведено к последовательному применению рассматриваемой процедуры.
В основе методов разделения лежит построение скалярной функции параметров (признаков)
принимающей различные знаки в двух областях диагноза.
Такую функцию называют разделяющей, и тогда
Таким образом, разделяющая функция имеет положительное значение для всех изделий, имеющих состояние и отрицательное значение — в противоположном случае.
Условие (43) образует решающее правило для разделения в пространстве признаков.
Если для предъявленного для распознавания объекта, характеризующегося вектором х, значение положительно, объект считают принадлежащим состоянию при отрицательном значении — состоянию
Рис. 5. Линия, разделяющая функции для двух диагнозов
Уравнение
будет составлять уравнение разделяющей поверхности (поверхности, разделяющей области диагнозов).
Наиболее простой вид имеет линейная разделяющая функция
где — число признаков (размерность пространства); — «весовые» коэффициенты.
Разделяющая поверхность будет гиперплоскостью («плоскостью» в многомерном пространстве)
Для случая двух признаков (параметров) разделяющая плоскость будет разделяющей прямой (рис. 5).
Для удобства геометрической интерпретации введем формально еще один параметр
Разделяющая функция может быть теперь представлена в виде скалярного произведения
где — «весовой» вектор,
Решающее правило будет таким:
Уравнение разделяющей гиперплоскости
Из последнего равенства следует, что разделяющая гиперповерхность перпендикулярна к «весовому» вектору и проходит через начало координат (в дополненном пространстве признаков размерности
Чтобы осуществить диагностику с помощью линейной разделяющей функции, достаточно знать компоненты весового вектора.
Приближенный способ определения весового вектора. Для построения весового вектора (нахождения коэффициентов используют объекты (изделия) с установленными состояниями и (обучающие последовательности).
Средние (эталонные) образцы характеризуются векторами и причем компоненты векторов
где — значения признака (параметра) для образцов, имеющих состояния — число образцов, входящих в обучающие последовательности для диагнозов
— индекс образцов.
Примем, что разделяющая плоскость проходит через точку, находящуюся на середине прямой, соединяющей точки эталонов (точку А, рис. 6), перпендикулярно к этой прямой.
Так как точка А характеризуется вектором то уравнение разделяющей плоскости будет
Рис. 6. Приближенный способ построения разделяющей гиперплоскости
Скалярное произведение вектора, лежащего в разделяющей плоскости, и вектора, нормального к ней, обращается в нуль.
Развертывая уравнение (53), находим
где — квадраты длины векторов
Сопоставляя равенства (54) и (46), находим составляющие весового вектора:
Последние соотношения устанавливают приближенные значения компонентов весового вектора.
Определение весового вектора методом последовательных приближений. Предполагают, что имеется обучающаи последовательность, в которой содержатся сведения об образцах с диагнозами состояний
Принимают первое приближение для весового вектора например, с помощью равенств (52) или каким-либо другим (произвольным) образом.
Выбирают произвольно образец из обучающей последовательности, которому приписывают условно первый номер он может иметь состояние или . Величину «испытывают» по отношению к , т. е. определяют
Если распознавание произошло с ошибкой, то значение корректируют.
Принимают следующее приближение:
При неправильных ответах к прибавляется или вычитается вектор точки, относительно которой совершена ошибка. Если с помощью распознавание вектора было правильным:
то сохраняется прежнее значение
и предъявляется следующий образец
Если линейное разделение возможно, то указанный процесс приводит к нахождению вектора X за конечное число шагов.
Однако разделение областей диагноза гиперплоскостью не всегда возможно. На рис. 7 приведен такой случай. Если области диагнозов являются выпуклыми (т. е. отрезок, соединяющий любые две точки области, лежит внутри нее) и непересекающимися, то линейное разделение осуществимо.
Рис. 7. Случай, когда невозможно разделение областей диагнозов с помощью гиперплоскости
Приведенное условие образует достаточный признак линейной разделимости. Область диагноза на рис. 7 не принадлежит к выпуклым, и достаточное условие не удовлетворяется. Однако признак не является необходимым, так как если «раздвинуть» области диагнозов на рис. 7, то окажется возможным разделение гиперплоскостью. Укажем теперь необходимый и достаточный признак линейной разделимости. возможна, если существует хотя бы одно направление, на котором проекции областей диагнозов не пересекаются.
Линейные методы разделения не могут быть использованы, если области диагнозов имеют сложные и близко расположенные границы (рис. 7).
Более эффективными, но и более сложными являются методы потенциальных функций и методы стохастической аппроксимации, в которых разделяющую функцию принимают в более общем виде
где — функции параметров (признаков).
В более сложных случаях приходится использовать преобразования признаков, указанные в связи с рассмотрением метрических методов распознавания.