4.3.3. Дискриминантный метод
Существуют два серьезных возражения против классификации, основанной на сходстве объектов, принадлежащих одному множеству. Первое заключается в том, что для каждого класса требуется отдельное преобразование и тем самым усложняется весь процесс классификации. Второе состоит в том, что изучение каждого класса в отдельности не позволяет обнаружить степень различия между классами в пространстве исходных измерений. Предлагаемый ниже критерий устраняет именно эти возражения. Он состоит в максимизации различия между точками разных множеств; при этом сумма расстояний между точками внутри и между множествами остается
Таблица 4.2 (см. скан) Оценки сходства для фрагментов скульптур и образцов из карьеров
постоянной. Такой критерий называется дискриминантным. Очевидно, этот подход должен привести к одной (составной) мере, по которой значения точек одного множества близки, а разных множеств существенно различны.
Этот критерий имеет интересную геометрическую интерпретацию. Можно представить себе составную меру в виде прямой в
-мерном пространстве, выходящей из начала координат пространства описаний
Любая точка будет проектироваться на эту прямую. Мы ищем прямую, для которой точки одного множества проектируются в одну и ту же область, а разных множеств — в разные области. На рис. 4.8 изображены проекции данных, представленных Крейгами для карьеров Парос, Гиметт и Пентели на прямую
определяемые взвешенными суммами упомянутых выше отношений кислорода и углерода.
Для определения соответствующих вычислительных процедур понадобятся три вспомогательные матрицы G, V и Т. Для любой

(кликните для просмотра скана)
пары точек
зададим
-матрицу
с элементами
равными произведениям разностей
компонент векторов х и у. Предположим, что исходные данные состоят из
множеств
наблюдений, соответствующих
классам. Обозначим через V усредненную матрицу
по всем парам точек х и у из различных множеств
а через Т — усредненную матрицу
по всем парам независимо от принадлежности их какому-то классу. Алгебраически это можно записать так:
и если
то
Если
— матрица, строки которой являются собственными векторами матрицы
то
— собственный вектор, соответствующий наибольшему собственному значению. Собственный вектор
определяет направление максимально разделяющей прямой, выходящей из начала координат пространства
Точнее, прямая
которую мы ищем, образует с
осью
пространства
угол, такой, что
Определением прямой
завершается этап распознавания образов. На этапе классификации объект относится к классу
в зависимости от положения на
проекции его описания у. Для любой точки
обозначим
Классифицируем у как описание объекта из класса
тогда и только тогда, когда величина
минимальна.
Недостаток дискриминатного метода состоит в том, что, хотя он приводит к хорошей мере для классификации по всем классам, он не
обязательно дает хорошую меру для каждого класса в отдельности. Это ясно видно, если приглядеться к рис. 4.5. Ни одна прямая не может разделить все классы, поскольку наилучшая прямая для разделения множеств Пентели и Наксос ориентирована не так, как оптимальная прямая для разделения всех множеств, кроме Наксос.