4.3.3. Дискриминантный метод
 
Существуют два серьезных возражения против классификации, основанной на сходстве объектов, принадлежащих одному множеству. Первое заключается в том, что для каждого класса требуется отдельное преобразование и тем самым усложняется весь процесс классификации. Второе состоит в том, что изучение каждого класса в отдельности не позволяет обнаружить степень различия между классами в пространстве исходных измерений. Предлагаемый ниже критерий устраняет именно эти возражения. Он состоит в максимизации различия между точками разных множеств; при этом сумма расстояний между точками внутри и между множествами остается 
 
Таблица 4.2 (см. скан) Оценки сходства для фрагментов скульптур и образцов из карьеров
постоянной. Такой критерий называется дискриминантным. Очевидно, этот подход должен привести к одной (составной) мере, по которой значения точек одного множества близки, а разных множеств существенно различны. 
Этот критерий имеет интересную геометрическую интерпретацию. Можно представить себе составную меру в виде прямой в  -мерном пространстве, выходящей из начала координат пространства описаний
-мерном пространстве, выходящей из начала координат пространства описаний  Любая точка будет проектироваться на эту прямую. Мы ищем прямую, для которой точки одного множества проектируются в одну и ту же область, а разных множеств — в разные области. На рис. 4.8 изображены проекции данных, представленных Крейгами для карьеров Парос, Гиметт и Пентели на прямую
 Любая точка будет проектироваться на эту прямую. Мы ищем прямую, для которой точки одного множества проектируются в одну и ту же область, а разных множеств — в разные области. На рис. 4.8 изображены проекции данных, представленных Крейгами для карьеров Парос, Гиметт и Пентели на прямую  определяемые взвешенными суммами упомянутых выше отношений кислорода и углерода.
 определяемые взвешенными суммами упомянутых выше отношений кислорода и углерода. 
Для определения соответствующих вычислительных процедур понадобятся три вспомогательные матрицы G, V и Т. Для любой 
 

(кликните для просмотра скана)
пары точек  зададим
 зададим  -матрицу
-матрицу  с элементами
 с элементами 
 
равными произведениям разностей  компонент векторов х и у. Предположим, что исходные данные состоят из
 компонент векторов х и у. Предположим, что исходные данные состоят из  множеств
 множеств   наблюдений, соответствующих
 наблюдений, соответствующих  классам. Обозначим через V усредненную матрицу
 классам. Обозначим через V усредненную матрицу  по всем парам точек х и у из различных множеств
 по всем парам точек х и у из различных множеств  а через Т — усредненную матрицу
 а через Т — усредненную матрицу  по всем парам независимо от принадлежности их какому-то классу. Алгебраически это можно записать так:
 по всем парам независимо от принадлежности их какому-то классу. Алгебраически это можно записать так: 
 
и если 
 
то
 
Если  — матрица, строки которой являются собственными векторами матрицы
 — матрица, строки которой являются собственными векторами матрицы  то
 то  — собственный вектор, соответствующий наибольшему собственному значению. Собственный вектор
 — собственный вектор, соответствующий наибольшему собственному значению. Собственный вектор  определяет направление максимально разделяющей прямой, выходящей из начала координат пространства
 определяет направление максимально разделяющей прямой, выходящей из начала координат пространства  Точнее, прямая
 Точнее, прямая  которую мы ищем, образует с
 которую мы ищем, образует с  осью
 осью  пространства
 пространства  угол, такой, что
 угол, такой, что 
 
Определением прямой  завершается этап распознавания образов. На этапе классификации объект относится к классу
 завершается этап распознавания образов. На этапе классификации объект относится к классу  в зависимости от положения на
 в зависимости от положения на  проекции его описания у. Для любой точки
 проекции его описания у. Для любой точки  обозначим
 обозначим 
 
Классифицируем у как описание объекта из класса  тогда и только тогда, когда величина
 тогда и только тогда, когда величина 
 
минимальна. 
Недостаток дискриминатного метода состоит в том, что, хотя он приводит к хорошей мере для классификации по всем классам, он не 
 
обязательно дает хорошую меру для каждого класса в отдельности. Это ясно видно, если приглядеться к рис. 4.5. Ни одна прямая не может разделить все классы, поскольку наилучшая прямая для разделения множеств Пентели и Наксос ориентирована не так, как оптимальная прямая для разделения всех множеств, кроме Наксос.