§ 11.2. Параметрические критерии качества классификации
 
Очень часто критерии качества классификации задают в виде функций от параметров, возникающих в других задачах математической статистики. Вначале мы дадим некоторое обоснование этих критериев, а затем изучим их свойства. Будет показано, что при использовании одного из этих критериев алгоритм предыдущего параграфа принимает особенно простой вид. Мы рассмотрим также идею инвариантного преобразования и некоторые результаты, которые можно из нее получить. 
11.2.1. Матрицы рассеяния и разделимость классов в задаче автоматической классификации.
 
Задачу автоматической классификации можно рассматривать как задачу поиска такой группировки объектов, при которой максимизируется разделимость классои. Тогда все критерии, рассмотренные в гл. 9, можно использовать в качестве критериев качества классификации. 
В этом параграфе мы ограничимся рассмотрением только функций матриц рассеяния. Такое ограничение обусловлено следующими причинами: 1) критерии этого типа, непосредственно обобщаются на случай многих классов; 2) они имеют более простой вид, чем расстояние Бхатачария или дивергенция. Простота в данном случае необходима, так как в задачах автоматической классификации возникают дополнительные сложности, связанные с отнесением объектов к заранее не известным классам. 
Выберем в качестве матриц рассеяния матрицы 
 и определенные выражениями (9.7), (9.8) и (9.12). Обобщение на случай многих классов производится следующим образом: 
 
 
Здесь 
 — соответственно матрицы рассеяния внутри классов, между классами и совместная матрица рассеяния. 
Когда качество классификации оценивается разделимостью построенных классов, то процедура автоматической классификации должна обладать свойством инвариантности по отношению к линейному преобразованию системы координат, т. е. давать одну и ту же классификацию данного множества объектов независимо от системы координат, в которой производится измерение. 
Как было указано в гл. 9, критерии (9.13) и (9.14) не зависят от системы координат. Выбирая 
 в соответствии с (9.13) и (9.14), имеем следующие критерии качества классификации: 
Более простые выражения получаются, если использовать совместную нормировку (4.53): 
 
где А — невырожденное линейное преобразование. Соответственно преобразуются переменные, матрицы рассеяиия и векторы математических ожиданий. В преобразованной системе координат они имеют вид 
 
и удовлетворяют условиям 
 
Следует отметить, что результат совместной нормировки не зависит от распределения объектов по классам. Критерии (11.15)-(11.17) можно переписать в виде функций от матриц 
 и собственных значений 
 матрицы 
 (которые 
 
совпадают с собственными значениями матрицы 
 
Приведенные выше критерии приводят к более или менее одинаковым классификациям, а в случае двух классов все они сводятся к одному критерию. Для двух классов ранг матрицы 
 равен 1, потому что 
где вторая строчка получается из (11.24). Поэтому 
 
Таким образом, 
Все эти выражения оптимизируются при максимизации Следовательно, в задаче с двумя классами эти три критерия дают в точности один и тот же результат. 
Хотя все три критерия можно оптимизировать описанным в предыдущем параграфе алгоритмом, использование критерия 
 позволяет построить особенно простой алгоритм автоматической классификации. Предположим, что на I-й итерации число векторов, отнесенных к каждому классу, достаточно велико, так что при переброске одного вектора из класса в класс средние векторы изменяются незначительно. Тогда формула для приращения 
 (см. параграф 11.1) принимает особенно простой вид: 
 
Так как второй член (11.34) не зависит от 
 решающее правило на 
 итерации имеет вид 
а алгоритм может быть описан следующим образом.