4.3.4. Сравнение статистического анализа и основанного на понятии близости распознавания образов
Бейесовский статистический метод классификации, представленный в разд. 4.2, весьма схож с распознаванием образов, основанным на минимизации расстояния между точками одного класса. В обоих случаях разыскивается преобразование для каждого класса, приближающее элементы класса друг к другу. В бейесовском подходе, использующем предположение о многомерном нормальном распределении, это преобразование минимизирует расстояние от каждой точки скопления до его центра. В методе, основанном на близости, минимизируется среднее значение квадрата расстояния между парами точек одного класса. Два этих решения почти одинаковы.
Существует аналогичная связь между дискриминантным методом и статистическим дискриминантным анализом. Допустим, что найдена некоторая линейная комбинация у описаний, соответствующих измерениям
Определим
как сумму квадратов расстояний от средних значений у для классов до среднего значения у всей выборки,
— как сумму квадратов расстояний от точек класса до среднего значения этого класса. В статистическом дискриминантном анализе у выбирается так, чтобы отношение
было максимальным. Это аналогично критерию максимизации, изложенному в разд. 4.3.3. Разница в том, что в анализе, основанном на близости, внимание уделяется расстояниям между парами точек, тогда как в статистическом анализе — расстояниям между отдельными точками и средними значениями для соответствующих классов.