где
и
обозначают, соответственно, множества векторов-наблюдений, векторов-признаков и индексов классификации. Член
характеризует степень соответствия структуры векторов-признаков структуре векторов-наблюдений. Член
характеризует разделимость классов в пространстве
Наконец,
— множитель, устанавливающий относительную важность
и
при определении
Мера степени соответствия между
и X строится, исходя из расстояний
между объектами в пространствах
и X. К настоящему времени предложены три таких меры, или критерия:
1. Критерий монотонности [Шепард, 1962а, б];
где
а
— ранг расстояния, определяемый в соответствии с (10.18).
2. Критерий «напряжения» [Крускал, 1964а, б]:
3. Критерий непрерывности [Шепард, 1966]:
Суммирование производится по всем парам
Веса
обычно выбираются так, чтобы меньшим
соответствовали большие веса. Типичное правило приписывания весов задается выражением
где а — неотрицательный свободный параметр.
В некоторых случаях многие полагают равными нулю, в частности, для больших
Критерий монотонности направлен на сохранение рангового порядка расстояний между объектами. Критерий напряжения устанавливает более жесткую связь между расстояниями в исходном пространстве и в пространстве признаков. Критерий непрерывности ограничивает для малых
В качестве
можно использовать любой критерий разделимости. В гл. 9 мы рассматривали некоторые из таких критериев, в том числе критерии
представляющие собой меру разброса (см. (9.13) — (9.16)), расстояние Бхатачария и дивергенцию. В случае нелинейного преобразования фактор простоты играет существенно более важную роль при оценке критериев. Поэтому, хотя имеется много критериев разделимости и все они могут быть использованы в качестве
предпочтение отдается критериям, имеющим простой вид. Например, можно использовать след матрицы разброса внутри классов:
где
— математическое ожидание векторов У, отнесенных к классу
— число объектов в классе
Если использовать
качестве
и нормировать систему координат так, чтобы матрица
стала единичной матрицей, то этот критерий совпадает с критерием
Можно переписать (10.33), выразив
через расстояния между объектами. Читатель может легко проверить, что
где в качестве
берется выборочное среднее
Выражение (10.34) представляет
в виде взвешенной суммы квадратов расстояний между объектами одного и того же класса. Можно несколько видоизменить
приписав этим квадратам расстояний веса в соответствии с (10.32):
где
Как только
выбраны, признаки У можно найти, например, методом наискорейшего спуска. Рекуррентную процедуру минимизации можно записать в общем виде следующим образом:
где
— подходящим образом выбранная положительная константа. Например, если использовать (10.30) в качестве меры сохранения структуры, критерий принимает вид
а рекуррентное выражение для
Для определения оптимальных У может быть также использован алгоритм случайного поиска [Калверт, 1969]. На каждом шаге
вычисляется следующим образом:
где
— случайный вектор той же размерности, что и
Если
дает улучшение критерия по сравнению с
то
принимается в качестве нового У; в противном случае генерируется новое V. Алгоритм заканчивает работу, когда дальнейшее улучшение получить уже не удается.
К сожалению, итеративпый характер рассмотренных алгоритмов ограничивает их применимость (см. замечания в начале этого параграфа). Рассмотрим теперь неитеративный алгоритм, по-прежнему основанный на идее улучшения разделимости и сохранения структуры.