12.6. ЗАКЛЮЧЕНИЕ
Гибкость, которой обладают описанные в этой главе методы, может оказаться причиной весьма необычной «формы» полученных разбиений. Поэтому необходимо управлять работой программы. Например, на трех первых шагах итерационного процесса использовать фиксированное расстояние или, если имеется соответствующая информация о данных, определить начальные значения сгущений, расстояний, а может быть, и разбиений.
И наконец, определение набора расстояний на каждом шаге итерационного процесса значительно замедляет работу программы. Этого можно избежать, взяв простые расстояния. Существует, например, программа, работающая с расстояниями в абсолютных значениях (City Block).
ПРИЛОЖЕНИЕ 1
Теорема.
Симметричная матрица размера с единичным определителем, минимизирующая выражение где В — конечное множество вектор-столбцов таких, что имеет вид
Доказательство. Известно, что если матрицы размеров соответственно, то . В силу того, что является скаляром,
Следовательно,
Заметим, что Так как симметричная положительно определенная матрица то где С - ортогональная, -диагональная матрицы, составленные из собственных векторов и собственных чисел матрицы Имеем: Положим Задача сводится к тому, чтобы найти матрицу с минимальным следом при условии Очевидно, что матрица симметрична и, следовательно, диагонализуема над вещественными числами и след равен сумме ее собственных значений. Поскольку произведение собственных значений равно а, минимум суммы достигается, когда все собственные значения равны а При этом матрица должна иметь вид
Тогда где
Следствие. Эта теорема может быть применена к задаче определения квадратичного расстояния задаваемого матрицей такого, что принимает минимальное значение имеет смысл центра тяжести В). Имеем
Решением является (10), где
расстояние Махаланобиса, ассоциированное с множеством В
ПРИЛОЖЕНИЕ 2
Теорема. Если В — конечное подмножество из и диагональная матрица, которую будем рассматривать как ковариационную в некотором ортонормированном базисе, то каждый диагональный элемент представляет собой инерцию по соответствующей главной оси.
Доказательство. Пусть имеется базис с началом в центре тяжести В, состоящий из векторов, коллинеарных собственным векторам
пиадионной матрицы, построенной по элементам множества В. В этом базисе ковариационной матрицей является Если вектор имеет координаты то
С другой стороны, базисные векторы являются главными осями инерции, а инерция по направлению, определяемому базисными векторами имеет вид
Из последних двух соотношений вытекает утверждение теоремы.
ПРИЛОЖЕНИЕ 3
Если В — конечное подмножество расстояние Махаланобиса в каноническом базисе то расстояние Махаланобиса ассоциированное с множеством В, в некотором другом базисе (определяемом невырожденной матрицей перехода имеет вид
Доказательство. Согласно приложению 1 расстояние задается матрицей
соответственно х и центр тяжести в каноническом базисе. Расстояние задается:
где
соответственно X и центр тяжести в новом базисе, причем Следовательно,