10.5.5. Многомерное метрическое шкалирование.
В предыдущих пунктах рассматривался вопрос визуализации данных, заданных в виде матрицы данных. В некоторых случаях данные задаются в виде матрицы близости D между объектами размера Мы рассмотрим здесь случай, когда элементы матрицы D могут рассматриваться как расстояния между объектами, и поставим задачу построить конфигурацию точек возможно меньшей размерности, которая порождала бы (объясняла) матрицу D. Такая задача носит название задачи многомерного метрического шкалирования. Для решения этой задачи снова воспользуемся функционалом вида (10.26). Итерационная процедура определения точки минимума остается той же самой. Однако вопрос задания удачной начальной конфигурации является уже более сложным. Рассмотрим подход, приводящий к выбору начальной конфигурации, эквивалентной получаемой методом главных компонент. Этот подход реализован в ППСА.
Введем, следуя [139], симметричную матрицу Н размера с элементами
(10.29)
Значение i считается фиксированным. Элементы строки и i-го столбца полагаются равными . Элемент можно интерпретировать как скалярное произведение векторов, идущих из точки с номером i в точки с номерами j и Действительно, для данных трех точек
где — угол между векторами . Отсюда простой перестановкой членов получаем
Из сравнения равенств (10.29) и (10.30) следует, что т. е. действительно является скалярным произведением векторов идущих
из точки в точки . Существует возможных матриц Н в зависимости от выбора точки Теперь можно определить матрицу скалярных произведений векторов, выходящих из центра множества точек , т. е. матрицу размера с элементами вида
Элементы этой матрицы получаются из элементов матрицы Н по формуле
При этом безразлично, какая из матриц Н использована для получения матрицы Н. Матрица Н и есть та матрица, которая теперь будет использована для получения начальной конфигурации. Предполагая векторы центрированными, можно записать Следовательно, ранг и собственные числа матриц Н совпадают с рангом и собственными числами матрицы ковариаций 2 (нам неизвестной). Каждый собственный вектор матрицы Н представляет соответствующую главную компоненту X, т. е. компонента собственного вектора есть скалярное произведение на собственный вектор матрицы 2. Для целей визуализации, например, положив и взяв два первых собственных вектора матрицы Н в качестве координат начальной конфигурации, мы придем к ситуации, описанной в предыдущем пункте.