17.1.2. Проекции строк и столбцов. Связь с анализом главных компонент.
Рассматривая профиля строк и столбцов как точки в соответствующих пространствах
дальше можно действовать несколькими способами, которые приводят к одинаковому результату.
Прежде всего для упрощения датьнейших выкладок нормируем профили строк (столбцов) так, чтобы
-метрика стала обычной евклидовой (дальше
):
Легко проверить, что евклидово расстояние между нормированными профилями строк (столбцов) совпадает с расстоянием между соответствующими исходными профилями Нормированные профили-строки являются строками матрицы
.
Введем теперь матрицу рассеивания Т, для нормированных профилей строк с учетом их весов
Матрица 1,. имеет размеры
. Это аналог ковариационной матрицы системы из
точек, но рассеивание измеряется не относительно их центра тяжести, а относительно нулевой точки. Будем теперь искать одномерную проекцию с вектором U, для которой рассеивание (дисперсия) образов точек максимально. Но это задача анализа главных компонент (см гл. 13). В вычислительном отношении это приводит к решению проблемы собственных значений и векторов:
С учетом того, что веса
равны диагональным элементам матрицы
матрица
может быть представлена в виде
Аналогично матрица рассеивания для нормированных профилей столбцов есть
Введем в рассмотрение матрицу
Тогда имеем