3.1.2. Алгебраическое решение
В процессе создания метода главных факторов сформировались три различных подхода к выделению главных осей. Пирсон исходил из того, что при отыскании плоскостей или гиперплоскостей, проходящих через центр тяжести облака точек в
-мерном пространстве, обеспечивалась минимальная сумма квадратов расстояний всех точек от этих плоскостей. При втором подходе, использованном Андерсоном [5; 4], исходят из геометрических представлений. Этот подход был описан в 3.1.1. И наконец, третий подход, самый распространенный, которым мы дальше и займемся, исходит из максимизации дисперсии в одном направлении при введении дополнительных условий. Более подробное изложение его приведено в книгах Андерсона 15; 4], Хармана [117], Хотеллинга [144; 1] и Вульстена [325].
Описание проблемы собственных значений имеется у Цурмюля [329].
Классическая модель факторного анализа имеет вид:
Если принять
, то факторы должны быть ортогональны. Считаем известной
и для вывода приравниваем
нулевой матрице. Однако метод пригоден также для оценки характерностей в матрице
. Таким образом, равенство (3.1) упрощается и принимает вид:
Система уравнений, соответствующая (3.2), имеет однозначное решение с вводом дополнительных условий, а именно: сумма квадратов нагрузок первого фактора должна составлять максимум от полной дисперсии; сумма квадратов нагрузок второго фактора должна составлять максимум оставшейся дисперсии и т. д., т. е. максимизирует функцию
при
независимых друг от друга условиях
Для максимизирования функции, связанной некоторым числом дополнительных условий, пользуются методом множителей Лагранжа. В результате приходят к системе
однородных уравнений с
неизвестными
Необходимым и достаточным условием существования нетривиального решения этой системы является равенство нулю детерминанта матрицы коэффициентов этих уравнений.
Детерминант (определитель), записанный в виде (3.5), называют характеристическим, а в развернутом виде — характеристическим уравнением. Все
корней этого уравнения действительны, т. е.
являются возможными, иногда совпадающими решениями. Если в (3.4) подставить из (3.5) найденное значение
то получим вектор решения
, который удовлетворяет указанным дополнительным условиям и имеет максимум при 2 То же самое имеет место для
, т. е. получаем в качестве решения вектор
, причем
является максимумом в отношении оставшейся дисперсии и т. д.
Система равенств (3.4) составляет так называемую проблему собственных значений действительной симметрической матрицы. В общем она записывается в следующем виде:
(3.6)
где
— собственные значения, они соответствуют собственным векторам
матрицы R. По собственным значениям и собственным векторам имеется обширная литература, которая указана в библиографии. Тот факт, что максимизация функции (3.3) приводит к классической проблеме собственных значений, облегчает численное решение системы уравнений (3.2), так как проблема собственных значений достаточно разработана.
Факторы пропорциональны собственным векторам матрицы R. Путем нормирования получим искомые значения
матрицы А по компонентам собственных векторов матрицы R: