Главная > Факторный анализ как статистический метод
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

5.4. Приближенный метод для некоррелированных факторов

Метод для некоррелированных факторов является в некоторой степени произвольным, поскольку значения нагрузок зависят, хотя и не сильно, от порядка рассмотрения факторов. Общий принцип состоит в упорядочивании факторов по числу нулевых нагрузок на них; сначала рассматриваются факторы с наибольшим числом нулевых нагрузок. Для использования метода необходимо, чтобы фактор при таком упорядочивании имел бы по крайней мере нулевых нагрузок, где максимально допустимое число факторов. У r-го фактора обязательно есть ненулевые нагрузки и он соответствует, таким образом, общему фактору.

Для иллюстрации воспользуемся данными из примера в гл. 2 (хотя для удобства здесь и в следующей главе, где пользуемся этими же данными,

Таблица 5.4 (см. скан) Матрица А корреляций

переменная 2 опущена, а остальные перенумерованы в порядке 5, 4, 6, 8, 9, 7, 1, 3). Корреляционная матрица этих переменных, занумерованных от 1 до 8, приведена в табл. 5.4. Объем выборки — 211.

Берем вначале предположительные значения или оценки факторных дисперсий. Для наших данных мы будем пользоваться следующими имеющимися оценками:

Пусть получена из матрицы А (табл. 5.4) заменой единиц вдоль диагонали оценками факторных дисперсий, данными выше.

Гипотеза, с которой мы начинаем анализ, состоит в том, что имеется три фактора и требуемый образец нагрузок (в нем на местах, соответствующих не обязательно нулевым нагрузкам, стоит таков:

В этой главе мы предположим, что все ненулевые нагрузки положительны, как это часто случается на практике.

Ниже мы напишем соответствующую этим трем факторам матрицу с тремя строками, на которую матрица умножается слева. Единственное существенное условие, которому должна удовлетворять матрица это линейная независимость строк. Действительный вид будет, конечно, влиять на процесс оценки. Простое общее правило выбора таково: поставить нули там, где нагрузки равны нулю, и единицы на других местах. (Однако если бы допускалась возможность отрицательных нагрузок, то соответствующие элементы в надо было бы принять за — 1). Таким образом, в нашем примере мы за возьмем

В отдельных случаях это правило надо несколько модифицировать, так как, если его строго придерживаться, можно получить линейно зависимые строки. Так, например, первая строка может быть просто суммой второй и третьей строк. Чтобы справиться с этим затруднением, можно найти простые модификации этого правила. Например, некоторые нули заменить единицами или наоборот.

Матрица элементы которой — это суммы или части сумм столбцов из легко находится:

Мы вычислим также матрицу

где транспозиция Обычно как и здесь, положительно определенная матрица. Если бы этого не было, некоторые из факторных дисперсий были бы завышены. На следующей стадии процесса определяем три вектора-строки на которые умножается слева. Элементы пропорциональны оценкам нагрузок для фактора и (для выбираются так, чтобы некоторые из этих элементов были как можно меньше.

Из ортогональности факторов следует, что должны удовлетворять соотношениям ортогональности:

В нашем примере мы начнем со второго фактора, так как у него наибольшее число нулевых нагрузок. Мы должны выбрать так, чтобы последние пять элементов были малы. Это можно сделать методом проб и ошибок, но мы воспользуемся методом

наименьших квадратов и будем минимизировать сумму квадратов этих элементов. Пусть тогда выберем так, чтобы выражение

было бы минимальным. Это приводит к «нормальным» уравнениям:

Отсюда

Рассмотрев затем третий фактор, мы выберем чтобы минимизировать сумму квадратов первого и последнего элементов при условии Таким образом, должны быть выбраны так, чтобы минимизировать

при условии

Для этого надо выписать уравнения

где неопределенный множитель. Эти уравнения в числах такие:

Исключив , получим

Это уравнение совместно с уравнением дает возможность найти

Отсюда

Наконец, определяется из условий

т. е.

Так что

Вычисляем теперь (эти значения положительны, поскольку положительно определена) и делим векторы на квадратные корни этих значений соответственно. Полученные векторы являются нормированными, так как необходимо, чтобы факторы имели единичные дисперсии. После вычислений найдем

Умножая слева последовательно на получим оценки нагрузок для трех факторов.

Матрица нагрузок равна:

Эти значения в делом не сильно отличаются от оценок максимального правдоподобия, данных в следующей главе (стр. 90). Значения в скобках достаточно малы и их можно заменить нулями.

Если бы предполагались дальнейшие итерации этого процесса, новые оценки факторных дисперсий можно было бы найти обычным путем.

Categories

1
Оглавление
email@scask.ru