Главная > Факторный анализ как статистический метод
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

Глава 3. ЦЕНТРОИДНЫЙ МЕТОД

3.1. Введение

Хотя в настоящее время метод максимального правдоподобия является единственным методом, который дает эффективные оценки факторных нагрузок, применяется он не часто и в основном из-за обременительности требуемых вычислений. Однако широко распространено использование многочисленных простых аппроксимационных методов для оценки нагрузок. Наиболее популярным из них является центроидный метод (иногда его называют методом простого суммирования), хорошо описанный многими авторами (Burt, 1940; Thurstone, 1947; Thomson, 1951; Jowett, 1958). Этот метод заслуживает внимания, так как оценки факторных нагрузок, которые он дает, весьма близки к оценкам максимального правдоподобия и достаточны для многих практических целей.

Из-за определенного произвола в его процедуре, которая вскоре будет приведена, статистическая оценка метода и исследование его выборочных свойств крайне трудны (если вообще возможны). Однако, насколько известно, метод является высоко эффективным (Lawley, 1955), и его легко понять, иллюстрируя на геометрической модели (Thomson, 1954).

3.2. Геометрическая модель центроидного метода

Пусть переменные отождествляются с векторами, выходящими из начала координат -мерного пространства, косинусы углов между которыми равны корреляциям, а длины векторов — стандартным отклонениям соответствующих переменных. Далее,

если направления, которые приписаны переменным, уже найдены, изменим на время, если необходимо, их знаки так, чтобы как можно больше корреляций стали положительными; тогда векторы будут иметь тенденцию к группировке в одном направлении в пучок. После зтого первый фактор системы определяется как сумма векторов и будет проходить каким-то образом через середину пучка.

Теперь можно учесть влияние этого фактора и, проделав дальнейшее изменение знаков, прийти к новому пучку векторов. Затем можно учесть второй фактор и т. д. до тех пор, пока дисперсия переменных не будет исчерпана полностью. В общем случае у нас будет векторов в -мерном пространстве, но существенные особенности модели можно продемонстрировать, рассматривая лишь двумерный случай.

Пусть две переменные с дисперсиями и коэффициентом корреляции Их ковариационная матрица равна

Рис. 3.1.

Представим переменные векторами (рис. 3.1) с углом между ними, где

Суммой векторов будет вектор где параллелограмм. Этот вектор после приведения к единичной длине и представляет первый фактор Пусть углы, которые составляет вектор и так что Нагрузки

и на даются формулами

Если вектор нагрузок обозначить через 1 то матрица остаточных ковариаций после учета влияния первого фактора равна

или

так как Поскольку то суммы как по строкам, так и по столбцам этой матрицы равны нулю.

Выражая созф! и в (3.1) через лучим простой метод вычисления нагрузок переменных на факторы прямо из ковариационной матрицы А. Например,

В этом выражении числитель равен сумме элементов первого столбца матрицы А, а знаменатель — квадратному корню из суммы всех элементов матрицы А. Подобное выражение можно получить и для

После этого необходимо получить нагрузки переменных на второй фактор. Их нельзя получить прямо из остаточной матрицы, так как суммы строк и суммы столбцов равны нулю. Поэтому, чтобы продвинуться дальше, нужно изменить знак одного из переменных. Это эквивалентно изменению знака в одной строке и одном столбце остаточной матрицы. Затем нагрузки переменных на второй фактор получаются

суммированием соответствующих столбцов и делением каждой суммы на квадратный корень из суммы всех элементов остаточной ковариационной матрицы. В заключение знаки нагрузок переменных, которые были изменены, должны быть восстановлены.

В случае двух переменных можно получить лишь два центроидных фактора, и поэтому в конце этой главы приводится пример, в котором рассчитываются нагрузки на три фактора. В центроидной процедуре имеется произвол. Дело в том, что необходимо после учета каждого нового фактора разрушить «равновесие», которое возникает оттого, что суммы столбцов в каждой остаточной матрице равны нулям, а для этого нужна замена знаков. Когда же число переменных велико, изменять знак можно разными способами (см. упражнение 2 в конце главы).

Обычная процедура состоит в том, что подсчитывается число отрицательных знаков в каждом столбце и во всей остаточной матрице в целом. Затем у переменной, имеющей наибольшее число отрицательных знаков, изменяется знак, т. е. изменяются все знаки в соответствующих ей строке и столбце. Следует отметить, что этот процесс оставляет диагональный элемент без изменения. После этого вычисляется суммарное число отрицательных знаков в матрице; процесс продолжается до тех пор, пока это число не станет минимальным. Когда это достигнуто, можно ожидать, что последующие факторы будут выделять большую часть остающейся дисперсии переменных, хотя простой подсчет знаков и не гарантирует этого, так как фактическая величина остатков не может приниматься во внимание. В случае когда не все истинные ковариации положительны, изменение знака может быть целесообразным еще до оценки первых факторных нагрузок.

Недостатком центроидного метода является зависимость центроидных нагрузок от шкалы, в которой измеряются переменные. Обычно поэтому переменные нормируют, так что ковариационная матрица А становится корреляционной. Но это приводит к трудностям при рассмотрении критериев достаточности.

Categories

1
Оглавление
email@scask.ru