Главная > Факторный анализ как статистический метод
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

3.4. Пример центроидного метода, использующего факторные дисперсии

В табл. 3.1. даны корреляции между отметками по шести школьным предметам, подсчитанные по выборке из 220 мальчиков. Предметы такие: 1) гэльский язык, 2) английский язык, 3) история, 4) арифметика, 5) алгебра, 6) геометрия.

Чтобы начать анализ, нужно «задать» начальные значения факторных дисперсий. В обычной процедуре для корреляционных матриц используются наибольшие коэффициенты корреляций в каждом столбце, которыми и заменяют единицы на диагонали. Это проделано в табл. 3.1 (В ковариационной матрице наибольший коэффициент корреляции в столбце умножается на дисперсию, стоящую в том же столбце на диагонали.) Затем столбцы матрицы суммируются и находится полная сумма, равная 13,212. Извлекая

Таблица 3.1 (см. скан) Матрица корреляций шести переменных с грубо приближенными значениями факторных дисперсий по диагонали

квадратный корень, получим 3,635 и, деля на это число суммы в соответствующих столбцах, получим первые оценки нагрузок на первый фактор. Контролировать вычисления поможет алгебраическая сумма нагрузок, которая должна быть равной делителю 3,635 (с точностью до ошибок округлений). Исключая теперь влияние первого фактора из первоначальной матрицы, придем к первой остаточной матрице ковариаций. Если только что полученную строку нагрузок обозначить матрицу с первоначальными факторными дисперсиями — то остаточная матрица равна Она приведена в табл. 3.2. За исключением ошибок округлений, суммы столбцов в таблице, как и должно быть, равны нулю. Прежде чем продолжить анализ, мы должны изменить знак на противоположный по крайней мере у одной переменной, причем лучше всего минимизировать число отрицательных знаков. В данном случае можно сделать это число нулем,

Таблица 3.2 (см. скан)Первая матрица остаточных ковариаций

изменяя знаки у переменных 4, 5 и 6. Затем рассматриваем числа в диагональных клетках матрицы. Так как все они в таблице положительны, то их либо используют, либо заменяют наибольшим числом в каждом столбце. Последнее является лучшей процедурой во время первой итерации (но, как правило, только для первой итерации), поскольку если подлинные оценки факторных дисперсий окажутся слишком малы, то некоторые диагональные элементы остаточной матрицы могут быть отрицательными, а этого нельзя допустить.

Остаточная матрица с измененными знаками у переменных 4, 5 и 6 с новыми оценками факторных дисперсий на диагонали дана в табл. 3.3.

Если суммы столбцов, приводимые ниже в таблице, разделить на корень квадратный из полной суммы всех элементов матрицы, то получим первые оценки нагрузок на второй фактор. Так как наша матрица содержит только шесть переменных, то нахождение нагрузок на третий фактор ничего не даст. Здесь также действует правило, ограничивающее число факторов условием которое применялось

в методе максимального правдоподобия. Однако если бы было больше переменных, можно было бы, используя табл. 3.3, найти вторую остаточную матрицу и рассчитать нагрузки на третий фактор.

Наконец, переменные, которые изменяли свои знаки на каждой стадии процесса, должны в самом конце восстановить их. В нашем примере это означает, что нагрузки для переменных 4, 5 и 6 на второй фактор, приведенные в последней строке табл. 3.3, нужно взять со знаком минус.

Таблица 3.3 (см. скан) Остаточная матрица с измененными знаками. По диагонали — грубые оценки факторных дисперсий (по второму фактору)

Более того, когда определяется более чем два центроидных фактора, также требуется изменять знаки нагрузки для этих переменных, причем подобный процесс замены переменных требуется на каждой последовательной стадии анализа.

В табл. 3.4 даны нагрузки на два фактора после восстановления знаков и новые оценки факторных

Таблица 3.4 (см. скан) Первые оценки центроидных нагрузок

дисперсий, полученные как суммы квадратов нагрузок для каждого переменного. Так, для переменной 1 имеем: 0,5922 + 0,3352 = 0,463. Чтобы получить более точные оценки нагрузок, можно вписать в диагональные клетки первоначальной матрицы полученные оценки факторных дисперсий и повторить процесс сначала. Оценки после следующей итерации представлены в табл. 3.5.

Таблица 3.5 (см. скан) Вторые оценки центроидных нагрузок

3.5.    Упрощение последующих итераций

При больших первоначальных матрицах итерационный процесс весьма утомителен, и на практике редко проводится значительное число итераций. Однако, как только становится известным, что смена знаков

необходима на каждой стадии (а это обычно происходит после первой итерации), процесс можно упростить и значительно ускорить. Поскольку эта возможность не является широко известной, мы разберем ее подробнее. Если замены знаков известны заранее, то центроидный метод становится совсем простым для осуществления.

Лучше всего представить процесс изменения знаков, вводя матрицу элементами равными либо либо —1. Если все корреляции в первоначальной матрице положительны, то первый столбец в будет состоять только из но последующие столбцы будут иметь элементы, равные —1: для ненулевой нагрузки переменной на фактор элемент будет, как правило, иметь знак Обозначим ковариационную (или корреляционную) матрицу с факторными дисперсиями на диагонали через

Предположим для простоты, что так что состоит из двух столбцов Обозначим соответствующие два столбца матрицы факторных нагрузок через и 12. Тогда центроидным методом находится из уравнения

где положительное число, такое, что

Остаточная матрица, когда влияние первого фактора уже учтено, равна можно теперь найти, умножая ее слева на

где положительное число, такое, что

Умножая (3.4) справа на и используя (3.3), установим, что

Простая проверка показывает, что уравнения (3.3) и (3.4) объединяются в простое соотношение

где и из (3.5) следует, что треугольная матрица с нулевыми элементами над диагональю. Очевидно, что это будет верно и для больших значений Вообще, эта процедура определяет однозначно.

Если считать известной, то процесс расчетов можно провести до конца на каждой стадии значительно проще, чем обычным методом нахождения остаточной матрицы. Если получена матрица ее можно легко представить в виде где треугольная матрица с положительными элементами на диагонали, для которой легко найти обратную матрицу (см. приложение, стр. 134). Из (3.6) следует, что матрица может быть найдена в виде

В нашем примере

корреляционная матрица с факторными дисперсиями, приведенными в табл. 3.5, по диагонали. Матрицы вычисляются и равны соответственно

и

Если

Следовательно, и отсюда

Снова, если то

Так что Значит,

Из уравнения (3.7) находятся новые оценки факторных нагрузок и факторных дисперсий. Их значения приведены в табл. 3.6. Затем, используя новые оценки

Таблица 3.6 (см. скан) Третьи оценки центроидных нагрузок

Затем, используя новые оценки в А0, производим последующую итерацию. Численные значения нагрузок указывают на сходимость. Эти данные приведены в табл. 3.7.

Теперь можно вычислить итоговый вклад каждого фактора в суммарную дисперсию шести переменных. Для этого надо взять сумму квадратов нагрузок по каждому из них. Поскольку для первого фактора эта величина равна 2,218, то в пределах суммарной

Таблица 3.7 (см. скан) Четвертые оценки центроидных нагрузок

дисперсии шести переменных (т. е. 6) получим 37%. Соответствующее значение для второго фактора есть 0,594 или 10%.

Categories

1
Оглавление
email@scask.ru