Главная > Факторный анализ как статистический метод
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

2.4. Числовой пример

Для иллюстрации вычислений по методу максимального правдоподобия воспользуемся данными, приведенными Эмметом (Emmett, 1949) для 9 переменных при выборке в 211 объектов. Матрица корреляций представлена в табл. 2.1; ее можно считать нормализованной ковариационной матрицей. Ниже приводятся детали вычислений. Сначала рассматривается гипотеза, что два фактора вполне объясняют корреляции. Приводится только один цикл итераций. С тех пор как был опубликован анализ Эммета, была написана программа (Nixon, Maxwell, 1960) для получения оценок нагрузок методом максимального правдоподобия на «Меркурии» (Mercury Electronic Computer) и результаты получены.

Эммет начал свои итерации с нагрузок, даваемых центроидным методом (см. гл. 3). Это, как правило, весьма разумно, так как хорошие начальные оценки значительно облегчают итеративный процесс. Однако была возможность (при имеющейся в распоряжении вычислительной машине) угадать приблизительные оценки нагрузок для начальных значений, столь же хорошие, как и их центроидные оценки; в этом примере сходимость была достигнута без труда. Вообще это не всегда так, и рекомендуется использовать вначале наилучшие из имеющихся оценок, иначе сходимость может отсутствовать или быть очень медленной.

Строки табл. 2.1, показывающей детали вычислений, отмечаются соответствующими символами. Первые две строки представляют центроидные нагрузки,

(см. скан)

которые используются как начальные оценки. В третьей строке показаны начальные оценки остаточных дисперсий в табл. 2.1, конечно, лишь диагональ матрицы они получены вычитанием из единицы суммы квадратов нагрузок каждого переменного на два фактора. Например, первая запись в третьей строке есть Элементы в строках и получены делением элементов первых двух строк на соответствующие элементы третьей строки. Строка, обозначенная задается выражением и может быть вычислена непосредственно, если пользуются настольной вычислительной машинкой. Ее первый элемент, например, равен скалярному произведению на первый столбец (или строку) корреляционный матрицы минус 0,718 (первый элемент в Аналогично, как только будет найдено, строку можно вычислить непосредственно на настольной машинке по формуле Элементы 12) являются соответствующими элементами умноженными на число равное 0,07299; подобным образом элементами являются соответствующие элементы умноженные на число равное 0,3250.

Выполняя вычисления на настольной машинке, полезно иметь контрольный столбец. Например, скалярное произведение и вектора контрольных сумм матрицы А равно 89,968. Вычитая из этого значения сумму строки а именно 6,192, мы получим 83,776, что совпадает (пренебрегая ошибками округления) с суммой строки Аналогично скалярное произведение и столбца контрольных сумм матрицы А равно —9,657; вычтя отсюда сумму строки равную 0,012, и произведение на сумму строки которое равно —11,833, получим 2,164, что совпадает с суммой строки

Теперь можно выполнить второй цикл итерационного процесса, используя новые оценки нагрузок,

данные в строках табл. 2.1, и процесс можно повторять до тех пор, пока нагрузки не сойдутся к стационарным значениям. Предельные значения, полученные после большого числа итераций на ЭЦВМ, приведены в табл. 2.2.

Таблица 2.2 (см. скан)Оценки максимального правдоподобия для нагрузок при двух факторах I и II

Суммарная дисперсия равна 9, и процент, выделяемый каждым из факторов, можно получить, вычисляя

для . Эти значения суть 47,3% и 10,7%.

Следующей стадией процесса является нахождение матрицы остаточных ковариаций (где V — матрица нагрузок из табл. 2.2) и проверка, подтверждается ли гипотеза о существовании лишь двух факторов. Детали расчетов на этой стадии будут приведены позднее.

Предыдущие расчеты приводят к мысли, что может существовать третий фактор, имеющий ощутимую нагрузку по крайней мере для восьмого переменного. Для исследования этой возможности были вычислены центроидные нагрузки для третьего фактора.

(см. скан)

Взяв их и уже имеющиеся оценки за начальное приближение для двух факторов, мы нашли методом максимального правдоподобия оценки нагрузок для трех факторов. Вычисленные на «Меркурии» значения оценок представлены в табл. 2.3, причем, как и ожидалось, наибольшую нагрузку третий фактор имеет в восьмом переменном.

Таблица 2.3 (см. скан)Оценки максимального правдоподобия нагрузок при трех факторах I, II, III

После этого в качестве эксперимента было решено повторить расчеты, используя менее точную аппроксимацию для начального приближения, чем это дает центроидный метод. Были использованы следующие значения:

(см. скан)

Это привело, без усложнений и потери машинного времени, к значениям, полученным ранее (табл. 2.3). Однако этот пример является в некотором смысле исключением. Опыт показывает, что при отсутствии хорошего начального приближения могут возникнуть

определенные трудности. Так, когда заранее постулировано существование трех или более факторов, является обычным почти совпадение с единицей одной из нагрузок, что приводит к разрушению итеративного процесса.

Чтобы избежать этого, Лорд (Lord, 1958) предложил, когда получена уже сходимость для меньшего числа факторов, получать приближенные оценки (см. гл. 3) нагрузок для следующего фактора из матрицы остатков. Это можно включить в итерационный процесс и повторять расчет для каждого добавляемого фактора.

Categories

1
Оглавление
email@scask.ru