Главная > Факторный анализ как статистический метод
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

1.2. Модели факторного анализа

При анализе структуры ковариационных (или корреляционных) матриц чаще всего используются два подхода, формально до некоторой степени похожих друг на друга, однако различных по целям. Одним из них является метод главных компонент по Пирсону (Pearson, 1901) и Хотеллингу (Hotelling, 1933), другим — факторный анализ, возникший как метод в работах Спирмана (Spearman, 1904, 1926). Следует различать эти два подхода, и, хотя в этой книге изучается прежде всего факторный анализ, в ней будет описан и метод главных компонент. Последний по существу совпадает с методом расчленения коварна ционной или корреляционной матрицы на совокупи ность ортогональных векторов (компонент) или направлений по числу рассмотренных переменных. Эти векторы соответствуют собственным векторам и собственным значениям корреляционных матриц (см. приложение 1). По этому методу собственные значения выделяются в порядке убывания их величины, что становится существенным, если для описания данных должно быть использовано лишь незначительное число компонент. Векторы попарно ортогональны, и компоненты, полученные по ним, некоррелированы. Хотя

несколько компонент могут выделить большую часть суммарной дисперсии переменных, однако для точного воспроизведения корреляций между переменными требуются все компоненты. В тех случаях, когда применяется метод главных компонент, не нужно делать никаких гипотез о переменных, они не обязаны даже быть случайными величинами, хотя на практике их наблюденные значения рассматриваются как выборки из некоторой популяции.

В противоположность методу главных компонент факторный анализ заранее объясняет матрицу ковариаций наличием минимального или по крайней мере небольшого числа гипотетических переменных или факторов.

Переведем это на язык корреляций. Первый возникающий вопрос: существуют ли значимые корреляции, т. е. отличается ли корреляционная матрица значимо от единичной матрицы? Если исследователь убежден, что это так, тогда он спрашивает: существует ли случайная величина такая, что попарные корреляции между переменными равны нулю, если влияние уже учтено? Если после этого корреляционная матрица еще не объяснена, он исследует: существуют ли такие две случайные величины что корреляции между парами переменных равны нулю, если влияние учтено, и так далее... (Howe, 1955, стр. 8 и след.). Таким образом, можно сказать, что, в то время как метод главных компонент ориентирован на дисперсии, факторный анализ ориентирован на ковариации (или на корреляционную связь).

Цели двух этих методов анализа можно также сформулировать в терминах наблюдаемых переменных и искомых компонент или факторов. Пусть суть наблюденных переменных. В компонентном анализе к ним применяется ортогональное преобразование для получения некоррелированных переменных Они выбираются так, что имеет максимум дисперсии, максимум дисперсии при требовании некоррелированности и т. д., причем относительно переменных не надо делать никаких предположений.

В факторном анализе основным предположением является равенство

где есть простой фактор точно задано и остатки, которые представляют источники отклонений, действующие только на Эти случайных величин предполагаются независимыми как между собой, так и с величинами Вначале мы будем предполагать, что некоррелированны, однако позднее мы рассмотрим и случай коррелированных факторов. Не умаляя общности, мы можем считать дисперсию каждого из равной единице. Дисперсии обозначим через Все средние предполагаются равными нулю. Коэффициент обычно называется или нагрузкой фактора в переменной, или нагрузкой переменной на фактор. Значения а также считаются обычно неизвестными параметрами, подлежащими оценке. Здесь можно упомянуть, что были сделаны попытки считать индивидуальные значения параметрами, но это привело к трудностям, важнейшая из которых состоит в том, что число параметров растет до бесконечности при неограниченном увеличении объема выборки (Whittle, 1953). Этот подход в нашей книге не рассматривается.

Очевидно, что уравнения (1.1) нельзя проверить непосредственно, поскольку переменных выражены в них через других ненаблюдаемых переменных. Но эти уравнения заключают в себе гипотезу о ковариациях и дисперсиях которую можно проверить (см. гл. 2).

Следует указать еще на одно различие между методом главных компонент и факторным анализом, замеченное Бартлеттом (Bartlett, 1953, стр. 32 и след.). Первый из этих методов по определению является линейным и аддитивным и даже не ставит вопроса о

гипотезе, тогда как второй несет в себе так называемую гипотезу линейности, которая, если она не верна, может быть использована как первое приближение. Однако она будет отвергнута как линейная модель, постулируемая уравнением (1.1), если фактические данные приведут к этому.

Так как корреляция по существу относится к линейным связям, то модель в таком виде не пригодна для манипуляций, и Бартлетт вкратце показывает, как можно подправить структуру уравнений для улучшения соответствия модели: добавить (как следующее приближение) вторые степени и произведения факторов. В подправленных уравнениях особый интерес представляет произведение факторов; так, равенства

которые содержат ровно два фактора, станут такими:

где Несмотря на то, что детали этого более сложного варианта еще только разрабатываются, упоминание о нем полезно, чтобы напомнить предположения линейности, содержащиеся в уравнении (1.1), и подчеркнуть различие между факторным анализом и эмпирической природой компонентного анализа.

Categories

1
Оглавление
email@scask.ru