Главная > Факторный, дискриминантный и кластерный анализ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

Метод максимального правдоподобия

Метод максимального правдоподобия преследует ту же цель, что и метод наименьших квадратов — найти факторное решение, которое наилучшим образом объясняет наблюдаемые корреляции. Алгоритм можно представить следующим образом. Допустим, что наблюдаемые данные — это выборка из генеральной совокупности, которая точно соответствует -факторной модели. Совместное распределение переменных (включая факторы) предполагается многомерным нормальным. Неизвестными являются значения нагрузок для каждой переменной. Задача сводится к оцениванию значений латентных переменных (нагрузок) генеральной совокупности, при которых в заданных предположениях функция правдоподобия для распределения элементов корреляционной матрицы максимальна. Несколько иной критерий заключается в нахождении факторных нагрузок, при которых общие факторы и наблюдаемые переменные находятся в канонической корреляции, т. е. коэффициент корреляции между ними максимален. Третий критерий, основанный на тех же принципах, сводится к определению факторных нагрузок, при которых детерминант матрицы остаточных корреляций максимален. Все эти критерии достаточно сложны для практического применения, но существуют различные итерационные схемы для получения на их основе решений, существенно отличающихся друг от друга с точки зрения вычислительной эффективности.

В настоящее время метод, предложенный Йореско (Joreskog, 1967), считается одним из лучших.

В принципе все варианты метода максимального правдоподобия сводятся к решению характеристического уравнения, которое может быть представлено в виде

где определяется соотношением

причем — оценка дисперсии характерных параметров. Разница между уравнениями (4) и (10) в том, что в последнем используется редуцированная корреляционная матрица вместо корреляционной матрицы R. В отличие от метода наименьших квадратов в вычисляемую на каждом шаге оценку общностей с большим весом входят корреляции с переменными, имеющими меньшую характерность. Заметим, что выражение в (11) то же самое, что в (9), т. е. вся разница только в весовых множителях. В методе максимального правдоподобия характерность играет роль дисперсии «квази-ошибки»: больший вес имеют переменные с максимальной общностью (т. е. с минимальной характерностью).

Таблица 4. Двухфакторное решение методом максимального правдоподобия для наддиагональных элементов табл. 1

Это соответствует основному принципу статистического оценивания, по которому менее точные наблюдения учитываются с меньшим весом.

Мы упомянули о том, что с помощью оптимальных алгоритмов можно точно оценить переменные генеральной совокупности для модельных данных в отсутствии ошибок. Хорошие программные реализации таких алгоритмов позволяют практически использовать эти потенциальные возможности.

В табл. 4 представлены результаты применения метода максимального правдоподобия к выборочным корреляциям, являющимся наддиагональными элементами табл. 1. Как мы и ожидали, гипотеза адекватности для полученного решения подтверждается.

Формула для вычисления статистики показывает, что ее значение определяется объемом выборки, в то время как число степеней свободы от выборки не зависит:

где — натуральный логарифм; — след матрицы; N — объем выборки; — число переменных, R — матрица ковариаций; — матрица факторных нагрузок; — характерности. (Это же соотношение используется для проверки адекватности решения методом наименьших квадратов, отличие только в оценках F и U.) Важно отметить, что при фиксированной корреляционной матрице, величина U. пропорциональна объему выборки N. Соответствующее число степеней свободы равно:

где k — число гипотетических факторов, а — число переменных.

Как видно, не зависит от объема выборки

Существенное преимущество метода максимального правдоподобия сострит в том, что для большой выборки он позволяет получить критерий значимости. Если критерий показывает значимое отклонение наблюдений от -факторной модели, то в рассмотрение вводится модель с факторами.

В разведочном анализе вычисления, как правило, начинают с одного фактора, а заканчивают, когда отклонение наблюдений от модели становится статистически незначимо. Хотя эти последовательные проверки гипотез находятся в зависимости друг от друга, на практике это несущественно (Lawley, Maxwell, 1971).

Если при оценивании числа факторов положиться на один только критерий значимости, то возникает опасность получить факторов больше, чем нужно. Там, где модель всего лишь приближена к реальности, неизбежные невязки обусловливают появление дополнительных значимых факторов. В разд. IV мы вернемся к вопросам, связанным с определением числа факторов.

Categories

1
Оглавление
email@scask.ru