Главная > Факторный, дискриминантный и кластерный анализ
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

ГЕОМЕТРИЧЕСКИЙ МЕТОД ВРАЩЕНИЯ, ПРОСТАЯ СТРУКТУРА И ВТОРИЧНЫЕ ОСИ

Геометрический метод вращения практически неприменим, когда скопления точек трудно разделимы или когда число факторов больше двух. Мы рассматриваем этот подход только потому, что он дает возможность лучше понять аналитический способ вращения. Хорошим введением в геометрический метод служит работа Мьюлейка (Mulaik, 1972).

Целью всех вращений является получение наиболее простой факторной структуры. К сожалению, концепция простоты неоднозначна, и поэтому не существует единых формальных критериев.

Наиболее полное определение простой структуры дано Тэрстоуном (Thurstone, 1947), но в последнее время уже выяснилось, что не все его критерии формализуются в аналитическом виде. Поскольку Тэрстоун использует понятие гиперплоскости или подпространства, мы остановимся на более простом подходе Мьюлейка (Mulaik, 1972), предполагающем знание лишь элементов теории векторных пространств. (В определении Мьюлейка через обозначено число общих факторов, а V — матрица вторичной структуры, образованная координатами (нагрузками) вторичных факторов, получаемых в результате вращения.)

1) В каждой строке матрицы вторичной структуры V должен быть хотя бы один нулевой элемент. Это предположение является основным в определении простой структуры.

2) Для каждого столбца k матрицы вторичной структуры V должно существовать подмножество из линейно-независимых наблюдаемых переменных, корреляции которых с k-м вторичным фактором — нулевые. Данный критерий сводится к тому, что каждый столбец матрицы должен содержать не менее нулей.

3) У одного из столбцов каждой пары столбцов матрицы V должно быть несколько нулевых коэффициентов (нагрузок) в тех позициях, где для другого столбца они ненулевые. Это предположение гарантирует различимость вторичных осей и соответствующих им подпространств размерности в пространстве общих факторов.

4) При числе общих факторов больше четырех в каждой паре столбцов должно быть некоторое количество нулевых нагрузок в одних и тех же строках. Данное предположение дает возможность разделить наблюдаемые переменные на отдельные скопления.

5) Для каждой пары столбцов матрицы V должно быть как можно меньше значительных по величине нагрузок, соответствующих одним и тем же строкам. Это требование обеспечивает минимизацию сложности переменных.

Сформулированные критерии основаны на двух соображениях: а) необходимо определить признаки простой структуры и б) необходимо выяснить условия, при которых простая структура выделяется однозначно и объективно. В специальных работах по факторному анализу при обсуждении этого понятия преобладает второе соображение. Мы же оставим этот вопрос специалистам, и сосредоточим наше внимание на первом.

Хотя трудно определить минимальные требования к простой структуре, но если взять число факторов и число переменных , то всегда можно сказать, какая структура наиболее простая. Факторная структура является наипростейшей, когда все переменные имеют факторную сложность, равную 1, т. е. когда каждая переменная имеет ненулевую нагрузку только на один общий фактор. Если число факторов два и больше, то это означает, что в наиболее простой матрице факторной структуры, во-первых, каждая строка будет содержать только один ненулевой элемент, во-вторых, каждый столбец будет иметь несколько нулей и, в-третьих, для каждой пары столбцов нулевые элементы не совпадают.

Для реальных данных такая простая структура недостижима. Следовательно, задача состоит в том, чтобы «определить» факторную структуру, которая является самой «близкой» к простой структуре. Здесь специалисты расходятся в определении «простоты» для таких «несовершенных» структур, а также в вычислительных методах решения задачи. Как уже отмечалось, критерий Тэрстоуна дает эмпирические условия, при которых простая структура определяется однозначно. Одно из них состоит в следующем: для каждого фактора должны существовать по крайней мере три переменные, имеющие на этот фактор значительную нагрузку. Но определение простой структуры никак не зависит от этого эмпирического ограничения, принимаемого при анализе реальных данных. В разведочном факторном анализе исследователь вынужден довольствоваться теми переменными, которыми он располагает, и прежде чем начать интерпретировать факторы, заранее определить, что он понимает под «простой» структурой.

Первоначально простую факторную структуру определяли в терминах вторичных осей. Хотя это понятие не является абсолютно необходимым (так как есть методы косоугольных вращений, где вторичные оси не вводятся), мы остановимся на нем, поскольку в некоторых компьютерных программах для косоугольных вращений введение этих осей предполагается.

Заметим, что первичные факторные нагрузки — это не что иное, как проекции переменных на две оси (в случае двухфакторной модели), т. е. нагрузки определяются при опускании перпендикуляров из данной точки на первичные ортогональные оси. Простая структура получается в том случае, когда все значения переменных лежат на этих осях. В ортогональном случае простая структура задается множеством точек, имеющим ненулевые нагрузки (нулевые проекции) только на один фактор (на одну ось). Проекция будет ненулевой, если угол между скоплениями точек отличен от прямого угла. При этом следует провести вторичные оси перпендикулярно гиперплоскостям, проходящим через эти скопления, которые сами могут рассматриваться как первичные факторы (для двухфакторной модели гиперплоскость есть прямая; рис. 4).

Таким образом, можно предположить, что скопления точек находятся на первичных осях, или же что проекции точек на вторичных осях — нулевые. В нашем примере переменные имеют нулевые проекции на вторичной оси , а переменные — нулевые проекции на оси Однако не ясно, зачем проводить вторичные оси, вместо того чтобы провести первичные оси прямо через скопления точек. Следует отметить, что метод, основанный на идентификации вторичных осей, при котором они рассматриваются как ортогональные, позволяет более точно определить первичные оси, если число факторов больше двух, а скопления точек не столь явные, как в модельных данных.

Рис. 4. — первичные косоугольные факторы; — соответствующие вторичные оси. Проекции будут нулевыми на оси а проекции — на оси

Из всего сказанного можно сделать вывод, что основная цель вращения заключается в нахождении матрицы факторного отображения, наиболее близкой к простейшей идеальной структуре, описанной выше.

1
Оглавление
email@scask.ru