ВАРИАНТЫ ФАКТОРНОГО АНАЛИЗА
Эти методы кластерного анализа весьма популярны в психологии. Они известны больше как варианты факторного анализа, обратный факторный анализ или факторизация
-типа. Работа методов начинается с формирования корреляционной матрицы сходств между объектами. Обычно факторный анализ проводится с корреляционной матрицей размерностью РХР, но если нужно определить кластеры, то анализ осуществляется на основе корреляционной матрицы размерностью NXN.
По корреляционной матрице определяются факторы, и объекты распределяются по кластерам в зависимости от их факторных нагрузок.
Использование факторного анализа Q-типа имеет долгую историю. Самыми ревностными сторонниками этого вида кластеризации до недавнего времени были Оуверолл и Клетт (1972), а также Скиинер (1979). Предметом критики методов факторного анализа в кластеризации стали неправомерное применение линейной модели к объектам, проблема множественных факторных нагрузок (неясно, что делать с объектом, который имеет высокие нагрузки более чем для одного фактора) и двойное центрирование данных (Everitt, 1980; Fleiss et. al., 1971).
Чтобы дать читателю представление о том, как используется обратный факторный анализ, приведем пример, где рассматривается модальный профильный анализ (Skinner, 1979). В этом методе кластеризации для формирования пространства малой размерности, представляющего соотношения между объектами, взята декомпозиция Экерта — Юнга. Подход Скиннера на основе пространственной модели (концептуальные вопросы часто возникают в связи с обратным факторным анализом) обсуждается в (Skinner, 1979). Процедура состоит из трех главных шагов: 1) начальной оценки факторов; 2) увеличения числа факторов с помощью повторных выборок и 3) проверки общности факторов на новой выборке. Первый шаг этой процедуры иллюстрируется данными MMPI-теста.
Трехфакторное решение было выбрано потому, что нам заранее известно о существовании трех кластеров в данных. Первые семь собственных значений решения равны:
Используя стандартные приемы факторного анализа для оценки числа факторов, можно было бы привести доводы в пользу того, что двухфакторное или четырехфакторное решение будет более приемлемо, чем трехфакторное. Тем не менее, поскольку было известно, сколько диагностических классов существует в данных, рассматривалось только трехкластерное решение.
Первым с помощью модального профильного анализа был получен биполярный фактор, который положительно коррелировал с фактором, соответствующим больным неврозами и отрицательно — с факторами, соответствующими больным расстройствами личности. Третий фактор включал в основном факторы, соответствующие больным психозами. Второй фактор состоял из всех факторов трех групп больных.
Три модальных профиля похожи на те, которые большинство психологов-клиницистов описывают как типичные MMPI-профили больных «неврозами», «расстройствами личности» и «психозами». Однако они имеют меньшие различия, чем профили для реальных трех групп в данных. Это согласуется с главной чертой обратного факторного анализа, который придает большее значение форме, а не сдвигу.