Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
8.4. ОБЗОР МЕТОДОВ, ПРИМЕНЯЕМЫХ НАРЯДУ С ФАКТОРНЫМ АНАЛИЗОМИмеется ряд методов, которые более или менее тесно связаны с факторным анализом и используются для решения некоторых специфических задач. Эти методы не изолированы, а проникают и переходят один в другой. Поэтому провести четкие границы между ними очень трудно. Пока также не удалось найти формальных путей перехода от одного к другому. Далее кратко, не останавливаясь на практических приложениях, опишем три таких метода многомерного статистического анализа, ограничившись только принципиальной постановкой вопроса. В гл. 8.6 будут рассмотрены еще несколько методов. Место факторного анализа среди многомерных статистических методов мы уже установили в гл. 2.5. 8.4.1. Кластерный анализЗадача кластерного анализа (cluster-analyse) состоит в разбиении множества точек на кластеры (подмножества, cluster) так, чтобы каждая точка принадлежала одному и только одному подмножеству разбиения. При этом в каждом подмножестве разбиения точки лежат плотно друг к другу и являются сходными, в то время как точки, принадлежащие разным подмножествам, являются разнородными. Точки могут быть переменными, индивидуумами и другими величинами, которые содержатся в матрице исходных данных. Трион [289; 1,2,3, 4, 5, 6] ввел определение кластерного анализа и много работал в этой области. В принципе задача кластерного анализа сводится к разработке определенного правила, или алгоритма, с помощью которого можно осуществлять разбиение точек на группы. При этом остается неизвестно, действительно ли найденные группировки являются наилучшими. В кластерном анализе при построении процедуры группировки используется В-коэффициент, или коэффициент принадлежности (coefficient of belonging), вычисляемый по ранее указанной формуле (3.32). При этом не разработано никакого удовлетворительного статистического критерия, который позволял бы оценить проведенное разбиение и принадлежность точки к определенной группе. При проведении кластерного анализа на моделях с четкой структурой отсутствие такого критерия не сказывается на качестве решения, но по данным реального исследования редко можно найти хорошую группировку. Вычислительная процедура кластерного анализа приведена у Фрюхтера [101]. Янг предложил для группировки переменных показатель кластеризации «index of clustering», который не связан с числом факторов в факторном анализе [326]. На рис. 8.3. сравниваются графически оба метода. Векторы являются переменными в пространстве общих факторов. Двух факторов вполне достаточно для объяснения связей между этими переменными. Задачей кластерного анализа является разбиение переменных на группы, наиболее отдаленные друг от друга. Для случая, изображенного на рис. 8.3, их можно разбить на три кластера. Одной из задач факторного анализа является снижение размерности набора переменных путем выделения скрытых за ними факторов, адекватно описывающих изучаемое явление. При вращении системы координат, осуществляемом при поиске простой структуры, кластеры часто располагаются вблизи гиперплоскостей координат. Кластерный анализ не связан с получением наилучших проекций совокупности точек наблюдения в пространстве меньшей размерности и выделением скрытых, но объективно существующих факторов. Кластерный анализ остается на уровне непосредственно наблюдаемых величин и пытается агрегировать их в определенные группы. Каттелл [35] выступал с критикой этого метода, приводя различную аргументацию. Так, он утверждал, что при переходе от выборки к выборке отдельные группировки переменных различаются между собой больше, чем выделенные факторы. Мы не можем полностью согласиться с этим выводом. Для его подтверждения нужны более обстоятельные исследования. Во всяком случае, число кластеров не связано с числом выделенных факторов, что нашло отражение на рис. 8.3.
Рис. 8.3. Кластерный и факторный анализ. Число кластеров и число факторов не связаны непосредственно между собой, например кластеров может быть больше, чем факторов В кластерном анализе отсутствует проблема общности и отпадает необходимость вращения. Трион [289; 2] был против применения факторного анализа и выступал в защиту кластерного. В качестве одного из аргументов он использовал тот недостаток модели факторного анализа, что факторные нагрузки К сожалению неизвестны никакие аналитические выражения, устанавливающие возможность перехода от одного метода к другому. Итак, задача кластерного анализа есть, по существу, задача классификации многомерных наблюдений, на которой мы еще подробнее остановимся в гл. 8.5.
|
1 |
Оглавление
|