14.2. Каноническая модель факторного анализа

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

14.2. Каноническая модель факторного анализа

14.2.1. Общий вид модели, ее связь с главными компонентами.

Как и прежде, будем для удобства полагать исследуемые наблюдения центрированными. Переход от исходных наблюдений и центрированным осуществляется с помощью простого переноса начала координат в «центр тяжести» исходного множества наблюдений, т. е. . Тогда линейная версия модели факторного анализа представляется в виде соотношений

или в компонентной записи

Здесь — прямоугольная матрица размера коэффициентов линейного преобразования (нагрузок общих факторов на исследуемые признаки), связывающего исследуемые признаки с ненаблюдаемыми (скрытыми) общими факторами , а вектор-столбец определяет ту часть каждого из исследуемых признаков, которая не может быть объяснена общими факторами, в том числе включает в себя, как правило, ошибки измерения признака

Применительно к каждому конкретному наблюдению соотношение (14.1) дает

или в компонентной записи

Будем предполагать, что вектор остаточных специфических факторов U подчиняется -мерному нормальному распределению , не зависит от F и состоит из взаимно независимых компонент, т. е. его ковариационная матрица имеет диагональный вид, где по диагонали стоят элементы

Вектор общих факторов в зависимости от содержания конкретной задачи, может интерпретироваться либо как -мерная нормальная случайная величина со средним (в силу центрированности исходных наблюдений) и с ковариационной матрицей специального вида либо как вектор неизвестных неслучайных параметров, вспомогательных переменных, значения которых меняются от наблюдения к наблюдению. При последней интерпретации вектора общих факторов более правильной является запись модели в виде (14.1), причем условия центрированности независимости и нормированности дисперсий компонент вектора F в этом случае имеют вид:

Однако при обоих вариантах интерпретации вектора общих факторов F исследуемый вектор наблюдений X оказывается нормально распределенной -мерной случайной величиной: при первом варианте как линейная комбинация двух нормальных случайных векторов (F и U), а при втором варианте за счет нормальности специфических факторов При этом из (14.1) и из сделанных выше допущений немедленно следует, что

или в матричной записи

Примером достаточно прозрачной интерпретации модели факторного анализа может служить ее формулировка в терминах так называемых интеллектуальных тестов. При этом наблюдение по признаку выражает отклонение оценки, например в баллах, данной индивидууму на экзамене по тесту, от некоторого среднего уровня. Естественно предположить, что в качестве ненаблюдаемых общих факторов от которых будут зависеть оценки индивидуумов по всем тестам, выступят такие факторы, как характеристика общей одаренности индивидуума характеристики его математических технических или гуманитарных способностей.

Отметим, что соотношения (14.1) в точности воспроизводят модели множественной регрессии и дисперсионного анализа [12], в которых под понимаются так называемые объясняющие переменные (факторы-аргументы). Однако принципиальное отличие модели факторного анализа от регрессионных схем и дисперсионного анализа состоит в том, что переменные выступающие в роли аргументов во всех этих моделях, не являются непосредственно наблюдаемыми в моделях факторного анализа, в то время как в регрессионном и дисперсионном анализе значения измеряются на статистически обследованных объектах.

Замечание 1.0 связи метода главных компонент и метода факторного анализа. Рассмотрим следующую общую схему, включающую в себя в качестве частных случаев обе сравниваемые модели. Примем гипотезу, что существуют такие взаимно некоррелированные факторы (быть может, в неограниченном числе), что

или в матричной записи

где случайных переменных без ограничения общности можно предположить, что

Очевидно, представление (14.3), если оно существует, не единственно, так как переходя от F с помощью произвольного ортогонального преобразования С к новым переменным будем иметь вместо (14.3) следующее соотношение:

Исследователю не известны коэффициенты но он хочет научиться наилучшим (в некотором смысле) образом аппроксимировать признаки с помощью линейных функций от небольшого (заранее определенного) числа факторов , которые поэтому естественно назвать главными или общими. Аппроксимация признаков X с помощью означает представление X в виде (14.3), но с «урезанной» суммой, стоящей в правой части, т. е.

где — матрица, составленная из первых тстолбцов матрицы A, a

Оказывается, что, по-разному формулируя критерий оптимальности аппроксимации X с помощью придем либо к главным компонентам, либо к общим факторам. Так, например, если определение элементов матрицы подчинить идее минимизации отличия ковариационной матрицы 2 исследуемого вектора X от ковариационной матрицы аппроксимирующего вектора (в смысле минимизации евклидовой нормы то ) определяется пропорционально главной компоненте вектора X. в частности , где величине характеристический корень ковариационной матрицы главная компонента столбец матрицы есть где — собственный вектор матрицы , соответствующий характеристическому

Если же определение аппроксимирующего вектора подчинить идее максимального объяснения корреляции между исходными признаками с помощью вспомогательных (ненаблюдаемых) факторов и, в частности, идее минимизации величины

при условии неотрицательности величин , то можно показать строка оптимальной в этом смысле матрицы преобразования состоит из факторных нагрузок общих факторов на исходный признак в модели факторного анализа вида (14.1). Другими словами, сущность задачи минимизации (по ) величины (14.5) состоит в следующем. Первый из общих факторов находится из условия, чтобы попарные корреляции между исходными признаками были как можно меньше, если влияние на них этого фактора учтено. Следующий общий фактор находится из условия максимального ослабления попарных корреляционных связей между исходными признаками, оставшихся после учета влияния первого общего фактора , и т. д.

Из сказанного, в частности, следует, что методы главных компонент и факторного анализа должны давать близкие результаты в тех случаях, когда главные компоненты строятся по корреляционным матрицам исходных признаков, а остаточные дисперсии сравнительно невелики.

Замечание 2. Вопрос о существовании модели факторного анализа. По-видимому, не всякая ковариационная матрица допускает представление вида (14.2), а следовательно, не всякий вектор наблюдений X допускает интерпретацию в рамках модели факторного анализа типа (14.1). Очевидно, условия представимости вектора наблюдений X в рамках модели факторного анализа должны формулироваться в терминах свойств ковариационной матрицы 2, а также в виде некоторых соотношений между размерностью исходного пространства и числом общих факторов . Одним из наиболее общих (но малоконструктивных) результатов такого рода является, например, следующее утверждение: для того чтобы вектор X допускал представление вида (14.1), необходимо и достаточно, чтобы существовала диагональная матрица V с неотрицательными элементами, такая, что матрица была бы неотрицательно-определенной и имела бы ранг . Более детальное и конструктивное исследование условий существования модели факторного анализа читатель сможет найти, например, в [180]. Заметим лишь, что изучение проблемы существования (разрешимости уравнений (14.1)) модели факторного анализа дает основу для построения различных статистических критериев адекватности модели по отношению к исследуемым наблюдениям

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
ВВЕДЕНИЕ. КЛАССИФИКАЦИЯ И СНИЖЕНИЕ РАЗМЕРНОСТИ. СУЩНОСТЬ И ТИПОЛОГИЗАЦИЯ ЗАДАЧ, ОБЛАСТИ ПРИМЕНЕНИЯ
B.1. Сущность задач классификации и снижения размерности и некоторые базовые идеи аппарата многомерного статистического анализа
В.2. Типовые задачи практики и конечные прикладные цели исследований, использующих методы классификации и снижения размерности
В.3. Типологизация математических постановок задач классификации и снижения размерности
В.4. Основные этапы в решении задач классификации и снижения размерности
ВЫВОДЫ
Раздел I. ОТНЕСЕНИЕ К ОДНОМУ ИЗ НЕСКОЛЬКИХ КЛАССОВ, ЗАДАННЫХ ПРЕДПОЛОЖЕНИЯМИ И ОБУЧАЮЩИМИ ВЫБОРКАМИ
1.1.1. Критерий отношения правдоподобия как правило классификации.
1.1.2. Основные математические модели.
1.1.3. Классификация посредством задания границы критической области.
1.1.4. Функция потерь.
1.1.5. Другие многомерные распределения.
1.2. Характеристики качества классификации
1.2.2. Изменение порога критерия.
1.2.3. Условная вероятность быть случаем.
1.2.4. Аналитические меры разделимости распределений.
1.3. Два класса, заданные генеральными совокупностями
1.3.2. Древообразные классификаторы.
1.3.3. Метод потенциальных функций.
1.3.4. Поиск характерных закономерностей.
1.3.5. Коллективы решающих правил.
1.4. Отбор информативных переменных
1.4.2. Функции потерь.
1.4.3. Схемы последовательного испытания наборов признаков.
1.5. Три и более полностью определенных класса
1.5.2. Модель нескольких многомерных нормальных распределений с общей ковариационной матрицей.
1.5.3. Упорядоченные классы.
ВЫВОДЫ
Глава 2. ТЕОРЕТИЧЕСКИЕ РЕЗУЛЬТАТЫ КЛАССИФИКАЦИИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК (ДИСКРИМИНАНТНЫЙ АНАЛИЗ)
2.1. Базовые понятия дискриминантного анализа
2.1.2. Основные виды ошибок.
2.1.3. Функции потерь.
2.2. Методы изучения алгоритмов ДА
2.2.2. Инвариантность и подобие алгоритмов.
2.2.3. Методы выработки рекомендаций.
2.3. Подстановочные алгоритмы в асимптотике растущей размерности
2.4. Статистическая регуляризация оценки обратной ковариационной матрицы в линейной дискриминантной функции для модели Фишера
2.5. Отбор переменных
2.6. Метод структурной минимизации риска
ВЫВОДЫ
Глава 3. ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО КЛАССИФИКАЦИИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК (ДИСКРИМИНАНТНЫЙ АНАЛИЗ)
3.1. Предварительный анализ данных
3.2. Оценивание отношения правдоподобия
3.3. Сводка рекомендаций по линейному дискриминантному анализу
3.4. Оценка качества дискриминации
3.5. Рекомендации для k >= 3 классов
ВЫВОДЫ
Глава 4. ПРИМЕНЕНИЯ ДИСКРИМИНАНТНОГО АНАЛИЗА
4.1. Группы риска и сравнительные испытания
4.2. Методы описания риска развития события
4.3. Другие применения ДА
ВЫВОДЫ
Раздел II. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ: МЕТОДЫ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ (КЛАСТЕР-АНАЛИЗА) И РАСЩЕПЛЕНИЕ СМЕСЕЙ РАСПРЕДЕЛЕНИЙ
Глава 5. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ, ИСПОЛЬЗУЕМЫЕ В МЕТОДАХ КЛАССИФИКАЦИИ БЕЗ ОБУЧЕНИЯ
5.2. Расстояния между отдельными объектами и меры близости объектов друг к другу
5.3. Расстояние между классами и мера близости классов
5.4. Функционалы качества разбиения на классы и экстремальная постановка задачи кластер-анализа. Связь с теорией статистического оценивания параметров
ВЫВОДЫ
Глава 6. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ (ПАРАМЕТРИЧЕСКИЙ СЛУЧАЙ). РАСЩЕПЛЕНИЕ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИИ
6.1. Понятие смеси вероятностных распределений
6.2. Общая схема решения задачи автоматической классификации в рамках модели смеси распределений (сведение к схеме дискриминантного анализа)
6.3. Идентифицируемость (различимость) смесей распределений
6.4. Процедуры оценивания параметров модели смеси распределений
6.4.2. Процедуры, базирующиеся на методе моментов.
6.4.3. Другие методы оценивания параметров смеси распределений.
6.5. Рекомендации по определению «исходных позиций» алгоритмов расщепления смесей распределений
ВЫВОДЫ
Глава 7. АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ, ОСНОВАННАЯ НА ОПИСАНИИ КЛАССОВ «ЯДРАМИ»
7.1. Эвристические алгоритмы
7.2. Алгоритмы, использующие понятие центра тяжести
7.2.2. Последовательные процедуры.
7.3. Алгоритмы с управляющими параметрами, настраиваемыми в ходе классификации
7.4. Алгоритмы метода динамических сгущений
7.4.3. Автоматическая классификация неполных данных.
7.5. Алгоритмы метода размытых множеств
7.5.2. Алгоритмы нечеткой классификации.
7.6. Алгоритмы, основанные на методе просеивания (решета)
ВЫВОДЫ
Глава 8. ИЕРАРХИЧЕСКАЯ КЛАССИФИКАЦИЯ
8.2. Методы и алгоритмы иерархической классификации
8.3. Графические представления результатов иерархической классификации
8.4. Приложения общей рекуррентной формулы для мер близости между классами
8.5. Быстрый алгоритм иерархической классификации
ВЫВОДЫ
Глава 9. ПРОЦЕДУРЫ КЛАСТЕР-АНАЛИЗА И РАЗДЕЛЕНИЯ СМЕСЕЙ ПРИ НАЛИЧИИ АПРИОРНЫХ ОГРАНИЧЕНИИ
9.1. Разделение смесей при наличии неполных обучающих выборок
9.2. Классификация при ограничениях на связи между объектами
9.3. Классификация на графах
ВЫВОДЫ
Глава 10. ТЕОРИЯ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
10.1. Математическая модель алгоритма автоматической классификации (ААК)
10.2. Базисная модель алгоритма АК, основанного на описании классов ядрами
10.3. Иерархическая структура многообразия алгоритмов АК
10.4. Исследование сходимости алгоритмов АК
ВЫВОДЫ
Глава 11. ВЫБОР МЕТРИКИ И СОКРАЩЕНИЕ РАЗМЕРНОСТЕЙ В ЗАДАЧАХ КЛАСТЕР-АНАЛИЗА
11.2. Метрики для задач кластер-анализа с неколичественными переменными
11.3. Алгоритмы классификации с адаптивной метрикой
11.4. Оценка метрики с помощью частично обучающих выборок
ВЫВОДЫ
Глава 12. СРЕДСТВА ПРЕДСТАВЛЕНИЯ И ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
12.1. Некоторые средства оценки результатов кластер-анализа
12.2. Связь между показателями качества прогноза переменных, метрикой и некоторыми критериями качества классификации в кластер-анализе
12.3. Некоторые методические рекомендации
12.4. Средства, помогающие интерпретации результатов
ВЫВОДЫ
Раздел III. СНИЖЕНИЕ РАЗМЕРНОСТИ АНАЛИЗИРУЕМОГО ПРИЗНАКОВОГО ПРОСТРАНСТВА И ОТБОР НАИБОЛЕЕ ИНФОРМАТИВНЫХ ПОКАЗАТЕЛЕЙ
13.1. Сущность проблемы снижения размерности и различные методы ее решения
13.2. Определение, вычисление и основные числовые характеристики главных компонент
13.3. Экстремальные свойства главных компонент. Их интерпретация
13.4. Статистические свойства выборочных главных компонент; статистическая проверка некоторых гипотез
13.5. Главные компоненты в задачах классификации
13.6. Нелинейное отображение многомерных данных в пространство низкой размерности
ВЫВОДЫ
Глава 14. МОДЕЛИ И МЕТОДЫ ФАКТОРНОГО АНАЛИЗА
14.1. Сущность модели факторного анализа, его основные задачи
14.2. Каноническая модель факторного анализа
14.2.2. Вопросы идентификации модели факторного анализа.
14.2.3. Определение структуры и статистическое исследование модели факторного анализа.
14.2.4. Факторный анализ в задачах классификации.
14.3. Некоторые эвристические методы снижения размерности
14.3.2. Метод экстремальной группировки признаков.
14.3.3. Метод корреляционных плеяд.
14.3.4. Снижение размерности с помощью кластер-процедур.
ВЫВОДЫ
Глава 15. ЭКСПЕРТНО-СТАТИСТИЧЕСКИЙ МЕТОД ПОСТРОЕНИЯ ЕДИНОГО СВОДНОГО ПОКАЗАТЕЛЯ ЭФФЕКТИВНОСТИ ФУНКЦИОНИРОВАНИЯ (КАЧЕСТВА) ОБЪЕКТА (СКАЛЯРНАЯ РЕДУКЦИЯ МНОГОКРИТЕРИАЛЬНОЙ СХЕМЫ)
15.1. Латентный единый (сводный) показатель «качества». Понятия «выходного качества» целевой функции и «входных переменных» (частных критериев)
15.2. Исходные данные
15.3. Алгоритмические и вычислительные вопросы построения неизвестной целевой функции
15.3.2. Оценивание неизвестных параметров целевой функции при балльных экспертных оценках выходного качества.
15.3.3. Оценивание неизвестных параметров целевой функции при экспертных ранжировках и парных сравнениях объектов.
15.4. Применение экспертно-статистического метода построения латентного интегрального показателя к решению практических задач
ВЫВОДЫ
Глава 16. МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ
16.1. Метрическое многомерное шкалирование
16.2. Неметрическое многомерное шкалирование [307, 261, 260, 152]
16.3. Шкалирование индивидуальных различий (ШИР)
ВЫВОДЫ
Глава 17. СРЕДСТВА АНАЛИЗА И ВИЗУАЛИЗАЦИИ НЕКОЛИЧЕСТВЕННЫХ ДАННЫХ
17.1. Анализ соответствий для двухвходовых таблиц сопряженностей
17.1.2. Проекции строк и столбцов. Связь с анализом главных компонент.
17.1.3. Интерпретация главных компонент в анализе соответствий.
17.1.4. Присвоение числовых меток строкам и столбцам.
17.2. Множественный анализ соответствий (МАС)
17.3. Алгоритмы оцифровки неколичественных переменных
ВЫВОДЫ
Раздел IV. РАЗВЕДОЧНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ И НАГЛЯДНОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Глава 18. РАЗВЕДОЧНЫЙ АНАЛИЗ. ЦЕЛИ, МОДЕЛИ СТРУКТУР ДАННЫХ, МЕТОДЫ И ПРИЕМЫ АНАЛИЗА
18.1. Цели разведочного анализа и модели описания структуры многомерных данных
18.2. Визуализация данных
18.3. Преобразования данных в разведочном анализе данных
18.4. Использование дополнительных (иллюстративных) переменных и объектов
18.5. Основные типы данных и методы, используемые в разведочном анализе данных
ВЫВОДЫ
Глава 19. ЦЕЛЕНАПРАВЛЕННОЕ ПРОЕЦИРОВАНИЕ МНОГОМЕРНЫХ ДАННЫХ
19.1. Цель и основные понятия целенаправленного проецирования
19.2. Проекционные индексы, подходящие для выделения кластеров
19.3. Выявление эллипсоидальной кластерной структуры (восстановление дискриминантного подпространства)
19.4. Проекционные индексы для дискриминантного анализа
19.5. Выделение аномальных наблюдений
19.6. Выделение нелинейных структур в многомерных данных
19.7. Регрессия на основе целенаправленного проецирования
19.8. Восстановление плотности и связь с томографией
19.8.2. Вычислительная томография и прикладная статистика.
19.8.3. Алгоритм восстановления плотности по ее проекциям на основе принципа минимальной вариабельности.
19.8.4. Алгоритм восстановления плотности по ее проекциям на основе принципа максимума энтропии.
19.9. Некоторые вопросы вычислительной реализации и практические приемы целенаправленного проецирования
ВЫВОДЫ
Глава 20. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ЦЕЛЕНАПРАВЛЕННОГО ПРОЕЦИРОВАНИЯ И ТОМОГРАФИЧЕСКИХ МЕТОДОВ АНАЛИЗА ДАННЫХ
20.1. Проекции многомерных распределений и их свойства
20.2. Радиальные распределения
20.3. Теория процедур оптимизации проекционных индексов
ВЫВОДЫ
Глава 21. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ЗАДАЧ СОКРАЩЕНИЯ РАЗМЕРНОСТИ И КЛАССИФИКАЦИИ
21.1. Программное обеспечение прикладного статистического анализа для ПЭВМ
21.2. Проблемы и опыт создания интеллектуализированного программного обеспечения по многомерному статистическому анализу
ВЫВОДЫ
СПИСОК ЛИТЕРАТУРЫ