13.3. Экстремальные свойства главных компонент. Их интерпретация

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

13.3. Экстремальные свойства главных компонент. Их интерпретация

Свойство наименьшей ошибки «автопрогноза» или наилучшей самовоспроизводимости. Можно показать [293, 283, 284], что с помощью первых главных компонент исходных признаков достигается наилучший прогноз этих признаков среди всех прогнозов, которые можно построить с помощью линейных комбинаций набора из произвольных признаков.

Поясним и уточним сказанное. Пусть требуется заменить исходный исследуемый -мерный вектор наблюдений X на вектор меньшей размерности , в котором каждая из компонент являлась бы линейной комбинацией исходных (или каких-либо других, вспомогательных) признаков, теряя при этом не слишком много информации. Информативность нового вектора Z зависит от того, в какой степени введенных линейных комбинаций дают возможность «реконструировать» исходных (измеряемых на объектах) признаков. Естественно полагать, что ошибка прогнозапо Z (обозначим ее а будет определяться так называемой остаточной дисперсионной матрицей вектора X при вычитании из него наилучшего прогноза по Z, т. е. матрицей где

Здесь — наилучший, в смысле метода наименьших квадратов, прогноз по компонентам , где — некоторая функция (качества предсказания) от элементов остаточной дисперсионной матрицы А.

В [293] решалась задача наилучшего прогноза X только в классе линейных комбинаций от исходных признаков и рассмотрены естественные меры ошибки прогноза, такие, как

(13.11)

Здесь — соответственно слей и евклидова норма матрицы . Рао показал, что функции (13.11) и (13.12) одновременно достигают минимума тогда и только тогда, когда в качестве выбраны первые главных компонент вектора X, причем величина ошибки прогноза о явным образом выражается через последние собственных чисел исходной ковариационной матрицы или через последние собственных чисел выборочной ковариационной матрицы , построенной по наблюдениям . В частности,

В работах [283, 284] эта схема обобщена на случай произвольных предсказывающих признаков и более широкого класса функций и показано, что ) достигается тогда и только тогда, когда в качестве искомых предсказывающих признаков берутся сами исследуемые (измеряемые) признаки а в качестве линейных комбинаций (предикторов) от них выбраны первые главных компонент вектора X. При этом величина ошибки прогноза , как и прежде, определяется лишь последними собственными значениями исходной ковариационной матрицы .

В эту схему укладывается, в частности, случай в котором о

Поясним идею описания (прогноза) исходных признаков с помощью меньшего, чем , числа их линейных комбинаций на примере 13.1.

В этом примере Зададимся целью снизить размерность исходного факторного пространства до единицы т. е. описать все три признака с помощью одной линейной комбинации от них.

В соответствии с описанным выше экстремальным свойством «автопрогноза» главных компонент возьмем в качестве этой единственной линейной комбинации первую главную компоненту, т. е. переменную

Метод наименьших квадратов приводит к следующему правилу вычисления неизвестных коэффициентов с. 209]:

Подставляя в эту формулу значения взятые из ковариационной матрицы 2 примера 13.7, получаем

где — случайные (остаточные) ошибки прогноза исходных центрированных компонент по первой главной компоненте

Если в качестве относительной ошибки прогноза исходного признака по первой главной компоненте рассмотреть величину , то несложные подсчеты дают

Суммарная характеристика относительной ошибки прогноза признаков и по (в соответствии с вышеописанным) может быть подсчитана по формуле

Свойства наименьшего искажения геометрической структуры исходных точек (наблюдений) при их проектировании в пространство меньшей размерности «натянутое» на первых главных компонент. Всякий переход к меньшему числу новых переменных осуществляемый с помощью линейного преобразования (матрицы) , т. е.

или в матричной записи

(13.13)

удобнее будет рассматривать теперь как проекцию исследуемых наблюдений из исходного факторного пространства в некоторое подпространство меньшей размерности

Геометрическая интерпретация сформулированных выше экстремальных свойств «автопрогноза» (самовоспроизводи-мости) главных компонент позволяет получить следующие интересные свойства.

Рис. 13.2 Эллипс рассеяния исследуемых наблюдений и направление координатных осей главных компонент

Свойство 1. Сумма квадратов расстояний от исходных точек-наблюдений до пространства, натянутого на первые главных компонент, наимень шая относительно всех других подпространств размерности , полученных с помощью произвольного линейного преобразования исходных координат.

Это свойство станет понятным (в свете вышеописанного экстремального свойства «автопрогноза»), если напомнить, что сумма квадратов расстояний от исходных точек до подпространства, натянутого на первых главных компонент, есть не что иное, как умноженная на (общее число наблюдений) суммарная дисперсия остаточных компонент (ошибок прогноза) следовательно, эта сумма квадратов равна ). Наглядным пояснением этого свойства может служить рис. 13.2, на котором ось соответствует подпространству, натянутому на первую главную компоненту (т. е. а сумма квадратов расстояний до этого подпространства есть сумма перпендикуляров, опущенных из точек, изображающих наблюдения на эту ось (сама ось может быть интерпретирована в данном случае как линия ортогональной регрессии см. [7, с. 127]).

Свойство 2.

Среди всех подпространств заданной размерности (), полученных из исследуемого факторного пространства с помощью произвольного линейного преобразования исходных координат в подпространстве, натянутом на первые главных компонент, наименее искажается сумма квадратов расстояний между всевозможными парами рассматриваемых точек-наблюдений.

Поясним это свойство. Пусть — подпространство размерности , натянутое на оси получаемые из исходных осей с помощью произвольного линейного преобразования (13.13), а — проекции исходных наблюдений в подпространство т. е. запись исходных наблюдений в координатах подпространства . Введем в рассмотрение величины

выражающие суммы квадратов расстояний между всевозможными парами имеющихся наблюдений соответственно в исходном пространстве и в подпространстве

Из простых геометрических соображений очевидно, что всегда при .

Рассматривая в качестве меры искажения суммы квадратов попарных взаимных расстояний между точками-наблюдениями величину , можно показать [293], что

где — матрица размера строками которой являются первые собственных векторов исходной ковариационной матрицы (т. е. подпространство ) является подпространством, натянутым на первые главных компонент вектора наблюдений X).

Свойство 3. Среди всех подпространств заданной размерности полученных из исследуемого факторного пространства с помощью произвольного линейного преобразования исходных координат в пространстве, натянутом на первые главных компонент, наименее искажаются расстояния от рассматриваемых точек-наблюдений до их общего «центра тяжести», а также углы между прямыми, соединяющими всевозможные пары точек-наблюдений с их общим «центром тяжести».

Поясним это свойство. Рассмотрим матрицу G размера «центрированных» наблюдений Здесь, как и прежде, — исходные наблюдения, а — средняя арифметическая по всем наблюдениям признака, т. е.

Введем в рассмотрение матрицу размера . Нетрудно установить геометрический смысл элементов этой матрицы:

это квадрат расстояния от точки-наблюдения до общего «центра тяжести» X, а

величина, пропорциональная косинусу угла между прямыми, соединяющими точки с центром тяжести X.

Если рассмотреть, кроме того, матрицу наблюдений являющихся проекциями исходных (центрированных) наблюдений в подпространство и соответствующую ей матрицу , то оказывается, что

где под понимается, как обычно, евклидова норма матрицы A, a соответствует ранее введенным обозначениям.

Из описанного выше следует, что естественной мерой относительного искажения геометрической структуры исходной совокупности наблюдений при их проектировании в пространство меньшей размерности, натянутое на первые главных компонент, является величина либо величина

При неизвестной истинной ковариационной матрице ее собственные значения следует заменить собственными значениями выборочной ковариационной матрицы Е (соответственно теоретические характеристики

х и у заменятся своими выборочными аналогами .

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
ВВЕДЕНИЕ. КЛАССИФИКАЦИЯ И СНИЖЕНИЕ РАЗМЕРНОСТИ. СУЩНОСТЬ И ТИПОЛОГИЗАЦИЯ ЗАДАЧ, ОБЛАСТИ ПРИМЕНЕНИЯ
B.1. Сущность задач классификации и снижения размерности и некоторые базовые идеи аппарата многомерного статистического анализа
В.2. Типовые задачи практики и конечные прикладные цели исследований, использующих методы классификации и снижения размерности
В.3. Типологизация математических постановок задач классификации и снижения размерности
В.4. Основные этапы в решении задач классификации и снижения размерности
ВЫВОДЫ
Раздел I. ОТНЕСЕНИЕ К ОДНОМУ ИЗ НЕСКОЛЬКИХ КЛАССОВ, ЗАДАННЫХ ПРЕДПОЛОЖЕНИЯМИ И ОБУЧАЮЩИМИ ВЫБОРКАМИ
1.1.1. Критерий отношения правдоподобия как правило классификации.
1.1.2. Основные математические модели.
1.1.3. Классификация посредством задания границы критической области.
1.1.4. Функция потерь.
1.1.5. Другие многомерные распределения.
1.2. Характеристики качества классификации
1.2.2. Изменение порога критерия.
1.2.3. Условная вероятность быть случаем.
1.2.4. Аналитические меры разделимости распределений.
1.3. Два класса, заданные генеральными совокупностями
1.3.2. Древообразные классификаторы.
1.3.3. Метод потенциальных функций.
1.3.4. Поиск характерных закономерностей.
1.3.5. Коллективы решающих правил.
1.4. Отбор информативных переменных
1.4.2. Функции потерь.
1.4.3. Схемы последовательного испытания наборов признаков.
1.5. Три и более полностью определенных класса
1.5.2. Модель нескольких многомерных нормальных распределений с общей ковариационной матрицей.
1.5.3. Упорядоченные классы.
ВЫВОДЫ
Глава 2. ТЕОРЕТИЧЕСКИЕ РЕЗУЛЬТАТЫ КЛАССИФИКАЦИИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК (ДИСКРИМИНАНТНЫЙ АНАЛИЗ)
2.1. Базовые понятия дискриминантного анализа
2.1.2. Основные виды ошибок.
2.1.3. Функции потерь.
2.2. Методы изучения алгоритмов ДА
2.2.2. Инвариантность и подобие алгоритмов.
2.2.3. Методы выработки рекомендаций.
2.3. Подстановочные алгоритмы в асимптотике растущей размерности
2.4. Статистическая регуляризация оценки обратной ковариационной матрицы в линейной дискриминантной функции для модели Фишера
2.5. Отбор переменных
2.6. Метод структурной минимизации риска
ВЫВОДЫ
Глава 3. ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО КЛАССИФИКАЦИИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК (ДИСКРИМИНАНТНЫЙ АНАЛИЗ)
3.1. Предварительный анализ данных
3.2. Оценивание отношения правдоподобия
3.3. Сводка рекомендаций по линейному дискриминантному анализу
3.4. Оценка качества дискриминации
3.5. Рекомендации для k >= 3 классов
ВЫВОДЫ
Глава 4. ПРИМЕНЕНИЯ ДИСКРИМИНАНТНОГО АНАЛИЗА
4.1. Группы риска и сравнительные испытания
4.2. Методы описания риска развития события
4.3. Другие применения ДА
ВЫВОДЫ
Раздел II. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ: МЕТОДЫ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ (КЛАСТЕР-АНАЛИЗА) И РАСЩЕПЛЕНИЕ СМЕСЕЙ РАСПРЕДЕЛЕНИЙ
Глава 5. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ, ИСПОЛЬЗУЕМЫЕ В МЕТОДАХ КЛАССИФИКАЦИИ БЕЗ ОБУЧЕНИЯ
5.2. Расстояния между отдельными объектами и меры близости объектов друг к другу
5.3. Расстояние между классами и мера близости классов
5.4. Функционалы качества разбиения на классы и экстремальная постановка задачи кластер-анализа. Связь с теорией статистического оценивания параметров
ВЫВОДЫ
Глава 6. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ (ПАРАМЕТРИЧЕСКИЙ СЛУЧАЙ). РАСЩЕПЛЕНИЕ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИИ
6.1. Понятие смеси вероятностных распределений
6.2. Общая схема решения задачи автоматической классификации в рамках модели смеси распределений (сведение к схеме дискриминантного анализа)
6.3. Идентифицируемость (различимость) смесей распределений
6.4. Процедуры оценивания параметров модели смеси распределений
6.4.2. Процедуры, базирующиеся на методе моментов.
6.4.3. Другие методы оценивания параметров смеси распределений.
6.5. Рекомендации по определению «исходных позиций» алгоритмов расщепления смесей распределений
ВЫВОДЫ
Глава 7. АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ, ОСНОВАННАЯ НА ОПИСАНИИ КЛАССОВ «ЯДРАМИ»
7.1. Эвристические алгоритмы
7.2. Алгоритмы, использующие понятие центра тяжести
7.2.2. Последовательные процедуры.
7.3. Алгоритмы с управляющими параметрами, настраиваемыми в ходе классификации
7.4. Алгоритмы метода динамических сгущений
7.4.3. Автоматическая классификация неполных данных.
7.5. Алгоритмы метода размытых множеств
7.5.2. Алгоритмы нечеткой классификации.
7.6. Алгоритмы, основанные на методе просеивания (решета)
ВЫВОДЫ
Глава 8. ИЕРАРХИЧЕСКАЯ КЛАССИФИКАЦИЯ
8.2. Методы и алгоритмы иерархической классификации
8.3. Графические представления результатов иерархической классификации
8.4. Приложения общей рекуррентной формулы для мер близости между классами
8.5. Быстрый алгоритм иерархической классификации
ВЫВОДЫ
Глава 9. ПРОЦЕДУРЫ КЛАСТЕР-АНАЛИЗА И РАЗДЕЛЕНИЯ СМЕСЕЙ ПРИ НАЛИЧИИ АПРИОРНЫХ ОГРАНИЧЕНИИ
9.1. Разделение смесей при наличии неполных обучающих выборок
9.2. Классификация при ограничениях на связи между объектами
9.3. Классификация на графах
ВЫВОДЫ
Глава 10. ТЕОРИЯ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
10.1. Математическая модель алгоритма автоматической классификации (ААК)
10.2. Базисная модель алгоритма АК, основанного на описании классов ядрами
10.3. Иерархическая структура многообразия алгоритмов АК
10.4. Исследование сходимости алгоритмов АК
ВЫВОДЫ
Глава 11. ВЫБОР МЕТРИКИ И СОКРАЩЕНИЕ РАЗМЕРНОСТЕЙ В ЗАДАЧАХ КЛАСТЕР-АНАЛИЗА
11.2. Метрики для задач кластер-анализа с неколичественными переменными
11.3. Алгоритмы классификации с адаптивной метрикой
11.4. Оценка метрики с помощью частично обучающих выборок
ВЫВОДЫ
Глава 12. СРЕДСТВА ПРЕДСТАВЛЕНИЯ И ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
12.1. Некоторые средства оценки результатов кластер-анализа
12.2. Связь между показателями качества прогноза переменных, метрикой и некоторыми критериями качества классификации в кластер-анализе
12.3. Некоторые методические рекомендации
12.4. Средства, помогающие интерпретации результатов
ВЫВОДЫ
Раздел III. СНИЖЕНИЕ РАЗМЕРНОСТИ АНАЛИЗИРУЕМОГО ПРИЗНАКОВОГО ПРОСТРАНСТВА И ОТБОР НАИБОЛЕЕ ИНФОРМАТИВНЫХ ПОКАЗАТЕЛЕЙ
13.1. Сущность проблемы снижения размерности и различные методы ее решения
13.2. Определение, вычисление и основные числовые характеристики главных компонент
13.3. Экстремальные свойства главных компонент. Их интерпретация
13.4. Статистические свойства выборочных главных компонент; статистическая проверка некоторых гипотез
13.5. Главные компоненты в задачах классификации
13.6. Нелинейное отображение многомерных данных в пространство низкой размерности
ВЫВОДЫ
Глава 14. МОДЕЛИ И МЕТОДЫ ФАКТОРНОГО АНАЛИЗА
14.1. Сущность модели факторного анализа, его основные задачи
14.2. Каноническая модель факторного анализа
14.2.2. Вопросы идентификации модели факторного анализа.
14.2.3. Определение структуры и статистическое исследование модели факторного анализа.
14.2.4. Факторный анализ в задачах классификации.
14.3. Некоторые эвристические методы снижения размерности
14.3.2. Метод экстремальной группировки признаков.
14.3.3. Метод корреляционных плеяд.
14.3.4. Снижение размерности с помощью кластер-процедур.
ВЫВОДЫ
Глава 15. ЭКСПЕРТНО-СТАТИСТИЧЕСКИЙ МЕТОД ПОСТРОЕНИЯ ЕДИНОГО СВОДНОГО ПОКАЗАТЕЛЯ ЭФФЕКТИВНОСТИ ФУНКЦИОНИРОВАНИЯ (КАЧЕСТВА) ОБЪЕКТА (СКАЛЯРНАЯ РЕДУКЦИЯ МНОГОКРИТЕРИАЛЬНОЙ СХЕМЫ)
15.1. Латентный единый (сводный) показатель «качества». Понятия «выходного качества» целевой функции и «входных переменных» (частных критериев)
15.2. Исходные данные
15.3. Алгоритмические и вычислительные вопросы построения неизвестной целевой функции
15.3.2. Оценивание неизвестных параметров целевой функции при балльных экспертных оценках выходного качества.
15.3.3. Оценивание неизвестных параметров целевой функции при экспертных ранжировках и парных сравнениях объектов.
15.4. Применение экспертно-статистического метода построения латентного интегрального показателя к решению практических задач
ВЫВОДЫ
Глава 16. МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ
16.1. Метрическое многомерное шкалирование
16.2. Неметрическое многомерное шкалирование [307, 261, 260, 152]
16.3. Шкалирование индивидуальных различий (ШИР)
ВЫВОДЫ
Глава 17. СРЕДСТВА АНАЛИЗА И ВИЗУАЛИЗАЦИИ НЕКОЛИЧЕСТВЕННЫХ ДАННЫХ
17.1. Анализ соответствий для двухвходовых таблиц сопряженностей
17.1.2. Проекции строк и столбцов. Связь с анализом главных компонент.
17.1.3. Интерпретация главных компонент в анализе соответствий.
17.1.4. Присвоение числовых меток строкам и столбцам.
17.2. Множественный анализ соответствий (МАС)
17.3. Алгоритмы оцифровки неколичественных переменных
ВЫВОДЫ
Раздел IV. РАЗВЕДОЧНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ И НАГЛЯДНОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Глава 18. РАЗВЕДОЧНЫЙ АНАЛИЗ. ЦЕЛИ, МОДЕЛИ СТРУКТУР ДАННЫХ, МЕТОДЫ И ПРИЕМЫ АНАЛИЗА
18.1. Цели разведочного анализа и модели описания структуры многомерных данных
18.2. Визуализация данных
18.3. Преобразования данных в разведочном анализе данных
18.4. Использование дополнительных (иллюстративных) переменных и объектов
18.5. Основные типы данных и методы, используемые в разведочном анализе данных
ВЫВОДЫ
Глава 19. ЦЕЛЕНАПРАВЛЕННОЕ ПРОЕЦИРОВАНИЕ МНОГОМЕРНЫХ ДАННЫХ
19.1. Цель и основные понятия целенаправленного проецирования
19.2. Проекционные индексы, подходящие для выделения кластеров
19.3. Выявление эллипсоидальной кластерной структуры (восстановление дискриминантного подпространства)
19.4. Проекционные индексы для дискриминантного анализа
19.5. Выделение аномальных наблюдений
19.6. Выделение нелинейных структур в многомерных данных
19.7. Регрессия на основе целенаправленного проецирования
19.8. Восстановление плотности и связь с томографией
19.8.2. Вычислительная томография и прикладная статистика.
19.8.3. Алгоритм восстановления плотности по ее проекциям на основе принципа минимальной вариабельности.
19.8.4. Алгоритм восстановления плотности по ее проекциям на основе принципа максимума энтропии.
19.9. Некоторые вопросы вычислительной реализации и практические приемы целенаправленного проецирования
ВЫВОДЫ
Глава 20. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ЦЕЛЕНАПРАВЛЕННОГО ПРОЕЦИРОВАНИЯ И ТОМОГРАФИЧЕСКИХ МЕТОДОВ АНАЛИЗА ДАННЫХ
20.1. Проекции многомерных распределений и их свойства
20.2. Радиальные распределения
20.3. Теория процедур оптимизации проекционных индексов
ВЫВОДЫ
Глава 21. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ЗАДАЧ СОКРАЩЕНИЯ РАЗМЕРНОСТИ И КЛАССИФИКАЦИИ
21.1. Программное обеспечение прикладного статистического анализа для ПЭВМ
21.2. Проблемы и опыт создания интеллектуализированного программного обеспечения по многомерному статистическому анализу
ВЫВОДЫ
СПИСОК ЛИТЕРАТУРЫ