14.3.2. Метод экстремальной группировки признаков.

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

14.3.2. Метод экстремальной группировки признаков.

При изучении сложных объектов, заданных многими параметрами, возникает задача разбиения параметров на группы, каждая из которых характеризует объект с какой-либо одной стороны. Но получение легко интерпретируемых результатов осложняется тем, что во многих приложениях измеряемые параметры (признаки) лишь косвенно отражают существенные свойства, которыми характеризуется данный объект.

Так, в психологии измеряемые параметры — это реакции людей на различные тесты, а выражением существенных свойств, общими факторами, являются такие характеристики, как тип нервной системы, работоспособность и т.д. Подобная природа формирования набора частных характеристик объекта или системы присуща широкому классу явлений и процессов в экономике, социологии, медицине, педагогике и т. д.

Оказывается, что во многих случаях изменение какого-либо общего фактора сказывается неодинаково на измеряемых признаках, в частности, исходная совокупность из признаков обнаруживает такое естественное «расщепление» на сравнительно () небольшое количество групп, при котором изменение признаков, относящихся к какой-либо одной группе, обусловливается в основном каким-то одним общим фактором, своим для каждой такой группы. После принятия этой гипотезы разбиение на группы естественно строить так, чтобы параметры, принадлежащие к одной группе, были коррелированы сравнительно сильно, а параметры, принадлежащие к разным группам, — слабо. После такого разбиения для каждой группы признаков строится случайная величина, которая в некотором смысле наиболее сильно коррелирована с параметрами данной группы; эта случай ная величина интерпретируется как искомый фактор, от которого существенно зависят все параметры данной группы.

Очевидно, подобная схема является одним из частных случаев общей логической схемы факторного анализа. В отличие от ранее описанных классических моделей факторного анализа при эвристически-оптимизационном подходе группировка признаков и выделение общих факторов делаются на основе экстремизации некоторых эвристически введенных функционалов. Разбиения, оптимизирующие функционал , или (см. ниже), называются экстремальной группировкой параметров. Вообще под задачей экстремальной группировки набора случайных величин на заранее заданное число классов понимают отыскание такого набора подмножеств натурального ряда чисел что при и таких нормированных (т. е. с единичной дисперсией ) факторов которые максимизируют какой-либо критерии оптимальности.

Остановимся здесь на алгоритмах для двух различных критериев оптимальности [33].

Первый алгоритм экстремальной группировки признаков в качестве критерия оптимальности использует функционал

в котором подсог понимается обычный парный коэффициент корреляции между признаком и фактором Обозначим . Максимизация функционала (как по разбиению признаков на группы так и по выбору факторов ) отвечает требованию такого разбиения параметров, когда в одной группе оказываются наиболее «близкие» между собой, в смысле степени коррелированности, признаки: в самом деле, при максимизации функционала для каждого фиксированного набора случайных величин в одну группу будут попадать такие признаки, которые наиболее сильно коррелированы с величиной в то же время среди всех возможных наборов случайных величин будет выбираться такой набор, что каждая из величин в среднем наиболее «близка» ко всем признакам своей группы.

Очевидно, что при заданных классах отпимальный набор факторов получается в результате независимой максимизации каждого слагаемого

откуда

где — максимальное собственное значение матрицы составленной из коэффициентов корреляции переменных, входящих в При этом оптимальный набор факторов задается формулами:

(14.14)

где — собственный вектор матрицы , отвечающий максимальному собственному значению т. е. .

С другой стороны, считая известными факторы нетрудно построить разбиение максимизирующее при фиксированных а именно:

(14.15)

Соотношения (14.14) и (14.15) являются необходимыми условиями максимума

Для одновременного нахождения оптимального разбиения и оптимального набора факторов предлагается итерационный алгоритм, последовательно осуществляющий выбор оптимальных (по отношению к разбиению, полученному на предыдущем шаге), факторов, а затем выбор разбиения, оптимального к факторам, полученным на предыдущем шаге.

Пусть на шаге итерации построено разбиение параметров на группы

Для каждой такой группы параметров строят факторы по формуле (14.14) и новое разбиение параметров в соответствии с правилом: параметр относится к группе если

(14.16)

Если для некоторого параметра найдутся два или более факторов таких, что для и этих факторов в (14.16) имеет место равенство, то параметр относится к одной из соответствующих групп произвольно.

Очевидно, что на каждом шаге итераций функционал не убывает, поэтому данный алгоритм будет сходиться к максимуму. Максимум может быть локальным.

Для описания второго алгоритма экстремальной группировки признаков введем функционал

В содержательном смысле функционал похож на функционал и его максимизация также соответствует основному требованию к характеру разбиения признаков на группы. В [33] показано, что имеет место следующее утверждение. Необходимыми и достаточными условиями максимума функционала являются следующие:

разбиение параметров на группы таково, что функционал

(где -некоторые числовые коэффициенты, равные либо + 1, либо — 1) достигает максимума как по разбиению на группы, так и по значениям коэффициентов . Здесь под понимается, как обычно, дисперсия случайной величины ;

факторы определяются соотношениями

Логическая схема доказательства этого следующая.

Сначала, варьируя функционал и используя метод множителей Лагранжа для учета условия показывают, что в точке максимума функционала фактор имеет вид (14.17). Затем доказывается, что если имеет вид (14.17), то при любом наборе коэффициентов и любом разбиении параметров на группы имеет место соотношение если же достигает максимума, то Из этого утверждения следует, в частности, что для нахождения групп и факторов достаточно максимизировать функционал . При фиксированном разбиении на группы функционал достигает максимума тогда, когда для каждого I соответствующие коэффициенты максимизируют величину

(14.18)

Поэтому естественно воспользоваться рекуррентной процедурой максимизации . В процедуре циклически перебираются переменные и на каждом шаге принимается решение об отнесении очередного параметра к одной из групп и определяется знак

Пусть к шагу алгоритма построены разбиения параметров на группы вычислены коэффициенты равные + 1 или — 1, и пусть на этом шаге рассматривается признак Тогда строятся вспомогательных коэффициентов по формуле

где

и для всех вычисляются разности

Затем выбирается такой номер , что

и признак исключается из группы ; и присоединяется к группе остальные группы признаков на этом шаге не меняются. В результате получаем новое разбиение признаков — Новые значения коэффициентов определяются по формулам:

На следующем шаге алгоритма рассматривается параметр если если

Процедура заканчивается, если при рассмотрении всех признаков очередного цикла сохранились как разбиения признаков на группы, так и значения всех коэффициентов; полученное разбиение и значения коэффициентов рассматриваются как оптимальные.

Для демонстрации сходимости метода к локальному максимуму в [33] доказывается, что на каждом шаге алгоритма значение не убывает.

Нетрудно проследить идейную близость метода экстремальной группировки факторов с методами, опирающимися на логическую схему факторного анализа. Так, например, отправляясь от общей модели вида

(14.1), первую компоненту и «нагрузки» в методе главных компонент можно определять из условия минимума выражения при нормирующем ограничении . Решение этой условно экстремальной задачи очевидным образом сводится к нахождению максимума выражения при условии

Для построения следующего фактора (второй главной компоненты) рассматриваются случайные величины Для этих случайных величин аналогичным образом находится свой фактор, который и является фактором и т. д.

Очевидно, что при реализации первого алгоритма метода экстремальной группировки признаков для каждой группы признаков строится фактор, имеющий смысл первой главной компоненты для признаков этой группы.

В центроидном методе общий фактор ищут в виде

(14-19)

где выбирается так, чтобы максимизировать величину

Сравнение выражений (14.19) и (14.20) с выражениями (14.17) и (14.18) показывает, что максимизация функционала приводит к построению для каждой группы признаков фактора, отличающегося на некоторый множитель от первого общего фактора, который был бы построен для этой группы центроидным методом.

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
ВВЕДЕНИЕ. КЛАССИФИКАЦИЯ И СНИЖЕНИЕ РАЗМЕРНОСТИ. СУЩНОСТЬ И ТИПОЛОГИЗАЦИЯ ЗАДАЧ, ОБЛАСТИ ПРИМЕНЕНИЯ
B.1. Сущность задач классификации и снижения размерности и некоторые базовые идеи аппарата многомерного статистического анализа
В.2. Типовые задачи практики и конечные прикладные цели исследований, использующих методы классификации и снижения размерности
В.3. Типологизация математических постановок задач классификации и снижения размерности
В.4. Основные этапы в решении задач классификации и снижения размерности
ВЫВОДЫ
Раздел I. ОТНЕСЕНИЕ К ОДНОМУ ИЗ НЕСКОЛЬКИХ КЛАССОВ, ЗАДАННЫХ ПРЕДПОЛОЖЕНИЯМИ И ОБУЧАЮЩИМИ ВЫБОРКАМИ
1.1.1. Критерий отношения правдоподобия как правило классификации.
1.1.2. Основные математические модели.
1.1.3. Классификация посредством задания границы критической области.
1.1.4. Функция потерь.
1.1.5. Другие многомерные распределения.
1.2. Характеристики качества классификации
1.2.2. Изменение порога критерия.
1.2.3. Условная вероятность быть случаем.
1.2.4. Аналитические меры разделимости распределений.
1.3. Два класса, заданные генеральными совокупностями
1.3.2. Древообразные классификаторы.
1.3.3. Метод потенциальных функций.
1.3.4. Поиск характерных закономерностей.
1.3.5. Коллективы решающих правил.
1.4. Отбор информативных переменных
1.4.2. Функции потерь.
1.4.3. Схемы последовательного испытания наборов признаков.
1.5. Три и более полностью определенных класса
1.5.2. Модель нескольких многомерных нормальных распределений с общей ковариационной матрицей.
1.5.3. Упорядоченные классы.
ВЫВОДЫ
Глава 2. ТЕОРЕТИЧЕСКИЕ РЕЗУЛЬТАТЫ КЛАССИФИКАЦИИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК (ДИСКРИМИНАНТНЫЙ АНАЛИЗ)
2.1. Базовые понятия дискриминантного анализа
2.1.2. Основные виды ошибок.
2.1.3. Функции потерь.
2.2. Методы изучения алгоритмов ДА
2.2.2. Инвариантность и подобие алгоритмов.
2.2.3. Методы выработки рекомендаций.
2.3. Подстановочные алгоритмы в асимптотике растущей размерности
2.4. Статистическая регуляризация оценки обратной ковариационной матрицы в линейной дискриминантной функции для модели Фишера
2.5. Отбор переменных
2.6. Метод структурной минимизации риска
ВЫВОДЫ
Глава 3. ПРАКТИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО КЛАССИФИКАЦИИ ПРИ НАЛИЧИИ ОБУЧАЮЩИХ ВЫБОРОК (ДИСКРИМИНАНТНЫЙ АНАЛИЗ)
3.1. Предварительный анализ данных
3.2. Оценивание отношения правдоподобия
3.3. Сводка рекомендаций по линейному дискриминантному анализу
3.4. Оценка качества дискриминации
3.5. Рекомендации для k >= 3 классов
ВЫВОДЫ
Глава 4. ПРИМЕНЕНИЯ ДИСКРИМИНАНТНОГО АНАЛИЗА
4.1. Группы риска и сравнительные испытания
4.2. Методы описания риска развития события
4.3. Другие применения ДА
ВЫВОДЫ
Раздел II. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ: МЕТОДЫ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ (КЛАСТЕР-АНАЛИЗА) И РАСЩЕПЛЕНИЕ СМЕСЕЙ РАСПРЕДЕЛЕНИЙ
Глава 5. ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ, ИСПОЛЬЗУЕМЫЕ В МЕТОДАХ КЛАССИФИКАЦИИ БЕЗ ОБУЧЕНИЯ
5.2. Расстояния между отдельными объектами и меры близости объектов друг к другу
5.3. Расстояние между классами и мера близости классов
5.4. Функционалы качества разбиения на классы и экстремальная постановка задачи кластер-анализа. Связь с теорией статистического оценивания параметров
ВЫВОДЫ
Глава 6. КЛАССИФИКАЦИЯ БЕЗ ОБУЧЕНИЯ (ПАРАМЕТРИЧЕСКИЙ СЛУЧАЙ). РАСЩЕПЛЕНИЕ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИИ
6.1. Понятие смеси вероятностных распределений
6.2. Общая схема решения задачи автоматической классификации в рамках модели смеси распределений (сведение к схеме дискриминантного анализа)
6.3. Идентифицируемость (различимость) смесей распределений
6.4. Процедуры оценивания параметров модели смеси распределений
6.4.2. Процедуры, базирующиеся на методе моментов.
6.4.3. Другие методы оценивания параметров смеси распределений.
6.5. Рекомендации по определению «исходных позиций» алгоритмов расщепления смесей распределений
ВЫВОДЫ
Глава 7. АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ, ОСНОВАННАЯ НА ОПИСАНИИ КЛАССОВ «ЯДРАМИ»
7.1. Эвристические алгоритмы
7.2. Алгоритмы, использующие понятие центра тяжести
7.2.2. Последовательные процедуры.
7.3. Алгоритмы с управляющими параметрами, настраиваемыми в ходе классификации
7.4. Алгоритмы метода динамических сгущений
7.4.3. Автоматическая классификация неполных данных.
7.5. Алгоритмы метода размытых множеств
7.5.2. Алгоритмы нечеткой классификации.
7.6. Алгоритмы, основанные на методе просеивания (решета)
ВЫВОДЫ
Глава 8. ИЕРАРХИЧЕСКАЯ КЛАССИФИКАЦИЯ
8.2. Методы и алгоритмы иерархической классификации
8.3. Графические представления результатов иерархической классификации
8.4. Приложения общей рекуррентной формулы для мер близости между классами
8.5. Быстрый алгоритм иерархической классификации
ВЫВОДЫ
Глава 9. ПРОЦЕДУРЫ КЛАСТЕР-АНАЛИЗА И РАЗДЕЛЕНИЯ СМЕСЕЙ ПРИ НАЛИЧИИ АПРИОРНЫХ ОГРАНИЧЕНИИ
9.1. Разделение смесей при наличии неполных обучающих выборок
9.2. Классификация при ограничениях на связи между объектами
9.3. Классификация на графах
ВЫВОДЫ
Глава 10. ТЕОРИЯ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
10.1. Математическая модель алгоритма автоматической классификации (ААК)
10.2. Базисная модель алгоритма АК, основанного на описании классов ядрами
10.3. Иерархическая структура многообразия алгоритмов АК
10.4. Исследование сходимости алгоритмов АК
ВЫВОДЫ
Глава 11. ВЫБОР МЕТРИКИ И СОКРАЩЕНИЕ РАЗМЕРНОСТЕЙ В ЗАДАЧАХ КЛАСТЕР-АНАЛИЗА
11.2. Метрики для задач кластер-анализа с неколичественными переменными
11.3. Алгоритмы классификации с адаптивной метрикой
11.4. Оценка метрики с помощью частично обучающих выборок
ВЫВОДЫ
Глава 12. СРЕДСТВА ПРЕДСТАВЛЕНИЯ И ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ
12.1. Некоторые средства оценки результатов кластер-анализа
12.2. Связь между показателями качества прогноза переменных, метрикой и некоторыми критериями качества классификации в кластер-анализе
12.3. Некоторые методические рекомендации
12.4. Средства, помогающие интерпретации результатов
ВЫВОДЫ
Раздел III. СНИЖЕНИЕ РАЗМЕРНОСТИ АНАЛИЗИРУЕМОГО ПРИЗНАКОВОГО ПРОСТРАНСТВА И ОТБОР НАИБОЛЕЕ ИНФОРМАТИВНЫХ ПОКАЗАТЕЛЕЙ
13.1. Сущность проблемы снижения размерности и различные методы ее решения
13.2. Определение, вычисление и основные числовые характеристики главных компонент
13.3. Экстремальные свойства главных компонент. Их интерпретация
13.4. Статистические свойства выборочных главных компонент; статистическая проверка некоторых гипотез
13.5. Главные компоненты в задачах классификации
13.6. Нелинейное отображение многомерных данных в пространство низкой размерности
ВЫВОДЫ
Глава 14. МОДЕЛИ И МЕТОДЫ ФАКТОРНОГО АНАЛИЗА
14.1. Сущность модели факторного анализа, его основные задачи
14.2. Каноническая модель факторного анализа
14.2.2. Вопросы идентификации модели факторного анализа.
14.2.3. Определение структуры и статистическое исследование модели факторного анализа.
14.2.4. Факторный анализ в задачах классификации.
14.3. Некоторые эвристические методы снижения размерности
14.3.2. Метод экстремальной группировки признаков.
14.3.3. Метод корреляционных плеяд.
14.3.4. Снижение размерности с помощью кластер-процедур.
ВЫВОДЫ
Глава 15. ЭКСПЕРТНО-СТАТИСТИЧЕСКИЙ МЕТОД ПОСТРОЕНИЯ ЕДИНОГО СВОДНОГО ПОКАЗАТЕЛЯ ЭФФЕКТИВНОСТИ ФУНКЦИОНИРОВАНИЯ (КАЧЕСТВА) ОБЪЕКТА (СКАЛЯРНАЯ РЕДУКЦИЯ МНОГОКРИТЕРИАЛЬНОЙ СХЕМЫ)
15.1. Латентный единый (сводный) показатель «качества». Понятия «выходного качества» целевой функции и «входных переменных» (частных критериев)
15.2. Исходные данные
15.3. Алгоритмические и вычислительные вопросы построения неизвестной целевой функции
15.3.2. Оценивание неизвестных параметров целевой функции при балльных экспертных оценках выходного качества.
15.3.3. Оценивание неизвестных параметров целевой функции при экспертных ранжировках и парных сравнениях объектов.
15.4. Применение экспертно-статистического метода построения латентного интегрального показателя к решению практических задач
ВЫВОДЫ
Глава 16. МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ
16.1. Метрическое многомерное шкалирование
16.2. Неметрическое многомерное шкалирование [307, 261, 260, 152]
16.3. Шкалирование индивидуальных различий (ШИР)
ВЫВОДЫ
Глава 17. СРЕДСТВА АНАЛИЗА И ВИЗУАЛИЗАЦИИ НЕКОЛИЧЕСТВЕННЫХ ДАННЫХ
17.1. Анализ соответствий для двухвходовых таблиц сопряженностей
17.1.2. Проекции строк и столбцов. Связь с анализом главных компонент.
17.1.3. Интерпретация главных компонент в анализе соответствий.
17.1.4. Присвоение числовых меток строкам и столбцам.
17.2. Множественный анализ соответствий (МАС)
17.3. Алгоритмы оцифровки неколичественных переменных
ВЫВОДЫ
Раздел IV. РАЗВЕДОЧНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ И НАГЛЯДНОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ
Глава 18. РАЗВЕДОЧНЫЙ АНАЛИЗ. ЦЕЛИ, МОДЕЛИ СТРУКТУР ДАННЫХ, МЕТОДЫ И ПРИЕМЫ АНАЛИЗА
18.1. Цели разведочного анализа и модели описания структуры многомерных данных
18.2. Визуализация данных
18.3. Преобразования данных в разведочном анализе данных
18.4. Использование дополнительных (иллюстративных) переменных и объектов
18.5. Основные типы данных и методы, используемые в разведочном анализе данных
ВЫВОДЫ
Глава 19. ЦЕЛЕНАПРАВЛЕННОЕ ПРОЕЦИРОВАНИЕ МНОГОМЕРНЫХ ДАННЫХ
19.1. Цель и основные понятия целенаправленного проецирования
19.2. Проекционные индексы, подходящие для выделения кластеров
19.3. Выявление эллипсоидальной кластерной структуры (восстановление дискриминантного подпространства)
19.4. Проекционные индексы для дискриминантного анализа
19.5. Выделение аномальных наблюдений
19.6. Выделение нелинейных структур в многомерных данных
19.7. Регрессия на основе целенаправленного проецирования
19.8. Восстановление плотности и связь с томографией
19.8.2. Вычислительная томография и прикладная статистика.
19.8.3. Алгоритм восстановления плотности по ее проекциям на основе принципа минимальной вариабельности.
19.8.4. Алгоритм восстановления плотности по ее проекциям на основе принципа максимума энтропии.
19.9. Некоторые вопросы вычислительной реализации и практические приемы целенаправленного проецирования
ВЫВОДЫ
Глава 20. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ЦЕЛЕНАПРАВЛЕННОГО ПРОЕЦИРОВАНИЯ И ТОМОГРАФИЧЕСКИХ МЕТОДОВ АНАЛИЗА ДАННЫХ
20.1. Проекции многомерных распределений и их свойства
20.2. Радиальные распределения
20.3. Теория процедур оптимизации проекционных индексов
ВЫВОДЫ
Глава 21. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ЗАДАЧ СОКРАЩЕНИЯ РАЗМЕРНОСТИ И КЛАССИФИКАЦИИ
21.1. Программное обеспечение прикладного статистического анализа для ПЭВМ
21.2. Проблемы и опыт создания интеллектуализированного программного обеспечения по многомерному статистическому анализу
ВЫВОДЫ
СПИСОК ЛИТЕРАТУРЫ