Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
19.2. Проекционные индексы, подходящие для выделения кластеров19.2.1. Смеси эллипсоидально симметричных распределений как модель кластерной структуры.Будем предполагать, что плотность распределения
где
В частности, если Смесь плотностей вида (19.2), (19.2) можно рассматривать как одну из возможных моделей для описания кластерной структуры. Плотность Матрицу ковариаций для случайного вектора с плотностью
Пусть теперь
где
Дисперсия z равна
которое можно рассматривать как меру различия компонент смеси для одномерной проекции, задаваемой вектором Поиск направлений проецирования, максимизирующих отношение 19.2.2. Дискриминантное подпространство.В дискриминантном анализе используются так называемые канонические переменные Подпространство В связи с вышесказанным следует, что проекционные векторы для ЦП (в рамках модели (19.2), (19.2)) должны принадлежать Оценка ДП является одной из задач дискриминантного анализа. Однако в ДА считается, что известны или могут быть оценены обе матрицы В и W. Оценка матрицы W производится по обучающим выборкам (ОВ), т. е. в дискриминантном анализе матрица Если же ОВ нет, то может быть оценена только матрица и приходится использовать другие подходы. 19.2.3. Проекционные индексы, использующие математическое ожидание монотонных функций плотности одномерной проекции.Рассмотрим однопараметрическое семейство проекционных индексов (ПИ) для одномерных проекций, задаваемых вектором
где Приведем без доказательств неравенства, связывающие значение
где константа В частности, если имелась смесь нормальных распределений, то Можно показать, что когда Конечно, это, скорее, эвристическое соображение, нежели точные рассуждения (можно, в частности, показать, что Пример 19.1. Приведем выражение для вычисления
Для нормальной плотности величина Когда
Все приведенные выше эвристические соображения могут быть применимы и к (19.6). Замечание. Можно использовать и отрицательные значения Р в (19.4). Тогда, однако, нужно либо искать направления U, минимизирующие величину 19.2.4. Проекционные индексы, основанные на использовании моментов третьего и четвертого порядков.Идея использования момента третьего порядка для поиска направлений, хорошо отображающих кластеры (если они есть), достаточно очевидна, если предполагать верной модель смеси симметричных распределений. Пусть U — проекционный вектор, тогда третий момент для одномерной проекции запишется
Дальше всюду, без ограничения общности, будем считать данные центрированными, т. е. полагать
Из выражения (19.7) видно, что отличие В качестве ПИ в решении максимизационной задачи целесообразнее использовать не сам третий момент, а коэффициент асимметрии. Хотя возможно и непосредственное использование Использование четвертого момента и связанного с ним коэффициента эксцесса
Константа с зависит только от функции
где Дж. В. Краскал предлагал использовать значения 19.2.5. Проекционные индексы, основанные на распределении разностных векторов.В задачах кластерного анализа и разделения смесей важной характеристикой структуры данных является распределение разностного вектора Предположим, что
где
Следовательно,
где В случае, когда имеется матрица данных Обратим внимание, что указанную оценку для ПИ Выборочное значение ПИ Пусть
где
Плотность распределения
Следовательно,
где
|
1 |
Оглавление
|