Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
19.3. Выявление эллипсоидальной кластерной структуры (восстановление дискриминантного подпространства)19.3.1. Восстановление дискриминантного подпространства на основе проекционных индексов типа функционалов от плотностей распределения проекций.Почему решение оптимизационной задачи (19.1) с использованием ПИ вида (19.4) приведет к выявлению кластерной структуры? Частично ответ следует из рассмотрения неравенства (19.5). Более того, оказывается, что, решая пошаговым методом задачу (19.1), придем к некоторому новому базису в ДП, которое, как указывается в п. 19.2.2, содержит полную информацию о кластерной структуре в случае, если верна модель (19.2), (19.2). Верна следующая лемма. Лемма 19.1. Пусть имеет место модель смеси распределений (19.2), (19.2). Предположим теперь, что векторы Доказательство. ПИ
где через
где
Вектор V является линейной комбинацией векторов
Вектор в правой части этого равенства принадлежит Заметим теперь, что число Когда же Другими словами, если задача поддается визуализации, т. е. имеется проекция размерности Приведем пример, показывающий, что условие равенства внутрикомпонентных матриц ковариаций является существенным для оценки дискриминантного подпространства на основе максимизации ПИ типа Пример 19.2. Рассмотрим двумерное распределение
где
Легко проверить, что X имеет среднее, равное нулю, и единичную ковариационную матрицу. Проекция X на первую координатную ось имеет плотность вида
а на вторую ось
Заметим, что 1) для любого а существует такое 2) для любого В обоих случаях для выделения кластеров, скажем, по критерию дискриминантного анализа или визуально, предпочтительнее вторая координатная ось. На этой оси расстояние махаланобисского типа между компонентами смеси максимально. В то же время следует отметить, что проекция на первую координатную ось обладает следующим экстремальным свойством: различие по вторым моментам (отношение дисперсии первого компонента смеси 19.3.2. Оценка дискриминантного подпространства на основе моментных индексов.Использование ЦП на основе критериев вида (19.4) на практике требует значительного объема вычислений. В данном параграфе предлагается простой способ оценки ДП или нескольких векторов на него на основе критериев асимметрии и эксцесса [69]. Полученные таким способом направления проецирования могут использоваться как самостоятельно, так и как Р «хорошие» стартовые точки для определения направлений f проецирования на основе критерия (19.4). Рассмотрим способ получения векторов, математическое ожидание которых принадлежит не самому ДП, а подпространству Используя (19.7), (19.8), докажем следующую лемму. Лемма 19.2. Пусть по выборке получены векторы
где S — оценка матрицы ковариаций X; U — произвольный вектор. Тогда для математических ожиданий векторов (19.11), (19.12) верны соотношения
где константы Из (19.13), (19.13) следует, что
Докажем только равенство (19.13) для вектора (19.11). Имеем
(в левой части в квадратных скобках стоит смещенная оценка третьего момента Следующая лемма определяет способ получения оценки некоторого вектора из Ям, свободный от произвола в выборе вектора U. Лемма 19.3. Пусть Н есть некоторая положительно определенная матрица, а
Тогда для вектора
Действительно, пусть вектор U в (19.11) распределен независимо от X с средним 0 и матрицей ковариаций Н. И пусть Операторы 19.3.3. Оценка подпространства R.Пусть теперь Вектор Лемма 19.4. Пусть последовательность векторов
где
Поскольку ранг системы векторов Хотя в реальной ситуации ранг Пусть
|
1 |
Оглавление
|