Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

6.2.4. Метрики и функция представительства

В процессе работы алгоритма метрика играет существенную роль. Ее влияние сказывается как при переходе от -центров сгущений к -разбиению так и при поиске К аффинных многообразий, связанных с разбиением.

Применить это значит вычислить для каждого класса квадратичную форму инерции V сгущения и диагонализовать поскольку есть аффинное многообразие размерности порожденное первыми собственными векторами формы Очевидно, что

различные варианты выбора связаны между собой; рассмотрим 3 возможности.

1. . В этом случае не зависит от анализируемого сгущения и не возникает задача о локальных метриках, т. е. метриках, ассоциированных с каждым классом.

Чтобы осуществить глобальный анализ сгущения , диагонализуют матрицу корреляций:

где

и

Другими словами, выполняют анализ главных компонент сгущения стандартизованных данных. На уровне классов это означает провести АГК подмножества множества стандартизованных данных

Когда выполняют локальный анализ для класса диагонализуют матрицу

где компонента центра тяжести преобразованного сгущения

Матрица не является матрицей коэффициентов корреляции переменных для класса для любого проводят анализ главных компонент сгущения данных, стандартизованных глобально, а не локально. При глобальном анализе роль этой метрики заключается в том, чтобы результаты не зависели от единиц измерения и она априори придает одинаковую важность различным признакам. Эти преимущества сохраняются в локальном анализе, если использовать локальные метрики, а именно

Матрица, которую следует диагонализовать, вместо (4) примет вид

Поскольку

и

то

Если используют (4) вместо (5) для признака, который мало меняется на классе но сильно меняется на всем множестве, т. е. мало по сравнению с то важность этого признака в анализе рассматриваемого класса уменьшают. Обратно, если (т. е. признак сильно изменяется на классе, но не на всем то подчеркивают большую значимость этого признака при анализе класса. метрика

Очевидно, желательно использовать метрику и» следовательно, анализ соответствий. Преимущества многочисленны: распределительная эквивалентность одновременное барицентрическое представление... Метрика в этом случае определяется данными, что ставит проблему локальных метрик, которая будет уточнена в 6.3.2.

1
Оглавление
email@scask.ru