Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

12.5. МЕТОД, В КОТОРОМ РАССТОЯНИЕ ОПРЕДЕЛЯЕТСЯ ОДИНАКОВО ДЛЯ ВСЕХ КЛАССОВ

Описанные выше методы требуют довольно много времени, поскольку на каждом шаге итерационного процесса определяются расстояния . В методе, который будет описан ниже, расстояние определяется на каждой итерации заново, но является одинаковым для всех классов.

12.5.1. Описание метода

Элемент пространства представительств состоит из точек и Расстояния принадлежащего семейству функций которое будет описано ниже:

Критерий определяется соотношением

где Он имеет смысл суммы инерции по всем классам в метрике относительно точек

Функция каждому представительству ставит в соответствие разбиение минимизирующее критерий (9). Очевидно, что класс разбиения оказывается сформированным из элементов, наиболее близких к в смысле

Замечание. Элемент, для которого расстояния до нескольких центров равны, относится к классу с наименьшим номером.

Функция каждому разбиению ставит в соответствие набор точек и расстояние минимизирующее (9). Задача заключается в определении таких точек и соответствующего расстояния.

Могут встретиться различные ситуации. Например, если множество квадратичных расстояний, определяемых матрицами с единичными определителями, то метрика определяется матрицей

где

вектор-столбцы, соответствующие центр тяжести класса

С помощью функций можно, как и в общем случае, построить-алгоритм, который будет обладать теми же свойствами сходимости.

12.5.2. Пример с искусственными данными

Описанный метод применялся к задаче классификации сорока то, чек, выбранных из двух классов в двумерном пространстве

Рис. 12.6

Наилучшее (в смысле критерия) разбиение было найдено после пяти прогонов алгоритма (при случайном «извлечении» представителей в качестве исходной точки последовательности, см. рис. 12.7),

Рис. 12.7

Начальное расстояние определялось матрицей Матрица расстояния, полученного в результате работы алгоритма, имеет вид

Применение метода динамических сгущений с евклидовой метрикой дает совершенно другие результаты.

1
Оглавление
email@scask.ru