Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

14.2. ОПИСАНИЕ МЕТОДА

Предлагаемый метод основан на поочередном разбиении множеств При этом используется модификация алгоритма динамических сгущений 121. Уточним, что имеется в виду, прежде чем описывать метод перекрестной классификации.

14.2.1. Метод динамических сгущений с использованием расстояния «хи-квадрат» и центра тяжести

Пусть таблица частот на Ищется разбиение множества на классов, Мы будем иметь дело со сгущением образованным -векторами; наделенными массой и масса вектора равна Предполагается, что в пространстве, в котором лежит сгущение введена метрика, задаваемая матрицей

14.2.1.1. Алгоритм

Начиная с некоторого исходного разбиения строится последовательность разбиений для каждого класса разбиения определяется центр тяжести; новое разбиение строится таким образом, что каждый элемент относится к тому классу, к центру которого он ближе

всего, затем процедура повторяется, т. е. алгоритм реализует метод динамических сгущений для случая, когда роль ядра класса играет его центр тяжести. Получаются следующие результаты:

а) критерий, оптимизируемый этим методом, имеет вид

где расстояние в метрике (2) и центр тяжести класса

б) последовательность стабилизируется (т. е. кроме того,

14.2.1.2. Связь между критерием W и коэффициентам сопряженности «хи-квадрат»

Пусть некоторое разбиение множества центр тяжести этого множества. Тогда согласно теореме Гюйгенса

Словами это можно выразить так: общая инерция равна сумме внутриклассовой инерции и межклассовой инерции т. е.

Выражение для

Если то по определению центра тяжести

напомним, что Откуда

таким образом получаем, что общая инерция равна коэффициенту исходной таблицы (см. (1)), который мы будем обозначать как

Выражение для В

Пусть таблица сопряженности, полученная суммированием по объектам, принадлежащим классу: Таким образом,

Отсюда получаем, что где — коэффициент для таблицы Выражение для совпадает с критерием (3), оптимизируемым методом динамических сгущений для множества состоящего из элементов массы и расположенного в пространстве с метрикой -Итак, (3) можно представить следующим образом:

где значение критерия для разбиения Поскольку не зависит от разбиений, алгоритм динамических сгущений, минимизируя максимизирует коэффициент для таблицы

14.2.2. Предлагаемый алгоритм

Во время работы алгоритма исходя из некоторого начального строится последовательность разбиений такая, что последовательность возрастает. Будет показано что последовательность стабилизируется.

14.2.2.1. Необходимость задания чисел классов р и q

В выражениях

Значения и всегда положительны, и поэтому Следовательно, если заранее не фиксированы, то наилучшими разбиениями в смысле критерия окажутся тривиальные разбиения, в которых каждый элемент множеств является отдельным классом. Числа можно определить, изучая изменение критерия как функции от

14.2.2.2. Построение ... исходя из ...

Пусть таблица сопряженности, элементы которой

где исходная таблица сопряженности, разбиение множества на классы этой таблице можно применить метод, описанный в (14.2.1). Будем считать, что объектами, подлежащими классификации, являются элементы множества классов разбиения параметры. Таким образом, можно построить такую последовательность разбиений на классов множества что последовательность соответствующих значений будет возрастать до некоторого номера:

Здесь номер, начиная с которого значения этой последовательности стабилизируются. Если то для улучшения этого разбиения достаточно положить При этом

14.2.2.3. Построение ... исходя из ...

Принцип тот же, что и в случае построения разбиения только теперь следует рассматривать таблицу Получается последовательность разбиений на классов множества на которой значения сначала строго возрастают, а потом стабилизируются. В качестве берется предел этой последовательности. При этом

14.2.3. Сходимость последовательности ...

Число всевозможных разбиений множеств I и 7 на классов конечно. Последовательность значений возрастает и ограничена сверху. Следовательно, она стабилизируется, т. е.

Из свойств метода динамических сгущений (см. 14.2.1.1) вытекает, что последнее равенство может выполняться только при

С другой стороны, получается из но было получено уже к моменту сходимости последовательности из Отсюда

Таким образом, последовательность стабилизируется.

1
Оглавление
email@scask.ru