всего, затем процедура повторяется, т. е. алгоритм реализует метод динамических сгущений для случая, когда роль ядра класса играет его центр тяжести. Получаются следующие результаты:
а) критерий, оптимизируемый этим методом, имеет вид
где
расстояние в метрике (2) и
центр тяжести класса
б) последовательность
стабилизируется (т. е.
кроме того,
14.2.1.2. Связь между критерием W и коэффициентам сопряженности «хи-квадрат»
Пусть
некоторое разбиение множества
центр тяжести этого множества. Тогда согласно теореме Гюйгенса
Словами это можно выразить так: общая инерция
равна сумме внутриклассовой инерции
и межклассовой инерции
т. е.
Выражение для
Если
то по определению центра тяжести
напомним, что
Откуда
таким образом получаем, что общая инерция
равна коэффициенту
исходной таблицы (см. (1)), который мы будем обозначать как
Выражение для В
Пусть
таблица сопряженности, полученная суммированием по объектам, принадлежащим
классу:
Таким образом,
Отсюда получаем, что
где
— коэффициент
для таблицы
Выражение для
совпадает с критерием (3), оптимизируемым методом динамических сгущений для множества
состоящего из элементов массы
и расположенного в пространстве с метрикой
-Итак, (3) можно представить следующим образом:
где
значение критерия для разбиения
Поскольку
не зависит от разбиений, алгоритм динамических сгущений, минимизируя
максимизирует коэффициент
для таблицы
14.2.2. Предлагаемый алгоритм
Во время работы алгоритма исходя из некоторого начального
строится последовательность разбиений
такая, что последовательность
возрастает. Будет показано что последовательность
стабилизируется.
14.2.2.1. Необходимость задания чисел классов р и q
В выражениях
Значения
и
всегда положительны, и поэтому
Следовательно, если
заранее не фиксированы, то наилучшими разбиениями в смысле критерия
окажутся тривиальные разбиения, в которых каждый элемент множеств
является отдельным классом. Числа
можно определить, изучая изменение критерия как функции от
14.2.2.2. Построение ... исходя из ...
Пусть
таблица сопряженности, элементы которой
где
исходная таблица сопряженности,
разбиение множества
на классы
этой таблице можно применить метод, описанный в (14.2.1). Будем считать, что объектами, подлежащими классификации, являются элементы множества
классов разбиения
параметры. Таким образом, можно построить такую последовательность разбиений на
классов
множества
что последовательность соответствующих значений
будет возрастать до некоторого номера:
Здесь
номер, начиная с которого значения этой последовательности стабилизируются. Если
то для улучшения этого разбиения достаточно положить
При этом
14.2.2.3. Построение ... исходя из ...
Принцип тот же, что и в случае построения разбиения
только теперь следует рассматривать таблицу
Получается последовательность разбиений на
классов множества
на которой значения
сначала строго возрастают, а потом стабилизируются. В качестве
берется предел этой последовательности. При этом
14.2.3. Сходимость последовательности ...
Число всевозможных разбиений множеств I и 7 на
классов конечно. Последовательность значений
возрастает и ограничена сверху. Следовательно, она стабилизируется, т. е.
Из свойств метода динамических сгущений (см. 14.2.1.1) вытекает, что последнее равенство может выполняться только при