Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
1.7. Алгоритм последовательной кластеризацииСхема последовательной кластеризации может быть описана следующим образом. Рассмотрим
Повторяя процесс, мы получим последовательные множества кластеров, состоящие из В качестве меры расстояния примем квадрат евклидовой метрики Таблица 1.4. Значения
Предположим, что расстояние между Таблица 1.5. Значения
Легко видеть, что Ланс и Уильямс [223] предложили рекурсивную процедуру, в которой вычисления матрицы расстояний опираются только на значения расстояний в предыдущей матрице. Их рекурсивная схема предполагает использование минимального и максимального локальных расстояний, медианы, групповых средних и центра. Все пять случаев, за исключением минимального локального расстояния и медианы, были описаны в параграфе 1.6. Минимальное локальное расстояние между двумя кластерами Уишарт [394] считает, что процедуру Уорда [387] можно объединить с пятью, рассмотренными выше. Как было показано в параграфе 1.5, объединение кластеров
где
Более того, из (1.13) следует, что
Подставляя выражение (1.15). для каждого
Уравнение (1.16) определяет величину приращения ВСК при объединении Начиная с матрицы квадратов евклидовых расстояний (табл. 1.4)
выполняется для всех Подставляя
где Алгоритм группирбвки окончательно может быть записан следующим образом [394]: 1) Найдем 2) Увеличение целевой функции при объединении двух кластеров 3) 4) Полагаем 5) Записываем элементы кластера Ланс и Уильямс [223] получили общее уравнение (1.19), аналогичное (1.18) и верное для всех пяти процессов кластеризации, описанных выше. Это уравнение может быть записано в следующем виде:
где Значения параметров, входящих в общую формулу (1.19), соответствующие шести различным процессам кластеризации, приведены ниже: минимальное локальное расстояние: максимальное локальное расстояние: медиана: среднее группы: центроидный метод: метод Уорда: Первые пять значений параметров приводятся в работе Ланса и Уильямса [223]. Значения параметров в методе Уорда найдены Уишартом [394] и получаются из уравнения (1.19). Все шесть методов были объединены в одну вычислительную программу с параметрами
|
1 |
Оглавление
|