Главная > Кластерный анализ
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

1.2. Задача кластерного анализа

Пусть m — целое число, меньшее, чем . Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся в множестве X, разбить множество объектов на кластеров (подмножеств) так, чтобы каждый объект h принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными (несходными).

Решением задачи кластерного анализа является разбиение, удовлетворяющее некоторому критерию оптимальности. Этот критерий может представлять собой некоторый функционал, - выражающий уровни желательности различных разбиений и группировок. Этот функционал часто называют целевой функцией. Например, в качестве целевой функции может быть взята внутригрупповая сумма квадратов отклонений (см. параграф 1.5). В качестве примера рассмотрим объектов, обладающих одной характеристикой (т. е. результаты измерения пусть представляют собой множество Х={3, 4, 7, 4, 3, 3, 4, 4}. Сумма квадратов отклонений вычисляется по формуле

где представляет собой измерение объекта. Для нашего примера, содержащего 8 объектов, получим:

Если множество X разбить на три группы: , то все внутригрупповые суммы квадратов отклонений будут равны нулю:

где обозначает сумму квадратов, соответствующую группе Оптимальное значение для этого примера равно нулю при условии, что ведется разбиение натри группы. В общем случае следует рассматривать значение целевой функции в сочетании с желаемым числом групп. Далее будут определены различные виды целевых функций, многие из которых могут быть записаны в универсальной и общей форме.

Очевидно, для того чтобы «решить» задачу кластерного анализа, необходимо количественно определить понятия сходства и разнородности. Что означает «два объекта различны»? Задача была бы решена, если бы объекты попадали в один и тот же кластер всякий раз, когда расстояние (отдаленность) между соответствующими точками и было бы «достаточно малым», и, наоборот, попадали в разные кластеры, если бы расстояние между точками было бы, «достаточно большим». Таким образом, для нашей цели следует рассмотреть понятие расстояния между точками из с абстрактных позиций.

1
Оглавление
email@scask.ru