Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

6.2. МЕТОД

6.2.1. Основные пространства и функции

Пусть конечное множество классифицируемых объектов, характеризуемых параметрами, т. е. рассматривается как часть аффинного пространства .

Пусть распределение массы на

Пусть метрика на индуцированное расстояние. Пусть (или проще -пространство представительств: множество аффинных подмногообразий размерности

Основу метода составляют следующие четыре отображения. 1) Определим меру близости между элементами и аффинными многообразиями как отображение:

где

Пусть V — направляющее подпространство — некоторая точка А,; если обозначить через оператор -ортогонального проектирования на то

Замечание 1. Когда к имеет размерность (т. е. сводится к одной точке а) у то

Замечание 2. Так как для любой точки существует вектор такой, что у а то

но вектором из V, ближайшим к , является , откуда

где есть оператор проектирования на ось, порожденную вектором базиса подпространства Соотношение (2) используется для практических расчетов.

Замечание 3. Можно интерпретировать как момент инерции точки х относительно аффинного многообразия X (т. е. инерции распределения массы, сосредоточенной в В дальнейшем пусть и распределение определено как в 6.2.1. Если обозначить через инерцию распределения относительно то

Эта величина, которую мы собираемся использовать в дальнейшем, будет также называться моментом инерции класса относительно К.

Замечание 4. Исходя из данных, которые нужно обрабатывать, и из желаемых результатов можно предложить другое определение более общее, чем предыдущее:

при (если то Сходимость алгоритма можно доказать и в этом случае.

2) - «функция» агрегирования, связанная с и определяемая следующим образом:

где

Это определение необходимо уточнить; при переходе от итерации к сталкиваются с одной из трех возможностей:

ситуация такова, что точка х остается в классе, которому она принадлежала на шаге, так как переход ее в другой класс не приводит к улучшению критерия и (2) — это случаи, когда х переходит в другой класс в соответствии со строгим убыванием критерия.

В случае (2) при наличии многих классов, расположенных на равном расстоянии от х, точку х относят к классу с наименьшим индексом. Итак, имеем следующее определение:

Очевидно, что такое определение имеет чисто теоретический интерес, практически же случаи равенства расстояний от точки х до представительств разных классов маловероятны. Но при таком определении каждой модификации разбиения соответствует улучшение критерия определенного ниже. Это позволяет доказать и использовать в 6.3.4.2 свойство ограниченной инъективности функции

Замечание действительно является функцией, так как есть разбиение, однозначно определенное таблицами близости между индивидуумами и центрами агрегирования.

Замечание 2. Интуитивно ясно, что новый класс состоит из точек (число точек класса априори не фиксировано), более «близких» (в смысле расстояния, определенного в 6.2.1) к многообразию чем к любому другому многообразию.

3) Определим меру близости

между классами и аффинными многообразиями следующим образом

Определим также

Нетрудно заметить, что (см. замечание 3 на с. 102) и что аналог меры среднего рассеяния класса вокруг аффинного многообразия будет предполагаться инъективным относительно первого аргумента, т. е.

Предполагается, что распределение масс имеет равную инерцию относительно двух многообразий только в том случае, когда эти многообразия совпадают, что неверно, например, в случае равномерного распределения в области с симметриями. Однако на практике такие распределения маловероятны.

4) g - «функция», связанная с которая позволяет определять К центров агрегирования исходя из -разбиения Она задается следующим образом:

где аффинное многообразие размерности такое, что т. е. это -мерное аффинное многообразие в относительно которого распределение имеет минимальную инерцию.

Воспользуемся следующими известными фактами:

где два «параллельных» аффинных многообразия и по теореме Гюйгенса

Следовательно, есть аффинное многообразие, проходящее через центр тяжести класса

2. Если положить то решение получим при одновременном исследовании двух квадратичных форм: квадратичная форма инерции распределения положительно определенная квадратичная форма, определяющая на евклидову структуру.

Из известных результатов факторного анализа (см. [1]) следует, что

векторное подпространство, порожденное первыми главными осями инерции сгущения Поскольку

имеем

Существование -центра дающего решение задачи на минимум, таким образом, доказано, но, конечно, условие для единственного не обязательно должно выполняться. Известно, что в случае кратных собственных значений подпространство определяется не единственным образом. Следовательно, в общем случае не является функцией. Однако в многочисленных приложениях кратные собственные значения встречаются только как исключение; они «появляются естественным образом только при наличии симметрии геометрической конфигурации». Поэтому мы не обращаем внимания на этот случай.

Замечание. Формализм при использовании локальных метрик. Квадратичная положительно определенная форма определяющая на евклидову структуру, может быть:

выбрана раз и навсегда (алгоритм ANATYP-A, описанный в 6.2.3); связана с анализируемым сгущением (алгоритм ANATYP-B см. 6.3.3.). В этом случае формализм, принятый здесь, следует модифицировать. Новые определения будут даны в 6.3.2.

1
Оглавление
email@scask.ru