Главная > Методы анализа данных. Подход, основанный на методе динамических сгущений
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

15.2. МЕТОД, ИСПОЛЬЗУЮЩИЙ ЦЕНЫ СОЗДАНИЯ КЛАССОВ

15.2.1. Введение

Один из возможных подходов к определению числа классов, на которые следует разбить множество состоит во включении в критерий цены создания класса. Таким образом, мы приходим к задаче о назначении [2], [8]. В наиболее простой форме ее можно представить как определение оптимального положения К центров обслуживающих клиентов разбросанных по некоторой территории. Каждому центру ставится в соответствие — цена его размещения. Каждому клиенту соответствует Цена прикрепления клиента к центру. Если в качестве решения взять некоторое подмножество центров то цена этого решения будет состоять из

— цены размещения центров и

— цены прикрепления клиентов к центрам

Задача заключается в определении такого что

Оптимальное решение всегда является компромиссом между двумя крайними решениями:

1) N = L. При этом цена минимальна, но достигает максимума;

2) множество состоит из единственного центра который имеет минимальную цену Однако при этом сильно возрастает цена

Поиск оптимального решения посредством полного перебора сложно реализовать, если поскольку число возможных решений имеет порядок Поэтому следует искать субоптимальные решения. Для этого часто используются гридиалгоритмы [51, [12]. Они сводят задачу к поиску пути на графе, соответствующем частям, на которые разбивается множество клиентов. Такие алгоритмы имеют сложность порядка

Другой подход состоит в объединении множества клиентов и множества центров. Иначе говоря, точки, в которых располагаются центры, включаются в множество точек, в которых расположены клиенты. При этом общность не ограничивается, так как для каждого возможного расположения центра можно создавать фиктивного клиента.

15.2.2. Описание метода

Введем следующие обозначения: множество, состоящее из элементов расстояние на подмножество содержащее элементов; система весов на . В задаче о назначении имеет смысл множества клиентов, множества центров.

В дальнейшем будет играть роль пространства представительств. Определим меру адекватности элементов следующим образом:

где цена элемента у.

Алгоритм, описанный в гл. 2, позволяет оптимизировать критерий

где разбиение на классов и множество элементов пространства представительств

определяется по формуле (1) при Формулу (2) можно представить в виде

или

Таким образом, критерий распадается на два слагаемых. При заданном числе классов первое слагаемое может быть минимизировано методом динамических сгущений при фиксированном числе элементов в ядрах [4]. Если цены элементов из равны, то

и задача сводится к методу динамических сгущений, где число элементов в каждом ядре следует положить равным Если же предъявленные требования не удовлетворяются, то можно воспользоваться алгоритмом, который в терминах введенных понятий можно описать следующим образом.

1. Начальный шаг. Выбираются элементов Выбор может быть случайным или заданным пользователем.

2. Функция назначения. Каждый элемент помещается в класс если минимально среди всех Таким образом, получается разбиение где

в случае равенства

Заметим, что на этом шаге уменьшается только первая сумма в выражении (3), вторая сумма не меняется, так как она зависит только от выбора элементов из

3. Функция представительства. Для каждого класса выбирается новый представитель

4. Критерий остановки итерационного процесса. Если выполняется одно из следующих трех условий, то надо перейти к шагу 5:

а) для всех классов представители не изменились;

б) классы, полученные на двух последних итерациях, идентичны;

в) -где заданное число, значение критерия на итерации.

5. Изменение числа классов. Цена исключения элемента

где минимальное из расстояний между х и элементами кроме

Цена создания нового класса

где расстояние между х и наиболее близким к нему элементом

Если для некоторого то исключение центра вызывает уменьшение критерия. Если для то уменьшения критерия можно достичь созданием нового центра Итак, на этом шаге вычисляются:

Если то ни создание новых классов, ни ликвидация уже имеющихся не могут вызвать уменьшения критерия, т. е. мы достигли локального минимума и должны прекратить работу алгоритма. Если же то следует соответствующим образом изменить число классов и продолжить оптимизацию, вернувшись к шагу 2.

15.2.3. Заключение

С помощью описанного метода априорное задание числа классов заменяется введением цены создания класса. Если все элементы из могут быть представителями классов и все представители имеют одну цену то метод упрощается, а критерий принимает вид

Таким образом, отмена задания числа классов требует только выбора цены создания класса, и критерий является возрастающей линейной функцией от числа классов для этой цены.

В работе [6] рассмотрена задача оценки стоимости создания нового класса, если требуется, чтобы критерий имел одно и то же значение для разбиения при котором каждый элемент множества образует отдельный класс, и для разбиения при котором все элементы попадают в один класс:

где у — элемент из минимизирующий критерий При этом требование влечет

Еще одно важное замечание относится к начальному шагу алгоритма. Как и в методе динамических сгущений, можно исходить из наугад выбранных элементов, но можно задать их, взяв, например, за начальное разбиение или

1
Оглавление
email@scask.ru