Главная > Статистический синтез при априорной неопределенности и адаптация информационных систем
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

16.4. ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ ОБ ОПТИМИЗАЦИИ МНОГОШАГОВОГО ПРОЦЕССА ПРИНЯТИЯ РЕШЕНИЙ

Рассмотрим еще раз сущность основных рекуррентных соотношений (2.7.20), (2.7.21), определяющих правило оптимизации многошагового процесса принятия решения. Мы уже отмечали, что входящий в эти

соотношения апостериорный риск представляет собой величину ожидаемых потерь, при следующих условиях:

— к -му шагу приняты решения

— получена совокупность данных наблюдения в дальнейшем на и последующих шагах вплоть до конечного шага решения после получения данных наблюдения будут приниматься оптимально, так чтобы в среднем потери оказались минимальны.

Таким образом, риск с одной стороны, зависит от прошлых решений и настоящего которые предполагаются фиксированными и подлежат выбору, а с другой стороны, учитывает будущее поведение, относительно которого предполагается, что на каждом следующем шаге мы будем выбирать наилучшее решение с точки зрения минимума потерь. Выбор же оптимального решения на любом шаге минимизацией апостериорного риска гарантирует, что будущее поведение действительно оптимально.

Ясное понимание сущности апостериорного риска приводит к заметному упрощению решения задачи в тех случаях, когда удается рассчитать заранее величину этого риска для любого значения не прибегая к формализму основных рекуррентных соотношений, требующих выполнения довольно сложной последовательности минимизаций и усреднений. Подобная возможность часто возникает в задачах, когда потери обусловлены только конечным решением а само это решение имеет качественно иное содержание по сравнению с решениями на всех предыдущих шагах, которые, в свою очередь, влияют на потери лишь косвенно, через процесс получения данных наблюдения или процесс изменения параметров X, определяющих потери. Характерными в этом смысле являются многие задачи измерения (оценки тех или иных параметров) с управлением процессом получения данных наблюдения. В этих задачах может иметь место даже дополнительное упрощение, связанное с тем, что при апостериорный риск оказывается не зависящим от наблюдаемых данных

Рассмотрим для пояснения самый элементарный пример задачи оценки с управлением процессом наблюдения. Пусть имеется -шаговый процесс, в конце которого мы должны принять решение представляющее собой оценку некоторого параметра X, так чтобы средний квадрат отклонения от X был минимален. На каждом предыдущем шаге мы можем принять одно из двух решений :

— начать со следующего шага процесс наблюдения и продолжать его до шага;

- не начинать наблюдения и подождать до принятия решения на следующем шаге.

Пусть потери, связанные с этими решениями, характеризуются некоторой функцией которую без ограничения общности можно считать равной нулю, если все равны нулю, и невозрастающей функцией номера шага на котором принято решение Например, если стоимость наблюдения на любом шаге одинакова, то

где с — стоимость одного наблюдения, номер шага, на котором принято решение о начале наблюдения с шага. Тогда

полная функция потерь может быть записана в виде

где зависит от последовательности решений (чтобы подчеркнуть явную зависимость функции (16.4.1) от ее можно записать, например, в виде

однако серьезный необходимости в этом нет), а стоимость одного наблюдения с предлагается выраженной в единицах среднего квадрата ошибки оценивания параметров

В соответствии с видом функции потерь (16.4.2) оптимальное правило принятия конечного решения при фиксированной последовательности предыдущих решений заключается в выборе в качестве оптимальной в смысле минимума среднего квадрата отклонения оценки построенной по совокупности данных наблюдения полученных после шага, а риск для фактически зависит только от номера шага на котором принято решение и равен

где минимальный средний квадрат ошибки измерения параметра

X по совокупности наблюдений начиная с и кончая шагом. Риск не зависит от данных наблюдения (поскольку до шага они просто отсутствуют), а оптимальная последовательность решений — фактически номер шага после которого начинается наблюдение, выбирается минимизацией (16.4.3). Пусть, например,

что соответствует случаю где последовательность независимых нормально распределенных величин При этом оптимальное значение выбирается из условия

или приближенно

Этот пример является простейшей иллюстрацией возможности нахождения апостериорного риска на основе знания только структуры оптимального правила принятия конечного решения и риска, соответствующего этому конечному решению. В следующем параграфе рассмотрим более сложную задачу подобного рода, а пока отметим, что совершенно аналогичные результаты получаются, если несколько изменить задачу и управлять не началом, а концом наблюдения. При этом имеется

в виду многошаговый процесс, в котором конечной целью по-прежнему является получение оценки параметра с минимальным средним квадратом отклонения от истинного значения, а управление процессом наблюдения заключается в том, что мы начинаем его на первом шаге и продолжаем до некоторого шага включительно. В этом случае на любом шаге мы можем принять одно из двух решений:

продолжить наблюдение еще на один шаг до принятия решения на следующем шаге;

закончить наблюдение и сформировать оценку параметра

При постоянной стоимости наблюдений этому многошаговому процессу соответствует функция потерь

где номер шага, на котором принято решение о прекращении наблюдения. Оптимальное конечное решение заключается в формировании оценки по совокупности наблюдаемых значений обеспечивающей минимальный средний квадрат отклонения от истинного значения параметра Апостериорный риск при условии прекращения наблюдения на шаге, т. е. для последовательности решений равен

где минимальный средний квадрат отклонения оценки от истинного значения параметра Я, вычисленный по апостериорному распределению вероятности Я. Если и — нормально распределенные величины, апостериорная дисперсия совпадает со своим математическим ожиданием:

и с точностью до замены на мы имеем ту же задачу, что и рассмотренная выше.

Фактическое различие между ними заключается только в том, что в первом случае мы решаем, когда начать наблюдение, а во втором — когда закончить. В обоих случаях риск зависит только от продолжительности наблюдения, что естественно и приводит к одинаковой оптимальной продолжительности наблюдения. Нужно заметить, что такая эквивалентность задач существует только при отсутствии априорной неопределенности. При неполном априорном знании это уже не так, и рассматриваемый пример является весьма характерной иллюстрацией того, что две близкие по постановке задачи статистического решения, приводящие к одинаковым правилам принятия решения при полном априорном знании, могут оказаться совершенно разными и по сути и по виду правила принятия решения в условиях априорной неопределенности.

Пусгь, например, имеет место простейший случай, когда где — независимые нормально распределенные величины с

неизвестной дисперсией Тогда для обеих задач апостериорный риск имеет неопределенное значение, правило принятия решения о начале или прекращении наблюдения, требующее знания величины также не определено и нужно использовать тот или иной из рассмотренных методов синтеза в условиях априорной неопределенности. В первой задаче до принятия на каком-либо шаге решения о начале наблюдения мы вообще не имеем никаких данных, которые позволили бы нам вынести суждение о неизвестном значении Поэтому единственным доступным методом является прямой минимаксный подход, который в данном случае соответствует выбору оптимального номера шага к, определяющего начало наблюдения, из условия минимума величины

где максимально возможное априори значение дисперсии которое может быть, в частности, и неограниченно большим. Далее, оптимальное значение к выбирается по (16.4.5) с заменой на Априорная неопределенность приводит к необходимости увеличения продолжительности наблюдения, а при больших значениях заставляет начинать наблюдение без промедления с первого шага.

По-иному обстоит дело во второй задаче. В Этом случае для принятия решения о прекращении наблюдения мы имеем возможность воспользоваться полученными данными для оценки неизвестного значения и использовать адаптивный байесов подход. В результате мы будем иметь оценку апостериорного риска

где оценка неизвестной дисперсии построенная по совокупности данных наблюдения и выберем оптимальное значение так же, как при отсутствии априорной неопределенности с заменой на оценку Последняя определяется по простой рекуррентной формуле

и. если только оптимальное (при отсутствии априорной неопределенности) значение не очень мало, будет близка к истинному значению . В результате этого и оптимальная продолжительность наблюдения, а следовательно, и результирующие потери будут близки к тем, которые получаются при полном априорном знании.

1
Оглавление
email@scask.ru