Главная > Статистический синтез при априорной неопределенности и адаптация информационных систем
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

5.4. ОГРАНИЧЕННЫЕ СВЕДЕНИЯ О СТАТИСТИЧЕСКИХ ХАРАКТЕРИСТИКАХ

Рассмотрим теперь случай, когда в соответствии с § 3.1 ограниченные априорные сведения о X заключаются в знании ряда статистических характеристик X (а не полного распределения вероятности), таких, как среднего значения, дисперсии, корреляционной матрицы и т. д., т. е. математических ожиданий некоторой совокупности функций Класс возможных распределений вероятности X в этом случае определен с помощью ограничений (3.1.4), где

индекс пробегает столько значений, сколько задано условий. В остальном же плотность распределения остается произвольной.

Для отыскания минимаксного правила решения с учетом заданных ограничений на класс о возможных распределений вероятности X воспользуемся соотношением (5.1.1) и найдем наименее предпочтительное распределение из этого класса. Тогда байесово правило решения для этого распределения X будет минимаксным. Ограничимся случаем непрерывных множеств X и и.

Пусть байесово правило решения относительно некоторого априорного распределения X с плотностью 0, получаемое с помощью обычной процедуры минимизации среднего риска Используем для отыскания наименее предпочтительного распределения метод Лагранжа, позволяющий учесть ограничения (3.1.4) на класс допустимых распределений вероятности. При этом плотность наименее предпочтительного распределения определяется из условия максимума функционала:

где а но, неопределенные множители, выбор которых должен обеспечить выполнение заданных ограничений (3.1.4) на т. е.

заданные значения математических ожиданий функций

Вычислим вариацию функционала по функции

где вариация функции вариация решающей функции по функции которая, очевидно, не зависит явно от X, а зависит только от градиент функции потерь по решению и. Поскольку в (5.4.2), т. е. является байесовой решающей функцией относительно распределения X с плотностью минимизирует средний риск

то из условия обеспечения минимума для этого решения следует выполнение равенства

Поэтому второе слагаемое в (5.4.4) обращается в нуль при любой Из условия обращения в нуль вариации среднего риска (5.4.4) следует уравнение для условного риска

которое позволяет сформулировать следующее правило нахождения наименее предпочтительного распределения:

— для того чтобы распределение с плотностью вероятности было наименее предпочтительным в классе распределений удовлетворяющих заданным ограничениям (5.4.3), условный риск для байесова правила решения относительно этого распределения должен иметь функциональную зависимость от X, определяемую выражением (5.4.6).

Это утверждение обобщает требование независимости условного риска от X, вытекающее из теоремы Вальда, при полном отсутствии априорных сведений о Последнее является естественным частным случаем (5.4.6), когда ни одной функции не задано и сумма по в правой части (5.4.6) отсутствует. Конкретный вид наименее предпочтительного распределения (плотности и соответствующего ему минимаксного правила решения зависит от заданных ограничений, а также от вида функции правдоподобия и функции потерь , однако соотношение (5.4.6) позволяет найти и минимаксное правило решения для многих важных с практической точки зрения случаев.

Рассмотрим один из таких примеров, когда является -мерным вектором, решение оценкой и задана корреляционная матрица X

а в остальном распределение X неизвестно и может быть произвольным.

При этом совокупность всех произведений а уравнение (5.4.6) для условного риска принимает вид

где множители определяются из условий

Таким образом, оценка соответствующая ограниченным априорным знаниям только корреляционной матрицы к, является оптимальной, если она байесова относительно априорного распределения вероятности к, для которого корреляционная матрица равна заданной, а условный риск для этой оценки представляет собой сумму постоянной величины и квадратичной формы к вида

Покажем, что при некоторых предположениях наименее предпочтительным является нормальное распределение k. Пусть функция потерь квадратичная, т. е.

где произвольная матрица, и пусть существует достаточная статистика для которой хотя бы приближенно

где определитель матрицы А (При этом без ограничения общности можно полагать Достаточная статистика является оценкой максимального правдоподобия вектора к, а представление (5 4 10) требует, чтобы она была несмещенной и распределена нормально (хотя бы приближенно). Матрица А в -это так называемая информационная матрица Фишера, которая определяется следующим образом.

где математическое ожидание вычисляется при фиксированном k. Она характеризует рассеяние оценки максимального правдоподобия и потенциально достижимую точность оценивания к в отсутствие всяких априорных сведений о k. Обратная ей матрица является корреляционной матрицей ошибок для эффективной оценки к, которой при данном представлении является оценка максимального правдоподобия — достаточная статистика

Рассмотрим нормальное распределение вероятности X с корреляционной матрицей и найдем для него байесову оценку. Средний риск в этом случае равен

где матрица, обратная и в силу того, что является достаточной статистикой и оптимальное решение может зависеть от х только посредством осуществлен переход от полной совокупности данных наблюдения х к достаточной статистике оценке максимального правдоподобия вектора Минимум среднего рисха (5.4.12) достигается, если и является условным (при заданном значении ) математическим ожиданием X, т. е. байесово правило решения имеет вид

где матрица определяется уравнением

Найдем теперь условный риск для этого правила решения:

где I — единичная матрица; след матрицы

Как видно из (5.4.15), условный риск имеет требуемый вид (5.4.7). Это означает, что нормальное распределение вероятности является наименее предпочтительным, а сама оптимальная оценка имеет вид (5.4.13), т. е. является линейным преобразованием оценки максимального правдоподобия. Матрица линейного преобразования С зависит от

корреляционной матрицы вектора X и корреляционной матрицы ошибок для оценки вектора X методом максимального правдоподобия.

Минимаксный риск для заданного класса о распределений вероятности X имеет следующее значение:

где след матрицы т. е. сумма ее диагональных элементов. Он всегда меньше минимаксного риска при полном отсутствии сведений об априорном распределении X, который в условиях справедливости (5.4.10) равен Значение риска (5 4.16) для правила решения (5.4.13) достигается, очевидно, также при любом распределении для которого корреляционная матрица равна

Представление функции правдоподобия (5.4.10) заведомо выполняется в том случае, когда совокупность нормальных случайных величин с корреляционной матрицей т. е. если данные наблюдения х представляют собой аддитивную смесь вектора X с гауссовой помехой

Если при этом известна корреляционная матрица X, то этому случаю соответствует известная постановка задачи линейной фильтрацил. Ее винеровское решение имеет вид (5.4.13), (5.4.14), а полученные выше результаты позволяют установить минимаксный смысл этого решения: если никаких других сведений о X, кроме корреляционной матрицы, нег" то никакого лучшего (в смысле квадратичной функции потерь) по сравнению с линейным оператором (5.4.13) оператора фильтрации не существует и только более подробные статистические сведения могут привести к изменению структуры оптимального оператора фильтрации.

Можно проиллюстрировать использование уравнения нахождения минимаксных оптимальных оценок еще большим количеством случаев. Например, пусть индекс для имеет смысл дискретного времени и для всех заданы срецние квадраты изменения за один шаг, т. е.

При переходе к непрерывному времени это будет означать задание среднего квадрата производной процесса для любого момента времени в интересующем нас интервале.

Уравнение (5.4.6) при этих ограничениях на распределение X принимает вид

Если задан второй момент для начального значения та к правой части этого выражения следует прибавить еще один член Аналогично рассмотренному выше случаю можно убедиться, что при этих ограничениях наименее предпочтительным является распределение для марковской случайной последовательности с переходной плотностью вероятности

и с равномерным распределением для начального значения когда величина не задана, либо нормальным распределением вероятности для с дисперсией если последняя задана. В обоих случаях оптимальная минимаксная оценка (оптимальный алгоритм фильтрации) находится без труда с помощью достаточно разработанных для подобных задач методов получения байесовых оценок.

1
Оглавление
email@scask.ru