Главная > Распознавание образов и анализ сцен
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

4.9. АППРОКСИМАЦИЯ ДЛЯ БИНАРНОГО СЛУЧАЯ

4.9.1. РАЗЛОЖЕНИЕ РАДЕМАХЕРА — УОЛША

Когда составляющие вектора х дискретны, задача оценки плотности распределения становится задачей оценки вероятности . По идее задача эта еще проще, нужно только считать, сколько раз наблюдается х, чтобы получить значение и воспользоваться законом больших чисел. Однако рассмотрим случай, когда d составляющих вектора х бинарны (имеют значения 0 или 1). Поскольку имеется возможных векторов мы должны оценить вероятностей, что представляет собой огромную задачу при больших значениях d, часто возникающих в работе по распознаванию образов.

Если составляющие вектора х статистически независимы, задача намного упрощается. В этом случае можем написать

Таким образом, в этом частном случае оценка для сводится к оценке d вероятностей . Более того, если мы возьмем логарифм то увидим, что он является линейной функцией от х, что упрощает как запоминание данных, так и вычисление:

где

Естественно поинтересоваться, существуют ли какие-либо компромиссные решения между полной строгостью, для достижения которой требуется оценка вероятностей, и вынужденным принятием

статистической независимости, что сведет всю проблему к оценке только d вероятностей. Разложение для и аппроксимация частичной суммой дают один ответ. Когда имеются бинарные переменные, естественно использовать полиномы Радемахера — Уолша в качестве базисных функций. Такое множество полиномов можно получить путем систематического образования произведений различных сомножителей которые получаются следующим образом: ни одного сомножителя, один сомножитель, два и т. д. Таким образом, имеем

Нетрудно заметить, что эти полиномы удовлетворяют отношению ортогональности

где суммирование проводится по возможным значениям х. Итак, любую функцию определенную на единичном -кубе, можно разложить как

где

Рассматривая как вероятностную функцию видим, что

Поскольку функции Радемахера — Уолша полиномы, видим, что коэффициенту являются в сущности моментами. Так что, если неизвестна, но имеется выборок коэффициенты можно оценить, вычисляя моменты выборок :

В пределе с устремлением к бесконечности эта оценка по закону больших чисел должна сойтись (по вероятности) к истинному значению

Теперь выражение (47) дает нам точное разложение для , и в этом случае оно не упрощает наши вычисления. Вместо оценки совместных вероятностей мы должны оценить моментов — коэффициентов Можно, однако, аппроксимировать Р(х), усекая разложение и вычисляя только моменты низкого порядка. Аппроксимация первого порядка, полученная с помощью первых членов, будет линейной относительно х. Аппроксимация второго порядка, содержащая первые членов, будет квадратичной относительно . В целом выражение (47) показывает, что для аппроксимации полиномами Радемахера — Уолша степени k требуется оценка моментов порядка k и ниже. Эти моменты можно оценить, исходя из данных, или вычислить непосредстренно из . В последнем случае тот факт, что можно суммировать сначала по переменным, не включенным в полином, говорит о том, что нужно знать только вероятности каждой переменной порядка k. Например, разложение первого порядка определяется вероятностями

где

Естественно поинтересоваться, насколько хорошо такое усеченное разложение аппроксимирует действительную вероятность . В общем, если мы аппроксимируем с помощью рядов, включающих подмножество полиномов Радемахера — Уолша,

то можно использовать отношения ортогональности, чтобы показать, что сумма квадратичной ошибки минимизируется выбором Таким образом, усеченное разложение является оптимальным в смысле среднеквадратичной ошибки. Кроме того, коль скоро в аппроксимацию входит постоянный полином можно легко показать, что что и требуется. Однако ничто не может предотвратить превращение в отрицательную величину для некоторого х. Действительно, если не входит в полином, то и по крайней мере одна из вероятностей должна быть отрицательной. Этого досадного результата можно избежать путем разложения а не хотя в этом случае мы уже не сможем больше быть уверены в том, что суммирование полученной аппрок симации для даст единицу.

4.9.2. РАЗЛОЖЕНИЕ БАХАДУРА — ЛАЗАРСФЕЛЬДА

Другое интересное разложение получают введением нормированных величин

считая, конечно, что не является ни нулем, ни единицей. Эти нормированные переменные имеют нулевое среднее и дисперсию, равную единице. Множество полиномов, похожих на полиномы Радемахера — Уолша, можно получить, систематически образуя различные произведения сомножителей в следующем порядке: ни одного сомножителя, один сомножитель, два и т. д. Так что имеем

Эти полиномы не ортогональны сами по себе, но они ортогональны, если ввести весовую функцию

т. е.

Это следует из того, что является распределением для случая с независимыми переменными и что в этом случае моменты являются или нулем, или единицей. Следовательно, любую функцию, определенную на единичном -кубе, можно разложить как

где

В частности, функцию можно представить в виде

где

Вспомнив, что есть произведение нормированных переменных видим, что это коэффициенты корреляции. Очевидно, что . Если определить

то можно представить соотношение (55) как

Оно известно как разложение Бахадура — Лазарсфельда . В нем содержится коэффициентов, d вероятностей первого порядка, коэффициентов корреляции второго порядка, коэффициентов корреляции третьего порядка и т. д. Естественный способ аппроксимировать — это игнорировать все корреляции свыше определенного порядка. Таким образом,

есть аппроксимация первого порядка

есть аппроксимация второго порядка и т. д. Если коэффициенты корреляции высокого порядка невелики и мы используем аппроксимацию то видим, что линейный относительно добавляет квадратичный член корреляции и т. д. Таким образом, логарифм разложения Бахадура — Лазарсфельда дает интересную последовательность аппроксимаций. Первая аппроксимация эквивалентна допущению независимости, и она линейна относительно х. Вторая отвечает корреляции второго порядка и квадратична относительно х. Каждая последующая аппроксимация отвечает корреляциям более высокого порядка, но, конечно, требует вычисления большего количества членов.

4.9.3. РАЗЛОЖЕНИЕ ЧОУ

Другой интересный класс аппроксимаций совместного распределения вероятностей основан на тождестве

Если переменные статистически независимы, оно сводится к произведению отдельных вероятностей . Предположим, что переменные не являются независимыми, но что зависит только от непосредственно предшествующей переменной . Тогда имеем марковскую цепь первого порядка и

Мы увидим, что каждый сомножитель можно определить с помощью двух коэффициентов; значит, можно определить с помощью коэффициентов, что будет менее сложно, чем если бы мы допустили все корреляций второго порядка. Аналогичные марковские аппроксимации более высокого порядка можно получить

Лучить, если допустить, что зависит только от k непосредственно предшествующих переменных.

Допущение, что заданная переменная зависит только от определенных предшествующих переменных, приемлемо, если мы имеем Дело с временным процессом; для более общих случаев это допущение выглядит довольно нелепо. Тем не менее есть основание полагать, что заданная переменная может в основном зависеть только от нескольких других переменных. Предположим, что мы можем занумеровать переменные так, что целиком зависит от некоторой предшествующей переменной

Например, допустим, что

Тогда из (59) следует, что можно записать как Вообще мы получаем разложение В виде произведения

Подставляя 0 или 1 вместо читатель может проверить, что

где

и

Полагая подставляя (62) в соотношение (61), беря логарифм и собирая члены, получаем разложение Чоу

Аналогичные результаты легко можно получить для зависимости более высокого порядка.

Следует сделать несколько замечаний относительно этих результатов. Во-первых, если переменные действительно независимы, мы замечаем, что и последние две суммы в разложении исчезают, оставляя уже знакомые разложения для случая с независимыми переменными. Когда зависимость имеется, мы получаем дополнительные линейные и квадратичные члены. Конечно, линейные члены можно объединить так, чтобы в разложении содержались константа, d линейных членов и квадратичных членов.

Сравнивая это разложение с разложением второго порядка Радемахера — Уолша или Бахадура — Лазерсфельда, для каждого из которых требуется квадратичных членов, видим, что преимущества данного разложения могут быть значительными. Конечно, эти преимущества можно реализовать только в том случае, если мы знаем дерево зависимости — функцию которая показывает ограниченную зависимость одной переменной от предыдущих переменных. Если дерево зависимости нельзя вывести из физической значимости переменных, то может возникнуть необходимость в вычислении всех коэффициентов корреляции просто для того, чтобы найти значимые. Однако следует заметить, что даже в этом случае может быть предпочтительнее использовать разложение так как получаемые при этом приближенные вероятности будут всегда неотрицательными и их сумма будет равна единице.

1
Оглавление
email@scask.ru