Главная > Прикладная статистика: Классификации и снижение размерности
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

13.2. Определение, вычисление и основные числовые характеристики главных компонент

Во многих задачах обработки многомерных наблюдений и, в частности, в задачах классификации исследователя интересуют в первую очередь лишь те признаки, которые обнаруживают наибольшую изменчивость (наибольший разброс) при переходе от одного объекта к другому.

С другой стороны, не обязательно для описания состояния объекта использовать какие-то из исходных, непосредственно замеренных на нем признаков. Так, например, для определения специфики фигуры человека при покупке одежды достаточно назвать значения двух признаков (размер — рост), являющихся производными от измерений ряда параметров фигуры. При этом, конечно, теряется какая-то доля информации (портной измеряет до одиннадцати параметров на клиенте), как бы огрубляются (при агрегировании) получающиеся при этом классы.

Однако, как показали исследования, к вполне удовлетворительной классификации людей с точки зрения специфики их фигуры приводит система, использующая три признака, каждый из которых является некоторой комбинацией от большого числа непосредственно замеряемых на объекте параметров.

Именно эти принципиальные установки заложены в сущность того линейного преобразования исходной системы признаков, которое приводит к главным компонентам. Формализуются же эти установки следующим образом.

Следуя общей оптимизационной постановке задачи снижения размерности (13.2) и полагая анализируемый признак X -мерной случайной величиной с вектором средних значений и ковариационной матрицей , вообще говоря, неизвестными, определим меру (критерий) информативности вспомогательной -мерной системы показателей с помощью (13.4), а класс допустимых преобразований — в виде (13.3). Тогда при любом фиксированном вектор искомых вспомогательных переменных определяется как такая линейная комбинация

(где матрица

а ее строки удовлетворяют условию ортогональности), что

Полученные таким образом переменные и называют главными компонентами вектора X. Поэтому можно дать следующее определение главных компонент.

Первой главной компонентой исследуемой системы показателей называется такая нормированно-центрированная линейная комбинация этих показателей, которая среди всех прочих нормированно-центрированных линейных комбинаций переменных обладает наибольшей дисперсией.

k-й главной компонентой исследуемой системы показателей называется такая нормированно-центрированная линейная комбинация этих показателей, которая не коррелирована с предыдущими главными компонентами и среди всех прочих нормированно-центрированных и не коррелированных с предыдущими главными компонентами линейных комбинаций переменных обладает наибольшей дисперсией.

Замечание 1 (переход к центрированным переменным). Поскольку, как увидим ниже, решение задачи (а именно вид матрицы линейного преобразования L) зависит только от элементов ковариационной матрицы 2, которые в свою очередь не изменяются при замене исходных переменных хпеременными — произвольные постоянные числа), то в дальнейшем будем считать, что исходная система показателей уже центрирована, т. е. что . В статистической практике этого добиваются, переходя к наблюдениям , где (для упрощения обозначений волнистую черту над центрированной переменной и над главной компонентой в дальнейшем ставить не будем).

Замечание 2 (переход к выборочному варианту). Поскольку в реальных статистических задачах располагаем лишь оценками соответственно вектора средних и ковариационной матрицы , то во всех дальнейших рассуждениях под понимается а под — выборочная коварнация

Вычисление главных компонент. Из определения главных компонент следует, что для вычисления первой главной компоненты необходимо решить оптимизационную задачу вида

где — первая строка матрицы L (см. (13.6)). Учитывая центрированность переменной X (т. е. ) и то, что имеем

Следовательно, задача (13.7) может быть записана

Вводя функцию Лагранжа и дифференцируя ее по компонентам вектор-столбца имеем

что дает систему уравнений для определения

(здесь ) — -мерный вектор-столбец из нулей).

Для того чтобы существовало ненулевое решение системы (13.8) (а оно должно быть ненулевым, так как матрица должна быть вырожденной, т. е.

Этого добиваются за счет подбора соответствующего значения Уравнение (13.9) (относительно ) называется характеристическим для матрицы . Известно, что при симметричности и неотрицательной определенности матрицы 2 (каковой она и является как всякая ковариационная матрица) это уравнение имеет вещественных неотрицательных корней называемых характера стическими (или собственными) значениями матрицы .

Учитывая, что (см. выше) и (последнее соотношение следует из (13.8) после его умножения слева на с учетом получаем

Поэтому для обеспечения максимальной величины дисперсии переменной нужно выбрать из собственных значений матрицы наибольшее, т. е.

Подставляем в систему уравнений (13.8) и, решая ее относительно определяем компоненты вектора Таким образом, первая главная компонента получается как линейная комбинация , где собственный вектор матрицы , соответствующий наибольшему собственному числу этой матрицы.

Далее аналогично можно показать, что , где — собственный вектор матрицы , соответствующий по величине собственному значению этой матрицы.

Таким образом соотношения для определения всех главных компонент вектора X могут быть представлены в виде

где а матрица L состоит из строк , являющихся собственными векторами матрицы , соответствующими собственным числам При этом сама матрица L по построению является ортогональной, т. е.

Основные числовые характеристики главных компонент.

Определим основные числовые характеристики (средние значения, дисперсии, ковариации) главных компонент в терминах основных числовых характеристик исходных переменных и собственных значений матрицы 2:

а)

б) ковариационная матрица вектора главных компонент:

Умножая слева соотношения

на ), получаем, что

и, следовательно:

(13.10)

Из (13.10), в частности, следует подтверждение взаимной некоррелированности главных компонент, а также

в) сумма дисперсий исходных признаков равна сумме дисперсий всех главных компонент. Действительно, обобщенная дисперсия исходных признаков (X) равна обобщенной дисперсии главных компонент (Z). Действительно, обобщенная дисперсия вектора Z равна

Следствие. Из б) и в), в частности, следует, что критерий информативности метода главных компонент (13.9) может быть представлен в виде

где — собственные числа ковариационной матрицы 2 вектора X, расположенные в порядке убывания.

Кстати, представление в виде (13.9) дает исследователю некоторую основу, опорную точку зрения, при вынесении решения о том, сколько последних главных компонент можно без особого ущерба изъять из рассмотрения, сократив тем самым размерность исследуемого пространства.

Действительно, анализируя с помощью (13.9) изменение относительной доли дисперсии, вносимой первыми главными компонентами, в зависимости от числа этих компонент, можно разумно определить число компонент, которое целесообразно оставить в рассмотрении. Так, при изменении изображенном на рис. 13.1, очевидно, целесообразно было бы сократить размерность пространства с до так как добавление всех остальных семи главных компонент может повысить суммарную характеристику рассеяния не более чем на

Замечание 3. Использование главных компонент оказывается наиболее естественным и плодотворным в ситуациях, в которых все компоненты исследуемого вектора X имеют общую физическую природу и соответственно измерены в одних и тех же единицах.

К таким примерам можно отнести исследование структуры бюджета времени индивидуумов (все ) измеряются в единицах времени), исследование структуры потребления семей (все ) измеряются в денежных единицах), исследование общею развития и умственных способностей индивидуумов с помощью специальных тестов (все измеряются в баллах), разного рода антропологические исследования (все измеряются в единицах меры длины) и т.д.

Рис. 13.1. Изменение относительной доли суммарной дисперсии исследуемых признаков, обусловленной первыми главными компонентами, в зависимости от (случай )

Если же различные признаки измеряются в различных единицах, то результаты исследования с помощью главных компонент будут существенно зависеть от выбора масштаба и природы единиц измерения. Поэтому в подобных ситуациях исследователь предварительно переходит к вспомогательным безразмерным признакам например с помощью нормирующего преобразования

где соответствует ранее введенным обозначениям, а затем строит главные компоненты относительно этих вспомогательных признаков X и их ковариационной матрицы которая, как легко видеть, является одновременно выборочной корреляционной матрицей R исходных наблюдений

Замечание 4. В некоторых задачах оказывается полезным понятие так называемых обобщенных главных компонент, при определении которых оговаривают более общие (чем ограничения на коэффициенты , т. е. требуют, чтобы

где — некоторые дополнительно введенные веса. Очевидно, если при при то имеем обычное условие нормировки коэффициентов и обычные главные компоненты. Можно показать, что при такой модификации условий нормировки коэффициенты с помощью которых обобщенные главные компоненты выражаются через исходные признаки определяются как решения уравнений

где по величине корень уравнения а матрица — некоторая положительно определенная матрица весов. При этом, как и прежде, дисперсия обобщенной главной компоненты равна при взаимно коррелированы.

Заметим, кстати, что если в качестве матрицы весов выбрать матрицу

то, как легко показать, обобщенные компоненты (в метрике ), построенные по исходным признакам совпадут с обычными компонентами, построенными по вспомогательным безразмерным (нормированным) признакам

Проиллюстрируем определение главных компонент на численном примере, заимствованном из [279].

Пример 13.1. По данным измерений (в мм) длины ширины и высоты панциря 24 особей одного из видов черепах определена выборочная ковариационная матрица

Решая, в соответствии с (13.4), кубическое уравнение (относительно К) вида

находим

Подставляя последовательно численные значения в систему (13.3) и решая эти системы относительно неизвестных , получаем

В качестве главных компонент получаем

Здесь под подразумеваются отклонения размеров длины ширины высоты панциря от своих средних значений.

Вычисление относительной доли суммарной дисперсии, обусловленной одной, двумя и тремя главными компонентами, в соответствии с формулой (13.9) дает

Отсюда можно сделать вывод, что почти вся информация о специфике размеров панциря данного вида черепах содержится в одной лишь первой главной компоненте, которую и естественно использовать при соответствующей классификации исследуемых особей.

1
Оглавление
email@scask.ru