Пред.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Приложение II. ОБЗОР МЕТОДОВ ОЦЕНКИ РАЗМЕРНОСТИ НАБОРОВ СЛУЧАЙНЫХ ВЕЛИЧИНЮ. Н. Благовещрнский 1. Введение.В настоящей книге факторный анализ сравнивается в какой-то мере лишь с анализом главных компонент. Да и в этом случае авторы в основном отмечают преимущества факторного анализа перед компонентным, не останавливаясь на некоторых сильных сторонах последнего. В многомерной статистике кроме этих двух есть еще несколько подходов к общей для них проблеме статистической оценки размерности набора наблюдаемых исследователем переменных. Основной из них (кроме указанных) - это регрессионный анализ. В этом приложении на простых модельных примерах даются основные принципы соответствующих методов, их основные достоинства и недостатки. Объяснение проводится по возможности без использования серьезного математического аппарата и предназначено для неспециалистов по многомерной статистике. 2. Некоторые обозначения и определенияБудем все случайные величины обозначать буквами
где
и линейно независимы в противоположном случае. Число равное максимальному числу линейно независимых случайных величин среди Вообще удобно называть минимум величины
минимальной дисперсией, а максимум — максимальной дисперсией набора
и через
Если 3. Факторный, компонентный и регрессионный анализы. Общая схемаИтак, у нас имеется набор случайных величин нулю. Каковы же могут быть гипотезы о структуре набора А. Есть такие случайные величины
B. Есть такие независимые между собой случайные величины Причем в обеих гипотезах можно различить два случая:
Удобно привести следующую схему: (см. скан) 4. Факторный анализ и компонентный анализ. МоделиВ этой формулировке легко обнаружить, что компонентный анализ является частным случаем факторного анализа. Однако это не значит, что, выбирая факторную модель, мы в результате ее исследования получим модель компонентного анализа как частный случай. Это совсем не так. Например, если все имеют ненулевые дисперсии, то размерность Пусть
Поскольку множество
Тогда
Таким образом, можно на при вращении сохраняются длины — это
С другой стороны, нам известна (или приближенно известна) матрица С ковариаций
Рассмотрим еще один крайний случай: пусть матрица С диагональна. Тогда факторная модель вообще состоит только из
есть ковариационная матрица для Проводя компонентный анализ, придем к равенствам
Отсюда видим, что Для проведения факторного анализа выдвинем гипотезу, что
Равенства (3) и (4) очень похожи, но и 5. Факторный анализ и компонентный анализ. Основные проблемыОдной из фундаментальных задач является описание спроектировать Проиллюстрируем сказанное на примере предыдущего параграфа. Из (3) получим
Из равенств (4) найти
Таким образом мы получим
Уравнения (5) и (6) уже существенно больше сходятся, чем различные гипотезы, выдвигавшиеся первоначально. Таким образом, в данном примере метод главных компонент совсем не так уж плох. Укажем, наконец, на ряд серьезных недоделок в факторном анализе даже для случая нормально распределенных совокупностей. Прежде всего фактически нет оценок того, какую погрешность привносят математические ожидания, вычисляемые по выборке. Хотя легко дать тривиально усовершенствованный алгоритм получения «оценок» Во-вторых, все алгоритмы, кроме центроидного метода (а именно он-то и не обоснован доконца), используют то, что можно сознательно добавить известный «шум» в каждое Укажем еще на одну сторону проблемы. При идентификации разных наборов случайных величин проблему надо ставить шире. Во-первых, очень существен разный размер наборов, во-вторых, весьма стеснительным является фиксация нулевых параметров (смотри равенство 6. Факторный анализ и регрессионный анализПусть у нас имеется набор
Нужно найти
Подставляя в (7) равенства (8), можно выбрать Этот путь кажется очень заманчивым по нескольким причинам. Каковы самые тяжелые предположения при использовании регрессивного анализа? Прежде всего — это измерение без ошибок. Второе — это интерпретация результатов. Первое при этом подходе снимается автоматически, а для интерпретации факторы являются существенно более широким понятием, чем линейная комбинация В этом отношении некоторую пользу регрессионному анализу может принести и метод главных компонент — регрессия по ортогональным направлениям проще и экономнее, и, по-видимому, коэффициенты регрессии по значимым компонентам более устойчивы даже при значительном числе переменных. В заключение еще раз подчеркнем, что все эти подходы линейные и изучают наборы нормально распределенных случайных величин.
|
1 |
Оглавление
|