Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
2.4. Перебор и недобор факторов в регрессииКак правило, исследователю неизвестна истинная модель регрессии, т. е. неизвестно, какие факторы входят в регрессию. Поэтому ошибка перебора факторов или их недобора является весьма вероятной. Исследуем, к чему приводят эти ошибки спецификации, а также выясним, какие из них ведут к более серьезным последствиям. Перебор. Истинная модель есть
или
относительно которой выполнены все предположения
или
где
Докажем, что
что доказывает несмещенность (2.34). Математическое ожидание оценок «лишних» параметров Можно доказать, что оценка Докажем, что оценка МНК в случае перебора является также состоятельной. Для этого предположим, что матрица
при
Корректность этого выражения следует из того, что Теперь распишем ковариационную матрицу для параметров
это также невырожденная матрица, т. е. Итак, вектор Оценка, получаемая в регрессиях с «лишними» независимыми переменными, как было показано, обладает по-прежнему рядом оптимальных свойств. Однако точность при переборе теряется. Покажем, почему это происходит. Матрица ковариаций оценки МНК для истинной модели равна
Матрица Нетрудно заметить, что если «лишнее» множество независимых переменных ортогонально истинному набору переменных, т. е. при переборе будут незначительны. Наоборот, если лишние переменные сильно сопряжены с исходным множеством переменных Недобор. В этом случае истинным уравнением является (2.32), а мы оцениваем регрессию
или
другими словами,
в общем случае является смещенной. Действительно,
где
Поскольку второе слагаемое в уравнении (2.39) отлично от нуля, делаем вывод, что оценка (2.38), т. е. оценка МНК для регрессии с недобором (2.37), является смещенной оценкой подвектора Случай ортогональности является идеальным для двух рассмотренных возможностей: перебора и недобора. Однако на практике независимые переменные сильно сопряжены. Если же в планируемом эксперименте мы полностью контролируем значения независимых переменных, то их желательно брать близко к ортогональным. Объясним суть смещения (2.39). Прежде всего заметим, что Теперь сравним, какая из оценок —
Но
поэтому
Окончательно
Сравнивая эту матрицу с матрицей (2.36), делаем вывод: в общем случае нельзя утверждать, что (2.36) меньше или больше (2.40). Например, если определена. Значит, если Докажем, что оценка МНК в случае недобора является несостоятельной. Доказательство для простоты будем проводить в условиях сильной регулярности матрицы
Тогда
Таким образом,
при Подведем итоги: в случае перебора оценка МНК теряет в эффективности, зато остается несмещенной и состоятельной; в случае же недобора оценка МНК является смещенной и несостоятельной. По изложенным выше причинам недобор считаем более существенной ошибкой спецификации, чем перебор, так как он ведет к более тяжелым последствиям. Проблема оптимального выбора множества независимых из данного набора переменных исследуется в [114, 93, 157, 182, 28,]. В качестве показателя правильности выбора множества переменных в [61] предлагается брать статистику
Строим оценки
|
1 |
Оглавление
|