Главная > Прикладной регрессионный анализ, книга 1
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

2.14. НЕКОТОРЫЕ ЗАМЕЧАНИЯ ОТНОСИТЕЛЬНО ОШИБОК В ПРЕДИКТОРАХ (ОДНОВРЕМЕННО С ОШИБКАМИ В ОТКЛИКАХ)

Рассмотрим сначала обычную ситуацию, когда мы имеем отклик и один предиктор X, и при этом постулируется функция отклика в виде уравнения прямой. В таких случаях

предполагается, что отклик содержит ошибку, тогда как X нет. А что если переменная X также подвержена ошибке? Пусть истинное значение переменной истинная величина Тогда наблюдаемые значения выражаются соотношениями

где есть случайные ошибки, добавляемые к соответственно, а независима от и независима от Постулированная нами модель имеет вид

Как мы теперь должны поступить при оценивании такой модели? Подставляя выражения (2.14.1) и (2.14.2) в (2.14.3), получим

где

На этой стадии было бы соблазнительно использовать для оценивания уравнения (2.14.4) обычные приемы регрессионного анализа, приводящие к уравнениям (1.2.9) и (1.2.10). Однако здесь есть некоторый подвох. Он состоит в следующем. Если мы предположим, что

и независимы, и если мы введем обозначения

то, используя уравнения (1.2.9), (2.14.4) и (2.14.5), получим

где Таким образом, есть в общем случае смешенный оцениватель Фактор смещения , если т. е. если однако смещение отсутствует вообще при ста Последний вариант мы будем обсуждать более подробно ниже. Если то мы имеем

Тогда фактор смещения всегда меньше 1, за исключением того случая,

когда отсутствуют ошибки в переменных Тогда оценка будет несмещенной. Основная проблема заключается в том, что и X не являются обычно независимыми. Фактически

Непосредственная подгонка уравнения (2.14.4), однако, приемлема, если:

1. Величина мала по сравнению с что в свою очередь означает малость в уравнениях (2.14.6).

2. Переменные являются детерминированными (см.: Berkson (1950) в библиографии). В этом случае так что В результате фактор смещения в уравнении (2.14.6) равен 1, правая часть (2.14.8) обращается в 0.

3. Постулируемая модель есть а не (2.14.3).

Если ситуация не совпадает ни с одной из указанных выше, то надо применять альтернативный метод анализа. Один из приемов, предложенный Вальдом и усовершенствованный Бартлеттом (см. библиографию), состоит в следующем. Необходимо разделить исходные данные на три непересекающиеся группы одинакового объема (или почти одинакового объема, если не кратно таким образом, чтобы:

1) в первую группу попали данные с наименьшими значениями Обозначим точку где и — соответствующие средние величин входящих в эту треть;

2) во вторую группу попали данные с наибольшими значениями X, Обозначим по аналогии с предыдущим

3) в третью группу попали остальные данные. В дальнейшем анализе они не участвуют.

Теперь проведем линию через точки Это «наилучшая» линия. Она имеет тангенс угла наклона, равный Обоснование этой процедуры дано в работе Вальда (см. библиографию). Дополнительная литература, посвященная этой проблеме, также приведена в библиографии.

Выводы из этого параграфа

Если переменные X подвержены ошибкам, как и переменные то регрессионная задача заметно усложняется, даже когда модель однофакторная, как мы могли видеть из приведенного выше

материала. По этой причине всегда полезно по возможности так организовать эксперимент, чтобы отношение было малой величиной. Практически это означает, что разброс величин ?, мерой которого служит должен существенно превышать разброс ошибок, содержащихся, вероятно, в переменных То же самое верно и для других предикторов. После того как это обеспечено, ошибками в переменных X можно пренебречь и применять обычный метод наименьших квадратов. Если этого сделать нельзя, то при использовании обычного анализа могут возникнуть осложнения.

Дополнение

Для ознакомления с детальной трактовкой регрессионного анализа функциональных и структурных соотношений, включая рассмотрение идентифицируемости параметров при использовании принципа максимального правдоподобия в условиях нормального распределения ошибок, см. работу М. Кендалла и А. Стьюарта «Статистические выводы и связи» (М.: Наука, 1973, гл. 29). Экономические аспекты проблемы освещены, например, в монографии: Goldberger A. S. Econometric Theory.- New York: Wiley, 1964. Решение такого типа задач с помощью двухступенчатого метода наименьших квадратов рассмотрено в кн: Kmenta J an. Elements of Econometrics.- New York: MacMillan, 1971, p. 559-565. Некоторые журнальные публикации, относящиеся к данной проблеме, указаны в библиографии.

1
Оглавление
email@scask.ru