6.5. Модели со случайными регрессорами
В § 6.4 (формула (6.27)) мы использовали модель вида
и предполагали, что
не зависит от
В терминах математических ожиданий соотношение (6.36) можно представить в виде
Такая имеющая характер закона связь между математическими ожиданиями часто называется функциональной.
Иногда соответствующая связь определяется тем или иным физическим законом (преобразованным таким образом, чтобы достичь линейности связи), а случайный фактор связан с ошибками измерений значений
По этой причине указанную модель иногда называют "моделью с ошибками в переменных" или (в случае одномерной линейной регрессии) "моделью регрессии, в которой обе переменные подвержены ошибкам". Эту модель следует отличать от модели
в которой имеющая характер закона связь существует между самими случайными величинами
не между их математическими ожиданиями. Sprent (1969) и другие называют такую связь "структурной". На практике
наблюдаемые величины, но V не известно (например, из-за ошибок эксперимента), так что в действительности наблюдается значение
Таким образом, модель принимает, здесь вид
или
Если и величины
измерены с (несмещенной) ошибкой, так что вместо
наблюдается
то модель принимает вид
Эта модель аналогична (6.36), и поэтому ее можно исследовать тем же самым способом, т. е. обращаться с
так, как если бы эти величины были (условно) постоянными.
Заметим также, что (6.38) можно записать в виде
где
Это соотношение похоже на (6.36), но только в нем
уже зависит от
Методам анализа моделей (6.37), (6.38) и (6.39) посвящена обширная литература. Читатель может обратиться за ссылками, например, к работам Sprent (1969), Hodges, Moore (1972) и Narula (1974). Другие ссылки имеются в § 7.7, где детально разобран случай одномерной линейной регрессии. Однако все эти методы, как правило, более сложны, чем обычный метод наименьших квадратов, и большинство из них требует дополнительной информации либо в виде дополнительных данных (например, метод
"инструментальных переменных"), либо оценок дисперсий ошибок (или их отношений), как в случае оценивания
в § 6.4. По этим причинам указанным методам обычно предпочитают более популярную технику условной регрессии
при фиксированных значениях наблюдений, соответствующую истинному положению дел только в модели (6.38). Однако и в случае моделей (6.37) и (6.38) можно скорректировать смещение оценки наименьших квадратов, используя метод, описанный в разд. 6.4.1. Поэтому обычный метод наименьших квадратов можно, по-видимому, использовать во всех трех случаях, конечно, при условии проявления известной осторожности в выборе модели.
Имеются еще две модели, заслуживающие упоминания. Это так называемая модель "компонент дисперсии" и модель "контролируемых переменных" Берксона [Berkson, (1950)]. В первой модели (называемой еще моделью регрессии второго рода) вектор
рассматривается как случайная величина. (См. Sprent (1969, с. 54, 82). Ссылки на другие работы можно найти в Searle (1971), Федоров (1978, Кендалл, Стьюарт (1973. В модели Берксона регрессоры случайны, но средние значения этих регрессоров контролируются. Подобная ситуация является общей при исследовании имеющих характер закона связей в физических науках. Пусть, например, мы собираемся исследовать закон Ома
где
напряжение в вольтах, и — ток в амперах,
сопротивление в омах. Тогда при заданном сопротивлении естественная процедура проведения эксперимента состоит в следующем. Ток, протекающий в цепи, регулируется таким образом, чтобы амперметр показывал некоторое предписанное заранее
-значение
например 1 А, и при этом значении тока вольтметром измеряется соответствующее напряжение
Поскольку при измерении тока амперметром возникает та или иная случайная ошибка, то значение тока, действительно протекающего в цепи, является неизвестной случайной величиной
Подобным же образом и истинное напряжение представляет собой неизвестную случайную величину
так что модель эксперимента принимает вид
т. е. является частным случаем (6.38). В то же время указанная модель приводится к "стандартной" модели наименьших квадратов
где в качестве ошибки (флюктуационной составляющей) выступает уже
а не
Из приведенного рассмотрение вытекает, что если значения регрессоров контролируются, то модель можно исследовать таким же образом, как и в ситуации, когда регрессоры не случайны и не содержат ошибок.