7.5. Оценивание параметров при наличии погрешностей в предикторных переменных (конфлюэнтный анализ)
7.5.1. Основные типы задач конфлюэнтного анализа.
При анализе функциональных связей между переменными (см. § В.5, зависимости по схеме D) можно выделить следующие два случая.
1. Имеются две группы переменных . Переменные из первой группы известны экспериментатору со значительно большей ошибкой, чем из второй. В этом случае целесообразно работать с зависимостями вида
Функция предполагается заданной, и отыскание истинной зависимости заключается в оценивании параметров
Переменные X могут трактоваться как предикторы (предсказатели): задаваясь каким-либо их конкретным значением, можно предсказать значения переменных . Если переменные X в процессе эксперимента могут изменяться по усмотрению экспериментатора, то говорят о контролируемых переменных. Переменные часто называют откликами.
2. Если все переменные, с которыми имеет дело экспериментатор, известны примерно с одинаковой точностью, то имеет смысл использовать зависимости, представленные в виде
(7.81)
При этом по-прежнему иногда удобно разделять переменные на результирующие и объясняющие (контролируемые - X:
(7.81)
Ниже основное внимание уделяется регрессионным моделям, связанным с представлением (7.80), и лишь в заключительной части рассмотрены модели, порождаемые (7.81').
Регрессионные модели, связанные с (7.80). Возможно несколько постановок регрессионных задач, в основе которых лежит зависимость (7.80). Перечислим наиболее характерные из них. Читатель без особого труда сможет построить и некоторые промежуточные или смешанные конструкции.
Классическая регрессия (см. § 5.1.). В результате эксперимента (наблюдения) оказываются доступными величины , где — случайные величины (погрешности наблюдения). Иными словами,
Подчеркнем, что значения предикторных переменных (условий наблюдения) известны точно. Нижний индекс 0 здесь и далее в этом параграфе обозначает истинное значение помеченной им величины.
Погрешности при фиксации условий наблюдения (активные эксперименты). Во многих экспериментах наблюдение проводится при условиях несколько отличных от желаемых , где — случайные величины (погрешности фиксации). Таким образом, экспериментатору доступны величины и связанные между собой соотношением
Пассивные наблюдения. Нередко (например, в эконометрических, социологических исследованиях) возможно лишь наблюдение за одновременным изменением переменных и X.
Если эти наблюдения проводятся с некоторыми случайными погрешностями, то для анализа становятся доступными величины или, в несколько более подробной записи,
По-видимому, впервые достаточно четкое разделение моделей (7.83) и (7.84) было осуществлено в [167], см. также [65, гл. 29].
Регрессионные задачи (7.82)-(7.84) содержат много общего как в постановке, так и в методах анализа. Более того, мы сознательно ограничимся рассмотрением именно тех методов, которые базируются на методе наименьших квадратов, широка используемом для классических регрессионных задач. В то же время внимание читателя будет обращено и на некоторые принципиальные различия в методах анализа соответствующих регрессионных задач.