11.3.7. СМЕШАННЫЕ МОДЕЛИ
Определенный интерес представляют модели, у которых линейный предиктор содержит как количественные, так и качественные переменные. Множество таких моделей включает модели, возникающие в ковариационном анализе, а также модели для проверки однородности линий регрессии, оцененных для нескольких групп.
Если X представляет собой модель, порожденную количественным вектором х, и А — модель, порожденная индикаторными векторами фактора А, то
и
Это два основных члена (термина) для описания смешанных моделей. В эквивалентных координатных обозначениях линейный предиктор для уровня фактора А может быть записан как если если
Ковариационный анализ может быть просто объяснен в этих обозначениях с помощью примера. Обратимся снова к рандомизированному блочному эксперименту для проверки влияния удобрений, Т, на урожайность пшеницы [см. раздел 11.3.5]. По существу, проверка гипотезы об отсутствии различий между обработками (дозами удобрений) сводится к подгонке моделей (В — блоки) и и
Рис. 11.3.2. Пояснение к ковариационному анализу: две обработки на шести единицах
последующему сравнению величины сокращения девиации с табулированными значениями значимостей (хотя имеется некоторое осложнение, связанное с оценкой параметра масштаба Предположим теперь, что, кроме урожайности, у, наблюдалось и число всходов, х, на 24 делянках. Так как рост числа всходов должен, вообще говоря, вести к некоторому повышению урожайности, эта переменная могла бы оказать определенное влияние на выводы из эксперимента, в особенности если число всходов коррелировало с дозой удобрения. Тогда сравнение В с будет смещенным. Главная цель ковариационного анализа состоит в учете этого смещения (даже если число всходов и не коррелировано с уровнями удобрения, ковариационный анализ позволяет построить более мощный тест, поскольку дает более эффективную оценку для
Идея ковариационного анализа состоит в уточнении предиктора с использованием разности и в сравнении оценок Когда значение неизвестно, это сравнение эквивалентно сравнению оценок для
Несколько идеализированный рис. 11.3.2 иллюстрирует мотивацию для применения моделей ковариационного анализа. В ситуациях, изображенных на рис. а) и б), вывод относительно значимости эффекта обработки будет различным в зависимости от того, учитывалось ли число всходов. Сравнение оценок модели В и указывает на значимость Т для а) и незначимость Т для б). В то же время сравнение оценок приводит к противоположному
заключению. Только в ситуации, изображенной на рис. в), где распределение х одинаково для обеих обработок, указанные сравнения приводят к заключению о значимости эффекта обработки.
Аналогично проверка однородности линий регрессии, или, более общее, линейных предикторов, так же просто описывается с помощью введенных обозначений. В ранее рассмотренном примере о смертности мышей в зависимости от дозы препарата применялась биномиально-логистическая модель. Распределение было Предположим теперь, что группы однополы. Тогда возможно, что препарат на самцов и самок действует по-разному, т. е. нужно проверить, необходимо ли использовать для самок, а для самцов. Если — фактор пола, то это сводится к сравнению моделей
Сравнение девиаций для и дает нам тест для проверки параллельности линий регрессии. Если они параллельны, то далее проверяется равенство свободных членов. Если они совпадают, то эти прямые идентичны.