7.3. ВЫБОР ПЕРВОГО ФАКТОРА ДЛЯ ВКЛЮЧЕНИЯ В РЕГРЕССИЮ
Хотя, как мы указали ранее, первый кандидат в наиболее важные факторы, исследуем тем не менее корреляционную матрицу. Поскольку эта матрица симметрична, приведена только ее правая верхняя часть (результаты округлены до третьего десятичного знака).
Наибольшая корреляция, равная 0,944, существует между Теперь мы можем построить модель
Опустим детали вычислений. Готовое уравнение имеет вид
ему соответствует следующая таблица дисперсионного анализа:
Вычисленное значение Это значит, что модель (по имеющимся данным) объясняет разброса относительно среднего. Однако значение -критерия для оценки степени неадекватности, равное 9,70, превосходит , т. е. модель должна считаться неадекватной. Чтобы разобраться в этом, мы можем исследовать остатки, вычерчивая, в частности, их графики в зависимости от «кандидатов» в новые факторы. Исходные наблюдения, предсказанные значения и остатки приведены в табл. 7.3. На рис. 7.1, 7.2 и 7.3 показаны графики остатков в зависимости от соответственно.
Рис. 7.1. График остатков в зависимости от
Рис. 7.2. График остатков в зависимости от
Таблица 7.3. Наблюдения, предсказанные значения и остатки
Из-за вертикального разброса нанесенных значений, указания на зависимость остатков от или неудивительны. (Заметим, однако, что факторы не согласуются с фактором уже введенным в регрессию. Это иногда вуалирует связь, которая может проявиться после такого согласования.) Вместо попыток использовать наши переменные мы обратим внимание на возможность добавления в модель переменных другого типа.
Рис. 7.3. График остатков в зависимости от