9.5. РЕГРЕССИОННАЯ ОБРАБОТКА ДАННЫХ В СЛУЧАЕ ОДНОСТОРОННЕЙ КЛАССИФИКАЦИИ: НЕЗАВИСИМЫЕ НОРМАЛЬНЫЕ УРАВНЕНИЯ
Допустим, что модель дисперсионного анализа имеет вид
Обозначим
Теперь, используя обозначения, принятые в регрессионном анализе, мы можем записать
где, если сравнивать с обозначениями §
есть тот же самый вектор; X — матрица, образуемая из прежней матрицы X путем вычеркивания из нее столбца
Пусть
тогда
Так как
— диагональная матрица с элементами
на главной диагонали и остальными нулями, обратная матрица от нее также диагональная с элементами
на главной диагонали. Отсюда легко видеть, что
Сумма квадратов, обусловленная вектором оценок
равна:
Остаточная сумма квадратов имеет вид
ей соответствует
степеней свободы.
Гипотеза
выражается в новых обозначениях так:
Если бы
была верна, то модель имела бы вид
или
где
есть вектор, составленный из единиц и имеющий ту же размерность, что и
Ей соответствует единственное нормальное уравнение
Таким образом, оценка параметра
была бы равна:
что приводит, как это можно показать, к остаточной сумме квадратов
с
степенями свободы.
Сумма квадратов, обусловленная гипотезой
есть разность между выражениями (9.5.10) и (9.5.6), а именно
степенями свободы. Статистика для проверки гипотезы
представляет собой, таким образом, величину
в точности совпадающую с выражением, которое мы получаем из дисперсионного анализа. Таким образом, если модель для односторонней классификации записана в виде
и проверяется гипотеза
то можно воспроизвести дисперсионный анализ с помощью регрессионного анализа при использовании стандартных программ. Оценки параметров
могут быть получены как разности