2.8. ВЫЧИСЛЕНИЕ СУММЫ КВАДРАТОВ МЕТОДОМ НАИМЕНЬШИХ КВАДРАТОВ ПРИ НЕСКОЛЬКИХ СТЕПЕНЯХ СВОБОДЫ
Обобщая метод из раздела 2.7, мы получаем возможность вычислять верные суммы квадратов с несколькими степенями свободы. Методы, изложенные здесь, рассмотрены в [Rubin (1976в)]; более ранние работы, посвященные этим проблемам, — [Tocher (1952); Wilkinson (1968)], более поздняя — [Jarrett (1978)].
Пусть где С — матрица констант, определяющих линейных комбинаций для которых нужны суммы квадратов, и пусть оценка наименьших квадратов Если вместо пропущенных значений были подставлены их оценки наименьших квадратов, то поэтому Для простоты допустим, что были выбраны ортонормальных при полных данных линейных комбинаций, т. е. что
Таким образом, ковариационная матрица X при полных данных равна Значит, сумма квадратов, относящаяся к X при полных данных, равна:
Сумма квадратов, которую нам следует отнести к X, равна:
Пусть матрица оценок X, полученных с помощью дисперсионного анализа для полных данных по сопеременным пропусков. Из теории ковариационного анализа или матричной алгебры вместе с результатами раздела 2.5.4 следует, что (2.22) выполняется и в общем случае, поэтому вследствие ортонормальности компонент X и равенства при оценивании пропущенных значений методом наименьших квадратов
или, в силу тождества Вудбери [Rao (1965), с. 29] и (2.26),
Для уравнения (2.28) требуется обращение симметричной матрицы а для (2.29) — матрицы Следовательно, (2.28) предпочтительнее (2.29) при
Пример 2.3. Уточнение сумм квадратов при заполнении пропусков (продолжение примера 2.2). Сумма квадратов для обработок имеет 4 степени свободы, которые мы разложим по следующим ортонормальным контрастам средних пяти обработок:
Заметим, что при полных данных линейные комбинации имеют ковариационную матрицу
Значения четырех контрастов, полученных в результате дисперсионного анализа для сопеременной первого пропуска, дают первую строку а в результате анализа для второй сопеременной — вторую строку:
Таким образом, вычислена одновременно с В.
Наконец, проводя дисперсионный анализ по данным, в которых пропуски заполнены оценками наименьших квадратов, мы получим . Из (2.29) .
Результаты дисперсионного анализа приведены в табл. 2.2, где сумма квадратов по блокам (без коррекции на обработки) была получена вычитанием сумм квадратов остатков для обработок и ошибок (0,7755 и 0,2947) из полной суммы квадратов (отклонений от среднего), 1,1679, найденной в примере 2.1.
Таблица 2.2. (см. скан) Дисперсионный анализ по заполненным данным
ЛИТЕРАТУРА
(см. скан)