9.2.5. Неравные числа наблюдений для разных средних
В разд. 9.2.3 мы видели, что. суммы квадратов в таблице дисперсионного анализа в сумме дают
и соответствуют ортогональному разложению вектора
Кроме того, из (9.30) легко вытекает, что сумма квадратов, стоящая в числителе
-статистики для проверки гипотезы
по отношению к полной модели, совпадает с суммой квадратов, стоящей в числителе
-статистики для проверки гипотезы
при условии, что гипотеза
верна. Действительно, если мы используем для сумм квадратов, стоящих в числителях, выражение
разд. 3.9.1), то этот результат получается непосредственно: эти суммы квадратов равны
соответственно и обе равны
Предположим, однако, что над совокупностью
производится
наблюдений. Если здесь использовать ту же модель, что и для сбалансированного случая из разд. 9.2.1 (равные числа наблюдений), а именно модель
с идентифицирующими ограничениями
то мы уже не получим простого разложения, подобного (9.30). Различные суммы квадратов теперь не будут аддитивно входить в состав полной суммы квадратов, а сумма квадратов в числителе статистики для проверки гипотезы
будет зависеть от того, истинной или ложной мы можем считать гипотезу
Эта ситуация обычно описывается как "неортогональный" дисперсионный анализ, поскольку суммы квадратов происходят здесь не от ортогональных векторов, как в сбалансированном случае. К сожалению, в отношении метода анализа такой модели в литературе, кажется, имеется некоторая путаница (см. Francis (1973) и в особенности Nelder (1974)). Поэтому здесь, вероятно, следует дать небольшой комментарий.
Первый шаг состоит в проверке гипотезы
по отношению к полной модели. За деталями этой проверки мы отсылаем читателя к Scheffe (1959, разд. 4.4). Если гипотеза
принимается, то следующим шагом является проверка гипотез
и
в модели
соответствующей предположению об истинности гипотезы НАВ. Как уже отмечалось, при проверке гипотезы
по отношению к модели (9.35) сумма квадратов в числителе соответствующей статистики отличается от суммы квадратов, используемой при проверке гипотезы
по отношению к полной модели, ввиду потери свойства ортогональности. В противоположность мнению Scheffe (1959, с. 172—176) последняя процедура здесь вряд ли уместна. Если взаимодействия
отличны от нуля, то гипотеза
(для всех
не эквивалентна первоначально имевшейся в виду (ср. с разд. 9.2.1) гипотезе
(для всех
). Если же какие-то из индивидуальных эффектов
не равны нулю, то проверка равенства нулю средних эффектов фактора А не имеет особого смысла.
Ввиду того что разложение (9.30) более не выполняется, суммы квадратов, используемые в статистиках критериев, становится уже не так просто вычислять. Однако здесь можно частично использовать метод разд. 11.5.4. При применении этого алгоритма можно использовать и другие идентифицирующие ограничения. Так, в частном случае, когда
(для всех
можно получить простое ортогональное разложение, подобное (9.30), если выбрать в качестве идентифицирующих ограничений соотношения