13.3. Полный двухфакторный дисперсионный анализ
13.3.1. Взаимодействия.
Рассмотрим полный двухфакторный эксперимент с факторами А и В, имеющими соответственно
градаций (уровней). Обозначим
- среднее значение результата эксперимента при сочетании i-гo уровня фактора А с
уровнем фактора В (среднее значение в
-ячейке прямоугольной таблицы, в которой строкам соответствуют градации фактора А, а столбцам — градации фактора В). Пусть
системы
весов, выбранные в соответствии с градациями факторов А и В. Например, если фактор А — тип почвы, а В — сорт, результат эксперимента — урожай, то и может быть пропорционально площадям с
типом почвы,
— площадям, занятым
сортом. Средним значением
уровня (фактора) А называют
В рассмотренном выше примере
— ожидаемая средняя урожайность на
типе почвы при условии, что выбор сорта при посеве не зависит от типа почвы и пропорционален
Эти условия выполняются, в частности, когда либо тип почвы оказывает приблизительно одинаковое влияние на урожайность всех сортов, либо низка общая культура земледелия, и землепользователю просто неизвестны или он лишен возможности использовать оптимальные сочетания сорта и типа почвы. Аналогично определяется среднее
уровня (фактора)
. В примере
— это ожидаемая средняя урожайность
сорта при случайном распределении его по полям, пропорциональном
Генеральным средним называют
Главный эффект
уровня А определяется как
Очевидно,
удовлетворяют условию
(13.12)
Аналогично главный эффект
уровня В определяется как
удовлетворяют условию
(13.13)
Взаимодействием i-го уровня А с
уровнем В называют
Взаимодействия удовлетворяют условиям:
(13.14)
Итак, математическая модель для средних имеет вид
где
удовлетворяют уравнениям
Очень важным для практического использования ДА является следующее утверждение [148, § 4.1]:
Если при некоторой системе весов
все взаимодействия равны нулю, то они равны нулю при любой другой системе весов. В этом случае модель называют аддитивной. В аддитивной модели каждое сравнение средних
или
и главных эффектов
или
имеет значение, не зависящее от системы весов
Содержательная интерпретация результатов ДА проста и наглядна, когда мы решаем
основании статистических или других соображений), что взаимодействия отсутствуют. В этом случае заключением о главных эффектах можно завершить весь анализ. Однако если гипотеза об отсутствии взаимодействий была принята на основании только того, что она не была отвергнута некоторым
-критерием, то следует посмотреть мощность этого критерия и оценить, насколько статистически невыявленные взаимодействия могут повлиять на интерпретацию результатов.
Часто величины взаимодействий могут быть уменьшены с помощью подходящего преобразования наблюдаемых случайных величин [14, п. 10.3.4]. Пример использования преобразования с целью сделать модель аддитивной можно найти в [170].
Среди статистиков нет единого мнения о целесообразности изучения главных эффектов в условиях статистически значимых взаимодействий. Нам кажется, что этот вопрос носит, скорее, содержательный, чем формально-математический характер. Если введенные средние имеют смысл, то изучение их свойств целесообразно. Наконец, взаимодействия могут быть значимы статистически, но относительно малы по сравнению с главными эффектами.
Всюду в дальнейшем, если не оговорено противное, будет выбираться система весов:
Такие веса иногда называют равными.
13.3.2. Двухфакторный анализ с равным числом К наблюдений в ячейках (К > 1).
Обозначим
наблюдение в
-ячейке, тогда математическая модель имеет вид
(13.16)
где
независимы и имеют нормальное распределение со средним, равным нулю, и дисперсией
а константы
удовлетворяют соотношениям (13.12)-(13.14) с равными весами. Обычно проверяются следующие гипотезы:
Оценки для параметров строятся аналогично тому, как это делается в § 13.2.1:
Возьмем тождество
возведем в квадрат его правую и левую части и просуммируем по всем значениям индексов
. Так как все смешанные произведения при суммировании равны нулю, получаем
Поскольку сумма рангов слагаемых правой части (13.17) совпадает с рангом квадратичной формы левой части, согласно теореме Кохрана получаем, что суммы квадратов правой части независимы и соответственно распределены как
с числом степеней свободы, совпадающим с рангом соответствующей формы. Таким образом, критерии для проверки гипотез
могут быть построены как соответствующие
-отношения
определены в таблице ДА для двухфакторного анализа с
наблюдениями в ячейке (табл. 13.2).
Доверительные интервалы для сравнений
могут быть построены с помощью
-метода аналогично тому, как это сделано в случае однофакторного анализа. Г-метод может быть также применен к разностям главных эффектов. Однако к взаимодействиям он уже не применим.
13.3.3. Случай неравных.
В общем случае не существует простого разложения, подобного (13.17). Поэтому остаются две возможности: либо воспользоваться точным, но громоздким методом анализа, изложенным, например, в монографии [148], либо применить приближенный метод. Последний заключается в следующем. Приближенно считают, что
где
независимы и нормально распределены с нулевым средним и дисперсией
удовлетворяют соотношениям
Оценка
в этом случае строится с помощью
Далее анализ проводится так же, как в п. 13.3.2 с
.
В частном случае, когда для всех
где
при выборе
разложение типа (13.17) имеет место, и ДА проводится с очевидными изменениями в табл. 13.2.
13.3.4. Случай.
Как правило, подобные данные возникают при использовании планов с рандомизированными блоками, когда можно априори ожидать, что или взаимодействие между изучаемым фактором А (способом обработки) и фактором В (блоком) мало в среднем, или что существует малопараметрическая параметризация взаимодействий. Ниже указываются основные модели.
Аддитивная модель без взаимодействий
(13.18)
где
а независимы, нормально распределены
. При рандомизированных блоках
отражает суммарное влияние двух источников случайных отклонений: отклонения, связанного со случайностью расположения фактора А в блоке, и отклонения, равного случайной погрешности воспроизведения эксперимента при заданном расположении А в блоке.
Поскольку в аддитивной модели предполагается, что взаимодействия отсутствуют, проверка гипотез
проводится так же, как в п. 13.3.2, только роль суммы квадратов ошибок играет сумма квадратов взаимодействий. Табл. 13.3 — это таблица ДА для аддитивной модели двухфакторного анализа с одним наблюдением в ячейке.
Таблица 13.3
Модель с однопараметрическим описанием взаимодействий носит стандартный вид (13.16), только дополнительно предполагается, что
(13.19)
Гипотеза об отсутствии взаимодействий в этом случае эквивалентна гипотезе
. Для ее проверки можно использовать критерий
(13.20)
где
Критерий F в (13.20) при
имеет
-распределение с
степенями свободы. Гипотезы
проверяются так же, как в п. 13.3.2, только сумма квадратов ошибок определяется как
и имеет на одну степень свободы меньше, чем в табл. 13.3.
Более реалистической является модель с
параметрическим описанием взаимодействий [217]. Она похожа на предыдущую, только в ней предполагается, что взаимодействия пропорциональны произведению не главных факторов, а некоторых констант, оцениваемых по выборке,
Пусть
- матрица с
определенными, как в (13.21), тогда
и определяются, как выше, а
где
наибольшее собственное число матрицы
;
-нормализованный собственный вектор
, соответствующий собственному числу
аналогичный вектор
. Для проверки гипотезы
используется отношение типа (13.20) с естественной заменой
на
. Однако распределение отношения сложнее и не сводится к
-распределению.