ДИСПЕРСИОННЫЙ АНАЛИЗ
— один из основных методов математической статистики, применяемый для анализа результатов наблюдений, зависящих от различных одновременно действующих факторов, выбора наиболее важных факторов, оценки их влияния и т. п. Д. а. развивался гл. обр. в связи с приложениями в сельскохозяйственной статистике. В настоящее время Д. а. применяется при анализе самых разнообразных экспериментов. Одним из первых вопросов, рассматриваемых Д. а., есть вопрос о том, является ли совокупность наблюдений эксперимента набором наблюдений одной нормально распределенной случайной величины или смесью наблюдений нормально распределенных случайных величин, различающихся только сред, значениями. Типичным примером применения Д. а. являются сельскохозяйственные эксперименты по сравнению действия различных удобрений, способов обработки почвы, сортов семян на урожайность культур.
Простейшую из задач Д. а. можно описать следующим образом. Предположим, что полученные в эксперименте наблюдения разбиты на
групп, причем
группа содержит
величин, предположительно нормальных, со
значением
и дисперсией
постоянной для всех групп. Требуется проверить гипотезу (см. Статистическая проверка гипотез) о том, что все значения
равны друг другу, или оценить изменчивость средних
. Пусть
величина в
группе,
арифметическое наблюдений
группы, а
ср. арифмет. всех наблюдений. Равенство
представляет полную сумму квадратов отклонений наблюдений от общего среднего
в виде суммы двух частей, из которых первая дает сумму квадратов отклонений каждого наблюдения от соответствующего группового сред, значения («сумма квадратов внутри групп»), а вторая — сумму квадратов отклонений групповых сред, значений от общего сред, значения («сумма квадратов между группами»). Величины
и
связаны с оценкой дисперсии внутри групп и оценкой дисперсии между группами и обладают следующими свойствами. Если случайные величины
независимы и имеют нормальное распределение с общей дисперсией
то величины
независимы. При предположении, что
для всех
, величины
имеют распределение
с
степенями
свободы соответственно. Если величина
, немного отличается от величины
то нет оснований считать сред. значения в группах различными. Однако, если
значительно превосходит
возникает подозрение, что
значения групп различны. Более обоснованные выводы получают следующим образом. Отношение
дисперсионным отношением и имеет распределение (распределение F), определяемое числами гиге. Вместо дисперсионного отношения часто используется величина z, определяемая равенством
Распределение величины z также известно; имеются таблицы распределений величин
и z. Для проверки гипотезы о том, что
одинаковы при всех i, пользуются «критерием г». «Критерий z» состоит в том, что предположение о равенстве средних отвергается при уровне значимости 8, если для полученного в эксперименте значения z выполняется неравенство
где
определяется так, что вероятность
. Если сред, значения
не равны друг другу, то величина
является несмещенной оценкой (см. Статистические оценки) для значения
которое можно рассматривать как меру изменчивости неизвестных сред, значений
Величина
имеет распределение Стьюдента с
степенями свободы. Интервал
является доверительным интервалом для разности между неизвестными сред.
. Соответствующим доверительному уровню
, число
взято так, что
Рассмотренный метод Д. а. наз. также однофакторным анализом или классификацией по одному признаку. Метод Д. а. может быть обобщен на случай, когда наблюдения являются независимыми
-мерными случайными векторами или когда наблюдаемые случайные величины разбиваются на группы более сложным образом, напр., по нескольким признакам (многофакторный анализ) и т. п.
Важный класс задач Д. а. связан с анализом моделей со случайными факторами. В простейшем случае рассматривается схема, в которой наблюдения имеют структуру
где величины
независимы в совокупности и имеют нулевые математические ожидания, причем
одинаково распределены с дисперсией
одинаково распределены с дисперсией а Наблюдения
относящиеся к
группе, зависимы; эта зависимость характеризуется коэфф. внутригрупповой корреляции
величин и
В предположении, что
— нормальные случайные величины, построены доверительные интервалы для
, доверительные интервалы и оценки для и
критерии для проверки гипотезы о том, что
и т. п.
Лит.; Шеффе Г. Дисперсионный анализ. Пер. с англ. М., 1963 [библиогр. с. 616—625].
А. Я. Дороговцев.