11.2.9. Критерии однородности многомерных нормальных совокупностей.
В многомерном случае гипотеза однородности формулируется аналогично одномерному случаю (11.14):
(11,58)
только аргумент X есть уже
-мерная величина.
Выбор методов для проверки гипотезы (11.58) значительно более ограничен, чем в одномерном случае. По существу, имеются лишь параметрические критерии, которые основаны на предположении, что каждое из распределений
является многомерным нормальным распределением. Как и в одномерном случае, некоторые из этих критериев, например
устойчивы к отклонению распределений от нормального и, следовательно, могут применяться и к выборкам из негауссовских распределений.
Как известно (см. § 6.1), многомерное нормальное распределение полностью характеризуется вектором средних значений
и матрицей ковариаций
. Соответственно статистики критериев, рассматриваемых далее, являются функционалами от выборочных оценок этих параметров
В случае двух выборок
критической статистикой критерия для проверки гипотезы однородности является величина [12]
(11.59)
При этом априори предполагается, что выборки извлечены из совокупностей с одинаковой ковариационной матрицей, т. е.
и
(11.60)
В случае истинности нулевой гипотезы величина
подчинена
-распределению с
и
степенями свободы.
В случае нескольких выборок (т. е. при
) критерий их принадлежности к общей генеральной совокупности (в предположении равенства ковариационных матриц) основан на
-статистике Уилкса [71]:
где
— оценка матрицы ковариаций общей генеральной совокупности,
— матрица ковариаций, оцененная по выборке, полученной объединением всех k выборок, а М — вектор средних значений такой объединенной выборки.
В терминах дисперсионного анализа матрица S называется матрицей внутригруппового разброса, матрица
— матрицей межгруппового разброса, а матрица
— полной матрицей разброса. Можно показать, что когда
величина
равна:
т. е.
является монотонной функцией статистики
и, значит, в случае
использование обоих критериев
и
приведет к одинаковым результатам.
Значение
заключено в пределах 1, и если верна нулевая гипотеза, то значение
должно быть близким к 1. Существенно меньшее, чем 1, значение
указывает на неоднородность, т. е. нулевая гипотеза должна отвергаться. Однако точное распределение
очень сложно и на практике пользуются статистиками, которые являются некоторыми функциями от
.
Это, во-первых, статистика, предложенная Бартлеттом [71]:
(11.61)
Распределение
в случае нулевой гипотезы аппроксимируется
-распределением с
степенями свободы.
Другой статистикой, использование которой при малых объемах выборок предпочтительнее, будет статистика, предложенная
(11.62)
распределение которой в случае нулевой гипотезы аппроксимируется
-распределением с
степенями свободы. Величины
не обязательно целые и вычисляются по формулам
Для обеих статистик
критической является область больших значений. Как и в одномерном случае, «слишком большие» значения критериев (11.59), (11.61), (11.62) могут возникнуть из-за нарушения условия равенства ковариационных матриц, хотя при этом средние значения отличаются незначимо. Для проверки гипотезы
Используется статистика [12]
(11.63)
где
В случае справедливости она асимптотически имеет
-распределение с
степенями свободы. Методология применения критерия (11.63) такая же, как критерия равенства дисперсий (11.56) в одномерном случае. В одномерном случае статистика (11.63) совпадает со статистикой (11.56).