Главная > Многомерный дисперсионный анализ
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.2.4. СТАТИСТИКИ ДЛЯ ПРОВЕРКИ МНОГОМЕРНОЙ ГИПОТЕЗЫ

Из литературы о многомерном дисперсионном анализе мы знаем различные способы вывода статистических критериев для проверки многомерных гипотез. Предлагаемый здесь подход аналогичен методу С. Н. Роя [74] и имеет то преимущество, что позволяет проследить аналогии между одномерным и многомерным дисперсионным анализами.

Если исходить из наблюдений у у над признаками индивидов, то линейная комбинация

даст значение нового признака этого индивида. Введя для всех векторов наблюдений один и тот же весовой (отличный от нуля) вектор и, можно перейти от многомерной постановки задачи к аналогичной одномерной.

Вместо матрицы наблюдений появляется вектор в качестве нового вектора параметров вводится и в качестве вектора случайной ошибки Из соотношения (4.27) следует:

Ковариационная матрица вектора приобретает вид основная гипотеза относительного нового вектора параметров выражается таким образом:

Для проверки этой одномерной гипотезы, полученной искусственным путем, можно применить критерий из раздела 4.1:

определяются по формулам и (4.11).

Из уравнения (4.36) следует, что если справедлива многомерная гипотеза (4.28), то при любом векторе и верна соответствующая одномерная гипотеза Обратно: если гипотезы справедливы для всех возможных то верна и многомерная гипотеза. Итак, существует тесная связь между гипотезой и совокупностью всех одномерных гипотез Эта связь — эвристическая основа нашего вывода статистических критериев, используемых для проверки гипотезы в многомерном анализе. При этом мы будем руководствоваться следующими постулатами.

Постулат Значения статистики, используемой в многомерном дисперсионном анализе, должны однозначно определяться матрицей плана X, матрицей гипотезы К, а также критериальной функцией определенной для всех и уравнением (4.37).

Согласно этому постулату значения критериальной статистики (статистики критерия) при данном плане эксперимента и выдвинутой гипотезе однозначно определяются двумя матрицами:

и

Матрицы не испытывают какого-либо стохастического влияния, это заданные постоянные матрицы. Случайная составляющая критериальной статистики заключается в Поэтому при исследовании стохастических свойств ее представляют в виде функции

Матрицы симметричные и согласно (2.75) и (2.74) — идемпотентные. Матрица имеет ранг ранг Матрицу наблюдений можно рассматривать как реализацию -мерной нормально распределенной случайной величины с невырожденной ковариационной матрицей. Кроме того, в силу Вследствие этого, по теореме (3.29) с вероятностью 1 получаем, что

Из следует

и

Поэтому

При справедливости гипотезы

Отсюда следует, что

и соответственно

Используя (3.21), делаем вывод, что при справедливости гипотезы матрица имеет распределение Уишарта распределение Уишарта Так как то из (3.22) следует, что взаимно стохастически независимы. Матрица

по (3.20) — несмещенная оценка неизвестной ковариационной матрицы 2.

Для матриц можно вывести соотношения, аналогичные (4.18) и (4.21) для одномерного случая. Вот они:

где

— оценка матрицы средних значений

где

— оценка матрицы

С помощью второго постулата мы еще больше сузим множество допустимых критериальных статистик.

Постулат 2. Статистика должна оставаться неизменной при любом невырожденном преобразовании наблюдаемых признаков.

При применении преобразования вместо матрицы наблюдений появляется новая матрица матрица В неизвестных параметров преобразуется в а случайные ошибки — в После преобразования уравнение модели принимает вид

а основная гипотеза —

Несмотря на преобразования, статистика критерия должна принимать те же самые значения, т. е. должно выполняться условие

Смысл постулата сводится к тому, что многомерный критерий основан не столько на использованных признаках, сколько на всем -мерном пространстве их линейных комбинаций.

В этом свойстве инвариантности заключены преимущества многомерного дисперсионного анализа по сравнению с некоторыми другими многомерными модами, например факторным анализом.

Выведем некоторые следствия из второго постулата.

Совокупность невырожденных преобразований образует группу. Она определяет отношение эквивалентности на множестве всех пар матриц размерности которое мы получаем из соотношений (4.38), (4.39), изменяя

Две пары матриц эквивалентны, т. е.

если существует невырожденная -матрица такая, что

По условию (4.49) эквивалентные пары матриц дают одинаковые значения статистики критерия, так что можно считать функцией, заданной на классах эквивалентности матричных пар

Можно показать, что две пары матриц эквивалентны тогда и только тогда, когда характеристические уравнения

и

имеют совпадающие корни Отсюда следует, что статистику критерия можно представить в виде функции соответствующих характеристических корней, которые будут так называемыми максимальными инвариантамиотносительно группы всех невырожденных преобразований (Леман [46]).

Доказательство этого утверждения непосредственно использует то, что если две пары матриц эквивалентны, т. е. имеет место (4.50), то справедливы соотношения (4.51) и потому характеристические уравнения совпадают с точностью до постоянного коэффициента:

Обратно, если характеристическое уравнения имеют одинаковые характеристические корни, то в соответствии с (2,58)

где невырожденные матрицы, диагональная матрица, причем ее элементами будут характеристические корни Если положить

получим, что

т. е. соотношения эквивалентности пар, что и требовалось доказать.

В силу приведенных выше рассуждений любая функция где характеристические корни уравнения

может быть использована в качестве статистики критерия. Введением третьего постулата мы еще более ограничим множество допустимых критериальных статистик.

Разумно потребовать, чтобы статистика критерия принимала тем большие значения (или тем меньшие), чем сильнее наблюдения у подвергающиеся обработке, противоречат гипотезе Из (4.45)

Отсюда следует, что элементы становятся тем больше, чем они больше А отличаются от нулевой матрицы, которой при справедливости гипотезы равно математическое ожидание матрицы А.

Для достижения упомянутой монотонности мы потребуем, чтобы критериальная статистика монотонно зависела от матрицы (при фиксированной матрице или, выражаясь более обще, от совокупности собственных значений

Постулат 3. Тестовая статистика многомерного дисперсионного анализа должна монотонно возрастать или монотонно убывать по всем аргументам, т. е. при

должны выполняться неравенства

или

В постулатах 1—3 даны основные требования, предъявляемые к статистикам критериев многомерного дисперсионного анализа. Легко убедиться, что сформулированным требованиям удовлетворяет большое число существенно различных статистик.

Нельзя отдать предпочтение какой-либо определенной статистике, так как ни одна из них не превосходит равномерно другие, если речь идет о всех возможных альтернативах, за исключением случая, когда

При лишь один из характеристических корней отличен от нуля, а потому любая допустимая статистика является монотонной функцией от значит, все эти критерии эквивалентны один другому. Таким образом, при фактически имеется только один критерий, и вопрос о выборе равномерно наиболее мощного не возникает.

Из характеристических корней в силу (4.40) лишь больше нуля, остальные обращаются в нуль. Положим Так как не существует равномерно наилучшего критерия, пользуются многими критериями. Наиболее употребительны три из них. В одномерном случае они, разумеется, эквивалентны обычному -критерию. При предложенные критерии существенно различаются.

1. -критерий Уилкса (критерий отношения правдоподобия) [87], [27]

Этот критерий получают с помощью отношения правдоподобия (см. [4]).

2. Критерий следа (Лоули и Хотеллинга [45], [25])

3. Критерий наибольшего характеристического корня (см. [74])

Последний критерий был предложен Роем на основе эвристического метода [73].

Две первые статистики не только монотонно, но строго монотонно возрастают и убывают. Статистику критерия называют строго монотонно возрастающей или строго монотонно убывающей, если из (4.53) и хотя бы для одного следует, что в (4.54) или (4.55) имеет место знак строгого неравенства. К этому свойству мы возвратимся в разделе 5.2.

1
Оглавление
email@scask.ru