Главная > Справочник по прикладной статистике. Том 1
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

10.1.3. ПРОВЕРКА ГИПОТЕЗ

Пусть мы хотим проверить общую линейную гипотезу H, заданную в виде

где Н — известная матрица размера и ранга — данный -вектор. Когда проверяются такие гипотезы для вырожденной модели с учетом дополнительных условий, мы действуем как и раньше, с той лишь оговоркой, что если какое-либо из ограничений, налагаемых на Н уже включено в дополнительные условия то порядок уменьшается на число дублированных среди независимых условий. Если это число окажется равным то порядок будет равен Построим критерий отношения правдоподобия для обычным способом [см. раздел 5.5]:

1) Для полной модели

получить которое минимизирует значение

Истинна ли или ложна, распределено как где

2) Для модели, ограниченной условием , а именно

получить при гипотезе , что достигается при минимуме значения при условиях и Если гипотеза Н верна, то дополнительное уменьшение распределено независимо от как где — эффективный порядок матрицы Н (ранг — число ограничений, общих для Н и для дополнительных условий).

3) Вычислить При условии это наблюдение из -распределения [см. раздел 2.5.6].

И снова, если Н верна, то мы сравниваем две независимых оценки для

Пример 10.1.2. Анализ «внутри и между». Для иллюстрации воспользуемся односторонней классификацией и рассмотрим гипотезу, что все обработки дают один и тот же (неизвестный) эффект. В терминах параметров вырожденной модели это означает, что На первый взгляд эта гипотеза выглядит так, как будто она имеет порядок 7. На самом деле эта гипотеза относительно общего неизвестного эффекта уже проверялась раньше [см. пример 8.3.8] для модели полного ранга, где мы установили, что ее порядок был (7—1). В данном случае это можно увидеть непосредственно, поскольку дополнительное условие означает, что устанавливает только независимых ограничений. Точнее, если бы оказалось, что то из условия мы получили бы, что и [см. пример 8.3.3].

С помощью (10.1.8) получим: . Если гипотеза Н верна, то пропорционально случайной величине с распределением и числом степеней свободы, равным порядку матрицы Н, т. е. Следовательно, статистика, лежащая в основе критерия равна:

[см. пример 8.3.3].

В обычной табличной форме получаем:

(см. скан)

Те части этой таблицы, которые нужны для проверки гипотезы Н, можно быстро отыскать следующим образом. Рассмотрим тождество

Это выражает отклонение наблюдения от общего среднего выборки через сумму его отклонения от группового среднего (по той группе, к которой оно принадлежит) и отклонения самого группового среднего от общего среднего. Возводя обе части выражения (10.1.10) в квадрат и суммируя по и по получим

Член, содержащий произведение и представляющий собой

обращается в нуль, поскольку . Отсюда получается тождество

Основная идея этого тождества, как и аналогичных ему, которые будут построены позже, заключается в том, чтобы разбить общую сумму квадратов отклонений некоторой случайной величины относительно ее среднего выборки на несколько отдельных сумм квадратов, каждая из которых относится к своему источнику вариации. В данном частном случае мы заметим, что:

а) величина представляет собой меру вариабельности внутри группы тогда как величина — мера обшей вариабельности внутри групп. Она известна как внутригрупповая сумма квадратов (ВСК) и представлена как остаток в приведенной выше таблице дисперсионного анализа;

б) величина служит мерой вариабельности между группами. Она называется межгрупповой суммой квадратов (МСК) и представлена членом, отражающим дополнительное снижение в таблице дисперсионного анализа.

Если не пользоваться методом наименьших квадратов, то с помощью выражения (10.1.10) можно проверить гипотезу относительно равенства групповых средних на основе следующих рассуждений. Когда групповые средние различны, мы вправе ожидать, что МСК будет больше, чем если бы они были одинаковыми. С другой стороны, мы не ожидаем, что это обстоятельство каким-либо образом отразится на величинах ВСК. Следовательно, интуитивно разумный метод проверки, одинаковы ли групповые средние, заключается в том, чтобы рассмотреть отношение МСК/ВСК. Исследование распределений этих двух статистик, когда ошибки независимы, нормально распределены, имеют нулевое среднее и одинаковые дисперсии показывает, что (как при подходе, основанном на методе наименьших квадратов):

а) распределена как случайная величина [см. раздел

б) МСК распределена как случайная величина независимо от ВСК, если математические ожидания для групп равны.

Следовательно, можно принять в качестве функции критерия выражение

которое имеет распределение [см. раздел 2.5.6], когда ожидания равны.

С этой точки зрения естественно использовать таблицу дисперсионного анализа несколько иного вида:

В последнем столбце приведены математические ожидания двух средних квадратов, подтверждающие, что математическое ожидание для МСК действительно возрастает, когда у групп оказываются неравные средние, что предполагает применение одностороннего критерия. Когда же групповые средние равны, эти два средних квадрата становятся независимыми оценками величины

Хотя эта вырожденная модель неортогональна (на самом деле модель может оказаться и невырожденной, поскольку матрица не диагональна), она обладает частичной ортогональностью, что было видно и раньше в разделе 8.3.7. В табл. (10.1.9) величина СКМ разбивается так:

где первый член в выражении, стоящем справа, есть а второй — сумма квадратов для проверки гипотезы, что так как это не что иное, как дополнительное уменьшение, когда гипотеза окажется «подорванной». Далее, МНК-оценка для а оставалась той же, как в модели полного ранга, так и в модели, ограниченной гипотезой, а именно Если же теперь мы рассмотрим вторую гипотезу (обычно не представляющую никакого интереса) то метод наименьших квадратов приведет к оценкам которые будут теми же, что и для полной модели, причем будет снижением, обусловленным данной гипотезой, а — дополнительным снижением, когда ограничение устранено. Получается, что в обеих гипотезах используется одно и то же разложение в котором члены в зависимости от ситуации меняются ролями. Вот как можно резюмировать наши рассуждения:

Это позволяет говорить, что параметры распадаются на две ортогональные группы, причем в одну входит параметр а во вторую Действительно, ковариация Ортогональность этих двух групп параметров особенно хорошо видна в ранее рассмотренном варианте модели полного ранга, где для исключения использовались дополнительные условия. Из выражения (10.1.5), где приведена матрица плана, видно, что матрица есть

Для других гипотез, скажем, для гипотезы эти особые свойства дисперсионного анализа вполне могут исчезнуть, так как оценки для вовсе не обязательно будут одинаковыми для модели полного ранга и для модели, ограниченной данной гипотезой.

1
Оглавление
email@scask.ru