Главная > Справочник по прикладной статистике. Том 1
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

8.3.6. ПРОВЕРКА ГИПОТЕЗ ДЛЯ НЕ ОРТОГОНАЛЬНЫХ ПЛАНОВ

При проверке гипотез Н для неортогональных планов используются те же подходы, что были описаны в разделе 8.3.3, т. е. дополнительное уменьшение (подгонка), получаемое при условии, что вектор не ограничен гипотезой Н, а именно сравнивается (после нормирования) с дисперсией ошибки, служащей оценкой для , где — остаток для полной модели. Из-за более сложной структуры нормальных уравнений конкретная реализация метода оказывается более сложной, чем в случае ортогонального плана, для которого, напомним, если Н не накладывает ограничений на , то МНК-оценка одинакова безотносительно к тому, верна ли гипотеза Н. Это очень удобное свойство в общем отсутствует у неортогональных планов (хотя в исключительных случаях и встречаются отдельные компоненты вектора в, имеющие свои собственные изолированные нормальные уравнения).

Для демонстрации различий рассмотрим вопрос о проверке гипотезы о том, нужен ли в модели параметр Дополнительная сумма квадратов при включенном в модель , в соответствии с (8.3.8) есть

где — МНК-оценка для при условии Н, а — соответствующие остатки. В ортогональном случае такое выражение включает только . В общем случае, однако, когда оценки остальных параметров не влияют на Н, оно тем не менее от них зависит. Обозначим такое уменьшение через , где — остальные параметры, включенные в модель. Для ортогонального плана что не зависит от Поэтому мы могли говорить однозначно об уменьшении в общей сумме квадратов, обусловленном включением в модель данного параметра , не обращая внимания на другие параметры (если они включены в модель). Это приводит к единственному разбиению (т. е. дисперсионному анализу) СКМ, приводящему, как мы видели раньше, к разделению на вклады, обусловленные включением в модель каждого из параметров, в виде

В неортогональном случае зависит от каждого из параметров, входящих в модель а СКМ можно разделить множеством разных способов в виде

В этом выражении обозначает уменьшение в общей сумме квадратов, обусловленное включением только параметра — дополнительное снижение, полученное при включении в модель еще и параметра Когда же включены сразу оба параметра, уменьшение равно вычитание дает что в общем случае зависит от обоих параметров, а в случае ортогонального плана только от . Аналогично — это дополнительное уменьшение, проявившееся после включения в дополнение к оно равно Последний член — дополнительное уменьшение при включении в модель в дополнение ко всем остальным параметрам. Можно показать, что если это уменьшение распределено независимо от остатков как Следовательно, последний член годится для проверки гипотезы (относительно полной модели с помощью Р-критерия.

Пример 8.3.5. Критерий для коэффициентов полиномиальной регрессии при неортогональном плане. Вернемся к вопросу о получении адекватной модели полиномиального вида для данных об осадках, на этот раз воспользовавшись обычными полиномиальными моделями. Напомним читателю, что описываемые здесь методы анализа без всяких изменений приложимы к построению полиномов по значениям х-переменных, расположенных не на равных расстояниях друг от друга (не с равным шагом). Начнем с построения полинома первого порядка:

Обозначим матрицу плана для этой модели через Тогда система нормальных уравнений примет вид или

Для данных об осадках она принимает вид

а решение таково: . В соответствии с (8.3.6) уменьшение, обусловленное этой моделью, есть Для его

вычисления воспользуемся эквивалентной, но более удобной формулой

и получим

Представляет интерес гипотеза при которой модель сводится к Нормальные уравнения этой модели получаются из предыдущих после вычеркивания последнего столбца и последней строки из матрицы и последних строк из векторов, поэтому . Тогда легко найти дополнительное уменьшение без использования (8.3.8). Уменьшение для этой модели равно: отсюда дополнительное уменьшение от включения в модель еще и равно: Дисперсионный анализ для проверки гипотезы сводится к

а его таблица имеет вид:

(см. скан)

Рассуждения остаются теми же, что и раньше. Мы приходим к выводу, что существуют недостаточные основания для отбрасывания гипотезы и ясно, что нужен полином по меньшей мере второго порядка. Построим его: Обозначим матрицу плана для этой модели через тогда система нормальных уравнений будет выглядеть так: и ее можно переписать в явном виде:

Подставив значения для данных об осадках и обратив матрицу, получим

Уменьшение общей суммы квадратов, обусловленное построением квадратичной модели, равно:

Произведя вычисления, получим . В условиях гипотезы выполняется модель первого порядка, построенная ранее. Для нее мы находили Дополнительная подгонка за счет включения еще и равна: Вот дисперсионный анализ:

и его таблица:

(см. скан)

Интерпретация та же, что и раньше: мы заключаем, что

Теперь построим кубическую модель Подставляя соответствующие значения в нормальные уравнения

и обращая матрицу, найдем

Уменьшение, обусловленное этой моделью, равно

что после вычислений дает 88,531. Теперь мы хотим проверить гипотезу . В условиях этой гипотезы «работает» уже полученная квадратичная модель, для которой уменьшение было Дополнительное уменьшение из-за равно:

Вот дисперсионный анализ:

и его табличная форма:

(см. скан)

Заключение, как и ранее, состоит в том, что основания для отбрасывания гипотезы слишком слабы. Аналогично можно рассмотреть и модель четвертого порядка: . В этом случае надо обращать матрицу размера после чего дисперсионный анализ примет вид

с таблицей:

(см. скан)

Интерпретация -критерия та же, что и раньше, при обсуждении ортогональной модели, и мы заключаем: квадратичная модель адекватно описывает наши данные.

Подчеркнем еще раз: для ортогональной модели надо проводить единственный дисперсионный анализ, выраженный соотношением (8.3.9), и уменьшение, с помощью которого мы судим о вкладе данного параметра в модель или в любую ее часть (подмодель), всегда одинаково. Для неортогональной модели дисперсионный анализ зависит от рассматриваемой гипотезы. Так, основное тождество дисперсионного анализа для модели первого порядка

в приведенном выше примере превращается в

поскольку мы хотим проверить гипотезу, что — представляет собой вклад дополнительный к тому, что уже дал в модели первого порядка. Поскольку это интересно не только для рассмотренного выше примера, можно оценить вклад дополнительно к вкладу с помощью

Такое разбиение относится к проверке гипотезы в модели первого порядка. Первый член в этом выражении не равен . В этом можно убедиться, подбирая модель для которой нормальное уравнение есть

и

Стоит отметить, что дополнительное уменьшение соответствует проверке гипотезы только в модели первого порядка. В нашем примере проверка для квадратичной модели приводит к дисперсионному анализу

Теперь его можно разбить на

но второй член в этом разбиении не годится для проверки гипотезы для данной модели. Если интересна именно эта гипотеза, то мы пользуемся разбиением

где . Получим подбирая квадратичную модель при условии т. е. модель . Нормальные уравнения для этой модели таковы:

Для данных об осадках получаем

откуда находим . Уменьшение, обусловленное подбором этой модели, равно: , а таблица дисперсионного анализа имеет вид:

(см. скан)

F-отношение равно 5,68, и мы имеем Из предыдущих таблиц и из этих данных видно, что:

а) квадратичная модель без линейного члена лучше, чем модель первого порядка;

б) в квадратичной модели член второго порядка (с дополнительным уменьшением, равным 0,720) более важен, чем. линейный член (с дополнительным уменьшением 0,443);

в) дополнительный вклад линейного члена меньше (хотя он и не очень мал) в квадратичной модели, а не в модели первого порядка. Однако F-критерий формально гораздо более значим именно для модели первого порядка. Это связано с тем, что сравнение происходит с различными остатками. Вклад таких членов низких порядков в полиномиальные модели практически не представляет интереса, поскольку общее решение касалось прежде всего степени полинома, подходящего для аппроксимации имеющихся данных.

Мы можем аналогично проверить гипотезу, не лишняя ли в модели группа параметров. Пусть подмножество из в и пусть обозначает параметры, не включенные в При гипотезе модель переходит в где матрица получается из матрицы А после вычеркивания столбцов, соответствующих параметрам из Тогда нормальные уравнения для гипотетической модели будут равны:

откуда получается оценка для вектора при условии Н в виде . Это совсем не то же самое, что МНК-оценка в полной модели, содержащей соответствующие компоненты

Уменьшение для ограниченной модели равно: отсюда дополнительное уменьшение при подборе полной модели равно: Можно показать, что когда верна, это дополнительное уменьшение распределено независимо от остатков полной модели как где — число параметров в

Вот таблица дисперсионного анализа:

(см. скан)

При гипотезе два средних квадрата служат независимыми оценками для основанными на степенях свободы соответственно, поэтому мы можем проверить Н, сравнивая

Пример 8.3.6. Продемонстрируем описанный выше метод при проверке гипотезы для квадратичной модели, построенной по данным об осадках, которая имеет вид

В принятых обозначениях Ранее мы нашли, что При условии Н модель которую мы тоже рассматривали, дает

Вот таблица дисперсионного анализа:

(см. скан)

Отношение средних квадратов равно 7,79, что весьма убедительно свидетельствует против

Точно так же, как мы решаем, можно ли исключить из модели некоторые параметры, мы можем поинтересоваться, удовлетворяют ли данные гипотезе, что различные параметры имеют определенные значения.

Пример 8.3.7. Проверка состоятельности данных об ускорении силы тяжести при определенных значениях параметров. Для этих данных из примеров 8.2.2, 8.2.4, 8.2.8 и 8.2.12 вопрос о проверке, требуются ли различные параметры, не возникает. Может представлять интерес другой тип гипотез вроде или Теперь мы проверим их при обычных предположениях, что ошибки независимы и распределены как

Поскольку содержит всего лишь один параметр, для ее проверки можно ограничиться просто -критерием. Тогда, если верна, то делится на оценку стандартного отклонения, в результате получается значение случайной величины, имеющей распределение Стьюдента с четырьмя степенями свободы (поскольку наша оценка базируется на остатках, имеющих 4 степени свободы).

Таким образом, приближенно

Теперь сравним эту величину с двусторонним критерием на 5%-ном уровне, равным Ясно, что гипотеза несостоятельна (на любом уровне!).

Эквивалентный метод заключается в проверке, попадает ли гипотетическое значение 981 в центральный 95%-ный доверительный интервал для который мы нашли в примере 8.3.1, и он оказался равным (981,2650, 981,2712). Наше гипотетическое значение явно лежит вне указанного интервала. Преимущество такого подхода состоит, как мы можем заметить, в том, что сразу видно, какие значения не попадают в интервал от нижнего значения 981,2650 до верхнего 981,2712, и если они не попадают, то это непосредственно означает, что они не согласуются с экспериментальными данными, а это должно привести к отбрасыванию гипотезы с помощью -критерия на 5%-ном уровне значимости.

Теперь мы проверим ту же гипотезу по -критерию, а затем применим его к гипотезам для которых -критерий не применим. При уравнения модели из примера 8.2.2 приводят к

Это можно записать и в матричной форме:

или

Заметим, что в матрице В есть две нулевых строки, которые соответствуют уравнениям 6 и 9 и в которых ошибки известны точно. Имеем

МНК-оценки при условии Н обозначим через и получим из решения системы нормальных уравнений в виде

Мы видим, что это совсем не те оценки которые были найдены в примере 8.2.2 для модели без ограничений, что является следствием неортогональности плана. Остаточная сумма квадратов при условии равна: где МНК-оценка при Н остатка (конечно, ). Получим подставив в уравнения для модели с ограничениями по их МНК-оценкам, отсюда:

Это дает что можно также найти по формуле

Полная модель имеет вид где приведены в примере 8.2.4. Остаточная сумма для полной модели равна: где — МНК-оценка для в модели без ограничений. Оценки были получены ранее в примере 8.2.12:

За исключением третьей и восьмой, все они меньше, чем в модели с ограничениями, что порождает сомнение в нашей гипотезе. Для формальной проверки мы возводим их в квадрат и складываем, получая откуда Можно показать, что если

эта гипотеза (т. е. ) верна, распределена как и независима от которое само распределено как Следовательно, соответствующее -отношение равно что приблизительно составляет так что может встретиться весьма мало еще больших значений -отношений.

Обратимся теперь к гипотезе . В суждениях о таких гипотезах индивидуальные доверительные интервалы для параметров могут вводить в заблуждение из-за пренебрежения корреляциями между оценками. Так, если воспользоваться индивидуальными интервалами, гипотетическое значение 981,2 будет казаться подходящим для но не подходящим для остальных оценок. В общем случае окончательное суждение может оказаться различным в зависимости от структуры матрицы хотя и тогда мы можем ожидать отбрасывания когда гипотетическое значение оказывается отстоящим далее, чем на три интервала. Для выбранного уровня можно построить совместную доверительную область, на которой основан критерий. По определению пятимерный доверительный эллипсоид для требует отбрасывания гипотезы если точка (981,2, 981,2, 981,2, 981,2, 981,2) ему не принадлежит. Действительно, можно построить -критерий обычным способом.

При условии нет параметров, подлежащих оценке, а ошибки известны точно, а именно:

откуда Если гипотеза верна, то распределено как и можно показать, что распределено независимо от как Следовательно, формула критерия такова:

Как и ожидалось, наша гипотеза, безусловно, отброшена.

Рассмотрим, наконец, гипотезу , для которой уравнения модели таковы:

В матричных обозначениях это выглядит так:

или

Поскольку МНК-оценка для при условии равна 981,11895. Все ошибки, кроме заданы, а для них мы получаем оценки Возводя в квадрат и складывая, найдем откуда Можно показать, что когда гипотеза верна, распределено независимо от как Значит, статистика, лежащая в основе критерия, есть и наша гипотеза, безусловно, должна быть отвергнута .

Categories

1
Оглавление
email@scask.ru