10.2.3. МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

10.2.3. МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ

К задачам типа а) относится также сравнение заранее выбранных линейных комбинаций параметров (например, групповых средних или разностей между ними), для которых требуется установить

доверительные утверждения . Проблема того же рода возникает и тогда, когда доверительные границы устанавливаются в каждом конкретном случае отдельно, но мы хотим знать общий уровень значимости для них всех, т. е. вероятность того, что все утверждения корректны одновременно. И снова зависимость между ними может затруднить точный ответ на такой вопрос, но мы по крайней мере можем сказать, что

Таким образом, если в каждом случае используется один и тот же доверительный коэффициент верны), мы имеем Р (все верно) Следовательно, мы располагаем нижней границей для требуемой вероятности и можем гарантировать величину доверительной вероятности при выборе . Это известный метод Бонферрони для построения совместных доверительных интервалов, а установленное выше неравенство называется неравенством Бонферрони.

Для иллюстрации этого подхода рассмотрим односторонний план с моделью

Если мы строим -ные доверительные интервалы для каждого группового среднего, т.е. где то какой уровень доверия мы можем иметь для утверждения ? В данном случае мы имеем так что это будет по меньшей мере , и можно положить для получения общего уровня доверия, по меньшей мере равного .

Когда -критерий позволяет отбросить гипотезы относительно равенства эффектов групп, обычно хотят знать, какие группы следует рассматривать как одинаковые, а какие — как разные. Доверительные интервалы для различия между двумя средними, скажем с вероятностью (поскольку дисперсия ) равны

Мы считаем, что два средних различны, если не содержит нуля. Когда все группы имеют одинаковые объемы это просто сводится к сравнениям всех разностей с наименьшей значимой разностью, причем групповые средние признаются значимо различными, когда превосходит Если это выполняется для каждой пары, то для при получается всего интервалов, и мы можем гарантировать общее доверие на уровне по крайней мере при выборе . К сожалению, когда велико, такие интервалы получаются очень широкими и поэтому имеют ограниченное применение. Более того, доверительный коэффициент корректен только в том случае, когда эти интервалы строятся безотносительно к результатам применения -критерия. Если же, что вполне разумно, мы заботимся только о том, чтобы -критерий не отбрасывал Н, то истинный уровень доверия оказывается неизвестным.

Пример 10.2.1. Совместные доверительные интервалы. В следующей таблице приведены результаты измерений предела прочности на разрыв для шести сплавов:

(см. скан)

Вот таблица дисперсионного анализа:

(см. скан)

Отношение средних квадратов равно следовательно, существуют сильные аргументы в пользу значительных различий между прочностями рассматриваемых сплавов. Взяв а в качестве стандартных ошибок средних получим: 0,058, 0,052, 0,058, 0,047, 0,052, 0,058. Отсюда (используя найдем следующие индивидуальные 95%-ные доверительные интервалы для .

Если мы хотим иметь шесть доверительных интервалов с совместной доверительной вероятностью не меньше 95%, то нужно взять и провести повторные вычисления, используя [см. приложение 5]. Тогда требуемые интервалы (каждый из которых остается отдельным, но с доверительным коэффициентом 0,9917) будут такими:

Если же мы рассмотрим интервалы для разностей между всеми парами средних, то окажется, что так что общее доверие потребует выбора и нам придется воспользоваться . В результате доверительные

интервалы довольно заметно расширятся. При сравнении первых двух групп, например, мы получим , а для групп

Иногда заранее ясно, что предстоит рассмотреть заданное подмножество таких сравнений. Это уменьшает , как следствие, сужает интервалы. В нашем примере группа 4 относится к наблюдениям над стандартным сплавом, а остальные пять групп относятся к пяти новым разработкам. Если мы ограничим внимание только сравнениями каждого из новых сплавов со стандартным, то получим а значит для достижения общего доверия, равного 0,95. Тогда получатся следующие интервалы:

Совместная доверительная вероятность для этих интервалов (т. е. вероятность того, что все пять разностей укладываются в интервал типа ) равна 0,95.

Как видно на примере интервала для при ограничении внимания только этими пятью сравнениями мы получаем более узкие интервалы для разностей в отличие от случая, кбгда рассматриваются все пары.

Когда заранее трудно определить, какие сравнения окажутся интересными, полезно иметь подходящие методы для получения интервалов, относящихся к вопросам, возникшим после того, как данные были исследованы. Одним из подходов к решению этой проблемы служит -метод Шеффе [см. Scheffe (1959)].

Мы ввели термин контраст для параметров применительно к любой линейной функции от скажем обладающей тем свойством, что , где с — известные константы.

Так, разность -между средними любых двух групп будет контрастом. Среднее одной группы минус среднее средних всех остальных групп, т.е. — тоже контраст. И вообще, контрастом будет среднее средних некоторого числа групп минус среднее средних некоторых других групп. Можно показать, что гипотеза эквивалентна Н: все возможные контрасты равны нулю. В основном метод Шеффе дает интервалы для всех возможных контрастов при заданном общем доверии. Тогда, какие бы контрасты мы ни выбрали (заранее или после изучения данных), они автоматически окажутся включенными в рассмотрение.

Найдем теперь МНК-оценку для равную

Соответствующая формула что дает Мы оцениваем эту дисперсию из

, где обычная оценка о основанная на , а именно

Шеффе показал, что когда охватывает все возможные контрасты, существует вероятность 1—а того, что все неравенства вида

удовлетворяются одновременно, где получается из — общее число наблюдений Заметим, что сомножитель — это порядок гипотезы

Пусть для любого контраста обозначает гипотезу, что Мы отвергаем на совместном уровне значимости а, если интервал, вычисленный для а именно не включает значения Можно показать, что -критерий отвергает гипотезу Н, если и только если отвергается по меньшей мере одна из гипотез Значит, когда все контрасты фактически равны нулю, существует вероятность а того, что по меньшей мере одна из гипотез будет отвергнута. Мы можем применить эти результаты к любым контрастам и выбрать то, что удалось выявить, что повлекло за собой отбрасывание гипотезы Н. Отметим, что если внимание концентрируется на отдельном контрасте выбранном заранее, а не на пришедшем в голову под влиянием результатов, то выражение (10.2.2) дает обычный -ный доверительный интервал для после замены на 1 в определении Если же мы хотим построить совместные доверительные интервалы для всех линейных комбинаций (т. е. не только контрастов), то нам придется лишь заменить в определении на I.

Пример 10.2.2. S-метод Шеффе. Применим S-метод Шеффе к данным, использованным ранее в примере 10.2.1. Имеем

В соответствии с (10.2.2) получим:

(см. скан)

Оказывается, что группы 1, 5 и 6 относятся к разным сплавам с одной структурой (назовем их сплавами типа 1), а группы 2 и 3 — к разным сплавам с другой структурой (не с той же, что сплавы 1, 5 и 6). Назовем их сплавами типа 2. Все результаты можно суммировать следующим образом. При сравнениях пяти сплавов со стандартом (первые 5 контрастов) создается впечатление, что сплав 2 лучше, чем стандарт, а для всех остальных не выявлено очевидных преимуществ. Но если, например, сплав 1 лучше, чем стандарт, то различие, по-видимому, не превышает величины 0,36. Аналогично и для остальных сплавов, кроме шестого контраста, который показывает, что нет достаточных оснований для заключения, что лучший сплав типа 2 превосходит лучший сплав типа 1, хотя различие между ними и может быть — самое большее в 0,43 единицы разрывной прочности. Интервал для восьмого контраста показывает, что сплавы типа 2 лучше, чем стандарт. Девятый интервал указывает, что нет достаточных оснований для утверждения, что сплавы типа 1 в общем лучше, чем стандарт. Последний контраст сравнивает сплавы типа 1 со сплавами типа 2. Разница в пользу типа 2 могла бы быть самое большее порядка 0,34, так что даже превосходство типа 1 не исключается и нужны дальнейшие исследования. Всеобщая доверительная вероятность для всех этих утверждений (и для любых других контрастов, интервалы которых мы в состоянии вычислить) равна 95%.

Что же касается первых пяти контрастов, то можно было бы получить более короткие их интервалы методом Бонферрони, но за это пришлось бы заплатить невозможностью делать какие бы то ни было заключения относительно любых других контрастов.

Когда все группы имеют одинаковые объемы, можно воспользоваться для получения интервалов для всех контрастов другим методом (предложенным Дж. Тюки). Он основан на стьюдентизированном размахе [см. раздел 2.5.9]. Эти интервалы получаются короче, чем при -методе для контрастов вида но длиннее для других контрастов. Более подробное обсуждение этих вопросов можно найти в работе [Scheffe (1959)].

В общем -метод можно применить к любому набору эффектов в линейной модели для получения совместных доверительных утверждений такого типа, как в (10.2.2). Общая теория изложена Шеффе [см. Scheffd (1959)]. В качестве заключительной иллюстрации рассмотрим сбалансированную перекрестную двустороннюю классификацию: