Главная > Многомерный дисперсионный анализ
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.3. ПАРНЫЕ И МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ ВЕКТОРОВ СРЕДНИХ

Критерий значимости из раздела 7.2 позволяет сделать суммарный вывод о различии, существующем между группами в целом, но он не дает информации о том, насколько определенные группы отличаются одна от другой. В данном разделе рассматривается критерий значимости, применяемый к парам групп.

Сравнение двух групп

При выводе формулы критерия опираемся на уравнение модели (7.5). Проверим гипотезу о равенстве векторов средних значений групп Соответствующий критерий легко получить методом из раздела 6.2.1. Единственное различие заключается в том, что оценка 2 находится по всем выборкам и поэтому ее вычисляют не по (6.18) и (6.19), а по (7.3) и (7.4). В соответствии с этим имеем Из (6.8) и (6.9) в качестве статистики критерия получаем

Итак, если

то существует значимая разница между группами При проверке этой гипотезы можно пользоваться как грубым, так и уточненным методом.

Пример. С помощью данных о больных гипертиреозом из раздела 7.1 получаем

Соответствующий квантиль -распределения есть Следовательно, при парном сравнении получаем существенную разницу между группами 1 и 2, а также между группами 2 и 3. И напротив, между группами 1 и 3 нет существенной разницы по средним значениям (для пациентов обеих групп лечение вначале было успешным).

Множественное сравнение групп

Как было показано выше, многомерный дисперсионный анализ позволяет производить попарное сравнение векторов средних значений (по формулам (7.21)-(7.23)). Для одной асти групп различие

оказывается значимым, для другой — незначимым. В связи с этим возникает проблема, правомочны ли мы отдельные результаты, касающиеся сравнения различных пар групп, объединить в общий результат. Более конкретно: можно ли по результатам, полученным после трехкратного применения приведенного выше критерия,

сделать вывод, что все три вектора средних значений попарно значимо отличны один от другого. Иначе, можно ли по трем результатам (7.24), каждый из которых получен на уровне значимости заключить, что и общий вывод о несовпадении каких-либо двух из трех векторов средних значений, выполняется на уровне значимости

Строго говоря, такой простой вывод, объединяющий отдельные результаты, неприемлем. Поэтому далее мы укажем формулы, пригодные для множественного сравнения нескольких пар групп.

Чтобы не быть превратно понятыми специалистами-прикладниками в области медицины, сельского хозяйства, психологии и т. д., мы хотим подчеркнуть, что упомянутого выше попарного сравнения в большинстве случаев на практике вполне достаточно. С помощью критерия сравнения в первую очередь оцениваются контрасты внутри каждой пары групп, и только в редких случаях требуется дополнительная проверка гипотезы (на определенном уровне а) относительно совокупности отдельных выводов, рассматриваемых как единый комплекс. В большинстве практических случаев критерий множественного сравнения может рассматриваться просто как усиление попарного сравнения.

Сформулируем в виде правила процедуру множественного сравнения.

Правило. Если для нескольких пар групп выполняется неравенство

где определяются по (7.13) и (7.14), то векторы разностей соответствующие всем этим парам групп, следует считать отличными от нуля. Формулировка соответствует по своей точности суммарному критерию согласно Если воспользоваться уточнением, указанным в виде формул то вместо (7.25) получим

где вычисляются по формулам Формулы (7.25) и (7.26) эквивалентны для случая

Докажем первую часть правила (7.25) исходя из критерия Вывести уточненный критерий читатель может самостоятельно по аналогии.

В основе доказательства лежит формула

— среднее арифметическое по объединению выборок что легко проверить. Так как правая часть (7.27) есть сумма положительно полуопределенных квадратичных форм, то

При справедливости гипотезы (7.6) с вероятностью согласно (7.12) должно выполняться соотношение

Отсюда при справедливости (7.6), по крайней мере с вероятностью 1 — а, все возможные пары групп одновременно удовлетворяют неравенству

Эту закономерность можно распространить на случай произвольных векторов средних значений . В результате получаем, что, по крайней мере с вероятностью , одновременно для всех пар групп выполняется неравенство

С помощью правила, приведенного выше, проверяем гипотезу по крайней мере одна из пар принадлежащих заданному множеству пар групп, удовлетворяет соотношению

Соответствующая альтернатива для всех пар групп множества имеет место

В качестве статистики критерия используется величина гипотеза отвергается, если

Чтобы, наконец, дать обоснование этому методу проверки гипотезы и тем самым доказать сформулированное правило, покажем, что

при справедливости гипотезы вероятностью не меньше выполняется соотношение Появление значения может расцениваться как противоречие гипотезе т. е. как доказательство альтернативы.

Обоснование. Так как неравенства (7.29) выполняются одновременно для всех пар групп с вероятностью, не меньшей, чем , то по крайней мере с той же вероятностью для одной пары групп которая согласно имеет два совпадающих вектора средних значений, получаем

Итак, мы действительно достигли намеченной цели, получив что неравенство а выполняется с вероятностью, не меньшей, чем . Тем самым доказано сформулированное выше правило.

Неравенство (7.28) показывает, что суммарный критерий из раздела 7.2 оказывается значимым, если значимое различие векторов средних значений (в смысле множественного сравнения) обнаруживается хотя бы для одной пары групп.

Наше изложение множественного сравнения следует известному в одномерном дисперсионном анализе -методу Шеффе [81].

Мы получили частный случай множественного сравнения, поскольку рассмотрели лишь контрасты, служащие для парных сравнений векторов средних значений. Соответствующим образом можно было бы исследовать более сложные контрасты (см., например, [74] и [54]). О методике множественного сравнения, основанной на одновременном доверительном оценивании параметров общей многомерной линейной модели, см. раздел 8.3.

Критерии сравнения из настоящего раздела легко реализуются с помощью вычислительных программ. В программе может быть предусмотрено сравнение каждых двух групп как по отдельности с помощью критерия (7.23), так и одновременно с помощью критериев (7.25) или (7.26).

Пример. Для данных о гипертиреозе из раздела 7.1 формулы (7.25) и (7.26) эквивалентны, так как По (7.25) получаем

Для сравнения используем квантиль -распределения Таким образом, одновременное сравнение всех трех векторов средних на уровне значимости показывает, что вектор средних значений группы 2 отличен как от вектора средних значений группы 1, так и от вектора средних значений группы 3. Для групп 1 и 3 вывода о различии сделать нельзя.

1
Оглавление
email@scask.ru