Главная > Справочник по прикладной статистике. Том 2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

14.6.2. КРИТЕРИЙ УИЛКОКСОНА-МАННА-УИТНИ

Ясно, что при медианном тесте теряется значительная часть информации, содержащейся в данных. Мы можем более эффективно использовать информацию, содержащуюся в объединенной выборке, если будем рассматривать ранги наблюдений. Следующая непараметрическая процедура предложена Уилкоксоном, Манном и Уитни [см. Wilcoxon (1945); Mann and Whitney (1947)]. Опишем ее в терминах данных примера 14.6.3.

Объединенный вариационный ряд и ранги, как мы уже видели, имеют вид

Полужирным шрифтом указаны ранги наблюдений из совокупности II (меньшая выборка). Статистика, используемая в критерии Уилкоксона—Манна—Уитни, — это сумма рангов одной из выборок. Мы можем взять

или

В более общем случае, если — ранги и — ранги в объединенной совокупности, то можно предпочесть любую из двух статистик:

или

Заметим, что если мы знаем то мы знаем также и поскольку

Эти две статистики эквивалентны, поэтому проще воспользоваться статистикой из меньшей выборки.

Если верна гипотеза что и являются одной и той же функцией распределения, то мы не должны ожидать преобладания наблюдений из одной выборки на одном из концов объединенного вариационного ряда: их значения должны быть рассеяны по всему объединенному вариационному ряду. Для альтернативной гипотезы общего вида сравнительно большие или сравнительно малые значения тестовой статистики (скажем, должны заставить нас усомниться в выполнении гипотезы Поэтому в качестве "критической области возьмем множество

где — константы, выбранные таким образом, чтобы размер не превышал а. Альтернативно можно оценить уровень значимости как вероятность наблюдать такое же или еще более крайнее значение статистики, чем то, что мы получили.

Пример 14.6.4. Уровень значимости критерия Уилкоксона—Манна—Уитни. При выполнении статистика имеет симметричное распределение с математическим ожиданием (см. ниже). Поэтому уровень значимости есть

Если выполняется, то рангов являются случайной выборкой (без возвращения) объема из набора целых чисел Поскольку при выполнении все возможные последовательности рангов в объединенной совокупности равновероятны, уровень значимости равен

Вычисление этой вероятности можно провести, просто выписав все комбинации, для которых

Таким образом, число комбинаций, для которых 46, равно 12. Так как имеет симметричное распределение при выполнении число комбинаций, для которых тоже равно 12, поэтому уровень значимости (14.6.2) равен:

Это достаточно низкая вероятность. Она довольно сильно свидетельствует против гипотезы, что две совокупности имеют одну и ту же функцию распределения. Вспомним, что, применяя критерий знаков и отбрасывая слишком много информации, содержащейся в данных, мы не смогли получить свидетельства против выполнения

Приведенной выше трудоемкой процедуры можно избежать, воспользовавшись существующими таблицами для критических значений в (14.6.1) [см., например, Owen (1962), табл. 11.5].

В некоторых таблицах используется другая тестовая статистика определяемая как

или

Здесь измеряет число случаев, когда наблюдение из большей выборки находится левее наблюдения из меньшей выборки в объединенном вариационном ряду; таблицы для см., например, в [Siegel (1956), табл. J, К, с. 271—277] или в [Owen (1962), табл. 11.2-11.4, с. 331—353].

Для больших выборок мы можем использовать нормальную аппроксимацию для (или и эти аппроксимации работают

хорошо даже для таких небольших значений как . При выполнении нулевой гипотезы мы ожидаем, что средний ранг наблюдения из совокупности I примерно равен среднему рангу наблюдения из совокупности II. Поскольку общая сумма рангов равна средний ранг равен Поэтому

Можно показать, что

В нашем примере объемы выборок несколько маловаты для того, чтобы ожидать очень аккуратной аппроксимации, но в качестве иллюстрации допустим, что имеет приблизительно нормальное распределение при выполнении . Отсюда приближенно

Уровень значимости, следовательно, равен что сравнимо с точным значением 0,030, вычисленным ранее.

Вполне возможно, что среди наблюдений могут оказаться равные. Мы припишем им средние ранги. Если связки встречаются лишь в одной из выборок, это не повлияет на или Если в связки входят наблюдения из различных выборок, то эффект, вообще говоря, будет невелик, но при использовании нормальной аппроксимации следует умножить дисперсию (14.6.3) на корректирующий множитель

где Т — число связок и связка состоит из наблюдений

Односторонние критерии могут быть получены для тех ситуаций, когда альтернатива означает, что и отличаются сдвигом в определенном направлении.

1
Оглавление
email@scask.ru