Главная > Справочник по прикладной статистике. Том 2
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

14.4.2. КРИТЕРИЙ ЗНАКОВЫХ РАНГОВ УИЛКОКСОНА

Очевидно, что критерий знаков не использует значительную часть информации, содержащуюся в выборке. Лучший непараметрический критерий должен учитывать не только информацию о том, положительны или отрицательны разности но и относительные размеры этих разностей. Снова рассмотрим двусторонний критерий для проверки

против

Положим по определению

а затем упорядочим абсолютные значения т. е. ранжируем

Как и в критерии знаков, мы игнорируем те наблюдения, которые дают

Пример 14.4.2. Знаковые ранги Уилкоксона. Значения в примере равны

Мы приписываем им ранги, не учитывая знаков:

В критерии знаковых рангов Уилкоксона эти ранги используются в одной из двух статистик:

или

Если выполняется гипотеза мы будем ожидать, что примерно равны, тогда как при — что одна из этих двух сумм доминирует. В нашем примере

и

Предположим, что мы выбрали меньшую величину в качестве статистики критерия. Сравнительно малые или большие значения заставят нас отклонить поэтому наблюдения, которые дают такие значения, войдут в критическую область. Чтобы определить критическую область или, взамен этого, достигаемый уровень значимости, нам нужно знать распределение при справедливости гипотезы При выполнении каждое наблюдение с вероятностью 1/2 больше или меньше медианы поэтому каждое из значений (и соответственно каждый из рангов) имеет вероятность 1/2 быть или Каждая из различных возможных расстановок знаков для значений имеет поэтому одну и ту же вероятность при Чтобы получить наблюдения, попадающие в критическую область, нужно перечислить все возможные случаи, которые приводят к крайним значениям Вместо этого мы можем вычислить достигаемый уровень значимости.

Так, в нашем примере

Числитель вычислим следующим образом:

Таким образом, есть 14 способов получить поэтому

Для двустороннего критерия достигаемый уровень значимости имеет вид

Здесь наибольшее значение равно Поскольку при выполнении распределение симметрично, достигаемый уровень значимости равен Следовательно, на 5%-ном уровне значимости мы отвергнем нулевую гипотезу, что медиана равна 5,0 в пользу гипотезы Из значения статистики следует, что медиана больше 5,0. Вообще говоря, эта процедура несколько утомительна. К счастью, доступны таблицы, которые содержат критические значения в критической области [см., например, Siegel (1956), табл. G, с. 254] или функцию распределения [см., например, Owen (1962), табл. 11, 1, с. 325-330-G].

Для больших значений мы можем использовать нормальную аппроксимацию для а именно при выполнении приближенно нормальна с математическим ожиданием и дисперсией

При статистики распределены одинаково.

Если есть совпадающие наблюдения, мы припишем им средние ранги. Влияние этой процедуры на распределение пренебрежимо мало, если только доля связок не слишком велика. Коррекция к аппроксимации в (14.4.2) состоит в уменьшении дисперсии на

где Т — число связок и связка состоит из наблюдений

Categories

1
Оглавление
email@scask.ru