14.4.2. КРИТЕРИЙ ЗНАКОВЫХ РАНГОВ УИЛКОКСОНА
Очевидно, что критерий знаков не использует значительную часть информации, содержащуюся в выборке. Лучший непараметрический критерий должен учитывать не только информацию о том, положительны или отрицательны разности
но и относительные размеры этих разностей. Снова рассмотрим двусторонний критерий для проверки
против
Положим по определению
а затем упорядочим абсолютные значения
т. е. ранжируем
Как и в критерии знаков, мы игнорируем те наблюдения, которые дают
Пример 14.4.2. Знаковые ранги Уилкоксона. Значения в примере
равны
Мы приписываем им ранги, не учитывая знаков:
В критерии знаковых рангов Уилкоксона эти ранги используются в одной из двух статистик:
или
Если выполняется гипотеза
мы будем ожидать, что
примерно равны, тогда как при
— что одна из этих двух сумм доминирует. В нашем примере
и
Предположим, что мы выбрали меньшую величину
в качестве статистики критерия. Сравнительно малые или большие значения
заставят нас отклонить
поэтому наблюдения, которые дают такие значения, войдут в критическую область. Чтобы определить критическую область или, взамен этого, достигаемый уровень значимости, нам нужно знать распределение
при справедливости гипотезы
При выполнении
каждое наблюдение с вероятностью 1/2 больше или меньше медианы
поэтому каждое из значений (и соответственно каждый из рангов) имеет вероятность 1/2 быть
или
Каждая из
различных возможных расстановок знаков для значений
имеет поэтому одну и ту же вероятность
при
Чтобы получить наблюдения, попадающие в критическую область, нужно перечислить все возможные случаи, которые приводят к крайним значениям
Вместо этого мы можем вычислить достигаемый уровень значимости.
Так, в нашем примере
Числитель вычислим следующим образом:
Таким образом, есть 14 способов получить
поэтому
Для двустороннего критерия достигаемый уровень значимости имеет вид
Здесь наибольшее значение
равно
Поскольку при выполнении
распределение
симметрично, достигаемый уровень значимости равен
Следовательно, на 5%-ном уровне значимости мы отвергнем нулевую гипотезу, что медиана равна 5,0 в пользу гипотезы
Из значения статистики
следует, что медиана больше 5,0. Вообще говоря, эта процедура несколько утомительна. К счастью, доступны таблицы, которые содержат критические значения
в критической области [см., например, Siegel (1956), табл. G, с. 254] или функцию распределения
[см., например, Owen (1962), табл. 11, 1, с. 325-330-G].