14.4.2. КРИТЕРИЙ ЗНАКОВЫХ РАНГОВ УИЛКОКСОНА
Очевидно, что критерий знаков не использует значительную часть информации, содержащуюся в выборке. Лучший непараметрический критерий должен учитывать не только информацию о том, положительны или отрицательны разности но и относительные размеры этих разностей. Снова рассмотрим двусторонний критерий для проверки
против
Положим по определению
а затем упорядочим абсолютные значения т. е. ранжируем
Как и в критерии знаков, мы игнорируем те наблюдения, которые дают
Пример 14.4.2. Знаковые ранги Уилкоксона. Значения в примере равны
Мы приписываем им ранги, не учитывая знаков:
В критерии знаковых рангов Уилкоксона эти ранги используются в одной из двух статистик:
или
Если выполняется гипотеза мы будем ожидать, что примерно равны, тогда как при — что одна из этих двух сумм доминирует. В нашем примере
и
Предположим, что мы выбрали меньшую величину в качестве статистики критерия. Сравнительно малые или большие значения заставят нас отклонить поэтому наблюдения, которые дают такие значения, войдут в критическую область. Чтобы определить критическую область или, взамен этого, достигаемый уровень значимости, нам нужно знать распределение при справедливости гипотезы При выполнении каждое наблюдение с вероятностью 1/2 больше или меньше медианы поэтому каждое из значений (и соответственно каждый из рангов) имеет вероятность 1/2 быть или Каждая из различных возможных расстановок знаков для значений имеет поэтому одну и ту же вероятность при Чтобы получить наблюдения, попадающие в критическую область, нужно перечислить все возможные случаи, которые приводят к крайним значениям Вместо этого мы можем вычислить достигаемый уровень значимости.
Так, в нашем примере
Числитель вычислим следующим образом:
Таким образом, есть 14 способов получить поэтому
Для двустороннего критерия достигаемый уровень значимости имеет вид
Здесь наибольшее значение равно Поскольку при выполнении распределение симметрично, достигаемый уровень значимости равен Следовательно, на 5%-ном уровне значимости мы отвергнем нулевую гипотезу, что медиана равна 5,0 в пользу гипотезы Из значения статистики следует, что медиана больше 5,0. Вообще говоря, эта процедура несколько утомительна. К счастью, доступны таблицы, которые содержат критические значения в критической области [см., например, Siegel (1956), табл. G, с. 254] или функцию распределения [см., например, Owen (1962), табл. 11, 1, с. 325-330-G].