11.2.3. Ранговые критерии однородности.
Ранговые критерии однородности основаны на использовании номеров наблюдений в вариационном ряду, полученном после упорядочивания объединенной выборки объема Номер, который получает наблюдение в упорядоченной выборке, называется его рангом и обозначается дальше через .
Будем рассматривать так называемые линейные ранговые критерии, статистики которых имеют вид:
где суммирование распространяется по элементам только первой или только второй выборки Дальше для определенности будем считать, что суммирование проводится по наблюдениям из первой выборки. Значения функции от ранга называют метками. С ростом объемов выборок распределение статистик этих критериев быстро сходится к нормальному.
Предлагаемые ниже критерии состоятельны при проверке гипотезы неоднородности, когда неоднородность порождается различием в параметре положения например, средних значений, медиан) распределений. Для случая двух выборок альтернативные гипотезы можно записать в виде:
а нулевую гипотезу (равенства распределений) как Кроме того, эти же критерии можно использовать и против альтернатив вида
т. е. распределение второй выборки «стохастически меньше» для чем первой, и «стохастически больше» для .
Критерий Вилкоксона — Манна — Уитни.
Статистика этого критерия имеет вид:
Метками в этом случае являются ранги наблюдений. Иногда статистика S называется статистикой суммы рангов. Часто пользуются эквивалентной статистикой
(11.28)
Если нулевая гипотеза верна, то имеем
(11.29)
Если так что распределение U сходится к нормальному со средним и дисперсией, определяемыми из соотношений (11.29), (11.30) соответственно. Сходимость к нормальному приближению очень быстрая, и оно уже эффективно, если и превышают 8 [401.
Еще более точной является аппроксимация вида
(11.31)
где функция и плотность стандартного нормального распределения (см. п. 12.1.2)
Критерий нормальных меток (Фишера — Йэтса — Терри — Гефдинга).
Статистика критерия записывается в виде
где — математическое ожидание порядковой статистики (см. п. 12.1.11) в выборке длины из стандартного нормального распределения.
Если верна нулевая гипотеза, то
(11.33)
При предельное распределение случайной величины сходится к нормальному; при величина а в дальнейшем она стремится к 1, так что при больших . Иногда используется критерий Ван дер Вардена [22] со статистикой
где — обратная функция стандартного нормального распределения (см. п. 12.1.2). Этот критерий асимптотически эквивалентен критерию С. Если верна нулевая гипотеза, то
Для применения критериев S, С и V выполняется следующая последовательность вычислений.
1. Выборки объединяются и объединенная выборка упорядочивается в порядке возрастания значений наблюдений.
2. По рангам первой (или второй) выборки вычисляется величина статистики критерия К (это может быть значение S, С, V) и затем вычисляется величина .
3. Значение величины А сравнивается с квантилями стандартного нормального распределения (либо вычисляется значение функции стандартного нормального распределения ). В зависимости от альтернативной гипотезы область критических значений отвержения нулевой гипотезы при уровне значимости а определяется следующими неравенствами (в предположении, что вычисление
статистики критерия проводилось по элементам первой выборки):
Если величины объемов выборок малы, то для получения более точного результата можно использовать таблицы критических значений соответствующих статистик 1.
Из рассматриваемых ранговых критериев против альтернатив сдвига при достаточно больших значениях наибольшей мощностью обладает критерий нормальных меток, а наименьшей — критерий Вилкоксона (в случае небольших объемов выборок критерий Вилкоксона может оказаться для некоторых типов модельных распределений более мощным, чем критерий нормальных меток). В частности, для нормальных распределений критерий нормальных меток имеет такую же мощность, как и -критерий, рассматриваемый в п. 11.2.7. Подробный сравнительный анализ свойств рассматриваемых критериев приведен в работе [40].