14.7.2. КРИТЕРИЙ КРАСКЕЛА—УОЛЛИСА
Снова мы можем полнее учесть информацию, содержащуюся в объединенном вариационном ряду. Как и для критерия Уилкоксона—Манна—Уитни из раздела 14.6.2 для двух выборок, мы используем ранги наблюдений в объединенной совокупности.
Для каждой из к выборок вычислим суммы рангов:
Пример 14.7.3. Обработка данных из примера 14.7.1 с помощью критерия Краснела—Уоллиса. Объединенный вариационный ряд вместе с рангами для данных примера имеет вид
Здесь мы показали ранги для совокупности I, например, как [4], ранги для совокупности II — как 6 (полужирный шрифт) и ранги для совокупности III — как 1 (светлый шрифт). Тогда
Для каждого наблюдения в конкретной выборке мы можем указать средний ранг
Если выполняется гипотеза
и распределения одинаковы, то можно ожидать, что все средние ранги примерно равны, а именно, что они примерно равны общему среднему рангу:
В качестве статистики критерия мы используем меру, которая чувствительна к отклонениям
от
Поэтому статистика критерия Краскела—Уоллиса равна:
Ясно, что большие значения К должны быть значимы, поэтому критическая область имеет вид
Для выборок небольшого объема существуют таблицы точных критических значений
. Siegel (1956), табл. О, с. 282-283; Owen (1962), табл. 14.2, с. 420—422]. В них предусмотрены случаи, когда
Если почти все
то удобна аппроксимация, которая основана на том, что -11- К имеет распределение
при выполнении
Если среди наблюдений имеются связки, мы вновь припишем соответствующим наблюдениям средние ранги в объединенной совокупности. Малое число связок оказывает малый эффект на статистику критерия К; тем не менее, удовлетворительная коррекция при применении
-аппроксимации состоит в замене К на
где
для случая Т связок по
наблюдений каждая
Пример 14.7.4.
-аппроксимация для процедуры из примера 14.7.3. Здесь
поэтому мы можем применить
-аппроксимацию. Для критерия размера 0,05 мы имеем критическую область вида
Для наших данных
Тем самым наше наблюдение попадает в критическую область, мы отвергаем нулевую гипотезу на
-ном уровне и заключаем, что распределения трех выборок различаются. Заметьте, что снова, используя информацию, содержащуюся в объединенном вариационном ряду, более эффективно, мы пришли к другому заключению по сравнению с выводами, сделанными в разделе 14.7.1.