14.8. РАНДОМИЗИРОВАННЫЕ КРИТЕРИИ
В критериях, обсуждаемых в разделах 14.3-14.7, мы учитывали информацию, содержащуюся в выборочных данных, предварительно преобразовав ее в ранги. Поскольку при этом не были использованы настоящие значения, мы, возможно, что-то теряли в эффективности.
Рандомизированные критерии [см. раздел 5.7] — это непараметрические правила, основанные на настоящих наблюдаемых (численных) значениях и их случайной природе. Они полезны для малых выборок, но могут стать очень громоздкими при увеличении объемов выборок [см. пример 5.7.1]. Уже знакомые нам критерии знаковых рангов Уилкоксона [см. раздел 14.4.2] и критерий Уилкоксона—Манна—Уитни [см. раздел 14.6.2] можно рассматривать как примеры рандомизированных критериев, основанных на рангах. Проиллюстрируем лежащие в основе рандомизированных критериев идеи на двувыборочной ситуации. Детали применений в других случаях можно найти, например, в книгах [Siegel (1956), с. 88, 152; Silvey (1975), с. 148—150, С].
Пример 14.8.1. Рандомизированный критерий для двух выборок. Предположим, что мы хотим сравнить эффекты двух обработок I и
II на 8 экспериментальных единицах. Назначим случайным образом
единицам обработку I, а оставшимся
единицам — обработку II:
Проверим гипотезу
что различие между обработками несущественно против альтернативы
что обработка II дает более высокие результаты. При справедливости гипотезы
мы получили бы 8 результатов, приведенных выше, как бы мы ни назначили обработки. Фактически имеется
различных возможных группировок в два множества по 4 элемента. При случайном назначении все возможные группировки равновероятны, и поэтому каждая из них имеет вероятность
Если
— сумма откликов, полученных при обработке II, то относительно большие значения
заставят нас сомневаться в справедливости нулевой гипотезы. Поэтому возьмем критическую область вида
или вычислим вероятность получения столь же высокого результата или еще более высокого, чем тот, что мы наблюдаем.
Здесь
и достигаемый уровень значимости равен
Существует 6 способов наблюдать
Поэтому достигаемый уровень значимости равен:
Эта относительно высокая вероятность указывает, что данные не противоречат нулевой гипотезе об отсутствии различия между обработками.
Очевидно, что для больших
эта процедура станет более трудоемкой. В работе [Siegel (1956), с. 154] обсуждается приближенное решение. Альтернативно можно использовать с удовлетворительными результатами критерий Уилкоксона—Манна—Уитни и аппроксимацию для него.