14.2.2. КРИТЕРИЙ СМИРНОВА. ДВЕ ВЫБОРКИ
Критерий Смирнова для двух выборок также использует понятие эмпирической функции распределения. Но в этом случае нас интересует, являются ли две независимые выборки наблюдений выборками из одного и того же распределения. Точнее говоря, имеется случайная выборка
из совокупности с непрерывной функцией распределения
и независимая случайная выборка
из совокупности с непрерывной функцией распределения
Мы хотим проверить гипотезу
против
Заметим, что мы не уточняем, какова на самом деле общая форма
По двум выборкам можно определить две эмпирические функции распределения
. В двувыборочном критерии Смирнова используется статистика
которая является наибольшим отклонением между двумя эмпирическими функциями распределения. Случайная величина
зависит от
через
и от
Если выполняется
то можно ожидать, что эмпирические функции распределения будут «далеки». Так что в качестве критической области размера а мы можем взять
где снова
— константа, выбранная так, что
Точное выборочное распределение
при выполнении
известно.
Его таблицы содержатся в
— табл. L, с. 278], для
— в
табл. 15.4, с.
а для
— в [Massey (1952)].
Снова распределение не зависит от общей формы
и
в
Для больших
(больше 40) для определения
можно использовать следующие аппроксимации:
Пример 14.2.3. Двувыборочный критерий Смирнова. Предположим, что мы получили две независимые выборки из двух совокупностей:
На рис. 14.2.4 показаны обе эмпирические функции распределения
Можно видеть, что
Рис. 14.2.4. Эмпирические функции распределения
для примера 14.2.3
Найдем из таблиц [Massey (1952)], что для критерия при 5%-ном уровне значимости
критическая область имеет вид
Наблюдаемое значение
не попадает в критическую область. Поэтому наш уровень значимости превышает 5% и данные можно считать согласующимися с гипотезой
что две совокупности имеют одно и то же распределение.