14.2.1. КРИТЕРИЙ КОЛМОГОРОВА. ОДНА ВЫБОРКА
Предположим, что мы хотим проверить простую гипотезу, что определенная непрерывная функция является функцией распределения, из которого получена случайная выборка Таким образом, мы хотим проверить гипотезу
против альтернативы
В одновыборочном критерии Колмогорова используется статистика
Рис. 14.2.2. Эмпирическая функция распределения для примера 14.2.1 и определенная
т. е. самое большое отличие эмпирической функции распределения от определенной функции распределения. На рис. 14.2.2 показано, например, значение для данных из примера 14.2.1, если такая, как изображено.
Статистикой критерия является значение случайной величины которая зависит от через Она дает меру того, как далека от Ясно, что большие значения заставят нас усомниться в Ни так как тогда существенно отличается от хотя бы для некоторых значений Поэтому в качестве критической области возьмем [см. раздел 5.12.2] множество
где — константа, выбранная таким образом, что Вычисление на первый взгляд представляется безнадежной задачей для столь общего непараметрического подхода. На самом же деле с помощью простых теоретико-вероятностных рассуждений, включающих преобразование интеграла веррятностей [см. II, теорема 10.7.2.], можно получить замечательный результат, состоящий в том, что при выполнении нулевой гипотезы имеет распределение, которое зависит только от объема выборки и не зависит от вида распределения Другими словами, у нас есть метод, свободный от распределения, так как, чтобы определить нужно только указать для определенного уровня значимости а, положив для заданных мы получим одно и то же значение каково бы ни было распределение — равномерное, нормальное, гамма- или любое другое.
Критические значения для точного распределения при выполнении гипотезы были вычислены для различных значений [см., например, Siegel (1956), с. 251 или Owen (1962), табл. 15.1, с. 423-425-G].
Аппроксимация критических значений, которая хороша для
35, приводит к следующим результатам:
Пример 14.2.2. Критерий Колмогорова. Предположим, мы хотим проверить гипотезу, что шесть наблюдений в примере 14.2.1 образуют случайную выборку из распределения Другими словами,
— функция распределения нормальной случайной величины, как это изображено на рис. 14.2.2. Мы можем тогда определить графически либо аналитически следующим образом. Сначала отметим, что значение должно появиться в точке соответствующей одной из наблюдаемых величин. Затем пары величин показанных на рис. 14.2.3, вычисляются для каждого такого значения. Они приведены в табл. 14.2.1. В третьем столбце содержатся значения , где — функция стандартного нормального распределения [см. приложение 3].
Таблица 14.2.1. (см. скан) Вычисление в примере 14.2.2
Рис. 14.2.3. Разности и
Из таблиц, упоминавшихся выше, мы найдем, что для критерия с 5%-ным уровнем значимости и критическая область имеет вид
Из табл. 14.2.1 получаем Наше множество наблюдений не попадает в эту критическую область. Поскольку уровень значимости больше, чем 5%, можно считать, что данные не противоречат гипотезе о том, что они подчиняются распределению
Следует заметить, что подобные задачи можно было бы решать с помощью критерия согласия [см. раздел 7.4]. Потенциальное преимущество критерия Колмогорова в том, что он не группирует данные (с обязательной потерей информации), а дает возможность рассматривать индивидуальные наблюдаемые значения. Его также можно успешно применять для малых выборок. Считается, что его мощность, вообще говоря, выше, чем у критерия
Вопрос о том, можно ли обобщить критерии на случай сложной нулевой гипотезы, которая не полностью определена (например, предположим, что в примере относится к распределению с неизвестным ), остается открытым.