5.2. МЕТОДЫ ВЫЧИСЛЕНИЙ
Задачу вычисления фактически достигаемого уровня значимости для условных перестановочных критериев, рассмотренных выше, можно представить как задачу оценивания среднего конечной совокупности с числом элементов (в -выборочном случае вместо надо взять где объемы выборок). В самом деле, пусть если для из возможных способов извлечения выборки объема из объединенной выборки, статистика где наблюденное значение статистики в противном случае. Тогда При практическом использовании критерия можно пренебрегать конечностью (в случаях, когда мало, нетрудно точно вычислять с помощью полного перебора), при этом мы приходим к задаче оценивания параметра биномиального распределения.
К сожалению, эффективная схема точного вычисления для статистик типа Смирнова [Черномордик (1980)] не поддается обобщению на многомерный случай, а для критерия омега-квадрат — даже на одномерный случай. Это относится и к другим методам, в которых задачи об однородности к выборок анализируются с помощью модели случайных блужданий, поскольку в многомерном случае трудно установить связь между траекторией блуждания и значением статистики. Естественным (и приемлемым с практической точки зрения) методом является метод статистических испытаний (Монте-Карло), в котором в качестве оценки используется число испытаний, в которых статистика имела значение, не меньшее наблюденного. Точность оценивания естественно характеризовать доверительным интервалом уровня 95%, 99% и т. п. Для его вычисления можно использовать биномиальную аппроксимацию, указанную выше, а при достаточно большом числе испытаний — пуассоновскую аппроксимацию биномиального распределения (для близких к или 1) или нормальную аппроксимацию.
Поскольку с ростом объемов выборок и особенно размерности наблюдений время счета быстро возрастает, целесообразно после одного или нескольких испытаний пересчитывать оценку и соответствующий доверительный интервал и выводить эти величины на экран, чтобы пользователь мог остановить процесс (например, увеличение точности оценки как правило, не имеет смысла, если текущий -ный доверительный интервал для равен (0,3, 0,8)).
Заметим, что прерывание итераций по достижении заданной точности (длины интервала) будет приводить в среднем к оптимистическому доверительному интервалу и к оценке смещенной к
значению либо 1. На практике можно пренебречь этим эффектом, считая, что пользователь, прерывая счет, подвержен воздействию многих внешних факторов, так что выбор точности и момента остановки счета случайны.
Вообще говоря, точность вычисления в методе Монте-Карло не существенна для свойств состоятельности критерия и свободы от распределения и важна, по сути, лишь для его мощности. Это вытекает из следующего утверждения.
Пусть задан уровень значимости Назовем «приближенным критерием уровня а с К испытаниями» критерий, в котором за фактически достигаемый уровень значимости принимается его оценка методом Монте-Карло после К испытаний. (Замечание. Уровень значимости приближенного критерия совпадает с уровнем значимости точного критерия благодаря тому, что несмещенная оценка при любом
Теорема 6. В условиях теоремы 5 приближенные критерии уровня при испытаниях состоятельны.
Теорему 5 можно считать частным случаем этого результата. Она соответствует теореме 6 при (При выборе без возвращения. При выборе с возвращением Обобщение формулировки теоремы 6 для критериев со статистиками (14) — (17) и для других предложений из раздела 5.1 достаточно прозрачно и опускается.