5.2. МЕТОДЫ ВЫЧИСЛЕНИЙ
Задачу вычисления фактически достигаемого уровня значимости
для условных перестановочных критериев, рассмотренных выше, можно представить как задачу оценивания среднего конечной совокупности с числом элементов
(в
-выборочном случае вместо
надо взять
где
объемы выборок). В самом деле, пусть
если для
из
возможных способов извлечения выборки объема
из объединенной выборки,
статистика
где
наблюденное значение статистики
в противном случае. Тогда
При практическом использовании критерия можно пренебрегать конечностью
(в случаях, когда
мало, нетрудно точно вычислять
с помощью полного перебора), при этом мы приходим к задаче оценивания параметра
биномиального распределения.
К сожалению, эффективная схема точного вычисления
для статистик типа Смирнова [Черномордик (1980)] не поддается обобщению на многомерный случай, а для критерия омега-квадрат — даже на одномерный случай. Это относится и к другим методам, в которых задачи об однородности к выборок анализируются с помощью модели случайных блужданий, поскольку в многомерном случае трудно установить связь между траекторией блуждания и значением статистики. Естественным (и приемлемым с практической точки зрения) методом является метод статистических испытаний (Монте-Карло), в котором в качестве оценки
используется число испытаний, в которых статистика имела значение, не меньшее наблюденного. Точность оценивания
естественно характеризовать доверительным интервалом уровня 95%, 99% и т. п. Для его вычисления можно использовать биномиальную аппроксимацию, указанную выше, а при достаточно большом числе испытаний — пуассоновскую аппроксимацию биномиального распределения (для
близких к
или 1) или нормальную аппроксимацию.
Поскольку с ростом объемов выборок и особенно размерности наблюдений время счета быстро возрастает, целесообразно после одного или нескольких испытаний пересчитывать оценку
и соответствующий доверительный интервал и выводить эти величины на экран, чтобы пользователь мог остановить процесс (например, увеличение точности оценки
как правило, не имеет смысла, если текущий
-ный доверительный интервал для
равен (0,3, 0,8)).
Заметим, что прерывание итераций по достижении заданной точности (длины интервала) будет приводить в среднем к оптимистическому доверительному интервалу и к оценке
смещенной к
значению
либо 1. На практике можно пренебречь этим эффектом, считая, что пользователь, прерывая счет, подвержен воздействию многих внешних факторов, так что выбор точности и момента остановки счета случайны.
Вообще говоря, точность вычисления
в методе Монте-Карло не существенна для свойств состоятельности критерия и свободы от распределения и важна, по сути, лишь для его мощности. Это вытекает из следующего утверждения.
Пусть задан уровень значимости
Назовем «приближенным критерием уровня а с К испытаниями» критерий, в котором за фактически достигаемый уровень значимости принимается его оценка
методом Монте-Карло после К испытаний. (Замечание. Уровень значимости приближенного критерия совпадает с уровнем значимости точного критерия благодаря тому, что
несмещенная оценка
при любом
Теорема 6. В условиях теоремы 5 приближенные критерии уровня
при
испытаниях состоятельны.
Теорему 5 можно считать частным случаем этого результата. Она соответствует теореме 6 при
(При выборе без возвращения. При выборе с возвращением
Обобщение формулировки теоремы 6 для критериев со статистиками (14) — (17) и для других предложений из раздела 5.1 достаточно прозрачно и опускается.