Главная > Статистический анализ данных с пропусками
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

5.2. МЕТОДЫ ВЫЧИСЛЕНИЙ

Задачу вычисления фактически достигаемого уровня значимости для условных перестановочных критериев, рассмотренных выше, можно представить как задачу оценивания среднего конечной совокупности с числом элементов -выборочном случае вместо надо взять где объемы выборок). В самом деле, пусть если для из возможных способов извлечения выборки объема из объединенной выборки, статистика где наблюденное значение статистики в противном случае. Тогда При практическом использовании критерия можно пренебрегать конечностью (в случаях, когда мало, нетрудно точно вычислять с помощью полного перебора), при этом мы приходим к задаче оценивания параметра биномиального распределения.

К сожалению, эффективная схема точного вычисления для статистик типа Смирнова [Черномордик (1980)] не поддается обобщению на многомерный случай, а для критерия омега-квадрат — даже на одномерный случай. Это относится и к другим методам, в которых задачи об однородности к выборок анализируются с помощью модели случайных блужданий, поскольку в многомерном случае трудно установить связь между траекторией блуждания и значением статистики. Естественным (и приемлемым с практической точки зрения) методом является метод статистических испытаний (Монте-Карло), в котором в качестве оценки используется число испытаний, в которых статистика имела значение, не меньшее наблюденного. Точность оценивания естественно характеризовать доверительным интервалом уровня 95%, 99% и т. п. Для его вычисления можно использовать биномиальную аппроксимацию, указанную выше, а при достаточно большом числе испытаний — пуассоновскую аппроксимацию биномиального распределения (для близких к или 1) или нормальную аппроксимацию.

Поскольку с ростом объемов выборок и особенно размерности наблюдений время счета быстро возрастает, целесообразно после одного или нескольких испытаний пересчитывать оценку и соответствующий доверительный интервал и выводить эти величины на экран, чтобы пользователь мог остановить процесс (например, увеличение точности оценки как правило, не имеет смысла, если текущий -ный доверительный интервал для равен (0,3, 0,8)).

Заметим, что прерывание итераций по достижении заданной точности (длины интервала) будет приводить в среднем к оптимистическому доверительному интервалу и к оценке смещенной к

значению либо 1. На практике можно пренебречь этим эффектом, считая, что пользователь, прерывая счет, подвержен воздействию многих внешних факторов, так что выбор точности и момента остановки счета случайны.

Вообще говоря, точность вычисления в методе Монте-Карло не существенна для свойств состоятельности критерия и свободы от распределения и важна, по сути, лишь для его мощности. Это вытекает из следующего утверждения.

Пусть задан уровень значимости Назовем «приближенным критерием уровня а с К испытаниями» критерий, в котором за фактически достигаемый уровень значимости принимается его оценка методом Монте-Карло после К испытаний. (Замечание. Уровень значимости приближенного критерия совпадает с уровнем значимости точного критерия благодаря тому, что несмещенная оценка при любом

Теорема 6. В условиях теоремы 5 приближенные критерии уровня при испытаниях состоятельны.

Теорему 5 можно считать частным случаем этого результата. Она соответствует теореме 6 при (При выборе без возвращения. При выборе с возвращением Обобщение формулировки теоремы 6 для критериев со статистиками (14) — (17) и для других предложений из раздела 5.1 достаточно прозрачно и опускается.

Categories

1
Оглавление
email@scask.ru