Главная > Справочник по прикладной статистике. Том 1
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

5.3. КРИТЕРИИ ДЛЯ ПРОВЕРКИ ГИПОТЕЗ

Главное требование к качеству критерия состоит в том, чтобы он по возможности не отвергал истинную гипотезу, но зато с большой вероятностью отвергал бы ложную. До сих пор мы интуитивно верили, что наши критерии именно так и ведут себя. В этом разделе обсуждается объективное обоснование процедуры и уточняется, в каком смысле можно говорить, что один критерий превосходит другой.

5.3.1. ФУНКЦИЯ ЧУВСТВИТЕЛЬНОСТИ

Чтобы не усложнять изложение материала математическими подробностями, сосредоточим внимание на простой ситуации, когда имеется вектор независимых наблюдений распределенной нормально с параметрами случайной величины, для которой проверяется нулевая гипотеза

против односторонней альтернативы . В этом примере возьмем среднее выборки в качестве статистики критерия, а областью значимости будет служить совокупность возможных значений среднего выборки, превышающих наше значение

где вектор х представляет выборку. Уровень значимости (скажем, статистики как и в (5.2.4), равен

Здесь X обозначает случайную величину, индуцированную выборочным средним; она нормально распределена с параметрами где , а при . В результате получаем

где Ф, как обычно, обозначает функцию стандартного нормального распределения [см. II, раздел 11.4.1]. Этот уровень значимости полностью определяется статистикой поэтому и сам он оказывается статистикой; мы подчеркнем это обстоятельство, называя его при необходимости статистикой уровня значимости. Сама же статистика представляет собой реализацию случайной величины уровня значимости

Нелишне отметить, что хотя уровень значимости статистики по определению равен вероятности, вычисленной в предположении справедливости нулевой гипотезы

[см. (5.3.3)], выборочное распределение т. е. распределение зависит от истинного (неизвестного) значения (скажем, ) математического ожидания Это распределение (посредством функции распределения) определяется как

Когда т. е. верна нулевая гипотеза, имеем

(так как при распределена по стандартному нормальному закону)

Таким образом, когда верна гипотеза уровень значимости имеет равномерное на выборочное распределение, а вероятность получить малое значение уровня значимости (скажем, меньше 0,01) соответственно мала (для приведенного выше примера — это один шанс из ста). Тем самым шанс отклонить гипотезу когда она на самом деле верна, очень мал.

Таким образом, критерий описанного типа удовлетворяет первому из сформулированных в начале раздела 5.3 условий. Что же можно сказать о втором условии, т. е. будет ли критерий с высокой вероятностью отклонять ложную гипотезу? Чтобы ответить на этот вопрос, вычислим выборочное распределение уровня значимости для неопределенного значения . Вероятность того, что уровень значимости окажется не больше когда истинная величина равна — это

(так как функция Ф монотонно возрастает)

поскольку подчиняется стандартному нормальному распределению.

Чтобы интерпретировать это, полезно рассмотреть значения при фиксированной величине (скажем, и всех возможных допустимых значениях . (В «одностороннем» примере допустимые значения — только неотрицательные.) Для выбранного фиксированного значения уровня значимости среднего выборки имеем нормальна с параметрами (где — объем выборки)

а значение . определенное формулой (5.3.7), сводится к

причем в силу (5.3.6)

Ниже будет показано, что значения функции измеряют, в какой степени процедура проверки, гипотез позволяет обнаружить отклонения от гипотетического нулевого значения (т. е. различать значения параметра ). По этой причине называется функцией чувствительности критерия. (На самом деле численно она совпадает с функцией мощности в теории Неймана—Пирсона проверки гипотез [см. раздел 5.10], но интерпретируется несколько иначе.)

Предположим, что нормальная выборка объема привела к среднему выборки Известно, что исходное распределение

имело единичную дисперсию. Ожидаемое значение — это неизвестный параметр, равный согласно нулевой гипотезе . Уровень значимости выборки при такой гипотезе составляет нормально распределена с параметрами

(так как

Вот некоторые из вычисленных по формуле (5.3.8) типичных значений функции

Возникают следующие вопросы:

1) Значение равно уровню значимости 0,02. Это «малая» величина. Ее смысл таков: если бы нулевая гипотеза была верна (т. е. истинное значение было бы , то вероятность получения уровня значимости 0,02 или менее была бы в точности равна 0,02. Эквивалентно это можно выразить, сказав, что вероятность получить сильные доводы против (силы 0,98) мала (фактически равна 0,02). При процедуре проверки невероятно получить сильные доводы против верной гипотезы.

2) . Это вероятность (весьма высокая) получить уровень значимости 0,02, когда нулевая гипотеза далека от истины тогда как гипотеза утверждает, что Уровень значимости 0,02 можно считать сильным доводом против гипотезы . Таким образом, видно, что критерий почти наверное обеспечивает сильные доводы против когда далека от истины.

3) То же относится, хотя и в меньшей степени, к ситуации, возникающей, когда неверна, но ближе к истине, чем в например, при

4) Когда еще ближе к истине, например, если процедура приобретает некоторую неопределенность, поскольку только (грубо говоря) в 40% случаев она обеспечивает доводы против силы 0,98 и, конечно, в 60% случаев таких доводов не будет.

Понятно, что критерий, который в большом числе случаев обеспечивает сильный довод против «только слегка ложных» гипотез и при котором невозможно получить сильные доводы против заведомо истинной гипотезы, будет чувствительным при различении близких к нулю значений 0. Тем самым функцию можно назвать функцией чувствительности критерия.

Рис. 5.3.1. Функции чувствительности для одностороннего критерия

Однако не все критерии одинаково чувствительны. Это можно показать с помощью критерия, статистика которого представляет собой среднее (скажем, первого и последнего наблюдений в выборке без учета остальных наблюдений. Ясно, что этот критерий будет обладать теми же свойствами, что и основанный на среднем выборки критерий из предыдущего примера, когда объем выборки Следовательно, его функция чувствительности в силу (5.3.8) равна

Для того же, что и в (5.3.9), уровня значимости ниже приведены значения функции

Этот критерий имеет тот же уровень значимости 0,02, что и критерий, основанный на выборке объема 20, функция чувствительности которого табулирована в (5.3.9). Но значения меньше соответствующих значений Это показывает, что для любых положительных в, какова бы ни была степень ложности гипотезы, более правдоподобно, что она будет отклонена первым критерием, а не вторым (при котором используется лишь часть данных). Аналогичные результаты справедливы и для других уровней значимости (Тот факт, что при отрицательных в, не относится к делу, поскольку односторонний критерий допускает лишь положительные конкурирующие

значения параметра в.) Вид функций чувствительности при фиксированной для обоих критериев общей величине уровня значимости представлен на рис. 5.3.1. Функция чувствительности критерия при принимает те же значения (но имеет иную интерпретацию), что и функция мощности критерия уровня в теории Неймана—Пирсона [см. раздел 5.10].

1
Оглавление
email@scask.ru