Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике 13.5. ПРОВЕРКА ГИПОТЕЗ О СРЕДНЕМ ЗНАЧЕНИИ ГАУССОВСКОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ13.5.1. Постановка задачи и априорные данные.Выдвигается гипотеза , что среднее значение гауссовской случайной величины g равно против альтернативы , что этот параметр распределения g равен . Имеется случайная выборка заданного размера , представляющая возможные значения g. Задача состоит в том, чтобы, используя эту выборку, принять или отклонить гипотезу . Так как элементы выборки независимы и подчиняются нормальному закону распределения, то на выборочном пространстве функции правдоподобия [см. (2.66)] (13.65 а) где — дисперсия гауссовской случайной величины. Возможными решениями являются (13.66) Если дисперсия известна, то сформулированная задача представляет проверку простой гипотезы Но против простой альтернативы . Но если проверяются гипотезы о среднем гауссовской величины в условиях параметрической априорной неопределенности и/или если дисперсия представляет неизвестный мешающий параметр, то приходим к более трудным задачам проверки сложных гипотез. 13.5.2. Достаточная статистика.Как было отмечено в п. 3.1.4, достаточной статистикой для проверки простой гипотезы против простой альтернативы является любое монотонное преобразование отношения правдоподобия. Для рассматриваемой задачи проверки простой гипотезы против простой альтернативы из (13.17) и (13.65 а), (13.656) получим (13.67) Так как линейное преобразование — монотонное, то достаточной статистикой будет также (13.68) т. е. среднее арифметическое выборочных значений.
Рис. 13.4. Плотность вероятности исходной случайной величины (а) и достаточной статистики (б) Статистика как линейная функция гауссовских случайных величин подчиняется нормальному закону распределения. Параметры этого распределения при гипотезе Но и альтернативе (13.69) и из условия независимости выборочных значений
Рис. 13.4 иллюстрирует все возрастающую эффективность использования достаточной статистики для различения между гипотезой и альтернативой при увеличении размера выборки. Априорные плотности вероятности случайной величины при гипотезе и альтернативе существенно перекрываются (рис. 13.4, а). Плотности вероятности среднего арифметического выборочных значений заметно различаются, концентрируясь при увеличении размера выборки вблизи средних значений, соответствующих гипотезе и альтернативе (рис. 13.4,б). 13.5.3. Оптимальные алгоритмы.Из результатов, приведенных в § 13.1, следует, что оптимальные дискретно-аналоговые одношаговые алгоритмы принятия решения при проверке простой гипотезы против простой альтернативы состоит в сравнении с порогом достаточной статистики (13.68) (13.71) где порог К определяется выбранным критерием качества. Для байесовского алгоритма, а также для алгоритмов максимальной апостериорной вероятности и максимального правдоподобия (13.72) где константа с для указанных критериев приведена в табл. 1.1. При использовании оптимальных по указанным трем критериям алгоритмов вероятности ошибок первого и второго рода (13.74) где — интеграл Лапласа (функция распределения стандартной гауссовской случайной величины). Подставляя (13.72) в (13.73) и (13.74), получаем (13.75) где (13.77) Формулы (13.75) и (13.76) можно записать иначе, если ввести процентные точки стандартного нормального распределения вероятностей [см. (2.34 а)]: (13.78) откуда следует простое соотношение между вероятностями ошибок первого и второго рода (13.80) которое определяется только величиной , не зависящей от порога. Нетрудно проверить, используя (13.67), что среднее и дисперсия логарифма отношения правдоподобия связаны с величиной простыми соотношениями (13.816) Заметим, что
Подставляя (13.75), (13.76) в (13.22), получаем величину минимального среднего (байесовского) риска (при ) (13.83) Если то формула (13.83) определяет вероятность ошибки любого рода. Для алгоритма максимального правдоподобия из (13.75) и (13.76) следует (13.84) и согласно (13.72) (13.85) Рис. 13.5 иллюстрирует равенство (13.84) и положение порога при использовании алгоритма максимального правдоподобия. В заключение отметим, что согласно (13.75) — (13.77) при т. е. при вероятности ошибок Алгоритмы, обладающие таким асимптотическим свойством, назовем состоятельными. В этом случае плотности вероятности достаточной статистики (13.68) приближаются к дельта-функциям в точках , а порог [см. (13.72)]. 13.5.4. Алгоритм, оптимальный по критерию Неймана—Пирсона.Для критерия Неймана — Пирсона алгоритм принятия решения определяется согласно неравенствам (13.71), но порог К при заданной вероятности а ошибки первого рода определяется из уравнения [см. (13.73)] (13.86) которое можно переписать в виде (13.87) где -процентная точка нормального распределения, определяемая заданной величиной а. Минимальная величина ошибки второго рода (13.88) или
Из (13.88a) следует, что и для рассматриваемого критерия имеет место соотношение (13.80) между вероятностями ошибок первого и второго рода.
Рис. 13.5. Вероятности ошибок (заштрихованные области) Из (13.88) следует также, что при Заметим, что порог К, устанавливаемый в соответствии с (13.87) у не зависит от Кроме того, при (вероятность ошибки первого рода меньше вероятности отвергнуть ложную гипотезу или уровень значимости меньше мощности правила выбора решения). Формула (13.88) допускает и другую интерпретацию: при заданных вероятностях ошибок определяется минимально возможная величина . Это означает, что при заданном существует минимальный размер выборки
при котором возможна проверка гипотез с заданными вероятностями ошибок Если то решение по критерию Неймана — Пирсона принимается при условии
13.5.5. Минимаксный алгоритм.Полагая из (13.27 а) для рассматриваемой задачи проверки простых гипотез о среднем значении гауссовской величины находим следующее уравнение, определяющее наименее благоприятную априорную вероятность гипотезы [см. также (13.83)]
При следует, что При заданном X наименее благоприятная величина ром соответствует максимальному значению . Как видно из рис. 13.6, если потери уменьшаются не очень значительно при фроы, однако при минимаксное правило может показаться чересчур осторожным. Но оно гарантирует, что потери никогда не превысят значения Действительно, если при немного отклониться от наименее благоприятного значения и принять байесовское решение при то средние потери будут уменьшены всего на 20%.
Рис. 13.6. Зависимость байесовского риска от вероятности гипотезы при Если же в действительности рофро, а применяется байесовское решение для то средний риск будет изменяться в зависимости от по линейному закону (касательная в точке к кривой при на рис. 13.6) и при некоторых значениях может значительно превышать , соответствующее минимаксному правилу (см. заштрихованную часть на рис. 13.6). 13.5.6. Оптимальный последовательный алгоритм Вальда.Рассмотрим оптимальный многошаговый дискретно-аналоговый алгоритм проверки простых гипотез о среднем значении гауссовской случайной величины по критерию минимума средних размеров выборки до принятия решения. Из (13.39а-в) следует, что указанный алгоритм предписывает сравнение достаточной статистики логарифма отношения правдоподобия (13.67) с двумя порогами (при ) (13.90) Этот же алгоритм можно записать, используя статистику (13.68): на шаге принимается решение , если (13.91 а) или решение , если (13.916) «ли продолжаются наблюдения, если не выполняется ни одно из неравенств (13.91а,б). Определим средние значения (минимально возможные) размеров выборки до принятия решения. Так как в рассматриваемом случае
— гауссовская случайная величина с известной дисперсией и средними значениями при гипотезе, — при альтернативе, то по формулам (13.46а-б) находим
Подставляя (13.92) в (13.45а,б) получаем
Рис. 13.7. Функция мощности 13.5.7. Проверка простой гипотезы о среднем значении против сложной альтернативы.Предположим, что о неизвестном среднем значении гауссовской случайной величины выдвигается простая гипотеза против сложной альтернативы . Дисперсия при этом предполагается известной. Как отмечалось в п. 13.5.4, оптимальный алгоритм (13.71), (13.87) при условии несмещенный и не зависит от альтернативы. Потому алгоритм, определяемый неравенствами (13.95) является несмещенным равномерно наиболее мощным алгоритмом относительно сложной альтернативы Однако, если проверяется гипотеза против сложной альтернативы причем а может принимать любые действительные значения, то равномерно наиболее мощного правила не существует. Функция мощности для правила (13.95) имеет вид (13.96) где — интеграл Лапласа. При функция мощности монотонно возрастает при увеличении а и . Но если , то , причем функция мощности убывает при уменьшении а (рис. 13.7). Таким образом, если не ограничивать значения параметра а, то правило (13.95) смещенное. Если равномерно несмещенный наиболее мощный алгоритм принятия решения при сложной альтернативе определяется неравенствами (13.97) Можно показать [6], что для альтернативы, включающей все действительные значения параметра а, несмещенный равномерно наиболее мощный алгоритм определяется следующим образом: принимается решение (отклоняется гипотеза ), если
В отличие от алгоритмов (13.95) и (13.97) алгоритм (13.98) двусторонний, так критическая область определяется двумя порогами (при этом критическая область двусвязная). Функция мощности, соответствующая правилу (13.98) (штриховая линия на рис. 13.7), имеет вид (13.99) и достигает минимума при
При всех функция (13.96) превышает (13.99), так как для произвольного . При обе функции совпадают, но при мощность правила (13.95) меньше мощности правила (13.98). Теперь в рассматриваемой задаче используем критерий максимального правдоподобия (13.62) и покажем, что статистика максимального правдоподобия [левая часть (13.62)] представляет монотонную функцию статистики, определяющей алгоритм (13.98). Так как
где , то в соответствии с (13.62)
или (13.100) Из (13.98) и (13.100) следует, что алгоритм максимального правдоподобия, определяемый неравенствами (13.101) является несмещенным РНМ алгоритмом при проверке простой гипотезы против сложной альтернативы афао. 13.5.8. Несмещенный РНМ алгоритм проверки простой гипотезы о среднем против сложной альтернативы при неизвестной дисперсии.Необходимо проверить гипотезу Н о том, что выборка принадлежит нормальному распределению со средним и неизвестной дисперсией против сложной альтернативы К, что эта выборка принадлежит нормальному распределению со средним и неизвестной дисперсией . В этой задаче неизвестная дисперсия является мешающим параметром. Рассмотрим статистику (13.102) Для гипотезы , т. е. при независимых нормально распределенных выборочных значениях с параметрами эта статистика распределена по закону Стьюдента с степенью свободы. Плотность вероятности для распределения Стьюдента (13.103) Обозначения t и приняты в статистике для случайной величины (13.102) и ее плотности вероятности. Можно показать (см., например, [41]; гл. 3), что при несмещенным равномерно наиболее мощным является такое правило, при котором критическая область определяется неравенством (13.104) где - процентная точка распределения Стьюдента, т. е. отклоняется гипотеза Н о том, что среднее равно при неизвестной дисперсии, если (13.105) Сравнивая правило (13.105) с аналогичным правилом (13.95) для проверки простой гипотезы о среднем против сложной альтернативы, когда дисперсия известна, замечаем: в (13.105) неизвестная дисперсия представлена выражением в квадратных скобках, а процентная точка нормального распределения заменена процентной точкой распределения Стьюдента. Если выборочные значения независимы, распределены нормально, но , то статистика подчиняется нецентральному распределению Стьюдента
где (13.107) — параметр при совпадающий с параметром определенным согласно (13.77). Используя (13.106), запишем выражение вероятности ошибки второго рода при использовании правила (13.105): (13.108) Если , то равномерно наиболее мощное правило проверки сложной гипотезы о том, что среднее равно при неизвестной дисперсии, определяет критическую область неравенством с (13.97)] (13.109) В этом случае, когда альтернатива содержит все действительные значения а, равномерно наиболее мощного правила не существует. Но аналогично (13.98) правило, согласно которому гипотеза Н отвергается, если (13.110) является наиболее мощным несмещенным правилом с заданной вероятностью а ошибки первого рода. При этом вероятность ошибки второго рода (13.111) 13.5.9. Алгоритм максимального правдоподобия проверки гипотез о среднем значении при неизвестной дисперсии.Рассмотрим ту же задачу, что и в п. 13.5.8, но используем критерий максимального правдоподобия. Покажем, что в рассматриваемом случае статистика максимального правдоподобия [см. левую часть (13.62)] представляет монотонную функцию статистики Стьюдента (13.102). Максимум функции (13.112) по двум переменным а и достигается при значениях этих параметров, удовлетворяющих системе уравнений
откуда находим экстремальные значения параметров а и (13.113) Подставляя (13.113), (13.114) в (13.112), находим (13.115) Аналогично (13.116) где
Тогда в соответствии с (13.62) (13.118) Но из (13.102), следует, что (13.119) Из (13.110) и (13.119) следует, что алгоритм максимального правдоподобия, определяемый неравенством (13.120) является несмещенным РНМ алгоритмом проверки простой гипотезы против сложной альтернативы при неизвестной дисперсии
|
1 |
Оглавление
|