Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
§ 11.2. Квадратическая функция потерь
Наиболее хорошо изученной функцией потерь в задачах оценивания вещественного параметра является квадратическая функция. Она задается равенством
Функция потерь (1) удобна для математических выкладок. Кроме того, следующие довольно грубые, но весьма полезные и широко используемые соображения показывают, почему эта функция потерь часто оказывается приемлемой.
Следуя замечанию, сделанному в начале § 11.1, предположим, что ущерб зависит лишь от разности Пусть где -неотрицательная дважды дифференцируемая функция и Если разложить в ряд Тейлора с точностью до членов второго порядка, то получим
Если статистик располагает достаточной информацией о значении чтобы выбрать оценку которая со значительной вероятностью будет близка к то члены более высокого порядка в относительно малы и ими можно пренебречь. Тот факт, что означает, что а из неотрицательности следует,
что и Таким образом, соотношение (2) сводится к (1).
Если функция потерь задается равенством (1), то байесовское решение при любом заданном распределении определяется как значение минимизирующее следующее значение риска:
Здесь мы предполагаем, что Элементарный расчет показывает, что квадратический полином от в (3) минимизируется при Далее, при таком выборе минимальное значение риска в соотношении (3) равно
Предположим теперь, что X — наблюдение (которое может быть и случайным вектором) с о. в. п., равной при Как обычно, пусть обозначает априорную апостериорную п. р. в. W при Тогда легко найти байесовскую оценку и байесовский риск для квадратической функции потерь (1). За счет подходящего выбора системы единиц можно считать, что в выражении Для любого наблюденного значения байесовское решение где среднее значение апостериорного распределения Далее, после наблюдения х и выбора оценки риск равен дисперсии апостериорного распределения Поэтому байесовский риск имеет вид
Математическое ожидание в соотношении (5) вычисляется по маргинальной о. в. величины X, задаваемой соотношением
Для расчета байесовского риска удобно использовать соотношение (5) § 3.8.
Мы считали здесь, что существуют все фигурирующие в формулах математические ожидания. Если распределение не сосредоточено в ограниченном интервале, то может случиться, что для некоторых наблюденных значений х апостериорное распределение не имеет среднего. Для такого распределения не существует оценки конечным математическим ожиданием ущерба. Далее, если и существует среднее апостериорного распределения, дисперсия может не существовать. Наконец, даже если эта дисперсия и будет конечной для каждого значения х, байесовский риск, задаваемый выражением (5), может быть бесконечным.
В качестве примера, в котором каждое среднее существует и легко вычисляется, рассмотрим повторную выборку из распределения Пуассона с неизвестным значением среднего Предположим, что априорное распределение есть гамма-распределение с параметрами Из теоремы 1 § 9.4 следует, что апостериорное распределение при это гамма-распределение с параметрами Пусть функция потерь имеет вид (1) с Из выражения (4) § 4.8 для среднего значения гамма-распределения видно, байесовская оценка определяется равенством
Для любых значений дисперсия апостериорного распределения равна
Так как
Поэтому из соотношений (5), (8) и (9) выводим следующую формулу для байесовского риска:
Допустим теперь, что цена одного наблюдения в выборке равна с и что статистик может выбирать объем выборки. Из формулы (10) видно, что для выборки объемом наблюдений общий риск равен
Этот общий риск минимизируется при
Разумеется, число должно быть натуральным числом или нулем. Если значение, даваемое формулой (12), отрицательно, то оптимальный объем выборки В этом случае не нужно делать наблюдений и статистик должен оценивать по априорному распределению. Если значение (12) — положительное, но не
целое число, то оптимальный объем выборки — это одно из ближайших к нему целых чисел.
Как мы видели в гл. 10 (в частности, в упр. 4 к этой главе), нечеткость априорных сведений о находит математическое выражение в том, что в априорном распределении а Когда приближаются к этому пределу, оптимальное значение задаваемое соотношением (12), становится неопределенным, так как оно зависит от отношения . В нашей задаче вреднее априорного распределения таким образом, служит оценкой для в случае отсутствия наблюдений. Таким образом, если статистик имеет незначительные сведения относительно то, как видно из (12), оптимальное число наблюдений приблизительно равно где наилучшая оценка для отсутствии наблюдений. Следует заметить, что в случае нечеткой априорной информации о статистику затруднительно указать точное значение Более удовлетворительный результат можно получить, модифицируя функцию потерь в этой задаче.
Пусть функция потёрь вместо соотношения (1) задается следующим соотношением:
Снова предположим, что априорное распределение есть гамма-распределение с параметрами Тогда (см. упр. 1) для любых значений наблюдений таких, что а байесовская оценка имеет вид
Байесовский риск равен Отсюда видно, что если цена одного наблюдения равна с, то общий риск минимизируется при Поэтому, если с мало, а априорная информация незначительна, то оптимальным числом наблюдений следует считать