§ 8.10. Цена наблюдения
Во многих статистических задачах решения наблюдение случайной величины X связано с определенными затратами, которые должны учитываться статистиком при расчете риска от принятия решающей функции, использующей результаты наблюдения Это обстоятельство играет особенно важную роль в случае, когда статистику надо решить, какую из нескольких случайных величин предпочтительнее наблюдать, или решить, производить ли наблюдения вообще. Пусть с обозначает цену наблюдения
значевия х величины X, если Тогда, если есть о. в. п. случайной величины то средняя цена наблюдения равна
Мы будем предполагать, что для цены с верно предположение о средней полезности. Другими словами, будем считать, что эта цена выражена в соответствующих единицах отрицательной полезности так, что существенным для нас является лишь среднее значение вероятностного распределения цены с
Общим риском от наблюдения X и принятия решающей функции называется сумма риска и средней цены наблюдения Статистик должен выбрать наблюдение X из некоторого класса доступных наблюдению случайных величин и соответствующую байесовскую решающую функцию минимизирующую общий риск.
Выражая общий риск в виде суммы риска решающей функции и средней цены наблюдения, мы неявно используем предположение об аддитивности полезностей статистика. По существу все результаты в теории статистических решений основываются на этом аддитивном представлении общего риска, и мы будем использовать его далее в этой книге, не входя в его обсуждение. Обстоятельный разбор этого вопроса можно найти у Райффы и Шляйфера (1961), гл. 4.
Весьма часто во власти статистика выбрать тот или иной объем случайной выборки, и цена наблюдения зависит лишь от этого объема выборки. Другими словами, цена наблюдения не зависит от значения или от наблюдаемых в действительности значений случайной величины X.
ПРИМЕР 1. Рассмотрим опять пример 1 из § 8.9 и предположим теперь, что цена наблюдения случайной величины X равна с, с Статистик может либо принять решение, не наблюдая X, либо заплатить сумму с и наблюдать X перед принятием решения. При заданном априорном распределении спрашивается, на какую сумму с стоит соглашаться статистику?
Для решения этой задачи надо сравнить минимальное значение риска без учета цены наблюдения с, которое может быть получено на основе наблюдения X, с минимальным риском отвечающим байесовскому решению при отсутствии наблюдений. Функция уже найдена, и ее график приведен на рис. 8.6. Функция согласно таблице 8.2, имеет вид
объема выборки по таблицам биномиального распределения. Для больших значений значение можно вычислить, используя нормальную аппроксимацию биномиального закона (см. Феллер (1957), гл. 7) и таблицы нормального распределения.
Для получения общего риска байесовской решающей функции при выборке объема к риску должна быть добавлена цена выборки
Таблица 8.3 (см. скан) Значения риска при
Оптимальный выборочный объем при априорной вероятности это значение минимизирующее общий риск определяемый формулой
В таблице 8.3 даны некоторые значения риска и общего риска при априорной вероятности равной и цене наблюдения с, равной 0,01. Следует отметить, что риск обязательно убывает с ростом Однако, ввиду того что наблюдения имеют дискретное распределение, общий риск как функция от может иметь незначительные колебания (на фоне общей картины). Из таблицы 8.3 видно, что оптимальный объем выборки в нашей задаче равен 25, а минимальное значение общего риска равно 0,3403.