10.3. ВЛИЯНИЕ ВОЗМОЖНОСТИ УТОЧНЕНИЯ ПО ДАННЫМ НАБЛЮДЕНИЯ АПРИОРНОГО РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ ПАРАМЕТРОВ X НА ТОЧНОСТЬ ИХ ОЦЕНКИ
В приведенных выше примерах предполагалось полное незнание априорного распределения вероятности для параметров к или столь большая его неопределенность, что так или иначе лучшей оценкой является оценка максимального правдоподобия к, построенная совместно с максимально правдоподобными оценками для мешающих параметров а функции правдоподобия. Рассмотрим теперь, как влияет на структуру и точность оценки параметров к возможность уточнения параметров
априорной плотности вероятности
с помощью имеющихся данных наблюдения. Естественно, для того чтобы такое уточнение было
возможно, среди этих данных должны быть такие, которые хотя бы в принципе давали возможность найти оценки неизвестных параметров
Обратимся к самому простому примеру. Пусть задача статистического решения заключается в оценке по совокупности данных наблюдения
параметра X, имеющего нормальное распределение вероятности с математическим ожиданием
и дисперсией
Величины
независимы и нормально распределены с математическим ожиданием X и дисперсией
Пусть наряду с
имеется совокупность наблюденных значений
каждое из которых имеет то же распределение вероятности, что и
Тогда полная совокупность данных наблюдения х есть
а логарифм совместной плотности вероятности
равен
где
— слагаемое, не зависящее от
и
Если параметры
плотности априорного распределения вероятности X известны, то
является функцией только от X и, максимизируя
по X, мы получим оптимальную байесову оценку параметра X при отсутствии априорной неопределенности:
где
— отношение дисперсий
Эта оценка имеет средний квадрат отклонения от истинного значения, равный
Если априорное распределение вероятности X определено только с точностью до неизвестных параметров, то в соответствии с общими правилами адаптивного байесова подхода необходимо проводить совместную оценку X и этих неизвестных параметров. Пусть единственным неизвестным параметром является математическое ожидание
Предположим сначала, что данные наблюдения о значениях
отсутствуют,
Тогда функция
принимает вид
Максимизируя ее по
получаем функцию
совпадающую с логарифмом функции правдоподобия. Это свидетельствует о том, что при отсутствии данных наблюдения, способных повлиять на уточнение параметров априорного распределения вероятности, последнее можно считать полностью неизвестным
Параметрическое задание плотности
в этом случае (при невозможности оценки параметров
не приводит ни к каким улучшениям оценки параметра X по сравнению с оценкой максимального правдоподобия
Последняя получается максимизацией (10.3.8) и имеет вид
а ее отклонение от истинного значения характеризуется дисперсией
Индекс «0» подчеркивает, что эта оценка образована при отсутствии наблюденных значений
Таким образом, наличие априорной неопределенности приводит к проигрышу в точности в
раз. Этот проигрыш может оказаться существенным только в том случае, если
не очень велико, а отношение
достигает больших значений,
априорный разброс значений измеряемого параметра X (величина
не велик по сравнению с апостериорным разбросом (величиной
), полученным в результате оптимального оценивания этого параметра.
Пусть теперь
имеется некоторое количество значений
которые могут быть использованы для уточнения параметров априорного распределения вероятности
Максимизируя функцию
из (10 3 2) по
и X, получаем следующее выражение для оценки параметра X
которое отличается от выражения (10 3.4) для оптимальной байесовой оценки заменой известного значения
его среднеарифметической
оценкой
по совокупности наблюденных значении
и заменой величины
величиной
Дисперсия этой оценки
а проигрыш в точности измерения по отношению к оптимальной байесовой оценке характеризуется отношением
Уже при
величина этого отношения не превосходит двух при каких угодно значениях и
Если наряду с математическим ожиданием
неизвестна и априорная дисперсия
параметра А, то оценка этого параметра по-прежнему определяется по (10.3.12) с заменой
ее оценочным значением
При этом минимально необходимое количество
наблюденных значений
для построения такой оценки равно двум.
Полученные результаты являются подтверждением отмеченных в гл. 2 общих закономерностей, относящихся к влиянию неопределенности априорного распределения вероятности параметров А на точность оценивания этих параметров. Это влияние практически несущественно, если априорный разброс значений А велик по сравнению с апостериорным разбросом, получающимся в результате оптимального оценивания в соответствии с байесовым правилом решения, или, что то же самое, по сравнению с разбросом, получающимся при оценивании методом максимального правдоподобия, т. е. в тех случаях, когда ширина плотности априорного распределения вероятности А велика по сравнение с шириной функции правдоподобия. В этих условиях возможность уточнения параметров априорного распределения вероятности А за счет использования данных наблюдения слабо влияет на точность оценки А (при
оценки
и
имеют одинаковую точность).
Поэтому затраты на получение дополнительных данных наблюдения, необходимых для оценивания параметров априорного распределения вероятности А, и усложнение алгоритмов оценивания А в этих условиях практически не оправданы. Эти дополнительные усилия имеют смысл только в том случае, когда априорный разброс А относительно невелик.