6.5.1. Случай одинаковой совокупности параметров y при разных значениях X
Вернемся к детализации правила решения
из (6.5.10) и об суждению его взаимосвязи с адаптивным байесовым правилом решения. Рассмотрим сначала распространенный случай, когда для всех значений X совокупности параметров
одинаковы и совпадают с полной совокупностью у. При этом
где
решение уравнения правдоподобия (6.5.4), вообще говоря, разное при разных значениях
Однако постольку поскольку величины
представляют собой оценки одних и тех же параметров
истинные значения которых не изменяются при изменении X, то в случае состоятельности этих оценок (напомним, что решение уравнения правдоподобия удовлетворяет требованию состоятельности) и близости их к истинным значениям у величины
слабо зависят от X и не могут отличаться сильно друг от друга при разных значениях
Возможные отличияухпри
где
любые два значения X обусловлены только случайным отклонением этих оценок от истинного значения у одинакового при
Эти случайные отклонения характеризуются матрицей
из (6.5.6), которая представляет собой асимптотическую апостериорную корреляционную матрицу для величин отклонений
и вообще говоря, зависит от А. Однако если функция
изменяется медленно, так что выполняется второе из неравенств (6.5.7), то величина
из (6.5.13) практически не зависит от X (зависит значительно слабее, чем любая другая функция А, входящая в подынтегральное выражение (6.5.8)). Благодаря этому ее можно сократить в числителе и знаменателе (6.5.8) или, что то же самое в данном случае, определить функцию
входящую в (6.5.8), следующим образом:
Получающееся с учетом равенства (6.5.14) упрощение для выражения апостериорного риска (6.5.8) является весьма существенным.
Оказывается, что при одинаковой для всех значений X совокупности параметров у и при выполнении единственного условия плавности изменения функции
количественно это условие задается неравенством (6.5.7), апостериорный риск и правило решения
вообще не зависят от
Само оптимальное решение находится минимизацией выражения (6.5.8) при подстановке в него функции
из (6.5.14).
Рассматриваемый здесь случай одинаковой для разных X совокупности неизвестных параметров
может иметь место как при дискретном, так и при непрерывном множестве значений
Для непрерывного множества значений X этот случай наиболее характерен; более того, трудно представить себе не слишком искусственный пример, когда плотность вероятности
Для разных значений X из непрерывного множества значений зависит от разных совокупностей параметров у (например,
и
при
Для непрерывного множества значений X процедуру нахождения правила решения
соответствующего минимуму усредненного риска, можно детализировать дальше и, кроме того, можно показать, что получающееся при этом правило решения совпадает асимптотически с адаптивным байесовым правилом решения, полученным выше.
Воспользуемся для этого асимптотическим приближением (6.3.2) для функции
из которого следует, что входящие в выражение (6.5.8) для апостериорного риска функции
определяются следующими выражениями:
где
является решением уравнения (6.3.3), а матрицы
определяются выражениями (6.3.4) и зависят
только от х (непосредственно и через
совместно с X является решением уравнения (6.3.3)). С учетом (6.5.15), (6.5.16) выражение для апостериорного риска (6.5.8) принимает вид
из которого следует, что решение
зависит от х посредством достаточной статистики
оценки параметра X, определяемой из уравнения (6.3.3).
Если множество решений и имеет ту же структуру, что и множество X, и функция потерь
является симметричной функцией разности
то решение
просто совпадает с
т. е. получается точно таким же, Как адаптивное байесово решение.
При произвольной структуре множества решений и оценка апостериорного риска (6.5.17), получающаяся с использованием принципа усреднения по неизвестным параметрам у среднего риска, отличается от оценки апостериорного риска (6.2.5), получающейся при адаптивном байесовом подходе с использованием оценки максимального правдоподобия у Для параметров у, только за счет различия матриц
и Первая из них фигурирует в выражении (6.5.17), дающем оценку апостериорного риска при использовании принципа усреднения, а вторая — в выражениях типа (6.2.3), (6.3 5) при подстановке в них
в соответствии с принципами адаптивного байесова подхода.
Таким образом, используемые в обоих случаях приближения для апостериорной плотности вероятности X, с помощью которых вычисляются оценки апостериорного риска и находятся минимизирующие этот риск решения, имеют одинаковый функциональный вид, одинаковое математическое ожидание X и несколько отличные матрицы вторых моментов. Естественно, что для всех задач (характеризуемых структурой множества решений
и видом функции потерь
в которых подобно задаче с функцией потерь, являющейся симметричной функцией разности
вид решения зависит только от апостериорного математического ожидания, принцип усреднения риска по у дает точно такое же правило решения, как и адаптивный байесов подход. В тех задачах, в которых решение и
зависит не только от апостериорного математического ожидания
оно может несколько отличаться от адаптивного байесова решения. Однако из-за асимптотической близости матриц
имеющейся, как мы убедимся в дальнейшем, практически всегда, эти различия малосущественны, и во всех реальных случаях, когда совокупность неизвестных параметров у не зависит от X, правило решения, минимизирующее усредненный по неизвестным параметрам у риск, совпадает с адаптивным байесовым правилом решения.