§ 4.2. БАЙЕСОВСКИЕ ОЦЕНКИ СЛУЧАЙНЫХ ПАРАМЕТРОВ СИГНАЛОВ
Предположим, что сигнал не содержит никаких мешающих параметров, т. е. что все его неизвестные параметры являются информационными и, следовательно, подлежат измерению. При этом сигнал оказывается вполне детерминированной функцией аргумента
и измеряемых параметров
и в его записи
символ
не участвует.
Пусть постоянный в течение времени наблюдения информационный параметр является векторной случайной величиной
, априорная
-мерная ПВ которой
известна. Напомним, что эта ПВ не связана с наблюдаемой реализацией
и показывает лишь, с какой частотой следует ожидать появления сигнала
с теми или иными значениями параметра
.
Как указывалось, задача измерителя состоит в том, чтобы по наблюдению
измерить (оценить) векторный параметр
. Отметим, что термин «оценка» в литературе используется двояко: им называют и саму процедуру измерения, и ее результат
, т. е. измеренное значение
выдаваемое в качестве решения. Уточним, как следует формировать оценку
, чтобы последствия ее расхождения с истинным значением
были минимальны. При этом ограничимся изучением лишь нерандомизированных (детерминированных) правил оценки, согласно которым
однозначно определяется видом наблюдаемого колебания
:
где
- детерминированный оператор, отображающий множество реализаций
в
-мерное пространство оценок
. Таким образом, формулирование оптимального в некотором смысле правила оценки
состоит в отыскании подходящего оператора
.
Чтобы проследить общность задачи оценки параметра сигнала с ранее изученными, допустим, что
принимает лишь дискретные значения из конечного множества
мощности М. Тогда оценить параметр
— значит указать, какой из М возможных детерминированных сигналов
присутствует в
. Следовательно, оценка дискретного параметра
есть просто различение М сигналов, и потому для отыскания оптимального правила (4.2) можно воспользоваться уже освоенным аппаратом гл. 2. Если формулу (2.1) переписать как
и под
понимать априорную вероятность выпадения значения
параметра
, т. e. появления сигнала
, под
- условную вероятность выдачи в качестве оценки
значения
при условии, что в сигнале, содержащемся в
, параметр
, а под
- плату (штраф, риск, ущерб) за несовпадение измеренного значения
с истинным
, то оператор в (4.2), минимизирующий сумму (4.3), обеспечит получение оценок, оптимальных по минимуму среднего риска
. Такие оценки называют байесовскими.
Перейдем к оценке непрерывного случайного параметра
, принимающего значения из континуального множества. При этом, как легко понять, речь вновь идет о различении сигналов, с той лишь разницей, что последние образуют не конечное множество, а континуум. Действительно, измерить параметр
- значит по-прежнему указать, какой именно из возможных сигналов
, отличающихся друг от друга значением
, присутствует в
. Очевидно, можно приспособить критерий (4.3) и к этому случаю, осуществив предельный переход от дискретных переменных к непрерывным и трактуя сумму (4.3) как интегральную. Для этого введем функцию потерь
, показывающую, какой платой (штрафом, риском, ущербом) оборачивается несовпадение оценки
с истинным значением параметра
. Пусть также
- условная
-мерная ПВ оценки
при условии, что истинным является значение оцениваемого параметра, равное
. Тогда при предельном переходе
следует заменить на
а
- на
, что приведет к выражению для среднего риска
Очевидно, теперь оптимальной (байесовской) оценкой следует считать ту, которая минимизирует средний риск (4.4).
Попытаемся выяснить, что собой представляют байесовские оценки параметров детерминированных сигналов. При этом не нужно отдельно рассматривать случаи непрерывных и дискретных параметров, поскольку для последних можно воспользоваться представлением ПВ в виде суммы взвешенных
-функций:
Подстановка этих выражений в равенство (4.4) с учетом фильтрующего свойства
-функции преобразует его в выражение (4.3).
Согласно теореме умножения вероятностей для случайных величин,
, где
— безусловная ПВ оценки
— условная ПB случайной величины
при условии, что оценкой является значение
. Тогда в соответствии с (4.4)
(4.5)
Внутренний интеграл можно записать и как
(4.6)
поскольку соотношение (4.2) связывает оценку
с видом наблюдаемого колебания
и, следовательно, условная ПВ
. Величина
является условным математическим ожиданием функции потерь
, вычисленным для фиксированной реализации
усреднением по всем возможным значениям случайного параметра
; как и дискретный аналог из § 2.2,
называют условным средним риском. Как видно, оценка, для которой условный средний риск минимален для любой заданной реализации
, минимизирует и безусловный средний риск (4.5). Поэтому байесовские оценки можно отыскивать из условия минимума выражения (4.6).
Предварим дальнейшие рассуждения следующим важным определением. Входящую в выражение (4.6) условную
-мерную ПВ
характеризующую частоту выпадения тех или иных значений
для заданной реализации (4.1), называют апостериорной (послеопытной), чем подчеркивается тот факт, что вероятностные свойства
описываются
с учетом всех сведений о
, имеющихся в
. Отличие апостериорной ПВ от априорной характеризует тот прирост информации о
, который обусловлен наблюдением
. В измерительных системах, работающих при заметном превышении энергией сигнала интенсивности помех, кривая апостериорной ПВ всегда значительно острее кривой априорной ПВ. Пусть, например, импульсом вида, показанного на рис. 4.1,а, ведется радиолокационное зондирование цели для определения дальности до нес
посредством измерения времени запаздывания отраженного от цели сигнала
(скорость света). Априори известно, что дальность D может с равной вероятностью принимать любое значение из интервала
. Тогда априорная ПВ запаздывания (рис.4.1,б)
Рис.4.1.
где
. После приема колебания, представленного на рис. 4.1, в, наблюдатель вправе заключить, что истинное время запаздывания, вероятнее всего, близко к
, ибо маловероятно, что помеха дала похожий на сигнал всплеск в момент
, «задавив» подлинный отраженный от цели импульс, находящийся где-то в стороне. Когда помеха отсутствует, апостериорная ПВ имеет вид
-функции, так как реализация
содержит исчерпывающую информацию
дает возможность точно измерить время запаздывания. Наличие помехи не позволяет точно определить время запаздывания, и поэтому его апостериорная ПВ
«размывается» (рис. 4.1, г).
Очевидно, чем более полога ПВ
тем меньшего доверия заслуживает информация о
, получаемая из
. При высокой точности измерений кривая
почти для все реализаций
имеет острый пик, расположенный в окрестности истинного значения
.
Понятие апостериорной ПВ (апостериорного распределения) играет существенную роль во всей теории байесовских оценок.
Перейдем непосредственно к выводу правил байесовской оценки параметров сигнала. Для их конкретизации следует прежде всего выбрать определенную функцию потерь
. Этот, казалось бы, ответственный шаг, не поддающийся полной формализации, должен учитывать как степень адекватности избранного критерия
реальному представлению о качестве функционирования данной системы, так и сложность реализации соответствующего правила. На практике же, как будет видно из дальнейшего, при высоких требуемых точностях измерения оптимальные оценки мало критичны к виду функции потерь. Рассмотрим две наиболее часто упоминаемые в литературе разновидности функции потерь.
1. Квадратичная функция потерь представляет собой квадратичную
относительно отклонения (ошибки, невязки)
оценки
от истинного значения параметра
:
где В — любая положительно определенная
-матрица. Напомним, что матрицу В называют положительно определенной, если скаляр
(квадратичная форма) положителен для любых ненулевых r-мерных вектор-столбцов
. При оценке скалярного параметра
,
квадратичная функция потерь
, где
, т. е. является параболой (рис. 4.2, а). В общем случае
уравнение (4.7) задает
-мерный параболоид. Подставив выражение (4.7) в (4.6), найдем
Продифференцировав правую часть этого выражения по
и приравняв результат нулю, с учетом невырожденности матрицы В независимо от конкретного вида последней для оптимальной оценки
получим
где
— апостериорное математическое ожидание векторного параметра
. Из равенства (4.8) видно, что байесовская оценка при квадратичной функции потерь есть апостериорное среднее измеряемого параметра. Расписав результат (4.8) для отдельных компонентов
(скалярных параметров
, образующих
, с учетом условия согласованности многомерных ПВ (формулы полной вероятности для случайных величин)
придем к результату
(4.9)
Таким образом, байесовская оценка
-го параметра
есть его апостериорное среднее, т. е. математическое ожидание, вычисленное на основании апостериорной ПВ содержащей всю информацию о
, извлеченную из
.
Рис.4.2
Байесовскую оценку (4.8), (4.9) называют также оценкой по центру тяжести, ибо
- центр тяжести апостериорного распределения
[при более строгой терминологии — абсцисса центра тяжести плоской фигуры, ограниченной кривой
и осью
]. Отметим, что независимость байесовской оценки (4.8) от матрицы В в (4.7) позволяет, не нарушив общности, считать матрицу В диагональной. Тогда функция потерь (4.7)
где
. Смысл такой функции потерь ясен: плата за отличие
от
растет пропорционально квадрату ошибки измерения каждого из параметров
.
2. Прямоугольная (равномерная) функция потерь при оценке скалярного параметра
(рис. 4.2,б) предполагает ущерб от ошибок, не выходящих за пределы
, нулевым, а от прочих ошибок — одинаковым:
(4.10)
— функция, описывающая прямоугольный импульс единичной амплитуды и длительности, симметричный относительно оси
.
Обобщая функцию (4.10) для многомерного случая
, определим
(4.11)
При этом считаются безопасными любые случаи, когда ошибки по параметрам
одновременно попадают в r окон
; все другие случаи равно нежелательны. При такой функции потерь
(4.12)
Рис. 4.3
Предположим, что апостериорная ПВ
имеет отчетливо выраженный глобальный максимум с координатами
и симметрична по всем координатам относительно точек в пределах отрезков
. Тогда, если побочные максимумы ПВ
не превышают ее значений в области
, минимум риска (4.12) будет достигнут при
. Таким образом, байесовской оценкой окажется оценка по максимуму (моде) апостериорной ПВ:
где
- значение вектора
, при котором апостериорная ПВ достигает максимума. Правило МАВ (4.13) можно получить и модифицировав функцию (4.11) до простой функции потерь
предполагающей одинаково опасными любые ошибки, но взимающей бесконечный по абсолютному значению отрицательный штраф, т. е. премирующей в бесконечном размере за точное совпадение оценки с истинным значением измеряемого параметра. Тогда правило МАВ (4.13) следует из выражения (4.12) после применения фильтрующего свойства
-функции.
Следовательно, использование разных разумно выбранных функций потерь привело к различным результатам, иллюстрацией чему служит рис. 4.3, где приведены примерный вид апостериорной ПВ скалярного параметра
центр тяжести
и мода
. Можно ввести и другие функции потерь, увеличив число примеров, приводящих к различным байесовским оценкам. Следует, однако, отмстить, что для симметричных апостериорных распределений и симметричных неубывающих функций потерь все байесовские оценки совпадают. Для практических задач асимметричные функции потерь не представляют интереса. В то же время во многих случаях апостериорная ПВ асимптотически (при высоких требуемых точностях) нормальна, т. е. удовлетворяет требованиям симметрии. При этом байесовской оценкой независимо от конкретного вида функции потерь оказывается, например, апостериорная мода (она же и центр тяжести)
.
К такому же выводу можно прийти и не ограничивая класс апостериорных ПВ требованием симметрии, а основываясь лишь на том, что при точных измерениях апостериорная ПВ имеет вид острого пика и, следовательно, расхождение ее характерных точек (центра тяжести, моды и др.) незначительно.
Приведенные рассуждения показывают, что в расчете на практические нужды незачем преувеличивать роль выбора конкретной функции потерь, считая универсальной байесовской оценкой, например, оценку по максимуму апостериорного распределения (по правилу МАВ).
Для придания завершенности рассмотренной теории байесовских оценок уместно пояснить, почему сами оценки оказалось целесообразным «привязать» именно к апостериорному распределению. Дело в том, что, когда помеха
статистически задана, т. е. известны
многомерные ПВ (при непрерывном наблюдении функционал ПВ), и когда задана априорная ПВ
, построение апостериорной ПВ
принципиальных трудностей не встречает (вычислительная сложность здесь не рассматривается). Пусть, например,
- функционал ПВ помехи
. Пользуясь обычными правилами отыскания статистических характеристик преобразованных случайных процессов, для любого заданного оператора
в правой части (4.1) можно найти
- условный функционал ПВ колебания
при условии присутствия в нем любого возможного сигнала вида
. Этот функционал задает «вероятность» реализации
при условии, что в ней содержится сигнал, параметр которого принял значение
. По теореме умножения вероятностей,
и, следовательно,
где
— коэффициент, не зависящий от
.
Выражение (4.14) позволяет построить апостериорную ПВ, содержащуюся в его левой части. Правую часть
(4.14) образует произведение известной априорной ПВ параметра
и известного функционала ПВ колебания
. Точное значение коэффициента
можно было бы вычислить из условия нормировки, однако этого никогда не требуется, поскольку
влияет на положение центра тяжести, моды и т. д. апостериорной ПВ, т. е. на значение величин, принимаемых в качестве оценок
.
Отметим, что условный функционал ПВ
, входящий сомножителем в апостериорное распределение (4.14), «читается наоборот» — как функция «условия» X при фиксированной реализации
. В таком употреблении, согласно введенной в § 2.2 терминологии, его называют функцией правдоподобия. Таким образом, чтобы построить апостериорную ПВ, достаточно перемножить априорную ПВ и функцию правдоподобия.
Покажем, как в рамках байесовского подхода преодолеваются трудности, возникающие в том случае, когда сигнал помимо информационных содержит и мешающие параметры. Пусть мешающие параметры, как и информационные, неизменны в течение наблюдений
, и являются случайными величинами с известной
-мерной априорной ПВ
. Тогда влияние мешающих параметров на процедуру оценки параметра
сигнала
, являющегося теперь не детерминированной, а случайной (вследствие случайности
) функцией аргументов
, можно устранить с помощью следующего приема. Включим все мешающие параметры наряду с информационными в число измеряемых, т. е. будем считать, что оценке подлежит (
-мерный вектор
),
. Построив согласно (4.14) его (
-мерную апостериорную ПВ
), можно путем интегрирования ее по всем мешающим параметрам получить
-мерную ПВ информационных параметров
[как и при выводе (4.8), здесь используется свойство согласованности многомерных ПВ]:
Полученная апостериорная ПВ вектора
пригодна для формирования байесовской оценки
в соответствии с намеченной ранее программой.