Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
10.2.3. Оценка функции при наличии мешающих сигналовРассмотрим задачу оценки функции зависящей от совокупности неизвестных параметров , по результатам наблюдения ее значений в дискретные моменты времени в смеси с помехой, содержащей флюктуационную составляющую и дополнительный мешающий сигнал вида где -известная функция времени и неизвестных параметров а. Совокупность данных наблюдения может быть описана вектором где
— значение флюктуационной составляющей помехи, которую мы будем гауссовой с
Функция правдоподобия
помимо к зависит от совокупности параметров а, определяющих детальный вид мешающего сигнала, и при неизвестных значениях а определена лишь с точностью до совокупности этих параметров. Таким образом, мы имеем задачу с параметрической априорной неопределенностью. В (10.2.36) для краткости введены обозначения
Оценка функции имеет вид следовательно, задача сводится к нахождению оценки максимального правдоподобия для параметров , а с учетом имеющейся априорной неопределенности — для совокупности параметров . Нужно отметить, что из выражения (10.2.36) следует, что при равных величинах дисперсий значение величины не влияет на положение максимума функции правдоподобия по параметрам к и а. Поэтому в этом случае дисперсия флюктуационной составляющей помехи может быть как известной, так и неизвестной. Априорная неопределенность ее значения не влияет на правило оценивания к и поэтому является несущественной (см. гл. 4). Точность оценок максимального правдоподобия параметров к и а определяется информационной матрицей Фишера, которая согласно (7.3 3) в данном случае имеет вид
Если матрица невырождена, то корреляционная матрица ошибок определения значения
асимптотически приближается к матрице а в частном случае линейных относительно функций т. е. при
где векторы той же размерности, что соответственно, в точности совпадает при любом Отмеченное выше требование невырожденности матрицы является необходимым условием обеспечения возможности измерения всех компонентов векторов а и к В противном случае без использования каких-либо дополнительных данных задача просто не имеет решения. Для существования обратной к матрицы достаточно, чтобы функции были линейно независимы. Предположим, что условия обращения матрицы выполнены. Тогда, поскольку из (10 2 36) следует, что логарифм функции правдоподобия представляется в стандартном виде (7.5 16) с
мы имеем возможность использовать для нахождения оценок рекуррентные соотношения гл. 7, которые в данном случае могут быть записаны в следующей форме:
где весовая матрица определяется как
В свою очередь, матрица может рассчитываться рекуррентно (аналогично тому, как это сделано при переходе от (7.5.30) к (7.5.31) с помощью соотношения
В частном случае линейных функций рекуррентные соотношения дают точное решение уравнения максимального правдолодобия. Рассмотрим на этом примере два вопроса. Первый — переход к непрерывному времени, который превращает рекуррентные соотношения в дифференциальные уравнения для оценок. При этом можно воспользоваться результатами гл. 7 (§ 7.5), определяющими дифференциальные уравнения для оценок максимального правдоподобия, когда вместо последовательности наблюдается непрерывный процесс
где дельта-коррелированный случайный процесс («белый» шум) с
Для этого процесса
Наряду с этим можно получить те же дифференциальные уравнения из приведенных выше рекуррентных соотношений, введя определения для любого
и осуществив них переход к пределу при В обоих случаях получим следующую систему дифференциальных уравнений для определения оценок максимального правдоподобия и
где Как и в случае рекуррентных соотношений (10.2.42) (10.2.44), начальные значения к и начальная матрица выбираются с учетом имеющихся априорных сведений, а при полном их отсутствии могут быть выбраны произвольно, например нулевыми, а матрица -нулевой или диагональной с произвольно малыми элементами, что будет соответствовать произвольно большой неопределенности значений параметров . Информационная матрица Фишера , характеризующая потенциально достижимую точность оценки параметров , определяется при непрерывном времени выражением
а в частном случае линейных по функций имеет вид
В последнем случае оценка максимального правдоподобия совокупности параметров является эффективной и корреляционная матрица ошибок оценивания совпадает с матрицей Если, кроме того, матрица - блочно-диагональная, т. е.
то система дифференциальных уравнений для совокупности распадается на две отдельные системы для причем в силу следующего из (10.2.52) соотношения
дифференциальные уравнения для определения упрощаются и принимают вид
т. е. вообще не зависят от параметров а и их оценок а. Таким образом, условие ортогональности (10.2.52) является условием того, что совокупность параметров а не является мешающей и наличие дополнительного сигнала не вносит априорной неопределенности в решение задачи оценки функции Если условие (10.2.52) не выполняется, однако функцию можно представить в виде
где полная совокупность неизвестных параметров разбита на две совокупности и соотношение ортогональности (10.2.52) выполняется для векторной функции
и
то в этом случае параметры не являются мешающими и при решении задачи оценки параметров X им могут быть приписаны произвольные значения, например нулевые. Второй вопрос — это влияние данных, полученных при предварительном наблюдении (в процессе обучения), когда не требовалось принимать основное решение (в данном случае оценивать параметры X). Выше уже отмечалось, что в задачах, подобных задаче оценки, абсолютно никакой разницы между способами использования этих данных и данных, полученных в процессе принятия решения (на рабочем шаге), не существует. Следствием этого является полное единство структуры алгоритмов обработки информации. Применительно к рассматриваемому здесь примеру обучение может заключаться в наблюдении отрезка реализации (или последовательности который содержит только мешающий сигнал Такое наблюдение позволяет получить предварительную оценку параметров а и функции описывающей помеху, к моменту начала наблюдения данных, предназначенных для решения задачи оценки основных («полезных») параметров к и зависящей от них функции Пусть данные обучения получены на интервале предшествующем интервалу 0 наблюдения в смеси с помехами оцениваемой функции При этом случай равенства соответствует соприкасающимся интервалам наблюдения только помехи и помех в смеси с полезным сигналом. Наблюдаемый процесс имеет вид
на интервале и (10.2.45) при и аналогично в дискретном случае. Если в соответствии с этим определить
и дополнительно для случая ввести определение
то решение задачи совместной оценки к и а по-прежнему дается системой дифференциальных уравнений (10.2.49), которая теперь подлежит решению при Матрица Фишера также определяется прежним выражением (10.2.51) с заменой на и с учетом (10.2.59), (10.2.60). Аналогичное совпадение имеет место и в дискретном случае. Таким образом, наличие данных обучения ничего не меняет в формальной структуре алгоритма оценивания. Фактически дифференциальные уравнения (10.2.49), конечно, упрощаются. Для они приобретают вид
для интервала
а для имеют полную форму (10.2.49). При достаточно большом интервале когда получаемые на этом интервале оценки параметров а достаточно точны, можно отказаться от дальнейшего уточнения оценок этих параметров при и в результате упростить уравнения (10.2.49) и на этом интервале, положив в них При этом оценка определяется системой дифференциальных уравнений:
Рассмотрим влияние данных обучения на точность оценки параметров k. Выпишем для этого информационную матрицу Фишера с учетом дополнительного интервала наблюдения к (10.2.59)
Из этого выражения следует, что если при отсутствии предварительного наблюдения матрица вырождена, т. е. измерение всех компонент параметров X и а невозможно и априорная неопределенность является неустранимой, то при наличии участка наблюдения интервале реализации только помех (10.2.58) матрица неособенная и появляется возсможность совместного оценивания полезных и мешающих а параметров. При этом априорная неопределенность, связанная с незнанием параметров а, мешает оценке параметров X лишь в той мере, в которой полученные оценки а отличаются от истинных значений. Для более полного понимания влияния мешающего сигнала и возможности его предварительного наблюдения на точность оценки параметров X найдем корреляционную матрицу ошибок для асимптотически эффективных оценок максимального правдоподобия, т. е. матрицу обратную информационной матрице Фишера. Выполнив обращение (10.2.64), получим следующее выражение для блока матрицы характеризующего ошибки оценивания параметров
При известных значениях параметров а, т. е. в отсутствие априорной неопределенности, соответствующая матрица ошибок для оценок параметров X имеет вид
Таким образом, матрицу можно представить в виде
где матрица
характеризует влияние априорного незнания параметров а. Это влияние зависит от вида функций и наличия интервала предварительного наблюдения Пусть, например,
т. е. мешающий сигнал представляет собой линейную комбинацию тех же функций времени из которых образуется оцениваемая функция . В этом случае при т. е. при отсутствии данных обучения, все интегралы, входящие в (10.2.65), одинаковы и матрица обращается в бесконечность (соответствующая матрица Фишера вырождена). При этом задача оценки к и функции неразрешима, что совершенно естественно, поскольку параметры к и а не различаются ничем, кроме обозначения, и можно оценить только сумму сигнала и помехи т. е. функцию Наличие дополнительного интервала наблюдения ликвидирует вырождение матрицы , а матрица принимает вид
При больших значениях длины интервала она слабо отличается от единичной матрицы и точность оценки параметра к получается почти такой же, как при известных значениях а. Рассмотрим теперь, как ухудшится точность оценки к, если оценка параметров а производится только по данным обучения (на интервале и не уточняется на рабочем интервале наблюдения т. е. в том случае, когда оценка к формируется в соответствии с дифференциальными уравнениями (10.2.63). Прежде всего заметим, что корреляционная матрица ошибок определения параметров а по интервалу предварительного наблюдения асимптотически совпадает с матрицей, обратной информационной матрице Фишера для параметров а:
Далее, линеаризуя уравнения (10.2.63) относительно ошибок измерения получаем
где во второй строке сразу записано решение (10.2.66) для весовой матрицы линеаризованной системы уравнений. Подставляя его в первое уравнение, получим решение этого уравнения для ошибки
с помощью которого определяется матрица ошибок оценивания параметров к
где
Нетрудно убедиться, что матрица всегда больше из совпадает с ней только в том случае, когда определяются соотношениями (10.2.68). Пользуясь выражениями (10.2.65) и (10.2.74), нетрудно оценить влияние отказа от уточнения параметров а на рабочем интервале при произвольных функциях
|
1 |
Оглавление
|