Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
6.5.3. Теория статистических оценокОстановимся теперь подробнее на теории статистических оценок параметров распределений [8]. Так называют раздел математической статистики, в котором плотность вероятности выборки (функционал плотности распределения реализации) зависит от одного или нескольких постоянных, но неизвестных параметров. Эти параметры и необходимо оценить по выборочным значениям входной величины. Наиболее развитыми и удобными методами нахождения оценок являются метод максимума апостериорной вероятности и метод максимума правдоподобия. Первый метод заключается в дифференцировании по параметру к (будем пока полагать его единственным) произведения априорного распределения параметра
где Результат дифференцирования приравнивается нулю, и ищется явно зависящий от у корень полученного уравнения
который и принимается в качестве наилучшей оценки. Согласно методу максимума правдоподобия дифференцируется функция правдоподобия, что дает так называемое уравнение правдоподобия
Его корень называется оценкой максимума правдоподобия. Хотя теория оценок была развита раньше общей теории решений, при появлении последней удалось интерпретировать теорию оценок с более общих позиций. При этом считают, что пространство решений представляет собой отрезок прямой, на котором отложены возможные «оценки» параметра k. В качестве функций потерь обычно рассматриваются: простая функция потерь
квадратичная функция потерь
функция потерь с насыщением
или функция
Если выбрать простую функцию потерь (6.5.7), то средний риск (6.5.3) равен
Для его минимизации, эквивалентной максимизации интеграла в правой части равенства (6.5.9), необходимо, чтобы при любом фиксированном у принималось решение X, соответствующее максимуму подынтегральной функции. Иначе говоря, оптимальная оценка соответствует максимуму апостериорной вероятности, т. е. является корнем уравнения (6.5.5). Отсюда ясно, в каком смысле оптимальна оценка максимума апостериорной вероятности. Легко убедиться, что такая оценка дополнительно максимизирует вероятаостъ правильного решения. Заметим еще, что при широком априорном распределении оценка максимума апостериорной вероятности переходит в оценку максимума правдоподобия. Возьмем теперь квадратичную функцию потерь (6.5.8). При этом средний риск (6.5.3) примет вид
Он имеет физический смысл усредненной по минимизировать
Формальным решением (6.5.11) является условное математическое ожидание
В отличие от оператора оценки максимума апостериорной вероятности структура оператора оптимальной оценки при квадратичной функции потерь зависит от вида всей функции апостериорной вероятности. Если задать функцию потерь какого-либо иного вида, отличного от рассмотренных, то в общем случае будут получены иные операторы. И хотя критерий минимума среднеквадратической ошибки, вытекающий из применения квадратичной функции потерь, наиболее привычен, разнообразие оптимальных решений вызывает некоторое неудовлетворение. Хотелось бы получить решение, которое было бы оптимальным для достаточно широкого класса случаев. Оказывается, что при некоторых ограничивающих предположениях теория байесовых оценок допускает такое решение. Для выяснения этого обстоятельства в первую очередь укажем, что оценки при простой и квадратической функциях потерь совпадают, когда апостериорное распределение вероятностей — симметричная относительно некоторой точки функция. Это ясно из полученных выражений. В теории оценок строгое математическое доказательство этого факта связано со свойством эффективности оценок, под которой понимается достижение нижней грани дисперсии оценки относительно истинного значения. Показывается [8], что в некотором классе случаев оценки максимума апостериорной вероятности эффективны. Особенно часто отмечается асимптотическая эффективность, т. е. эффективность при времени наблюдения, значительно большем интервала корреляции наиболее медленных случайных переменных смеси Докажем, что при симметрии апостериорного распределения всякая симметричная функция потерь приводит
где
Поскольку в точке оптимальной оценки производная от среднего риска по оценке равна нулю, то в этой точке должно удовлетворяться уравнение
Выразим Значение с максимальным значением апостериорного распределения и может служить универсальной оптимальной оценкой. Таким образом, метод максимума апостериорной вероятности, а при широком априорном распределении и метод максимального правдоподобия при весьма неограничительных условиях дают единую байесову оценку измеряемого параметра. Для дальнейшего полезно отметить одну математическую закономерность, доказываемую в теории оценок. Дело в том, что при большом времени наблюдения и при сравнительно низком уровне помех на входе логарифм функции правдоподобия (как функции параметра) близок по форме к параболической кривой, находящейся возле истинного значения параметра:
где От выборки к выборке вершина этой параболы перемещается по обеим осям, а также меняется по ширине. Естественно, что эту параболу можно разложить в любой точке, близкой к точкам истинного и максимально-вероятного значения, ограничившись всего тремя членами разложения. В любом случае мы придем к кривой, совпадающей с (6.5.13). Если теперь перейти от логарифма к самой функции правдоподобия, то приведенные зависимости выразятся в том, что функция правдоподобия будет аппроксимирована гауссовой кривой, находящейся где-то возле точки истинного значения
Такие закономерности имеют место для Полезно пояснить свойства совместных оценок нескольких параметров. Функция правдоподобия определяется в этом случае в пространстве всех измеряемых величин
Матрица, составленная из средних значений вторых производных,
характеризует «остроту» многомерного пика и иногда называется информационной матрицей Фишера. Ее значение заключается в том, что обратная к ней матрица ошибок измерения. Тогда введенный эллипсоид рассеяния при любом методе оценки параметров будет целиком содержать в себе эллипсоид со вторыми моментами, определяемыми матрицей Радиолокационные приложения теории оценок заключаются, в первую очередь, в следующем. В процессе отражения зондирующего радиолокационного сигнала от цели параметры плотности вероятности смеси отраженного сигнала и помех на входе приемника оказываются зависящими от координат и скорости цели. Измерив (оценив) задержку модуляции сигнала, его среднюю частоту или направление прихода, можно было бы тем самым определить необходимые координаты цели. Если в течение некоторого интервала времени эти координаты можно считать постоянными, то возникает классическая задача теории оценок: по данной реализации смеси сигнала и помех, наблюденной за данный интервал времени, определить с минимальными ошибками неизвестные параметры сигнала в этой смеси. Первые результаты по синтезу оптимальных радиолокационных измерителей были получены именно на базе теории оценок Можно указать следующие методы синтеза устройств для обработки сигналов, полученные в литературе на базе теории оценок. В работах [10, 11] и в значительном числе более поздних работ явно или неявно предполагается, что имеется возможность последовательного или параллельного нахождения значений функции правдоподобия во всей априорной области измеряемого параметра, в результате чего можно найти точку максимального значения, являющуюся оценкой. Не стоит пояснять, что в общем случае получение осей «развертки» функции правдоподобия технически сложно, за исключением параметра в виде временной задержки модуляции. В работах [12, 13] предложен иной, более простой, метод нахождения оценки максимального правдоподобия, основанный на предположении, что известно значение параметра
даст явное выражение для оценки максимума правдоподобия Я:
Таким образом, для получения Если попытаться распространить методы синтеза, основанные на теории оценок, на случай изменяющегося параметра, то это удается сделать лишь путем известных нестрогостей. Так, предположим, что схема измерителя уже задана в виде следящей системы того типа, который изучался в § 6.2. В отношении дискриминатора постулируем, что он должен постоянно выдавать с максимальной точностью оценку рассогласования между истинным значением параметра и тем значением цепей сглаживания. Как следует из
В условиях, когда на подынтервале осуществляется достаточное накопление, выполняется приближенное соотношение
т. е. вторая производная может быть заменена величиной, не зависящей от Однако такие методы синтеза следящих измерителей непоследовательны, поскольку введенные новые предположения выходят за рамки теории оценок. В то же время известно, что измерительные системы всегда синтезируются из условий компромисса между флюктуационной и динамической ошибками, причем возникновение последней из них объясняется именно переменностью параметра во времени. Желательно было бы найти оптимальную измерительную систему сразу в целом, исходя из требования минимума результирующих (сглаженных) ошибок. Такую возможность в принципе дает теория фильтрации. Перед тем как излагать основы теории фильтрации, остановимся еще на одном применении теории оценок к проблеме оптимизации радиолокационных или других измерителей. Имеется в виду определение параметров орбит объектов, летящих по баллистическим кривым [14]. Известно, что траекторию движения центра тяжести произвольного тела в пространстве при детерминированных внешних силах определяют шесть постоянных параметров равными крутизнам дискриминаторов, то согласно результатам § 6.2 в пренебрежении параметрическими флюктуациями будем иметь
т. е. аддитивные смеси измеряемых координат В § 6.8 мы еще вернемся к задаче сглаживания данных при координатах, зависящих от постоянных известных величин.
|
1 |
Оглавление
|