Главная > Радиотехнические системы
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 4.9. ЭЛЕМЕНТЫ ТЕОРИИ ФИЛЬТРАЦИИ ПАРАМЕТРОВ СИГНАЛОВ

Как указывалось в § 4.1, фильтрацией называют измерение текущих значений параметров сигнала, меняющихся в процессе наблюдения.

Таким образом, целью фильтрации является формирование оценки значения зависящей времени величины (в общем случае векторной) , , входящий в качестве параметра в сигнал . Последний доступен наблюдателю в смеси с помехой, так что колебание, на основании которого должна быть построена искомая оценка , описывается вариантом соотношения (4.1)

который в теории фильтрации называют уравнением наблюдения. Отметим, что, распространив на задачу фильтрации идеи, изложенные в § 4.2, мешающие параметры сигнала можно присовокупить к информационным, увеличив размерность вектора последних. Поэтому в (4.68) мешающие параметры самостоятельно не фигурируют.

Из приведенного определения ясно, что текущая оценка в процессе фильтрации формируется исходя из всей полученной вплоть до момента t информации, т. е. с учетом значений наблюдаемой реализации при всех Родственной является задача прогнозирования или экстраполяции, когда по наблюдениям вплоть до момента t требуется предсказать будущее значение параметра при . Если измеряют значения параметра в моменты времени, предшествующие , , то такую процедуру называют сглаживанием или интерполяцией.

К фильтрации сводятся многие классические радиотехнические задачи. Так, в традиционных системах передачи непрерывной информации (радиовещание, телевидение, радиосвязь и т. д.) передаваемое сообщение модулирует тот или иной параметр (амплитуду, частоту, фазу) излучаемых передатчиком высокочастотных колебаний, на приемной же стороне для восстановления сообщения осуществляют демодуляцию, состоящую в непрерывном отслеживании амплитуды, частоты или фазы (в зависимости от вида модуляции) колебаний, т. е. фильтрацию названных параметров. В то же время теория фильтрации используется и для решения сложных задач, таких, как обработка информации в многозвенных комплексах, объединяющих разнородные системы. Примеры применения теории фильтрации к задачам такого типа рассмотрены в гл. 22. Для того чтобы исследовать задачу фильтрации с общностью, достаточной для понимания материала гл. 22, перепишем уравнение наблюдения (4.68) в векторной форме:

В этой записи учтена возможность получения информации о из разнородных наблюдений, т. е. из множества N параллельно наблюдаемых реализаций процессов, записанных как одна реализация -компонентного векторного колебания . Независимо от конкретного содержания той или иной задачи удобно считать, что каждому скалярному колебанию отвечает свой индивидуальный канал. Каждая из реализаций, т. е. каждый из N каналов, содержит свой полезный сигнал , являющийся детерминированной функцией t и измеряемого параметра . Все N сигналов сведены в одну -компонентную векторную функцию — сигнал . Помеха в (4.69) также представлена в векторной форме , так как в каждом из N каналов присутствует свой шумовой компонент . Появление в (4.69) знака плюс вместо оператора . указывает на то, что далее помеха будет считаться аддитивной: .

Определяющее влияние на алгоритмы формирования имеет вид зависимости в (4.69) от . Если - линейная функция , т. е. зависимость от подчиняется принципу суперпозиции, и можно записать , где — некоторая -матрица, элементы которой могут зависеть от времени t, но не от , то фильтрацию параметра называют линейной. В остальных случаях фильтрацию называют нелинейной.

Наряду с непрерывной фильтрацией, осуществляемой при непрерывном наблюдении , можно рассматривать и дискретную фильтрацию или фильтрацию последовательностей, когда наблюдения доступны лишь в отдельные моменты времени . Тогда вместо (4.69) используют уравнение наблюдения

где ; . При дискретной фильтрации целью является оценка i-го элемента последовательности по наблюдениям .

Главной проблемой изучаемой области статистической теории РТС является оптимальная фильтрация, т. е. отыскание наилучших в некотором смысле правил формирования текущей оценки .

При этом за основу может быть принят байесовский подход, общие положения которого без затруднений переносятся со случая неизменного в течение наблюдений параметра на рассматриваемый случай. Повторив рассуждения из § 4.2, нетрудно прийти к выводу, что для формирования байесовской оценки текущего значения необходимо построить текущее апостериорное распределение , приняв затем некоторую характерную точку последнего (центр тяжести, моду и т. п. — в зависимости от избранной функции потерь) за искомую оценку. Заметим, что запись в апостериорной ПВ условия с ограничениями на отражает зависимость апостериорных (вычисленных по итогам наблюдений) вероятностей тех или иных значений от всего, что было доступно наблюдателю до момента .

Следует подчеркнуть, что априорнбму (предшествующему наблюдениям) знанию возможного поведения в теории оптимальной фильтрации принадлежит значительная роль, и попытки применить к измерениям меняющихся параметров методику максимального правдоподобия, столь продуктивную при оценке неизвестных постоянных (см. § 4.4), могут привести к решениям, не имеющим никакой практической ценности. В подтверждение рассмотрим простейший пример скалярных наблюдений в которых — стационарный белый шум и требуется оценить текущее значение скаляра . Это задача линейной фильтрации, в которой сигнал , т. е. совпадает с фильтруемой величиной. ФП для очевидно совпадает с функционалом ПВ для при , максимально правдоподобной оценкой явится зависимость , точно совпадающая с наблюдаемой реализацией на отрезке . Какая-либо обработка данных при этом отсутствует и фильтрации как «очистки» наблюдений от вредного влияния помех не происходит. Для осуществления же подлинной «очистки» необходимо согласовывать, увязывать данные наблюдений с имеющимися заранее сведениями о возможном характере изменения именно в этом и состоит суть процедур фильтрации. Заметим, что изучавшиеся в § 4.3, 4.4 правила ОМП, хотя и не требовали привлечения априорных сведений о возможных значениях [априорной ПВ ], коренным образом опирались на иную априорную информацию — постоянство в процессе наблюдений полагалось достоверным фактом.

Таким образом, для синтеза алгоритмов фильтрации необходимо прежде всего располагать априорными сведениями о возможном поведении , т. е. моделью сообщения . Одной из простейших моделей является представление его в виде какой-либо стандартной детерминированной функции времени, зависящей от некоторого конечного числа постоянных в течение наблюдений неизвестных параметров — чаще всего в виде полинома фиксированной степени с неизвестными коэффициентами. Измерение при этом сводится к оценке констант (коэффициентов полинома), т. е. к процедурам, описанным в предыдущих параграфах.

Во многих случаях, однако, содержанию задачи в большей мере отвечает модель сообщения как некоторого векторного случайного процесса. Случайными, например, нередко естественно считать речевые сообщения или сигналы изображения в телевидении, данные о состоянии физических и биологических объектов в телеметрии, биоэлектронике и сейсмологии, отклонения траекторий движущихся объектов от регулярных в локации и навигации и т. п. Очень удобной и адекватной многим реальным ситуациям оказывается модель в виде векторного марковского процесса, позволяющая прийти к рекуррентным правилам фильтрации: таким, когда оценку удается формировать последовательно по мере наблюдений, корректируя и уточняя ранее полученные данные с учетом вновь поступающих. Приняв за основу марковскую модель сообщения, сосредоточим внимание на проблеме дискретной фильтрации исходя из тех соображений, что, во-первых, для современной радиоэлектроники с ее ориентацией на цифровую схемотехническую базу характерен особый интерес к дискретным методам обработки информации, а во-вторых, непрерывные алгоритмы фильтрации с достаточной для инженерных дисциплин строгостью можно получать из дискретных с помощью соответствующих предельных переходов.

Обратимся к фильтрации случайной последовательности , являющейся марковской, т. е. удовлетворяющей свойству зависимости условной ПВ i-го элемента при условии задания предыдущих только от значения последнего, -го, заданного элемента . Здесь и далее символы , для краткости заменяют последовательности и т. п.

Будем считать, что отсчеты помехи в уравнении наблюдения (4.70) независимы между собой при и с отсчетами измеряемого параметра . Вспомнив соотношение (4.14), запишем совместную апостериорную ПВ всех отсчетов , измеряемого параметра после получения i наблюдений :

где — коэффициент, зависящий от наблюдений , но не от ; - априорная ПВ ; - ФП при заданной последовательности наблюдений . Так как можно представить как совместную ПВ и , то, воспользовавшись теоремой умножения вероятностей и свойством марковских последовательностей, получим

(4.72)

где — априорная ПВ последовательности . Кроме того,

(4.73)

Записав первый сомножитель в виде нетрудно понять, что при задании (фиксации ) «вероятность» последовательности определяется отсчетами помехи в (4.70) и не зависит от . Поэтому . Кроме того, из равенства и из (4.70) следует, что после фиксации , «вероятности» тех или иных значений совпадают с «вероятностями» отсчетов помехи . Так как последние независимы друг от друга, а также от , то . Следовательно, вместо (4.73) имеем равенство , подстановка которого совместно с (4.72) в (4.71) дает

(4.74)

Но из (4.71) следует,

и потому

где не зависит от .

Проинтегрируем обе части (4.75) по всем значениям аргументов .

По условию согласованности многомерных ПВ слева получим апостериорную ПВ i-го отсчета измеряемого параметра , вычисленную по всем наблюдениям . Справа же интегрирование сомножителя по (остальные от этих переменных не зависят) дает ПВ отсчета после наблюдений . Таким образом,

где

имеет смысл ПВ i-го отсчета предсказанной (экстраполированной) на шаг по результатам наблюдений на предыдущем шаге. Сравнив (4.76) с (4.14), можно заключить, что является априорной (по отношению к -му наблюдению ) ПВ отсчета учитывающей все сведения о , содержащиеся во всей серии наблюдений , предшествовавших . Эта величина, как следует из (4.77), может быть рассчитана на основании апостериорной ПВ значения измеряемого параметра на шаге и известной переходной ПВ марковской последовательности . Таким образом, марковский характер изменений измеряемого параметра и независимость отсчетов помехи в (4.70) позволяют строить апостериорное распределение рекуррентно, т. е. шаг за шагом: с помощью априорной ПВ и наблюдения по известной ФП строить , а затем по полученной величине и переходной ПВ на основании формул (4.76), (4.77) построить и .

Отметим, что любая выбранная в качестве оценки ; характерная точка ПВ , а именно мода, центр тяжести и , не будет зависеть от значения , которое, таким образом, вычислять не нужно (хотя это и можно было бы сделать, воспользовавшись условием нормировки апостериорной ПВ).

Часто возможны и еще большие упрощения, избавляющие от необходимости формировать апостериорную ПВ на каждом шаге и связывающие непосредственно оценки на и шагах. При этом рекуррентно строят уже не апостериорную ПВ, а саму оценку. Именно к таким алгоритмам приводит задачи линейной фильтрации марковской последовательности, основывающееся на следующем варианте уравнения наблюдения (4.70):

где — прямоугольная -матрица, с помощью которой значения пересчитываются в сигнальный вектор ; - отсчеты вектора помехи, которые будем полагать не только независимыми и имеющими нулевое среднее, но и нормальными. Введем также корреляционную матрицу вектора , учитывающую возможную зависимость его компонентов (см. § 1.4).

Условимся, что последовательность образуется согласно следующему уравнению сообщения:

где — детерминированная -матрица; — независимые отсчеты шума, придающие поведению . случайный характер. Каждый из будет полагаться -мерным нормальным вектором с нулевым средним и корреляционной матрицей , независимым от всех . Нетрудно понять, что последовательность, строящаяся согласно (4.79), - марковская.

Подчеркнем, что индекс у в (4.78),(4.79) показывает, что эти величины могут зависеть от , т. е. законы формирования и пересчета в сигнал, а также помеха могут быть нестационарными.

Для того чтобы техника выкладок не заслонила существа вопроса, разумно подробный вывод и интерпретацию алгоритма оптимальной линейной фильтрации провести для простейшего примера измерения скалярного параметра при скалярных наблюдениях, соответствующим образом прокомментировав последующее обобщение на векторный случай. Для скалярных уравнения наблюдения и сообщения (4.78), (4.79) можно переписать как

где и — детерминированные коэффициенты, в общем случае зависящие от , — нормальные случайные величины с нулевым средним и дисперсиями, обозначаемыми как и , причем и и при , а также со всеми статистически независимы.

Пусть , формально появляющаяся справа в (4.81) при нормальная случайная величина со средним и дисперсией . Предположим, что апостериорная ПВ в (4.77) нормальна для некоторого со средним и дисперсией .

При этом, воспользовавшись следующей из (4.81) нормальностью переходной (т. е. условной при фиксированном ) ПВ , можно после вычисления интеграла в (4.77) убедиться в нормальности ПВ для фиксированной совокупности наблюдений . Этот же факт, однако, убедительно демонстрируется и неформально. Действительно, все, что можно предсказать о вероятных значениях измеряемого параметра на шаге по наблюдениям на всех предыдущих, базируется на уравнении (4.81) с учетом того, что, согласно предположению по данным наблюдений , величина , нормальна со средним и дисперсией . Тогда, по данным тех же наблюдений, величина как продукт линейного преобразования с добавлением независимого нормального слагаемого [см. (4.81)] также нормальна со средним и дисперсией

где в сведены все сомножители, не зависящие от .

Согласно (4.80), ПВ при фиксированном значении нормальна со средним и дисперсией (условными по отношению к ) и , так что ФП в (4.76) имеет вид , где не зависит от . Подставив это выражение вместе с (4.82) в (4.76), после раскрытия скобок и приведения подобных членов в показателе экспоненты придем к выражению для апостериорной ПВ вычисленной по наблюдениям :

где в объединены сомножители, не зависящие от . Сравнивая это соотношение со стандартной записью одномерного нормального закона , убеждаемся в нормальности апостериорной ПВ с дисперсией

и средним

Таким образом, из нормальности апостерирной ПВ на шаге следует нормальность ее на , что при допущении нормальности индуктивно доказывает нормальность апостериорной ПВ для любого . Вспомним (см. § 4.2), что при квадратичной или простой функциях потерь оптимальными (байесовскими) оценками являются оценки по центру тяжести (апостериорному среднему) либо по правилу МАВ. Но для нормальной апостериорной ПВ среднее и мода совпадают. Следовательно, в качестве оптимальной оценки скалярного измеряемого параметра при линейной фильтрации независимо от функции потерь следует брать апостериорное среднее. В итоге из (4.84) и (4.83) после замены на и небольшой перегруппировки слагаемых найдем

где

Соотношения (4.85) — (4.87) называются уравнениями фильтра Калмана. Как следует (4.85), располагая оценкой на предыдущем, , шаге, фильтр Калмана, основываясь на уравнении сообщения (4.81), прогнозирует оценочное значение на шаг. По получении -го наблюдения прогнозированная оценка подправляется на значение, пропорциональное невязке (обновляющему процессу), т. е. отклонению прогнозированного слагаемого -го наблюдения в (4.80) от полученного отсчета Коэффициент пропорциональности, регулирующий вес новых данных (невязки) в , по сравнению с прогнозом , называюткоэффициентом усиления фильтра Калмана. Эта величина помимо коэффициента в уравнении наблюдения и дисперсии шума наблюдения определяется еще и апостериорной дисперсией параметра . Последняя, как нетрудно показать, совпадает с квадратом разности оценки и истинного значения , усредненным по всем возможным шумам наблюдения, и, таким образом, характеризует точность оценки на шаге. Действия, выполняемые фильтром Калмана, иллюстрируются схемой рис. 4.10, в которой элемент задержки осуществляет запоминание предыдущей, , оценки до следующего, -го, шага.

Рисунок, как и поясняемый им рекуррентный (разностный) алгоритм (4.85) — (4.87), показывает, что фильтр Калмана является характерным примером линейной дискретной замкнутой астатической системы регулирования с переменными параметрами. Ее чувствительный элемент (дискриминатор) вырабатывает сигнал рассогласования (невязку) входных данных и данных, поступающих по цепи обратной связи.

Рис 4.10

После взвешивания рассогласование суммируется с ранее накопленным результатом, что эквивалентно введению в замкнутый контур интегратора, исключающего статическую ошибку.

Приведенные рассуждения позволяют понять и алгоритм фильтра Калмана для векторного параметра при векторных наблюдениях. Техника его вывода не отличается принципиально от использованной ранее, а итогом служат соотношения, которые формально можно получить из (4.85) — (4.87), заменив скаляры соответствующими векторно-матричными аналогами , а дисперсии — корреляционными матрицами , последняя из которых характеризует точность фильтрации векторного параметра :

где — матрица размера , являющаяся матричным коэффициентом усиления фильтра Калмана.

Суть алгоритма осталась прежней; экстраполированная с предыдущего шага оценка В t после получения -го наблюдения корректируется с учетом новой информации, заключенной в невязке , вклад которой в , определяется матричным коэффициентом усиления .

Пошаговый (рекуррентный) характер алгоритма Калмана, позволяющий получать текущую - оценку корректировкой ее предыдущего значения с учетом только очередного (-го), наблюдения, удобен для реализации на ЭВМ, особенно при необходимости фильтрации в реальном времени, т. е. по мере поступления данных. Подчеркнем, что коэффициенты усиления в (4.85), (4.88), как и характеристики точности оценок и , не зависят от входных данных и могут быть рассчитаны заранее для всех значений i и занесены в память ЭВМ, с тем чтобы извлекаться оттуда по мере надобности.

Кроме того, на практике нередко приемлемы те или иные упрощения алгоритма Калмана, как, например, замена переменных коэффициентов усиления и в (4.85), (4.88) некоторыми не зависящими от , т. е. переход к квазиоптимальным фильтрам с постоянными параметрами.

Диапазон применений алгоритма Калмана в современных информационных системах чрезвычайно широк. Хотя для доказательства его оптимальности при байесовском подходе пришлось оговорить нормальность помехи, он обладает определенными оптимальными свойствами и по отношению к любым аддитивным помехам. Оказывается, что формируемая им текущая оценка наиболее близка в смысле среднеквадратического отклонения к истинному значению параметра по сравнению с прочими линейными (полученными только линейными преобразованиями наблюдений) оценками. Кроме того, алгоритм Калмана можно усложнить, приспособив и к задачам нелинейной фильтрации. Допустим, что измерению подлежит скалярный параметр описываемый уравнением сообщения

отличающимся от (4.81) только тем, что вклад в описывается нелинейной зависимостью . Пусть содержащее , слагаемое в уравнении наблюдения в отличие от (4.80) также нелинейно зависит от

Предположим, что предыдущие отсчетов позволили каким-то образом выработать прогноз оценки на шаг . Тогда, считая измерения настолько точными, что расхождения истинного значения с прогнозированной оценкой невелики, можно заменить в (4.92) двумя первыми членами ряда Тейлора в окрестности , придя к линеаризованному уравнению наблюдения

где .

Переписав выражение (4.93) в виде

нетрудно видеть аналогию полученного соотношения

с (4.80), если в последнем за наблюдение принять левую часть (4.94), а за коэффициент производную .

Поэтому итогом рассуждений, подобных тем, что привели к алгоритму Калмана, окажется близкое к нему правило, согласно которому оценку можно сформировать, добавив к прогнозу невязку [разность наблюдения слева в (4.94) и прогноза правой части (4.94)], взятую с весом

При этом для приближенного рекуррентного вычисления дисперсии оценки на шаге пользуются версией уравнения сообщения (4.91), получаемой такой же, как и (4.93), линеаризацией правой части в окрестности оценки , -го шага . Здесь коэффициенту в (4.81) аналогична производная . Поэтому вместо (4.86) получаем следующий алгоритм вычисления дисперсии оценки:

Экстраполированная по наблюдениям на шаг оценка получается как следствие из (4.91):

Отмечая сходство линеаризованного алгоритма (4.95) — 4.98) с линейным (4.85) — (4.87) нельзя упускать из вида принципиальное отличие: нелинейность исходной задачи проявляется в линеаризованном фильтре зависимостью коэффициента усиления и дисперсии оценки от предыдущей оценки , т. е. от наблюдений. Поэтому, реализуя такой фильтр, рассчитать заранее нельзя и приходится довольствоваться возможностью пересчета этих величин от шага к шагу в соответствии с очередным наблюдением .

Не приводя здесь обобщения формул (4.95) — (4.98) на векторный случай, подчеркнем лишь, что формально оно, как и при линейной фильтрации, свелось бы к замене скаляров их векторно-матричными аналогами.

В заключение отметим, что на первый взгляд гауссовско-марковские модели сообщений (4.79), (4.81) могут показаться несколько искусственными и ограниченными. В действительности же они обладают большой гибкостью и, в частности, охватывают и случаи, когда зависит не только от , но и от других предыдущих значений.

Такую зависимость вновь удается учесть в рамках модели (4.79), если соответствующим образом увеличить размерность оцениваемого вектора,включив в его состав наряду с текущим значением и значения оцениваемого параметра на предыдущих шагах и т. д. Универсальность гауссовско-марковской модели сообщения в не меньшей степени, чем вычислительная эффективность алгоритмов фильтрации типа калмановских, объясняет повсеместное применение последних в современной информационной технике.

Детерминированными или случайными функциями являются априорная ПВ, апостериорная ПВ, функция правдоподобия? Как эти функции связаны между собой? В чем принципиальное отличие априорной и апостериорной ПВ? Получите байесовское правило оценки скалярного параметра при «абсолютной» функции потерь . Предположим, что наблюдатель готов примириться с некоторым смещением оценки, т. е. систематическая ошибка не настолько опаснее случайной, чтобы непременно требовать равенства ее нулю. Какие разумные критерии качества оценок, обобщающие (4.15), (4.16), можно при этом сформулировать? Как связана информация Фишера (4.23) со «средним» поведением ФП .

В чем достоинство оценки по максимуму правдоподобия? Какими способами ФП может быть «освобождена» от неинформационных параметров?

Как трактуется ОМП неэнергетического параметра (в том числе и при усреднении ФП по начальной фазе сигнала) в терминах сходства принимаемого колебания с сигналом?

Какие из следующих параметров сигнала являются неэнер-гетическими: начальная фаза, центральная частота спектра, амплитуда, время запаздывания, длительность, девиация частоты, период повторения импульсов в пакете, индекс угловой модуляции?

Какой качественный смысл вкладывается в понятие ФН и как он отражается в формулах типа (4.60), (4.61)?

Какова природа аномальных ошибок и пороговых эффектов?

К какому виду ФН следует стремиться, чтобы с большим доверием относиться к значениям дисперсий ошибок, рассчитанным по границе Крамера — Рао?

Каков смысл понятия «фильтрация параметров ?

Какую роль играют априорные сведения в задачах фильтрации?

Какую последовательность называют марковской и чем удобна марковская модель сообщений для задач фильтрации?

Запишите алгоритм Калмана (4.85) — (4.87), если в уравнениях наблюдения и сообщения для скалярного параметра и (4.81) , а , и , — стационарные дискретные шумы .

Какова зависимость коэффициента усиления g, от при -го, если .

Какое качественное объяснение можно дать этому факту?

1
Оглавление
email@scask.ru