Глава 5. ОБНАРУЖЕНИЕ СИГНАЛОВ СО СЛУЧАЙНЫМИ ФАЗАМИ
1. Испытание сложных гипотез
(а) Критерий Байеса
В гл. 3 были рассмотрены оптимальные стратегии для выбора между двумя гипотезами на базе фиксированного числа измерений. Эта задача могла рассматриваться как задача выбора из двух функций плотности вероятности
или
функции, более согласующейся с наблюдаемыми
значениями
случайных переменных. Выбор должен осуществляться таким образом, чтобы он был оптимальным при некотором критерии — байесовом, минимаксном или Неймана — Пирсона, соответствующем определению длительного успеха. Предполагалось, что эти две функции распределения полностью известны.
Однако часто случается, что одна или обе функции
зависят от некоторых параметров
значения которых при любом испытании экспериментатору неизвестны. Примером таких функций распределения являются распределения, даваемые формулами (3.24) или (3.26), в которых среднее значение
или дисперсия
соответственно могут быть неопределенными
или
Задача отыскания оптимальной стратегии решений при этом значительно усложняется. В данной главе мы будем рассматривать случай, когда функция
не зависит от каких-либо неизвестных параметров, а
зависит от
параметров, набор значений которых мы представим вектором
в некотором
-мерном пространстве параметров. Когда задана некоторая частная система этих параметров, функция совместного распределения результатов наблюдений х при гипотезе
равна
Если компоненты 0 могут рассматриваться как случайные переменные, функция распределения
является условным
распределением вероятностей (см. приложение
Гипотеза
называется "простой", — "сложной". Искомая стратегия для принятия решений опять описывается поверхностью раздела в
-мерном декартовом пространстве наблюдений х, делящей его на две области
Гипотеза
выбирается, когда точка с координатами, заданными наблюдавшимися значениями
попадает в область
когда она попадает в
Поверхность решений
разделяющая эти области, должна быть выбрана так, чтобы статистическое испытание было в некотором смысле оптимальным.
В задаче обнаружения, рассматривавшейся в предыдущей главе, например,
есть функция распределения для
наблюдений входного сигнала
когда он состоит из одного шума, а
функция распределения для той же серии наблюдений, когда присутствует сигнал
компоненты 0 представляют определенные параметры сигнала. Узкополосный радиолокационный импульсный сигнал имеет вид
где
амплитуда сигнала,
время его прихода и
несущая частота. Любой или все из этих параметров могут оказаться известными наблюдателю лишь в некоторых широких пределах. Можно сказать, что наблюдатель пытается обнаружить любой сигнал из системы взаимно исключающих друг друга сигналов вида (5.1). В этой главе в основном будет рассмотрен случай, когда неизвестна только фаза сигнала
Но сначала следует обсудить методы оптимального выбора между сложными гипотезами.
Наиболее общая ситуация, хотя она и редко встречается на практике, когда все априорные вероятности и цены вполне известны и применим критерий Байеса. Этот общий случай был полностью рассмотрен Вальдом [4], а его применение к задаче обнаружения сигналов описано Мидлтоном и Ван-Митером [7]. Априорные вероятности С и
с которыми соответственно осуществляются гипотезы
заданы. Наблюдатель знает также и функцию совместного распределения априорных вероятностей
параметров
описывающую относительные частоты, с
которыми они появляются, когда гипотеза
правильна. Интеграт этой функции по пространству параметров равен
Наблюдатель знает также цены
выбора гипотез
соответственно, когда
правильна (3.7). Цены
выбора гипотез
когда
правильна, могут зависеть от системы значений параметров
которые имели место в действительности; чтобы отметито эту зависимость, запишем эти цены в виде
Обращаясь к (3.18), видим, что средний риск при решении выразится теперь формулой
где интегрирование
производится по всей области изменения
параметров
Первая скобка в (5.2) есть риск, связанный с гипотезой
вторая скобка — риск, связанный с
Чтобы удовлетворить критерию минимального среднего риска Байеса, поверхность решений
разделяющая области и
должна быть выбрана так, чтобы минимизировать С.
Анализ вопроса точно такой же, как и в гл. 3 [формула (3.11)], где он проведен с целью получения стратегии Байеса для выбора между двумя простыми гипотезами. Он приводит к результату, что поверхность решений
состоит из точек х, удовлетворяющих уравнению
Те точки х, для которых левая часть уравнения (5.3) больше правой, образуют область
те же, для которых левая часть меньше, — область
Чтобы произвести выбор между двумя гипотезами
наблюдатель вычисляет коэффициент цены правдоподобия
по данным своих наблюдений х. Он решает в пользу гипотезы
если
или в пользу
если
Легко распространить рассмотрение и на случай, когда гипотеза является сложной, но нам это не понадобится.
Если цены и
независимы от параметров, байесов критерий требует, чтобы наблюдатель вычислил средний коэффициент цены правдоподобия
Средний коэффициент правдоподобия
сравнивается с величиной
Как и в гл. 3, гипотеза
выбирается, если
если
Байесов риск, равный минимальному значению
и определяющийся по формуле (5.2), получается, когда поверхность решений
удовлетворяет уравнению (5.3). Он зависит от априорной вероятности С и вида функции распределения
Если
неизвестны, но цены определены, можно применить минимаксный критерий и найти такие
чтобы
был максимален, предполагая, например, что противник выбирает их таким образом, чтобы сделать минимальные потери наблюдателя возможно большими. Функция априорной вероятности
и значение С. максимизирующие байесов риск
называются "наименее благоприятным распределением" параметра
В некоторых
задачах оно может быть найдено способом проб, в других вычислить его оказывается довольно трудно. Если эта функция распределения известна, минимаксное значение С и минимаксный риск могут быть найдены методами, описанными в разд. 2 гл. 3. Мы вернемся к задаче о наименее благоприятном распределении ниже в связи с критерием Неймана — Пирсона. Для дальнейшего рассмотрения байесова критерия отсылаем читателя к книге Блекуэлла и Гиршика [6].
(б) Критерий Неймана — Пирсона
Вероятность
ошибки первого рода, или ложной тревоги, равна
где — область пространства наблюдений, в котором выбирается гипотеза
Вероятность
ошибки второго рода, или ложного пропуска, является теперь функцией осуществившихся значений параметра в
где
область, в которой выбирается гипотеза На. Чтобы, удовлетворить критерию Неймана — Пирсона для данной системы значений параметра
поверхность решений
разделяющая области
должна быть выбрана таким образом, чтобы для фиксированного значения
вероятность (в) была минимальна.
Простейшая ситуация при критерии Неймана — Пирсона имеет место, когда положение поверхности
минимизирующей
при данном
не зависит от значения параметра 6. Тогда одна и та же поверхность решений
является оптимальной для всех значений 0 и для всех априорных функций распределения и говорят, что стратегия является "равномерно наиболее мощным испытанием гипотезы
против
Пример такого испытания возникает в следующем случае. Пусть наблюдаемые величины
нормально распределенные независимые случайные переменные С дисперсией
и пусть их среднее значение равно нулю
оптимальной для всех значений 0 и равномерно наиболее мощное испытание не существует. Это, например, будет иметь место, когда истинное значение
в приведенном выше примере может быть или положительно, или отрицательно. Возможный компромисс при этом состоит в том, чтобы выбрать некоторую разумную функцию
плотности распределения вероятностей и попытаться минимизировать среднюю вероятность
ошибки второго рода:
Наблюдатель соглашается считать удовлетворительной стратегию, дающую хорошие результаты при ансамбле возможных значений параметров
распределенных в соответствии с этой функцией
Изложенные выше методы анализа позволяют установить, что стратегия, для которой средняя вероятность ложного пропуска
минимальна при фиксированной вероятности ложной тревоги
это такая стратегия, когда наблюдатель вычисляет средний коэффициент правдоподобия по формуле (5.4), пользуясь предпочтенным распределением
Этот коэффициент
сравнивается с некоторым фиксированным значением
Гипотеза
выбирается, если
если
Критическое значение
выбирается так, чтобы получить предписанное значение
где
функция распределения
при гипотезе
Минимальная средняя вероятность
ошибки второго рода при этом равна
где
функция распределения
при гипотезе
когда значения параметра равны 0.
В частности, может существовать одно распределение
для которого минимальное среднее значение вероятности
ложного пропуска
найденное таким образом, является наибольшим возможным. Это наименее благоприятное распределение при критерии Неймана-Пирсона. В ситуациях, когда значения параметров неизвестны, представляется разумным использовать критерий Неймана-Пирсона, связанный с этим наименее благоприятным распределением, поскольку, как мы покажем ниже, вероятность ложного пропуска не может превышать это значение
независимо от того, какой окажется истинная функция распределения в будущих экспериментах. Эта процедура соответствует использованию минимаксного критерия, за исключением того, что здесь не включены ни цены, ни априорные вероятности двух гипотез.
Чтобы пояснить задачу, предположим сначала, что система параметров
принимает только
дискретных значений
В задаче обнаружения сигнала, например, может быть
возможных сигналов, которые нужно обнаружить, причем только один из них может присутствовать в данном эксперименте. Какой из сигналов присутствует, наблюдателя не интересует. Пусть априорные вероятности значений этих параметров или сигналов будут
при условии
Система вероятностей
дает относительные частоты различных значений параметров, когда гипотеза справедлива, т. е. когда какой-либо из сигналов присутствует. Эти вероятности
могут быть представлены точкой в
-мерном пространстве, и соотношение (5.10) означает, что точка лежит на некоторой гиперплоскости в этом пространстве.
Когда присутствует
сигнал, функцию совместного распределения наблюдений х сокращенно запишем в виде
Функцией совместного распределения х при гипотезе
так же как и раньше, будет
Средняя вероятность ложного пропуска сигнала
где
область пространства наблюдений х, в которой выбирается гипотеза
Критерий Неймана — Пирсона
предписывает минимизировать среднюю вероятность
для фиксированной вероятности ложной тревоги, даваемой выражением
где
область, где выбирается гипотеза
Области
разделены поверхностью решений
положение которой нужно определить. В частности, мы будем искать систему априорных вероятностей
и поверхность решений
такие, чтобы минимальное значение
было наибольшим возможным.
Важное ограничение, накладываемое на априорные вероятности
состоит в том, что они должны быть либо положительны, либо равны нулю:
Говорят, что "вектор
лежит в положительном ортанте
-мерного пространства этих векторов". Это требование обеспечивает дополнительное ограничение рассматриваемой вариационной задачи. С каждой точкой в этом положительном ортанте связано минимальное значение
для данного" значения
и эта минимальная вероятность ложного пропуска может достигать наибольшего значения на границе разрешенной области, т. е. когда некоторые или все априорные вероятности
за исключением одной, равны нулю. Задача определения таких условных экстремальных значений рассматривается в теории линейного программирования и в теории игр [5] Однако пока экстремальное значение лежит внутри разрешенной области, могут быть применены обычные вариационные методы. Вначале мы предположили, что это именно так.
Чтобы найти наименее благоприятное распределение
можно испо тьзовать метод множителей Лагранжа. Ищется экстремальное значение выражения (5.11) при ограничениях,
выражаемых уравнениями (5.10) и (5.12). Для этого нужно кайти значение выражения
являющееся минимальным при вариациях поверхности решений
и максимальным при вариациях величин
Эти вариации могут теперь выполняться независимо. Положение поверхности
и значения
для которых получается экстремальное значение, являются функциями множителей Лагранжа
Значения последних выбираются таким образом, что ограничения, накладываемые равенствами (5.10) и (5.12), удовлетворяются.
Сначала, беря фиксированное
варьируем поверхность
чтобы величина
стала минимальной. Как и в нашем рассмотрении в разд. 3 гл. 3 [см. формулу (3.22)], минимум достигается тогда, когда поверхность решения является одной из семейства поверхностей, описываемых уравнением
Значение параметра X выбирается так, что вероятность ложной тревоги (5.12) равна предписанному значению. Но когда поверхность решений
определяется уравнением (5.14), любые малые вариации
дают увеличение величины
второго порядка малости по сравнению с даваемыми изменением положения поверхности точно так, как это обычно происходит с экстремальными значениями в вариационном исчислении.
Предполагая теперь, что области
разделены поверхностью
даваемой уравнением (5.14), будем варьировать каждое
в выражении (5.13), чтобы максимизировать величину
Эти вариации вызовут как изменение поверхности
так и
явно входящих в выражение (5.13). Но эффект от вариации поверхности
второго порядка малости и, таким образом, имеют значение только вариации в
Поэтому получаем систему
уравнений
Эти уравнения выражают, что для системы
которую мы ищем, стратегия Неймана — Пирсона даст для
сигнала (т. е. для системы значений параметра
вероятность ложного пропуска
принимающую одно и то же значение для всех сигналов:
для
Эти соотношения вместе с уравнением (5.14) и ограничениями, накладываемыми уравнениями (5.10) и (5.12), достаточны для определения системы
априорных вероятностей.
Необходимо проверить, что при этом решении выполняется условие Если это не так, то не существует истинного экстремального значения величины
внутри разрешенной области значений
и нужно искать точку на границе этой области, где минимальная вероятность пропуска
принимает наибольшее значение. При этом существует система значений параметра
для которой соответствующие априорные вероятности
равны нулю. Для остальных значений, однако, вероятности ложного пропуска
равны, так как вариация
может быть выполнена так же, как и раньше, для этих ненулевых
В частности, решение вариационной задачи может указывать на то, что присутствует
один сигнал, например I-й, для которого
Вероятность ложного пропуска
для этого сигнала больше, чем для всех других:
Ниже мы рассмотрим пример, в котором это имеет место.
Система априорных вероятностей
определенная таким способом, является наименее благоприятным распределением для значений параметра
независимо от того, лежит ли система
внутри области допустимых значений
или на ее границе. Для этого наименее благоприятного распределения вероятности ложного пропуска удовлетворяют уравнениям
при условии, что поверхность решений была выбрана в соответствии с уравнением (5.14). Параметр X выбран так, что вероятность ложной тревоги
даваемая (5.12), равна предписанному значению. Наблюдатель при этом уверен, что его стратегия дает желаемую вероятность ложной тревоги и вероятность ложного пропуска не превышает общей границы
даваемой (5.16) независимо от истинной системы относительных частот сигналов (или значений параметров
которые могут иметь место в будущих испытаниях.
(в) Обнаружение сигналов с неизвестными амплитудами
В качестве примера проверки сложных гипотез рассмотрим задачу обнаружения
взаимно исключающих друг друга сигналов
одинаковой формы, но с различными амплитудами
Сначала мы будем предполагать, что все амплитуды положительны, а шум белый и гауссов. Входной сигнал
наблюдается в интервале
Наблюдатель должен произвести выбор между двумя гипотезами:
-присутствует один шум,
присутствует шум плюс один из
возможных сигналов,
Он не знает заранее, какой из сигналов ожидается. Наблюдателю следует применить критерий Неймана — Пирсона для наименее благоприятного распределения априерных вероятностей
сигналов.
В разд. 1 гл. 4 мы нашли, что подходящей стратегией для обнаружения одного из этих сигналов, скажем
является вычисление статистики
для измеренной входной величины
и сравнение найденного значения этой статистики с некоторым критическим уровнем, определенным по предписанному значению вероятности ложной тревоги
Постоянный коэффициент в этой статистике несуществен, его изменения требуют только
относительных частот передаваемых сигналов. Сама стратегия не зависит от возможных амплитуд сигналов, поскольку они должны быть положительны, и поэтому она является равномерно наиболее мощным испытанием.
Распространение результатов подраздела (б) на случай непрерывных областей значений параметра в связано с некоторой неопределенностью, так как наименее благоприятного распределения
может не существовать. Рассмотрим обнаружение сигнала
в белом гауссовом шуме, где
задано, а амплитуда А не задана. Если разрешены только положительные значения А, описанная выше стратегия, использующая статистику
даваемую (5.17), является, очевидно, оптимальной также и для непрерывного случая. Но чем меньше значение амплитуды А, тем больше вероятность ложного пропуска
Максимальное значение
достигается только на границе
интервала
возможных значений амплитуды. В этом случае, к счастью, описанная выше стратегия образует равномерно наиболее мощное испытание и то обстоятельство, что наименее благоприятного распределения не существует, на имеет значения.
Когда амплитуды сигналов
могут быть как положительными, так и отрицательными, равномерно наиболее мощное испытание не существует, так как оптимальная стратегия для сигнала с положительной амплитудой отлична от оптимальной стратегии для сигнала с отрицательной амплитудой. Наименее благоприятная ситуация здесь — ситуация, в которой сигналы каждого знака появляются одинаково часто:
В этом случае стратегия, удовлетворяющая критерию Неймана — Пирсона, состоит в образовании статистики
по формуле (5.17) и в выборе гипотезы
лишь когда
Значение критического уровня
дается формулой
Вероятность пропуска для сигнала с амплитудой
при этом равна
Она может быть вычислена по формуле (5.19), если соответственно изменить пределы интегрирования. Оказывается что вероятность
пропуска теперь больше значения, найденного выше для обнаружения сигналов, об амплитудах которых было известно, что они положительны. Неопределенность в знаке амплитуды сигнала уменьшает вероятность обнаружения сигнала.
В следующем разделе будет рассмотрен случай непрерывного неизвестного параметра, а именно фазы узкополосного сигнала, для которой наименее благоприятное распределение существует. Обычно вычислить такое распределение
очень трудно, если только его нельзя обнаружить сразу на основе некоторой симметрии или естественного порядка имеющихся параметров. Наш анализ в подразделе (б) указывает, что если непрерывное наименее благоприятное распределение
для системы параметра
существует, то вероятность пропуска
постоянна для тех значений 0, для которых
(Это обеспечивается при использовании стратегии Неймана-Пирсона.) Средний коэффициент правдоподобия, даваемый (5.4), вычисляется при этом распределении:
В дальнейшем мы попытаемся спроектировать системы обнаружения, которые эффективно вычисляют средний коэффициент правдоподобия, даваемый формулой (5.4), с использованием наименее благоприятного распределения, если это распределение может быть найдено. Если это невозможно, может быть использовано некоторое разумное априорное распределение. В задачах радиолокации наблюдатель часто располагает дополнительными сведениями, дающими ему возможность ограничить пределы неизвестных параметров сигнала, таких, как время прихода сигнала, или допплеровское смещение несущей частоты.
Заметим, что, если наблюдатель ограничит себя только выбором между двумя гипотезами
он не будет интересоваться действительными значениями параметра
осуществляющимися в данной ситуации. Пытаясь определить эти
значения, он встретится с проблемой статистической оценки параметров, которая будет рассматриваться в гл. 7 и 8.