Глава 13. РАСПОЗНАВАНИЕ ОБРАЗОВ
13.1. ВВЕДЕНИЕ
Широким классом задач, относящихся к проверке статистических гипотез, является распознавание образов. Собственно говоря, это настолько емкое понятие, что его можно считать синонимом проверки гипотез, а изученные выше задачи обнаружения объектов могут рассматриваться как случаи распознавания образов. По сути дела, к распознаванию образов сводятся любые задачи классификации объектов, ситуаций, процессов и т. д. на основании наблюдения выборочных значений некоторых случайных величин или реализаций случайных процессов.
Однако здесь рассматривается распознавание образов отдельно (например, от обнаружения объектов или сигналов) для объединения с помощью этого термина только тех задач, в которых наблюдаемые физические сигналы-носители информации во всех возможных ситуациях содержат не только шумы или помехи, но и полезные сигналы, связанные с некоторыми распознаваемыми объектами или процессами.
Ясно, что к такому определению относится много задач, имеющих разный физический смысл и технические приложения. В качестве примеров достаточно упомянуть распознавание объектов, наблюдаемых радиолокатором по характеристикам отраженных от них радиолокационных сигналов, смешанных с шумами или помехами; распознавание объектов по их оптическим изображениям (в частности, полученным фотографированием); распознавание людей по их голосам; определение видов животных, живших в разные эпохи по остаткам их костей; диагностика заболеваний по некоторой совокупности наблюдаемых признаков и т. д.
Во всех случаях наблюдаются некоторые, вообще говоря, случайные данные или сигналы и на основе их наблюдения производится классификация, т. е. результаты наблюдений связываются с тем или иным классом объектов, процессов, ситуаций.
Из статистической сущности процессов распознавания вытекает адекватность для синтеза распознающих систем и анализа качества их работы методов теории статистических решений. При полностью известных законах распределения вероятностей распознаваемых ситуаций и наблюдаемых сигналов могут отыскиваться байесовы правила распознавания, минимизирующие средний риск. Однако в большинстве практических задач, связанных с распознаванием, упомянутые законы распределения известны не полностью, а в лучшем случае с точностью до совокупности некоторых параметров. Часто сигналы, имеющиеся при наличии различных распознаваемых ситуаций, представляются функциями заданных видов, зависящими от некоторого числа неизвестных параметров. Эти параметры принимают разные значения при изменении внешних условий или в принятых выше терминах «обстановки» работы системы распознавания.
Такими параметрами могут являться, например, задержка модуляции отраженного от объекта радиолокационного сигнала, пропорциональная неизвестной дальности до объекта; амплитуда этого сигнала, зависящая от отражающей поверхности объекта; признаки побочных заболеваний, влияющие на характеристики основного заболевания человека, выявляемого при постановке диагноза и т. д.
Неизвестными дополнительными параметрами могут быть и пара метры шумов, с которыми смешиваются сигналы, а также в конечном итоге любые другие параметры законов распределения вероятностей для величин, на основании наблюдения которых производится распо знавание.
При наличии подобной параметрически заданной априорной неопределенности задачи распознавания образов сводятся к проверке, вообще говоря, многоальтернативных гипотез при наличии неизвестных параметров принимаемых сигналов и, возможно, априорных распределений для распознаваемых ситуаций. Если ограничиться задачами, в которых подразумевается наблюдение сигнала в какой-то одной распознаваемой ситуации, то параметры априорного распределения вероятностей ситуаций восстановлены быть не могут и поэтому мы ограничимся далее рассмотрением случаев неизвестных параметров распределений вероятностей лишь наблюдаемых сигналов.
В этих условиях оптимальные системы распознавания являются адаптивными, производящими наряду с распознаванием образов оценку параметров обстановки, в которой производится распознавание, и могут быть найдены путем непосредственного применения теории, развитой выше.
В частности, при наличии двухальтернативных ситуаций, которые надо распознать, при классической процедуре анализа оптимальная система распознавания должна составлять отношение правдоподобия
и сравнивать его с порогом
Здесь и -плотности вероятности принимаемых сигналов при наличии объектов (ситуаций) первого и второго распознаваемых классов соответственно; и — векторы
неизвестных параметров обстановки, характерной для этих двух классов ситуаций; оценки максимального правдоподобия этих величин; параметры, определяющие величину порога имеют смысл, указанные в гл. 11, и определяются приведенными там формулами.
Могут применяться также процедуры последовательного анализа и рекуррентного составления отношения правдоподобия с принятием решений на каждом шаге и с последующим их уточнением. Соответствующие формулы могут быть заимствованы из гл. 11. Никакой специфики задачи распознавания образов в них не вносят. В настоящей главе мы применим упомянутые результаты к некоторым задачам, относящимся к распознаванию образов, получив при этом оптимальные алгоритмы адаптивного распознавания, соответствующие им функциональные схемы распознающих устройств, а также в ряде случаев статистические характеристики распознавания. Кроме того, отдельно рассмотрим случай, в котором различны лишь априорные распределения для распознаваемых ситуаций, а распределения вероятностей для принимаемых сигналов одинаковы.