4.3. Другие применения ДА
4.3.1. Распознавание сигналов.
До сих пор рассматривали задачи, в которых ресурсы, используемые на выработку решающего правила и на саму классификацию нового объекта, не учитывались. При распознавании сигналов картина, как правило, другая: и выработка решающего правила должна быть доступна используемому микропроцессору и классификация (идентификация) объекта должна произойти за конечное время (часто доли секунды).
В качестве примера подобной задачи рассмотрим речевое общение с ЭВМ.
Сначала диктор начитывает ЭВМ используемый им словарный фонд (задает «эталоны»), а затем в ходе общения машина должна правильно идентифицировать произносимые им слова и принимать соответствующие, заранее предусмотренные действия.
В работе [1441 образ слова в ЭВМ состоит из (-мат-рицы чисел, столбцы которой соответствуют полосам частот в диапазоне от 200 до 5000 Гц и их число фиксировано, строки — последовательным отсчетам времени через 5—15 миллисекунд и их число зависит от длительности произнесения слова, а элементы соответствуют спектральной плотности сигнала на выходе фильтра соответствующей полосы, оцененной за соответствующий интервал времени, и отдельно числа , показывающею, сколько пересечений нулевого уровня сделано сигналом при произнесении слова.
На повторное произнесение одного и того же слова диктор, вообще говоря, тратит разное время. Поэтому при идентификации слов обязательно производится выравнивание времен так, чтобы допустить небольшие колебания в длительности произношения отдельных звуков.
Отложим по оси абсцисс точки , соответствующие последовательным отсчетам первого слова, а по оси ординат — точки , соответствующие отсчетам второго. Рассмотрим далее прямоугольник с вершинами (рис. 4.2). Точки прямоугольника с целочисленными координатами назовем узлами. Каждой ломаной, выходящей из узла (1,1) и идущей в узел по правилу, что из узла ломаная может попасть только в один из узлов , соответствует вариант сопоставления последовательных отсчетов двух слов. Ограничения на колебания длительности произнесения отдельных звуков можно задать в виде прямых, параллельных диагонали прямоугольника.
Расстояние между двумя словами берется как минимум по разрешенным колебаниям суммы (по столбцам и строкам) квадратов разностей соответствующих элементов матриц, т. е. берется простейшее расстояние. Новое слово идентифицируется с тем эталоном, к которому оно оказывается ближе. В настоящее время на распознавание одного слова при словаре в 100—200 слов и одном дикторе коммерческие системы тратят до 1—2 с времени и обеспечивают среднюю правильность результатов опознания 98-99 %.
Один из путей повышения надежности распознавания — это сопоставление с одним словом нескольких эталонов, как это предложено в п. 1.1.3.