Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше
Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике
12.7. Полосный вокодер
Полосный
вокодер — это система анализа — синтеза речи, основанная на знании механизмов ее
образования и восприятия. В частности, в полосном вокодере используется
нечувствительность органов слуха к фазе сигнала и воспроизводится только кратковременный
энергетический спектр речевого сигнала (это эквивалентно использованию
амплитуды кратковременного фурье-преобразования без учета его фазы). Огибающая
спектра речи измеряется с помощью гребенки полосовых фильтров, причем предполагается,
что ее форма определяется характеристикой фильтра, образованного голосовым
трактом. Источник возбуждения считается шумовым или импульсным
квазипериодическим. (Таким образом, в вокодере непосредственно используется
модель образования речи с независимыми источником возбуждения и голосовым
трактом.) Существуют различные методы восстановления речи на основе измеренных
параметров. В данном разделе описано несколько схем вокодера и рассмотрены
факторы, влияющие на выбор их конструктивных параметров.
В
типичном полосном вокодере (фиг. 12.17) исходный речевой сигнал
анализируется
гребенкой полосовых фильтров (в данном случае их 16), неравномерно
перекрывающих диапазон, существенный для восприятия речи (обычно от 0 до 3
кГц). Особенности проектирования этих фильтров будут рассмотрены ниже.
Колебания на выходах полосовых фильтров детектируются и проходят через ФНЧ,
выходные сигналы которых
в той или иной степени представляют
огибающую спектра речи. Параметры, характеризующие источник возбуждения,
получаются с помощью обнаружителя тон—шум, определяющего, является ли звук
звонким (голосовые связки вибрируют) или глухим. В первом случае выделитель
основного тона определяет основную частоту вибрации связок
.
Шестнадцать
канальных сигналов, сигнал тон—шум и значение высоты основного тона кодируются
и передаются по каналу связи к приемнику. Предположим, что передача происходит
без ошибок. Тогда задача приемника сводится к восстановлению речи на основе
переданных параметров. Источником возбуждения служит либо генератор импульсов,
частота которого синхронизируется сигналом
, либо генератор шума. В
зависимости от сигнала тон—шум один из них подключается к гребенке фильтров,
идентичных фильтрам анализатора, и возбуждает их. Продетектированные сигналы
огибающей спектра используются для модуляции колебаний на выходах
соответствующих полосовых фильтров, за счет чего создается звуковая мощность в
каждой из частотных полос. Синтезированный речевой сигнал получается после
суммирования всех промодулированных полосовых колебаний.
Фиг.
12.17. Блок-схема типичного полосного вокодера.
Одним
из назначений вокодеров является передача речи удовлетворительного качества
при малой скорости передачи информации. Во многих работах рассматривалось,
какой должна быть скорость передачи, необходимая для полного представления
параметров, используемых в полосном вокодере. Хотя в вокодерах различных типов
требуется разная скорость, было показано, что для большинства из них она лежит
в пределах от 2400 до 9600 бит/с. Вообще качество речи монотонно зависит от
скорости передачи.
Так,
лучше всего вокодеры звучат при скорости 9600 бит/с, а при 2400 бит/с речь для
большинства слушателей становится почти неразборчивой.