10.4. МЕТОДЫ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

10.4. МЕТОДЫ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ

Введение. Одним из методов повышения разборчивости речи является снижение уровней шумов и помех. Но в большинстве случаев они бывают заданными и не зависят от нас, хотя иногда можно снизить помехи от диффузного звука (путем уменьшения акустического отношения), от шумов, проникающих под заглушки, и т. п. Остается возможность манипулирования уровнями речи у слушателя по прямому звуку. Это возможно следующим образом: повышением уровня голоса говорящего, приближением микрофона ко рту и уменьшением неравномерности озвучения (путем приближения минимального уровня прямого звука к максимальному), увеличением индекса тракта. Последний способ возможен только при условии, что в системах звукоусиления не достигнут предельный индекс тракта, а в других системах — рациональный. И, наконец, есть еще способ повышения разборчивости речи — способ такой компрессии динамического диапазона речевого сигнала, при которой происходит повышение уровней слабых звуков речи при сохранении уровней громких звуков речи. Для систем с обратной акустической связью этот метод непригоден, так как возникает

самовозбуждение системы. А в остальных системах слабые уровни речи повышаются на величину компрессии динамического диапазона.

Из компрессоров наиболее применимы ограничители уровня, действие которых сводится к выравниванию пиковых уровней громких звуков, при этом не изменяются соотношения между уровнями слабых звуков. Подробно об этом будет сказано в курсе «Радиовещание».

Амплитудное ограничение. Рассмотрим предельный случай компрессии речи — предельное амплитудное ограничение, при котором речевой сигнал превращается в последовательность прямоугольных импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами. При модуляции сигнала передатчика таким речевым сигналом получается телеграфный режим работы. А это означает, что все звуки речи будут иметь одинаковый и притом максимальный уровень на приеме. Если при передаче неограниченной речи слабые звуки маскировались помехами, то при таком способе передачи они окажутся выше уровней помех и разборчивость будет выше, чем при приеме неограниченной речи. Правда, качество звучания и разборчивость речи в отсутствие помех будут ниже, чем для неограниченной речи, но остаются еще в допустимых пределах. Оказывается, что предельно ограниченный речевой сигнал для слуха будет иметь распределение по частоте и по уровням, не очень сильно отличающееся от распределений неограниченной речи. На рис. 10.1 приведено среднее распределение уровней для предельного ограничения речи (кривая 2) и без него (кривая 7), крутизна кривой изменяется только вдвое, а на рис. 10.3 приведены спектральные огибающие звуков речи также для обоих условий (получаются несколько сглаженные форманты). Это объясняется тем, что слух имеет «комплект» узкополосных фильтров и, когда в одном или нескольких фильтрах уровень в данный момент повышается, То в других он уменьшается и наоборот, в результате чего в каждом из них процесс происходит с переменным уровнем.

В случае непредельного ограничения или компрессии результат получается промежуточный между предельным ограничением и передачей неограниченной, некомпрессированной речи.

Вокодерная связь. Вокодер представляет собой устройство, в передающей части которого из

речевого сигнала выделяются параметры, определяющие информативность речи. К этим параметрам относятся спектральные огибающие звуков речи и параметры основного тона речи, т. е. признаки звуков речи, медленно изменяющиеся во времени.

Рис. 10.3. Спектральные огибающие звуков речи до (Ограничения (сплошные кривые) и после пунктирные) звука «з»; б) звука,

Параметр основного тона управляет частотой генератора основного тона, находящегося в приемной части вокодера. Напряжение от этого генератора, создающего импульсы, сходные с импульсами гортани, подается на сложный фильтр, имитирующий акустическую систему речевого тракта для звонких звуков речи. При синтезе глухих звуков речй генератор создает шумовое напряжение, подаваемое на фильтры, имитирующие систему для глухих звуков речи. Параметрами этих фильтров и уровнем звуков речи управляют параметры, выделенные на передающем конце, в результате чего восстанавливается спектральная огибающая речевого сигнала. Качество и разборчивость восстановленного сигнала получаются достаточно высокими.

В зависимости от типа выделяемых параметров речевого сигнала есть вокодеры полосные, гармонические, формантные и фонемные. В полосных выделяется комплекс ординат спектра в узких полосках, в гармонических — коэффициенты Фурье от разложения спектральной огибающей в сумму гармоник, в формантных — частоты и амплитуды формант, в фонемных — какой звук произнесен. Так как эти параметры изменяются во времени со скоростью произнесения звуков речи (8—10 звуков в секунду), то частотный диапазон каждого параметра не превышает 20—25 Гц. Кроме того, в каждом из перечисленных типов вокодеров выделяется параметр (частота) основного тона голоса.

В полосных вокодерах берут 12—18 полос. Динамический диапазон каждого параметра не превышает поэтому при переводе параметров в импульсную форму достаточен четырехзначный код (16 значений по а во времени достаточно 50 отсчетов в секунду. Необходимая пропускная способность для спектральных параметров требуется передачу основного тона еще а всего В настоящее время уже достигнуто высокое значение разборчивости речи и качества ее при скорости в В гармоническом вокодере требуемая скорость передачи несколько меньшая.

В наиболее распространенном типе формантного вокодера выделяются четыре формантных частоты и четыре формантных уровня. Динамический диапазон этих параметров — не более поэтому достаточны трехзначный код (8 значений по и 40 отсчетов в секунду. Всего получается отводится на передачу мелодии основного тона. Требуемая скорость передачи параметров получается равной

Для фонемного вокодера требуемая скорость передачи пока еще не ниже при этом теряется информация об индивидуальности говорящего.

Применение вокодеров дает повышение разборчивости речи в условиях радиопомех, так как сигналы передаются в телеграфном режиме со специальным помехоустойчивым кодированием. Речь, передаваемая с тожохцью вокодерной связи, идет с высоким уровнем и хорошей разборчивостью даже при наличии сильных помех и замираний. Хорошая помехоустойчивая

радиосвязь получается при формаитном кодировании. Ее применяют на линиях связи.

Импульсная форма сигнала дает возможность кодирования речи [5] аналогично кодированию телеграфной передачи. Такую закодированную речь невозможно подслушать современными методами. Кроме того, вокодерная связь дает возможность значительного увеличения числа каналов в импульсных системах связи. Для обычного речевого сигнала требуется пропускная способность около В этом канале можно разместить около десяти передач при использовании полосного вокодера и около 40 при использовании формантного. В будущем, при разработке фонемного вокодера, эти возможности еще более увеличатся.

Вокодерную связь в США применяют с 1959 г. (в военной авиации для связи). В настоящее время в США выпускается такая аппаратура для коммерческих радиостанций с засекречиванием. Габариты и масса подобной аппаратуры уже находятся в приемлемых пределах. Разрабатываются вокодеры на новых интегральных элементах с цифровыми методами анализа и синтеза речевого сигнала. Это значительно упрощает производство подобных устройств и удешевляет их.

<< Предыдущий параграф

Следующий параграф >>

Оглавление