12.9. Синтезаторы вокодеров. Особенности обработки сигналов
Методика
расчета элементов синтезатора достаточно проста. Как уже обсуждалось, полосовые
фильтры синтезатора в большинстве случаев идентичны фильтрам анализатора.
Часто, однако, вместо стандартной схемы канального синтезатора применяют другой
вариант, называемый каналом с выравниванием спектра (фиг. 12.19). Перед
модуляторами включены жесткие (двухуровневые) ограничители, на выходе которых
образуется сигнал типа меандра, принимающий в зависимости от знака входного
сигнала, значения
или
. Эти прямоугольные колебания
постоянной мощности поступают на входы модуляторов.
В
установившемся режиме сигнал возбуждения тонового (звонкого) звука создает
набор «меандров» с частотами, близкими к гармоникам основного тона. Таким
образом, поведение канала с выравниванием спектра должно совпадать с поведением
стандартного канала, если через первый полосовой фильтр проходит только одна
гармоника, поскольку третья и высшие гармоники, образующиеся при жестком
ограничении, отфильтровываются выходным полосовым фильтром. Однако эти две
схемы дают разное звучание даже при высокой основной частоте, когда в каждый
фильтр попадает заведомо только одна гармоника.
Фиг. 12.19. Сопоставление стандартной и
модифицированной схем канального синтезатора вокодера.
Для
объяснения этого явного несоответствия следует учесть, что спектр источника
звука в гортани не постоянен, а флуктуирует во времени. Эти флуктуации вызваны
как изменением сечения гортани, так и непостоянством частоты вибрации
голосовых связок. Анализатор вокодера выделяет только частоту, но не форму
колебаний голосовых связок. Тот факт, что выравнивание спектра существенно
влияет на качество синтезированной речи, означает, что флуктуации спектра речи
по крайней мере отчасти вызваны различием формы соседних звуковых импульсов,
образующихся в гортани.
Быстрые
флуктуации спектра, вызванные изменением частоты повторения импульсов
возбуждения, можно исследовать количественно, вычисляя энергетический спектр
трех импульсов (фиг. 12.20). Расчет дает
. (12.29)
Если
(т.е.
ширина импульса мала по сравнению с расстоянием между импульсами), то
в рассматриваемом
диапазоне частот. Спектры
для
и
изображены на фиг. 12.21.
Фиг. 12.20. Импульсы возбуждающего
сигнала для тоновой речи.
Если
приведенные рассуждения справедливы, то флуктуации спектра, вызванные
нестабильностью основного тона, проявятся как при спектральном анализе, так и
при выделении высоты основного тона. Выравнивание спектра эффективно устраняет
(в случае, если в каждый фильтр попадает не более одной гармоники) флуктуации
спектра, связанные с нестабильностью сигнала возбуждения.
Если
основная частота мала, так что в фильтры попадают по нескольку гармоник, то
схема выравнивания спектра не будет полностью сглаживать спектр возбуждения. Это
связано со спецификой ограничения суммы двух гармоник: более слабая из них
подавляется. Рассмотренные трудности можно в значительной степени преодолеть,
заменив ограничитель системой автоматической регулировки усиления (АРУ),
изображенной на фиг. 12.22. В этой системе задержанный узкополосный сигнал
делится на собственную среднюю интенсивность. Задержка
в ФНЧ согласована с задержкой
сигнала. Если
стремится
к нулю, сигнал на выходе делится на собственный модуль, т.е. в предельном
случае система АРУ переходит в двухуровневый ограничитель. При умеренных
задержках (порядка 10 мс) спектральные искажения весьма малы, даже если
присутствует не одна гармоника. Короче говоря, выравнивание спектра методом
АРУ сохраняет амплитудные соотношения в полосе фильтра и устраняет флуктуации
спектра при переходе от фильтра к фильтру. Поскольку при этом не возникает (или
почти не возникает) третьей гармоники, можно вообще не применять выходной
полосовой фильтр в каждом канале.
Фиг. 12.21. Спектры двух
различных импульсных последовательностей.
Фиг. 12.22. Автоматическая регулировка усиления
в вокодере.