Главная > Разное > Теория и применение цифровой обработки сигналов
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

12.5. Особенности анализа речи

Качество представления речи рассматриваемой системой зависит от того, насколько полно гребенка из  фильтров представляет спектр речевого сигнала. Простой способ оценки качества состоит в определении импульсной характеристики всей системы и анализе ее преобразования Фурье. Если обозначить импульсную характеристику гребенки фильтров через , то

.               (12.17)

Обозначив сумму косинусов в (12.17) через , т.е.

,                     (12.18)

получим

,                       (12.19)

т.е. импульсная характеристика гребенки фильтров равна произведению импульсной характеристики ФНЧ-прототипа и функции, зависящей только от числа фильтров  и их центральных частот .

Чтобы понять, насколько хорошо  аппроксимирует единичный импульс (возможно, с некоторой задержкой), можно проанализировать либо саму характеристику , либо ее преобразование Фурье. В частном случае равномерного расположения фильтров гребенки по частоте, когда

                                                      (12.20)

(   постоянно),  можно найти,  вычислив сумму   (12.18)

,                                   (12.21)

.         (12.22)

Если , где — целое, то последовательность  периодична с периодом в  отсчетов. Если же отношение  не равно целому числу, то последовательность  непериодична, но имеет пики, следующие через  секунд.

Особенно интересен случай, когда  — целое и нечетное (аналогичные результаты можно получить для четных ), а . Поскольку , то ясно, что этот случай соответствует измерению кратковременного преобразования Фурье на частотах, расположенных равномерно в диапазоне . Если в гребенку фильтров ввести также канал с центром   на нулевой частоте, то можно показать, что

                   (12.23)

Итак, в рассматриваемых условиях  представляет собой периодическую последовательность импульсов с периодом , обратно пропорциональным разнесению каналов по частоте. Поскольку , то ясно, что импульсная характеристика всей гребенки фильтров также является последовательностью импульсов. А так как идеальная импульсная характеристика — это одиночный задержанный импульс, то импульсную характеристику ФНЧ-прототипа  следует выбирать так, чтобы в последовательности  остался только один импульс. Зафиксируем  и , при этом разнесение частот фильтров  будет фиксировано. Тогда если выбрать импульсную характеристику фильтра-прототипа очень короткой, длиной менее , то суммарная импульсная характеристика будет такой, как показано на фиг. 12.13, а. Здесь же пунктиром изображена импульсная характеристика ФНЧ-прототипа, служащая временным окном для входного сигнала. Она совмещена с последовательностью импульсов, представляющей импульсную характеристику гребенки фильтров. В данном случае эта последовательность состоит лишь из одного импульса. Однако подобные короткие импульсные характеристики  соответствуют довольно широкой полосе ФНЧ, не обеспечивающей нужного частотного разрешения. Если же применять более узкополосные фильтры, то длительность импульсной характеристики гребенки фильтров пропорционально увеличится (фиг. 12.13, б), причем она будет состоять из нескольких импульсов, и в синтезированном речевом сигнале появится реверберация. Таким образом, условие хорошего частотного разрешения (т. е. узкие полосы фильтров) вступает в противоречие с условием отсутствия реверберации. Существует, однако, способ, позволяющий (по крайней мере теоретически) в точности согласовать выходной сигнал со входным. Он иллюстрируется на фиг. 12.13, в.

Фиг. 12.13. Компромисс  между  разрешением  по  времени  и  разрешением по частоте.

Здесь используется более широкополосный фильтр, но принято, что значения  в точках, кратных периоду , должны равняться нулю. В этом случае суммарная импульсная характеристика состоит из единственного импульса, задержанного на . Таким образом, выходной сигнал представляет собой задержанную масштабированную копию входного сигнала. Форму соответствующего временного окна можно рассчитать. Итак, с помощью кратковременного фурье-преобразования теоретически можно представить речевой сигнал без искажений.

Во многих практических системах неудобно выбирать параметры так, чтобы суммарная импульсная характеристика изображалась кривой фиг. 12.13, в. Однако уравнения анализа и синтеза можно изменить таким образом, чтобы улучшить характеристику системы, даже если оптимальные характеристики при этом не достигаются. Этот подход иллюстрируется на фиг. 12.14 на примере системы анализа—синтеза, содержащей 39 каналов, размещенных через 100 Гц. Частота дискретизации равна 10 кГц. Пунктирной линией на фиг. 12.14, о слева представлена импульсная характеристика ФНЧ  (фильтра Бесселя шестого порядка), а сплошной — суммарная импульсная характеристика . Последняя кривая иллюстрирует импульсно-периодический характер последовательности  в случае, когда не все каналы анализа используются при синтезе. Видно, что, кроме основного импульса при =10 мс, имеется заметное эхо при =20 мс [период  составляет 10 мс]. На суммарной частотной характеристике эхо проявляется в виде пульсаций модуля и фазы [фиг. 12.14, б и в, слева], а на слух — как реверберация в синтезированном выходном сигнале. Рассмотренный пример, а также то, что  является произведением  и , указывают на два пути улучшения суммарной характеристики гребенки фильтров. Как уже отмечалось, при заданном разнесении каналов можно расширить полосу ФНЧ, сократив таким образом длительность . Согласно фиг. 12.14, а (слева), это приведет к увеличению амплитуды первого импульса и уменьшению второго. Однако в этом случае приходится идти на ухудшение частотного разрешения. Другой подход основан на том, что если  может быть сдвинуто вправо относительно  (т.е. относительно пунктирной кривой), то амплитуда основного импульса увеличится, а эхо станет меньше. В то же время импульс последовательности  в точке , который был полностью подавлен множителем , при сдвиге вправо будет увеличиваться по амплитуде (фиг. 12.14, а, график справа). Поэтому при заданном частотном разрешении существует оптимальная задержка  относительно , при которой  состоит из большого центрального импульса и двух одинаковых малых импульсов слева и справа от него. Можно показать, что при этом условии для заданного частотного разрешения обеспечиваются минимальные пульсации модуля и фазы.

Фиг. 12.14. Импульсные и частотные характеристики двух гребенок фильтров.

Задержку  относительно  можно ввести как при анализе, так и при синтезе речи. Если формулы (12.6а) и (12.6б) записать в виде

,         (12.24)

,          (12.25)

где  — выбранная задержка в числе отчетов, и использовать для синтеза речи соотношение (12.16), то фактическая импульсная характеристика -го канала будет иметь вид

,              (12.26)

а суммарная импульсная характеристика будет равна

.                          (12.27)

Ту же импульсную характеристику канала можно получить иначе, строя систему анализа на основе формул (12.6а) и (12.6б) и заменяя равенство (12.16) соотношением

        (12.28)

где . Третья возможность состоит в использовании для анализа формул (12.24) и (12.25), а для синтеза — равенства (12.28), если . Программа проектирования системы обеспечивает такой выбор параметров, что импульсная и частотная характеристики системы соответствуют кривым, приведенным в правой части фиг. 12.14.

 

<< Предыдущий параграф Следующий параграф >>
Оглавление