Главная > Преобразования Фурье, Уолша, Хаара и их применение в управлении, связи и других областях
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

§ 3. Спектральный состав речевых сигналов, модели формирования речи

А. Спектральный состав речевых сигналов. Методика анализа речи.

Методы обработки речевых сигналов с использованием алгоритмов преобразования Фурье и при применении цифровых фильтров основаны на выводах, исходными для которых являются представления о физических процессах речеобразования и о возможностях их моделирования. Для каждого из звуков человеческой речи характерен особый спектр колебаний. В формировании речи участвуют органы человека, схематически показанные на рис. 5.1, д. Для этого рисунка приняты обозначения: 1 — мускульная сила, 2 — легкие, 3 — трахея и бронхи, 4 — голосовые связки, 5 — гортанная трубка, 6 — глоточная полость, 7 — мягкое нёбо, 8 — спинка языка, 9 — полость рта, 10 — носовая полость, 11 - ротовой звук, 12 — носовой звук. Ниже приводятся лишь краткие сведения о процессах речеобразования. Подробно взаимодействие показанных на рис. 5.1,а органов описано в книге [131], а также в книгах [100,101].

Различают звонкие и глухие фрикативные звуки. Звонкие звуки генерируются при прохождении воздуха через щель между голосовыми связками. Колеблющимися голосовыми связками формируются широкополосные квазипериодические порции воздуха. Глухие звуки получаются при прохождении воздуха через суженный голосовой тракт. При этом поток воздуха становится турбулентным, квазислучайным. На рис. 5.1,5 наверху показаны речевые колебания при произнесении одного из гласных звуков, а внизу — при произнесении одного из глухих звуков. Длительность записи каждого из этих колебаний 0,075 с. Фрикативные звуки, называемые

Рис. 5.1 (см. скан)

глухими взрывными (например, отдельно произносимая буква получаются при полном закрытии и последующем резком открытии голосовой щели.

При произнесении каждого звонкого звука характеристика голосового тракта определяется собственными резонансными его частотами, называемыми формантными частотами или формантами. Сочетания формант различны для разных звуков. Уже первые три или четыре форманты являются определяющими, если иметь в виду восприятие речи человеком. В качестве иллюстрации на рис. 5.1,в показаны спектры двух различных гласных звуков [131]. Здесь на каждой позиции по горизонтальной оси отложены значения частоты в герцах, а по вертикальной оси относительный уровень амплитуд колебаний в децибелах (при сравниваемых величинах мощности сигнала один децибел равен

Голосовой тракт, представляющий собой систему с медленно изменяющимися параметрами, может рассматриваться как акустическая трубка, находящаяся под воздействием периодического или шумового колебания. Речевой сигнал является откликом указанной системы на соответствующие возбуждающие колебания. Возникают различные звуки благодаря изменению формы голосового тракта. Когда форма голосового тракта остается неизменной, выходной сигнал образуется как свертка возбуждающего сигнала и импульсного отклика голосового тракта. Можно считать, что так же формируется речевой сигнал и тогда, когда форма голосового тракта медленно изменяется, но при условии, что рассматриваются короткие промежутки времени. При таком представлении речевого сигнала его преобразование Фурье равно произведению преобразований Фурье возбуждающего сигнала и голосового тракта. Таким же образом связаны между собой соответствующие z-преобразования сигналов.

В некоторых случаях оказывается полезным рассмотрение передаточной функции голосового тракта. Форманты речевого сигнала в основном определяются полюсами передаточной функции, однако для фрикативных звуков нужно учитывать как полюса, так и нули передаточной функции.

Анализ речевых сигналов обычно сводится к тому, что разделяют характеристики возбуждающей функции и функции голосового тракта и порознь определяют параметры возбуждения и голосового тракта. В отношении возбуждающей функции выясняют, является ли она периодической или шумовой, в первом случае возникает необходимость определения частоты основного тона колебаний.

1
Оглавление
email@scask.ru