СИНТЕЗ РЕЧЕВЫХ СИГНАЛОВ
— создание речевых сигналов искусственным образом с помощью технических устройств. Одну из первых «говорящих машин» создал в конце 18 в. Кемпелен. Роль легких выполняли меха, «речевой тракт» представляли ящички, колеблющиеся язычки и мягкая трубка. Машина, управляемая оператором, создавала звуки, похожие на речевые, из которых можно было составить слова и даже фразы. Позже было сконструировано много подобных мех. моделей. С развитием электроники и электроакустики стали создавать электр. синтезаторы. Первым из них считается «вокодер» Дадли (1939).
Современные синтезаторы состоят, как правило, из двух осн. узлов; источника сигнала возбуждения и блока формирования передаточной характеристики речевого тракта. В источнике возбуждения для синтеза гласных имеется генератор периодических колебаний сложной формы, имитирующий работу голосовых связок. Для синтеза шумных согласных («с», «ш», «ф») требуется применение генератора шума, а для синтеза некоторых звонких («з», «ж») — обоих генераторов одновременно. Синтезаторы по строению блока формирования передаточной характеристики можно разделить на три осн. типа: полосный, формантный, аналог речевого тракта.
В полосном синтезаторе передаточная характеристика речевого тракта воспроизводится приближенно вследствие использования небольшого числа полосовых фильтров (обычно 5—7). В формантном — приближение более точное благодаря применению элементов с резонансной характеристикой, воссоздающих осн. «полюсы» (форманты) речевого тракта. Наиболее точное моделирование с учетом распределенного характера параметров речевого аппарата человека получается на аналоге речевого тракта, использующем, напр., неоднородную Электр, линию, составленную из звеньев с переменными параметрами. Этот тип синтезатора наиболее целесообразен для воспроизведения особенностей голоса любого человека.
Практическое осуществление С. р. с. связано с проблемой управления синтезатором. В системах синтетической телефонии, осуществляющих сжатие объема речевого сигнала в процессе его передачи по каналам связи, управляющие сигналы поступают непосредственно с выхода т. н. анализатора спектра речевого сигнала. В других же случаях С. р. с. осуществляется по правилам из некоторых исходных элементарных сигналов. Эти сигналы описывают составные части фонем, сами фонемы и их различные варианты, слоги и слова. Вопросы выбора элементарных сигналов и правил составления из них речи разработаны еще далеко не полностью. Особенно трудным оказывается получение естественных, переходов между звуками и учет взаимного влияния звуков. С помощью ЭВМ реализованы первые экспериментальные программы синтеза речи, позволяющие синтезировать связную речь. Входными данными для таких программ является последовательность кодов, соответствующих параметрам фонем, которые требуется воспроизвести. Однако синтезируемая этими программами речь характеризуется еще низкой словесной разборчивостью (можно разобрать около 70—80% слов).
Наряду с озвучиванием произвольных текстов создаются простейшие системы С. р. с., основанные на считывании (проигрывании) заранее записанных речевых сигналов отдельных слов. Таковы устройства «IВМ-7770» и «IBM-7772», которыми оснащены системы «IВМ-360». С. р. с. с помощью этих устройств сводится к указанию последовательности, в которой должны быть воспроизведены слова. Устройства такого типа являются усовершенствованием автоответчика. Они решают весьма частную задачу С. р. с. Решение задачи автомат. С. р. с., как и решение задачи автомат, распознавания речевых сигналов, позволит осуществить эффективную двустороннюю связь человека с ЭВМ посредством голоса.
Лит.: Сапожков М. А. Речевой сигнал в кибернетике и связи. М., 1963 [библиогр. с. 419—450]; Фант Г. Акустическая теория речеобразования. Пер. с англ. М., 1964 [библиогр. с. 278—284]; Фланаган Д. Л. Анализ, синтез и восприятие речи. Пер. с англ. М., 1968 [библиогр. с. 378—392].
В. Н. Мутников.