12.21. Заключение
Материалы настоящей главы позволяют проследить, насколько тесно цифровая обработка сигналов и исследования речевых сигналов связаны друг с другом. Фактически только после появления вычислительных машин, предназначенных для обработки сигналов, и развития соответствующих алгоритмов удалось практически решить большинство задач анализа и синтеза речи.
Следует еще раз отметить, что конкретные задачи, рассмотренные в данной главе, являются лишь типичными примерами из области исследования речи и никоим образом не претендуют на полное описание большого числа работ, проводимых в этой области. Более того, рассмотренные конкретные системы не обязательно являются оптимальными для решения соответствующих задач. Их выбор прежде всего объясняется знакомством авторов книги с основными принципами построения этих систем, а также тем, что все они связаны с применением цифровых методов обработки сигналов.
ЛИТЕРАТУРА
Литература общего характера
1. Flanagan J. L., Speech Analysis, Synthesis and Perception, 2nd ed., Springer-Verlag, N.Y., 1972; есть русский перевод: Фланаган Дж. Л., Анализ, синтез и восприятие речи, изд-во «Связь», 1968.
2. Schafer R. W., A Survey of Digital Speech Processing Techniques, IEEE Trans, on Audio and Electroacoustics, AU-20, No. 4, 28—35 (March 1972).
3. Flanagan J. L., Coker С. H., Rabiner L. R., Schafer R. W., Umeda N.r Synthetic Voices for Computers, IEEE Spectrum, 7, No. 10, 22—45 (1970).
Кратковременный спектральный анализ
1. Flanagan J. L., Golden R. M., Phase Vocoder, Bell Syst. Tech. J., 45, 1493— 1509 (1966).
2. Schafer R. W., Rabiner L. R., Design of Digital Filter Banks for Speech Analysis, Bell Syst. Tech. J., 50, No. 10, 3097—3115 (Dec. 1971).
3. Schafer R. W., Rabiner L. R., Design and Simulation of a Speech Analysis-Synthesis System Based on Short-Time Fourier Analysis, IEEE Trans, on Audio and Electroacoustics, AU-21, 165—174 (June 1973).
Полосные вокодеры
1. Schroeder M. R., Vocoders: Analysis and Synthesis of Speech, Proc. IEEE, 54, 720—734 (1966); есть русский перевод: Шредер, Вокодеры: анализ и синтез речи, ТИИЭР, т. 54, № 5, стр. 5—29 (1966).
2. Gold В., Rader С. М., Systems for Compressing the Bandwidth of Speech, IEEE Trans, on Audio and Electroacoustics, AU-15, No. 3, 131—135 (Sept. 1967).
3. Golden R., Vocoder Filter Design: Practical Considerations, J. Acoust. Soc. Am., 43, 803—810 (April 1968).
4. Gold В., Rader С. M., The Channel Vocoder, IEEE Trans, on Audio and Electroacoustics, AU-15, No. 4, 148—160 (Dec. 1967).
Выделение основного тона
1. Gold В., Computer Program for Pitch Extraction, J. Acoust. Soc. Am., 34, 916-921 (1962).
2. Gold В., Description of a Computer Program for Pitch Detection, Proc. Int. Cong. Acoustics, 4th, Copenhagen, Paper G34, 1962.
3. Gold В., Note on Buzz — Hiss Detection, J. Acoust. Soc. Am., 36, 1659 — 1661 (1964).
4. Gold В., Rabiner L. R., Parallel Processing Techniques for Estimating Pitch Periods of Speech in the Time Domain, J. Acoust. Soc. Am., 46, No. 2, 442—449 (Aug. 1969).
5. Noll A. M., Cepstral Pitch Determination, J. Acoust. Soc. Am., 41, 293— 309 (1967).
Гомоморфная обработка речи
1. Oppenheim A. V., Schafer R. W., Stockham T. G., Nonlinear Filtering of Multiplied and Convolved Signals, Proc. IEEE, 56, 1264—1291 (1968); есть русский перевод: Оппенхейм, Шефер, Стокхэм мл., Нелинейная фильтрация сигналов, представленных в виде произведения и свертки, ТИИЭР, т. 56, № 8, стр. 5—46 (1968).
2. Oppenheim А. V., Schafer R. W., Homomorphic Analysis of Speech, IEEE Trans, on Audio and Electroacoustics, AU-16, 221—226 (1968).
3. Oppenheim A. V., Speech Analysis-Synthesis System Based on Homomorphic Filtering, J. Acoust. Soc. Am., 45, 459—462 (1969).
4. Schafer R. W., Rabiner L. R., System for Automatic Analysis of Voiced Speech, J. Acoust, Soc. Am., 47, Part 2, 634—648 (1970).
Формантные синтезаторы
1. Rabiner L. R., Digital-Formant Synthesizer for Speech Synthesis Studies, J. Acoust. Soc. Am., 43, 822—828 (1968).
2. Gold В., Rabiner L. R., Analysis of Digital and Analog Formant Synthesizers, IEEE Trans, on Audio and Electroacoustics, AU-16, 81—94 (March 1968).
3. Rabiner L. R., Jackson L. В., Schafer R. W., Coker С. H., Digital Hardware for Speech Synthesis, IEEE Trans, on Communication Tech., COM-19, 1016— 1020 (1971).
Линейное прогнозирование речи
1. Atal В. S., Hanauer S. L., Speech Analysis and Synthesis by Linear Prediction of the Speech Wave, J. Acoust. Soc. Am., 50, 637—655 (1971).
2. Itakura F., Saito S., An Analysis — Synthesis Telephony System Based On Maximum Likelihood Method, Electronics and Communication in Japan, 53A, 36—43 (1970).
3. Makhoul J. I., Wolf J. J., Linear Prediction and the Spectral Analysis of Speech, Bott, Beranek, and Newman Report 2304, Aug. 1972.
4. Markel J. D., Gray A. H., Jr., Wakita H., Linear Prediction of Speech-Theory and Practice, Speech Communication Research Lab. Monograph No. 10, Sept. 1973.
Системы речевого ответа для ЦВМ
1. Rabiner L. R., Schafer R. W., Flanagan J. L., Computer Synthesis of Speech, by Concatenation of Formant-Coded Words, Bell Syst. Tech. J., 50, No. 5, 1541-1558 (May-June 1971).
2. Flanagan J. L., Rabiner L. R., Schafer R. W., Denman J., Wiring Telephone Apparatus from Computer-Generated Speech, Bell Syst. Tech. J., 51 v No. 2, 391—397 (Feb. 1972).