11.5. СОКРАЩЕНИЕ ИЗБЫТОЧНОСТИ. СЖАТИЕ ДАННЫХ
Дальнейшее повышение эффективности СПИ связано с кодированием источника. Эффективность кодирования источники полностью определяется его избыточностью
-аеи Избыточность источника дискретных сообщений и обусловлена тем, что элементы сообщения (например, буквы в тексте) не равновероятны и что между буквами имеется статистическая связь (корреляция). Обозначим эти составляющие избыточности, соответственно через
Полная избыточность источни а будет
Расчёты показывают, что для текста на русском языке
Отсюда следует, что основная избыточность обусловлена не распределением вероятностей, а статистической связью между буквами. Аналогичная картина имеет место и при цифровой передаче речи: большая избыточность речевого сигнала обусловлена прежде всего наличием сильных корреляционных связей между отсчётами. Это означает, что наиболее эффективными методами сокращения избыточности источника будут те, которые основаны на декорреляции сообщений. К таким методам относятся при телеграфии методы укрупнения алфавита, а при цифровой передачи речи — методы дифференциального кодирования (методы с предсказанием). Кодирование с учётом только распределения вероятностей (код Шеннона-Фано, код Хаффмэна) малоэффективно. Коды же, учитывающие статистические связи между буквами, ока зываются сложными и требуют значительной задержки передачи при кодировании и декодировании длинных последовательностей сообщений источника. Поэтому в системах телеграфной связи эти методы кодирования не нашли практического применения — их техническая реализация пока оказывается экономически нецелесообразной.
Иначе обстоит дело с устранением избыточности в непрерывных сообщениях, в частности в телефонии и телевидении. Избыточность речевого сигнала очень велика. Об этом можно судить хотя бы потому, что для передачи какого-нибудь текста по телефону применяется канал с пропускной способностью в десятки раз большей, чем для его передачи по телеграфу.
Было предложено много методов обработки телефонного сообщения с целью устранения его избыточности. Некоторые устройства, осуществляющие такую обработку, называют вокодерами, которые строятся на различных принципах. Одни из них (формантные вокодеры) передают в кодированном виде значения амплитуд составляюших речевого сигнала в отдельных полосах частот, определяющих разборчивость речи. Другие (гармонические вокодеры)
осуществляют измерения текущего энергетического спектра речи, разлагают спектральную плотность в ряд Фурье и передают в кодированной форме несколько первых коэффициентов этого ряда. В приёмнике на основе этих данных синтезируется речевой сигнал, аналогичный исходному. Такие системы синтетической телефонии позволяют примерно в 10 раз сократить полосу частот при достаточно хорошей разборчивости речи.
Имеется ещё одна возможность повышения эффективности связи при передаче телефонных сообщений. Она основана на том, что при двусторонней телефонной связи каждый абонент говорит в среднем не более половины времени, а остальное время слушает ответ. Кроме того, речь всегда содержит определённые паузы между словами и фразами. Сюда следует добавить время ожидания, пока подойдёт абонент к телефону, и различные перерывы в разговоре, во время которых канал В остаётся занятым, а информация не передаётся. В настоящее время известен целый ряд систем связи, в которых телефонные паузы используются для передачи дополнительной информации. Передача данных, например, в паузах телефонного сигнала позволяет в 2...3 раза повысить эффективность использования каналов тональной частоты.
Ещё более остро стоит проблема устранения избыточности телевизионного сообщения. Эта избыточность чрезвычайно велика, что, в частности, выражается в широкой полосе пропускания, необходимой для телевизионного канала. В вещательных системах телевидения с целью плавного воспроизведения движения приходится, как и в кино, передавать последова тельность кадров, весьма мало отличающихся друг от друга. Соседние строки внутри кадра так же как и соседние элементы изображения на одной строке, тоже очень сильно коррелированы. Всё это порождает огромную избыточность; которую можно было бы устранить, например, передавая значительно меньшее число элементов в секунду и производя соответствующую интерполяцию.
При цифровой передаче непрерывных сообщений необходимая полоса частот канала увеличивается примерно в 10...15 раз по сравнению с аналоговой передачей. Таким образом, к естественной избыточности сообщения добавляется частотная избыточность сигнала. Для таких систем задача сокращения избыточности стоит особенно остро. Для решения этой задачи широко используются системы с предсказанием АДИКМ (адаптивная дифференциальная импульсно-кодовая модуляция) и АДМ (адаптивная дельта-модуляция), которые были рассмотрены в гл. 8. Эти системы рекомендованы МККТТ для цифровой передачи со скоростью 32 кбит/с. В сочетании с интерполяцией речи АДИКМ позволяет снизить скорость цифрового потока до 16 и даже 9,6 кбит/с при том же качестве передачи речевой информации, что и в ИКМ, при стандарте 64 кбит/с.
Метод предсказания широко используется и в вокодерных системах. В этих системах, в отличие от систем ДИКМ, в которых кодируются отсчёты первичного сигнала, в вокодерах кодируются отдельные параметры сигнала. В сочетании с вокодерами АДИКМ позволяет снизить скорость цифрового потока до 2,4 кбит/с.
Наряду с предсказанием для сокращения избыточности непрерывных сообщений также используются методы декорреляции, основанные на аппроксимации непрерывных сигналов с помощью различных базисных функций. Чаще всего в качестве таких функций используются степенные полиномы нулевого и первого порядка. Отмечен интерес к интерполяционным методам сжатия данных с применением кусочно-полиномиальной интерполяции на основе сплайн-функций.
Высокая эффективность цифровых систем со сжатием данных, очевидно, будет достигаться в том случае, когда кодек источника согласован с цифровым каналом, включающим в себя кодек канала, модем и непрерывный канал. При этом необходимо учитывать то обстоятельство, что символы сжатой кодовой последовательности имеют более высокую информа тивность и различный вес в воспроизведении передаваемых отсчётов первичного сигнала. В ряде случаев в канале используется помехоустойчивое кодирование с учётом веса символов (неравная защита). В общем же для передачи сжатых данных требуется хороший цифровой канал, обеспечивающий достаточно малую вероятность ошибки передаваемых кодовых символов. Наиболее полное согласование, очевидно, возможно при совместном кодировании источника и канала.
Кодирование источника и помехоустойчивое кодирование канала связаны между собой. Уменьшение избыточности источника
влечет за собой необходимость увеличения