Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 1.6. Постановка задачи кодирования дискретных источников равномерными кодамиОбозначим через А некоторое множество, состоящее из Последовательность кодовых символов называется кодовым словом, а любое семейство кодовых слов — кодом над алфавитом А. Пример 1.6.1. Пусть А—множество букв русского алфавита (включая пробел). Любая последовательность букв заданной длины Пример 1.6.2. Пусть Определение 1.6.1. Код называется разномерным, если все его слова имеют одинаковую длину Количество различных слов равномерного кода длины Определение 1.6.2. Кодированием сообщений ансамбля X посредством кода называется отображение (необязательно взаимно однозначное) множества сообщений в множество кодовых слов. Пример 1.6.3. Пусть
Рассмотрим теперь кодирование дискретного источника. Для того чтобы лучше понять основные проблемы, возникающие при кодировании, мы рассмотрим несколько подробных примеров. Пример 1.6.4. Предположим, что на центральном телеграфе введена автоматическая обработка телеграмм, записанных в алфавите, объем которого для простоты будем считать равным 64 буквам (сюда входят сами буквы, русские и латинские, цифры, знак пробела и некоторые вспомогательные знаки). Предположим, что эффективность такой обработки определяется количеством телеграмм, которые можно ввести в запоминающее устройство Рассмотрим вначале так называемое побу к венное кодирование. В этом случае используют код, содержащий Второй способ кодирования состоит в том, что выделяется специальный словарь, например, из При кодировании можно условиться о том, что всякое слово, не содержащееся в словаре, кодируется так же, как слово «ошибка». При декодировании вместо этих слов будет воспроизводиться слово «ошибка». Таким образом, второй способ является значительно более эффективным. Полученный эффект объясняется тем, что далеко не всякая последовательность букв встречается в языке, а тем более среди слов телеграмм. Имеются почти невероятные буквосочетания, например, Заметим, что при побуквенном кодировании все слова телеграмм могут быть однозначно (безошибочно) закодированы. Изложенная в примере 1.6.4 идея может быть применена для кодирования произвольных дискретных источников равномерными кодами. Предположим, что множество всех последовательностей длиной Описанный метод кодирования дискретного источника мы будем называть равномерным кодированием. Ошибкой равномерного кодирования является событие, состоящее в появлении неоднозначного кодируемого блока. При равномерном кодировании количество D-ичных кодовых символов, приходящихся на одно сообщение, равно Определение 1.6.3. Число
называется скоростью равномерного кодирования источника посредством кода с Количество двоичных символов на сообщение естественно измерять числом Как видно из примера 1.6.4, существенной частью задания равномерного кода является указание множества последовательностей сообщений источника, которые кодируются с помощью кодовых слов однозначно. Все коды, которые имеют одинаковое число кодовых слов и однозначно кодируют одно и то же множество сообщений, имеют одинаковую скорость и одинаковую вероятность ошибки. Поэтому ни сами кодовые слова, ни способ сопоставления кодовых слов и однозначно кодируемых сообщений не имеют значения с точки зрения качества кода. При кодировании с помощью равномерных кодов основная задача состоит в определении наименьшей возможной скорости кодирования, при которой вероятность ошибки может быть сделана произвольно малой. Наименьшая достижимая скорость кодирования является характеристикой источника сообщений и называется скоростью создания информации. Определение 1.6.4. Скоростью создания информации дискретным источником при равномерном кодировании называется наименьшее число В следующем примере показано, что по крайней мере для некоторых источников можно построить код с заданной малой вероятностью ошибки декодирования. Пример 1.6.5. Рассмотрим двоичный источник без памяти, независимо выбирающий сообщения из множества Предположим, что допускается некоторая достаточно малая вероятность ошибки при кодировании. Рассмотрим множество
Согласно закону больших чисел (см. пример 1.2.3) вероятность появления на выходе источника последовательности, принадлежащей множеству Рассмотрим кодирование, при котором имеется равномерный код, состоящий из Оценим теперь скорость кодирования. Для этого необходимо оценить число
где
где
стремится к Возьмем, например,
откуда получается
Выбирая Ниже мы покажем, что энтропия определяет наименьшее возможное значение скорости кодирования и согласно определению 1.6.4 дает величину скорости создания информации при равномерном кодировании. В последующей части этой главы мы будем заниматься определением скорости создания информации различными дискретными источниками. Для того чтобы установить, что некоторая величина, скажем Я, является скоростью создания информации, необходимо доказать два утверждения: 1. Для любого 2. Для любого Вначале, в §§ 1.7-1.9, мы будем рассматривать задачу равномерного кодирования дискретных источников. Затем, в
|
1 |
Оглавление
|