§ 6.2. Кодирование источников с дополнительной информацией
 
6.2.1. Постановка задачи.
 
Пусть, как и в предыдущей задаче, имеются два зависимых дискретных источника без памяти  с совместным ансамблем сообщений
 с совместным ансамблем сообщений  . Как и ранее, будем предполагать, что сообщения источников
. Как и ранее, будем предполагать, что сообщения источников  кодируются с помощью двух независимо работающих кодеров. Отличие рассматриваемой задачи от предыдущей состоит в том, что теперь требуется восстановление не двух последовательностей х, у на выходах источников
 кодируются с помощью двух независимо работающих кодеров. Отличие рассматриваемой задачи от предыдущей состоит в том, что теперь требуется восстановление не двух последовательностей х, у на выходах источников  а только одной, например, х. При этом информация, которую доставляет декодеру второй кодер, является дополнительной. Если бы не было дополнительной информации, то для восстановления сообщений источника
 а только одной, например, х. При этом информация, которую доставляет декодеру второй кодер, является дополнительной. Если бы не было дополнительной информации, то для восстановления сообщений источника  потребовалось бы затратить примерно
 потребовалось бы затратить примерно  двоичных символов на сообщение. При наличии дополнительной информации количество двоичных символов может быть уменьшено. Для восстановления сообщений источника
 двоичных символов на сообщение. При наличии дополнительной информации количество двоичных символов может быть уменьшено. Для восстановления сообщений источника  получатель может использовать выходы обоих кодеров, причем второй кодер будет при этом восполнять недостающую информацию первого.
 получатель может использовать выходы обоих кодеров, причем второй кодер будет при этом восполнять недостающую информацию первого. 
Можно продолжить рассмотрение примера с системой метеорологических датчиков для того, чтобы показать ситуацию, в которой может возникнуть задача кодирования с дополнительной информацией. Предположим, что в центре обработки метеорологических данных требуется получить картину погоды в одном районе, скажем, районе расположения датчика  Так как сообщения всех датчиков зависимы, то остальные датчики системы могут рассматриваться как источники дополнительной информации. По-прежнему можно использовать различные наборы скоростей
 Так как сообщения всех датчиков зависимы, то остальные датчики системы могут рассматриваться как источники дополнительной информации. По-прежнему можно использовать различные наборы скоростей 
 
 для
 для  независимо работающих кодеров. Задача заключается в определении всех таких наборов скоростей, при которых возможно восстановление сообщений только одного датчика
 независимо работающих кодеров. Задача заключается в определении всех таких наборов скоростей, при которых возможно восстановление сообщений только одного датчика  
 
Частичное решение этой задачи для случая двух источников было получено в предыдущем разделе. Действительно, если кодер источника  передает
 передает  бит на сообщение, т. е. если декодер получает полную информацию о сообщениях второго источника,
 бит на сообщение, т. е. если декодер получает полную информацию о сообщениях второго источника,  кодер источника
 кодер источника  может передавать только
 может передавать только  бит на сообщение,
 бит на сообщение,   При этом сообщения первого источника могут быть восстановлены со сколь угодно малой вероятностью ошибки. Более того, если кодер источника
 При этом сообщения первого источника могут быть восстановлены со сколь угодно малой вероятностью ошибки. Более того, если кодер источника  передает
 передает  бит на сообщение,
 бит на сообщение,  то кодер источника
 то кодер источника  может передавать
 может передавать  бит на сообщение. Однако при этом сообщения и первого и второго источников могут быть восстановлены сколь угодно точно, что в рассматриваемой задаче вовсе не требуется. Указанное обстоятельство позволяет надеяться на то, что, если не требовать сколь угодно точного восстановления сообщений источника
 бит на сообщение. Однако при этом сообщения и первого и второго источников могут быть восстановлены сколь угодно точно, что в рассматриваемой задаче вовсе не требуется. Указанное обстоятельство позволяет надеяться на то, что, если не требовать сколь угодно точного восстановления сообщений источника  то можно понизить минимальное значение скорости
 то можно понизить минимальное значение скорости  при фиксированной скорости
 при фиксированной скорости  . В частности, в данной задаче, как будет показано ниже, возможно кодирование со скоростью
. В частности, в данной задаче, как будет показано ниже, возможно кодирование со скоростью  при
 при  
 
Пусть  отображения множеств
 отображения множеств  на множества целых чисел
 на множества целых чисел  соответственно. Как и раньше, будем считать, что независимое кодирование двух источников
 соответственно. Как и раньше, будем считать, что независимое кодирование двух источников  задается парой отображений
 задается парой отображений  Декодер описывается отображением
 Декодер описывается отображением  , пары чисел
, пары чисел  в множество
 в множество  (в отличие от предыдущей задачи, где
 (в отличие от предыдущей задачи, где  было отображением в
 было отображением в  ).
). 
Вероятность ошибки  определяется как вероятность того, что последовательность х на выходе источника
 определяется как вероятность того, что последовательность х на выходе источника  будет восстановлена неверно:
 будет восстановлена неверно: 
 
Будем говорить, что задан код  с длиной
 с длиной  для кодирования источника
 для кодирования источника  с дополнительной информацией, если кодируются последовательности длины
 с дополнительной информацией, если кодируются последовательности длины  и заданы три отображения
 и заданы три отображения  (кодирование) и
 (кодирование) и  (декодирование). Величины
 (декодирование). Величины 
 
называются при этом скоростями кодирования источников  соответственно.
 соответственно. 
 
Определение 6.2.1. Пара чисел  называется допустимой парой скоростей при кодировании источника
 называется допустимой парой скоростей при кодировании источника  с дополнительной информацией, если для любых
 с дополнительной информацией, если для любых  найдется
 найдется  и найдется код
 и найдется код  со скоростями кодирования
 со скоростями кодирования  кодирующими отображениями
 кодирующими отображениями  и декодирующим отображением
 и декодирующим отображением  для которого
 для которого  
 
 
Рис. 6.2.1. Область допустимых пар скоростей при кодировании источника с дополнительной информацией. 
Множество всех допустимых пар скоростей при кодировании с дополнительной информацией будем обозначать через  . Из возможности кодирования с разделением времени следует, что множество
. Из возможности кодирования с разделением времени следует, что множество  выпукло. Ниже будет показано, что
 выпукло. Ниже будет показано, что  имеет вид заштрихованной области на рис. 6.2.1. Двойной штриховкой на этом же рисунке показана область 31 допустимых пар скоростей при независимом кодировании двух источников.
 имеет вид заштрихованной области на рис. 6.2.1. Двойной штриховкой на этом же рисунке показана область 31 допустимых пар скоростей при независимом кодировании двух источников. 
Прежде чем дать точное описание области допустимых пар скоростей, полезно представить себе задачу с общих позиций, чтобы попытаться найти с помощью качественных рассуждений, какими могут или не могут быть допустимые пары скоростей. Вначале заметим, что пара скоростей  очевидно, является допустимой.
 очевидно, является допустимой. 
Предположим, что декодеру известен выход источника  Тогда, как было показано в предыдущем параграфе, для восстановления сообщений источника
 Тогда, как было показано в предыдущем параграфе, для восстановления сообщений источника  требуется передать не менее
 требуется передать не менее  бит на сообщение. Поэтому для любой пары допустимых скоростей
 бит на сообщение. Поэтому для любой пары допустимых скоростей  должно выполняться неравенство
 должно выполняться неравенство  Кроме того, любая пара скоростей, допустимая при независимом кодировании двух источников, допустима и при кодировании одного источника с дополнительной информацией. Таким образом,
 Кроме того, любая пара скоростей, допустимая при независимом кодировании двух источников, допустима и при кодировании одного источника с дополнительной информацией. Таким образом,  есть пара допустимых скоростей.
 есть пара допустимых скоростей. 
Предположим теперь, что  . В этом случае декодеру известна не последовательность у, появившаяся на выходе источника
. В этом случае декодеру известна не последовательность у, появившаяся на выходе источника  а лишь подмножество, которому она принадлежит. Это следует из того, что при
 а лишь подмножество, которому она принадлежит. Это следует из того, что при  кодирующее отображение
 кодирующее отображение  осуществляет разбиение высоковероятного множества источника
 осуществляет разбиение высоковероятного множества источника  на
 на  непересекающихся подмножеств таких, что все последовательности, принадлежащие одному и тому же подмноже ству, отображаются в одно и то же число из
 непересекающихся подмножеств таких, что все последовательности, принадлежащие одному и тому же подмноже ству, отображаются в одно и то же число из  Таким сбразом
 Таким сбразом 
 
задание кодирующего отображения  эквивалентно заданию разбиения высоковероятного множества источника
 эквивалентно заданию разбиения высоковероятного множества источника  на
 на  непересекающихся подмножеств.
 непересекающихся подмножеств. 
В дальнейшем мы покажем, что такое разбиение может быть реализовано следующим образом. Пусть  некоторый вероятностный ансамбль и
 некоторый вероятностный ансамбль и  — семейство переходных вероятностей из
 — семейство переходных вероятностей из  Будем предполагать, что эти переходные вероятности задают дискретный канал без памяти. Если распределение
 Будем предполагать, что эти переходные вероятности задают дискретный канал без памяти. Если распределение  и переходные вероятности
 и переходные вероятности  выбраны таким образом, что
 выбраны таким образом, что 
 
то, как будет показано ниже, разбиение высоковероятного множества источника  может быть реализовано с помощью совокупности решающих областей некоторого кода
 может быть реализовано с помощью совокупности решающих областей некоторого кода  для дискретного канала без памяти с переходными вероятностями
 для дискретного канала без памяти с переходными вероятностями  При этом число слов кода
 При этом число слов кода  равно
 равно  и сами кодовые слова принадлежат высоковероятному множеству дискретного источника без памяти с ансамблем сообщений
 и сами кодовые слова принадлежат высоковероятному множеству дискретного источника без памяти с ансамблем сообщений  (источник
 (источник  Такое разбиение будет задавать кодирование источника
 Такое разбиение будет задавать кодирование источника  со скоростью
 со скоростью  При этом способе кодирования источника
 При этом способе кодирования источника  мы можем полагать, что декодеру известна последовательность сообщений
 мы можем полагать, что декодеру известна последовательность сообщений  появившаяся на выходе фиктивного источника
 появившаяся на выходе фиктивного источника  Пара источников
 Пара источников  может рассматриваться как пара зависимых дискретных источников без памяти с совместным распределением
 может рассматриваться как пара зависимых дискретных источников без памяти с совместным распределением 
 
Так как декодеру известна последовательность  принадлежит высоковероятному множеству источника
 принадлежит высоковероятному множеству источника  то в соответствии с результатами предыдущего параграфа кодирующее источник
 то в соответствии с результатами предыдущего параграфа кодирующее источник  отображение
 отображение  может быть построено таким образом, что
 может быть построено таким образом, что  Из приведенных рассуждений следует, что пара скоростей
 Из приведенных рассуждений следует, что пара скоростей  должна быть допустимой для кодирования источника
 должна быть допустимой для кодирования источника  с дополнительной информацией. Более того, как будет показано, допустимы только пары скоростей такого вида.
 с дополнительной информацией. Более того, как будет показано, допустимы только пары скоростей такого вида. 
6.2.2. Функция T(d) и ее свойства.
 
В дальнейшем для характеризации области  потребуется некоторая специальная функция, которую мы введем и изучим в этом разделе.
 потребуется некоторая специальная функция, которую мы введем и изучим в этом разделе. 
Пусть  пара совместно заданных дискретных ансамблей. Введем в рассмотрение дискретное множество
 пара совместно заданных дискретных ансамблей. Введем в рассмотрение дискретное множество  и зададим распределение вероятностей
 и зададим распределение вероятностей  на
 на 
 
тройках  посредством следующих соотношений:
 посредством следующих соотношений: 
 
где  распределение вероятностей на
 распределение вероятностей на  Из (6.2.1) следует, что при данном сообщении
 Из (6.2.1) следует, что при данном сообщении  сообщения
 сообщения  статистически независимы. Ясно, что распределение вероятностей
 статистически независимы. Ясно, что распределение вероятностей  , удовлетворяющее соотношениям (6.2.1), может быть выбрано многими способами с помощью различных выборов множества
, удовлетворяющее соотношениям (6.2.1), может быть выбрано многими способами с помощью различных выборов множества  и распределения
 и распределения  Каждый такой выбор определяет ансамбль
 Каждый такой выбор определяет ансамбль  Обозначим через
 Обозначим через  множество различных ансамблей троек, распределения вероятностей на которых удовлетворяют условиям (6.2.1). Для каждого ансамбля
 множество различных ансамблей троек, распределения вероятностей на которых удовлетворяют условиям (6.2.1). Для каждого ансамбля  из добычным образом определены энтропии
 из добычным образом определены энтропии  Пусть
 Пусть  максимальное подмножество множества такое, что
 максимальное подмножество множества такое, что  для каждого ансамбля из
 для каждого ансамбля из  Определим функцию
 Определим функцию  следующим образом:
 следующим образом: 
 
 
В определении функции  используется знак
 используется знак  а не
 а не  так как мощность множества
 так как мощность множества  хотя и ограничена, но может быть сколь угодно большой.
 хотя и ограничена, но может быть сколь угодно большой. 
Лемма 6.2.1. Функция  монотонно неубывающая, выпуклая вниз функция при всех
 монотонно неубывающая, выпуклая вниз функция при всех  
 
Доказательство. Для доказательства монотонного неубывания достаточно заметить, что при всех  и воспользоваться определением (6.2.2).
 и воспользоваться определением (6.2.2). 
Для доказательства выпуклости достаточно показать, что для любых  и любого
 и любого  имеет место неравенство
 имеет место неравенство 
 
Пусть зафиксировано  тогда можно найти два ансамбля
 тогда можно найти два ансамбля  из
 из  со следующими свойствами:
 со следующими свойствами: 
 
 
для остальных  Очевидно, что при этом
 Очевидно, что при этом  следовательно,
 следовательно,  является распределением вероятностей на
 является распределением вероятностей на  Обозначим через
 Обозначим через  такое подмножество множества
 такое подмножество множества  что
 что  только для элементов
 только для элементов  Если
 Если  то, заменяя
 то, заменяя  на
 на  и проводя аналогичные рассуждения, построим множество
 и проводя аналогичные рассуждения, построим множество  и распределение
 и распределение  такие, что
 такие, что  если
 если  если
 если  Повторяя этот процесс не более чем
 Повторяя этот процесс не более чем  раз, построим распределение
 раз, построим распределение  удовлетворяющее условиям леммы. Лемма доказана.
 удовлетворяющее условиям леммы. Лемма доказана. 
Лемма 6.2.4. Пусть  такое максимальное подмножество множества
 такое максимальное подмножество множества  что, если
 что, если  то
 то  
 
Тогда 
 
Доказательство. Пусть — такое максимальное подмножество множества  что, если
 что, если  то
 то  Для доказательства леммы достаточно показать, что для любого
 Для доказательства леммы достаточно показать, что для любого  выполняется равенство
 выполняется равенство 
 
 
где 
В соответствии с теоремой Куна-Таккера для нахождения значения функции  при каждом фиксированном значении
 при каждом фиксированном значении  необходимо решить следующую задачу минимизации: найти
 необходимо решить следующую задачу минимизации: найти 
 
 
где X — величина, определяемая условиями Куна-Таккера по заданному значению  Тогда ансамбль
 Тогда ансамбль  который доставляет минимум (6.2.14), будет доставлять минимум также и (6.2.13). Если
 который доставляет минимум (6.2.14), будет доставлять минимум также и (6.2.13). Если  изменяется в области своих значений, то X также изменяется некоторым образом и поэтому
 изменяется в области своих значений, то X также изменяется некоторым образом и поэтому  можно рассмаривать как функцию от
 можно рассмаривать как функцию от  В общем случае
 В общем случае  , если
, если  Если показать, что
 Если показать, что  для любого
 для любого  и любого
 и любого  то минимум в (6.2.14) при любых
 то минимум в (6.2.14) при любых  будет для каждого
 будет для каждого  достигаться на одном и том же подмножестве
 достигаться на одном и том же подмножестве  множеств
 множеств  Тем самым минимум в (6.2.13) также будет достигаться на подмножестве
 Тем самым минимум в (6.2.13) также будет достигаться на подмножестве  множеств
 множеств  Следовательно,
 Следовательно,  для всех
 для всех  и лемма будет доказана. Покажем, что
 и лемма будет доказана. Покажем, что  
 
 
Пусть для некоторого фиксированного X минимум в (6.2.14) достигается на ансамбле  который задается распределениями
 который задается распределениями  Будем считать, что в функциях
 Будем считать, что в функциях  аргументы
 аргументы  фиксированы и равны
 фиксированы и равны  . В этом случае
. В этом случае 
 
 
Так как функции  линейны относительно распределения
 линейны относительно распределения  то выражение под знаком минимума в (6.2.1) является, тривиальным образом, выпуклой функцией. При этом из теоремы Куна-Таккера следует, что необходимые и достаточные условия, которым должно удовлетворять распределение
 то выражение под знаком минимума в (6.2.1) является, тривиальным образом, выпуклой функцией. При этом из теоремы Куна-Таккера следует, что необходимые и достаточные условия, которым должно удовлетворять распределение  минимизирующее правую часть (6.2.15), суть
 минимизирующее правую часть (6.2.15), суть 
 
для всех  где — множитель Лагранжа, обусловленный ограничением
 где — множитель Лагранжа, обусловленный ограничением  Так как соотношение (6.2.16) не зависят от
 Так как соотношение (6.2.16) не зависят от  то минимум в правой части (6.2.15) достигается на любом распределении
 то минимум в правой части (6.2.15) достигается на любом распределении  таком, что
 таком, что 
 
 
В соответствии с леммой 6.2.3 найдется такое распределение  при котором выполняется (6.2.17) и число элементов
 при котором выполняется (6.2.17) и число элементов  для которых
 для которых  не превосходит
 не превосходит  Отсюда очевидно следует, что
 Отсюда очевидно следует, что  Лемма доказана.
 Лемма доказана. 
6.2.3. Обратная теорема кодирования.
 
Пусть  совместно заданные дискретные источники без памяти и
 совместно заданные дискретные источники без памяти и  — совместный ансамбль сообщений. Пусть — множество всех ансамблей
 — совместный ансамбль сообщений. Пусть — множество всех ансамблей  распределения вероятностей на которых удовлетворяют условиям (6.2.1) и
 распределения вероятностей на которых удовлетворяют условиям (6.2.1) и  Определим
 Определим  множество
 множество  пар чисел
 пар чисел  следующим образом:
 следующим образом: 
 
В этом пункте будет показано, что  Другими словами, если пара скоростей
 Другими словами, если пара скоростей  допустима при кодировании источника
 допустима при кодировании источника  с дополнительной информацией, то эта пара должна принадлежать множеству
 с дополнительной информацией, то эта пара должна принадлежать множеству 
На плоскости  множество имеет границу, определяемую функцией
 множество имеет границу, определяемую функцией  Действительно, энтропия
 Действительно, энтропия  не
 не  
 
зависит от выбора распределения  и принимает одно и то же значение для всех ансамблей
 и принимает одно и то же значение для всех ансамблей  Если положить
 Если положить  то
 то  для всякого ансамбля
 для всякого ансамбля  следовательно,
 следовательно,  . С другой стороны, величина
. С другой стороны, величина  равна
 равна  и представляет собой наименьшее возможное значение скорости
 и представляет собой наименьшее возможное значение скорости  при данном
 при данном  Таким образом, для любой пары
 Таким образом, для любой пары  
 
 
и, наоборот, любая пара  удовлетворяющая этому неравенству, принадлежит
 удовлетворяющая этому неравенству, принадлежит  
 
Теорема 6.2.1 (обратная теорема кодирования). Пусть  — пара зависимых дискретных источников без памяти и (
 — пара зависимых дискретных источников без памяти и ( совместный ансамбль сообщений. Если пара скоростей
 совместный ансамбль сообщений. Если пара скоростей  допустима при кодировании источника
 допустима при кодировании источника  с дополнительной информацией, то эта пара принадлежит множеству
 с дополнительной информацией, то эта пара принадлежит множеству  .
. 
Доказательство. Пусть  некоторыйфиксированный код для кодирования источника
 некоторыйфиксированный код для кодирования источника  с дополнительной информацией. Как и при доказательстве теоремы 6.1.1, имеем
 с дополнительной информацией. Как и при доказательстве теоремы 6.1.1, имеем 
 
где сохранены обозначения теоремы 6.1.1. Далее, применяя неравенство Фано к ансамблю  и следуя доказательству этой теоремы, можно получить, что при
 и следуя доказательству этой теоремы, можно получить, что при  найдется
 найдется  такое, что для любого
 такое, что для любого  и любого кода
 и любого кода  вероятность ошибки
 вероятность ошибки  Таким образом, для любой допустимой пары скоростей
 Таким образом, для любой допустимой пары скоростей  код должен быть таким, чтобы
 код должен быть таким, чтобы  Покажем теперь, что последнее условие эквивалентно требованию того, чтобы
 Покажем теперь, что последнее условие эквивалентно требованию того, чтобы  принадлежало
 принадлежало  
 
Очевидно, что 
 
Из этого соотношения следует, что 
 
 
Так как  неубывающая функция
 неубывающая функция  то
 то 
 
Нетрудно заметить, что ансамбль  принадлежит множеству
 принадлежит множеству  и поэтому, применяя определение (6.2.7), лемму 6.2.2 и последнее неравенство, получим
 и поэтому, применяя определение (6.2.7), лемму 6.2.2 и последнее неравенство, получим 
 
Таким образом, с учетом леммы  для любой пары допустимых скоростей
 для любой пары допустимых скоростей  найдется такой ансамбль
 найдется такой ансамбль  что
 что  или
 или  Теорема доказана.
 Теорема доказана. 
6.2.4. Прямая теорема кодирования.
 
Мы покажем теперь, что любая пара скоростей  допустима при кодировании дискретного источника с дополнительной информацией. Совместно с доказанной выше обратной теоремой это установит, что
 допустима при кодировании дискретного источника с дополнительной информацией. Совместно с доказанной выше обратной теоремой это установит, что  Для произвольного ансамбля
 Для произвольного ансамбля  будет указан метод построения кода со скоростью
 будет указан метод построения кода со скоростью  и вероятностью ошибки
 и вероятностью ошибки  где
 где  — произвольно малые положительные числа.
 — произвольно малые положительные числа. 
В качестве первого шага докажем утверждение, являющееся по существу непосредственным следствием из прямой теоремы кодирования для пары зависимых источников (теоремы 6.1.2). 
Лемма 6.2.5. Пусть  пара зависимых дискретных источников без памяти с совместным ансамблем сообщений
 пара зависимых дискретных источников без памяти с совместным ансамблем сообщений  Пусть
 Пусть  некоторое фиксированное отображение множества
 некоторое фиксированное отображение множества  на множество
 на множество  Для любых
 Для любых  найдется
 найдется  такое, что при
 такое, что при  существует код
 существует код  для кодирования источника
 для кодирования источника  с дополнительной информацией, для которого
 с дополнительной информацией, для которого  и вероятность ошибки
 и вероятность ошибки  
 
Доказательство. Введем в рассмотрение два новых дискретных источника  Последовательность сообщений на выходе первого представляет собой последовательность блоков длины
 Последовательность сообщений на выходе первого представляет собой последовательность блоков длины  последовательность сообщений на выходе второго — последовательность элементов из множества
 последовательность сообщений на выходе второго — последовательность элементов из множества  Из теоремы 6.1.2 следует, что для пары источников
 Из теоремы 6.1.2 следует, что для пары источников  существует такой код
 существует такой код  где
 где  достаточно велико, что
 достаточно велико, что  и вероятность ошибки
 и вероятность ошибки  где
 где  и
 и  — произвольно малые положительные числа. Очевидно, что этот код одновременно является
 — произвольно малые положительные числа. Очевидно, что этот код одновременно является 
 
и пусть  такое подмножество множества
 такое подмножество множества  что для любой последовательности
 что для любой последовательности  выполняется неравенство
 выполняется неравенство  Из этих определений и (6.2.20) следует, что
 Из этих определений и (6.2.20) следует, что 
 
откуда получается, что 
 
Положим теперь 
 
 
Так как  то для множества
 то для множества  неравенства К 5 утверждения леммы выполняются. Кроме того,
 неравенства К 5 утверждения леммы выполняются. Кроме того, 
 
Если выбрать  то легко убедиться в том, что для множества, определяемого соотношением (2.6.21), условие 6 леммы выполняется. Далее нетрудно заметить, что имеют место равенства
 то легко убедиться в том, что для множества, определяемого соотношением (2.6.21), условие 6 леммы выполняется. Далее нетрудно заметить, что имеют место равенства 
 
Поэтому при указанном выше выборе величин  неравенства 7-9 утверждения леммы также выполняются. Лемма доказана.
 неравенства 7-9 утверждения леммы также выполняются. Лемма доказана. 
Далее нам понадобится еще одно утверждение, относящееся к типичным последовательностям ансамбля  и свойствам кодов для канала
 и свойствам кодов для канала  Мы покажем, что можно построить код, слова которого
 Мы покажем, что можно построить код, слова которого  принадлежат высоковероятному множеству ансамбля
 принадлежат высоковероятному множеству ансамбля  решающие области
 решающие области  причем число кодовых слов
 причем число кодовых слов  а решающие области почти полностью покрывают множество
 а решающие области почти полностью покрывают множество  (т. е. вероятность попадания в непокрытую часть
 (т. е. вероятность попадания в непокрытую часть  может быть сделана произвольно малой). Такой код мы будем использовать для задания отображения
 может быть сделана произвольно малой). Такой код мы будем использовать для задания отображения  определяющего кодирование источника
 определяющего кодирование источника  
 
Лемма 6.2.7. Пусть  подмножество, удовлетворяющее условиям леммы 6.2.6. Рассмотрим дискретный
 подмножество, удовлетворяющее условиям леммы 6.2.6. Рассмотрим дискретный 
 
канал без памяти с множеством входных сигналов  выходных сигналов
 выходных сигналов  и переходными вероятностями
 и переходными вероятностями  Для этого канала, любых
 Для этого канала, любых  найдется код
 найдется код  для которого кодовые слова
 для которого кодовые слова  решающие области
 решающие области  имеют место следующие неравенства:
 имеют место следующие неравенства: 
 
где  множество кодовых слов.
 множество кодовых слов. 
Кроме того, для любого кода, для которого  и выполнены неравенства 1 и 2, число кодовых слов удовлетворяет условию
 и выполнены неравенства 1 и 2, число кодовых слов удовлетворяет условию 
 
Доказательство. Для фиксированного  выберем величину
 выберем величину  настолько большой, чтобы числа
 настолько большой, чтобы числа  участвующие в формулировке леммы 6.2.6, удовлетворяли неравенствам
 участвующие в формулировке леммы 6.2.6, удовлетворяли неравенствам  Для канала
 Для канала  построим максимальный код с вероятностью ошибки X (см. теорему 3.8.1), выбирая в качестве кодовых слов последовательности из множества
 построим максимальный код с вероятностью ошибки X (см. теорему 3.8.1), выбирая в качестве кодовых слов последовательности из множества  а в качестве решающих областей — множества
 а в качестве решающих областей — множества  При этом обеспечивается выполнение условий 1.
 При этом обеспечивается выполнение условий 1. 
Для доказательства выполнения неравенства 2 учтем, что мы построили максимальный код и поэтому для любой последовательности  не принадлежащей множеству С кодовых слов, имеет место неравенство
 не принадлежащей множеству С кодовых слов, имеет место неравенство 
 
Так как  то из последнего неравенства следует, что
 то из последнего неравенства следует, что 
 
для любой последовательности  такой, что
 такой, что  . С другой стороны, по построению кода
. С другой стороны, по построению кода  и, следовательно,
 и, следовательно, 
 
 
Учитывая теперь, что  получим
 получим 
 
Таким образом, неравенство 2 также имеет место. 
Докажем теперь выполнение неравенства 3. Для этого нам понадобится так называемое сильное обращение теоремы кодирования в дискретном канале без памяти. В интересующем нас случае сильное обращение может быть сформулировано следующим образом. Для любой последовательности кодов  при
 при  где
 где  произвольное положительное число, и при условии, что слова кода
 произвольное положительное число, и при условии, что слова кода  принадлежат
 принадлежат  вероятность ошибки стремится к единице с ростом
 вероятность ошибки стремится к единице с ростом  Из этого утверждения следует, что для любого
 Из этого утверждения следует, что для любого  при достаточно большом
 при достаточно большом  количество слов построенного выше максимального кода удовлетворяет неравенству 3. Таким образом, для завершения доказательства леммы необходимо доказать справедливость сформулированного здесь сильного обращения. Пусть
 количество слов построенного выше максимального кода удовлетворяет неравенству 3. Таким образом, для завершения доказательства леммы необходимо доказать справедливость сформулированного здесь сильного обращения. Пусть  Из условия 2 леммы 6.2.6 и теоремы о высоковероятных множествах дискретных источников без памяти следует, что
 Из условия 2 леммы 6.2.6 и теоремы о высоковероятных множествах дискретных источников без памяти следует, что 
 
 
Кроме того, из условий 1 и 3 указанной леммы следует, что для любой пары  
  
 
 
Предположим, что для построенного выше кода  
 
Тогда из неравенства (6.2.22) вытекает, что по крайней мере для одного  
 
 
 
 
Из определения множества  утверждения 8 леммы 6.2.6 и из того, что
 утверждения 8 леммы 6.2.6 и из того, что  имеем
 имеем 
 
 
Из утверждений 1 и 4 леммы 6.2.6 следует, что для всех  
 
 
Из последнего неравенства нетрудно вывести, что 
 
 
Подставляя (6.2.27), (6.2.28) в (6.2.26) и учитывая, что  получим при достаточно большом
 получим при достаточно большом  
 
 
 
для всех  . В случае
. В случае  можно использовать оценку
 можно использовать оценку 
 
 
Так как  то из (6.2.29) и (6.2.30) следует, что
 то из (6.2.29) и (6.2.30) следует, что 
 
 
Для того чтобы завершить построение оценки энтропии  заметим, что для кода из леммы 6.2.7 имеет место неравенство
 заметим, что для кода из леммы 6.2.7 имеет место неравенство 
 
 
Другими словами, если  то
 то  при
 при  Полагая теперь
 Полагая теперь  для кода леммы 6.2.7 и учитывая неравенство 2 этой леммы, из (6.2.31) и (6.2.32) получим, что для любого
 для кода леммы 6.2.7 и учитывая неравенство 2 этой леммы, из (6.2.31) и (6.2.32) получим, что для любого  найдется
 найдется  такое, что
 такое, что 
 
Теорема доказана.