Главная > Работы по теории информации и кибернетики (1963)
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

ГЕОМЕТРИЧЕСКИЙ ПОДХОД К ТЕОРИИ ПРОПУСКНОЙ СПОСОБНОСТИ. КАНАЛОВ СВЯЗИ

Методам вычисления скорости передачи информации и пропускной способности С дискретного канала без памяти, может быть дано геометрическое толкование, которое приводит к новым результатам и новому пониманию свойств этих величин. Наши результаты обобщают интересную статью рога и в некоторой степени перекрываются с ней, хотя мы исходили из различных соображений. Метод нашего исследования совершенно иной, поскольку нами используется геометрический подход, основанный на результатах теории выпуклых тел в противоположность алгебраическому подходу, который использовал Мурога.

Пусть канал определен матрицей вероятностей перехода от буквы на входе к букве на выходе Можно рассматривать каждую строку этой матрицы как вектор или точку в -мерном равностороннем симплексе -мерный аналог отрезка прямой, равностороннего треугольника, тетраэдра и т. д.]. Координатами точки являются ее расстояния от граней, в сумме равные единице Они известны под названием барицентрических координат и соответствуют, например, координатам, часто используемым химиками при описаниях сплавов в терминах долей различных компонент.

Таким образом, с входом связывается точка или вектор Его компоненты равны вероятностям различных букв на выходе, если используются все входы. Если использованы все входы (с вероятностью для входа ), то вероятности букв на выходе

даются компонентами векторной суммы

Вектору или точке симплекса соответствуют также вероятности букв на выходе. Тогда компонента этого вектора равна Поскольку неотрицательны и в сумме дают единицу, то точки лежат в выпуклой оболочке (или барицентрической оболочке) точек Более того, любая точка в этой выпуклой оболочке может быть получена при подходящем выборе

Теперь для удобства обозначений определим энтропию точки или вектора из симплекса как энтропию барицентрических координат точки, интерпретированных как вероятности. Таким образом, имеем

и

где — энтропия распределения полученных символов.

В этих обозначениях скорость передачи для данной системы вероятностей на входе задается формулой

Функция где — точка симплекса, является выпуклой кверху функцией. Так, если компоненты равны то имеем

Отсюда является отрицательно определенной формой. Это справедливо для пространства всех неотрицательных и отсюда, конечно, и для подпространства, в котором Следовательно, скорость о которой шла речь выше,

всегда неотрицательна. Н строго выпукла (без плоских участков), и положительна, если только не равно для всех тех для которых

Процесс вычисления может быть легко изображен наглядно в случае двух или трех букв на выходе. Если на выходе имеется три буквы, то представим себе равносторонний треугольник на некоторой основной плоскости. Это будет симплекс, содержащий точки А и Сверху этот треугольник покрыт куполообразной поверхностью, как показано на рис. 1.

Рис. 1. Пропускная способность канала в случае трех букв на входе и на выходе.

Высота этой поверхности над любой точкой А равна Если на входе имеются три буквы с соответствующими векторами то они отвечают трем точкам в треугольнике и трем точкам на куполе, расположенным непосредственно над первыми тремя точками. Каждый выходной вектор является точкой треугольника, находящегося на основной плоскости и определенного точками

Энтропия равна высоте купола над точкой а равна высоте над точкой плоскости, задаваемой тремя точками купола, расположенными над Иными словами, равно вертикальному отрезку прямой, проходящей через который отсекается куполом и плоскостью, определяемой этими тремя точками.

Пропускная способность С равна максимуму Следовательно, в этом частном случае она равна максимальному расстоянию в вертикальном направлении от купола до внутренней части треугольника, вершины которого расположены на куполе над точками Этот максимум, очевидно, достигается в точке касания

плоскости, касательной к куполу и параллельной плоскости того же треугольника при условии, что проекция точки касания на основную плоскость лежит внутри треугольника, заданного точками . В противном случае максимум достигается на одной из сторон этого треугольника.

Если бы имелось четыре буквы на входе, то они в зависимости от своего расположения определили бы треугольник или четырехугольник на основной плоскости, а точки, расположенные прямо над ними на куполе, определили бы, вообще говоря, тетраэдр.

Рис. 2. Пропускная способность канала для пяти входных букв и трех выходных букв.

Использование для букв на входе различных распределений вероятности приводит к различным точкам в тетраэдре и к различным значениям вычитаемым при вычислении Очевидно, что максимум был бы достигнут только при таком выборе вероятностей, когда эта вычитаемая часть лежит где-либо на нижней грани тетраэдра. Эти замечания применимы также в случае, когда имеется еще большее количество букв на входе. Если имеется а букв на входе, то они определяют многоугольник с а или меньшим числом сторон на основной плоскости, а точки на куполе, расположенные над вершинами этого многоугольника, образуют симплекс. Любая точка из выпуклой оболочки точек, полученная на куполе, достигается при подходящем выборе ей соответствует некоторое значение вычитаемого в формуле для вычисления Ясно, что для нахождения максимума и определения таким образом значения С необходимо рассмотреть только нижнюю часть поверхности выпуклой оболочки (см. рис. 2).

Геометрически очевидно также, что из выпуклости книзу нижней части симплекса и строгой выпуклости кверху купола вытекает существование единственной точки, в которой достигается максимум и значит, и С. Если бы имелись две такие точки, то значение в середине отрезка, соединяющего эти две точки, давало бы еще лучшее значение. Это объясняется тем, что вдоль кривой на куполе, соединяющей проекции этих точек, поверхность купола выпукла вверх, а средняя точка нижней соединительной кривой (на нижней грани выпуклой оболочки) не может сдвинуться вверх. Далее, скорость является строго выпуклой кверху функцией выходного вектора Оказывается справедливым также тот факт, что скорость является выпуклой кверху функцией вектора входных вероятностей (этот вектор имеет а барицентрических координат в противоположность координатам других наших векторов). Это утверждение выполняется потому, что векторы и отвечающие вероятностям на входе , даются формулами

Точкой отвечающей вектору (где положительны), является точка , следовательно, что и требовалось установить. Равенство может встретиться в случае так что в этом случае нельзя говорить о строго выпуклой функции.

Из этих последних замечаний вытекает также, что множество векторов Р, для которых скорость равна пропускной способности С, образует выпуклое множество в своем -мерном симплексе. Если максимум достигается в двух различных точках, то он также достигается и во всех точках отрезка, соединяющего эти точки. Более того, любой локальный максимум является также абсолютным максимумом, равным С. Допустим, что это неверно, и соединим отрезком точки, соответствующие локальному и абсолютному максимумам. Значение должно в силу выпуклости лежать на этой линии или выше ее, но в силу свойств максимума оно должно лежать ниже ее в достаточной близости от локального максимума. Это противоречие доказывает наше утверждение.

Приведенные результаты для геометрической наглядности были описаны для случая трех букв на выходе, но они легко обобщаются на случай букв на выходе, если использовать хорошо известные результаты теории выпуклых тел.

Еще одно легко выводимое свойство канала состоит в том, что пропускная способность С может быть достигнута при использовании не более чем букв на входе, гдед — ранг матрицы Это объясняется тем, что равно размерности множества точек

Любая точка на поверхности -мерного симплекса лежит на некоторой его грани. Эта грань может быть подразделена на -мерные симплексы (если она сама еще не является симплексом). Значит, точка лежит в одном из них. Вершинами симплекса являются букв на входе, и рассматриваемая точка может быть выражена через них. Теперь легко получается результат Мурога, состоящий в том, что пропускная способность не превышает Действительно, если использованы только букв, то энтропия входа не может превысить а ненадежность может только уменьшить её значение.

Геометрическая картина дает важную информацию относительно того, какие буквы на входе следует использовать для достижения пропускной способности канала. Если, скажем, вектор соответствующий входной букве лежит в выпуклой оболочке векторов, соответствующих остальным буквам, то его не нужно использовать.

Так, предположим, что где Тогда по свойству выпуклости Если при использовании с вероятностями получаем скорость

то скорость, большая или равная может быть получена, если в этой формуле выразить через другие эта операция не изменит первый член и уменьшит или не изменит вычитаемую сумму.

В случае наличия только двух букв на выходе ситуация чрезвычайно проста. Каково бы ни было количество букв на входе, для достижения пропускной способности канала нужно использовать только две из них. Эти две буквы должны быть выбраны так, чтобы на них достигались максимум и минимум вероятностей перехода к одной из букв на выходе. Эти буквы, скажем помещены в одномерном симплексе — отрезке единичной длины и проектируются кверху на кривую Я, как показано на рис. 3. Если провести секущую, то пропускная способность будет равна наибольшему расстоянию в вертикальном направлении от секущей до кривой. Вероятности и которые необходимы для достижения этой пропускной способности, пропорциональны расстояниям от этой точки до обоих концов секущей.

В случае трех букв на выходе концы всех векторов, соответствующих буквам на входе, могут быть изображены точками равностороннего треугольника. Можно рассмотреть многоугольник, ограничивающий эти точки (их выпуклую оболочку вычеркнуть), и точки, внутренние для этого многоугольника (включая и точки на контуре),

требуется рассмотреть нижнюю поверхность симплекса, определенного точками, расположенными на куполе (над оставшимися точками). Эта нижняя поверхность, вообще говоря, будет состоять из треугольников, и наша задача заключается в нахождении вершин, лежащих на этой нижней поверхности. Метод решения этой задачи состоит, например, в рассмотрении отрезка, соединяющего пару вершин, и в последующем выяснении, лежат ли выше или ниже этого отрезка другие отрезки, проекции которых на основную плоскость пересекают проекцию первого отрезка.

Рис. 3. Пропускная способность канала в случае двух букв на выходе.

Если нет отрезков, лежащих ниже первого, то этот отрезок является ребром нижней поверхности симплекса. Если же некоторый отрезок лежит ниже первого, то он может быть исследован аналогичным способом, и в конце концов будет найдено одно ребро. Это ребро делит проекцию на два меньших многоугольника, и каждый из этих многоугольников должен быть рассмотрен таким же способом. В конце концов начальный многоугольник будет разбит на систему многоугольников, соответствующих поверхности симплекса. Относительно каждого из этих многоугольников нужно затем проверить, лежит ли или нет в этом многоугольнике проекция точки касания плоскости, параллельной ему соответствующей грани, касательной к куполу. Это случится в точности в одном из многоугольников, и тем самым будет определена точка в которой достигается максимум

Теперь докажем другое свойство выпуклости для дискретных каналов: докажем, что пропускная способность канала с

переходными вероятностями является выпуклой книзу функцией этих вероятностей. Это значит, что пропускная способность С удовлетворяет неравенству, аналогичному неравенству соответствующих переходных вероятностей:

где является пропускной способностью, отвечающей вероятностям — пропускной способностью, отвечающей вероятностям

Чтобы доказать это, допустим, что пропускная способность канала с переходными вероятностями достигается, когда вероятности букв на входе равны Рассмотрим следующий канал. Он имеет такое же число входных букв, как и данный канал, и удвоенное число выходных букв (которое разобьем на два равных множества Каждой выходной букве соответствуют переходные вероятности Таким образом, этот канал является каналом, который получился бы при делении пополам всех вероятностей в каналах, отвечающих переходным вероятностям и при одновременном отождествлении соответствующих входных букв и оставлении выходных букв различными. Заметим, что если соответственные выходные буквы отождествлены, то канал сводится к каналу, отвечающему переходным вероятностям Заметим также, что без такого отождествления этот канал будет работать так же, как канал, который половину времени работает как канал с переходными вероятностями а половину времени как канал с переходными вероятностями Отождествление некоторых выходов всегда уменьшает (или не изменяет) скорость передачи. Пусть этот канал используется с вероятностями для входных символов. Тогда для скоростей передачи может быть написано такое неравенство

где является условной энтропией х, когда у принадлежит группе является условной энтропией х, когда у принадлежит группе Разбивая на две части, чтобы объединить их с получаем

где является скоростью передачи канала, отвечающего переходным вероятностям когда выходы имеют вероятностии

является аналогичной величиной для канала, отвечающего переходным вероятностям Эти скорости, конечно, меньше соответственно, чем или так как пропускные способности являются максимальными возможными скоростями. Отсюда получаем желаемый результат

Различные результаты, полученные нами, могут быть объединены следующим образом.

Теорема. Конечный дискретный канал без памяти обладает следующими свойствами.

1. Скорость передачи является строго выпуклой кверху функцией от вероятностей полученных букв

2. Скорость является выпуклой кверху функцией от вероятностей букв на входе.

3. Область пространства вероятностей букв на входе, в которой достигается пропускная способность канала, является выпуклым множеством.

4. Не существует локального максимума который не является абсолютным максимумом С.

5. Любая буква на входе, внутренняя для выпуклого тела, определенного другими буквами на входе, может быть выкинута без снижения пропускной способности канала.

6. Для достижения пропускной способности канала нужно использовать только (соответствующим образом выбранных) букв на входе, где равно рангу матрицы Более того, (по данным рога).

7. Пропускная способность является выпуклой вниз функцией переходных вероятностей

1
Оглавление
email@scask.ru