14. Характеристика ненадежности для «случайного» шифра
В предыдущем разделе была вычислена характеристика ненадежности для простой подстановки, примененной к языку с двухбуквенным алфавитом. Но даже для этого почти самого простого шифра и языка полученные формулы уже настолько сложны, что почти бесполезны.. Что же делать в практически интересных случаях, скажем в тех случаях, когда дробная транспозиция применена к английскому тексту с его крайне сложной статистической структурой. Эта сложность сама выдвигает метод подхода. Достаточно сложные проблемы часто могут быть разрешены статистически. Чтобы облегчить дело, введем понятие «случайного» шифра.
Сделаем следующие допущения.
1. Число возможных сообщений длины
равно
таким образом
где
— число букв алфавита. Предполагается, что число возможных криптограмм длины
также равно Т.
2. Все возможные сообщения длины
можно разделить на две группы: группу с высокими и достаточно равномерными априорными вероятностями и группу с пренебрежимо малой полной вероятностью. Высоковероятная группа будет содержать
сообщений, где
— энтропия источника сообщений на одну букву.
3. Операцию дешифрирования можно представлять графически в виде ряда линий (как на рис. 2 и рис. 4), идущих от каждого Е к различным М. Предположим, что имеется к равновероятных ключей и что от каждого Е будет отходить к линий. Предположим, что для случайного шифра линии от каждого Е отходят к случайному набору возможных сообщений. Тогда случайный шифр будет представлять собой фактически целый ансамбль шифров и его ненадежность будет равна средней ненадежности этого ансамбля.
Ненадежность ключа определяется с помощью равенства
Вероятность того, что от частного Е к высоковероятной группе сообщений отходит ровно
линий, равна
Если перехвачена криптограмма, которой соответствует
таких линий, то ненадежность равна
Вероятность такой криптограммы равна
так как она может быть создана из высоковероятных сообщений, каждое из которых имеет вероятность
с помощью одного из
ключей. Отсюда ненадежность равна
Требуется найти простое приближенное выражение для
когда
велико. Если для величины
еесреднее значение
много больше 1, то изменение
в области тех
для которых биномиальные слагаемые велики, будет малым и мы можем заменить
на
. Этот множитель можно вынести за знак суммы, которая даст значение т. Таким образом, при этом условии
— избыточность на букву первоначального языка
Если
мало по сравнению с к, то биномиальное распределение может быть приближенно пуассоновским:
где
Отсюда
Заменив
на
получим
Это выражение можно использовать, когде X близко к 1. Если же
, то существенным является лишь первый член ряда. Отбрасывая другие, получим
Итак, подводя итог вышесказанному, получаем, что
рассматриваемая как функция
-числа перехваченных букв — при
равна
Далее она убывает линейно с наклоном D до окрестности точки
После небольшой переходной области
начинает убывать экспоненциально со временем «полураспада»
если D измеряется в битах на букву. Поведение
показано на рис. 7 вместе с аппроксимирующими кривыми.
С помощью аналогичных рассуждений можно подсчитать ненадежность сообщения. Она равна