18-3. ЭНТРОПИЯ И ИНФОРМАЦИЯ В ЗАМКНУТЫХ СИСТЕМАХ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ
В теории информации рассматривается прохождение информации через разомкнутые системы. Между тем для процессов управления характерны замкнутые контуры циркуляции информации. На рис. 18-1 показан замкнутый контур управления в многомерной системе. Координаты процесса измеряются системой получения информации. Выработанные сигналы управления преобразуются в управляющие воздействия которые оказывают влияние на управляемый процесс и координаты Сокращенно контур циркуляции информации в данной системе может быть представлен в виде:
Для одномерной системы аналогичная схема изображена на рис. 18-2. Сокращенное обозначение контура циркуляции информации здесь имеет вид:
Мы хотим определить изменение энтропии управляемого процесса за счет действия управления, т. е. за счет воздействий, организованных на основании полученной информации о том же процессе. Ограничимся рассмотрением дискретного во времени прерывистого управления, при котором информация об управляемом процессе в течение некоторого интервала времени накапливается, преобразуется и лишь после этого один раз за интервал вырабатываются управляющие воздействия. Предположение о дискретности управления связано с исчислением среднего количества информации на один сигнал.
Хотя дискретность управления, одинаковая для всех управляющих воздействий, имеется далеко не во всех комплексных системах, она характерна для важного класса комплексных автоматических систем с цифровыми управляющими машинами. Кроме того, соотношения могут быть, по-видимому, обобщены на случай непрерывного управления.
Для получения общих соотношений, справедливых для любых звеньев замкнутого контура, в числе которых могут находиться и люди—операторы, необходимо использовать достаточно общее понятие передачи информации.
Обратимся к рис.
Разомкнем контур в какой-либо точке, например в точке соединения измерительной системы (системы получения информации) с
Рис. 18-2. Циркуляция информации в одномерной системе управления.
управляемым процессом (объектом). Иными словами, прекратим поступление информации от управляемого процесса к измерительной системе. Подадим на вход измерительной системы информацию, т. е. некоторое значение х, от постороннего Источника. Тогда после прохождения сигнала через систему управления и управляемый объект на выходе образуется значение х. Таким образом, в разомкнутой одномерной системе имеет место передача информации вида
Аналогично в разомкнутой многомерной системе реализуется передача информации вида Предполагается, что размыкание многомерной системы происходит так же, как и одномерной. При этом получается многомерный разомкнутый контур.
Согласно (18-33) количество информации при передаче равно:
где энтропия х до поступления сигнала усредненное по х значение энтропии после получения сигнала х.
Для сокращения записи использованы обозначения
В формулах количества информации (18-32) и (18-33) в общем случае фигурирует информационная энтропия. Однако в рассматриваемом контуре информационная энтропия вектора х совпадает с энтропией процесса не только по величине (что согласно предыдущему имеет место всегда), но и по существу. Последнее обусловлено тем, что здесь — координаты самого управляемого процесса.
Соотношение (18-37) можно представить в следующем виде:
где
Величину 5 будем называть приращением энтропии приведенных шумов. Смысл этой величины следующий. Величина является» энтропией координат на выходе (энтропия процесса) при заданном сигнале х на входе. Энтропия эта имеет конечную величину вследствие воздействия различного рода погрешностей и шумов, причем она отображает суммарный эффект действия ошибок и шумов измерителей, системы преобразования информации, исполнительной системы, а также возмущающих сил непосредственно на сам управляемый процесс. Действие этих шумов как бы» приведено к выходу контура — управляемым координатам х. Член представляет собой ту же величину, усредненную по входной величине х.
Таким образом, приращение энтропии приведенных шумов есть разность энтропии шумов, приведенных к выходу, и той же энтропии, усредненной по входным величинам.
Мы рассмотрели разомкнутый контур управления. Замкнем теперь, контур прерывистого управления. Тогда на вход воспринимающей системы будут воздействовать координаты управляемого процесса в некоторый момент времени, а величиной х будут координаты того же управляемого процесса в момент времени. Таким образом, после замыкания контура прерывистого управления будеуг иметь:
Величины и при замыкании контура прерывистого управления обращаются в значения энтропии управляемого процесса, соответственно в моменты времени.
Уравнение для замкнутого контура прерывистого управления принимает вид:
или
где значения энтропии управляемого процесса соответственно в моменты времени; -количество информации, переданное в соответствующий интервал времени от источника информации (управляемый процесс) к приемнику, которым является тот же самый управляемый процесс (передача вида приращение энтропии приведенных шумов.
Уравнение (18-39) выражает следующую теорему.
Приращение энтропии управляемого дискретным образом во времени процесса за интервал дискретности равно разности приращения энтропии приведенных шумов и количества информации, переданной в замкнутом контуре за тот же интервал времени. Из этого общего положения можно сделать ряд важных выводов. Обозначая индексом начальный момент времени и суммируя соотношения (18-39), находим:
Энтропия управляемого дискретным образом процесса равна разности начальной энтропии этого процесса, сложенной с суммарным приращением энтропии приведенных шумов, и суммарного количества информации, переданной через контур
Для стационарного процесса
Таким образом, для поддержания стационарного управляемого процесса необходимо передавать через контур управления в течение интервала дискретности количество информации, равное соответствующему приращению энтропии приведенных шумов.
Здесь уместно также дать дополнительное толкование величины Для неуправляемого процесса количество информации У равно нулю и
т. е. приращение приведенной энтропии шумов равно приращению энтропии неуправляемого процесса за соответствующий интервал времени.
Остановимся еще на вопросе идентичности процессов. ,Два процесса называются идентичными, если текущие их координаты равны: Очевидно, что энтропии идентичных процессов равны. Из соотношения (18-39) вытекает, что необходимым (но недостаточным) условием идентичности двух управляемых процессов является равенство
Все указанные положения справедливы в самом общем случае произвольного распределения вероятностей.
Рассмотрим специально случай нормального распределения. Согласно (18-35) при нормальном распределении вероятностей
где значение корреляционного определителя вектора значение корреляциднного определителя вектора т. е.
— математическое ожидание произведения отклонений компонент случайного вектора в момент времени
Формула (18-36) в данном случае дает:
где совместный корреляционный определитель векторов
Здесь
Подставляя эти выражения в (18-39), получаем: 1
Отсюда
или
Находим окончательную формулу:
Для одномерной системы
где — значения дисперсии в моменты времени; коэффициент корреляции между значениями координаты.
Таким образом, для случая одной координаты
и
Дисперсия координаты управляемого процесса будет уменьшаться, до тех пор, пока
т. е.
Чем больше коэффициент корреляции при заданном приращении энтропии приведенных шумов тем быстрее уменьшается в процессе управления дисперсия координаты. Однако по мере уменьшения дисперсии падает коэффициент корреляции и в конце концов устанавливается стационарный режим, при котором дисперсия неизменна.
В стационарном режиме
В частности, для независимого шума
где дисперсия шума.
В стационарном режиме
Заметим также, что если т. е. количество переданной информации бесконечно (что в действительности неосуществимо), то дисперсия обращается в нуль за один интервал дискретного управления.
Достоинством ассмотренных понятий являются их общность, воз можность применения почти к любым системам управления без точного знания их структуры. Однако это ни в коей мере не заменяет
детального анализа процессов. Чтобы в какой-то степени пояснить возможность практического применения новых понятий, приведем следующий пример.
Пример. Пусть требуется построить комплексную дискретную систему автоматического управления самолетом с центральной цифровой управляющей машиной, обеспечивающую в стационарном режиме 1:
точность стабилизации курса точность стабилизации высоты о точность стабилизации на заданной траектории в боковом движении
точность выдерживания нулевого угла скольжения с
точность нацеливания бортовой станции .
Перечислить все многочисленные координаты управляемого объекта здесь нет необходимости.
Требуется, чтобы система управления после ее включения выводила объект в указанный стационарный режим не более чем за 30 сек. Возможный начальный разброс координат включения системы) следующий:
Известно, что в случае внезапного прекращения управления в стационарном режиме, отклонения за 1 сек нарастают до следующих значений:
Для простоты примера интервал дискретности управления принимается одинаковым для всех координат, закон распределения — нормальным и координаты — независимыми (что, разумеется, неточно). Кроме того, считается, что в контуре управления используются лишь отклонения координат с указанными дисперсиями, а не сами координаты. Заданные же значения координат хранятся в специальных запоминающих устройствах, здесь не рассматриваемых.
Требуется: 1. Определить количество информации, которое необходимо передавать через полный многомерный контур управления в стационарном режиме в течение интервала дискретности сек. 2. Оценить общее количество информации, которое необходимо передать через полный многомерный контур, управления в переходном режиме. 3. Оценить нижнюю границу емкости памяти цифровой управляютцей машины, работающей с интервалом дискретности выборки информации сек.
Ответ на первый вопрос вытекает непосредственно из формулы стационарного режима где приращение энтропии приведенных шумов определяется для случая лотери управления
Такое количества информации должно в стационарном режиме передаваться через полный многомерный контур. Однако, количество информации, вырабатываемое источниками и передаваемое в центральную цифровую машину, должно быть больше указанного, так как в различных звеньях контура происходит потеря информации.
Ответ на второй вопрос получим из (18-40). Согласно этой формуле суммарное, количество информации, передаваемой за время переходного процесса, равно сумма общего приращения энтропии процесса и общего приращения энтропии приведенных; шумов:
Приращение определяем по, приведенным данным:
Приведенные исходные данные не позволяют точно определить Однако, оценку этой величины можно получить, предполагая все приращения энтропии приведенных шумов равными приращению для стационарного режима. Тогда
так как время переходного процесса ставляет 30 сек. Таким, образом, оценка
количества информации, передаваемой за время переходного процесса, имеет вид:
Нижняя граница емкости памяти получается непосредственно из последнего выражения, а именно: