Рис. 5.1.2. Графы переходов состояний автомата с линейной тактикой: а — при
, б - при
рис. 5.1.2) производятся различные действия, т. е. действие
производится при
Таким образом, является состоянием автомата, в котором он производит
действие
Легко видеть, что при нештрафе
последнее действие повторяется и закрепляется, а при штрафе
внутреннее состояние автомата изменяется так, чтобы быстрее сменить это действие на другое. Доказано [46, 134], что в стационарной среде, т. е. при неизменных вероятностях штрафа за каждое действие, этот автомат асимптотически оптимален:
где
— знак математического ожидания;
— минимальная вероятность штрафа:
— вероятность штрафа за
действие автомата
Асимптотическая оптимальность означает, что в стационарной среде при увеличении объема памяти
автомат всегда будет совершать наилучшее действие, минимизирующее его штраф.
Очевидно, что в нестационарной среде нельзя объем памяти
делать слишком большим, так как при этом затрудняется перестройка с одного действия автомата на другое. Чем более нестационарна среда, тем меньше должен быть параметр памяти
Таким образом, при использовании автомата с линейной тактикой для целей альтернативной адаптации эффективность
процесса определяется одним параметром, оптимальный выбор которого обычно представляет некоторую трудность.
Рассмотренный автомат является детерминированным. Далее перейдем к стохастическим автоматам.