Рис. 5.1.2. Графы переходов состояний автомата с линейной тактикой: а — при , б - при
рис. 5.1.2) производятся различные действия, т. е. действие производится при
Таким образом, является состоянием автомата, в котором он производит действие
Легко видеть, что при нештрафе последнее действие повторяется и закрепляется, а при штрафе внутреннее состояние автомата изменяется так, чтобы быстрее сменить это действие на другое. Доказано [46, 134], что в стационарной среде, т. е. при неизменных вероятностях штрафа за каждое действие, этот автомат асимптотически оптимален:
где — знак математического ожидания; — минимальная вероятность штрафа:
— вероятность штрафа за действие автомата
Асимптотическая оптимальность означает, что в стационарной среде при увеличении объема памяти автомат всегда будет совершать наилучшее действие, минимизирующее его штраф.
Очевидно, что в нестационарной среде нельзя объем памяти делать слишком большим, так как при этом затрудняется перестройка с одного действия автомата на другое. Чем более нестационарна среда, тем меньше должен быть параметр памяти
Таким образом, при использовании автомата с линейной тактикой для целей альтернативной адаптации эффективность
процесса определяется одним параметром, оптимальный выбор которого обычно представляет некоторую трудность.
Рассмотренный автомат является детерминированным. Далее перейдем к стохастическим автоматам.