Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
11.5. ДВУХПЕРИОДНАЯ ЗАДАЧА УПРАВЛЕНИЯ Б СЛУЧАЕ МНОЖЕСТВЕННОЙ РЕГРЕССИОННОЙ МОДЕЛИЗаймемся теперь задачей нахождения значений независимых переменных в случае, когда зависимые переменные должны быть как можно ближе к своим целевым значениям не для одного, а для нескольких будущих периодов. Эта задача — обеспечение оптимального управления для нескольких будущих периодов — добавляет новые аспекты к нашему анализу. Как признано в литературе, многопериодные задачи управления связаны с соображениями обучения на эксперименте и планирования эксперимента, а именно: по мере нашего продвижения в будущее мы получаем больше выборочной информации, что дает нам возможность улучшать наши знания о значениях неизвестных параметров. Этот процесс обучения зависит от установки значений управления, т. е. от планирования эксперимента. Ниже мы убедимся, что решение многопериодной задачи управления обеспечивает получение оптимальной последовательности действий, которая в явном виде учитывает управление, обучение и планирование эксперимента. Ввиду того, что представленные в решении будущие действия связаны с адаптацией к новым данным по мере их поступления, многопериодную задачу часто называют задачей адаптивного управления. Чтобы конкретизировать вышеуказанные соображения, рассмотрим двухпериодную задачу. Наша модель для объяснения наблюдений имеет вид
где Вектор будущих наблюдений,
где Если мы воспользуемся априорной ФПВ для элементов
где Пусть функция потерь имеет вид
где Подход I. Принятие решения типа «здесь и сейчас». С помощью ФПВ в (11.59) вычислим математическое ожидание функции потерь в (11.60), а затем минимизируем его относительно компонент 1) мы не можем использовать информацию, получаемую в результате реализации 2) мы не можем учитывать, как выбор Однако поскольку есть ситуации, в которых решение типа «здесь и сейчас» является необходимым (в том числе и для сопоставления), интересно его получить. Мы имеем
Тогда оптимальные значения для
Подставляя эти значения в (11.61), получаем ожидаемые потери Подход II. Принятие решения путем «последовательного обновления». Используем ФПВ (11.59) для вычисления
минимизации по компонентам При последовательно обновляемом решении для первого будущего периода имеем
и
Значение Для периода
где
где Минимизируя (11.66) по компонентам
что отличается от значения Подставляя (11.70) в (11.66), мы получаем, что ожидаемые потери в период
Поскольку правая часть (11.71) зависит от
Если мы теперь подставим общие ожидаемые потери для двух периодов в случае последовательно обновляемого решения приблизительно составляют
где Подход III. Адаптивное принятие решения. Опишем адаптивную процедуру управления для получения решения двухпериодной задачи. Шаг 1. Предположим, что мы находимся в начале второго будущего периода,
Необходимо подчеркнуть, что (11.74) справедливо для любого значения, принимаемого Шаг 2. Минимизируем выражение (11.74) по компонентам
Из (11.75) следует, что Шаг 3. Подставим
являющемуся функцией Шаг 4. Найдем математическое ожидание (11.76) по
Шаг 5. Минимизируем (11.77) по компонентам
Отсюда видно, что Оптимальное значение для Вернемся сейчас к вопросу получения адаптивного решения в случае двухпериодной, регрессионной задачи управления с функцией потерь, заданной (11.60), и прогнозной ФПВ, заданной (11.59). Специализируя шаг 1, представленный (11.74), получаем
где было использовано выражение (11.66) и где статистики
Ввиду того, что На шаге 3 мы подставляем (11.80) в (11.79) и получаем
выражение, являющееся функцией Шаг 4 включает вычисление математического ожидания в (11.81) по
где На шаге 5 мы минимизируем (11.82) по компонентам
где Наконец, мы можем подставить (11.83) в (11.82) и получить следующее выражение для ожидаемых потерь при заданных приближенных оптимальных установках значения
где меньше. Разница в присутствующих членах, однако, связана также с разницей в членах порядка В табл. 11.6 некоторые из полученных результатов сведены вместе. Таблица 11.6. Установки управлений для первого периода и ожидаемые потери двух периодов при различных управляющих решениях
Основное достоинство полученных решений заключается в возможности их практического использования. Кроме того, как уже отмечено, имеет место снижение ожидаемых потерь при «последовательно обновленном» и адаптивном решениях. Далее, сопоставление приближенных ожидаемых потерь для «последовательно обновляемого» и адаптивного решения задачи управления показывает, что в последнем случае потери меньше. Однако разница в большинстве случаев будет небольшой, если Т не мало и целевое значение невелико. Наконец, все эти выводы получены на частной модели и для двухпериодной задачи управления, таким образом, они не могут быть просто перенесены на другие модели и задачи.
|
1 |
Оглавление
|