Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
1.7. Анализ чувствительности по отношению к коэффициенту переоценкиВыше была рассмотрена задача с переоценкой при фиксированном коэффициенте переоценки Пример (Вейнот [111]). Имеются два состояния 1 и 2. В состоянии 1 возможны три решения Решение
Следовательно,
при Для этой задачи
Рис. 2. Суммарный средний доход с учетом переоценки, как функция от коэффициента переоценки Заметим, что
Рассмотрим пример 2 из предыдущего раздела (задачу водителя такси). Ховард [63] нашел зависимость оптимальной стратегии от коэффициента переоценки для этой задачи:
Из приведенных диаграмм видно, что существует такая точка
Имеет место следующее утверждение. Теорема 1.7. Если Доказательство. Предположим, что две оптимальные стратегии Следовательно,
или
где Таким образом, если Мы не приводим здесь алгоритма нахождения точек безразличия, подробное описание которого содержится в работе Смолвуда [106]. Интересной задачей является анализ поведения Ссылки и комментарии Теория цепей Маркова излагается во многих стандартных учебниках по теории вероятностей или теории марковских процессов, например, в книгах Кемени и Снелла [70], Феллера [56], Баручи-Рида [12], Карлина [68], Дуба [50] и Чжун Кайлая [23]. Марковские процессы принятия решений с переоценкой впервые были рассмотрены Ховардом [63], им же был предложен итерационный алгоритм нахождения стратегий. Блекуэлл [14] дал строгий анализ этого процесса и доказал существование стационарной Р-оптимальной стратегии (следствие к теореме 1.3). Блекуэллу также принадлежат лемма 1.1 и теоремы 1.1, 1.2, 1.3. Существование стационарных Формулировка задачи с переоценкой в виде задачи линейного программирования впервые была дана Депену [48]. Результаты раздела 1.3 принадлежат Де Хелинку и Эпану [28]. Общая теория линейного программирования содержится, например, в книге Данцига [25]. Пример 2 из раздела 1.6 разобран в работе Ховарда [63]. Там же рассматриваются и другие интересные задачи — об игре в бейсбол и о замене автомобиля. Последняя будет рассмотрена в разделе 2.6 в качестве примера модели без переоценки. Теорема 1.7 принадлежит Смолвуду [106], который также дал алгоритм нахождения точек безразличия, используя теорему Гамильтона — Кэли из линейной алгебры. Упомянем теперь о нескольких не рассмотренных нами интересных задачах. Первой является выбор начальной стратегии, от которого зависит скорость сходимости к Мак-Куин [80] рассмотрел с позиции динамического программирования метод последовательных приближений, дающий монотонную сходимость к Вторая задача заключается в исследовании марковского процесса принятия решений специального вида, для которого Наконец, упомянем так называемую магистральную теорему. Обозначим время планирования
|
1 |
Оглавление
|