Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
1.3. Алгоритм линейного программированияНиже будет сформулирована задача линейного программирования применительно к марковским процессам принятия решений (соотношение между итерационным алгоритмом нахождения стратегий и алгоритмом линейного программирования рассматривается в следующем разделе) и приведен алгоритм ее решения. Для дальнейшего удобно расширить понятие решений и рассмотреть рандомизированные (или смешанные) стратегии. Определим для каждого При любом
где — вероятность того, что в момент Лемма 1.2. Любая неотрицательная функция Доказательство. Поскольку
Из предположения, что
Это равенство и тот факт, что по предположению Утверждение леммы 1.2 позволяет рассмотреть следующую задачу линейного программирования:
при ограничениях вида (1.9) и
Они могут рассматриваться как
при условии
Ниже мы воспользуемся специальным видом этой задачи для нахождения ряда интересных свойств ее решения, которые, в свою очередь, будут использованы для доказательств существования оптимального решения рассматриваемой задачи и того факта, что любому базисному оптимальному решению соответствует оптимальное решение задачи Определим стационарную стратегию как функцию, которая каждому ставит в соответствие в точности одну переменную Теорема 1.4. Если в системе уравнений (1.15) оставить лишь переменные
Доказательство. Указанную подсистему можно записать в виде
(верхний индекс а) Рассмотрим однородную систему, получаемую из (1.17), если положить Суммируя уравнения указанной однородной системы по всем
Так как все слагаемые левой части равенства (1.18) неположительны, то они должны, равняться нулю. Однако, поскольку 1, то Используя аналогичные рассуждения и определяя б) Пусть
Правая часть (1.19) снова неотрицательна, откуда следует, что в) Пусть, наконец, 0. В этом случае положим Используем теперь теорему 1.4 для доказательства важного соотношения между стационарными стратегиями и допустимыми базисными решениями уравнений (1.15), когда Теорема 1.5. Если Доказательство. Действительно, теорема 1.4 устанавливает, что в случае, когда
и, таким образом, по меньшей мере одна переменная Любая стратегия, связанная, таким образом, с оптимальным базисным решением, будет называться оптимальной стационарной стратегией. В следующей теореме мы покажем, что, хотя оптимальная стационарная стратегия получена для фиксированного множества значений Теорема 1.6. Если правая часть Доказательство. Из теоремы 1.4 следует, что допустимые решения существуют, а из леммы 1.2 известно, что целевая функция ограничена. Это гарантирует существование оптимальных решений как для исходной, так и для двойственной задач. В силу теоремы 1.5 любое базисное решение невырождено, а в силу условий дополнительной нежесткости любое оптимальное решение двойственной задачи должно удовлетворять соответствующей невырожденной системе из Для доказательства второй части теоремы заметим, что оптимальность данного базисного решения задачи линейного программирования зависит от целевой функции, а не от правой части. Изменение последней может повлиять лишь на допустимость решения при любом неотрицательном значении Следующее следствие будет использовано в разделе 1.4. Следствие. Если все Из приведенных теорем вытекает, что рассматриваемая задача линейного программирования обладает специальной структурой. С помощью подходящего начального распределения (например,
|
1 |
Оглавление
|