5.6. ОПТИМАЛЬНАЯ ПРОГРАММА ПРОИЗВОДСТВА СТАЛИ
Здесь мы покажем на простом примере, каким образом можно применять наш метод к планированию производства некоторой продукции, с тем чтобы добиться максимального ее количества. В соответствии с нашей тенденцией ситуацию лучше полагать «дифференциальной», дискретные шаги фактически должны
быть сглажены в непрерывный процесс. В результате мы получаем задачу долгосрочного планирования.
Пусть государство или некоторое большое предприятие приступает к планированию производства стали. Предположим — и это действительно согласуется с практикой, — что некоторое количество из имеющейся в наличии стали должно быть выделено для добавочного производства стали. В каждый текущий момент имеющееся в наличии количество стали должно быть разделено на три части на цели добавочного производства стали, для построения сталепрокатных станов и на создание запасов. Мы хотим максимизировать запас стали к концу некоторого заранее намеченного срока
Как мы должны действовать? Можно предположить, например, что вначале все ресурсы передаются на увеличение количества прокатных станов, а когда число их станет достаточно большим, нужно полностью переключиться на производство стали Когда должен произойти такой переход?
Пусть
число прокатных станов в момент времени
количество стали в этот момент. Пусть — доля этой стали, выделенная на строительство новых прокатных станов, — доля стали, выделенная на цели дальнейшего увеличения производства стали, так что
Будем считать, что скорость производства прокатных станов прямо пропорциональна количеству стали, выделенной для этой цели, т. е.
где
некоторое положительное число. Пусть количество новой стали, которое производится из единицы запасов стали в единицу времени, равно
Тогда скорость, с которой производится новая сталь, равна а скорость расходования запаса равна Кроме того, сталь, выделенная на строительство прокатных станов, безвозвратно изымается из текущего запаса со скоростью Таким образом,
Третьей фазовой координатой является
время окончания программы. Итак, мы приходим к следующим уравнениям движения
Количество имеющихся в наличии прокатных станов ограничивает выпуск новой стали. Поэтому для некоторого
мы должны принять ограничение
или
в этой задаче величины, ограничивающие управление, не обязательно постоянны
Примем за
октант
трехмерного пространства; терминальной поверхностью будет плоскость
Параметризация для такова:
Плата терминальная, поскольку наша цель — максимизировать
при
Следовательно,
Ограничение (5.6 1) имеет смысл только при
или, обозначив
можно сказать, что оно имеет смысл лишь при
В соответствии с этим плоскостью
на которой
можно разделить
на две части:
где
где
Если точка находится в то это означает, что имеется достаточно прокатных станов, чтобы переработать всю сталь; в точках из
скорость производства стали ограничена сверху имеющимся в наличии количеством прокатных станов. На рис. 5.6.1, а изображено пространство У. Заметим, что вектограммы имеют треугольное «основание» в и трапецеидальное в
это обусловлено наложенными на управления ограничениями. На рис.
показано, каким образом эти ограничения определяют форму «оснований».
Основное уравнение (4.2.1) здесь имеет вид
Чтобы найти
заметим, что как в
так и в мы максимизируем линейную функцию от
на выпуклом многоугольнике. Максимум ее всегда достигается в вершине. На рис. 5.6.2 указаны значения, которые принимают выражение в фигурных скобках основного уравнения на каждой из вершин Вершины здесь перенумерованы так же, как на рис. 5.6.1,6, где
эти номера обведены кружками; соответствующие величины обозначены через
Рис. 5.6.1.
Мы еще будем ссылаться на эти локальные стратегии с их номерами; например, мы будем говорить, что в вершине
Разумеется, стратегии 1, 2, 3 применяются в
в
Рис. 5.6.2.
Тот факт, что ограничения на
не постоянны, приводит к необходимости изменить наш обычный способ получения уравнений характеристик. Это изменение несложно и выражается в том, что при дифференцировании основного уравнения по управлениям мы включаем в число аргументов
или
Поскольку
основное уравнение (4.2.3) здесь принимает вид одного из уравнений
уравнениями характеристик в регрессивной форме будут
Сделаем теперь некоторые замечания общего характера.
Действительно, если V — гладкая функция, то из (5.6.2) и последнего уравнения движения следует, что
На поверхности переключения одно
заменяется другим, но они должны иметь одно и то же значение в момент переключения. При пересечении плоскости
функции
совпадают, поэтому числовые значения их равны.
Во всех точках из
имеем
В самом деле, предположим, что мы начинаем в точке
из
и действуем оптимально. Если количество стали увеличить на
мы, пренебрегая приростом, можем применять первоначальную стратегию и получить плату, равную прежней цене плюс
Второе неравенство получаем аналогично, рассматривая случай, когда мы пренебрегаем приростом количества прокатных станов
Разумеется, при этом можно использовать прежние и ограничение (5.6.1) здесь уже не играет роли.
Действительно, как следует из (5.6.4),
всегда мажорируется функцией
или
Если обозначить
то
и
Этот результат получается простым вычислением при использовании формул для
(рис. 5.6.2).
Остальные начальные условия определяем, как всегда, вычисляя Ум и
на
Вернемся теперь к рассмотрению решения в области Поскольку
на
из (5.6.6) получаем
и из
Так как
то птах
на есть
т. е.
Таким образом, к концу срока планирования оказывается целесообразным полностью переключиться на производство стали, совсем не выделяя средств для строительства прокатных станов.
Напишем уравнения характеристик:
где
Послс интегрирования получаем
Следовательно,
При
имеем
траектория покидает (32. При
в нуль обращается
В силу (5.6.6) следует ожидать, что
На каждой траектории либо
либо
в зависимости от относительных значений
следовательно, от
Нетрудно показать, что эти два класса траекторий заполняют все где и пересекают плоскость
в точках, для которых
Поверхность, состоящая из точек множества
для которых
аналогично должна пересекаться с этими траекториями во всех своих точках. Мы скоро увидим, что эта поверхность является поверхностью переключения.
Ясно, что
выпадает из рассмотрения, ибо из (5.6.7) следует, что
когда
Рассмотрим теперь траектории на дальней стороне поверхности переключения. За начальные условия принимаем
(здесь
новые параметры), Принимая в качестве стратегий значения
и в вершине 4 на рис. 5.6.2, получаем следующие уравнения характеристик:
Оптимальные стратегии можно полностью определить, не прибегая к интегрированию этих уравнений, а для нахождения V интегрирование необходимо.
Все время, пока траектория остается в
значение
должно быть положительным. Покажем, что при этом функция
равная нулю при
в остальных точках положительна Тогда из (5 6.6) должно следовать, что
В самом деле,
где
Обычная формула интегрирования такого дифференциального уравнения с начальным условием
дает
откуда в силу (5.6.4) следует наш результат, поскольку экспонента всегда положительна.
Теперь покажем, что и
не может доминировать; из этого будет следовать, что здесь преобладает
Из соотношений, приведенных на рис. 5.6.2, и из уравнений характеристик получаем, что
Так как всюду
то на поверхности переключения
В самом деле, если это не так, обозначим через то наименьшее из значений
для которых
Из уравнений характеристик следует, что при
что невозможно, так как производная от
не может быть положительной в своем наименьшем нуле.
Наконец покажем, что этот класс оптимальных траекторий полностью заполняет часть области
находящуюся за поверхностью переключения. Пусть
точка из этой части, так что
Естественная (не обращенная по времени) траектория, исходящая из этой точки, удовлетворяет уравнениям
и поэтому
Пусть
первое из значений времени, при которых
обращается в нуль (если это вообще происходит). В эгот момент
и
мы получили противоречие того же типа, что и раньше Заметим кстати, что если траектория начинается из точки плоскости
(с применением стратегии 4), то те же рассуждения показывают, что
и поэтому естественная траектория должна входить в
Итак,
Так как
то
Таким образом, траектория остается в
В конце концов она толжна достигнуть поверхности переключения. Следовательно, область за поверхностью переключения заполнена, причем траектории проходят через каждую точку плоскости
Рассмотрим, наконец,
Покажем, что в
всюду
и в силу (5.6.5) оптимальными стратегиями будут и в вершине 3 на рис. 5.6.2. Из соотношений, приведенных на этом рисунке, и из начальных условий получаем, что на
и поэтому соотношение (5 6 9) выполняется Оно выполняется также и на
в каждой точке встречи с траекторией, идущей из
на которой преобладает
или
совпадающие на
Покажем теперь, что если (5.6.9) выполняется в начальной точке траектории, то оно выполняется и в каждой ее точке. Напишем уравнения характеристик в регрессивной форме (считая, что
Их интегралы имеют вид (индексом
обозначены начальные значения)
Тогда для
Наши утверждения следуют из того, что
остается равным своей начальной величине, а в силу (5 6 3) и
остается постоянным
Наконец легко видеть, что траектории системы (5 6 10)
ответствующие левым уравнениям), исходящие из
за полняют все
Оптимальные стратеги полностью представлены на рис
где прокатных станов более чем достаточно, мы должны, как мы уже знаем, всю сталь передать для увеличения ее производства
Рис. 5.6.3
На рисунке показан один типичный случаи, когда мы начинаем из точки X в Сталепроизводство продолжается до тех пор, пока не окажутся загруженными все существующие прокатные станы Тогда X оказывается в точке А на
. От
прокатные станы используются на полную мощность, а избыток стали идет на изготовление дополнительных прокатнь станов В точке В, за время, равное
до окончания, строительство прокатных станов прекращается, вся сталь идет на производство стали,
на увеличение ее запасов Так про должается до точки С, лежащей на
Итак, оптимальную стратегию мы описати полностью, траектории тоже, по крайней мере качественно, теперь с помощью простого интегрирования можно вычислить цену