Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 3.2. Предпосылки случайного поискаСлучайный поиск как метод управления имеет свою историю, связанную в основном с отстаиванием «права на существование». Однако случайный поиск возник не на пустом месте: его появлению предшествовал период предыстории, когда инструмент случайности оттачивался на решении различного рода прикладных и теоретических задач. Рассмотрим их. I. Простейший, всем известной схемой, использующей идею случайного поиска, является метод, называемый обычно методом проб и ошибок. Строго говоря, его нельзя даже назвать методом, так как довольно трудно точно определить, в чем же он состоит. В действительности правильнее было бы говорить о методе случайных проб и исправления ошибок. Как видно, метод предполагает возможность случайных экспериментов (проб) с некоторыми объектами, причем допустим неудачный результат экспериментов. Эти неудачи не имеют рокового характера, и их последствия легко устранимы (исправимы), т. е. стоимость исправления допущенной ошибки невелика. Такова ситуация, типичная для применения метода проб и ошибок. Само применение метода связано прежде всего с использованием идеи случайности: здесь пробы (эксперименты) всегда случайны, поскольку для их организации нет никаких иных соображений. В самом деле, если бы такие соображения были, то отпала бы необходимость в методе проб и ошибок. Итак, метод проб и ошибок опирается на два существенных предположения — нероковой характер ошибок и отсутствие априорных соображений о том, как и в каком направлении делать пробы. Эти предположения почти неизбежно приводят к случаю. Действительно, случайность в такой ситуации является единственно разумной мерой: случайность почти ничего не стоит и всегда содержит в себе искомое решение. Это значит, что достаточно длительный поиск всегда приведет к решению задачи. Сказанное, безусловно, оправдывает применение метода проб и ошибок для решения практических задач, несмотря на его несколько одиозную славу. (Вспомним, что часто мы так «обзываем» всякую неудачную постановку эксперимента, когда априорных сведений достаточно для организации детерминированного поведения, т. е. для построения регулярного плана эксперимента. Однако подобная ситуация складывается не столь часто, как хотелось бы: априорных данных чаще бывает недостаточно, особенно в поисковых экспериментах, и неизбежно приходится обращаться к пресловутому методу проб и ошибок с его «неразумной», но спасительной случайностью.) II. Метод Монте-Карло появился в 1943 г. и с тех пор стал одним из самых распространенных вычислительных методов. Метод Монте-Карло представляет собой наиболее эффективное (и эффектное) применение случайности. Математически он, как правило, связан с вычислением многомерных интегралов в заданных областях, а содержательно — с определением характеристик моделируемых случайных процессов. Популярность этого метода обусловлена прежде всего тем, что он явился основой для моделирования сложных процессов (например, технологических) с помощью ЭВМ. Дело в том, что очень часто мы много знаем о деталях интересующего нас процесса, но почти ничего не можем сказать о его поведении в целом. Иначе говоря, по локальному поведению процесса необходимо определить его интегральные свойства. В простейшем случае, когда локальные свойства процесса удается описать в виде регулярных дифференциальных отношений, получаем дифференциальное уравнение, интегрирование которого и позволяет определить глобальные свойства процесса. Примером такого уравнения является известный второй закон Ньютона. Однако для сложных процессов, обладающих стохастическими локальными свойствами, в лучшем случае получается стохастическое дифференциальное уравнение, интегрирование которого представляет огромные трудности, а в худшем — лишь правила перехода процесса из одного состояния в другое. Эти правила имеют определенный стохастический характер, т. е. всегда можно «разыграть» с помощью ЭВМ конкретные случайные реализации переходов и тем самым построить различные траектории процесса. Очевидно, что такие траектории случайны и каждая из них в отдельности почти ни о чем не говорит. Однако возможность построить с помощью ЭВМ большое число траекторий нашего процесса открывает широкие перспективы, которые и и использует метод Монте-Карло. Действительно, поскольку каждая полученная траектория моделирует поведение реального процесса, то интересующие нас свойства процесса можно определить, обрабатывая траекторий как различные наблюдения реального процесса. Например, таким образом можно определить поведение в среднем, максимальные уклонения, дисперсию и другие вероятностные свойства нашего процесса. Как видно, суть метода Монте-Карло состоит в многократном моделировании («разыгрывании») случайного поведения процесса и принятии каких-то необходимых решений на этой основе. Для разыгрывания нужно уметь многократно моделировать локальное случайное поведение процесса с целью определения его интегральных, глобальных характеристик, на основе которых применяются управленческие решения. Приведем пример применения метода Монте-Карло для решения такой простой задачи, как определение среднего случайной переменной. Прежде всего нужно уметь моделировать эту случайную переменную, для чего необходимо знать ее распределение, с помощью которого описывается локальное поведение исследуемого процесса. Пусть Располагая этим распределением, можно поступить двояко. С одной стороны, естественно воспользоваться известной формулой для среднего как математического ожидания, которое вычисляется с помощью интеграла:
С другой стороны, можно для оценки применить метод Монте-Карло. В данном случае он заключается в том, чтобы оценить среднеес помощью ряда специально генерированных случайных чисел
имеющих плотность распределения
Здесь через Таким образом, метод Монте-Карло обходит трудности, связанные с наблюдением реального процесса, и позволяет получить ряд (3.2.2) путем моделирования случайной величины х в соответствии с имеющейся плотностью распределения Этот подход легко обобщается На любую функцию
является монте-карловской оценкой среднего
Естественно задать вопрос: не проще ли — а главное, не точнее ли — вычислить интеграл (3.2.1), например, методом трапеций, чем оценивать его по формуле (3.2.3) с помощью ряда специально разыгранных чисел В одномерном случае, когда х — скаляр среднее
вычисление многомерного интеграла
представляет уже довольно сложную задачу, точность решения которой уменьшается с ростом размерности
где случайные векторы Оценка (3.2.8) является случайной величиной: для другого ряда случайных чисел 1 . Оценка
т. е. в среднем совпадает с точным значением интеграла (3.2.7). 2. Оценка у состоятельна:
3. Ее дисперсия зависит от
где с — некоторая не зависящая от Эти свойства метода Монте-Карло делают его очень эффективным при решении сложных задач. Действительно, первое свойство (несмещенность оценки) гарантирует, что при любом Таким образом, случайность в методе Монте-Карло используется для моделирования (имитирования) локального поведения процесса. Это и обеспечивает методу широкие возможности и огромные перспективы. Так, в последнее время бурно развивается метод имитационного моделирования, который является развитием метода Монте-Карло для решения задач моделирования поведения сложных систем. III. Метод рандомизации предложен в 30-х годах Фишером, заложившим основы математической теории эксперимента, и широко используется в планировании эксперимента. Метод также опирается на специально генерируемую случайность. Суть проблемы заключается в следующем. Пусть необходимо построить модель изучаемого явления, зависящего от ряда факторов. Для простоты положим, что таких факторов два —
а в эксперименте он наблюдает отдельные реализации зависимости
где
где Описанный путь нереален, так как исследователь никогда не располагает зависимостью его распределения
где Использование генерированных случайных значений элиминируемого фактора и образует основу процедуры рандомизации планируемого эксперимента. Здесь случайность играет роль элиминирующего, исключающего фактора, сглаживающего влияние посторонних воздействий на изучаемое явление. IV. Стохастическая идентификация динамических систем также использует случайность в виде белого шума, который, как известно, имеет
где
где
т. е. импульсная переходная функция объекта в этом случае с точностью до постоянной совпадает со взаимно-корреляционной функцией белого шума и реакции объекта на этот шум. Такой способ идентификации динамического объекта обладает тем преимуществом, что не вызывает резонансных явлений в объекте. Здесь эффективно используется «всечастотность» случайности. V. Гомеостат Эшби является машиной, реализующей, по сути дела, один из простейших алгоритмов случайного поиска. Эшби предложил свой гомеостат в Г омеостат представляет собой линейную динамическую систему
где
Известно, что система (3.2.20) в случае устойчивости имеет одно устойчивое состояние в начале координат ( Задача заключалась в том, чтобы автоматически определять такие матрицы А, которые делали бы гомеостат устойчивым. Эшби предложил в момент обнаружения неустойчивости, т. е. при
изменять матрицу А случайно, т. е. вводить в гомеостат элемент случайности. Алгоритм управления гомеостатом имеет вид
где Здесь случайность ошибку, то выбор устойчивой матрицы целесообразно доверить случаю. Это значительно проще, чем искать ее по известному, но громоздкому критерию отрицательной действительной части всех собственных чисел матрицы А. Нетрудно заметить, что гомеостат по сути дела реализует метод проб и ошибок, рассмотренный выше. Здесь критерием успешности случайной пробы является выполнение условия Аналогичная идея реализуется так называемым «усилителем мыслительных способностей», также предложенным Эшби [245]. Несколько претенциозное название этого усилителя связано с любопытной мыслью о том, что случай содержит ответы на все вопросы, а правильный ответ может реализоваться путем многоэтапной селекции, отбора. К сожалению, Эшби не указал, каким образом делать этот отбор. Во всяком случае, отбор должен опираться на проверку истинности полученного промежуточного результата путем определенных процедур вывода, позволяющих отсеивать заведомую нелепость. Эшби даже доказал теорему, что такой процесс заканчивается за конечное время. Идея доказательства опирается на очевидное соображение, что случайное исходное разнообразие можно исчерпать за конечное число этапов селекции, если на каждом этапе редукция (снижение) разнообразия конечным образом отличается от нуля. VI. Случайные поисковые сигналы могут быть эффективно использованы для экстремального управления непрерывным объектом [118], т. е. для минимизации его выхода путем соответствующего воздействия на вход. Пусть объект управления представляет собой статический
где X — искомое состояние входа объекта, минимизирующее его выход. При экстремальном управлении к каждому входу
где
где
где Как видно из (3.2.28), при отсутствии случайных возмущений: Таким образом, использование случайных сигналов VII. Метод случайного баланса, предложенный Саттерзвайтом [264], использует случайный план для определения существенных факторов управляемого объекта. Пусть для простоты объект представляется линейной моделью
где Задача заключается в том, чтобы выявить эти существенные факторы, т. е. сводится к оценке коэффициентов с помощью малого числа
координаты которых являются независимыми и центрированными случайными величинами. Тогда имеет место
т. е. эта сумма мала, так как она с точностью до множителя
где Очевидно, что эти оценки приближенны вследствие приближенности выражения (3.2.31) и влияния случайных помех Строго говоря, возможно получить любые значения этих оценок, сколь угодно сильно отличающиеся от действующих. (С этого упрека методу случайного баланса обычно и начинают его критику.) Но это примерно так же маловероятно, как существенное искажение модели из-за влияния «хвостов» центрированной помехи в объекте. Приближенность и смещенность оценок, вызванные малостью числа экспериментов, не должны никого смущать, поскольку нас здесь интересует лишь соотношение между коэффициентами влияния, а не их абсолютные значения. С помощью случайных экспериментов (3.2.30) удается выделить переменные, которые претендуют на существенность. Более того, их «претензии» можно даже проранжировать по полученным оценкам
где коэффициенты Как видно, случайность плана (3.2.30) в методе случайного баланса гарантирует решение поставленной задачи, т. е. выделение существенных факторов. VIII. Смешанные стратегии в теории матричных игр с нулевой суммой впервые рассмотрены Нейманом еще в 1928 г. Ситуация матричной игры двух лиц (игроков) описывается следующим образом. Пусть первый игрок имеет Оказывается, что при отсутствии седловой точки в платежной матрице, т. е. при
оптимальной является смешанная (рандомизированная) стратегия, определяемая для первого игрока вероятностями
где Здесь рандомизация связана не столько с максимизацией выигрыша, сколько с минимизацией проигрыша. Случай здесь играет роль «дымовой завесы», не позволяющей противнику действовать наверняка. При отсутствии активности одного из игроков оптимальное решение всегда лежит в области чистых, или детерминированных, стратегий. Чистая стратегия оптимальна также при наличии в платежной матрице седловой точки, т. е. когда в выражении (3.2.34) стоит знак равенства. Таким образом, случай в антагонистических играх выступает в роли фактора, мешающего противнику выиграть. Как видно, случайность уже давно стала активным фактором, которым человек широко пользуется не только в обыденной жизни, но и в науке и технике. Случайный поиск является следующим этапом освоения случайности, ее приспособления для решения с помощью ЭВМ, пожалуй, самых распространенных задач нашего времени — задач оптимизации и адаптации сложных систем.
|
1 |
Оглавление
|