Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
§ 4.7. Адаптивная идентификация параметров распределенияПусть
— заданная плотность распределения скалярной случайной величины х, где
порожденными распределением (4.7.1) при
где С — искомый вектор неизвестных параметров. Таким образом, задача определения плотности (4.7.1) предполагается параметризованной. Обычным (неадаптивным) способом решения этой задачи является известный метод максимума правдоподобия, при котором максимизируется функция правдоподобия вида
где
Максимум функции правдоподобия соответствует оптимальной оценке неизвестных параметров
Эта оценка, как известно [120], обладает свойствами состоятельности
и асимптотической эффективности
где Однако задача минимизации функции (4.7.5) часто представляет собой не столько сложную, сколько громоздкую вычислительную задачу, которая обычно сводится к решению системы трансцендентных уравнений вида
Некоторое упрощение можно получить, если воспользоваться моментами случайной величины х. Для этого по распределению (4.7.1) определяются
Оценки этих же моментов можно найти по выборке (4.7.2):
Теперь, приравнивая эти выражения, получаем систему трансцендентных уравнений:
которую при Эти соображения заставляют обратиться к итерационным методам оценки неизвестных параметров распределений. Рассмотрим применение методов адаптации к решению изложенной задачи. Исходя из свойства (4.7.7), выражение (4.7.5) при
т. е.
Задача оценки параметров С, обеспечивающих максимум этого выражения, теперь может быть сформулирована, например, в виде итеративного процесса адаптации [237]:
где
вектор градиента:
Для упрощения матрицу (4.7.17) удобно представить в диагональном виде
Проиллюстрируем этот метод на примере определения параметров нормального закона распределения
Здесь
причем алгоритм адаптации (4.7.15) принимает вид
где
Теперь рассмотрим адаптацию по двум параметрам — математическому ожиданию и дисперсии. В этом случае
В результате получаем алгоритм адаптации в виде
где начальные значения
где параметры Так, при
Покажем, как применяется адаптация такого рода для оценки параметров объекта в процессе его оптимизации методом случайного поиска. Начнем с оценки модуля градиента показателя качества
где
Здесь
Здесь оба слагаемых являются случайными величинами. Величина
где Г — гамма-функция; к — модуль градиента оптимизируемой функции:
Помеха
Определим плотность распределения случайной величины
В простейшем случае для
где Ф — функция Лапласа [47]. Теперь определим составляющие градиента логарифма функции (4.7.35):
Алгоритм адаптивной оценки модули градиента к и среднеквадратичного отклонения а имеет вид
Входящие в выражения (4.7.37) частные производные довольно громоздки. При Пусть случайная величина х является заданной функцией независимых случайных величину
с заданными законами распределения
где Пусть плотность распределения х имеет по-прежнему вид (4.7.1), где, однако,
и
Ввиду сложности функции (4.7.38) зависимость (4.7.1) в явном виде представить нельзя. Поэтому в алгоритмы адаптивной идентификации (4.7.15) вместо градиента (4.7.18) следует ввести его оценку
Таким образом, задача сводится к определению оценки (4.7.42). Именно для нее и предлагается воспользоваться методом Монте-Карло. Сделать это можно следующим образом. Пусть надо оценить частную производную по параметру
Как известно,
где
Т — объем «разыгрываний» случайной величины
Выбор величины промежутка Теперь частные производные (4.7.46) можно представить в виде приближенных выражений:
где Выбор величины Любопытно, что оценка (4.7.47) не зависит явно от объема испытаний Т. Однако этот объем должен быть одинаков для оценки Предложенный метод может примениться для идентификации параметров оптимизируемого объекта и как средство для организации оптимального поиска. Такими параметрами объекта, необходимыми для построения оптимальных алгоритмов поиска экстремума, являются модуль градиента показателя качества, дисперсия помехи, кривизна гиперповерхностей равного уровня показателя качества и др.
|
1 |
Оглавление
|