Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
Глава XVI. ИДЕНТИФИКАЦИЯ МЕХАНИЧЕСКИХ СИСТЕМ1. ОБЩИЕ ВОПРОСЫ ИДЕНТИФИКАЦИИЗадача идентификации. Идентификация понимается как построение математической модели функционирующего объекта (системы) по априорной информации и измерительным данным В общем случае математическая модель представляется в виде функционального уравнения
где некоторая полностью или частично неизвестная и подлежащая определению функция (функционал); - входная переменная; выходная переменная; -непрерывное или дискретное время. Для многомерного объекта х и у — векторы, а в случае одномерного объекта х и у — скаляры. Обычно имеется некоторая априорная информация , например может быть априори известен класс и даже структура уравнения, физический смысл и размерности векторов х, у, а иногда известны функции распределения случайной переменной х и ошибок измерения Однако часто встречаются такие случаи идентификации, когда почти ничего неизвестно об уравнении (1) (размерности и физический смысл векторов х, у и т. п.). В таких случаях установление переменных х, у, определение или выбор вида уравнения (1) обычно отиосят к постановке задачи идентификации реального объекта. До сих пор постановка задачи идентификации осуществляется обычно исследователем неформальными методами. Формальные методы оценивания (определения) класса и структуры уравнения (1), выяснения значимых (существенных) входов и выходов объекта пока находятся в начальной стадии развития. В большинстве практических задач идентификации уравнение (1) приводят к виду операторного уравнения
где неполностью известные и подлежащие определению математические операторы, действующие на соответственно, Когда существует обратный оператор уравнение (2) приводят к виду
где В — подлежащий определению оператор. С целью получения недостающей информации о модели эксперимент проводят в условиях функционирования объекта, при котором измеряют переменные х, у или некоторые другие величины, зависящие от х и у, причем измерение обычно возможно с некоторой ошибкой Используя априорную информацию об операторах или и результаты измерения можно найти оптимальные в некотором смысле оценки операторов или Ввиду того, что переменные х, у измеряют с ошибкой §, истинные операторы или невозможно найти, можно найти некоторые их оценки или Наиболее широкое распространение получила так называемая параметрическая идентификация. На основе априорной информации строят гипотезы о классе и структуре модели (1), (2) или (3). Используя измерения, проверяют гипотезы и принимают соответствующие решения. При этом допускается, что операторы или оператор известны с точностью до векторного параметра с, т. е. уравнения (2) и (3) имеют вид
где операторы, действующие на соответственно и известным образом зависящие от неизвестного векторного параметра с. Таким образом, оценивание операторов или сводится к задаче оценивания векторного параметра с. Параметрическая идентификация (далее для краткости ее будем называть просто идентификацией) является многоэтапным процессом и состоит из следующих основных этапов [3, 8, 14, 18, 21, 25, 28, 44, 48]: 1) планирования и проведения эксперимента, необходимого для получения наблюдений за входными и выходными переменными; 2) определения или уточнения класса и структуры модели; 3) оценивания неизвестного параметра с модели известной структуры; 4) анализа адекватности модели и принятия решения о продолжении или окончании процесса идентификации. Установление этапов идентификации в значительной степени условно, так как они переплетаются между собой и явной границы между ними не существует. Получение информативных измерений. Измерительные данные должны содержать достаточное количество информации об операторах или Если в результатах измерений и не содержится достаточной информации об указанных операторах, то никакими способами невозможно получить хорошие оценки или Когда операторы заданы с точностью до неизвестного векторного параметра с, в результате измерений и должны содержаться информация о всех компонентах векторного параметра с. Количество имеющейся в наблюдениях и информации о параметре с зависит от класса входного воздействия х, типа и уровня ошибок измерения от размерности вектора с, от вида операторов или Принципиальная возможность оценить векторный параметр с по наблюдениям и определяется условиями оцениваемости. Обычно наблюдения где отдельно ненаблюдаемые ошибки измерения входа х и выхода усоответственно. Предполагается, что и являются случайными и некоррелированными между собой и с х и у. Встречаются следующие характерные схемы наблюдения. 1. Ошибки измерений отсутствуют, т.е. Это исключительно редкий случай, позволяющий одинаково эффективно использовать модели типа (4). 2. . Основные результаты по исследованию задачи оценивания параметров операторов получены именно для этого случая. При оценивании векторного параметра с операторов этот случай не является настолько удобным, как при оценивании с оператора 3. . Этот случай эквивалентен задаче оценивания параметра с обратного оператора уравнения
4. . При этом информативность наблюдений хуже, чем в случаях 1—3. Из вышесказанного следует, что измерение входных сигналов должно осуществляться как можно точнее, так как ошибки во входных наблюдениях влияют на точность идентификации и во многих случаях не удается построить помехозащищенные методы. Методы идентификации менее чувствительны к ошибкам выходных наблюдений. Так как неучтенные в модели факторы действуют в виде неконтролируемой помехи, уровень этой помехи определяет допустимую точность наблюдений за выходными сигналами. Если наблюдения за контролируемыми непрерывными системами осуществляются в дискретные моменты времени то необходимо правильно выбрать шаг дискретности времени Обычно его выбирают в соответствии с теоремой Котельникова, т.е. из условия где максимальная частота, которую требуется различать по дискретизированным сигналам. В задаче идентификации в качестве может быть принята интересующая исследователя максимальная частота частотной характеристики системы (или максимальная частота выходных сигналов). При этом следует иметь в виду, что слишком высокая частота дискретизации непрерывных сигналов приводит к дискретным моделям (в виде разностных уравнений) с близкими к границе области устойчивости коэффициентами, что усложняет задачу оценивания параметров таких моделей. В связи с этим появляется проблема оптимальной дискретизации, которая может быть решена для конкретных структур операторов. Необходимо отметить, что при неизвестной структуре, а иногда и параметрах математической модели, нельзя указать методики получения наблюдений за входными и выходными сигналами системы, гарантирующие решение задачи идентификации оптимальным способом. При исследовании задач каждого этапа идентификации могут потребоваться новые наблюдения, проведенные в измененных (в соответствии с полученной апостериорной информацией) условиях. Оценивание параметров оператора. В большинстве случаев при известной структуре модели задачу удается свести к параметрическому виду с неизвестным вектором числовых параметров Тогда задача оценивания параметров состоит в определении таких значений параметров с, которые соответствуют наименьшему или наибольшему (для определенности далее будем говорить о наименьшем) значению выбранного критерия качества в допустимой области С:
Допустимая область определяется теми ограничениями, которые накладываются на параметры. Например, при идентификации динамических систем допустимыми являются те значения параметров, которые обеспечивают устойчивость модели. Если ограничения на параметры не накладываются, то допустимая область С совпадает с евклидовым пространством размерности Выбор критерия качества в значительной степени зависит от априорной информации, целей идентификации, формы представления наблюдений за сигналами системы, вычислительных возможностей исследователя и т. д. Поэтому здесь приведены только наиболее распространенные способы построения функции Метод наименьших квадратов. Предполагается, что существующую связь между векторами наблюдений за входными х и выходными у сигналами можно представить в следующем виде:
где вектор-функция размерности известная с точностью до вектора параметров -вектор ненаблюдаемой помехи, При этом используются два вида функции:
где положительно определенная матрица. Функция (8) является статистически обоснованной для случаев, когда вектор помехи имеет нулевое среднее, а ее координаты независимы между собой. При применении функции (9) говорят об обобщенном методе наименьших квадратов. Если где ковариационная матрица коррелированной помехи , имеющей нулевое среднее, то оценки параметров называют марковскими [32, 44]. Метод наименьших квадратов особенно часто используют при линейных по параметрам зависимостях вида
и при отсутствии ограничений на параметры, В последнем выражении некоторая матрица, элементы которой получаются из соответствующих преобразований над входными наблюдениями х. Метод максимального правдоподобия. Оценивание параметров оператора рассматривается как задача исследования условного распределения вероятностей наблюдений относительно вектора параметров с. В качестве оценок выбирают такие значения параметров, которые являются наиболее вероятными при наблюдениях и, В связи с этим функция имеет вид
где плотность условного распределения вероятностей, известная с точностью до вектора параметров с (логарифм от плотности берется для удобства при вычислении). В общем случае
где плотность условного распределения вероятностей выходных наблюдений у при фиксированных входных наблюдениях х и параметрах плотность условного распределения наблюдений х относительно параметров с. В большинстве случаев так как входной сигнал независим от параметров системы, В соответствии с (12) получаем
Если наблюдения за входными сигналами х не зависят от параметров с оператора, то второй член в фигурных скобках выражения (13) можно отбросить, так как он не влияет на значение аргумента, соответствующее наименьшему значению функции. Метод максимальной апостериорной вероятности. Предполагается, что параметры с являются случайными величинами, плотность распределения вероятностей которых известна и называется априорной плотностью распределения. Должна быть задана с точностью до параметров с плотность (и с) условного распределения вероятностей наблюдений и для каждой реализации случайного вектора с. Тогда по формуле Байеса определяется так называемая апостериорная плотность распределения вероятностей параметров с:
Если априорные вероятности характеризуют возможность появления различных значений параметров с до получения наблюдений за сигналами системы, то апостериорные вероятности описывают частоты появления тех же значений параметров после того, как к априорной информации добавлена информация, извлеченная из наблюдений и. Поэтому в качестве оценок целесообразно принимать такие значения параметров, которые соответствуют наибольшим апостериорным вероятностям. Тогда функция имеет вид
Последний член в фигурных скобках не зависит от параметров с, поэтому вместо (15) можно использовать функцию
Из выражений (11) и (16) непосредственно видно различие между методом максимального правдоподобия и методом максимальной апостериорной вероятности. Часто используют гауссовские аппроксимации плотностей что приводит к критерию вида
где — соответственно ковариационная матрица и априорное среднее вектора с. Метод среднего риска. В предыдущих методах не учитывались возможные потери, появляющиеся при отличин оценок от нстннных значений параметров оператора системы с. Эти потери можно представить так называемой неотрицательной функцией потерь Тогда мерой качества может быть функция средних потерь по всевозможным наблюдениям для каждого фиксированного значения вектора параметров с:
которая называется функцией условного риска. Функция среднего риска получается усреднением условного риска по всевозможным значениям случайных параметров с;
Из (19) следует, что функция среднего риска будет наименьшей, если минимизировать внутренний интеграл. Поэтому критерий представляется в виде
Метод среднего риска является наиболее общим методом оценивания параметров. В зависимости от конкретного вида функции потери и априорного распределения можно получить различные оценки — наиболее вероятное, апостериорное среднее, минимаксную и др. [32]. В целом оценки параметров, полученные в соответствии с двумя последними методами, называют байесовскими оценками. Численные алгоритмы минимизации. Решение экстремальной задачи (6) в явном виде можно получить только для случаев, когда критерий качества является квадратической функцией, а ограничения на параметры либо отсутствуют, либо заданы в виде системы линейных алгебраических уравнений:
где В — неотрицательно определенная матрица порядка матрица размерности ранг которой равен векторы-столбцы размерностей тяг соответственно. В этом случае оценки с параметров с получаются решением системы линейных уравнений [1]
где X — вектор-столбец множителей Лагранжа размерности Например, в случае линейных по параметрам зависимостей вида (10) метод наименьших квадратов приводит к функции вида (21) с параметрами
или
При отсутствии ограничений на параметры с из (23) получаются системы нормальных уравнений
или
В остальных случаях для решения экстремальной задачи (6) необходимо применять численные методы оптимизации [26, 411. Формально итерационный алгоритм вычисления оценок параметров представляется в виде
где направление поиска в итерации; неотрицательное число, являющееся шагом вдоль направления В соответствии с (28) процесс вычисления оценки состоит из повторения следующих двух этапов: 1) выбора направления поиска, ведущего к уменьшению функции внутри допустимой области; 2) выбора шага из интервала где максимально допустимый шаг по направлению при котором оценки остаются в допустимой области С. Различные численные методы оптимизации отличаются друг от друга выбором направления поиска и шага [12, 26, 41]. Эффективным оказывается также принцип покомпонентной минимизации выбранного критерия поочередный спуск по отдельным группам параметров при фиксированных остальных. Фиксация отдельных групп параметров обычно упрощает минимизируемую функцию относительно остальных, а для многих структур операторов она имеет вид (21). Направление поиска. Наиболее распространенными методами выбора направления внутри допустимой области С являются: метод наискорейшего спуска
метод сопряженных градиентов
метод переменной метрики
метод Ньютона
где градиент функции в точке матрица вторых частных производных; I — единичная матрица; — неотрицательно определенная матрица порядка Если на шаге поиска достигается граница допустимой области С, а очередное (вычисленное в соответствии с (29) — (32)) направление ведет из допустимой области, то максимально допустимый шаг получается нулевым, из-за чего процесс поиска преждевременно прекращается. В таких случаях необходимо с учетом активных ограничений выбирать компромиссное направление, которое ведет к уменьшению критерия качества внутри допустимой области. Для этой цели можно использовать метод проекции градиента, метод обобщенного приведенного градиента и др. [41]. Шаг обычно минимизирует функцию по направлению на интервале
Решение экстремальной задачи (33) можно получить методами одномерного поиска типа Фибоначи, золотого сечения и др. [41]. В практических задачах наиболее часто используют следующие интерполяционные формулы: при квадрэтической интерполяции
при кубической интерполяции
при квадратичной аппроксимации функции
где значения шага из интервала для которых выполняются неравенства производная функции Рекуррентные стохастические алгоритмы. На основе применения вышеописанных методов получается вполне определенный критерий качества Однако критерий качества может быть задан в виде
где — известная функция, зависящая от случайной величины со и параметров неизвестная плотность распределения вероятностей величины Следовательно, критерий качества (37) не является вполне определенным, и для вычисления оценок параметров нельзя применить детерминированные методы вида (23) или (28). Однако оказывается, что в таких случаях можно построить рекуррентные стохастические процедуры вычисления оптимальных по критерию (6) оценок параметров. Формально алгоритмы такого типа представляются в следующем виде:
где некоторая неотрицательно определенная матрица; случайное направление поиска (псевдоградиент), удовлетворяющее условию неотрицательности скалярного произведения
т. е. угол между средним направлением в итерации и антиградиентом функции (37) должен быть острым. В зависимости от вида функции способа определения направления и матрицы получаются различные варианты рекуррентных стохастических алгоритмов [1, 9, 12, 23, 27, 42, 43]. Наиболее частое качестве направления используют антиградиент наблюдаемой реализации функции в точке с.. Ограничения на параметры соблюдают путем проекции оценок в допустимую область Оцениваемость параметров и предельная точность оценивания. Естественным оказывается вопрос — какой наибольшей (предельной) точности оценок параметров можно достичь на основе имеющейся априорной информации и информации, полученной из и наблюдений за входными и выходными сигналами системы. Ответ на этот вопрос дает неравенство Рао-Крамера [32, 44]:
где ковариационная матрица ошибок
смещение оценки с
фишеровская информационная матрица
плотность совместного распределения вероятностей наблюдений и параметров с
Если параметры с являются детерминированными, то превращается в многомерную дельта-функцию: Правая часть неравенства (40) указывает нижнюю границу для ковариационной матрицы ошибок оценивания. Эта граница не зависит от конкретного метода оценивания. Если можно найти оценки параметров, для которых в (40) достигается равенство, их можно называть наилучшими оценками. Неравенгтво Рао-Крамера остается справедливым и в более частных формах записи — для следа, детерминанта или максимального собственного значения ковариационной матрицы. Из неравенства Рао-Крамера (40) также следует, что ковариационная матрица ошибок оценок параметров не ограничена по любой норме матрицы, если информационная матрица (43) вырождена. Это означает, что в таком случае нельзя найти оценки всех координат вектора с, близкие к истинным значениям. Вырожденность информационной матрицы указывает на отсутствие необходимой информации о некоторых координатах векторного параметра с. Поэтому параметры с оператора заданной структуры являются оцениваемыми, если их фишеровская информационная матрица (43) является невырожденной. Оцениваемость параметров может быть обеспечена как для каждого входного сигнала, так и в среднем для заданного класса входных сигналов [14, 24] Выделение существенных параметров. В большинстве случаев при параметризации оператора заданной структуры априори не удается точно указать число неизвестных его параметров. Исследованием условий оцениваемости можно найти верхнее число параметров, которые могут быть оценены по имеющимся наблюдениям за входными и выходными сигналами. Однако в модели всегда целесообразно оставить только существенные параметры из совокупности оцениваемых, так как число неизвестных параметров обычно определяет сложность математической модели и затраты на идентификацию, а увеличение числа параметров не всегда гарантирует улучшение математического описания исследуемой системы. Поэтому на этапе оценивания параметров оператора известной структуры необходимо определить значимость отдельных параметров или их групп. Таким образом можно выбрать и существенные входные и выходные сигналы системы, так как им соответствуют отдельные группы существенных параметров. Исходной информацией при построении решающих правил для выделения существенных параметров математической модели являются векторы остаточных ошибок
При введении в модель всех существенных параметров координаты вектора должны быть некоррелированными между собой. Первая группа решающих правил основывается на критериях проверки этого предположения [3]. Второй способ состоит в сопоставлении между собой оценок дисперсии остаточной ошибки при различных размерностях вектора с [14]. Для конкретных операторов возможны и другие подходы [49, 501. Проверка построенной модели на адекватность. Полное описание систем представляет собой нереальную задачу, так как невозможно учесть все действующие переменные и возмущения во время функционирования. Математическая модель обычно отражает только те основные закономерности реальной системы или процесса, которые необходимы для решения конкретной задачи познавания, проектирования или управления. Поэтому при решении задачи идентификации всегда появляется необходимость в оценке степени адекватности (соответствия) построенной модели реальной системе. Для количественной оценки степени адекватности могут быть использованы информационная и дисперсионная меры степени адекватности [28]. Информационной мерой степени адекватности называется величина
в точке В последнем уравнении условная энтропия выходных наблюдений у относительно входных х при фиксированных параметрах энтропия выходных наблюдений [34]. Величина принимает значения из интервала Случай единичной информационной меры означает, что построенная модель позволяет полностью восстанавливать выходные наблюдения у по входным наблюдениям х. Дисперсионной мерой степени адекватности называется величина
в точке В уравнении дисперсия координаты вектора выходных наблюдений условная дисперсия переменной относительно входных наблюдений х при фиксированных параметрах с Дисперсионная мера также принимает значения из интервала [0, 1]. В практических задачах вместо величин в числителе и знаменателе (47) используют соответствующие оцеькн, вычисленные по входным наблюдениям и остаточным ошибкам (45). Количественные меры адекватности (46) и (47) показывают степень восстановления выходных наблюдений у с помощью модели по входным наблюдениям х. В то же время во многих задачах модели требуется не только возможность восстановления выходных наблюдений, которые искажены помехами, но также и определенная точность при восстановлении неизвестных истинных значений у выходных сигналов или истинных значений с параметров системы, когда структура операторов системы и модели полностью совпадает. В этих ситуациях в качестве меры адекватности модели следует использовать некоторые числовые характеристики близости величины или с и с, причем эти характеристики не должны зависеть от неизвестных значений или Такие характеристики близости можно построить на основе применения теории доверительных областей [14]. Кроме применения вышеописанных количественных мер степени адекватности используют и другие способы проверки адекватности построенной модели, например статистический анализ вектора остатка так как его координаты только при полностью адекватной модели являются некоррелированными случайными величинами с нулевым средним и одинаковой дисперсией [40]. Сопоставлением моделей, построенных по группам наблюдений в различные периоды времени, можно обнаружить неадекватность модели с постоянными параметрами реальной системе [14, 15]. В ряде случаев пользуются качественной априорной информацией об исследуемой системе. Например, если известно, что система является колебательной или ее нелинейная характеристика выпуклая вниз, то аналогичными свойствами должна обладать построенная модель. Только всесторонняя проверка позволяет построить достаточно адекватную модель ндентифицируемой системы.
|
1 |
Оглавление
|