Пред.
След.
Макеты страниц
Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO
16.4. Сравнение модельных структурНаиболее естественно при поиске подходящей структуры модели перебрать несколько вариантов и сравнить полученные результаты. В этом разделе мы обсудим, как осуществляется сравнение при разной степени формализации. Большое значение при просмотре разных моделей имеют также методы подтверждения моделей из раздела 16.5. Сравнение моделей на новых данных: взаимное подтверждение. Нет ничего удивительного в том, что модель будет хорошо работать на том множестве данных, которое использовалось для ее настройки. Настоящая проверка состоит в том, чтобы убедиться в возможности применения модели взаимного подтверждения, они известны в нескольких вариантах. См., наиример, работы Стоуна [403] и Сни [363]. Критерием при сравнении могла бы быть, например, сумма квадратов ошибок предсказания или рассогласования между фактическими выходными сигналами и смоделированными Ум Сравнение моделей на уже использованных множествах данных: предварительная оценка с позиций практики. Если возможность сохранить часть информационного материала нетронутой в целях взаимного подтверждения отсутствует, то для сравнения двух моделей приходится вновь воспользоваться теми же множествами данных, на которых осуществлялась настройка моделей. Последнее существенно усложняет процесс сравнения. Модель, которая строилась в рамках более широкой структуры, будет автоматически придавать меньшее значение критерию согласия, поскольку соответствующее значение получено как минимальное при минимизации на множестве большего размера. Поэтому по мере расширения модельной структуры (как в
Рис. 16.1. Минимальное значение функции потерь как функции размера модельных структур Начнем с того, что чем больше особенностей, присущих данным, учитывается в модели, тем меньше становится значение Предложено несколько формализованных процедур, которые используются для формальной регистрации коленоподобных фрагментов. Мы в данном разделе эти процедуры опишем, но сначала прокомментируем их содержательный смысл. Имеется две основные идеи. Первая состоит в том, чтобы проимитировать идею метода взаимного подтверждения, т. е. использовать величину Критерий подтверждения модели. Рассмотрим скалярную меру подтверждения
где
На этом этапе функция Пусть
Аналогично в силу того, что
Чтобы определить математические ожидания от этих двух выражений, используются следующие асимптотические формулы:
где Кроме того,
и
Это при усреднении формул (16.19) и (16.20) соответственно дает
Отсюда находим, что
где последнее приближение состояло в том, что среднее значение Используя это общее выражение, мы можем рассмотреть несколько частных вариантов Информационный критерий Акаике (ИКА). Пусть критерий ошибки предсказания выбран в виде нормированной логарифмированной функции правдоподобия (см. (3.72) ):
Для случая, когда: — истинная система описывается вектором - параметры идентифицируемы так, что матрица из асимптотического результата раздела 9.3 известно, что
(см. (7.68), (7.77) и (9.29)). Подстановка (16.27) в (16.24) позволяет записать критерий в виде
поскольку
Это выражение совпадает с ИКА (7.94). Таким образом, можно сформулировать совместную задачу определения структуры модели и оценивания параметров как
где Пример 16.1. ИКА для гауссовых обновлений. Предположим, что обновления процесса гауссовы с неизвестной дисперсией
где
а внешняя минимизация
Существенный в процессе минимизации член имеет вид
где последнее приближение получено из того, что Критерий финальной ошибки предсказания Акаике (ФОП). Вернемся к формуле (16.24) и допустим, что
В предположениях (16.26) из формулы (9.17) известно, что
где
Это дает в (16.24)
В силу формул (16.23)
В результате пригодную оценку
что при подстановке в (16.32) даст
Критерий (16.33) впервые был описан Акаике [3] и назван им критерием финальной ошибки предсказания (ФОП). Он отражает величину дисперсии ошибки предсказания, которая получается в усредненном варианте использования модели Штраф за сложность модели. С более практической точки зрения рассмотренные нами сейчас критерии могут интерпретироваться как совместные критерии для определения структуры модели и значений параметров в пределах фиксированной структуры. В принципе эти критерии можно было бы записать в виде
где
Эти критерии нанравлены на отыскание таких описаний систем, которые дают наименьшую среднеквадратическую ошибку. Та модель, которая определит лучшее согласие по заметно меньшей среднеквадратической ошибке (предсказания), может быть выбрана, даже если она будет достаточно сложной. На практике может возникнуть желание ввести в функционал (16.35) добавок, штрафующий за увеличение сложности и отражающий представления субъекта о плате за сложность: ”Я собираюсь взять более сложную модель (по моей собственной мере сложности), она должна оказаться существенно лучше!”. Что же такое сложная модель и какой штраф связывать с этой сложностью? Такие вопросы обычно решаются субъективно. Интересный подход предложен Риссаненом [338]. Он утверждает, что главная цель идентификации состоит в формировании максимально короткого описания. Это ведет к критерию типа (16.34), в котором
Критерии проверки статистических гипотез Выбор между двумя модельными структурами
Эта гипотеза проверяется на фоне альтернативной гипотезы
Если теперь Теперь нам хотелось бы принять решение о выборе между гипотезами Пусть обозначает предельную оценку в рамках модельной структуры Если эта величина определяет правильное описание системы
При пулевой гипотезе (16.37) из (16.39) следует, что
Таким образом, с помощью этого выражения нулевая гипотеза может быть проверена на любом желательном доверительном уровне а. Если Использование (16.40) сводится к решению отвергнуть
где
Это соотношение в зависимости от значения разности Для малых
(сравните с леммой 11.4). Опираясь на это асимптотическое Сравнение линейных регрессий. Использование критерия (16.33) или критериев проверки гипотез (16.40) требует проведения расчетов модели для каждой из проверяемых структур. Это может оказаться трудоемкой работой. При этом важно, что применительно к модельным структурам типа линейной регрессии эта процедура существенно упрощается. Пусть самая большая модельная структура, которая будет рассматриваться в семействе
Пусть в этой структуре минимальное значение функции потерь равно
Построим ортонормальную матрицу
Тогда из
Предположим теперь, что в формуле (16.44) удаляется последний регрессор
т. е. оно возросло на Лемма 16.1. Рассмотрим линейную регрессию (16.44). Пусть
Наибольшие вычислительные трудности связаны с расчетом значений обсуждавшихся в этом разделе критериев может быть выполнена на высоком уровне эффективности. Характерным примером применения подобных методов к системной идентификации является решение задачи оценивания порядков модели и временных запаздываний. Соответствующее упорядочение регрессоров очевидно. Для общих задач регрессии с упорядочением ясности меньше. Подробное обсуждение этих вопросов можно найти в книгах Дрейпера и Смита [101] и Дэниела и Вуда [90]. В 1968 году Ивахненко [188] предложил особый способ перебора на множестве возможных модельных структур (типа линейной регрессии), который ведется только на основе экспериментальных данных - это метод группового учета аргументов (МГУА). Этот метод, который вызвал интерес, может быть представлен как процедура поиска на дереве всевозможных комбинаций регрессоров вида
где
|
1 |
Оглавление
|