7.7. Ограничения
Изучим теперь, как скажутся на ковариационной матрице ограничения типа равенств и неравенств, которые не зависят от данных. Пусть соотношения выражают эти ограничения, которым точка 0, конечно, удовлетворяет.
Рис. 7.2. (см. скан) Ограничение типа неравенств оптимальная точка без ограничений; оптимальная точка при ограничениях; граница области, содержащей 90% всех реализаций ; - граница области, содержащей 90% всех реализаций
Пусть есть то значенне параметра которое оптимизирует функцию когда ограничение исключается, но все другие ограничения сохранены. Понятно, что если окажется допустимым значением, т. е. если то Фактически мы различаем следующие четыре случая (см. рис. 7.2):
(а) Точка по отношению к ограничению оказалась хорошей в пределах допустимой области. Следовательно, различные значения появляющиеся для различных выборок данных, вероятнее всего остаются допустимыми, и ограничение не оказывает никакого влияния на матрицу
Точка допустима но лежит очень близко к поверхности . В этом случае значительное число выборок данных может привести к недопустимым значениям что заставит точку 0 лежать на поверхности, задаваемой ограничением. Пложисть выборочного распределения 0 становится усеченной: она положительна с одной стороны от поверхности ограничения, равна бесконечности — на поверхности ограничения и нулю — с другой стороны поверхности. Вычисление ковариационной матрицы этого распределения становится трудным и не будет здесь рассматриваться.
(в) Точка недопустима, но недопустимость выражена слабо. Точка — на поверхности ограничения. Некоторые выборки данных делают точку допустимой, и, следовательно, некоторые реализации 0 попадают во внутренность допустимой области. Распределение подобно распределению в случае (б), и мы не будем работать с ним в дальнейшем.
(г) Точка резко недопустима, так что точка 0 остается на поверхности ограничения для всех возможных выборок данных, за исключением пренебрежимо малой части этих данных. В этом случае мы можем трактовать как ограничение типа равенства
Пусть теперь вектор представляет собой все ограничения с помощью равенств, включая ограничения неравенствами типа Как мы знаем из раздела 3.6, в точке должны выполняться условии Лагранжа
Если мы изменим данные на величину то обнаружим, что 0 из менялось на величину , а величины на . В точке нового оптимума равенство (7.71) примет вид (с точностью до членов первого порядка)
причем все производные вычислены в точке После вычитания из остаток равен:
где
так что
Добавка 60 должна оставить справедливым равенство Следовательно
Подставляя в уравнение и решая его относительно мы находим:
Окончательно, после подстановки выражения в равенство мы получаем:
Сравнивая формулу с формулой мы обнаруживаем два отличия:
1. Матрица заменяется на матрицу А. Из соотношения видно, что если все ограничения линейны, то фактически Так будет, например, когда все ограничения — это границы сверху и снизу.
2. Выражение умножается слева на матрицу проектирования
которая обладает тем свойством, что если х есть какой-либо -мерный вектор, то вектор удовлетворяет условию , т. е. у лежит в плоскости, касательной к ограничениям. Таким образом, матрица проектирует всякий вектор на эту касательную плоскость. Итак, получается выражение, аналогичное равенству
Если все ограничения линейны, т. е. то при соответствующих условиях равенство остается в силе при следующей его модификации:
Вычислим матрицы для простого, хотя и довольно общего случая, когда все активные ограничения порождаются нижними и верхними границами на параметры. Для простоты представления мы предположим, что активные ограничения для параметров существуют и выражаются в виде их равенства числам соответственно. Для оставшихся параметров не существует активных ограничений. Совокупность активных ограничений можно записать в виде
причем I есть единичная матрица размерами нулевая мат» рица размерами Тогда мы имеем
Так как наши ограничения линейные, мы к тому же имеем . Пусть матрица разделена на блоки следующим образом:
причем размеры матриц есть соответственно. Следовательно,
и окончательно
Как и ожидалось, дисперсии и ковариации для равны нулю, поскольку на эти параметры налагались ограничения в виде равенства фиксированным значениям.
Ковариационная матрица для параметров без ограничений свелась к матрице вместо матрицы Матрица есть просто обратная к нижнему лравому блоку матрицы А, так что ковариационная матрица для параметров без ограничений получается обращением соответствующей части матрицы А.