7.2.1. Функция потерь.
Параметры регрессионной поверхности находят из условия минимизации по вектору 0:
где . Покажем, что для
1) решение этой задачи единственно;
2) в модели (7.2) для симметричных распределений случайных ошибок оценка состоятельна. В самом деле, функция рассматриваемая как функция от 0, строго выпукла вниз. Следовательно, строго выпукла вниз и сумма поэтому минимум единствен и достигается в одной точке. Из строгой выпуклости и, следовательно, положительности вытекает, что для любой симметричной относительно нуля случайной величины для любого
Из закона больших чисел [14, п. 7.2.1] следует, что в модели (7.2) для больших значений для любого фиксированного вектора
При симметричном относительно нуля распределении случайных ошибок, как следует из (7.23), правая часть (7.24) будет наименьшей при Следовательно, в силу (7.24) должно быть при большом близко к , т. е. оценка состоятельная.
В сформулированных выше условиях асимптотическая ковариационная матрица имеет вид (см. также гл. 11):
где — случайный регрессионный остаток.
В практической работе математические ожидания, стоящие в правой части (7.25), заменяются на их выборочные оценки:
Напомним, что формула (7.25) верна только для независимых и симметрично (относительно нуля) распределенных регрессионных остатков.
Методы вычисления [44, 94, 1863. Основные уравнения имеют вид
Введем под знак суммы веса и заменим на Получим систему
Система (7.28) решается итеративно, при этом веса оцениваются на основе параметров, полученных на предыдущем шаге. В качестве нулевого приближения параметров можно взять обычные мнк-оценки. Чтобы не иметь дела со слишком большими весами, выбирают какую-либо большую константу с и для с полагают Для минимизации пользуются также методами линейного программирования [253, 256] или специальным геометрическим приемом [53].
В качестве математической модели симметричного распределения с более тяжелыми хвостами, чем у нормального распределения, часто берут распределение Лапласа с плотностью
Если в модели (7.2) «остатки» не зависят от X, независимы между собой, одинаково распределены и имеют распределение Лапласа, есть оценка максимального правдоподобия для
Оценка Хубера [213, 2141. Исходя из задачи поиска минимума максимальной (по всем симметричным засорениям нормального распределения) асимптотической дисперсии оценки параметра положения, П. Хубер ввел в рассмотрение функцию потерь
Эта функция, являясь выпуклой, удачно сочетает достоинства при малых и умеренных значениях — при больших отклонениях. Применение для оценки регрессии в модели (7.2) требует обязательной одновременной оценки и параметра масштаба распределения е. Тем самым теряется одно из преимуществ — независимость процедур оценивания этих параметров. П. Хубер предложил искать и он из решения системы:
где — плотность стандартного нормального распределения.
Авторы [124] советуют заменить последнее уравнение в (7.30) на
где . Теоретические свойства этих оценок и соответствующие вычислительные процедуры изучаются в [43, 110, 124].
На практике для оценки ковариационной матрицы в случаях, когда распределение можно считать симметричным, можно использовать формулы (7.25), (7.26), (7.27) с заменой на