§ 3. Ошибки измерений
Итак, для того чтобы восстановить регрессию в условиях схемы интерпретации результатов прямых экспериментов, достаточно восстановить плотность заданную с точностью до значения параметров а. Согласно же принятой модели параметрическое семейство плотностей содержащее искомую, определяется, во-первых, заданным параметрическим семейством функций содержащим регрессию а во-вторых, известной плотностью распределения вероятностей помехи
Задание класса функций содержащего регрессию, является неформальным моментом в постановке задачи. Класс функций должен быть задан априори.
Что же касается плотности распределения вероятностей помехи, то с формальной точки зрения возможна любая плотность. Однако на практике при проведении прямых экспериментов возникают типичные ситуации, связанные с одинаковыми механизмами возникновения помехи при измерениях. Эти механизмы могут быть изучены.
При интерпретации результатов прямых экспериментов важную роль играют следующие три закона плотности распределения вероятностей помехи: равномерный закон, нормальный закон, закон Лапласа.
Равномерным законом плотности распределения вероятностей
принято описывать ошибки округления. Пусть, например, значение некоторой большой величины х определяется с точностью до целых чисел. Тогда ошибка которая возникает вследствие округления до ближайшего целого числа, часто считается распределенной по закону
Нормальным законом плотности распределения вероятностей (законом Гаусса)
принято описывать ошибки, которые возникают при физических измерениях, проводимых в одних и тех же условиях. Условия измерения определяют величину дисперсии Так, например, ошибки при измерениях расстояния с помощью теодолита, проводимых в одних и тех же условиях (одинаковая освещенность, влажность, температура воздуха, степень запыленности атмосферы и принято описывать нормальным законом.
Законом Лапласа
принято описывать ошибки, которые возникают при физических экспериментах, проводимых в меняющихся условиях. Например, если измерение расстояния происходит при различной степени облачности, в различное время суток, при различной запыленности атмосферы и т. п., то ошибки измерения принято описывать законом Лапласа.
Каждый из этих законов порождает свое параметрическое множество плотностей
В этой главе для восстановления плотностей в различных параметрических множествах мы используем один и тот же регулярный метод — метод максимума правдоподобия. Выбор этого метода определяется тем, что его реализация не связана с техническими трудностями. Метод максимума правдоподобия может быть успешно реализован для всех интересующих нас параметрических множеств плотностей.
Итак, используем метод максимума правдоподобия для восстановления параметров условной плотности
по случайной независимой выборке
распределенной согласно закону
Для этого выпишем функцию правдоподобия
Эта функция распадается на сомножители: сомножитель
который является функцией правдоподобия для условной плотности, и сомножитель
Так как сомножитель не зависит от параметров а, то точки максимума (4.9) и (4.10) совпадают.
В дальнейшем максимизацию функции (4.10) будем также называть методом максимума правдоподобия.
Рассмотрим функцию правдоподобия для различных законов распределения помехи и найдем для них точку максимума.
Функция правдоподобия (4.10) для равномерного закона распределения помехи имеет вид
где
Максимум функции правдоподобия определится такими а и А, для которых достигается минимум выражения
т. е. а выбирается из условия минимизации наибольшего уклонения от
Для нормального закона плотности распределения вероятностей функция правдоподобия равна
а метод максимального правдоподобия эквивалентен минимизации функционала
Метод отыскания а путем минимизации функционала (4.12) называется методом наименьших квадратов.
Наконец, если считать, что помеха распределена по закону Лапласа, то функция правдоподобия равна
и максимум правдоподобия достигается при таком векторе параметров а, при котором функционал
минимален. Метод минимизации функционала (4.13) получил название метода минимальных модулей.
Как указывалось в главе III, метод максимума правдоподобия является асимптотически эффективным методом оценивания параметров, поэтому все три алгоритма являются в определенном смысле оптимальными. Плохо лишь то, что каждый из них оптимален в своих условиях (в условиях равномерного, нормального или лапласовского распределения помехи), и решения, полученные с помощью этих алгоритмов, могут значительно различаться.
В самом деле, рассмотрим наиболее простую задачу восстановления зависимости — определение среднего значения случайной величины у по выборке объема Эта задача сводится к минимизации функционала
по выборке Для нее метод минимизации наибольшего уклонения (4.11) приведет к следующему решению:
где наименьшее значение у в выборке, наибольшее значение, т. е. за оценку принимается величина, равная половине размаха выборки.
Метод наименьших квадратов (4.12) приведет к такой оценке параметра:
т. е. в качестве оценки среднего берется среднее арифметическое выборки.
Наконец, метод минимальных модулей (4.13) приводит к следующему решению: надо образовать вариационный ряд
т. е. расположить элементы выборки в порядке неубывания, и затем найти значение среднего по формуле