6.7.2. НЕПРЕРЫВНЫЕ ДАННЫЕ И ГРУППИРОВКА. ПОПРАВКА ШЕППАРДА
Наблюдения непрерывных случайных величин могут быть представлены в естественном виде, т. е. так, «как они наблюдаются», или в виде таблицы частот. Итак, допустим, что п.р.в. генеральной совокупности, из которой происходит выборка, равна
. Если наблюдения
фиксируются с достаточно высокой степенью точности, их можно считать реализацией непрерывной случайной величины. Их совместная выборочная плотность, в точке
при условии независимости наблюдений равна
. На практике же точность регистрации наблюдений всегда конечна, поэтому, например, выражение «значение наблюдения
равно
в действительности соответствует неравенству
, а элемент функции правдоподобия в, отвечающий этому наблюдению, будет равен не
, а
где
генеральной совокупности.
Допуская, что выборка из непрерывного распределения записывается в виде таблицы частот, обозначим частоту ячейки
через
Обозначим п.р.в. случайной величины X в точке х через
, а ее ф.р. — через
.
Если предположить, что данные получены из дискретного распределения с частотой наблюдения
равной
то функция правдоподобия будет
а ее логарифм равен:
Оценка максимального правдоподобия является корнем уравнения
Если же считать, что в действительности исходная совокупность непрерывна, то (правильная) функция правдоподобия имеет вид
Она должна быть максимизирована с привлечением некоторого численного алгоритма. Однако если
достаточно мало, например
то, опуская члены начиная с
в разложении по Тейлору, получим
где штрихи означают дифференцирование по
Тогда
и с той же степенью приближения
Например, если исходное распределение является нормальным с параметрами
, то, рассматривая в качестве в параметр
мы получим
Таким образом, группированной оценкой
будет
Уравнение правдоподобия, основанное на подправленной п.р.в., сведется к
откуда подправленная о.м.п. будет равна
Как видим, здесь оценки совпали:
Теперь рассмотрим помимо параметра
группированную оценку для
. Имеем
Приравнивая это выражение к нулю и решая его в системе с уравнением для
получаем
где
Отсюда следует, что группированной оценкой для
будет
Подправленное уравнение правдоподобия сводится к
где
— группированный четвертый выборочный момент, равный
Если мы далее аппроксимируем это уравнение, заменяя
на их соответствующие выборочные моменты, то при
с принятой степенью точности (с точностью до членов
получаем
Таким образом, подправленная о.м.п. дисперсии исходной совокупности получается из оценки дисперсий по группированным данным с поправкой на
, где
— ширина интервала группировки. (Это известно как поправка Шеппарда.)
6.8. ЛИТЕРАТУРА ДЛЯ ДАЛЬНЕЙШЕГО ЧТЕНИЯ
(см. скан)