Выводы
1. Одна из центральных задач статистического анализа реальной системы заключается в вычислении (на основании имеющихся статистических данных) как можно более точных приближенных значений (статистических оценок) для одного или нескольких числовых параметров, характеризующих функционирование этой системы. Принципиальная возможность получения работоспособных приближений такого рода на основании статистического обследования лишь части анализируемой генеральной совокупности (т. е. на основании ограниченного ряда наблюдений, или выборки) обеспечивается замечательным свойством статистической устойчивости выборочных характеристик (см. § 7.2).
2. Статистическая оценка строится в виде функции от результатов наблюдений, а потому сама по природе является случайной величиной. При повторении выборки из той же самой генеральной совокупности и при подстановке новых выборочных значений в ту же самую «функцию-оценку» мы, вообще говоря, получаем другое число в качестве приближенного значения интересующего нас параметра, т. е. имеется неконтролируемый разброс в значениях оценки при повторениях эксперимента (в данном случае — выборки)
3. В качестве основной меры точности статистической оценки 0 неизвестного параметра используется средний квадрат ее отклонения от оцениваемого значения, т. е. величина а в многомерном случае — ковариационная матрица компонент векторной оценки 0. Очевидно, чем меньше эта величина (или обобщенная дисперсия оценки 0 в многомерном случае), тем точнее (эффективнее) оценка. Для широкого класса генеральных совокупностей существует неравенство (неравенство Рао—Крамера—Фреше (8.12), (8.13)), задающее тот минимум (по всем возможным оценкам) среднего квадрата улучшить который
невозможно. Естественно использовать этот минимум в качестве начальной точки отсчета меры эффективности оценки, определив эффективность любой оценки параметра в виде отношения
4. Свойство состоятельности оценки 0 (см. § 8.1) обеспечивает ее статистическую устойчивость, т. е. ее сходимость (по вероятности) к истинному значению оцениваемого параметра по мере роста объема выборки, на основании которой эта оценка строится. Свойство несмещенности оценки (см. § 8.1) заключается в том, что результат усреднения всевозможных значений этой оценки, полученных по различным выборкам заданного объема (из одной и той же генеральной совокупности), дает в точности истинное значение оцениваемого параметра, т. е. Далеко не всегда следует настаивать на необходимом соблюдении свойства несмещенности оценки: несущественное само по себе уже при умеренно больших объемах выборки, оно может чрезмерно обеднить класс оценок, в рамках которого решается задача построения наилучшей оценки.
5. С учетом случайной природы каждого конкретного оценочного значения неизвестного параметра представляет интерес построение целых интервалов оценочных значений а в многомерном случае — целых областей, которые с наперед заданной (и близкой к единице) вероятностью Р накрывали бы истинное значение оцениваемого параметра Эти интервалы (области) принято называть доверительными (или интервальными оценками). Существует два подхода к построению интервальных оценок: точный (конструктивно реализуемый лишь в сравнительно узком классе ситуаций) и асимптотически-приближенный (наиболее распространенный в практике статистических приложений), см. п. 8.6.5.
6. Основными методами построения статистических оценок являются:
метод максимального правдоподобия (см. п. 8.6.1);
метод моментов (см. п. 8.6.2);
метод наименьших квадратов (см. п. 8.6.3);
метод, использующий «взвешивание» наблюдений, — цензурирование, урезание, порядковые статистики (см. п. 8.6.4).
Различные варианты метода, использующего «взвешивание» наблюдений, находят все большее распространение в связи с устойчивостью получаемых при этом статистических выводов по отношению к возможным отклонениям реального распределения исследуемой генеральной совокупности от постулируемого модельного.
7. Наличие априорной информации об оцениваемом параметре, позволяющей сопоставить с каждым возможным значением неизвестного параметра некую вероятностную меру его достоверности, т. е. сведений об априорном вероятностном законе распределения оцениваемого параметра, позволяет существенно уточнить оценки, полученные традиционными методами (методом максимального правдоподобия, методом моментов и т. п.) в условиях отсутствия такой информации. Построение таких оценок осуществляется с помощью так называемого байесовского подхода (см. п. 8.6.6), а сами оценки называются байесовскими.