1.5. Необходимые статистические предпосылки

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

1.5. Необходимые статистические предпосылки

Набор измерений называется выборкой. Слово «выборка» часто применяется как для отдельного измерения, так и для набора измерений, даже если это повторные

измерения одного и того же объекта. Этот термин появился потому, что статистики считают основой множество или ансамбль возможных измерений, а вы получаете один возможный набор результатов (одну реализацию), который связан с вероятностью получения отдельно наблюдаемого результата и с эффектами повторений эксперимента. Измерения в выборке могут быть взяты все в одной точке. Например, выборка может представлять собой ряд измерений длины определенного провода. Кроме того, измерения могут быть рассеяны по различным местам в диапазоне изменения функции, например, скорость судна в различное время дня.

Часто бывает необходимо найти модель для распределения отсчетов, т. е. необходимо представить себе ансамбль, из которого извлечена отдельная выборка.

Для иллюстрации предположим, что есть длина только что упомянутого провода, тогда модель измерений будет иметь вид

где читается: «вероятность того, что длина меньше или равна х. Таким образом, есть вероятность того, что измеренная длина меньше или равна называется интегральной функцией распределения для Во многих случаях имеет производную т. е.

В таком случае называется плотностью, либо плотностью вероятности для

Часто встречающаяся плотность, которая имеет место в таких случаях как при измерении длины куска провода, представляет гауссово (или нормальное) распределение

где — параметры, значения которых зависят от конкретной моделируемой ситуации (рис. 1.5,1, б).

Другой пример модели встречается в теории округления. Разумно предположить, что ошибка округления образуется в том случае, когда число, которое квантуется (округляется), «равномерно распределено» от до в последнем сохраняемом разряде. Следовательно,

(рис. 1.5.1, а).

Рис. 1.5.1. Распределение ошибок округления (а), Гауссово распределение (б)

Обычно рассчитываемой характеристикой случайной величины, такой как длина или в других случаях плотности служит среднее или ожидаемое значение (также называемое математическим ожиданием). Оно обозначается или и определяется как

Для примера с округлением

Для примера с гауссовым распределением

Заменяя на у, получим

Этот результат следует из того, что первое подынтегральное выражение нечетное, а второй интеграл дает

Можно рассматривать вычисление математического ожидания как воздействие оператора на функцию. Если вспомнить о моментах (да это и очевидно), получим, что среднее значение постоянной величины есть сама эта величина Помимо этого, если в модели — константа, переменная величина, то а если, кроме того, еще и — константа, тогда

Помимо среднего значения, широко используются и другие «типовые» величины. Одной из них является мода — наиболее частое значение или значение с максимальной плотностью. Другой — медиана — значение, соответствующее половине распределения. Но в этой книге мы не будем пользоваться какой-либо из этих величин.

Еще одной, обычно вычисляемой, характеристикой случайной величины или в других случаях ее распределения служит дисперсия. Она обозначается если — случайная величина, и определяется как

где имеет плотность Дисперсия значается также символом

В случае округления имеем

а для гауссового распределения

Если положить

то получим

Интегрирование по частям при обозначениях

дает

Этот результат поясняет, почему мы выбрали специфическую форму записи гауссового распределения: представляет собой дисперсию, среднее значение гауссового (нормального) распределения

Ясно, что дисперсия, которая есть сумма квадратов отклонений распределения от его среднего значения [взвешенная вероятностью текущего значения тесно связана с принципом наименьших квадратов (который устанавливает, что «наилучшее соответствие» имеет место тогда, когда сумма квадратов ошибок минимальна). В обоих случаях это сумма квадратов текущих разностей. При дисперсии имеют дело с отличием от используемого среднего значения, а при приближении по наименьшим квадратам — с отличием данных от используемой аппроксимации.

Упражнения

(см. скан)

<< Предыдущий параграф

Следующий параграф >>

Оглавление