Главная > Прикладной анализ случайных данных
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

4.7 Статистическая независимость и выявление тренда

При анализе случайных данных часто возникают ситуации, когда требуется выяснить, являются ли наблюдения или оценки параметров статистически независимыми или же они подвержены тренду. Особое значение эта задача приобретает при анализе нестационарных данных, изучению которых посвящена гл. 12. Поскольку наблюдения или оценка параметров могут иметь самые разнообразные функции распределения, то удобно такие исследования проводить на основе свободных от распределений или непараметрических методов, в которых относительно функции распределения исследуемых данных не делается никаких предположений. Критерий серий и критерий инверсий дают два примера таких процедур, весьма полезных для установления статистической независимости и выявления тренда.

4.7.1. КРИТЕРИЙ СЕРИЙ

Рассмотрим последовательность наблюденных значений случайной величины х, причем каждое наблюдение отнесено к одному из двух взаимно исключающих классов, которые можно обозначить просто как (+) или (—). Простейший пример дает последовательность бросаний монеты, в которой каждое наблюдение — это либо герб либо решетка (—). В качестве второго примера можно привести последовательность измереннных значений с средним значением х, где каждое наблюдение — это или (—). Третий приме последовательность одновременных измерений двух случайных величин где каждое наблюдение — это . В любом случае образуется последовательность вида

Серией называется последовательность однотипных наблюдений, перед и лосле которой следуют наблюдения противопо ложного типа или же вообще нет никаких наблюдений. В данном примере в последовательности из наблюдений имеется серий.

Число серий, появившихся в последовательности наблюдений, позволяет выяснить, являются ли отдельные результаты независимыми наблюдениями одной и той же случайной величины. Именно, если последовательность наблюдений состоит из независимых исходов одной и той же случайной величины, т. е. если вероятность отдельных исходов или не меняется от наблюдения к наблюдению, то выборочное распределение числа серий в последовательности является случайной величиной со средним значением и дисперсией [4.1]

Здесь число исходов число исходов (—). В частном случае выражения (4.51) в (4.52) принимают вид

Небольшая табл. А.6 дает -процентные точки функции распределения числа серий.

Вероятно, самое непосредственное применение критерий серий находит в задачах оценки данных, связанных с выявлением тренда в анализируемой последовательности. Предположим, что есть основания подозревать, что в последовательности наблюдений имеется тренд, т. е. есть основания считать, что вероятности появления или меняются от наблюдения к наблюдению. Существование тренда можно проверить следующим образом. Примем в качестве гипотезы, что тренда нет, т. е. предположим, что наблюдений являются независимыми исходами одной и той же случайной величины. Предположим также, что число исходов равно числу исходов (—). Тогда число серий в последовательности будет иметь выборочное распределение, протабулированное в табл. Для проверки гипотезы с любым требуемым уровнем значимости а надо сравнить наблюденное число серий с границами области принятия гипотезы, равными где Если наблюденное число серий окажется вне этой области, то гипотеза должна быть отвергнута с уровнем значимости а. В противоположном случае гипотезу можно принять.

ПРИМЕР 4.4. ПРИМЕНЕНИЕ КРИТЕРИЯ СЕРИЙ. Пусть имеется следующая последовательность наблюдений некоторой случайной величины:

Проверим независимость наблюдений, подсчитав число серий в последовательности, полученной путем сравнения наблюдений с медианой исходной последовательности. Применим критерий с уровнем значимости

Из анализа данных видно, что является медианой 20 наблюдений. Наблюдения, превышающие 5,6, классифицируем как а наблюдения, меньшие 5,6, классифицируем как (—). В результате получим

Таким образом, в последовательности из 20 наблюдений имеется 13 серий. Предположим, что наблюдения независимы. Область принятия этой гипотезы имеет вид

Из табл. для находим Гипотеза принимается, ибо попадает в интервал, заключенный между 6 и 15. Это означает, что нет оснований сомневаться в независимости наблюдений, т. е. свидетельства в пользу тренда нет.

Categories

1
Оглавление
email@scask.ru