Главная > Прикладной регрессионный анализ, книга 1
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

3.10. ИССЛЕДОВАНИЕ СЕРИЙ НА ГРАФИКАХ ВРЕМЕННОЙ ПОСЛЕДОВАТЕЛЬНОСТИ ОСТАТКОВ

При известной временной последовательности множеств остатков иногда удается наблюдать необычные скопления положительных или отрицательных остатков. Возьмем для примера крайний случай. Если временная последовательность из тридцати остатков содержит сначала десять отрицательных, а затем двадцать положительных значений, то мы вправе ожидать, что есть какая-то не принимавшаяся во внимание переменная, которая изменила уровень между десятым и одиннадцатым опытами. Значит, мы можем исследовать причины, вызывающие подобное поведение. Когда встречается такая последовательность знаков, полезно иметь метод, позволяющий выносить решение об отклонении чередования знаков в последовательности опытов от случайного, т. е. выносить решение о «ненормальности» последовательности.

Допустим, мы имеем следующую последовательность знаков:

Это знаки остатков во временной последовательности (которыми мы воспользуемся). Знаки «плюс» и «минус» могут означать также «мужской» и «женский», «головы» и «хвосты», «лучше» и «хуже», «обработка А» и «обработка В» или два уровня любой другой дихотомической классификации. Предположим, что здесь всего знаков, из которых знаков плюс и знаков минус, а и — число серий. В

приведенном примере серий, показанных круглыми скобками:

Мы вправе поставить вопрос, является ли данное расположение знаков «выделяющимся» расположением? Если, например, из шести знаков два знака плюс, а остальные минус, то возможны следующие расположения:

Расположение Число серий

Распределение этих серий таково:

Следовательно, пять серий могут встречаться в 3/15, или 20 % возможных случаев, т. е. с вероятностью 0,2. С другой стороны, две серии могут иметь место в 2/16, или 13,3 % возможных случаев, или с вероятностью 0,133. При исследовании остатков обычно нас интересует только случай с малым числом серий, поэтому мы не тревожимся, может ли быть их «слишком много». Если мы имеем только в наборе из шести остатков, из которых два остатка положительны, то вероятность существования такого случая составляет 0,133. Для любой данной последовательности знаков можно найти вероятность того, что наблюдаемое значение и (или меньшее) может иметь место.

(Пример. При вероятность и нет ничего необычного в том, что происходит в случаев.)

На основе таких уровней вероятности можно решать, правомерно ли полагать, что мы имеем дело со случайным расположением знаков. Мы можем, например, сравнить вероятность с заранее заданной величиной, скажем и отвергнуть предположение о случайном характере расположения, если вероятность . В табл. 3.1 приведены кумулятивные распределения

(кликните для просмотра скана)

(кликните для просмотра скана)

вероятностей для случаев то надо поменять местами Эти распределения первоначально были даны Ф. Свед и С. Эйзенхартом в работе: Swed Frieda S., Eisenhart C. Tables for testing randomness of grouping in a sequence of alternatives. - Annals of Mathematical Statistics, 1943, 14, p. 66-87. В этих таблицах приводится большее число знаков после запятой и иное расположение материала.

Если то отпадает необходимость знать точные значения вероятностей, так как можно достаточно точно аппроксимировать истинное распределение с помощью нормального. Пусть

Можно показать, что это истинные среднее и дисперсия дискретного распределения величины и. Тогда величина

приближенно может считаться единичным (нормированным) нормальным отклонением, причем обычная поправка на непрерывность, которая позволяет компенсировать тот факт, что непрерывное распределение используется для аппроксимации дискретного.

Пример. Исследуется множество из двадцати семи остатков (пятнадцать из которых имеют один знак, а двенадцать — противоположный), размещенных во временной последовательности, содержащей серий. Можно ли считать, что в таком расположении знаков «слишком мало серий»?

Здесь Из уравнений (3.10.1) и (3.10.2) имеем . Следовательно, наблюдаемая величина в соответствии с уравнением (3.10.3) есть

Вероятность того, что нормированное нормальное отклонение будет иметь значение —2,713 или меньше, составляет 0,0033 (или 0,33 %). Так что, по-видимому, здесь необычно малое число серий. Мы должны отвергнуть предположение, что данное расположение знаков носит случайный характер. Модель следует взять под подозрение и исследовать причины такого расположения остатков.

(Примечания: 1. Слишком малое число серий указывает на возможную положительную сериальную корреляцию в остатках. А слишком большое число серий указывает на возможную отрицательную сериальную корреляцию. В этом случае нужно пользоваться

верхним «хвостом» критерия серий и уровнями вероятности, накопленными с правого конца, а не с левого, как в табл. 3.1. Вероятности правого хвоста можно считать и из табл. 3.1, если иметь в виду, что накопленная вероятность того, что обозначенная, допустим, равна Так, например, накопленная вероятность того, что в случае число серий равна Для значений превосходящих табличные, вполне подходит верхний «хвост» нормированного нормального отклонения, для которого т. е. поправку на непрерывность надо вычитать. Конечно, теперь требуется не нижний, а верхний «хвост» вероятности

2. Строго говоря, критерий для серий применим только в том случае, когда причины, приводящие к данному расположению серий, независимы. Для временной последовательности остатков это не так из-за корреляций, которые имеют место между ними (см. параграф

3.7), и уровень вероятности, получаемый по этой процедуре, будет меняться в зависимости от конкретной структуры данных. В большинстве регрессионных ситуаций, встречающихся на практике, если отношение не слишком мало, таким эффектом можно пренебречь.)

1
Оглавление
email@scask.ru