Главная > Прикладная статистика: Основы моделирования и первичная обработка данных
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

11.2.7. Обработка совпадений.

При применении ранговых критериев предполагается, что наблюдаемые случайные величины имеют непрерывные распределения. Однако на практике мы всегда имеем дело с дискретным рядом возможных значений случайной величины либо в силу ее природы (дискретная величина), либо вследствие округления или группирования наблюдаемых значений. Это приводит к тому, что в ряду наблюдений имеются группы наблюдений с совпадающими значениями. Рассмотрим некоторые методы, помогающие применять ранговые критерии и в случае наличия совпадений.

Если все совпавшие наблюдения в группе принадлежат одной выборке, то никакой проблемы нет — в качестве рангов можно взять номера из этой группы совпадений в произвольном порядке. В случае же попадания в группу совпадений элементов из обеих выборок наиболее употребительны следующие подходы [23].

Метод случайного ранга — совпавшим наблюдениям случайным образом (равновероятно) присваиваются номера (ранги), принадлежащие группе. В этом случае вся теория о распределении статистики критерия при нулевой гипотезе сохраняется, можно пользоваться обычными таблицами и предельными распределениями. Однако мощность критерия будет меньше, чем при применении метода средней метки.

Метод средней метки состоит в том, что всем наблюдениям из первой (второй) выборки, попавшим в группу совпадений, присваивается среднее значение метки для наблюдений из этой группы. В этом случае предельное распределение статистики критерия остается нормальным. Математическое ожидание статистики будет прежним, а дисперсия уменьшается.

Соответственно для статистик критериев Вилкоксона, нормальных меток и Ван дер Вардена имеем следующие формулы для вычисления диспепсий с учетом совпадений:

(11.46)

где g — число групп, на которое разбиваются наблюдения; число совпавших наблюдений в группе — средние метки по группе соответственно для критерия нормальных меток и Ван дер Вардена.

Полученные значения дисперсий и нужно использовать при применении соответствующих ранговых критериев. С учетом (11.46) статистика критерия Крускала — Уоллиса (11.36) в случае совпадений модифицируется следующим образом:

Для критериев симметрии рассмотрим только случай, когда порождающее распределение непрерывно в точке гипотетического центра симметрии , т. е. вероятность получить наблюдение с значением равна . Тогда имеем следующие формулы для дисперсий:

где — среднее значение меток для наблюдений, попавших в группу.

Аналогично определяются величины для критерия Ван дер Вардена.

1
Оглавление
email@scask.ru