11.2.7. Обработка совпадений.
При применении ранговых критериев предполагается, что наблюдаемые случайные величины имеют непрерывные распределения. Однако на практике мы всегда имеем дело с дискретным рядом возможных значений случайной величины либо в силу ее природы (дискретная величина), либо вследствие округления или группирования наблюдаемых значений. Это приводит к тому, что в ряду наблюдений имеются группы наблюдений с совпадающими значениями. Рассмотрим некоторые методы, помогающие применять ранговые критерии и в случае наличия совпадений.
Если все совпавшие наблюдения в группе принадлежат одной выборке, то никакой проблемы нет — в качестве рангов можно взять номера из этой группы совпадений в произвольном порядке. В случае же попадания в группу совпадений элементов из обеих выборок наиболее употребительны следующие подходы [23].
Метод случайного ранга — совпавшим наблюдениям случайным образом (равновероятно) присваиваются номера (ранги), принадлежащие группе. В этом случае вся теория о распределении статистики критерия при нулевой гипотезе сохраняется, можно пользоваться обычными таблицами и предельными распределениями. Однако мощность критерия будет меньше, чем при применении метода средней метки.
Метод средней метки состоит в том, что всем наблюдениям из первой (второй) выборки, попавшим в группу совпадений, присваивается среднее значение метки для наблюдений из этой группы. В этом случае предельное распределение статистики критерия остается нормальным. Математическое ожидание статистики будет прежним, а дисперсия уменьшается.
Аналогично определяются величины для критерия Ван дер Вардена.