4.3.3. Асимптотика Колмогорова — Деева.
В практической работе часто
— размерность вектора X и
— число наблюдений суть величины одного порядка.
Например, в медицинских исследованиях при диагностике относительно редких заболеваний приходится работать с векторами размерности
при выборках объема
Ясно, что в этих условиях результаты типа (4.18), установленные в предположении, что распределение фиксировано, а
вряд ли могут служить надежным обоснованием.
В последние годы получила распространение новая асимптотика, специально рассчитанная на многомерные задачи, в которых отношение
не стремится к нулю. В этой асимптотике рассматривается последовательность (по некоторому параметру
многомерных задач изучаемого класса. При росте
(переходе в последовательности от одной задачи к другой) растут как
, так и
, причем их отношение стремится к пределу
В этой специальной асимптотике, которую мы в дальнейшем будем называть асимптотикой Колмогорова — Деева, нарушаются многие привычные свойства статистических процедур. Например, если X имеет многомерное нормальное распределение с нулевым вектором средних и независимыми координатами с дисперсией
— независимая выборка объема
, то квадрат длины вектора выборочного среднего
а не к 0, как это было бы в обычной асимптотике.
Достоинство новой асимптотики не в том, что в ней не обязательно верны многие общепринятые статистические процедуры, а в том, что полученные в ней предельные формулы, например для ошибок классификации многомерных объектов, исключительно хорошо работают даже при относительно небольших значениях
.
Алгоритм Крускала оказывается устойчивым по отношению к новой асимптотике. Так, если равномерно по
для некоторого
т. е. при переходе от одной задачи к другой в асимптотике Колмогорова — Деева
по всем парам координат не приближается слишком быстро к единице,
по существенным (ненулевого веса) связям не стремится слишком быстро к нулю, то (4.18) имеет место и в асимптотике (4.19). При этом выборочные значения коэффициентов корреляции совсем не обязаны удовлетворять соотношению (4.14), задающему свойство древообразности для нормальных распределений. Они только должны быть близки к теоретическим значениям коэффициентов, которые удовлетворяют (4.14).