1.1.5. Другие многомерные распределения.
В теоретических и прикладных работах по классификации используется ряд многомерных распределений, в различных направлениях обобщающих многомерное нормальное распределение и его частные случаи. Укажем наиболее важные из них.
Эллипсоидальные распределения. Пусть
равномерно распределено на
-мерной сфере
— неотрицательная случайная величина, не зависящая от
и имеющая строго возрастающую функцию распределения
такую, что
— матрица невырожденного линейного преобразования
. Будем говорить, что случайная величина
имеет эллипсоидальное распределение
. Основанием для названия служит то, что, как и для нормального распределения, на концентрических эллипсоидах вида
(1.34)
где
плотность распределения
постоянна. В частном случае, когда
имеет
-распределение с
степенями свободы, распределение
совпадает с нормальным
. Это обстоятельство используется при статистическом моделировании случайных величин
. Так, если
то
равномерно распределено на
В модели независимых выборок из
при дополнительном предположении существования плотностей
отношение правдоподобия имеет вид:
где
Откуда при
в случае, когда
— монотонная функция разности
общий вид классификатора максимального правдоподобия такой же, что и в (1.12). Сохраняется также и способ нахождения наилучшей разделяющей плоскости в модели независимых выборок из
(см. п. 1.1.3 и [25]).
Распределения, трансформируемые к нормальному. Пусть координаты вектора
имеют непрерывные одномерные функции распределения
с плотностями соответственно
. Будем говорить, что
имеет трансформируемое к нормальному (короче, Т-нормальное) распределение
, где
- неотрицательно определенная матрица, a
вектор-функция одномерных распределений X, если
где
— функция, обратная
. Введем
одномерных функций
тогда Т-нормальное распределение можно также определить как распределение вектора
где
Обозначим плотность Т-нормального распределения
. Предположим, что
и пусть
тогда
Пусть
— независимая выборка объема n из
координата
наблюдения,
ее ранг в вариационном ряду
координат
Замечательная особенность Т-нормальных распределений заключается в том, что для оценки F надо использовать только матрицу
, а для оценки
— только матрицу
Сформулированные выше модели выборок из нормальных распределений обобщаются на случай Т-нормальных распределений. Так, аналог модели Фишера (см. п. 1.1.2) формулируется: даны две независимых выборки из
при этом известно, что для всех X
где
— некоторый ненулевой вектор, и матрица 2 положительно определена.
Распределения с простой структурой связей между признаками. С простейшей моделью дискретных распределений с признаками, имеющими древообразную структуру зависимостей, познакомились в п. 1.1.2. Эта модель, естественно, может быть усилена предположением, что признаки имеют
-распределение [12, § 4.4]. Однако без дополнительных предположений общий вид
для
слишком сложен. Вместе с тем предположение о
-зависимости признаков для нормальных распределений позволяет заметно уменьшить число параметров, от которых зависит ковариационная матрица, и это дает существенный выигрыш в ряде задач (см. пп. 1.4.1, 2.3.1 и 2.3.3).
Другое обобщение моделей с независимыми признаками — это параметрические модели, в которых вектор параметров
и вектор наблюдений X могут быть так разбиты на k взаимно непересекающихся подмножеств
что плотность
Распределения, удовлетворяющие (1.36), будем называть распределениями с независимыми блоками. Они широко используются в теоретических исследованиях (см. пп. 2.3.2 и 2.5.3).