9.2. Дисперсионный критерий и распределение дисперсии [1]
Из выражения (9.1.16) следует, что эффективность коэффициента преобразования для представления вектора данных X определяется соответствующим ему собственным значением. Если коэффициент не учитывается, то среднеквадратичная ошибка увеличивается на соответствующее собственное значение . Таким образом, необходимо выбрать множество соответствующее М наибольшим собственным значениям, а остальные отбросить, так как их можно заменить константами .
Так как собственные значения являются элементами , стоящими на главной диагонали, то они соответствуют дисперсиям коэффициентов преобразования . Для всех остальных преобразований содержит ненулевые внедиагональные элементы. Поэтому естественным критерием при выборе множества сохраняемых коэффициентов преобразования является сохранение М коэффициентов с наибольшими дисперсиями, а остальные коэффициентов можно отбросить. Приведенный выше критерий выбора коэффициентов преобразования определим как дисперсионный критерий.
Графическим представлением дисперсионного критерия является график дисперсий коэффициентов преобразования, где дисперсии расположены в порядке убйвания и нормированы к следу матрицы или . Нормировка производится потому, что отношение дисперсии к сумме дисперсий (т. е. следу) дает меру (в процентах) среднеквадратичной ошибки, возникающей при отбрасывании в (9.1.4). Такой график называется графиком распределения дисперсии. На рис. 9.1 приведено распределение дисперсии, связанное с четырьмя различными преобразованиями. Площадь, ограниченная каждой кривой для заданного числа коэффициентов преобразования, является мерой энергии, содержащейся в этих коэффициентах. Общая площадь, ограниченная каждой кривой, равняется единице в результате нормировки на след. Например, при сохранении 20 коэффициентов из рис. 9.1 следует, что преобразования упорядочиваются по эффективности следующим образом.
Преобразование преобразования преобразования преобразования 1.
Выше предполагалось, что X принадлежит к одному классу сигналов, но все рассуждения легко распространяются на несколько классов. Отличие заключается в том, что базисные Еекторы для соответствующего ПКЛ являются собственными векторами общей матрицы , а не . Матрица определяется как
Рис. 9.1. Распределение дисперсии
где К — число классов сигналов, а — ковариационная матрица -го класса с априорной вероятностью.
Ниже, на примере обработки электрокардиограмм, будет показано, как распределение дисперсий используется для сжатия данных.