Главная > Многомерный дисперсионный анализ
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.9. ВЫЧИСЛИТЕЛЬНЫЕ ПРОБЛЕМЫ ВЫБОРА ПРИЗНАНИЙ

Из формулы (7.81) видно, что для определения оптимальной комбинации признаков при пошаговых методах включения и исключения необходимо, чтобы для каждого множества признаков, появляющегося в ходе процесса, была известна обратная матрица соответствующей ковариационной матрицы и матрица весовых коэффициентов элементарных дискриминантных функций. Чтобы не вычислять обе эти матрицы каждый раз заново, обращая исходные матрицы, а также в связи с возможным отсутствием запоминающего устройства, мы рекомендуем метод текущего пересчета. На каждом шаге включения и исключения признаков обе матрицы посредством простых вычислений получают новые значения.

Каждое промежуточное состояние на пути к оптимальной комбинации признаков однозначно характеризуется тем, что из всех признаков определенная часть — пусть она состоит из признаков — составляет рассматриваемое множество признаков Остальные признаков исключены из этого множества. Каждому из возможных состояний соответствуют две матрицы: Здесь симметричная матрица, поэтому в памяти ЭВМ она занимает ячеек. В частном случае, если первые признаков принадлежат множеству а последние признаков — нет и сделано соответствующее разбиение матриц

то матрицы представимы в виде

Что матрица действительно симметрична, следует из соотношения

Итак, матрица находится в левом верхнем углу матрицы а матрица в верхней части

Если признаки расположены в произвольной последовательности, то соответствующие им матрицы получают из (7.90) путем определенной перестановки строк и столбцов. Известно, что те признаки точно принадлежат множеству которым в матрице соответствует положительный диагональный элемент .

Процесс отбора признаков начинается либо с состояния т. е. пустогомножества либо с состояния т. е. с содержащего все признаки Итак, согласно (7.90) вначале полагаем

либо

При включении или исключении признака (вид шага несуществен) выполняются следующие вычисления:

Формула (7.94) дает возможность перед проведением соответствующего шага преобразования определить признак вносящий наибольший вклад в увеличение или уменьшение значения дистанта.

При совмещении двух последовательных шагов, относящихся к признакам можно воспользоваться формулой

Она пригодна как при исключении либо введении двух признаков, так и при их замене.

(кликните для просмотра скана)

Если исходя из состояния (7.92) последовательно выполнять преобразования всех признаков то из матрицы получится матрица Отсюда следует, что формулы (7.95)-(7.98) устанавливают алгоритм обращения положительно или отрицательно определенных симметричных матриц.

Мы сознательно отказываемся от доказательства формул, приведенных в этом разделе. Подробное изложение математического аппарата, связанного с пошаговым методом включения и исключения признаков применительно к регрессионному анализу, можно найти в работах [15] и [48].

1
Оглавление
email@scask.ru