1.2.4. Снижение размерности исследуемого факторного пространства и отбор наиболее информативных признаков.
Имеется по крайней мере три основных типа принципиальных предпосылок, обусловливающих возможность перехода от большого числа исходных показателей состояния (поведения, эффективности функционирования) анализируемой системы к существенно меньшему числу наиболее информативных переменных (последние либо отбираются по определенному правилу из числа исходных, либо являются некоторыми функциями от них). Это, во-первых, дублирование информации, доставляемой сильно взаимосвязанными признаками; во-вторых, неинформативность признаков, мало меняющихся при переходе от одного объекта к другому (малая вариабельность признаков); в-третьих, возможность агрегирования, т. е. простого или взвешенного суммирования, по некоторым признакам. Формально задача перехода (с наименьшими потерями в информативности) к новому набору признаков может быть описана следующим образом. Пусть — некоторая -мерная вектор-функция исходных переменных и пусть — определенным образом заданная мера информативности -мерной системы признаков Конкретный выбор функционала зависит от спецификации решаемой реальной задачи и опирается на один из двух возможных критериев: критерий автоинформативности, нацеленный на максимальное сохранение информации, содержащейся в исходном массиве относительно самих исходных признаков, и критерий внешней
информативности, нацеленный на максимальное «выжимание» из информации, содержащейся в этом массиве относительно некоторых других (внешних) показателей.
Задача заключается в определении такого набора признаков Z, найденного в классе F допустимых преобразований исходных показателей что
Тот или иной вариант конкретизации этой постановки (определяющий конкретный выбор меры информативности ) и класса допустимых преобразований F) приводит к конкретному методу снижения размерности: к методу главных компонент, к факторному анализу, к экстремальной группировке параметров и т. д. (см. [9]).