Главная > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

1.2.4. Снижение размерности исследуемого факторного пространства и отбор наиболее информативных признаков.

Имеется по крайней мере три основных типа принципиальных предпосылок, обусловливающих возможность перехода от большого числа исходных показателей состояния (поведения, эффективности функционирования) анализируемой системы к существенно меньшему числу наиболее информативных переменных (последние либо отбираются по определенному правилу из числа исходных, либо являются некоторыми функциями от них). Это, во-первых, дублирование информации, доставляемой сильно взаимосвязанными признаками; во-вторых, неинформативность признаков, мало меняющихся при переходе от одного объекта к другому (малая вариабельность признаков); в-третьих, возможность агрегирования, т. е. простого или взвешенного суммирования, по некоторым признакам. Формально задача перехода (с наименьшими потерями в информативности) к новому набору признаков может быть описана следующим образом. Пусть — некоторая -мерная вектор-функция исходных переменных и пусть — определенным образом заданная мера информативности -мерной системы признаков

Конкретный выбор функционала зависит от спецификации решаемой реальной задачи и опирается на один из двух возможных критериев: критерий автоинформативности, нацеленный на максимальное сохранение информации, содержащейся в исходном массиве относительно самих исходных признаков, и критерий внешней информативности, нацеленный на максимальное «выжимание» из информации, содержащейся в этом массиве относительно некоторых других (внешних) показателей.

Задача заключается в определении такого набора признаков Z, найденного в классе F допустимых преобразований исходных показателей что

Тот или иной вариант конкретизации этой постановки (определяющий конкретный выбор меры информативности ) и класса допустимых преобразований F) приводит к конкретному методу снижения размерности: к методу главных компонент, к факторному анализу, к экстремальной группировке параметров и т. д. (см. [9]).

Categories

1
Оглавление
email@scask.ru