12.1.6. Средства визуализации данных.
Рассмотрим программное обеспечение следующих методов визуализации данных (см. § 10.5):
1) стандартный метод главных компонент;
2) нелинейный метод главных компонент;
3) многомерное метрическое шкалирование.
Стандартный метод главных компонент реализован в пакетах BMDP 75, BMDP 79 (в программе факторного анализа ), в ПНП [55, вып. 2,14], в ППСА (программа REDUCT). Нелинейный метод главных компонент и многомерное метрическое шкалирование реализованы из рассматриваемых пакетов (программа REDUCT).
Важным моментом сервиса, определяющим эффективность применения методов визуализации, является возможность вывода диаграммы рассеивания (см. гл. 10) с помощью различного рода терминальных устройств — АЦПУ, графопостроителя или дисплея. Обычным и достаточно удобным средством является использование АЦПУ.
Рассмотрим подробнее, как построена (например, в ППСА) диаграмма рассеивания. Координаты двумерных проекций точек нормируются. Пусть L и М — соответственно горизонтальный и вертикальный размер диаграммы. Эти величины либо задаются пользователем, либо принимают умалчиваемые значения. Позиция i-го объекта по горизонтали (оси ОХ) от левого края диаграммы вычисляется по формуле
где означает целую часть числа, — соответственно максимальное и минимальное значения координаты Аналогично вычисляется и положение объекта (номер строки) по вертикали. В точке с этими координатами печатается какой-либо символ, например буква А. Если в одну точку попадает не один, а объектов, то, если печатается цифра, равная числу объектов, попавших в эту точку, а если то символ Если имеется несколько групп объектов, для каждой из них может быть использован свой собственный символ. Значения координат X и Y в исходных шкалах печатаются соответственно по нижнему краю (через каждые пять позиций) и левому краю (через каждые пять строк) диаграммы.