Глава 15. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ЗАВИСИМОСТЕЙ
Методы статистического исследования зависимостей, в особенности регрессионный анализ, анализ временных рядов, дисперсионный анализ, анализ таблиц сопряженности, планирование эксперимента, наиболее употребительны среди методов обработки данных в различных областях науки и техники. Соответственно к настоящему времени существует и продолжает разрабатываться обширное программное обеспечение, связанное с исследованием зависимостей. Ниже кратко рассмотрены программные средства — пакеты и библиотеки программ, доступные пользователям в СССР, а также наиболее интересные, на наш взгляд, для обеспечения статистического исследования зависимостей зарубежные пакеты и библиотеки. Основные сведения о пакетах и библиотеках программ приведены в табл. 15.1.
В табл. 15.2 приведены данные о разделах статистического исследования зависимостей, охватываемых пакетами и библиотеками программ. Номера вертикальных граф табл. 15.2 соответствуют следующим разделам и методам статистического исследования зависимостей:
1. Корреляционный анализ:
а) вычисление и анализ значимости множеств частных и множественных коэффициентов корреляции;
б) анализ коэффициентов корреляции Спирмэна, Кендалла и др.
2. Регрессионный анализ:
а) линейная множественная регрессия;
б) отбор переменных в линейной регрессии методом полного перебора или «ветвей и границ»;
в) пошаговые процедуры отбора переменных;
г) регрессия на главные компоненты;
д) гребневая регрессия и другие виды регрессии в условиях мультиколлинеарности;
е) робастная регрессия;
ж) полиномиальная регрессия с подбором степени полинома;
з) регрессия нелинейная относительно оцениваемых параметров;
и) оценивание параметров стандартных нелинейных регрессионных моделей (логистическая, экспоненциальные и другие кривые);
к) непараметрическая регрессия.
3. Дисперсионный анализ (ДА).
4. Статистическое исследование зависимостей в случае неколичественных переменных и переменных смешанной природы:
а) стандартный анализ таблиц сопряженности;
б) логлинейный анализ таблиц сопряженности;
в) выравнивание шкал (оцифровка, переход к бинарным переменным).
5. Статистический анализ систем структурных эконометрических уравнений.
6. Анализ временных рядов.
Приведем теперь сведения о программном обеспечении некоторых разделов статистического исследования зависимостей, не включенные в табл. 15.1, 15.2.
Анализ временных рядов. Дополнительная информация приведена в табл. 15.3.
Логлинейный анализ таблиц сопряженности. Соответствующее программное обеспечение описано в [91, 23].
Анализ нечисловой информации. Программное обеспечение обработки нечисловой информации методами оцифровки представлено в [121], корреспонденс-анализа — в [221].
Отбор переменных в регрессионном анализе.
Таблица 15.3
Программа, реализующая метод «ветвей и границ» и некоторые другие методы отбора, описана в [87]. Отбор в условиях многомерной функции отклика рассматривается в [151].
Математическое обеспечение прикладного статистического анализа для мини- и микроЭВМ рассматривается в [83, 157].
Дополнительную информацию по вопросу программного обеспечения статистического анализа можно получить в [24, 69, 188].