1.2.2. Проблема статистического исследования
зависимостей между анализируемыми показателями. Исследование характера и структуры взаимосвязей, существующих между анализируемыми показателями, характеризующими состояние или поведение статистически обследованных объектов (процессов), является сущностью и главной целью многомерного статистического анализа. Поэтому неудивительно, что вынесенная в заголовок данного пункта проблема, бесспорно, превалирует и с точки зрения прикладной актуальности, и с точки зрения разнообразия и степени
разработанности соответствующего математического аппарата. К последнему относятся методы регрессионного, корреляционного, дисперсионного и ковариационного анализа, методы экстремального планирования регрессионных экспериментов, методы анализа временных рядов, некоторые методы и модели зависимостей специального (например, марковского) типа.
В большинстве случаев общую схему исследования в рамках данной проблемы можно представить следующим образом. Вектор статистически регистрируемых на исследуемой реальной системе показателей X подразделяется на два подвектора, один из которых, например
интерпретируется как вектор характеристик условий функционирования (или состояния) исследуемой системы (как правило, все эти характеристики или их часть поддаются регулированию или частичному управлению), а второй,
интерпретируется как вектор результирующих показателей, характеризующих поведение или эффективность функционирования (качество) исследуемой системы 1. Проблема состоит в конструктивном объяснении поведения результирующих показателей за счет изменения факторов-аргументов т. е. в определении такой векторной функции
из класса допустимых решений F, которая давала бы наилучшую, в определенном смысле, аппроксимацию поведения вектора X на множестве точек наблюдений . Для математической формулировки задачи введем невязки характеризующие погрешности в описании результирующего признака с помощью функции в точке а затем — функционал
как меру адекватности модели
Задача статистического исследования зависимостей показателей от факторов сводится, таким образом, к определению такой векторной функции которая является решением экстремальной задачи вида
Конкретный вид невязок , функционала адекватности и класса допустимых решений F определяется в зависимости от природы анализируемых исходных данных и от некоторых априорных сведений (если таковые имеются) о природе и структуре искомых зависимостей. Если в качестве F задаются некоторым параметрическим семейством функций то задача (1.7) сводится к подбору (статистическому оцениванию) значений параметров, на которых достигается экстремум (1.6), а соответствующие методы исследования называют параметрическими.
В [9] приводятся наиболее распространенные в теории и приложениях варианты конкретизации описанной общей схемы. Почти все они относятся к исследованию аддитивных аппроксимационно-регрессионных моделей вида
в которых -мерный вектор-столбец остатков отражает либо (в качестве остаточной случайной компоненты) влияние на совокупности неучтенных случайных факторов, либо (в качестве ошибки аппроксимации) меру достижимой аппроксимации показателей функциями из класса F, либо (как чаще всего и бывает в реальных ситуациях) — и то и другое одновременно.
Очевидно, параметрический вариант модели (1.8) может быть записан в виде
В зависимости от характера дополнительных допущений по поводу природы остатков и класса функций F мы приходим к тому или иному конкретному виду невязок и функционала А, что определяет тип аппроксимационно-регрессионных моделей и способ оценивания неизвестных параметров модели.
Формулирувхмый нами способ формализованного описания проблемы статистического исследования зависимостей, хотя является достаточно общим, не претендует на всеобъемлющий охват всех мыслимых постановок задач и моделей, относящихся к данной проблеме.