В.2. Какова конечная прикладная цель статистического исследования зависимостей?
С этого вопроса должно начинаться любое статистическое исследование зависимостей. Ведь от ответа на этот вопрос существенно зависят план исследования, выбор общей структуры математической модели, интерпретация получаемых статистических характеристик и выводов и т. д.
где — гарантируемая (с вероятностью не меньшей заданного значения Р) максимальная величина ошибки прогноза. Таким образом, исследователя интересуют в данном случае лишь значения функции , но не ее структура, определяющая, в частности, соотношение удельных весов влияния объясняющих переменных на каждый из результирующих показателей . Так, например, если при статистическом оценивании неизвестной истинной зависимости
исследователю удалось получить оценку функции f(X) в виде
и при этом было установлено, что объясняющие переменные связаны между собой «почти функциональной» линейной зависимостью
то функция будет обладать хорошими прогностическими свойствами, несмотря на существенное отличие ее коэффициентов при от соответствующих коэффициентов истинной функции . (Обращаем внимание читателя на тот факт, что коэффициенты при в функциях и отличаются даже по знаку!) При подстановке заданных значений объясняющих переменных в правые части (В.9) и (В.9'), при условии, что эти значения связаны приближенным соотношением (В.10), мы будем получать совпадающие (или приближенно совпадающие) результаты , характеризующие усредненную величину исследуемого результирующего показателя.
Тип 3: выявление причинных связей между объясняющими переменными X и результирующими показателями Y, частичное управление значениями Y путем регулирования величин объясняющих переменных X.
Такая постановка задачи претендует на проникновение в «физический механизм» изучаемых статистических связей, т. е. в тот самый механизм преобразования «входных» переменных в результирующие показатели Y (см. рис. В.1), который в большинстве случаев исследователь, не будучи в состоянии его конструктивно описать, вынужден именовать (следуя сложившейся кибернетической терминологии) «черным ящиком».
И при выявлении причинных связей, и при намерении исследователя использовать модели типа (В.3) или (В.4) для управления значениями результирующих показателей или путем регулирования величин объясняющих переменных X на первый план выходит задача правильного определения структуры модели (т. е. выбора общего вида функции ), решение которой обеспечивает возможность количественного измерения эффекта воздействия на каждой из объясняющих переменных в отдельности. Однако как раз это место (правильный выбор общего вида функции f(X)) и является самым слабым во всей технике статистического исследования зависимостей: к сожалению, не существует стандартных приемов и методов, которые образовывали бы строгую теоретическую базу для решения этой важнейшей задачи (некоторые рекомендации по проведению этого этапа исследования содержатся в гл. 6).
Заметим, что исследователи, пожалуй, чаще других ставят перед собой именно цели типа 3. И в таких прикладных задачах, как управление качеством продукции с помощью регулирования хода технологических процессов [95, 47], прогноз и анализ объемов произведенной продукции по затратам на трудовые ресурсы и капитальные вложения [31, 152], построение интегральных целевых функций, описывающих эффективность функционирования экономических единиц (предприятий, семей) по набору частных характеристик [9, 11, 128] и др., это вполне оправдано. Однако, к сожалению, далеко не всегда целевые установки исследователей подкреплены объективными возможностями их реализации.