В.5. Основные типы зависимостей между количественными переменными

<< Предыдущий параграф

Следующий параграф >>

<< Предыдущий параграф

Следующий параграф >>

Пред.

След.

Вернуться к книге

Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ

ZADANIA.TO

В.5. Основные типы зависимостей между количественными переменными

При изучении взаимосвязей между анализируемыми количественными показателями следует установить, к какому именно типу зависимостей относится исследуемая схема. Под типом зависимости мы подразумеваем в данном случае не аналитический вид функции в моделях вида (В.11) (о выборе общего аналитического вида функции см. гл. 6), а природу анализируемых переменных (X, у) и соответственно интерпретацию функции в каждом конкретном случае.

Зависимость между неслучайными переменными (схема А).

В этом случае результирующий показатель у детерминированно (т. е. вполне определенно, однозначно) восстанавливается по значениям неслучайных объясняющих переменных т. е. значения у зависят только от соответствующих значений X и полностью ими определяются. Это — обычная схема чисто функциональной зависимости между неслучайными переменными, когда у является некоторой функцией от переменных X (т. е. ), что является вырожденным случаем зависимостей вида (В. 11), когда остаточная случайная компонента равна нулю (с вероятностью единица).

Известно, например, что возраст дерева у (в годах) можно однозначно восстановить по числу колец х на срезе его ствола, а именно у = х. Примеры адекватного описания реальных зависимостей с помощью чисто функциональных (нестохастических) связей, к сожалению, крайне редки в практике исследований. Кроме того, при проведении их анализа нет необходимости использовать методы вероятностно-статистической теории. Поэтому в дальнейшем изложении мы не будем больше возвращаться к этому типу зависимостей.

Регрессионная зависимость случайного результирующего показателя от неслучайных предсказывающих переменных X (схема В). Природа такой связи может носить двойственный характер: а) регистрация результирующего показателя неизбежно связана с некоторыми случайными ошибками измерения , в то время как предикторные (объясняющие) переменные измеряются без ошибок (или величины этих ошибок пренебрежимо малы по сравнению с соответствующими ошибками измерения результирующего показателя); б) значения результирующего показателя зависят не только от соответствующих значений X, но и еще от

В этом случае предикторные переменные X играют роль неслучайного (векторного при параметра, от которого зависит закон распределения вероятностей (в частности, среднее значение и дисперсия) исследуемого результирующего показателя Удобной математической моделью такого рода зависимостей является разложение вида

в котором неслучайная составляющая правой части (функция ) описывает поведение условного среднего в зависимости от X, а остаточная случайная компонента в (X) отражает случайную природу . В широком классе исследуемых схем модель (В.14) строится таким образом, что математическое ожидание случайного остатка равно нулю тождественно по X; предполагается обычно, что при всех X существует конечная дисперсия (т. е. причем величина этой дисперсии, вообще говоря, может зависеть от X (т. е. Подчеркнем то обстоятельство, что в описанной модели (В. 14) ни природа случайной компоненты , ни соответственно характеристики ее вероятностного распределения никак не связаны со структурой функции и, в частности, не зависят от значений ее параметра 0 в параметрической записи модели (т. е. когда вместо всех возможных функций рассматривают какое-либо параметрическое семейство , см., например, (В.12), (В.13)).

Если вернуться к примеру В.1, то можно убедиться, что он хорошо укладывается в рамки модели (В. 14). Для этого следует ишь заметить, что имевшаяся в этом примере возможность контролировать значения предикторной переменной по существу, переводит эту переменную из категории случайных величин в категорию неслучайных (контролируемых) параметров модели. Дальнейший анализ примера В.1 (см. табл. В.1, формулу (В.5) и рис. В.2) подсказал нам следующую конкретизацию допущений о природе составных частей модели (В. 14):

где — константа, не зависящая от х.

Пример В.2. В табл. В.4 и на рис. В.5 представлены результаты усталостных испытаний алюминиевых сплавов 1125], т. е. набор сорока пар экспериментальных значений величин соответственно.

Если при сборе выборочных данных, составляющих двумерную систему наблюдений, производится по нескольку наблюдений при каждом фиксированном значении аргумента, а также в случае разбиения диапазона переменной — аргумента на интервалы группирования в общую схему обозначений двумерной системы наблюдений (В.1) целесообразно внести некоторые изменения.

Рис. В.5. Графическое представление результатов усталостных испытаний алюминиевых сплавов

Так, если — число различных фиксированных значений предикторной переменной (или количество интервалов группирования на которые разбит весь обследованный диапазон этой переменной), .

— количество наблюдений, произведенных при фиксированном значении аргумента (или количество наблюдений, попавших в интервал разбиения ), то результаты наблюдений удобнее снабдить двумя индексами, т. е. записать в виде (), где . Здесь первый индекс обозначает порядковый номер фиксированного значения независимой переменной (или порядковый номер интервала группирования), а второй индекс порядковый номер наблюдения, произведенного приданном фиксированном значении аргумента (или порядковый номер наблюдения, попадающего в интервал группирования). Так, например, под понимается результат пятого по порядку наблюдения, произведенного при третьем фиксированном значении аргумента (или попадающего в третий интервал группирования ). В наших рассмотрениях будут фигурировать также величины представляющие собой последовательность различных фиксированных значений аргумента, при которых производились наблюдения (или средние точки интервалов группирования ), а также условные средние зависимой переменной

Таблица В.4

характеризующие средние значения результирующего показателя при каждом фиксированном значении аргумента х? (или средние значения в каждом отдельном интервале группирования

Очевидно, что в ситуациях, когда производится по нескольку наблюдений при каждом фиксированном значении аргумента, мы будем иметь

В качестве результирующего показателя — случайной переменной в нашем примере рассматривается характеристика долговечности образца — нормированная величина логарифма числа циклов N до разрушения образца, а в качестве неслучайной предикторной переменной х — логарифм соответствующей величины эксплуатационного напряжения . Очевидно, долговечность образца зависит также от целого ряда неконтролируемых факторов (случайное варьирование условий эксперимента, свойств самих образцов и т. п.), поэтому при каждом уровне напряжения характеристики долговечности будут подвержены некоторому случайному разбросу около своего среднего.

Расположение экспериментальных точек на рис. В.5 указывает на систематическую закономерность в поведении условных средних в зависимости от номера т. е. от величины их расположение близко к прямолинейному. Это приводит к гипотезе о целесообразности представления исследуемой случайной величины выражением Первыми шагами исследователя может быть приближенная оценка прямой а также меры случайного разброса индивидуальных значений вокруг этой прямой, характеризующейся в первом приближении только эмпирическими дисперсиями . Однако при проведении более точного количественного анализа возникают следующие вопросы: как наиболее точно провести прямую как оценить степень точности построенной зависимости; нельзя ли строить математически обоснованные зоны (так называемые доверительные интервалы и границы) около исследуемой прямой, попадание в которые эмпирических индивидуальных или средних значений при каждом фиксированном гарантировалось бы с заранее заданной вероятностью? Ответы на все эти вопросы и дает регрессионный анализ (см. гл. 5.11).

Корреляционно-регрессионная зависимость между случайными векторами — результирующим показателем и — предикторной переменной (схема С). В данном типе моделей и компоненты вектора результирующего показателя и компоненты вектора объясняющих переменных зависят от множества неконтролируемых факторов, так что являются случайными по своей физической сущности. Мы уже сталкивались с такой ситуацией в примере, в котором исследовалась связь между производительностью мартеновских печей и процентным содержанием углерода в металле (см. рис. В.4). Зависимости такого типа вообще характерны для описания хода технологических процессов, реальные значения параметров которых равно как и характеризующие их результирующие показатели как правило, флюктуируют случайным (но взаимосвязанным) образом около установленных номиналов.

В подобных ситуациях оказывается полезным рассмотреть разложение исследуемого результирующего показателя на две случайные составляющие по формуле типа (В.3).

Первая из них определяется некоторой (векторнозначной) функцией от объясняющей переменной , а вторая отражает остаточные влияния неучтенных случайных факторов на анализируемый результирующий показатель Итак

При этом разложение (В. 16) строится таким образом, чтобы для компонент векторов и выполнялись соотношения

В частном случае единственного результирующего показателя и линейного вида функции имеем:

Подразумевая, как и прежде, под условное математическое ожидание результирующего показателя (при условии, что объясняющая переменная приняла значение, равное X), мы от (В. 17) приходим к линейному уравнению регрессии

Возможны случаи, когда вторая (остаточная) компонента в разложении (В. 16) с полной мерой достоверности (т. е. с вероятностью единица) равна нулю. При этом исследуемые случайные величины оказываются связанными чисто функциональной зависимостью но ее следует отличать от функциональной зависимости неслучайных переменных (см. выше, схема А).

Пример В.3. Рис. В.6 иллюстрирует связь между вакуумом в печи для отжига стекла и процентом брака в стекольном производстве [101.

Случайные изменения свойств сырья, а также ряда неконтролируемых факторов приводят к случайным колебаниям обеих исследуемых переменных. Однако расположение точек на рис. В.6 свидетельствует о том, что эти колебания взаимосвязаны, подчинены вполне определенной закономерности: «облако» рассеяния вытянуто вдоль некоторой прямой, не параллельной ни одной из координатных осей. Все это подтверждает целесообразность разложения случайной величины по формуле (В. 16) и исследования связи между и которая в этом случае носит название корреляционной.

К перечисленным вопросам регрессионного анализа (построение конкретного вида зависимости между переменными, различные оценки ее точности) в этом случае присоединяется круг вопросов, связанных с исследованием степени тесноты связи между этими переменными. Совокупность методов, позволяющих решать эти вопросы, принято называть корреляционным анализом (см. гл. 1—3).

Рис. В.6. Графическое представление данных по связи вакуума в печи для обжига стекла и процента брака в стекольном производстве

Зависимости структурного типа, или зависимости по схеме конфлюэнтного анализа (схемы ). В обеих описываемых ниже схемах речь идет о восстановлении искомых зависимостей по искаженным наблюдениям анализируемых переменных, причем, в отличие от регрессионной схемы В, искаженными оказываются при наблюдении не только значения результирующего показателя, но и значения объясняющих (предик-торных) переменных . В зависимости оттого, между какими именно переменными — неслучайными или случайными — исследуются связи, мы будем иметь соответственно тип связи по схеме или . Оба эти типа связей упоминаются в специальной литературе как структурные зависимости [65, с. 500—557] или как зависимости по схеме конфлюэнтного анализа [7, 10]. Таким образом, конфлюэнтный анализ предоставляет исследователю совокупность методов математико-статистической обработки данных, относящихся к анализу априори постулируемых функциональных связей между количественными (случайными или неслучайными) переменными в условиях, когда наблюдаются не сами переменные, а случайные величины

где — случайные ошибки измерений соответственно переменных наблюдении, а — общее число наблюдений. При этом общий вид исследуемых функциональных (структурных)- связей

между ненаблюдаемыми, а точнее, наблюдаемыми с ошибками переменными считается заданным (неизвестным является лишь значение векторного параметра участвующего в уравнениях искомых зависимостей (В.20)).

Схема исследуемые переменные не случайны. Для упрощения обозначений проанализируем зависимости (В.19)-(В.20) в рамках данной схемы лишь для одного результирующего показателя и одной объясняющей переменной (случай обобщение этого анализа на случай не представляет принципиальных трудностей.

Учитывая формулы (В.19) и (В.20) и воспользовавшись формальным разложением функции в ряд Тейлора около точки , получаем соотношение между и

Здесь под подразумевается производная функции по взятая в точке . В частности, при линейном виде имеем

Из (В.21) непосредственно следует, что уравнение регрессии по (т. е. вид зависимости условного математического ожидания ) от совпадает со структурным соотношением (В.20). Однако в схеме в отличие от схем В и С, остаточная случайная компонента в разложениях (В.21) и (В.22) (т. е. соответственно зависит от неизвестных параметров, участвующих в описании функции и оцениваемых на основании имеющихся у нас выборочных данных.

Эта специфичность природы зависимости, присущая схеме сильно усложняет задачу построения хороших оценок для неизвестных параметров, входящих в соотношение (В.20). Дело в том, что достаточно хорошо разработанная теория построения таких оценок для схем В и С, в частности оценок максимального правдоподобия, оценок наименьших квадратов, оказывается неприменимой к задачам схемы

Так, например, оценки, используемые в регрессионном и корреляционном анализах, при обращении к задачам схемы теряют свои «хорошие» свойства — несмещенность, эффективность и даже состоятельность. Поэтому исследователь должен проявить особую аккуратность на самой первой стадии анализа — при постановке задачи и определении, к какому из известных типов зависимостей следует отнести данный конкретный случай.

Рис. В.7. Зависимость между пределом прочности и твердостью по Бринелю для 75 образцов одной из плавок стали

Соответственно при описании рекомендаций и приемов обработки выборочных данных с целью статистического исследования зависимостей приходится отделять регрессионный и корреляционный анализы (схемы В и С) от так называемого конфлюэнтного анализа (схемы ).

Пример В.4. [90] На рис. В.7 и в табл. В.5 приведены результаты испытаний образцов (изготовленных из стали ) на твердость по Бринелю и предел прочности .

Известно, что при существующих условиях производства и конструирования возможность взаимного перевода показателей прочности и твердости для конструкционных сталей (т. е. возможность взаимного сопоставления этих характеристик типа ) зачастую является необходимой.

Таблица В.5

Такой перевод осуществляется с помощью специальных таблиц, общей основой которых является предположение, что между значениями (твердость по Роквеллу) существует чисто функциональная взаимно-однозначная зависимость (т. е. зависимость по схеме А в нашей классификации). Однако при практическом использовании переводных таблиц и формул было обнаружено, что фактические значения механических характеристик часто существенно отличаются от полученных переводом (даже в тех случаях, когда эти таблицы носят узкоспециализированный характер, т. е. когда они составляются и используются лишь для какого-то одного типа полуфабриката и для одной и той же марки стали).

Причина же подобной рассогласованности, неточности этих таблиц кроется на самом деле в том, что сама природа связи, существующей между различными механическими характеристиками материалов, например между носит не функциональный (детерминированный), а стохастический характер.

Так, например, на рис. В.7 видно, что при каждом фиксированном значении твердости соответствующие значения предела прочности подвержены некоторому неконтролируемому разбросу.

Более детальный профессионально-статистический анализ [90] приводит нас в данном случае к следующей схеме.

На значения так же как и на вид связи, существующей между ними, влияют следующие факторы:

1) химический состав плавки

2) термическая обработка ;

3) особенности исследуемого образца — локальный химсостав, размеры зерна в зоне отпечатка, локальная термическая обработка и т. п. ;

4) погрешности измерения, связанные с приборами, установкой образца и т. п. .

Если величину твердости по Бринелю обозначим а соответствующую величину предела прочности то можно воспользоваться выражением, где роль неслучайных (структурных) компонент и у играют значения и взятые для некоторой фиксированной плавки при некотором фиксированном режиме термической обработки и усредненные по всевозможным комбинациям факторов (их «наблюденные значения», полученные усреднением по пятнадцати однородным плавкам, изображены на рис. В.7). Что касается остаточных случайных компонент , то наличие каждой из них обусловлено в данном случае различиями в особенностях исследуемых образцов (фактор ). При этом из наших определений следует, что Кроме того, специфика данной конкретной задачи такова, что мы вправе принять в качестве исходных предпосылок для дальнейшего исследования следующие допущения:

а) между структурными компонентами у их имеется линейная зависимость вида В. 15, причем коэффициенты вообще говоря, зависят от химического состава (от фактора ), т. е. могут меняться при переходе от одной плавки к другой;

б) пары случайных величин не зависят друг от друга;

в) при любых фиксированных (т. е. для любой фиксированной плавки и при любом фиксированном режиме ее термической обработки) существуют дисперсии

г) «общая» остаточная случайная компонента — подчинена нормальному распределению, параметры которого не зависят от характера термической обработки (т. е. от фактора );

д) диапазоны изменения структурных компонент х и у во много раз превосходят практические диапазоны остаточных случайных компонент (см. рис. В.7).

Схема исследуемые переменные случайны. Этот тип зависимости, нередко встречающийся в практике статистических исследований, является в некотором смысле обобщением схемы

Итак, под схемой мы будем понимать такую схему зависимости, в которой исследуемые случайные переменные I и связаны соотношением (В.20), однако наблюдать мы их можем лишь с некоторыми случайными ошибками — соответственно и Поэтому экспериментальными данными в действительности представлены выборочные значения случайных величин , где

Обычно предполагают, что ошибки взаимно независимы, но зависят от и имеют нулевые математические ожидания и конечные дисперсии

При этом оказывается, что корреляционные и регрессионные характеристики схемы могут существенно отличаться от соответствующих характеристик исходной (неискаженной) схемы . Так, например, ниже (см. п. 1.1.4) показано, что наложение случайных нормальных ошибок на исходную двумерную нормальную схему ) всегда уменьшает абсолютную величину коэффициента регрессии в соотношении (В. 15), а также ослабляет степень тесноты связи между (т. е. уменьшает абсолютную величину коэффициента корреляции ).

Зависимости по схеме имеют место, в частности, в задачах исследования хода технологических процессов, когда взаимосвязанные флюктуирующие значения параметров процесса () могут быть измерены лишь с некоторыми случайными ошибками.

<< Предыдущий параграф

Следующий параграф >>

Оглавление

ПРЕДИСЛОВИЕ
Введение. СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ ЗАВИСИМОСТЕЙ СОДЕРЖАНИЕ, ЗАДАЧИ, ОБЛАСТИ ПРИМЕНЕНИЯ
В.2. Какова конечная прикладная цель статистического исследования зависимостей?
В.3. Математический инструментарий
В.4. Некоторые типовые задачи практики
В.5. Основные типы зависимостей между количественными переменными
В.6. Основные этапы статистического исследования зависимостей
ВЫВОДЫ
Раздел I. АНАЛИЗ СТРУКТУРЫ И ТЕСНОТЫ СТАТИСТИЧЕСКОЙ СВЯЗИ МЕЖДУ ИССЛЕДУЕМЫМИ ПЕРЕМЕННЫМИ (корреляционный анализ)
1.1.1. Понятие индекса корреляции.
1.1.2. Коэффициент корреляции как измеритель степени тесноты связи в двумерных нормальных схемах.
1.1.3. Распределение выборочного коэффициента корреляции и проверка гипотезы о статистической значимости линейной связи.
1.1.4. Влияние ошибок измерения на величину коэффициента корреляции.
1.1.5. Измерение степени тесноты связи при нелинейной зависимости.
1.2. Анализ частных («очищенных») связей
1.2.2. Частные коэффициенты корреляции и их выборочные значения.
1.2.3. Статистические свойства выборочных частных коэффициентов корреляции (проверка на статистическую значимость их отличия от нуля, доверительные интервалы).
1.3. Анализ множественных связей
1.3.2. Множественный коэффициент корреляции и его свойства (общий случай).
1.3.3. Вычисление и свойства множественного коэффициента корреляции в рамках линейных нормальных моделей.
1.3.4. Примеры.
ВЫВОДЫ
Глава 2. АНАЛИЗ СТАТИСТИЧЕСКОЙ СВЯЗИ МЕЖДУ ПОРЯДКОВЫМИ (ОРДИНАЛЬНЫМИ) ПЕРЕМЕННЫМИ
2.1. Ранговая корреляция
2.1.2. Понятие ранговой корреляции.
2.1.3. Основные задачи статистического анализа связей между ранжировками.
2.1.4. Вероятностные пространства ранжировок, генерируемые порядковыми переменными [14, гл. 4, 5].
2.2. Анализ и измерение парных ранговых статистических связей
2.2.1. Ранговый коэффициент корреляции Спирмэна.
2.2.2. Ранговый коэффициент корреляции Кендалла.
2.2.3. Обобщенная формула для парного коэффициента корреляции и связь между коэффициентами Спирмэна и Кендалла.
2.2.4. Статистические свойства выборочных характеристик парной ранговой связи.
2.3. Анализ множественных ранговых связей
2.3.2. Проверка статистической значимости выборочного значения коэффициента конкордации.
2.3.3. Использование коэффициента конкордации в решении основных задач статистического анализа ранговых связей.
2.3.4. Примеры.
ВЫВОДЫ
Глава 3. АНАЛИЗ СВЯЗЕЙ МЕЖДУ КЛАССИФИКАЦИОННЫМИ (НОМИНАЛЬНЫМИ) ПЕРЕМЕННЫМИ
3.1. Таблицы сопряженности
3.1.2. Логарифмически-линейная. параметризация таблиц сопряженности.
3.1.3. Проверка гипотез.
3.1.4. Меры связи между строками и столбцами таблицы.
3.2. Приписывание численных значений качественным переменным (дуальное шкалирование)
3.2.1. Методическое место дуального шкалирования.
3.2.2. Максимизация F-отношения суммы квадратов отклонений между объектами к полной сумме квадратов отклонений.
3.2.3. Двойственность в определении V и W.
3.2.4. Максимизация коэффициента корреляции.
3.2.5. Изучение оптимального решения.
3.2.6. Таблицы «объект—многомерный отклик».
ВЫВОДЫ
Глава 4. АНАЛИЗ СТРУКТУРЫ СВЯЗЕЙ МЕЖДУ КОМПОНЕНТАМИ МНОГОМЕРНОГО ВЕКТОРА
4.1.1. Цепи Маркова.
4.1.3. Математические задачи, связанные с изучением распределений с ДСЗ.
4.2. Распределение с древообразной структурой зависимостей
4.2.1. Предварительные сведения из теории графов.
4.2.2. Распределения с древообразной структурой зависимостей (ДСЗ).
4.3. Оценка графа структуры зависимостей компонент нормального вектора
4.3.2. Построение графа структуры зависимостей по корреляционной матрице.
4.3.3. Асимптотика Колмогорова — Деева.
4.4. R(k)-распределения
4.4.1. Основные определения. Начнем с обобщения понятия распределения с ДСЗ.
4.4.2. Нормальное R(k)-распределение.
4.4.3. Восстановление графа структуры зависимостей.
4.5. Структура связей нормального вектора (общий случай)
4.5.1. Марковская тройка. Структура многомерного вектора.
4.5.2. Информационная интерпретация структуры связей.
4.5.3. Использование структуры для представления распределения в виде композиции более простых распределений.
ВЫВОДЫ
Раздел II. ИССЛЕДОВАНИЕ ВИДА ЗАВИСИМОСТИ МЕЖДУ КОЛИЧЕСТВЕННЫМИ ПЕРЕМЕННЫМИ (регрессионный анализ)
5.1. Функция регрессии как условное среднее и ее интерпретация в рамках многомерной нормальной модели
5.2. Функция «дельта»-регрессии как решение оптимизационной задачи
5.3. Взаимоотношения различных регрессий
ВЫВОДЫ
Глава 6. ВЫБОР ОБЩЕГО ВИДА ФУНКЦИИ РЕГРЕССИИ
6.1. Использование априорной информации о содержательной сущности анализируемой зависимости
6.2. Предварительный анализ геометрической структуры исходных данных
6.2.1. Содержание геометрического анализа парных корреляционных полей.
6.2.2. Учет и формализация «гладких» свойств искомой функции регрессии.
6.2.3. Некоторые вспомогательные преобразования, линеаризующие исследуемую парную зависимость.
6.3. Математико-статистические методы в задаче параметризации модели регрессии
6.3.1. Компромисс между сложностью регрессионной модели и точностью ее оценивания.
6.3.2. Поиск модели, наиболее устойчивой к варьированию состава выборочных данных, на основании которых она оценивается.
6.3.3. Статистические критерии проверки гипотез об общем виде функции регрессии.
ВЫВОДЫ
Глава 7. ОЦЕНИВАНИЕ НЕИЗВЕСТНЫХ ЗНАЧЕНИЙ ПАРАМЕТРОВ, ЛИНЕЙНО ВХОДЯЩИХ В УРАВНЕНИЕ РЕГРЕССИОННОЙ ЗАВИСИМОСТИ
7.1. Метод наименьших квадратов
7.1.2. Свойства мнк-оценок.
7.1.3. Ортогональная матрица плана.
7.1.4. Параболическая регрессия и система ортогональных полиномов Чебышева.
7.1.5. Обобщенный мнк.
7.2. Функции потерь, отличные от квадратичной
7.2.1. Функция потерь.
7.2.3. Функции потерь, имеющие горизонтальную асимптоту.
7.2.4. Эв-регрессия («лямбда»-регрессия).
7.2.5. Минимизация систематической ошибки.
7.3. Байесовское оценивание
7.3.1. Введение априорной плотности распределения параметров.
7.3.2. Апостериорное распределение параметров.
7.3.3. Повторная выборка из той же совокупности.
7.4. Многомерная регрессия
7.4.1. Случай известной ковариационной матрицы ошибок.
7.4.3. Эв-оценки.
7.4.4. Использование многомерной регрессии для параметризации многомерных распределений.
7.5. Оценивание параметров при наличии погрешностей в предикторных переменных (конфлюэнтный анализ)
7.5.1. Основные типы задач конфлюэнтного анализа.
7.5.2. Модифицированный мнк для схемы активного эксперимента.
7.5.3. Пассивные наблюдения.
7.5.4. Некоторые принципиальные отличия регрессионных задач (7.83) и (7.84).
7.5.5. Неявное задание отклика.
7.6. Оценивание в регрессионных моделях со случайными параметрами (регрессионные задачи второго рода)
7.6.2. Случай, когда средние значения и ковариационная матрица оцениваемых параметров известны (требуется оценить параметры).
7.6.3. Случай, когда известна только ковариационная матрица (требуется оценить параметры).
7.6.4. Случай неизвестных.
ВЫВОДЫ
Глава 8. ОЦЕНИВАНИЕ ПАРАМЕТРОВ РЕГРЕССИИ В УСЛОВИЯХ МУЛЬТИКОЛЛИНЕАРНОСТИ И ОТБОР СУЩЕСТВЕННЫХ ПРЕДИКТОРОВ
8.1. Явление мультиколлинеарности и его влияние на мнк-оценки
8.2. Регрессия на главные компоненты
8.3. Смещенное оценивание коэффициентов регрессии
8.4. Редуцированные оценки для стандартной модели линейной регрессии
8.4.2. Редуцированная оценка Мейера — Уилке.
8.5. Оценки, связанные с ортогональным разложением
8.5.1. Оптимальное взвешивание вклада главных компонент.
8.5.2. Оценка оптимальных вкладов главных компонент.
8.6. Вопросы точности вычислительной реализации процедур линейного оценивания
8.6.1. Два метода получения мнк-оценок.
8.6.2. Оценки величин возмущений для решений центрированной и соответствующей ей нормальной системы уравнений.
8.6.3. Центрирование и нормирование матрицы данных.
8.6.4. Вычисление элементов ковариационной матрицы.
8.7. Отбор существенных переменных в задачах линейной регрессии
8.7.1. Влияние отбора переменных на оценку уравнения регрессии.
8.7.2. Критерии качества уравнения регрессии.
8.7.3. Схемы генерации наборов переменных.
8.7.4. Пошаговые процедуры генерации наборов.
8.7.5. Оператор симметричного выметания.
8.7.6. Методические аспекты использования процедур отбора существенных предикторных переменных.
ВЫВОДЫ
Глава 9. ВЫЧИСЛИТЕЛЬНЫЕ АСПЕКТЫ МЕТОДА НАИМЕНЬШИХ КВАДРАТОВ
9.1. Итерационные методы поиска оценок метода наименьших квадратов (мнк-оценок)
9.1.2. Алгоритмы квазиградиентного типа.
9.2. Градиентный спуск
9.3. Метод Ньютона
9.4 Метод Ньютона-Гаусса и его модификации
9.4.2. Обсуждение скорости сходимости процедуры.
9.4.3. Рекомендации по правилу остановки итерационной процедуры.
9.5. Методы, не использующие вычисления производных
9.6. Способы нахождения начального приближения
9.7. Вопросы существования и единственности мнк-оценки
ВЫВОДЫ
Глава 10. НЕПАРАМЕТРИЧЕСКАЯ, ЛОКАЛЬНО-ПАРАМЕТРИЧЕСКАЯ И КУСОЧНАЯ АППРОКСИМАЦИЯ РЕГРЕССИОННЫХ ЗАВИСИМОСТЕЙ
10.1. Непараметрическое оценивание регрессии
10.2. Локальная параметрическая аппроксимация регрессии в одномерном случае
10.3. Кусочно-параметрическая (сплайновая) техника аппроксимации регрессионных зависимостей
10.3.1. Определение одномерных сплайнов.
10.3.2. Выбор порядка сплайна, числа и положения узлов.
10.3.3. Оценка параметров и проверка гипотез.
10.3.4. Билинейные сплайны.
ВЫВОДЫ
Глава II. ИССЛЕДОВАНИЕ точности СТАТИСТИЧЕСКИХ ВЫВОДОВ в РЕГРЕССИОННОМ АНАЛИЗЕ
11.1 Линейный (относительно оцениваемых параметров) нормальный вариант идеализированной схемы регрессионной зависимости
11.1.2. Решение основных задач по оценке точности регрессионной модели.
11.1.3. Случаи линейной (по предикторным переменным) и полиномиальной регрессии.
11.2. Нелинейный нормальный вариант идеализированной схемы регрессионной зависимости
11.2.2. Решение основных задач по оценке точности нелинейной регрессионной модели.
11.3. Исследование точности регрессионной модели в реалистической ситуации
ВЫВОДЫ
Глава 12. СТАТИСТИЧЕСКИЙ АНАЛИЗ АВТОРЕГРЕССИОННЫХ ДИНАМИЧЕСКИХ ЗАВИСИМОСТЕЙ
12.1. Дискретные динамические модели
12.2. Авторегрессия первого порядка
12.3. Авторегрессия произвольного порядка
ВЫВОДЫ
Раздел III. ИССЛЕДОВАНИЕ ЗАВИСИМОСТИ КОЛИЧЕСТВЕННОГО РЕЗУЛЬТИРУЮЩЕГО ПОКАЗАТЕЛЯ ОТ ОБЪЯСНЯЮЩИХ ПЕРЕМЕННЫХ СМЕШАННОЙ ПРИРОДЫ
Глава 13. ДИСПЕРСИОННЫЙ И КОВАРИАЦИОННЫЙ АНАЛИЗ
13.1. Классификация моделей дисперсионного анализа по способу организации исходных данных
13.2. Однофакторный дисперсионный анализ
13.3. Полный двухфакторный дисперсионный анализ
13.4. Модели дисперсионного анализа со случайными факторами
13.5. Ковариационный анализ (КА) и проблема статистического исследования смесей многомерных распределений
13.6. Влияние нарушений основных предположений
ВЫВОДЫ
Раздел IV. СИСТЕМЫ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ АППАРАТА СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ЗАВИСИМОСТЕЙ
14.1. Системы одновременных уравнений
14.2. Спецификация модели и проблема идентифицируемости
14.3. Рекурсивные системы
14.4. Двух- и трехшаговый методы наименьших квадратов
14.5. Метод неподвижной точки
14.6. Сравнение методов
ВЫВОДЫ
Глава 15. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ ЗАВИСИМОСТЕЙ
ПРИЛОЖЕНИЯ. МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ
Таблица П.1. Значения функции плотности стандартного нормального закона распределения
Таблица П.2. Значения функции стандартного нормального распределения
ИСПОЛЬЗУЕМЫЕ В КНИГЕ ОБОЗНАЧЕНИЯ
СПИСОК ЛИТЕРАТУРЫ