матрица (размера
) исходных данных по объясняющим (предикторным) переменным, матрица плана (здесь
),
— известные базисные функции, по которым разложена функция регрессии
в частном случае линейной (по объясняющим переменным) модели регрессии матрица плана имеет вид:
В гл. 3 X используется для обозначения матрицы исходных данных таблицы сопряженности (т. е. ее элемент
— это число объектов в двумерной выборке объема
отнесенных по первой случайной компоненте к градации i, а по второй случайной компоненте — к градации
), а в гл. 6 — для обозначения некоторого подмножества области определения исследуемой функции регрессии
Законы распределения вероятностей и их числовые характеристики
-мерный нормальный закон распределения вероятностей с вектором (столбцом) средних значений М и ковариационной матрицей
(если контекст не требует уточнения размерности закона, нижний индекс может быть опущен);
— нецентральное
-распределение с числами степеней свободы числителя и знаменателя соответственно и
и с параметром нецентральности
— обозначение факта: «случайная величина Е, имеет распределение
— квантиль уровня
квантиль) стандартного нормального распределения;
—
-ная точка
-распределения с v степенями свободы;
—
-ная точка распределения Стьюдента с v степенями свободы;
—
-ная точка центрального
-распределения с числами степеней свободы числителя и знаменателя соответственно
— элемент последовательности чисел, задающей двумерный (дискретный) закон распределения вероятностей: вероятность, что случайно извлеченный объект будет отнесен по первой компоненте к
градации, а по второй — к
- случайная величина
, анализируемая при условии, что значение другой случайной величины
зафиксировано и равно X;
— теоретическое среднее (математическое ожидание) случайной вели чины
— корреляционное отношение, характеризующее тесноту статистической связи между
при разбиении диапазона изменения объясняющей (предикторной) переменной на k интервалов группирования (здесь
наблюденное значение результирующей переменной
в
интервале группирования,
— средняя величина всех
наблюденных значений
, оказавшихся в
интервале группирования, а
— общее среднее значение всех
наблюденных значений случайной величины
;
— информационная мера статистической связи между дискретными случайными величинами
, где
— энтропия случайной величины
(здесь
), а суммирование производится по всем возможным значениям случайной величины
);
— частный (очищенный) коэффициент корреляции между компонентами
вектора
(вычислен при условии, что все остальные компоненты
вектора X зафиксированы на некотором постоянном уровне);
— частный коэффициент корреляции между и при условии фиксации на постоянных уровнях компонент
— множественный коэффициент корреляции между результирующей переменной
и объясняющими переменными
— коэффициент детерминации между
;
— ранговый коэффициент корреляции Спирмэна;
— ранговый коэффициент корреляции Кендалла;
— коэффициент конкордации (согласованности), измеряющий степень согласованности
различных ранжировок одних и тех же объектов.
Регрессионный, дисперсионный и ковариационный анализ
- функция регрессии результирующей переменной
по объясняющим переменным
(параметрическая запись):
— функция потерь, измеряющая убытки от неточности восстановления значения
с помощью функции
где
— некоторая аппроксимация неизвестной функции регрессии