Главная > Справочник по прикладной статистике. Том 2
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

Глава 16. МНОГОМЕРНЫЙ АНАЛИЗ: КЛАССИЧЕСКИЕ МЕТОДЫ

16.1. ВВЕДЕНИЕ

Статистика имеет дело с совокупностями (популяциями) объектов и выборками из этих совокупностей. Когда каждый объект в выборке имеет одну количественную или качественную характеристику, интересующую статистика, совокупность и выборка являются одномерными. Объектами могли бы быть, например, взрослые люди, а переменной

— их рост (количественная переменная) или цвет волос (качественная переменная). Когда для каждого объекта в выборке определены значения двух и более переменных, мы имеем дело с многомерной совокупностью: двумерной, если число переменных у объекта два, трехмерной, если три и т. д. Для совокупности взрослых людей такими переменными могли бы быть: — рост, — вес, — возраст и — кровяное давление. Тогда мы бы имели дело с четырехмерной совокупностью и векторной случайной переменной X с четырьмя компонентами

Из математических соображений удобно представлять объект в виде вектора-столбца. Но это неудобно с полиграфической точки зрения. Поэтому обычно записывают вектор в транспонированной форме [см. I, раздел 6.5], указывая на это с помощью штриха:

Вообще для -мерной совокупности мы нуждаемся в случайных векторах Хер компонентами случайную величину соответствующую измерению объекта из совокупности, будем называть компонентой векторной случайной переменной. Векторное наблюдение над объектом из выборки будет присваивать некоторое скалярное численное значение для каждой из скалярных случайных величин . Обозначим эти значения через , где второй индекс служит для идентификации объекта из выборки. Векторное наблюдение над этим объектом определяется теперь как вектор

Так, примером двумерного наблюдения служит

Здесь измеряет рост в дюймах, а — вес в фунтах случайно выбранного взрослого человека из совокупности людей; для челове рост оказался 65,2 дюйма, а вес 110,5 фунта. Выборка объема к из -мерной совокупности содержит к векторных наблюдений — по одному на каждый объект в выборке:

каждое — порядка с

Эти к выборочных векторов являются к реализациями векторной случайной величины, -мерное распределение которой служит предметом исследования.

Часто удобно агрегировать векторные наблюдения в форме выборочной матрицы [см. I, раздел 6.2]:

порядка Для двумерной выборки объема из двумерного распределения роста и веса людей эта матрица могла бы иметь следующий вид:

Вообще элемент в есть который представляет собой наблюдение компоненты члена выборки.

Введем для дальнейшего вектор-столбец 1 с компонентами и заметим, что

1) есть вектор-столбец

2) есть вектор-строка

3) есть симметричная матрица элемент которой есть

В нашей выборке объема к среднее значение веса (переменной есть

Аналогично определим среднее компоненты вообще:

т. е. — сумма элементов строки выборочной матрицы

Для матрицы выборки (16.1.2) это дало бы

и для среднего значения роста и среднего значения веса Используя правило сложения векторов [см. II, раздел 6.2], можно сделать эквивалентную запись:

Вообще средний вектор выборки

компонентами которого будут выборочные средние 1-й, 2-й и т. д. характеристик. Он может быть альтернативно определен как

Эквивалентно

где [см. I, раздел 6.2], так как — вектор, компоненты которого есть сумма элементов строк выборочной матрицы

Для каждой из характеристик (рост, вес и т. д.) определим выборочную сумму квадратов:

и выборочные суммы произведений:

где по определению (Отметим условность употребления термина «сумма квадратов». В действительности это означает «сумму квадратов отклонений от соответствующего выборочного среднего». То же относится и к произведениям.) Для матрицы данных (16.1.2) имеем

как выборочную сумму квадратов для роста и для веса. Выборочная сумма произведений:

Суммы квадратов и произведений могут быть агрегированы в форме матрицы А, имеющей как элемент. Это — матрица выборочных сумм квадратов и произведений:

Она является симметричной матрицей порядка

Из введенных определений следует, что матрица А может быть выражена в виде [см. (16.1.6)]

или, более подробно,

Выборочные дисперсии определяются как величины

а выборочные ковариации — как

[см. раздел 2.1.2, п. б)]. Делитель выбирается так, чтобы обеспечить несмещенность оценок [см. раздел 3.3.2] соответствующих величин для совокупности. Выборочная ковариационная матрица (выборочная дисперсионно-ковариационная матрица, выборочная дисперсионная матрица) есть симметричная матрица С порядка определяемая как

Диагональные элементы С представляют собой выборочные дисперсии, а элементы — выборочные ковариации.

Определим теперь математическое ожидание векторной переменной

как вектор

и математическое ожидание матрицы случайных величин

как

т. e. в матрице [см. (16.1.11)] каждый случайный элемент замещается его математическим ожиданием

Из несмещенности выборочных дисперсий и ковариаций как оценок соответствующих параметров совокупности следует, что

где — вектор математических ожиданий, дисперсионная матрица совокупностей.

Введем следующие определения.

Определение 16.1.1. Дисперсионной матрицей (называемой также матрицей ковариаций и вариационно-ковариационной матрицей) векторной случайной величины называется матрица V размера где

Матрица корреляций получается из этой матрицы замещением на

Определение 16.1.2. Кросс-ковариационная матрица двух случайных векторных переменных есть прямоугольная -матрица где

Кросс-корреляционная матрица получается из С заменой на , где

Введем терминологию, которая будет использоваться в дальнейшем.

Определение 16.1.3. Положительно и неотрицательно определенные матрицы. Квадратная действительная матрица V называется положительно определенной, если

для любого вектора а с действительными компонентами и такого, что не все его компоненты — нули. Мприца V называется неотрицательно определенной, если

при тех же условиях.

В частности, если V — дисперсионная матрица случайного вектора компоненты которого линейно независимы в том смысле, что все нетривиальные линейные комбинации вида являются невырожденными случайными величинами (т. е. не будут константами и будут иметь положительную дисперсию), то [см. I, раздел 19.6.14]

где Так что V — положительно определенная матрица. (Предупредим читателя, что положительные матрицы, т. е. матрицы, у которых все элементы положительны, не обязательно положительно определены. Аналогичное замечание верно и относительно неотрицательно определенных матриц.)

Результаты, представленные равенствами (16.1.13), указывают на некоторые трудности, связанные с обозначениями. Их мы попытаемся избежать, приняв некоторые соглашения.

Замечание. До настоящего момента мы делали различие между случайной переменной и ее реализацией в этом разделе, следовательно, нужно различать случайную переменную и ее реализацию . В то же время необходимо различать матрицу и ее элементы Соглашение теории вероятностей «прописная буква — строчная буква» и такое же соглашение в теории матриц вступают в противоречие. Мы могли бы, скажем, греческими буквами обозначать векторные или матричные случайные переменные, а латинскими — векторы и матрицы. Но в этом случае выигрыш от однозначности обозначений был бы перевешен их сложностью. Поэтому мы принимаем следующее соглашение.

Соглашение об обозначениях. Будут применяться стандартные обозначения линейной алгебры: х — вектор-столбец; — транспонированный ему вектор-строка; А — матрица и т. д. В предыдущей главе, там, где это было удобно, мы отбрасывали ранее принятое соглашение, согласно которому мы обращались к индуцированной случайной величине X [см. определение 2.2.1], чтобы описать выборочное распределение некоторой выборочной статистики х, используя для обозначения выборочного математического ожидания х [см. определение 2.3.1] и т. д. Здесь будет использоваться для обозначения (там, где контекст позволяет избежать двусмысленности) выборочного математического ожидания х. Это же относится к дисперсиям, ко-вариациям, векторным и матричным случайным величинам.

1
Оглавление
email@scask.ru