Главная > Линейный регрессионный анализ
НАПИШУ ВСЁ ЧТО ЗАДАЛИ
СЕКРЕТНЫЙ БОТ В ТЕЛЕГЕ
<< Предыдущий параграф Следующий параграф >>
Пред.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
След.
Макеты страниц

Распознанный текст, спецсимволы и формулы могут содержать ошибки, поэтому с корректным вариантом рекомендуем ознакомиться на отсканированных изображениях учебника выше

Также, советуем воспользоваться поиском по сайту, мы уверены, что вы сможете найти больше информации по нужной Вам тематике

ДЛЯ СТУДЕНТОВ И ШКОЛЬНИКОВ ЕСТЬ
ZADANIA.TO

6.6. Анализ остатков

6.6.1. Определение и свойства

Электронные вычислительные машины дают нам прекрасную возможность вычисления отклонений каждого из наблюдавшихся значений от аппроксимирующей регрессии Эти разности называются остатками и обозначаются символами

или

где (Если матрица X имеет неполный ранг, то мы можем использовать в определении обобщенную обратную матрицу Остатки, связаны математической зависимостью, определяемой соотношением (4.29) из § 4.2, а именно

Если то Напомним, что - несмещенная оценка для и поскольку то

Если то вектор имеет вырожденное многомерное нормальное распределение (вырожденность возникает из-за того, что матрица положительно полуопределена), и маргинальным распределением является Поскольку то и/поэтому Равенство достигается здесь (это соответствует только для некоторых специально подобранных планов [Behnken, Draper (1972, с. 102)]. Заметим, наконец, что (теорема 3.5(iii) из § 3.4)

и для

Второе равенство здесь — следствие соотношения (6.41). Последнее равенство в (6.43) вытекает из нормальных уравнений, что можно увидеть, дифференцируя а также из соотношения

Рассмотрим теперь некоторые графические методы, основанные на остатках и дающие возможность исследовать отклонения от основной модели и от сделанных предположений относительно распределений. Смысл использования этих графиков состоит в том, что всякое отклонение от сделанных предположений относительно распределения 8 отражается на векторе При этом различные графики отражают разные типы отклонении.

6.6.2. Графики остатков

Первый шаг состоит в таком выборе масштаба остатков, при котором они будут иметь дисперсии, приблизительно равные единице. Достичь этого можно, используя, например, понятие средней дисперсии

Оценивая с помощью мы приходим к шкалированным остаткам

(см. Daniel, Wood (1971, с. 28), Behnken, Draper (1972, с. 102)). В то же время, поскольку естественнее использовать "стьюдентизированные" остатки

Хотя сами остатки и их шкалированные варианты и коррелированы, эта корреляция, по-видимому, мало влияет на характер графиков, описанных ниже. Поэтому мы можем обращаться с и (до некоторой степени) с как с приблизительно независимыми и одинаково распределенными случайными величинами, имеющими распределение

Практика показывает, что во многих случаях, величины можно не учитывать, и при этом можно использовать либо либо, если не мало, [Behnken, Draper (1972, 1.3 и 2.5)].

(а) Нормальная вероятностная бумага

Пусть стьюдентизированные остатки, расположенные в порядке возрастания. Для умеренно больших значений (см. приложение С) построенный на вероятностной бумаге график зависимости от будет выявлять

любые заметные отклонения от нормальности, поскольку при наличии нормальности точки графика должны располагаться приблизительно вдоль прямой Такой график полезен также для обнаружения "выделяющихся", или "сомнительных", наблюдений. Они выглядят на графике как точки, значительно удаленные от прямой, соответствующей линейному тренду, на который указывают остальные точки. Однако к таким точкам надо относиться с достаточной осторожностью. Считается, что отбрасывать их как выделяющиеся наблюдения следует только в случае, когда их аномалия достаточно очевидна из каких-то соображений нестатистического характера. Так, возможны поломка измерительного устройства при проведении отдельного измерения, неправильная запись наблюдения или неправильное занесение его на перфокарту. Иногда наличие "странной" точки может иметь даже большее значение, чем весь остальной график, поскольку оно может указывать на серьезные недостатки в модели. Например, если такая точка соответствует экстремальному значению одного из это может означать такое изменение в модели, которое приводит к выходу за обычные рамки эксперимента. Следует отметить, что при малых практически невозможно определить, является данное наблюдение выделяющимся или нет.

(b) График зависимости остатков от подобранных значений

Построение графика зависимости от помогает выявлять три довольно распространенных дефекта.

(1) Выделяющиеся наблюдения: некоторые из остатков могут по абсолютной величине существенно превосходить все остальные остатки. Одна из возможных процедур проверки такова: остаток, имеющий экстремальное значение, скажем исключается из рассмотрения, если где С — некоторое заранее выбранное число. Если то можно использовать простое приближенное правило, согласно которому из рассмотрения исключаются все те остатки для которых Совместное распределение остатков известно (Ellenberg (1973)), так что, по крайней мере теоретически, можно найти распределение и определить соответствующее значение С. Эмпирическое решение этой задачи для случая одномерной линейной регрессии приведено в работе и др. (1973). Маргинальное распределение величины также известно (Beckman, Trussell (1974)). В то же время имеется и приближенный критерий, основанный на максимуме нормированных остатков [см. Stefansky (1971. 1972), Goldsmith, Boddy (1973), а также Williams (1973)].

(2) Прогрессирующее изменение дисперсии: если все имеют одинаковую дисперсию, то следует ожидать, что вариабельность остатков будет достаточно постоянной. Такое положение отображает рис. 6.1, а, где соответствующий график представляет собой, грубо говоря, "полосу" постоянной ширины. В то же время, если график имеет клинообразный вид, как на рис. 6.1, 6, это служит весьма серьезным указанием на то, что дисперсия возрастает с ростом

Рис. 6.1. Возможные дефекты модели, выявляемые на графиках остатков: а — удовлетворительный график; Ь—дисперсия возрастает с ростом с — имеющаяся кривизна указывает на неадекватность модели; наличие линейного тренда указывает на ошибки в вычислениях.

Примером может служить ситуация, когда наблюдения упорядочены во времени, а дисперсия наблюдений с течением времени возрастает. Другая ситуация подобного рода возникает, если ошибка является мультипликативной, а не дитивной, т. е. если

где В этом случае дисперсия равная изменяется вместе с -средним значением

Иногда дисперсию удается стабилизировать с помощью подходящего преобразования (см. § 6.7 и 7.1). Другим методом

может являться использование взвешенной процедуры наименьших квадратов. Итерационную процедуру оценивания весов в случае, когда является функцией от приводят Box, Hill (1974). Устойчивый метод взвешивания, основанный на использовании остатков, описан в работе Beaton, Tukey (1974).

(3) Неадекватность модели: криволинейный характер графика, подобный характеру графика, приведенного на рис. 6.1, с, указывает на неадекватность модели. Пусть, например, подобрана модель а истинная модель имеет вид

Тогда нетрудно показать, что

где и -функции от Поскольку и систематически изменяются с/изменением то систематическое изменение наблюдается и в графике зависимости или от

Заметим, наконец, что наличие в графике линейного тренда, подобного изображенному на рис. указывает на ошибки, имеющиеся в вычислениях, поскольку, как показали Draper, Smith (1966), (см. (6.42)).

(с) График зависимости остатков от пропущенных факторов

На практике любой фактор, который может влиять на отклик следует включать в регрессионную модель в качестве регрессора. Однако если какой-либо из вероятных факторов был пропущен, то это может быть выявлено по графику зависимости остатков от этого фактора (такой график, конечно, можно построить, только если известны уровни этого фактора). Например, график зависимости от времени, который часто является и графиком зависимости от может показывать наличие корреляции между последовательными (по времени) значениями (на рис. 6.2 показаны соответственно случаи положительной и

Рис. 6.2. Графики остатков, указывающие на. наличие корреляции между последовательными по времени значениями : а - положительная корреляция; б - отрицательная корреляция.

отрицательной корреляции) или указывать на изменение дисперсии с течением времени (как, например, на рис. 6.1, если по оси х откладывается время). Если график выглядит как полоса постоянной ширины, но при этом обнаруживается линейный или криволинейный тренд, как на рис. 6.3, то это говорит о необходимости включения в модель составляющих, линейным или нелинейным образом зависящих от времени.

Рис. 6.3. Графики остатков, указывающие на наличие в модели временного тренда: а — линейный тренд; b — криволинейный тренд.

В подобной ситуации полезно также построить график зависимости от времени самих или Это дает возможность непосредственно увидеть, насколько хорошо аппроксимирующая регрессия соответствует наблюдаемым значениям отклика. Полезно также разбить упорядоченные во времени остатки на последовательные пары и вычертить график зависимости одного члена пары от другого.

Для проверки наличия корреляции между членами временного ряда имеется целый ряд критериев. Простейшим из них является так называемый знаковый критерий (в оригинале "runs test"), основанный на рассмотрении последовательности знаков упорядоченной во времени последовательности остатков (этот критерий очень хорошо освещен в Brunk (1965 с. 354)). Правда, этот критерий является только приближенным, так как остатки слабо коррелированы. Однако наиболее популярным критерием для проверки корреляции внутри ряда является -критерий, который предложили Durbin, Watson (1950, 1951, 1971). Этот критерий описан ниже.

Предположим, что значения следуют модели авторегрессии первого порядка, т. е. где независимые случайные величины с распределением Пусть

Тогда, как показали Durbin, Watson (1971), критическая область для проверки нулевой гипотезы против односторонней альтернативы обладает определенными свойствами оптимальности. Например, она является локально наиболее мощной инвариантной критической областью. К сожалению, распределение статистики при гипотезе зависит от матрицы данных X, так что надо вычислять для каждой матрицы X отдельно. Тем не менее Durbin, Watson предложили несколько приближенных методов, которые как будто весьма хорошо работают на практике. Прежде всего они доказали [Durbin, Watson (1950)], что где и - случайные величины, распределения которых уже не зависят от Процентные точки для распределений и табулированы для различных в их статье за 1951 г., а также в работе Koerts, Abrahamse (1969, с. 176—178). Они также показали, что распределение статистики при гипотезе можно удовлетворительно аппроксимировать бета-распределением, имеющим такие же среднее и дисперсию. Иначе говоря, плотность распределения статистики при нулевой гипотезе аппроксимируется плотностью

а выражения для приведены в статье Durbin, Watson (1971, соотношения (3.1) — (3.4)). На основе такой аппроксимации они предлагают следующую процедуру. Пусть А — наблюдаемое значение статистики -размер критерия, нижние -процентные точки распределений соответственно. Если то гипотеза отвергается; если то гипотеза принимается; если то вычисляется (численными методами) интеграл

и гипотеза принимается или отвергается в зависимости от того, будет ли этот интеграл больше или меньше а. (Здесь можно воспользоваться имеющимися пакетами программ для вычисления функции бета-распределения.)

Если в качестве альтернативы выступает гипотеза о наличии отрицательной корреляции, т. е. то надо попросту использовать статистику При этом с релчицой можно

обращаться так, как если бы она была наблюдаемым значением статистики используемой для проверки наличия положительной корреляции. Двусторонние критерии для альтернативы получаются путем комбинации пары указанных выше односторонних критериев, для каждого из которых берется уровень значимости .

Durbin, Watson (1971, с. 18) предложили и другой приближенный критерий, основанный на критическом значении где а и подбираются таким образом, чтобы статистики имели одинаковые средние и одинаковые дисперсии. В этой же статье кратко описаны и другие тестовые статистики, распределения которых при нулевой гипотезе не зависят функциойально от матрицы . К этой категории принадлежит и так называемый НЛНШ-критерий [см. Koerts, Abrahamse 1969)]. Он является точным критерием и основывается на другом типе остатков — так называемых НЛНШ-остатках. К сожалению, последние требуют проведения большого количества вычислений.

Другой точный критерий, основанный на остатках рекуррентного типа, предложили Phillips, Harvey (1974). Этот критерий, по-видимому, лучше НЛНШ-критерия, хотя оба эти критерия являются менее мощными, чем взятая в целом процедура Durbin, Watson (1971), описанная выше.

Полезный графический метод обнаружения корреляции членов ряда, использующий накопленную периодограмму, построенную по остаткам предложил Durbin (1969). Предлагаем обратиться читателю к его работе, в которой можно найти детали этой и других процедур, использующих периодограммы.

(d) Графики зависимостей остатков от каждого из регрессоров

Эти графики полезны для обнаружения нелинейной зависимости от переменной При этом может оказаться уместным включить в исходную модель слагаемое (или перейти, например, от к Для иллюстрации предположим, что в Тогда Отсюда видно, что в обычной ситуации, когда остатки от модели, выражаемой прямой линией, будут располагаться на графике вокруг параболы При соответствующий график зависимости от будет иметь вид, подобный указанному на рис. 6.1, с Отметим, что линейный тренд здесь наблюдаться не должен, так как выборочная ковариация пар равна нулю (соотношение

Наша линейная модель предполагает, что сами регрессоры не взаимодействуют друг с другом, так что изменение значений одного из них не оказывает никакого влияния на то, какими будут значения других регрессоров. Чтобы убедиться в том, что это предположение правильно, можно построить график зависимости от произведения Если такое произведение необходимо в модели по существу, то будет наблюдаться тенденция к коррелированности остатков с этим произведением, выражающаяся в виде тренда, наблюдаемого на графике.

Указанные графики дают возможность обнаруживать также и любые заметные изменения дисперсии.

В заключение сделаем одно предостережение. Графики зависимости от каждого из редко оказываются полезными и, более того, могут даже вводить в заблуждение (см., например, Daniel Wood (1971, с. 53)).

(е) Графики зависимости ... от ...

Если какие-нибудь два регрессора сильно коррелировать между собой, то, вообще говоря, нет никакой необходимости включать в исходную модель регрессии обе эти переменные. В этом случае включение в модель одной из этих переменных означает в то же самое время, что в расчет, по существу, принимается и вторая неременная.

Другие типы графиков зависимостей между регрессорами вместе с некоторыми полезными ссылками можно найти в Anscombe (1973).

1
Оглавление
email@scask.ru