11a.3. Моделирование рядов ежегодной численности населения
США. Мы рассмотрим ряды ежегодной численности населения США, заимствованные из Statistical Abstracts of the United States (1974).
11a.3.1. Детерминированные модели.
Поскольку мы имеем дело с популяцией, численность которой монотонно возрастает со временем, из двух детерминированных моделей модель Верхулста (11а.2.3) является наиболее подходящей. Три неизвестных параметра модели (11а.2.3), а именно
и
можно оценить по значениям численности населения в 1840, 1950 и 1960 гг. Соответствующие оценки и отвечающая им модель задаются соотношениями
где
измеряется в годах, а численность населения задана в миллионах. График численности населения для подобранной модели накладывается на кривую фактической численности, приведенную на рис.
Соответствие очень хорошее для 1790 - 1930 гг., но несколько худшее (хотя и удовлетворительное) для 1930 - 1960 гг. Мы могли бы улучшить соответствие для другого интервала лет, если бы для оценки параметров
использовали три других года. Но в рамках детерминированного подхода нет никакого систематического и приемлемого способа сравнения разных моделей. Можно было бы использовать критерий типа наименьших квадратов, но он представляется довольно произвольным. Одно из преимуществ стохастического варианта уравнения
состоит в том, что появляется систематический способ оценки его параметров.
Предположим, что для предсказания на один год численности населения в 1960- 1971 гг. мы используем детерминированную модель (11а.3.1). Результаты представлены в табл.
Предсказанное значение обозначено через у. Среднее значение
Таблица 11а.3.1. (см. скан) Прогнозы на год вперед численности населения США по детерминированной модели
ошибки предсказания равно 7,796, а среднеквадратическое значение ошибки предсказания равно 73,162. Наблюденные и предсказанные с помощью модели
значения приведены на рис. 3а.1.4. Заметим, что для рис. 3а.1.4 относительная ошибка предсказания
возрастает с ростом
и для 1971 г. равна приблизительно 6%. Таким образом, мы имеем один из самых: типичных примеров детерминированной модели, которая очень хорошо согласована с исходными данными, но имеет плохие характеристики предсказания.
11а.3.2. Стохастические модели.
Рассмотрим следующие четыре класса стохастических моделей
, описываемых уравнениями
Пусть
Тогда
Уравнение
есть стохастический вариант модели Верхулста
Уравнения
и выводятся из стохастических вариантов моделей Гомпертца. Они совпадают с
соответственно. Уравнение
совпадает с уравнением
при
Можно порождать дополнительные классы, отвечающие другим уравнениям
получаемым при различных значениях
Но необходимости использовать дополнительные классы не возникает, поскольку было найдено, что модель класса
вполне удовлетворительна.
Для получения наилучшим образом согласованных моделей в каждом из перечисленных классов (модели приводятся ниже вместе с дисперсиями остатков) используем данные за
Наилучшим образом согласованную модель в классе С обозначим через
Классы сравниваются с помощью изложенного в
метода правдоподобия. Поскольку все модели включают логарифмические преобразования, будем сравнивать их, используя следующие статистики
число параметров,
дисперсия
остатков):
Максимальной среди
является
поэтому класс
предпочтительнее других. Этого и следовало ожидать, поскольку
значительно меньше, чем
Мы подкрепим этот выбор с точки зрения качества предсказания, используя подход п. 8b.4.1. Получим наилучшие согласованные модели, используя лишь данные за 1900 - 1947 гг., а затем используем эти модели для предсказания на год вперед для 1948 -1971 гг.
Рис. 11а.3.1. Прогноз численности населения США по модели
.
Согласованными с данными за 1900 —1947 годы моделями являются
Предсказанные значения и ошибки предсказания приведены в табл. 11а.3.2, а предсказания по модели
изображены на рис. 11а.3.1. В табл. 11а.3.2 приведены также средние и
среднеквадратические значения ошибок для 24 точек. Среди всех моделей модель
имеет наименьшие значения средней абсолютной ошибки и среднеквадратической ошибки предсказания, указывая на предпочтительность класса
другим классам. Типичная ошибка предсказания для
равна приблизительно 0,1% от значения численности населения, тогда как для других моделей она колеблется от 5 до 1%.
Таблица 11а.3.2. (см. скан) Прогнозы численности населения США по стохастическим моделям
Модель
удовлетворяет всем критериям адекватности на 95-процентном уровне значимости.
Следует подчеркнуть, что наилучшая согласованная модель
приводит к экспоненциальному росту среднего значения и
Как было упомянуто ранее, можно построить болыпоег число различных детерминированных моделей, используя при оценке параметров данные каких-нибудь трех разных лет. Некоторые
этих моделей могут дать лучшие результаты предсказания, чем другие.
Рис. 11а.3.2. Прогнозы на пять (V) и десять
лет вперед численности населения США по модели
— прогнозы по логистической кривой.
Например, Крокстон, Коуден (1939) предложили следующую детерминированную модель по данным за
Если использовать эту модель для предсказания численности населения на
то ошибки предсказания составят приблизительно 14 и 20,1%.
B. Сравнение моделей
. Интересно также сравнить пары моделей
рассчитанных по данным за 72 года и 48 лет соответственно. Заметим, что соответственные коэффициенты моделей
приблизительно одинаковы, различие между ними можно приписать флуктуациям выборки. Но соответственные коэффициенты для пар моделей
существенно различны, показывая непригодность классов
Сравнивая
или
мы не имеем права заключать о необходимости модели с переменными коэффициентами, поскольку обе модели,
не удовлетворяют критериям адекватности.
C. Сравнение классов
Другой чертой общей теории построения моделей, представляющей значительный интерес, является существенное различие прогностических возможностей
наилучшим образом согласованных моделей классов
Обе модели оказываются авторегрессионными уравнениями второго порядка относительно переменной
с добавленным постоянным членом. Но остаточные дисперсии и прогностические возможности для этих моделей существенно различны. Конечно, следует ожидать расхождения характеристик двух моделей, поскольку модель IAR с постоянным членом приводит к асимптотическому возрастанию средних и дисперсий, тогда как обычная модель
к их устойчивому поведению. Это ясно показывает, насколько опасно использовать обычную модель AR для процесса, описываемого моделью IAR с постоянным членом.
D. Сравнение модели
с детерминированной моделью
Напомним, что модель
есть стохастический аналог детерминированной модели
Поэтому можно сравнивать коэффициенты моделей. Из уравнения
получаем оценки
так что
Обратим внимание на расхождение между оценками коэффициента
в моделях
а также на большую разницу в ошибках предсказания для детерминированной модели
из
и ее стохастического варианта
выявляемую при сравнении данных табл. 11а.3.1 и 11а.3.2. Преимущество стохастической модели можно объяснить двумя причинами. (I) Стохастическая модель
использует фактические наблюдения по всем годам, предшествующим предсказываемому. Этого нельзя сказать о модели
которая использует для предсказания меньше информации, чем
Параметры стохастической модели
оцениваются более систематическим способом, чем параметры модели
оценки параметров
довольно произвольны, так как три ее коэффициента оцениваются по значениям численности населения для трех произвольных годов.