Научная статья на тему 'Моделирование и анализ динамических данных'

Моделирование и анализ динамических данных Текст научной статьи по специальности «Математика»

CC BY
726
269
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Трусова А. Ю., Ильина А. И.

В статье рассмотрены некоторые особенности авторегрес-сионых моделей, использовалась авторегрессионная интегрированная модель скользящего среднего Бокса — Дженкинса. Выполнен ретропрогноз на основе использованных моделей, рассчитаны важнейшие показатели моделей, проведена оценка адекватности и выбрана оптимальная модель авторегрессии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELING AND ANALYSIS OF DYNAMIC DATA

In this work some characteristics of autoregressive models are viewed, autoregressive integrated model of moving average of Box-Jenkins was used. Retro forecast was made based on this model, most important indicators were calculated, adequacy of model was tested and optimal autoregressive model was chosen.

Текст научной работы на тему «Моделирование и анализ динамических данных»

УДК 338

А.Ю. Трусова, А.И. Ильина * МОДЕЛИРОВАНИЕ И АНАЛИЗ ДИНАМИЧЕСКИХ ДАННЫХ

В статье рассмотрены некоторые особенности авторегрес-сионых моделей, использовалась авторегрессионная интегрированная модель скользящего среднего Бокса — Дженкинса. Выполнен ретропрогноз на основе использованных моделей, рассчитаны важнейшие показатели моделей, проведена оценка адекватности и выбрана оптимальная модель авторегрессии.

Ключевые слова: динамические данные, авторегрессионые модели, прогнозирование, ретропрогноз.

Авторегрессионные модели широко используются для описания стационарных случайных процессов в экономических исследованиях.

В настоящее время достаточно хорошо изучены адаптивные модели прогнозирования уровней рядов динамики, такие как: модель скользящего среднего, модели авторегрессии — скользящего среднего, обобщенная линейная модель прогноза временных рядов, сезонные модели, модель Бокса — Дженкинса, нестационарные модели, модель со множеством состояний и др.

Построение авторегрессионных моделей в экономике основано на таком важном свойстве рядов экономических явлений и процессов, как взаимозависимость уровней одного и того же ряда друг от друга. Условие нормальности распределения ряда при построении их эконометрических моделей не является обязательным [1].

Авторегрессионные модели широко используются для описания стационарных случайных процессов. Характерной особенностью стационарных временных рядов является то, что их развитие происходит без выраженной тенденции в неизменных стабильных условиях, поэтому вероятностные свойства рядов не изменяются во времени. Функции распределения стационарных динамических рядов не меняются при сдвиге времени [2].

Рассмотрим модели, лежащие в основе процедуры прогнозирования и методы построения этих моделей, а затем проанализируем особенности их применения и конкретные результаты, полученные при проведении экспериментов.

1. Авторегрессионная модель.

В этой модели текущее значение процесса выражается через конечную линейную совокупность предыдущих значений процесса и возмущения

где с^ - параметры (коэффициенты) авторегрессионной модели (] = 1,2,...ш);

^ — случайная ошибка с нулевым математическим ожиданием, конечной дисперсией и единичной автокорреляционной матрицей, подтверждающей отсутствие автокорреляции между уровнями ряда ошибок (отклонений).

* © Трусова А.Ю., Ильина А.И., 2013

Трусова Алла Юрьевна, Ильина Алла Ивановна ([email protected]), кафедра математики и бизнес-информатики Самарского государственного университета, 443011, Российская Федерация, г. Самара, ул. Акад. Павлова, 1.

2. Модель скользящего среднего.

Модель описывает конкретные уровни выборочного ряда (случайный процесс) как линейную функцию зависимости моделируемой величины от разности (отклонений) между прошлыми фактическими (у4_[) и прошлыми расчетными (смоделированными) (у^1 ) наблюдениями = у^ - 1 = 1,2,я; t = 2,3,п). Таким образом, данная модель задается уравнением вида

где [30, р[ — параметры модели скользящего среднего.

3. Нестационарные модели.

В этих моделях используются идеи о возможности трансформировать нестационарные ряды в стационарные путем перехода от исходного ряда к его разностям соответствующего порядка ё. Тогда преобразованный, стационарный ряд можно описать одной из рассмотренных выше моделей [3; 4].

Модель авторегрессии — скользящего среднего

Описывает временной ряд у4 выборочных данных, задается путем объединения АР-модели и СС-модели в следующем виде:

где а^с^ — коэффициенты авторегрессии (] = 1,2, ...,р); р — порядок уравнения авторегрессии;

ц — порядок уравнения скользящего среднего;

— коэффициенты (параметры) уравнения скользящего среднего 1 = 1,2,..., ц};

^ — отклонения фактического и расчетного у^ уровней ряда. В случае когда коэффициенты автокорреляции существенно отличаются от нуля при больших лагах, ряд динамики можно описать моделью авторегрессии — скользящего среднего.

Модель АРСС (р^) применительно к стационарному случайному процессу в общем виде представляется следующим уравнением с характерным «белым шумом» е<.:

где — истинные коэффициенты авторегрессии и скользящего среднего динамического процесса у<.; -1 < ^ < 1 и - 1 < Ъ1 < 1.

Модель Бокса — Дженкинса

Переход от авторегрессионной модели скользящего среднего к модели Бокса — Дженкинса происходит с помощью представления АРСС-модели без свободного члена для центрированных элементов ряда, задающихся в виде уравнений:

ч

й =У+Й1(У4-1 -у) + 02(У1-2-У) + - + ар(у1-р-у)-]гр1б1-

(5)

где д у^з^ - расчетные значения исходного и разностного рядов в момент времени V, — средние значения исходного и разностного рядов, относительно которых предполагается наличие статистического равновесия колеблемости уровней ряда;

г. - отклонение фактического и расчетного уровней ряда в момент времени 1.

Авторегрессионная модель скользящего среднего такого вида нестационарного исходного ряда идентифицируется тремя параметрами:

1) порядком авторегрессионной модели,

2) порядком разностного ряда,

3) порядком уравнения скользящего среднего.

Определенная таким образом модель называется авторегрессионной интегрированной моделью скользящего среднего Бокса — Дженкинса. Данная модель используется для идентификации временного ряда (определение порядков конечной разности, авторегрессии и скользящего среднего), оценивания параметров и проверки адекватности модели [5].

Обощенная линейная модель прогноза временных рядов

Обобщенная линейная модель прогноза временного ряда (ОЛИМП) представляет собой, по сути, модель авторегрессии — скользящего среднего, применяемую для моделирования нестационарных временных рядов.

В модели ОЛИМП не используется параметр ё — порядок разностного ряда. Таким образом, эта модель идентифицируется только двумя параметрами р и ц и сокращенно записывается как ОЛИМП (р,ц). Уравнение модели ОЛИМП имеет следующий вид:

(6)

где з^ — эмпирические (фактические) значения уровня ряда в момент времени V, г — среднее значение исходного ряда; : - коэффициент уравнения авторегрессии ]-го порядка;

- коэффициент уравнения скользящего среднего 1-го порядка; е- отклонение фактического (у<.) и расчетного (у\) уровней исходного ряда в момент времени 1

Построенные на практике модели показали, что применение специальных процедур адаптации моделей прогноза временных рядов, основанных на методах Брауна, Хольта, авторегрессии, авторегрессии — скользящего среднего, обобщенной линейной модели, дает достаточно точные результаты краткосрочного и среднесрочного ретропрогноза.

В алгоритмах процедур адаптивных моделей заложены схемы постоянного пошагового сопоставления оценок ретропрогноза, полученных на основе модели, с фактическими уровнями ряда и корректировки параметров модели в соответствии с имеющимися расхождениями.

Модель строилась на основе данных о пассажирских перевозках в разные промежутки времени, всего 144 наблюдения. По исходным данным построена модель проинтегрированного скользящего среднего, выявлены тенденции, проведена оценка параметров модели, проверена стационарность ряда и адекватность модели, построен прогноз на последующие промежутки времени. На рис. 2 представлен график исходных данных по 144 наблюдениям.

Рис. 1. Графическая иллюстрация исходного ряда

На рис. 1 видно, что ряд удовлетворяет всем требованиям, при этом нет резких скачков, просматриваются тренд ряда, который выражается в плавном увеличении объема перевозок, и некоторая сезонность. Для нахождения периодичностей используется спектральный анализ.

Рис. 2. Спектральный анализ, периодограмма

Узкий высокий пик на рис. 2 свидетельствует о наличии регулярных циклов, а широкие пики соответствуют нерегулярным циклам.

Следующим шагом являлось оценивание параметров АРИСС модели максимизацией функции правдоподобия. С помощью программы «Статистика» получился результат оценивания со стандартными ошибками, асимптотическими значениями ^статистик и т. д. (рис. 4).

В таблице видно, что оценки обоих параметров высоко значимы (т.к. р значительно меньше 0,05).

Далее строятся прогнозы и их доверительные интервалы для наблюдений, начиная с 145-го (рис. 5, 6).

Для анализа адекватности модели исследуются остатки (рис. 7).

На графике видно, что выборочная плотность распределения остатков успешно аппроксимируется нормальным законом распределения, что является признаком адекватности построенной модели.

^ Descriptive Statistics (данные.staj _ joui

Continue... Mean Std.Dv. 1 Minimum 1 Maximum | First I Case Last Case » 1

1 DANNIE 230,299 1 119,97 104,0000 622,0 1 ,ooooool 144,0000 144 ,0000

DANNIE : Feriüdogram vals; 4126,955 pl3503,66 ,0000 151143,3 1 ,000000 73,0000 73 ,0000

DANNIE : Spectral density; 4173,534 11630,41 41,3273 75196,7 1 ,оооооаП 73,0000 73 ,0000

DANNIE : ln(x) 5,5 42 ,44 4,6444 6,4 1 ,000000 144,0000 144 ,0000

Рис. 3. Параметры ряда

Input: DANNIE (данные.йа) - |Р|

Continue... Transformations : In (я) , D (1), D (12) Model: 10,1,1) (0,1,1) Seasonal lag: 12 MS Residual=,00141

Paraioet. Paran. Asynipt. Std.Err. îisynipt. t{ 129) F Lower 95% Conf Upper 95% Conf

q(l> ,377162 ,059313 4,222693 ,□□0045 ,200445 ,553330

Qs¡l> ,572379 ,071139 3,040232 ,000000 ,431529 ,7132?Г]

Рис. 4. Оценка параметров

Г Forecasts.; Model:(0,l,ll[0,l,ll Seasonal laq: 12 faaHHbie.sta] _ |П| x||

Continue... J Input : DANNIE Start of origin: 1 End of origin: 144

СазеЫо. Forecast Lower 90,0000% Upper 90,0000%

1 145 450,1171 422,9655 479,0117

14 6 425,6620 335,5777 453,0341

147 479,5240 441,3696 520,9766

143 432,0412 443,0033 539,1979

149 503,5473 460,4357 561,6374

150 533,0166 524,0264 643,6473

151 66 9,1520 597,3534 743,5742

152 666,4152 531,1003 751,3264

153 557,9930 431,9233 632,3473

154 436,7552 435,3399 566,7696

155 429,6965 374,5207 433,0009

15S 477,1535 413,6613 550,3310

Рис. 5. Прогноз на 12 наблюдений

В ходе работы были рассмотрены особенности авторегрессионых моделей, такие как неизменность динамических временных рядов, при сдвиге времени; понятие об информационной ценности наблюдений; колебания уровней ряда в условиях модификации моделей, понятие о взаимозависимости уровней ряда, оценка адекватности моделей и другие.

® &гаРЬЗ: Роига^ .--'-гг1 - - I □ I X

Рис. 6. Проверка прогноза

Рис. 7. Гистограмма остатков

В работе построены модель Бокса — Дженкинса. Выявлены основные показатели моделей, проверена адекватность и соответствие модели реальному положению.

Библиографический список

1. Хеннан Э. Многомерные временные ряды. М.: Мир, 1974.

2. Лукашин Ю. Адаптивные методы краткосрочного прогнозирования временных рядов. М.: Мир, 2003.

3. Попов А. С. Резервы ресурсосбережения на машиностроительных предприятиях. М.: Финансы и статистика, 2006.

4. Сараев А. Л., Сараев Л. А. К теории структурной модернизации производственных предприятий // Вестник Самарского государственного университета. 2012. № 10(101). С. 160-169.

5. Эренберг А. Анализ и интерпретация статистических данных. М.: Финансы и статистика, 1999.

А.Уы. Тгшоха, А.1. Пута*

MODELING AND ANALYSIS OF DYNAMIC DATA

In this work some characteristics of autoregressive models are viewed, autoregressive integrated model of moving average of Box-Jenkins was used. Retro forecast was made based on this model, most important indicators were calculated, adequacy of model was tested and optimal autoregressive model was chosen.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Key words: dynamic data, autoregressive model, forecast, retro forecast.

* Trusova Alla Yurievna, Ilyina Alla Ivanovna ([email protected]), the Dept. of Mathematics and Business Informatics, Samara State University, Samara, 443011, Russian Federation.

i Надоели баннеры? Вы всегда можете отключить рекламу.