Научная статья на тему 'Прогноз сезонной компоненты экономических временных рядов с учетом детерминированных факторов'

Прогноз сезонной компоненты экономических временных рядов с учетом детерминированных факторов Текст научной статьи по специальности «Математика»

CC BY
774
99
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Губанов Вячеслав Анатольевич

Предложена процедура прогноза экономических временных рядов потоковых показателей, циклические компоненты которых определяются детерминированными факторами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Seasonal Components Forecast of Economic Time Series Taking Into Account Deterministic Factors

A forecasting procedure of flow time series economic indicators is proposed. Time series with seasonal components dependent on deterministic factors are regarded.

Текст научной работы на тему «Прогноз сезонной компоненты экономических временных рядов с учетом детерминированных факторов»

Тубан°в

ПРОГНОЗ СЕЗОННОЙ КОМПОНЕНТЫ ЭКОНОМИЧЕСКИХ ВРЕМЕННЫХ РЯДОВ С УЧЕТОМ ДЕТЕРМИНИРОВАННЫХ ФАКТОРОВ

Введение. Исследование помесячных временных рядов экономических показателей (в дальнейшем экономические временные ряды -ЭВР) в большинстве случаев связано с их декомпозицией на несколько ненаблюдаемых компонент. Среди компонент, на которые раскладывается исходный ЭВР, можно выделить три основных типа - это циклические компоненты, эволюционные и нерегулярные компоненты.

Одной из главных целей любого исследования ЭВР является прогнозирование их динамики на прогнозный интервал времени. Необходимость декомпозиции рядов на несколько компонент связана с тем, что их прогноз формируется по-разному и на разных временных интервалах наблюдения исследуемого показателя. Так, прогноз эволюционных компонент формируется по нескольким уровням актуального последнего интервала времени, т.е. локально (эволюционные компоненты - это локальные переменные). Для прогноза циклических компонент необходимо знание их значений или уровней за несколько периодов. Даже для простейшего линейного прогноза необходимо иметь значения составляющих циклических компонент за два периода [1]. Нерегулярные компоненты, в числе других факторов, определяют точность прогноза.

Одной из наиболее важных циклических компонент считается сезонная циклическая компонента1 с периодом Т равным одному году (для помесячных ЭВР Т = 12 ). Эта компонента определяет внутригодовую динамику показателя и по информативности столь же значима, что и трендовая компонента.

Возникновение сезонной цикличности в каждом конкретном случае ЭВР связано с разными причинами. Внутригодовую динамику определяет ряд факторов, которые формируют «размах» и форму сезонной компоненты по периодам. Под формой сезонных циклов

1 Сезонную циклическую компоненту часто называют «сезонной волной», что методологически неправильно и противоречит физическому понятию волны, как распространяющемуся в пространстве возмущению.

подразумеваются уровни циклической компоненты внутри ее отдельных периодов.

Если форма сезонной компоненты меняется от периода к периоду, то прогноз усложняется и в значительной степени зависит от динамики отдельных циклов (moving seasonality). Все факторы, которые определяют форму циклов сезонной компоненты можно разделить на два типа: детерминированные и неопределенные. Детерминированные факторы - это некоторый временной ряд, динамика которого известна в прошлом и в будущем, причем она существенным образом влияет на динамику сезонной компоненты исходного ЭВР. Неопределенные факторы - это та циклическая компонента временного ряда, динамика которой в будущем неизвестна.

К неопределенным факторам относятся, например, погодные условия. Очевидно, что они влияют на многие экономические показатели, в том числе на объемы производства электроэнергии, объемы производства пищевых продуктов и т.д. Спрос на многие виды продуктов также определяется погодными факторами. Однако, Эдвард Лоренц, еще в 1963 г. показал (см. например, [3]), что среднесрочный прогноз погоды принципиально не возможен с той точностью, которая необходима для прогноза экономических показателей (в метеорологии среднесрочный прогноз составляет несколько недель). Подразумевается, что средняя температура мая выше, чем в апреле, но про уровень осадков в мае по апрельскому уровню еще ничего сказать нельзя. Поэтому такую информацию сложно использовать для детального анализа и прогноза формы циклов анализируемого экономического показателя. Например, ЭВР объемов производства сельскохозяйственной продукции.

Более того, многие экономические и институциональные факторы также не поддаются прогнозу, но влияют на форму сезонных циклов и увеличивают неопределенность их прогноза. Все эти аргументы позволяют говорить о том, что в значительной степени сезонная динамика нам не известна и определяется апостериорно. Поэтому возможен только инерционный тип прогноза.

Существуют случаи, когда динамика сезонной компоненты или ее составляющей известна точно благодаря детерминированным факторам. К таким факторам можно отнести эффект календарного масштаба (календарный эффект) - разное число дней в разных месяцах, эффект разного числа рабочих дней в разные месяцы (working days effect) из-за не одинакового числа выходных в разные месяцы2,

2 Здесь учитывается изменение масштаба месяца только за счет того, что 7 не является делителем числа дней в месяцах, кроме не високосного февраля.

переходящие праздники и каникулы (moving Holidays), високосные годы. В этом случае возникает ряд проблем, которые необходимо решить для корректного учета такого типа сезонных компонент. Постановка задачи. Представим исходный ЭВР - Yt в виде компо-

где t = І ^ n и n - длина ряда, а периоды циклических компонент

Подробно, процедура декомпозиции исходного ряда на тренд и циклические компоненты описана в работе [2].

В разложении (І) отсутствует член соответствующий нерегулярной компоненте. Этот факт связан с тем, что циклы с периодами Т< І2 могут носить (и, в большинстве случаев, носят) спорадический характер и таким образом включают в себя нерегулярную компоненту. При таком представлении нерегулярная компонента оказывается «размазанной» по изменениям формы «коротких» (т < І2) циклов.

Под формой сезонных циклов подразумевается множество со-(t )

ставляющих цикла ck на одном периоде:

Г (т )= c (т) = c (т) (2)

W ~ u(k-І)т+t' ~ uk,t'■> { '

где t = (k - І)т +1’, k = І,...,K - номер цикла, t’ = І,...,T - индекс внутри периода.

Очевидно, что если циклическая компонента «периодическая», то ее

(т)

форма не меняется от периода к периоду и «периодические» ck,t инвариантны к сдвигам на период внутри интервала наблюдения показателя. В этом случае проблем с прогнозом сезонной компоненты не возникает, по-

От )

скольку при прогнозе ck/, просто транслируется на прогнозный период.

В общем случае задача может быть поставлена следующим образом. Пусть имеется ЭВР, уровни которого представляют собой потоковые переменные (flow time series) и который может быть представлен в виде (І). Имеется другой временной ряд, уровни которого известны точно как в прошлом, так и в будущем:

тє G (т = І2,б,4,3,2).

11з

где ^ - детерминированный временной ряд, ^ - тренд детерми-

нированного ряда и ^ А(т)^ - сумма сезонного и «коротких» цик-

тєО

лов (т < 12).

Тренд и циклические компоненты ряда (3) влияют на циклическую компоненту исходного ЭВР (1).

Понятно, что тренд и циклические компоненты ряда У( зависят

от детерминированного ряда ^. Однако на временном интервале

анализа исходного ряда эти зависимости не играют существенной роли, поскольку корректная процедура сезонной корректировки должна реализовывать декомпозицию исходного ряда с учетом всех факторов, включая и детерминированные. При инерционном прогнозе ряда (1) положение существенно меняется.

Естественно предположить, что экстраполяция циклических компонент рассматриваемого ЭВР должна учитывать и те эффекты, о которых информация известна полностью. Например, если известны отклонения в датах проведения праздников или то, что следующий год будет високосным, то эти факторы должны быть включены в прогноз.

Такой учет детерминированных факторов может быть реализован несколькими способами. Простейший способ - это переход от потоковых переменных к моментным переменным. Для сильно агрегированных показателей, которые часто используются для анализа динамики реального сектора экономики, возможен переход от потоковых переменных к моментным переменным (например, для данной задачи переход от месячных объемов производства к среднесуточным объемам). Но при этом, автоматически теряется доля непрерывных производств, среди производств с прерывным циклом.

Во-вторых, возможно моделирование детерминированных факторов, с использованием авторегрессии и скользящего среднего (см., например, [5-7]). Однако вопрос о сопоставимости ряда детерминированных факторов с реальными показателями не обсуждается. Такой подход можно воспринимать как попытки оптимизации сезонной корректировки для определенного типа временных рядов.

В-третьих, стохастическое моделирование детерминированных факторов, которое развито в работе [8] и в некоторых других работах. Последнему упомянутому подходу свойственна определенная исходная противоречивость, поскольку должны быть описаны де-

терминированные факторы на основе вероятностного подхода с присущей вероятности неопределенностью.

Метод перенормировки. В настоящей работе для учета детерминированных факторов предложен метод перенормировки, который позволяет при прогнозе ЭВР с существенным влиянием детерминированных факторов, учесть их и, тем самым, сделать прогноз более определенным. Процедура перенормировки предполагает, что принята аддитивная модель влияния детерминированного фактора (3) на исходный ряд (1).

Основная проблема разделения сезонной циклической компоненты на две составляющие связана с приведением их к такой форме, чтобы уровни обеих составляющих были сопоставимы. Для этого оба ряда натуральных показателей приводятся к форме базисных индексов (некоторый уровень, например первое значение ряда на интервале наблюдения, принимается за единицу). Это первый этап нормирования рядов. Примем, что У( и О( уже рассматриваются в

виде базисных индексов, а не натуральных показателей.

В общем случае циклическая компонента исходного ЭВР зависит от уровней обоих рядов:

с, = с, (У,, о,).

Для того, чтобы избавиться от этой зависимости, предположим, что уровни составляющих циклов линейно зависят только от уровней тренда соответствующего ряда. Тогда, нормировав уровни циклов по уровням

трендов, можно получить нормированные сезонные компоненты С, и АО,, которые не будут зависеть от уровней исходных рядов:

С, = С< / 7,, АО, = АО?2) /О(0). (4)

Теперь нормированные циклические составляющие сопоставимы, и можно отделить сезонную компоненту исходного ряда от детерминированной циклической компоненты.

Нормированная остаточная составляющая исходной циклической

компоненты (К, ) определяется просто как разность между нормированной циклической компонентой исходного ЭВР и нормированной циклической компонентой детерминированной ряда:

К = С, -АО,. (5)

После ренормирования (К, = К, ), получаем составляющую цик-

лической компоненты исходного ряда У,, для которой возможен инер-

ционный прогноз (экстраполяция). Для детерминированной составляющей ^ зависимость от времени на прогнозном периоде известна.

период (прогнозные значения компонент обозначаем верхним индексом /) складывается из инерционного прогноза остаточной ком-

ненты детерминированного ряда. Общий прогноз ЭВР определяется следующим соотношением:

уровни детерминированной составляющей на прогнозном периоде.

Пример прогноза ЭВР. Рассмотрим характерный случай учета календарной составляющей при инерционном постпрогнозе ЭВР в виде базисных индексов объемов добычи нефти. Особенность этого ряда заключается в том, что его сезонная компонента в значительной степени определяется календарем, т. е. флуктуации месячных объемов добычи нефти должны быть пропорциональны флуктуациям числа дней от месяца к месяцу.

Ряд состоит из 61 точки (5Т +1) и охватывает период времени с декабря 1999 г. по декабрь 2004 г. На этом временном интервале было два високосных года - 2000 и 2004 годы. На рис. 1 показаны исходный ряд базисных индексов, тренд и сезонная компонента. Уже из графика сезонной компоненты хорошо заметны «отрицательные» выбросы в февралях, которые уменьшают месячную добычу пропорционально уменьшению числа дней в месяце. Разница в один день между февралем високосного и обычного года дает изменение в амплитуде «выброса» в обычный год и високосный около АС = 13% в предположении линейного изменения тренда за год:

Теперь прогноз циклической компоненты С,^) на прогнозный

поненты

(г )

Щ и ренормированных значений циклической компо-

- ренормированные

- инерционный

(6)

0.06

0.04

0.02

0

-0.02

-0.04

-0.06

-0.08

-0.1

-0.12

Исходный ЭВР

-Тренд

-Календарные циклы

Рис.1. Исходный ряд базовых индексов объемов добычи нефти и его тренд (левая шкала), сезонная компонента (правая шкала).

Объем добычи нефти в декабре 1999 г. соответствует единице

Как уже упоминалось, календарная циклическая компонента будет зависеть от уровней тренда исходного ряда:

О,, = о( 7), (7)

причем с изменением тренда отклонение от среднего числа дней в месяце будет сказываться пропорционально значениям тренда (линейное приближение).

График детерминированного ряда - базисные индексы календарной составляющей циклической компоненты, ее тренд и сама циклическая компонента показаны на рис. 2. Число дней в декабре принято за единицу.

1.02

1

0.98

0.96

0.94

0.92

0.9

0.88

0.86

0.84

0.04

0.02

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0

-0.02

-0.04

-0.06

-0.08

-0.1

& Ф ф"

-Календарный ряд

& <? & <$? ф" & ф ^»Тренд Календарные циклы

Рис.2. Базисные индексы календарного ряда (числа дней в месяце), его тренд (левая шкала), циклическая компонента (правая шкала)

Некоторое отклонение от среднего индекса в начале и в конце интервала наблюдения ряда (порядка сотых долей процента) связано со скачками числа дней в февралях високосных годов и реакцией на них оператора сезонной корректировки [8].

Выбор интервала анализа 2000-2003 гг. и прогнозного периода -2004 г. обусловлен следующим эффектом. При инерционном прогнозе циклической компоненты базисного индекса объемов добычи нефти должен проявиться очевидный дефект прогноза - увеличение амплитуды «отрицательного выброса» базисного индекса в феврале 2004 г. В более точном (реальном) прогнозе амплитуда февральского выброса должна уменьшиться, поскольку 2004 г. - високосный. Учет детерминированной составляющей циклической компоненты должен привести к повышению уровня базисного индекса в високосном феврале и, следовательно, к увеличению точности прогноза.

Рассмотрим два варианта прогноза циклической компоненты ЭВР, приведенного на рис.1, без учета детерминированного календарного ряда и с учетом календарного ряда, изображенного на рис. 2. В качестве базы прогноза циклической компоненты ЭВР используются данные за 2001 и 2003 гг., база прогноза тренда состоит из нескольких последних данных за 2003 год. Прогноз тренда исходного ЭВР реализован на основе полиномиальной регрессии [1].

После проведения нормирования циклической компоненты С, и

циклической компоненты календарного (детерминированного) ряда легко получить нормированный ряд остаточной составляющей. Для сравнения, на рис. 3 показана нормированная календарная составляющая и нормированная остаточная составляющая, которая, на первый взгляд, должна быть значительно меньше5, чем календарная. Тем не менее, это не так. По порядку величины она сравнима с календарной составляющей и связана, скорее всего с технологическими проблемами, возникающими в нефтедобыче в связи с климатическими условиями - циклический спад добычи в зимние месяцы.

Из рис. 4 отчетливо виден дефект инерционного прогноза без учета календарных факторов в феврале високосного года. Полностью прогноз индексов объемов добычи нефти с учетом детерминированных (календарных) факторов в сравнении с исходным ЭВР показан на рис. 5. Максимальное отклонение прогнозных значений от уровней реального ряда не превышает 1,2% от истинного значения показателя, а среднее - менее 0,6%. При использовании инерцион-

3 Поскольку в рассматриваемой модели ряда короткие циклы не учитываются, то, ин-

туитивно, кажется, что именно они определяют остаточную составляющую.

ного прогноза максимальная ошибка превышает 2%, а средняя также в полтора раза больше.

Рис. 3. Нормированные календарные циклы и нормированная остаточная составляющая на временной базе прогноза

Прогноз циклических компонент на 2004 г. показан на рис. 4. Показаны реальный цикл за прогнозный период, когда декомпозиция ряда осуществлялась на интервале анализа 2000-2004 г., инерционный прогноз циклической компоненты с базой прогноза 2000-2003 г. и прогноз цикла с учетом календарной (детерминированной) составляющей.

0.06 -0.04 -0.02 -0

-0.02 --0.04 --0.06 -0.08 --0.1 --0.12 --0.14

янв.04 фев.04 мар.04 апр.04 май.04июн.04июл.04 авг.04 сен.04 окт.04 ноя.04 дек.04

--------Реальный цикл

прогноз цикла Прогноз цикла с учетом календарного ряда

Рис. 4. Реальный цикл на прогнозном периоде и два типа прогноза

1.55 -г-

і---------------------------------------------------------------------------г--------------------------------------------------------------------------1

Прогноз ряда ----------Исходный ЭВР

Рис. 5. Прогноз базисных индексов объемов добычи нефти за 2004 г. с учетом календарных факторов и реальные уровни временного ряда

Таким образом, учет детерминированных факторов позволяет существенно улучшить качество прогноза и учесть характерные особенности циклической компоненты ЭВР.

Заключение. Точность декомпозиции ЭВР на ненаблюдаемые компоненты определяется только самой процедурой сезонной корректировки и выделения тренда [2]. При корректном подходе циклическая компонента исходного ЭВР должна включать в себя все циклические изменения показателя, включая календарные эффекты и переменное значение числа рабочих дней от месяца к месяцу.

Учет детерминированной составляющей важен только при прогнозе ЭВР и позволяет существенно его улучшить, поскольку известная часть циклической компоненты фактически не требует определения прогнозных значений.

Операторы выделения сезонной компоненты и тренда из исходного ряда и детерминированного ряда должны быть одним и тем же (должна использоваться одна и та же модель временного ряда). Использование разных моделей [7] ведет к увеличению неопределенности прогноза и к потере его точности. В данной работе использовалась процедура выделения циклических компонент ЭВР, основанная на вариационных принципах [1, 2]. Неопределенность соотнесения изменений исходного ряда к циклическим компонентам или к тренду определялась функционалом качества. Наибольшее значение методы учета детерминированной и календарной составляющей имеют для рядов производства промышленной продукции, а также при прогнозе продаж крупных розничный сетей.

Литература и информационные источники

1. Губанов В.А. Оценка и прогноз конъюнктурных циклов в трендах экономических временных рядов //Научные труды ИНП РАН/Гл. ред. А.Г. Коровкин. М.: МАКС Пресс, 2006.

2. Губанов В.А. Выделение тренда из временных рядов макроэкономических показателей. Научные труды: Институт народнохозяйственного прогнозирования РАН / Гл. ред. А.Г. Коровкин. М.: МАКС Пресс, 2004.

3. Кроновер Р.М. Фракталы и хаос в динамических системах. Основы теории. М.: По-стмаркет, 2000.

4. Hillmer, S.C. Forecasting Time Series with Trading Day Variation. Journal of Forecasting, 1 (1982).

5. Bell W.R. Seasonal decomposition of deterministic effects. Research Report 84/01, Bureau of the Census, Washington, DC, Statistical Research Division, 1984.

6. Bell W.R. Correction to “Seasonal decomposition of deterministic effects”. Research Report 95/01, Bureau of the Census, Washington, DC, Statistical Research Division, 1995.

7. Bell W.R., Martin D.E.K. Modeling Time-Varying Trading-Day Effects in Monthly Time Series. http://www.census.gov/srd/www/sapaper/jsm2004dem_abs.html

8. Dagum, E.B., Quenneville, B. and Sutradhan, B. Trading-Day Variations Multiple Regression Model with Random Parameters, International Statistical Review, 60 (1992).

i Надоели баннеры? Вы всегда можете отключить рекламу.