Вестник УМО
Образование
С
Афанасьев Владимир Николаевич
доктор экономических наук, профессор, заведующий кафедрой статистики и эконометрики ГОУ ВПО «Оренбургский государственный университет»
Тел.: (3532) 37-24-73 E-mail: [email protected]
Любчич
Вячеслав Владимирович
аспирант кафедры статистики и эконометрики ГОУ ВПО «Оренбургский государственный университет»
Тел.: +7 919 845-59-05 E-mail: [email protected]
Статья направлена на развитие методологических аспектов статистического исследования временных рядов в контексте современных научных работ и программного обеспечения. Представлен ряд ценных принципов исследования временных рядов; описаны и апробированы методы, рекомендуемые для внедрения в отечественную методологию: двувходовое объединение, вейвлет-анализ, изучение коинтеграции, причинности и другие. Рассмотрены теоретические и практические аспекты выбора наилучшего метода прогнозирования.
Ключевые слова: временные ряды, методология, прогнозирование, двувходовое объединение, синхронность, причинность.
К методологии статистического исследования временных рядов
Развитие современного общества сопровождается ростом всевозможных банков и баз данных, расширением информационного пространства, усилением роли знаний и информации, методов и результатов ее анализа в деятельности человека. Особую важность для государственных органов и частных компаний приобретает исследование временных рядов экономических показателей и их прогнозирование. Анализ разнообразных экономических данных, представленных в виде временных рядов, является необходимой составной частью современных исследований в области макроэкономической динамики, переходной экономики, эконометрики финансовых рынков.
С целью получения адекватных результатов анализа экономических процессов необходим учет временной структуры данных, то есть применение статистической методологии, специально разработанной для исследования временных рядов. Следует иметь в виду, что элементы рассмотренной методологии существуют, но имеются некоторые моменты, которые требуют дальнейшей интерпретации и апробации в новых условиях.
Во-первых, это обусловлено стремлением исследователей при помощи статистических методов понять сущность наблюдаемых явлений и процессов, выявить скрытые взаимосвязи, то есть приблизиться к причинному пониманию социально-экономических систем.
Во-вторых, необходимость развития методологических аспектов анализа временных рядов диктуется новейшими положениями экономической теории и практики, когда старые методы уже не подходят для анализа результатов нового качества.
В-третьих, развитие требуется методологическим аспектам, связанным с исследованием не так давно открытых свойств динамики: инте-грированности, коинтеграции, переменной волатильности.
В-четвертых, имеющиеся противоречивые подходы в отечественной и зарубежной методологии исследования временных рядов преуменьшают ценность российских исследований в глазах заграничных коллег. Следует отметить, что в российской литературе отсутствуют специальные работы, направленные на сравнительную оценку методов анализа, на описание деталей методов, современных статистических программных продуктов, разрабатываемых за рубежом. Поэтому является актуальным исследование, направленное на получение обоснованной характеристики зарубежных методов и аспектов их применения. Исследованию временных рядов уделяется достаточно много внимания в отечественных и зарубежных работах. Основные отечественные тру-
To the methodology of statistical time series analysis
Vladimir N. Afanasiev
doctor of economics, professor, manager of Statistics and Econometrics department, Orenburg State University
Тel.: (3532) 37-24-73 E-mail: [email protected].
Vyacheslav V. Lyubchich
postgraduate student, Statistics and Econometrics department, Orenburg State University,
Тel.: 8-919-845-59-05 E-mail: [email protected]
This paper focuses at the problem of statistical time series analysis aspects improvement in the context of present scientific works and software. Valuable principles of time series analysis are presented. It is shown, how the methods, recommended for integration into the Russian methodology can be used: two-way joining, wavelet analysis, investigation of cointegration, causality, etc. Also, the theoretical and practical aspects of choosing the best forecasting method are described.
Key words: time series, methodology, forecasting, two-way joining, synchronism, causality.
ды по методологии анализа временных рядов принадлежат С. В. Арженовскому, В.Н. Афанасьеву, В.В. Витязеву, А.Г. Гранбергу, В.В. Глинскому, Т.А. Дубровой, И.И. Елисеевой, И.Б. Загайтову, М.С. Каяйкиной, Г.С. Кильдишеву, Н.Д. Кондратьеву, С.В. Куры-шевой, Ю.П. Лукашину, А.И. Маннеле, И.Н. Молчанову, Н.А. Садовниковой, А.А. Френкелю, С.Л. Чернышеву, Е.М. Четыркину, Е.П. Чуракову, Р.А. Шмойловой, М.М. Юз-башеву.
Среди зарубежных авторов, занимающихся методологией анализа временных рядов, могут быть выделены С. Армстронг (S. Armstrong), Дж. Бокс (G. Box), Д. Бриллинджер (D. Brillinger), Т. Боллерслев (T. Bollerslev), Дж. Гамильтон (J. Hamilton), Ф. Дайболд (F. Diebold), Дж. Дарбин (J. Durbin), Г. Дженкинс (G. Jenkins), Д. Дики (D. Dickey), Р. Калман (R. Kalman), М. Кен-далл (M. Kendall), Л. Килиан (L. Kilian), Д. Кохрейн (D. Cochrane), Р. Отнес (R. Otnes), Д. Поллок (D. Pollock), Д. Стоффер (D. Stoffer), А. Стьюарт (A. Stuart), А. Тейлор (A. Taylor), Р. Тсэй (R. Tsay), В. Фуллер (W. Fuller), М. Хатанака (M. Hatanaka), Д. Хейс (D. Heise), Э. Хеннан (E. Hannan), К. Хольт (C. Holt), К. Четфилд (C. Chatfield), Р. Шум-вэй (R. Shumway), В. Эндерс (W. Enders), Л. Эноксон (L. Enokson) и другие.
Особо отмечают Р. Фриша (R. Frisch) и Я. Тинбергена (J. Tinbergen) в связи с тем, что в 1969 г. за разработку прикладных динамических моделей для анализа экономических процессов им была присуждена премия Шведского государственного банка по экономическим наукам памяти А. Нобеля. В 2003 г. данной премии были удостоены К. Грэнджер (C. Granger) и Р. Ингл (R. Engle). К. Грэнджер — за методы анализа экономических временных рядов с общими трендами (коинтеграцией); Р. Ингл — за методы анализа экономических временных рядов с меняющейся волатильностью (модели авторегрессии с условной гетеро-скедастичностью).
Необходимым пунктом в реализации задачи развития методологии и апробации результатов является наличие современного программного обеспечения для проведения расчетов. Многообразие статистических программных продуктов (по официальным данным Международного статистического института, их число приближается к тысяче) требует их классификации для обеспечения удобств в выборе программы.
Проведенный анализ в данной области позволил выделить следующие группы программ для анализа временных рядов (рис. 1).
Программы для иследования временных рядов
По удобству интерфейса
• с графическим интерфейсом
• с интерфейсом основанным на командном языке
• сочетающие оба типа интерфейса
По необходимости оплаты
бесплатные
условно бесплатные
платные
Рис. 1 Классификация прикладных программных продуктов
По области применения
• общего предназначения
• узкого назначения
• для подбора кривых и моделирования
• для проведения наблюдений и измерений
• рабочие листы и встраиваемые модули для MS Excel
• языки
программирования
• другие программы
Рис. 2 Динамика производства цельномолочной продукции в Оренбургской области (в пересчете на молоко)
Наиболее важными характеристиками для выбора программы являются:
• наличие широкого ассортимента встроенных функций для анализа временных рядов;
• удобный пользовательский интерфейс;
• возможность написания собственных команд;
• ценовая доступность для пользователя. Новейшие обновления программ от версии к версии оперативно добавляют в их базовые функции новые разработки методологии анализа.
В зарубежной практике сформирован ряд ценных принципов исследования временных рядов:
1) обязательное предварительное изучение графика и коррелограммы исходного временного ряда. Следует уделить особое внимание выбору нулевых точек, масштаба, типа шкалы, отображению асимптот, трендов, подписей значений, а также наложению различных графиков для повышения их аналитических свойств;
2) использование формализованного тестирования для определения характеристик временного ряда, если вид графика не позволяет сделать однозначные выводы. Например, значительная колеблемость или медленное затухание выборочной автокорреляционной функции затрудняют исследование стационарности. Поэтому применяются формализованные тесты и критерии;
3) верификация использованного метода или модели на данных, не участвовавших в их спецификации и идентификации. Так как основной целью моделирования является получение на базе имеющейся информации интерпретируемой модели какого-либо экономического процесса, отражение присущих связей, а целью прогнозирования — получение
прогноза с помощью экономической модели или более абстрактных расчетных процедур, то используемые в анализе данные рассматриваются лишь как средство в достижении этих целей. Таким образом, важным является не доскональное описание и приближение к данным выборки, а оценка общих закономерностей генеральной совокупности. Поэтому сравниваемые методы прогнозирования должны использовать лишь историческую информацию анализируемого массива данных, не выходя за его пределы.
Использование данных принципов нацелено на совершенствование исследования временных рядов, обеспечение как визуального, так и формализованного изучения характера динамики процесса; сопоставимость результатов различных исследований одного и того же объекта.
Наиболее полно разработана методология статистического анализа одномерного временного ряда, однако и здесь существуют аспекты, требующие дополнительного рассмотрения. Дополнительные возможности анализа рассмотрим на примере динамики производства молока в Оренбургской области, представленной на рис. 2.
Так как график на рис. 2 не дает однозначного ответа на вопрос о наличии сезонности или тенденции, то следующим шагом является исследование коррелограммы временного ряда (рис. 3).
АС РАС а^Ы РтоЬ
Коррелограмма временного ряда производства цельномолочной продукции в Оренбургской области (в пересчете на молоко) с января 1995 г. по декабрь 2004 г.
1 0.577
О.К*
0/161 0.360
о.гя <ша
е й.аб4 0 0,199
10 О.че ц пса
12 О.Пб и 0.031
и -О.М5 Л -0.1Й I» -0.1М
17 -0.1К 10 -0.30* 14 -О.320
А1Р 2? -0,162 2* -0.209 /4 -О.ЗМ
Си&ГТ 0.5*0 0£ЙЗ О.ОЯ) ■0.113 -0.1 И
олгт
0.203 ■0022 ■ОЛИ
-о.т
-0.1« ■0001 -о.юг о.оат
ЩИО
■0,113
■оом о.вд о.1а
■0067
■ооя
101.57
165,11 131,57 1ЭДН 1*5.» 305.11) 210,32 213.23 2ЧЛ4 2Ш4 21 н.&г
21-0,51 ЛШ 3№.№
223.90
220.90 ЯП*
24i.es 240.66 255.Л НТ.ЙА
0000 С'.СОЗ ода о.ооо оооо &ЙЙ ода ода оооо олоо ода ода ода
Ш)
ода ода ода оооо
ОЛИ
ода ода оооо оооо ода
Важным и очевидным выводом, следующим из рис. 3, является заключение об отсутствии выраженной сезонности производства цельномолочной продукции, так как коэффициент автокорреляции при лаге 12 месяцев составляет лишь 0,116, а коэффициент частной корреляции — 0,019.
Характер убывания функций свидетельствует о возможной стационарности ряда и применимости методологии Бокса-Дженкинса для его описания.
Однако представленные коэффициенты отражают тесноту линейной взаимосвязи между последовательными значениями временного ряда. Для визуального поиска возможных нелинейных зависимостей рекомендуется использовать матрицы полигонов распределения данного вида.
На рис. 4 представлены распределения лаговых значений производства цельномолочной продукции, в зависимости от текущих значений.
На рис. 4 отмечается увеличение рассеяния с ростом лага и уменьшением линейного коэффициента парной корреляции (г). Нелинейные зависимости в данном случае не прослеживаются, что облегчает труд исследователя при дальнейшей спецификации модели. Значения тестовой статистики, представленные в табл. 1, подтверждают отсутствие единичного корня на уровне значимости 5%. Нулевая гипотеза о наличии единичного корня отвергается в пользу альтернативной, так как статистика АЭБ-теста меньше (лежит левее) соответствующего критического значения.
Таблица 1
ADF-тест уровней временного ряда производства молока в Оренбургской области с января 1995 г. по декабрь 2004 г.
Статистика Вероятность
Статистика ADF-теста -3,328987 0,0157
Критические значения: 1,0% -3,486551
5,0% -2,886074
10,0% -2,579931
Следовательно, параметр d в модели АЯ1МА(р^^) равен нулю. Значения остальных параметров установлены, исходя из поведения корреляционных функций: р=2, q=0. То есть мы имеем дело с реализацией процесса АЯ(2):
После оценки коэффициентов получена модель динамики производства цельномолочной продукции в Оренбургской области, статистически значимая с вероятностью 95%:
х( = 867,04 + 0,47*м + 0,30х,_2 (2)
Важным этапом анализа является определение устойчивости полученной модели во времени, для чего строится динамический ряд ее коэффициентов. Коэффициенты модели (2), полученные на двухлетних скользящих периодах, представлены на рис. 5.
Матрица лаговых зависимостей динамики производства цельномолочной продукции в Оренбургской области
Скользящие коэффициенты модели AR(2) динамики производства молока в Оренбургской области
■о,! ■
1995-1 ИВ 1И»1ИТ ШГ-1НВ 1&ЭВ1Й9Э I »»9-2000 2000-2001 МС1-2002 2К12.ННН ННВДНМ
Из рис. 5 следует, что коэффициенты модели указанной спецификации претерпевали значительные изменения в изучаемом периоде, но после 1999 г. зависимости вида ЛЯ(2) стали укрепляться, в связи с этим колебания значительно сократились, а скользящие значения стали близки к коэффициентам общей модели (0,47 и 0,30 соответственно).
Использование спектральных характеристик временного ряда позволяет получить информацию, незаметную при временном представлении. Если характеристи-
ки колебаний меняются со временем (эволюционирующая сезонность, квазициклическая колеблемость), то вместо обычного преобразования Фурье и оконного преобразования Фурье рекомендуется использовать более продвинутый метод — вейвлет-анализ. В оконном преобразовании Фурье размер окна выбирается единожды: узкое окно обеспечивает лучшее временное представление, а широкое — частотное. Вейвлет-преобразование решает эту проблему с помощью кратномасштабного анализа: временной ряд анализируется на различных частотах и раз-
личном разрешении одновременно, что особенно эффективно позволяет выделить высокочастотные компоненты короткой длительности с протяженными низкочастотными компонентами, с локализацией их на временной оси. Результаты вейвлет-анализа динамики производства молока в Оренбургской области представлены на рис. 6.
ИЯ> Результаты вейвлет-анализа динамики производства молока в Оренбургской области в 1995-2004 гг.
• . • А .
1 ^ " 1 ' ^г
Я ig W N П И С а ь il -:ь-14l -xi hi -Сшшмйлт»*
На рис. 6 с помощью различных оттенков показаны коэффициенты совпадения формы вейвлета с фактической динамикой процесса на различных уровнях частот и временных отрезках одновременно. Выделяются колебания периодичностью около 15 месяцев на временном промежутке от 10-го по 40-й месяцы; затем приоритетными становятся низкочастотные колебания (около 6 месяцев); после 73-го месяца вновь обнаруживаются колебания более высоких периодичностей.
Одним из информативных методов
анализа многомерных временных рядов является выявление синхронности их колебаний. Для этого определяются отклонения от трендов, а затем находятся парные коэффициенты корреляции отклонений. Чем ближе найденный коэффициент к 1, тем большая синхронность наблюдается в колебаниях; чем ближе его значение к -1, тем сильнее асинхронность колебаний; при значениях, близких к нулю, связь отсутствует.
В целях дальнейшего развития методологии изучения синхронности колеба-
ний временных рядов авторы предложили и апробировали использование двувходового объединения для выделения из исследуемой совокупности групп объектов с синхронными и асинхронными колебаниями.
Двувходовое объединение — один из методов кластерного анализа, учитывающий при формировании групп одинаковую важность как наблюдений, так и переменных. Его применение к матрице парных коэффициентов корреляции позволяет объединить объекты, используя как информацию по строкам, так и по столбцам.
На рис. 7 представлены результаты анализа динамики урожайности пшеницы в 1961-2007 гг. в 17 странах (обозначения стран даны в соответствии с кодами ISO 3166).
На рис. 7 выделяется кластер из четырех стран (Китай, Германия, Нидерланды и Великобритания) с синхронными колебаниями урожайности. К ним очень близка Франция, но ее синхронность с Китаем слаба (0,2). Колебания урожайности пшеницы выделенного кластера асинхронны с Россией, Канадой и африканскими государствами (Кенией, ЮАР и Эфиопией). Это позволяет развивать выгодное сотрудничество между странами.
Второй кластер — это Польша и Венгрия. Производство пшеницы здесь также асинхронно со странами с других континентов, но более или менее синхронно с Францией и Россией.
Именно асинхронность колебаний производства между странами позволяет взаимовыгодно экспортировать зерно из стран с относительно высоким урожаем в страны с относительно низким в текущем году урожаем. Перераспределение продовольственных запасов в соответствии с данным принципом способствует снижению социальной напряженности, рассма-
• Результаты двувходового объединения коэффициентов парной корреляции колебаний урожайности пшеницы
АИЗ РКА йиЗ НО САМ СИМ N10 МЕХ
Р01 КЁМ ВЙА И5А ИиМ ЕТН ОЁ^ ОЙЙ
1
О,Б 0,6 0,4 О,г о
-о,г -о.-ч
тривается как инструмент диверсификации, обеспечения продовольственной безопасности и борьбы с голодом.
Изучение синхронности колебаний основано на сопоставлении силы и направленности колебаний во временных рядах, качественные зависимости между которыми могут и не прослеживаться. Если же качественный анализ указывает на наличие зависимостей, то применяются иные методы, в том числе, исследование коинтегра-ции временных рядов.
Под коинтеграцией понимается зависимость в уровнях двух (или более) временных рядов, которая выражается в совпадении или противоположной направленности их тенденций и случайной колеблемости [1, с. 447]. Однако имеются случаи, когда временные ряды имеют одинаковое поведение только при импульсах некоторого конкретного типа. Следовательно, если временной ряд устойчив к снижению, то его реакция на негативные изменения не будет симметрична реакции на положительные скачки. Например, розничные цены на бензин в Российской Федерации растут при повышении цены на нефть, в то время как снижение последней не обеспечивает аналогичного падения цен на бензин. В то время как подобные экономические временные ряды могут быть не-коинтегрированными, в их компонентах может быть заключена важная информация, необходимая для понимания их динамических взаимосвязей. Данная информация
упускается обычной теорией коинтеграции, но учитывается при изучении коинтеграции компонентов данных, то есть скрытой коинтеграции.
Указанный метод является источником большого объема дополнительной информации о динамике временных рядов, инструментом оценки долговременных взаимосвязей между некоинтегрированными нестационарными временными рядами. Тем не менее, скрытая коинте-грация незаслуженно игнорируется отечественными статистиками.
Если рассматривать взаимосвязи между интегрированными накопленными положительными ( У е< и \ Г1 )
и отрицательными (
и >Л, ) случайными
возмущениями временных рядов
(3)
(4)
У, = У;_, +Л, = 70 + = 70 + + 2Х то возможны следующие основные варианты [2, с. 8].
1Ни -ни и
(1,-к) — коинтеграционный вектор величин
не яв-
зи ^ ,и ^
коинте-
грированы, но с различными коинтеграционными векторами. Временные ряды Xt и Yt хотя и имеют общие положительные и отрицательные возмущения, но общие возмущения некоинтегрированны.
коинте-
Л,7
ляются коинтегрированными. Из этого следует, что Xt и Yt также некоинтегрированны, то есть имеют различные стохастические тренды.
I ( 1 ( 1 /
2. Или
коинтегрированы, но не одновременно. Следовательно, Xt и Yt имеют общие либо позитивные, либо негативные колебания. Xt и Yt в данном случае все еще не являются ко-интегрированными, но из структуры их взаимосвязи можно извлечь больше информации, чем в первом случае. Эти сведения о скрытых коинтеграционных связях не используются, если исследователь заинтересован лишь коинте-грацией между Xt и Yt.
и — белый шум.
Модели (5) и (6) являются более общими, чем обычные модели корректировки ошибок, так как накладывают меньше ограничений на свои коэффициенты. При этом они сохраняют свойства данного класса моделей, за исключением того факта, что показывают долговременные равновесные взаимосвязи и кратковременную динамику нестационарных компонентов, а не самих временных рядов.
Таким образом раскрывается «иерархия» явления коинтеграции: стандартная коинтеграция является частным случаем скрытой коинтеграции, в то время как скрытая коинтеграция является простым примером нелинейной коинтеграции (рис. 8).
грированы с одинаковыми коинтеграционными векторами. В данном случае присутствует один общий импульс. Это интерпретируется как наличие общего стохастического тренда для Xt и Yt, отвечающего за их долговременное поведение в динамике. В данном случае ряды Xt и Yt являются коинтегрированными.
Данные варианты связи, представленные К. Грэн-джером, показывают, насколько специфичным явлением является коинтеграция. Обычная коинтеграция между временными рядами наблюдается лишь в четвертом случае, однако в первых трех случаях степень ее отсутствия различна. Если уделять внимание лишь четвертому случаю, то теряется множество ценной информации.
Для случая скрытой коинтеграции К. Грэнджер предложил модель корректировки ошибок, которая для третьего варианта зависимости имеет вид [2, с. 12]:
и
щ =ь0+ь1{х;_1-у,:1У-ь2(^;_, -кг^У^^ыЛК.Ах^лг,:^, (6) где 1а&(&х;_,, Л , М7,, Л Г,) —добавочные регрессоры с различными лагами;
(1,-1) — коинтеграционный вектор величн
«Иерархия» коинтеграции
Теоретически использование коинтеграционных отношений в моделировании и прогнозировании более предпочтительно, так как модели специфицируются в исходных уровнях временных рядов, в результате чего сохраняется информация о долгосрочной взаимосвязи, не нарушаются положения экономической теории. Однако на реальных данных точность таких прогнозов не всегда превосходит другие методы.
Другая разработка К. Грэнджера — концепция причинности — сфокусирована на измерениях во времени и на их влиянии друг на друга. Идея этой причинности в том, как настоящее и прошлое влияют на дальнейшее развитие. Рост доступности детальных статистических данных открывает большие возможности для данного подхода.
Вестник УМО
Образование
Причинная модель динамики инвестиций в Российской Федерации строилась впервые. Для этого использовались следующие ежемесячные показатели за период с 02.1994 г. по 12.2007 г.:
Y — индекс реальных инвестиций в основной капитал, % к предыдущему периоду;
Х1 — индекс реального объема промышленного производства, % к предыдущему периоду;
Х2 — среднемесячная величина денежного агрегата М2 в ценах декабря 2007 г., млрд. руб.;
Х3 — среднемесячный официальный курс доллара, руб./долл.;
Х4 — среднемесячная задолженность предприятий в бюджет в ценах декабря 2007 г., млрд. руб.;
Х5 — индекс цен на строительно-монтажные работы, % к предыдущему периоду;
Х6 — индекс потребительских цен, % к предыдущему периоду;
Х7 — индекс промышленного производства в электроэнергетике, % к предыдущему периоду;
Х8 — индекс промышленного производства в газовой промышленности, % к предыдущему периоду;
Х9 — индекс промышленного производства в нефтедобывающей промышленности, % к предыдущему периоду.
Дисперсионный анализ на уровне значимости 0,05 показал отсутствие сезонности лишь во временных рядах Х5 и Хб; с этой же вероятностью АББ-тест подтвердил наличие единичного корня в скорректированных на сезонность временных рядах Х2(эа), Хз(эа), Х4^а). После корректировки исходных значений на сезонные колебания (процедура «Х-11») и стохастический тренд (взятие первых разностей) оценивалась распределенная во времени корреляционная взаимосвязь между факторными и результативным показателями (табл. 2).
Коэффициенты корреляции между текущими значениями Y(sa) и лаговыми значениями факторных признаков, статистически значимые на уровне 5% (в скобках указана величина лага !)
Таблица•
Х6,Н Х7М, 1-1 X8(sa),t-l Х9М,Ы
X1(sa),t-l D(X2(sa)),t-l D(Xз(sa)),t-l D(X4(sa)), 1-1 Х5,1-1
- 0,17(1) - 0,17(1) -0,16(0) -0,19(4) 0,26(1)
0,22(2) 0,22(2) - 0,17(3)
- 0,19(3) - 0,19(3) 0,22(7)
0,27(5) 0,27(5) - 0,17(9)
0,20(8) 0,20(8) 0,25(10)
- 0,23(10) - 0,23(10)
0,20(11) 0,20(11)
Y(sa)t
0,20(0)
Максимальные значения лагов ! использовались в тесте К. Грэнджера на наличие причинности (табл. 3).
Результаты поиска причинности К. Грэнджера между результативной и факторными переменными
Нулевая гипотеза Мак. лаг F-статистика Вероятность
Х1(5а) не является Грэнджерпричиной Y(sa) 11 2,719 0,003
Y(sa) не является Грэнджер-причиной Х1(5а) 0,892 0,550
0(Х2(за» не является Грэнджер-причиной Y(sa) 1,977 0,031
Y(sa) не является Грэнджер-причиной D(X2(Sa)) 12 0,416 0,955
0(Х3(5а)) не является Грэнджер-причиной Y(sa) 2 4,287 0,015
Y(sa) не является Грэнджер-причиной D(X3(sa)) 0,671 0,512
D(X4(sa)) не является Грэнджер-причиной Y(sa) Л 1,979 0,101
Y(sa) не является Грэнджер-причиной D(X4(sa)) 4 0,373 0,827
Х5 не является Грэнджер-причиной Y(sa) 10 3,164 0,001
Y(sa) не является Грэнджер-причиной Х5 2,458 0,010
X9(sa) не является Грэнджер-причиной Y(sa) Y(sa) не является Грэнджер-причиной X9(sa)
0,754
0,472
0,545
0,581
Данные табл. 3 с вероятностью 95% подтверждают, что между временными рядами Х1(за) и У(эа); Б(Х2^а)) и У(эа); Б(Х3^а)) и У^а) существует односторонняя причинная связь по направлению к У(эа), а между временными рядами Х5 и У(эа) присутствует двусторонняя причинная зависимость. Причинной взаимосвязи между Х5 и другими факторами не выявлено.
В процессе спецификации проведено объединение лаговых значений экзогенных переменных в отдельные факторы, что позволило предвосхитить появление муль-тиколлинеарности переменных:
— среднемесячный процент роста реального объема промышленного производства в предшествующие три месяца сформировал фактор Б1:
х = 0,749FU + 0,002F2 í - 0,965£>(гз(га)) -X5;í = 8,237 - 0,123^ - 0,928^ >
+ 0,292X5t_l + St + elt t- 0,928^- 0,774£2>m + e2>í
(9)
(8)
F\,t ~ (,s-),)-l (,ra),í-2 (ía),í-3 (7)
— лаговые приросты денежного агрегата М2 образовали фактор F2:
Fu = D(X2(ja) ]_5 + D{X2(sa) )7 + D{X2isa) J_g + D^2(sa) )_9+D{X2(sa))i2
В результате спецификации зависимости X5 от Y в виде парной линейной регрессии с ошибками, имеющими структуру ARMA(1,1), получена система с обратной связью:
где .Я'— средний показатель аддитивной сезонности для
г -
соответствующего месяца, г =1,12
— ошибки, отклонения реальных значений от теоретических. 8 8
1 и 2 — ошибки, отклонения реальных значений от теоретических.
С вероятностью 95% все коэффициенты модели являются статистически значимыми, а остатки имеют нормальное распределение.
Выявленные взаимосвязи представляют собой: ^ влияние среднемесячного процента роста реального объема промышленного производства в предшествующие три месяца на индекс реальных инвестиций в текущем периоде. Экономически данное влияние является полностью обоснованным: когда повышается выпуск, немедленно возникает потребность в новом капитальном оборудовании. Данное оборудование приобретается за счет имеющейся дополнительной нераспределенной прибыли, полученной от увеличения объема производства. То есть уже имеются свободные ликвидные средства, что по-
2
Вестник УМО
Образование
зволяет осуществить необходимую оплату без задержек с получением кредита или реализацией свободных неликвидных активов. Причем установка нового оборудования не будет отложена из-за необходимости демонтировать старое, чем объясняется достаточно короткий временной лаг. Из модели (9) следует, что увеличение среднемесячного роста объема производства на 1 п. п. (процентный пункт) приведет к росту индекса инвестиций в основной капитал в среднем на 0,749 п. п.;
^ влияние роста денежной массы
страны на индекс реальных инвестиций в основной капитал. Данная связь также объясняется экономически: увеличение объема доступных денежных средств позволяет направить их на инвестирование. Из первого уравнения системы (9) следует, что рост фактора Б2 от его средней величины на 100 млрд. руб. вызовет рост индекса реальных инвестиций на 0,2 п. п. (также от средней величины);
^ влияние текущего прироста стоимости доллара на снижение текущего индекса реальных инвестиций. Экономика России сильно зависит от курса американской валюты, что подтверждается результатами анализа причинности. При увеличении курса доллара возрастает цена импорта, что увеличивает издержки производства на предприятиях, где он применяется. В России чаще всего невозможно заменить импорт отечественными товарами (оборудованием). Поэтому рост курса доллара приводит к росту уровня цен и сокращению инвестиционных расходов: увеличение фактора Б^З^а)) на 1 руб./долл. приведет к сокращению индекса реальных инвестиций в основной капитал на 0,965 п. п. (как и в предыдущих случаях, изменения отмеряются от средних значений показателя). Данные выводы необходимо учитывать при определении политики Центрального банка в области валютного регулирования;
взаимовлияние индекса реальных инвестиций в основной капитал и индекса цен на строительно-монтажные работы. Изучение выборочной кросс-корреляционной функции по-
казало различную направленность взаимосвязи: положительная корреляция возникает между Y(sa)t и X5,t-1, а отрицательная — между Y(sa)t и X5,t+1. Так как спрос рождает предложение, то рост цен (а цены растут при увеличении спроса) указывает на рост доходности; а чем выше доходность, тем выше привлекательность для инвесторов. Поэтому увеличение индекса цен на строительно-монтажные работы в предшествующем месяце на 1 п. п. обусловит рост индекса реальных инвестиций на 0,292 п. п., о чем говорит первое уравнение системы (9). Рост инвестиционных затрат стимулирует выход на рынок дополнительных участников, предлагающих свои услуги (строительство, ремонт, пуск и наладка), в результате чего средняя стоимость таких услуг в конкурентных условиях снижается: предложение превышает спрос. Из второго уравнения следует, что рост индекса инвестиционных затрат в предыдущем месяце на 1 п. п. обусловит снижение индекса цен на строительно-монтажные работы на 0,123 п. п. в текущем периоде.
Тем не менее, описательные свойства модели не всегда являются преимуществом при экономическом прогнозировании. Структурирование проблемы и определение цели исследования на начальных этапах определяет критерии для сравнения и выбора оптимального метода прогнозирования. Такими критериями могут быть:
• точность прогноза,
• стоимость прогноза,
• экспертная оценка аналитика,
• доступность программного обеспечения,
• свойства прогнозируемых временных рядов,
• направление использования результатов,
• другие свойства, зависящие от конкретных обстоятельств.
Выявлено, что наиболее распространенным критерием является точность, которая оценивается средней абсолютной ошибкой (МАЕ), средней квадратической ошибкой (PMSE), средней абсолютной процентной ошибкой (МАРЕ) и другими показателями. Однако выбор того или иного показателя напрямую зависит от функции потерь, которой в практических исследованиях не уделяется достаточно внимания.
Проведенная оценка точности прогнозов индекса реальных инвестиций различными методами показала (табл. 4), что, в зависимости от формы функции потерь, для прогнозирования может быть выбрана либо сезонная модель ARMA (линейная функция потерь), либо экспоненциальное сглаживание (квадратическая функция).
Сравнительная оценка прогнозов индекса реальныхинвестиций в основной капитал на тестовую выборку (01.2008-02.2010 гг.)
Таблица 4
Модель (метод) Дополнительные условия МАЕ, п. п. PMSE, (п. п.)2 МАРЕ, % К
1. Наивная — 6,3 45,3 8,1 х
2. Тренд-сезонная — 5,3 39,0 7,2 0,847
3. Экспоненциальное сглажива (0,020; 0,00) 5,6 35,4 6,5 0,885
ние с различными параметра (0,016; 0,00) 5,4 35,1 6,4 0,850
ми адаптации (а; б) (0,012; 0,00) 5,3 34,9 6,3 0,832
4. БАКМА(2,1)(1,0)12 — 5,2 43,9 6,7 0,826
5. Многофакторная прогнозирование факторов 58,3 3442,1 73,0 9,237
прогнозирование уровней рядов 6,2 51,2 8,8 0,983
Коэффициент несоответствия прогнозов (К) в табл. 4 рассчитывался как отношение суммы абсолютных ошибок к сумме абсолютных ошибок наивной модели. То есть данный показатель также предполагает, что величина ошибки и их значимость для пользователя связаны между собой линейно.
Экспоненциальное сглаживание проводилось с автоматическим определением параметров (а; ¿) при минимизации одного из трех типов ошибок (МАЕ, РЫБЕ или МАРЕ) внутри выборки. Результаты послевыборочного сравнения показали, что минимизация МАРЕ позволяет получить более точные послевыборочные прогнозы (табл. 4).
Наименьшую среднюю абсолютную ошибку после-выборочного прогноза (5,2 п. п.) имеет модель 8ЛИМЛ(2,1) (1,0)12 (табл. 4). В частности, это объясняется тем, что линейные ошибки данной модели имеют тщательно специфицированную структуру. Такой способ обработки временного ряда способствовал получению модели с наименьшими абсолютными ошибками.
Точность прогнозов по многофакторной модели, основанной на причинных зависимостях между переменными, в данном случае уступает другим методам (табл. 4). Это объясняется тем, что в процессе спецификации не были найдены ведущие индикаторы, позволяющие получать прогнозы без необходимости прогнозирования объясняющих переменных хотя бы при некотором ограниченном горизонте прогнозирования. Причем прогнозирование непосредственно факторов Е1 и Е2 дало результаты значительно хуже (МАРЕ составила 73,0%, а линейная аппроксимация оказалась в 9,2 раза хуже наивной модели), чем вариант с прогнозированием входящих в них показателей. Прогнозирование входящих в модель переменных в виде уровней временных рядов, еще не объеди-
ненных в факторы, более обоснованно, так как динамика показателей при спецификации многомерной модели исследовалась подробнее динамики факторов Е1 и Е2. Таким образом, предварительное исследование временного ряда (его графический анализ, изучение коррело-граммы, определение наличия единичных корней, сезонности, выбросов, пропущенных значений и так далее) способствует получению улучшенных прогнозов даже при использовании автоматических методов прогнозирования (в данном случае — экспоненциального сглаживания).
Усреднение прогнозов позволяет учесть больше информации, полученной от прогнозирования различными способами. Авторами предложен метод усреднения, представляющий собой формализованную процедуру объединения прогнозов на основе показателей точности. При линейной функции потерь вес каждого прогноза в усредненном рассчитывается по формуле:
1
=
МАЕ, к 1 2МЛЕ1
(10)
>¿00
где к — количество элементов сравнения. В результате среди четырех усредняемых индивидуальных прогнозов наибольший вес присвоен прогнозам по модели 8ЛЯЫЛ(2,1)(1,0)12, имеющим наименьшую ошибку МАЕ (табл. 5).
Определение доли индивидуальных прогнозов в усредненном
Модель (метод) MAEi, п. п. 1 MAEi di, %
Тренд-сезонная 5,3 0,187 25,6
Экспоненциальное сглаживание 5,3 0,190 26,1
SARMA(2,1)(1,0)12 5,2 0,192 26,3
Многофакторная 6,2 0,161 22,1
Итого 22,0 0,730 100,0
Применение данного метода дало следующие результаты: ошибка усредненного прогноза МАЕс=4,9 п. п.; РЫ8Ее=32,0 (п. п.)2; МАРЕс = 6,3%, что превосходит результаты каждой из индивидуальных моделей (табл. 4). Графически результаты представлены на рис. 9.
На рис. 9 видно, что усредненный прогноз имеет лучшее приближение к фактическим послевыборочным данным, чем индивидуальные прогнозы. Однако применение усреднения прогнозов лишает аналитика таких преимуществ, как простота модели, обоснованность доверительных интервалов прогнозирования, экономическая интерпретируемость параметров. В связи с этим предложенный способ также не является идеальным.
Представленные положения и выводы могут быть использованы при дальнейшем более глубоком изучении статистической методологии анализа и прогнозирования временных рядов с целью ее совершенствования. Теоретические и методологические положения, представленные в статье, значительно повышают возможности и качество исследования временных рядов, уточняют особенности применения методов, обеспечивают глубокое понимание сущности происходящих процессов.
«
Источники информации:
1. Эконометрика: учебник.
И. И. Елисеева, С. В. Курышева, Т. В. Костее-ва и др.; под ред. И. И. Елисеевой. — 2-е изд., перераб. и доп. — М: Финансы и статистика, 2007. — 576 с.
2. Грэнджер К., Юн Г. Скрытая коинтеграция. Рабочий доклад по экономике. — Сан-Диего: Калифорнийский университет, 2002. — 48 с.
References:
1. Econometrics: textbook. / I.I. Eliseeva, S. V. Kurisheva, T. V. Kosteeva and others; editor 1.1. Eliseeva. — 2nd edition., revised and augmented—Moscow: Finansy i Statistika, 2007. — 576 p.
2. Granger C. W. J., Yoon G.
Hidden cointegration. Economics working paper. San Diego: University of California, 2002. — 48 p.
■ Взвешенное усреднение индивидуальных прогнозов