ПРОГНОЗИРОВАНИЕ РЕГИОНАЛЬНОЙ ИНФЛЯЦИИ С ИСПОЛЬЗОВАНИЕМ МОДЕЛЕЙ ПРОСТРАНСТВЕННОЙ КОРРЕЛЯЦИИ
Таисия ГОРШКОВА
Научный сотрудник РАНХиГС при Президенте Российской Федерации. E-mail: [email protected] Марина ТУРУНЦЕВА
Заведующий лабораторией краткосрочного прогнозирования Института экономической политики имени Е.Т. Гайдара; заведующий лабораторией макроэкономического прогнозирования РАНХиГС при Президенте Российской Федерации, канд. экон. наук. E-mail: [email protected]
В статье рассматривается целесообразность использования методов моделирования пространственной корреляции между регионами России применительно к прогнозированию показателя инфляции в них. Показано, что нельзя дать однозначный ответ о необходимости включения в модели пространственных переменных.
Ключевые слова: региональная инфляция, прогнозирование, пространственная корреляция.
Известно, что учет пространственной корреляции между показателями может улучшить прогнозные свойства моделей1. Но в некоторых работах показано, что это не всегда так. Например, в работе Бека и др.2, в которой региональная инфляция исследовалась с помощью метода главных компонент, было отмечено, что около 75% изменчивости региональной инфляции может быть объяснено общими факторами и, таким образом, включение пространственных показателей не является необходимым. В работе Банержи и Марсел-лино3 разные модели пространственной корреляции более чем в половине случаев дают результаты не лучше, чем модели, не учитывающие пространственную зависимость.
В настоящей статье мы пытаемся ответить на вопрос о необходимости учета пространственной корреляции между регионами России при прогнозировании региональной инфляции (по индексу потребительских цен). Для этой
цели мы использовали авторегрессионные модели, учитывающие временную и пространственную корреляцию между регионами.
Для построения прогноза инфляции мы использовали данные с 1999 по 2014 гг. по 83 регионам РФ без учета Республики Крым и г. Севастополя. Данные по всем регионам, в том числе отдельно по автономным округам, входящим в состав областей, доступны с 1999 г. Единственное исключение составляет Чеченская Республика, данные по которой доступны с 2004 г.
В качестве базовой модели (так называемого «наивного» прогноза), с которой будут сравниваться остальные прогнозы, мы использовали модели AR (1), оцененные для каждого из субъектов РФ отдельно с помощью метода наименьших квадратов. Для каждого региона были оценены модели вида
nit = a, + Дп_, + £lt, £lt~NID (0, ф, (1)
1 Более подробно см.: LeSage J.P., Pace R.K. Introduction to spatial econometrics // Boca Raton, US: CRC Press Taylor & Francis Group. 2009; Marques H., Pino G., Horrillo J. Regional inflation dynamics using space—time models // Empirical Economics. Springer. Vol. 47 (3). Pp. 1147-1172. November 2014; Nagayasu J. Regional Inflation, Spatial Location and the Balassa-Samuelson effect // MPRA Paper 59220, University Library of Munich. German. 2014; Yesilyurt F., Elhorst J. P. A regional analysis of inflation dynamics in Turkey // Annals of Regional Science. 2014. Vol. 52 (1). Рр. 1-17. 10.1007/s00168-013-0570-4.
2 Beck, Hubrich, Marcellino. Regional inflation dynamics within and across euro area countries and a comparison with the US // ECB Working Paper. No 681. European Central Bank. Frankfurt / Main, October 2006.
3 Banerjee A., Marcellino M. Are there any reliable leading indicators for US inflation and GDP growth? // International Journal of Forecasting. Elsevier/ 2006. Vol. 22 (1). Pp. 137-151.
где п- годовой темп инфляции в регионе i в период времени t; eit - ошибки модели, различные для каждого региона в каждый момент времени; ai - константа, специфическая для каждого региона.
Поскольку в годовом измерении ряды региональной инфляции являются короткими, оценки коэффициентов, полученные методом наименьших квадратов (МНК-оценки), оказываются смещенными и далее исследуются данные, объединенные в пул (модель сквозной или объединенной регрессии), в котором константа a и коэффициент при объясняющей переменной р предполагаются одинаковыми для всех регионов и лет:
nit = a + pti_ i + i ел ~ NID (0, S) (2)
где a - константа, одинаковая для всех регионов.
Данная модель оценивается двухшаговым обобщенным методом моментов (ОММ-оцен-ки) на основании методики Ареллано-Бонда4. Во всех оцененных регрессиях (здесь и далее) значимым оказался первый лаг инфляции плюс дополнительные лаги, разные для различных спецификаций.
На основе модели (2) были построены прогнозы региональной инфляции, средняя ошибка которых составила 9%. Наименее точный прогноз был получен для Чеченской Республики - 14%. Средние ошибки прогнозов для всех остальных регионов РФ оказались равными 9%. При этом наибольшие ошибки были получены для 2013-2014 гг.
Следующая используемая для прогнозирования модель - модель панельной регрессии с фиксированными эффектами, в которой
константа «предполагается регионально специфической переменной:
п, = а 1 + п, _+ е„, е„ ~ N10 (0, 82), (3)
где а -константа, специфическая для каждого региона.
Прогнозы, построенные на основе данной модели, оказываются менее точными по сравнению с прогнозами для пула. Тем не менее их ошибки меньше полученных по «наивной» А^1)-модели и равны в среднем 11%. Максимальная ошибка была получена для Чукотской автономной области - 14%.
Далее были построены регрессии, учитывающие пространственную корреляцию. Для оценки этих моделей также использовались данные, собранные в пул, и модели с фиксированными эффектами. Все модели пространственной автокорреляции оценивались методом максимального правдоподобия. Для расчетов использовалась матрица весов на основе общей границы (^)5: если регион / имеет общую морскую или сухопутную границу с регионом _/', то w¡J = 1, в противном случае w¡J = 0. На основе этой матрицы весов и данных по инфляции были рассчитаны значения статистики I Морана6:
N ХХ^ (х! -м) (х1 -м) I ---.
ХХ^ Х,(х, - м)2
Значения I Морана для каждого года приведены в табл. 1. Из нее видно, что на 10%-ном уровне значимости значимой оказывается статистика Морана для 2007, 2009, 2010, 2011 и 2014 гг. В эти периоды значения I положительны, что говорит о наличии положительной кла-
4 При использовании данного метода временные лаги зависимой переменной могут использоваться одновременно как в качестве объясняющих переменных, так и в качестве инструментов. При анализе инфляции использовались различные комбинации лаговых значений. Критерием качества служил тест Саргана, проверяющий сверхидентифицируемость инструментов (для оцененной регрессии нулевая гипотеза не была отвергнута; это верно и далее для всех моделей, оцененных данным методом).
5 Все диагональные элементы матрицы весов равны нулю.
6 Moran P. A. P. Notes on Continuous Stochastic Phenomena // Biometrika. 1950. Vol. 37 (1). Рр. 17-23.
стеризации между регионами. В остальные периоды гипотеза о наличии пространственных взаимосвязей между инфляцией в различных регионах отвергается. Таким образом, в 2000-2006 гг.7 пространственная связь между регионами не наблюдается, и можно говорить, что инфляция распределяется между ними случайным образом. Напротив, согласно статистике Морана можно сделать вывод, что во второй половине 2000-х годов потребительские цены в соседних регионах стали зависеть друг от друга, что согласуется с принципом отсутствия арбитража.
Несмотря на то что гипотеза о наличии пространственной корреляции в первой под-выборке (2000-2006 гг.) была отвергнута, в работе Джиакомини и Грейнджера8, посвященной агрегированию пространственных прогнозов, было показано, что исключение из общего прогноза информации о даже невысокой пространственной корреляции ведет к ухудшению его качества.
В этой связи мы исследуем инфляцию по трем подвыборкам: вся совокупность данных (2000-2014 гг.) с учетом и без учета пространственной корреляции; первая половина 2000-х годов (2000-2006 гг.) - только без учета пространственных эффектов; вторая половина 2000-х годов (2007-2014 гг.) - только с учетом пространственных эффектов.
Модель объединеннЕД.регрессии (пула) для всего периода имеет вид
п = а + вп , + 8Ъ83 шп, + е, , (4)
Л "Л -1 ] Л 11' ^ '
где а-константа, одинаковая для всех регионов; ш] - элементы весовой матрицы соседей ] для региона /.
Средняя ошибка прогноза по данной модели равна 8%, что меньше ошибок моделей, не учитывающих пространственную корреляцию. Индивидуальные ошибки практически для всех регионов также равны 8%. В число регионов с большей ошибкой прогноза входят 5 из 10 регионов Кавказа и 7 из 24 регионов Сибири и Дальнего Востока, что косвенно может свидетельствовать о необходимости исследования инфляции в различных частях России индивидуально.
Затем модель пула (4) была оценена для двух подвыборок: для 2000-2006 гг. без учета пространственной корреляции и для 2007-2014 гг. с учетом пространственной корреляции.
Средняя ошибка прогноза по данной модели в 2000-2006 гг. совпадает с ошибкой аналогичной модели для полной выборки и равна 8%. Максимальная ошибка была получена для Чеченской Республики - 42%, что соответствует результатам модели для полной выборки. Такая большая ошибка прогноза по сравнению с ошибками для других регионов может быть связана с отсутствием данных по инфляции в Чеченской Республике до 2004 г. В модели для второй половины выборки (2007-2014 гг.) средняя ошибка прогноза составляет 4%, что меньше, чем в соответствующей модели для всей выборки. Ошибка прогноза для Чеченской Республики уменьшилась при этом до 4%, что может служить подтвер-
Таблица 1 Значения I Морана
Год 1999 г. 2000 г. 2001 г. 2002 г. 2003 г. 2004 г. 2005 г. 2006 г.
Значение / Морана -0,09 0,05 -0,11 -0,02 0,02 0,05 0,15 0,09
Год 2007 г. 2008 г. 2009 г. 2010 г. 2011 г. 2012 г. 2013 г. 2014 г.
Значение / Морана 0,385 0,18 0,215 0,285 0,19 0,04 0,1 0,39
7 Данные за 1999 г. не использовались в связи с высоким значением инфляции в каждом регионе относительно следующих периодов.
8 Giacomini R., Granger C.W.J. Aggregation of space-time processes // Journal of Econometrics. 2004. Vol. 118. Рр. 7—26.
ждением гипотезы о связи значительной ошибки в предыдущем случае с отсутствием данных. Для подвыборки 2007-2014 гг. максимальная ошибка прогноза была получена для Республики Алтай - 21%.
Далее была оценена модель с фиксированными эффектами с учетом пространственной корреляции
п = а. + вк, , + З!83 шп, + е, , (5)
¡1 I " ¡1 -1 ] = 1 ] ¡1 ¡1' ^ '
(где а - константа, специфическая для каждого региона) для всей выборки9. Средняя ошибка прогноза по данной модели составила 11%. Максимальная ошибка была получена для Чеченской Республики - 16%.
Модель с фиксированными эффектами без учета пространственной корреляции была оце-
нена для первой части выборки 2000-2006 гг. Средняя ошибка прогноза по всем регионам составила при этом 9%, что больше, чем в модели пула.
В модели с фиксированными эффектами с учетом пространственной корреляции для 2007-2014 гг. средняя ошибка прогноза равна 3%, что существенно меньше, чем ошибки по полной модели и по подвыборке за 2000-2006 гг. без учета пространственной корреляции. Также ошибка в 3% меньше ошибки для подвыборки 2007-2014 гг. по модели пула.
Кроме того, была оценена модель с фиксированными эффектами с пространственной корреляцией в ошибках10. Соответствующая функция правдоподобия имеет вид
-^Т1п(2жт2) + Г]Т 1п(1-^,) —1-г ]Г ¿л, е, = (1-^)[У, - У- (X, - Х)в], (6)
Таблица 2
Результаты оценки моделей*
Без пространственных эффектов С пространственными эффектами
'сиз р OLS ^OLS р SAR '"SAfl ^SEM
Модель (1) Модель Модель Модель Модель Модель
Максимум Минимум (2) (3) (4) (5) (6)
Выборка 2000-2014 гг.
a 35,51 0,76** 91,13 2,89
P 0,67 -0,61 0,074 0,122 0,031 0,67 0,757
8 0,938 0,656 0,152
Выборка 2000-2006 гг.
a 121,57 -34,11
P 0,11 0,671
8
Выборка 2007-2014 гг.
a 53,95
P 0,17 0,178 -0,23
8 0,33 0,337 0,57
* - Здесь: а - константа, специфическая для каждого региона в индивидуальных моделях(7015) и одинаковая для всех регионов в моделях пула ( Роиз и Р^)', р и 8 - коэффициенты при инфляции предыдущего периода и при взвешенной инфляции соседних регионов в текущем периоде соответственно. ** - Коэффициент незначим.
9 В качестве объясняющих переменных использовались первый и одиннадцатый лаги инфляции и взвешенная инфляция соседних регионов. Регрессия в целом значима. Гипотеза о том, что индивидуальные фиксированные эффекты равны 0, отвергается, корреляция между фиксированными эффектами и значением ВРП равна по модулю 0,79. Однако коэффициент при первом лаге инфляции оказывается отрицательным, что противоречит теоретическим предположениям и результатам остальных моделей.
10 Для оценки таких моделей методом максимального правдоподобия (ММП) был написан специальный программный код.
где щ - характеристические корни весовой матрицы IV; О - дисперсия ошибок оцениваемого уравнения. Средняя ошибка прогноза по данной модели для всей выборки составляет 10%.
Полученные результаты несравнимы с ОММ-оценками, поэтому для сравнимости были построены также оценки максимального правдоподобия для пространственной БА^ модели. Функция правдоподобия в таком случае принимает следующий вид:
Ь(2яо0) + Т2 Щ-Л,)-От V,, е, = - У) - (X, - Х)в. (7)
Средняя ошибка прогноза по данной модели составила 17%.
Также были построены ММП-оценки моделей (6) и (7) для второй половины выборки (2007-2014 гг.). В обеих моделях получаются большие ошибки прогноза - 77 и 113% соответственно.
Оценки коэффициентов, полученные по всем моделям, приведены в табл. 2.
В табл. 3 приведены средние абсолютные процентные ошибки прогнозов по всем моделям.
Полученные результаты не позволяют сделать однозначных выводов относительно того, какая модель наилучшим образом предсказывает региональную инфляцию. В целом ошибки по всем моделям, кроме модели с пространственной корреляцией, рассчитанные методом максимального правдоподобия, дают практически идентичные результаты. В отличие от результатов эмпирических работ других авторов (Маркес и др., Нагаюси, Эл-хорст и Есилюрт, ЛеСаг и Пасе) «наивная» А^1)-модель дает результаты, не уступающие по точности остальным моделям. Деление выборки на два периода улучшает точность модели: и у моделей без учета пространственных связей на периоде 2000-2006 гг., и у моделей, учитывающих инфляцию соседних регионов на периоде 2007-2014 гг., ошибки прогноза оказываются меньше ошибок моделей, рассчитанных по полной выборке. ■
Таблица 3
МАРЕ-модели (ошибки прогнозов в %)
Без пространственных эффектов С пространственными эффектами
р он 'Ъш р БАЙ р * 8АР '"ЗБИ
Модель (1) Модель (2) Модель (3) Модель (4) Модель (5) Модель (6)
Выборка 2000-2014 гг. 8 9 11 8 11 17
Выборка 2000-2006 гг. 7 8 9
Выборка 2007-2014 гг. 3 4 3 77
* - Приведена минимальная ошибка из моделей, рассчитанных методами ОММ и ММП.