Научная статья на тему 'Прогнозирование динамики стоимости минимального набора продуктов питания'

Прогнозирование динамики стоимости минимального набора продуктов питания Текст научной статьи по специальности «Экономика и бизнес»

CC BY
503
104
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МИНИМАЛЬНАЯ ПРОДУКТОВАЯ КОРЗИНА / ARIMA / СЕЗОННОЕ РАЗЛОЖЕНИЕ / STL / ПАКЕТ R / ПРОГНОЗ / MINIMUM FOOD BASKET / SEASONAL DECOMPOSITION / R PACKAGE / FORECAST

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Грахольская Людмила Владимировна, Митрофанов Алексей Юрьевич

Построены две модели ARIMA динамики стоимости минимального набора продуктов питания в Саратовской области с января 2001 г. по апрель 2016 г. включительно. Одна из них модель с линейным трендом, сезон-ными фиктивными переменными и AR(2)-возмущениями. Установлена высокая степень адекватности этой модели. Вторая модель воспроизводит трендовую и циклическую составляющие ряда, выделенные с помощью команды stl в пакете R (сезонное разложение, основанное на сглаживании loess). С применением информаци-онных критериев и значимости коэффициентов выбрана структура модели ARIMA(4, 1, 3) с неполной структурой лагов. C помощью этих моделей построены прогнозы на 36 месяцев (до апреля 2019 г. включительно): c по-мощью первой модели включая сезонность, с помощью второй модели исключая ее. Вторая модель пред-сказывает ускорение темпов прироста показателя в конце 2016 г. и первой половине 2017 г., за которым ожи-дается его снижение

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING THE DYNAMICS OF MINIMUM FOOD BASKET COST

The paper presents two ARIMA models of the dynamics of minimum food basket cost in the Saratov region from January 2001 to April 2016 inclusive. One of the models is a linear trend model with seasonal dummies and AR (2) disturbances. The authors state high adequacy of the model. The second model shows trend and cyclical components of the series selected by stl in R package (seasonal decomposition based on smoothing loess). Using information criteria and relevance factors the authors chose ARIMA model structure (4, 1, 3) with incomplete lag structure. The models are used to build forecasts for 36 months (up to April 2019 inclusive): the fi rst model includes seasonal factor, while the second model excludes seasonal factor. The second model predicts the acceleration of the growth rate indi-cator at the end of 2016 and the fi rst half of 2017, after which it is expected to decline.

Текст научной работы на тему «Прогнозирование динамики стоимости минимального набора продуктов питания»

saf [email protected] Людмила Владимировна Грахольская,

кандидат экономических наук, доцент кафедры прикладной математики и информатики, Саратовский социально-экономический институт (филиал)

РЭУ им. Г. В. Плеханова

[email protected] Алексей Юрьевич Митрофанов,

кандидат экономических наук, доцент кафедры прикладной математики и информатики, Саратовский социально-экономический институт (филиал) УДК 338.27 РЭУ им. Г. В. Плеханова

ПРОГНОЗИРОВАНИЕ ДИНАМИКИ СТОИМОСТИ МИНИМАЛЬНОГО НАБОРА ПРОДУКТОВ ПИТАНИЯ

Построены две модели ARIMA динамики стоимости минимального набора продуктов питания в Саратовской области с января 2001 г. по апрель 2016 г. включительно. Одна из них - модель с линейным трендом, сезонными фиктивными переменными и AR(2)-возмущениями. Установлена высокая степень адекватности этой модели. Вторая модель воспроизводит трендовую и циклическую составляющие ряда, выделенные с помощью команды stl в пакете R (сезонное разложение, основанное на сглаживании loess). С применением информационных критериев и значимости коэффициентов выбрана структура модели ARIMA(4, 1, 3) с неполной структурой лагов. C помощью этих моделей построены прогнозы на 36 месяцев (до апреля 2019 г. включительно): c помощью первой модели - включая сезонность, с помощью второй модели - исключая ее. Вторая модель предсказывает ускорение темпов прироста показателя в конце 2016 г. и первой половине 2017 г., за которым ожидается его снижение.

Ключевые слова: минимальная продуктовая корзина, ARIMA, сезонное разложение, stl, пакет R, прогноз.

♦-♦

L.V. Graholskaya, A.Yu. Mitrofanov

FORECASTING THE DYNAMICS OF MINIMUM FOOD BASKET COST

The paper presents two ARIMA models of the dynamics of minimum food basket cost in the Saratov region from January 2001 to April 2016 inclusive. One of the models is a linear trend model with seasonal dummies and AR (2) disturbances. The authors state high adequacy of the model. The second model shows trend and cyclical components of the series selected by stl in R package (seasonal decomposition based on smoothing loess). Using information criteria and relevance factors the authors chose ARIMA model structure (4, 1, 3) with incomplete lag structure. The models are used to build forecasts for 36 months (up to April 2019 inclusive): the first model includes seasonal factor, while the second model excludes seasonal factor. The second model predicts the acceleration of the growth rate indicator at the end of 2016 and the first half of 2017, after which it is expected to decline.

Keywords: minimum food basket, ARIMA, seasonal decomposition, stl, R package, forecast.

Резкое повышение до 23% годового темпа прироста цен на продовольствие в 2014-2015 гг. с прогнозируемым Банком России его снижением до уровня 5-6% в 2016 г. [1] делает актуальным независимое моделирование динамики цен на продукты питания с акцентом на ее прогнозирование.

Желание выявить долгосрочную тенденцию динамики, с одной стороны, а также отразить региональную специфику - с другой, обусловило выбор в качестве объекта исследования ежемесячных данных о стоимости минимального набора продуктов питания в Саратовской области за период с января 2001 г. по апрель 2016 г. [4]. Длина изучаемого ряда составила 184 наблюдения.

Стоимость минимального набора продуктов питания является одним из основных показателей статистики потребительских цен. Состав и количество входящих в набор продовольственных товаров соответствует принципу здорового питания при минимальных затратах и учитывает сложившиеся пищевые привычки населения и нормы потребления для мужчины трудоспособного возраста в расчете на месяц. Нормы, используемые при исчислении стоимости минимального набора продуктов питания, едины для всех субъектов Российской Федерации. Тот факт, что количество товаров в наборе не отражает реальных объемов их потребления, является скорее преимуществом данного показателя, позволяя использовать его для определения длительной динамики и межрегиональной дифференциации уровней потребительских цен на основные продукты питания [5; 6].

В работе рассматривается построение двух эконо-метрических моделей для изучаемого показателя, которые в дальнейшем используются для его прогнозирования на 36 месяцев - до апреля 2019 г. включительно. Эти модели различаются по своей направленности и использованным методологическим основаниям, что, по нашему мнению, позволяет более широко охватить прошлую и будущую динамику стоимости минимального продуктового набора.

Динамика изучаемого показателя характеризуется двумя типичными признаками нестационарных экономических временных рядов - наличием тенденции и сезонных колебаний « исходного ряда». Возрастающая

тенденция с направленной вниз выпуклостью, а также очевидный рост размаха сезонных и нерегулярных колебаний свидетельствуют о возможном наличии экспоненциальной тенденции и адекватности мультипликативного сезонного разложения. Поэтому перед построением обеих моделей данные были прологарифмированы (/п), результат умножен на 100, после чего из значений ряда было вычтено начальное значение 665,1378, соответствующее январю 2001 г. Такое преобразование позволило перейти к моделированию относительных изменений стоимости минимального продуктового набора по сравнению с уровнем января 2001 г., выраженных в удобных «логарифмических процентах», спрямить тенденцию, стабилизировать размах сезонных и нерегулярных колебаний (рис. 1).

Построение первой из упомянутых выше моделей было выполнено в два этапа. На первом этапе с использованием пакета дгвИ [3] и обычного МНК к ряду преобразованных значений была подобрана модель линейной регрессии на время t (номер месяца) и совокупность сезонных фиктивных переменных с<2, с/3, ..., с<12. Оценка коэффициента при переменной времени составила 0,734214, что соответствует около 8,81 «логарифмических процентов» в год. Коэффициенты при сезонных фиктивных переменных показывают, что по сравнению с январем стоимость минимального продуктового набора в феврале-апреле повышается на 1,1%, 1%, 0,9% соответственно, в мае - на 1,5%, в июне - на 2%, в июле - на 0,9%, в августе-декабре снижается на 5%, 7,2%, 7%, 5,2% и 2,9% соответственно. Стандартная ошибка модели составила 6,9%, коэффициент детерминации - 0,97. Построение корре-лограммы остатков показывает наличие сильной автокорреляции последних, при этом обычные автокорреляции убывают, оставаясь положительными и значимыми (на уровне 5%) для всех лагов до 12-го включительно, в то время как частные автокорреляции значимы лишь для лагов 1 и 2 (0,94 и -0,27 соответственно). Такой характер автокорреляций не позволяет признать данную модель адекватной, одновременно подсказывая изменения, которые необходимо внести в структуру модели, а именно, считать, что случайные возмущения модели следуют модели авторегрессии 2-го порядка [2].

Рис. 1. Непараметрическое сезонное разложение ф/) ряда стоимости минимального набора продуктов питания в Саратовской области с января 2001 г. по апрель 2016 г. (логарифмическая процентная шкала, январь 2001 = 0)

На втором этапе также с использованием дгвМ и точного метода максимального правдоподобия была оценена модель линейной регрессии на время и сезонные фиктивные переменные с АЩ2)-возмущениями. Коэффициент при времени составил 0,733419, что соответствует 8,8% в годовом выражении, незначительно меньше значения, полученного ранее. Характер сезонной волны остался прежним, со следующими коэффициентами за февраль-декабрь (в сравнении с январем, в процентах): 1,1; 1; 0,9; 1; 1,5; 0,4; -5,5; -7,7; -7,5; -5,7; -3,4. Оценка стандартного отклонения инноваций составила 1,9%, что существенно меньше, чем у предыдущей модели. Значимые автокорреляции остатков отсутствуют даже на уровне 10%. В целом моделирование структуры зависимости случайных возмущений в форме АЩ2) позволило существенно улучшить качество модели. Информационный критерий Шварца дает значение 850,24, критерий Акаике -798,80. Все коэффициенты модели кроме коэффициентов при сезонных фиктивных переменных 63-67 являются значимыми на уровне 5%, т.е. стоимость

набора с марта по июль включительно несущественно отличается от уровня января. Существенное снижение цен (по сравнению с январем текущего года) приходится на период с августа по декабрь, что соответствует периоду появления на рынках области продукции местных сельхозпроизводителей. Наибольшее снижение стоимости происходит в сентябре-октябре. Существенным оказалось повышение стоимости набора в феврале (1,1% к январю текущего года). Поскольку последние несколько лет именно на февраль приходится повышение цен ЖКХ, можно говорить о его влиянии на общий уровень цен в регионе. Модельные значения ряда достаточно близки к наблюдаемым. Прогноз значений стоимости минимального продуктового набора (в исходной шкале) представлен на рис. 2.

Рассмотренная выше модель имеет два элемента, общих с классическим сезонным разложением (преобразованного) временного ряда: линейную тенденцию и сезонную составляющую, неизменную на протяжении всего изучаемого периода.

Рис. 2. Стоимость минимального набора продуктов питания в Саратовской области с января 2001 г. по апрель 2016 г. и прогноз до апреля 2019 г. с помощью модели линейной регрессии с АР(2)-возмущениями

♦-

Существенное отличие второй модели состоит в подходах к моделированию медленно изменяющейся составляющей ряда. В рассмотренной выше модели относительно плавные колебания уровня ряда воспроизводятся с помощью авторегрессии, в то время как в классическом сезонном разложении для этого выделяется особая, циклическая, составляющая ряда. Каждый из подходов имеет свои преимущества и недостатки: авторегрессионный подход обладает простой математической формой с минимальным количеством дополнительных параметров, но имеет характер «черного ящика»; циклический подход нагляден, но характеризуется сложной математической формой, требующей большого числа дополнительных параметров. Помимо этого авторегрессионный подход приводит к «шероховатой», а циклический - к гладкой медленно изменяющейся составляющей.

При построении второй модели, описывающей динамику стоимости минимального набора продуктов питания, мы следовали методологии классического сезонного разложения, но реализованной с использованием современной методологии моделирования временных рядов.

Преобразованный ряд был подвергнут сезонному разложению с помощью команды stl [7] статистического пакета R [10]. Как отмечают разработчики, stl представляет собой процедуру фильтрации для разложения временного ряда на трендовый, сезонный и остаточный компоненты, основанную на последовательном применении сглаживания loess [7]. Заметим, что «тренд» в терминологии stl соответствует сумме (линейной) тенденции и циклический составляющей в терминологии классического сезонного разложения.

Существенное отличие stl от классического сезонного разложения состоит в том, что он дает варьирующую сезонную составляющую. Для реализации stl требуется задать параметр сглаживания сезонной составляющей s.window, не имеющий значения по умолчанию. Как отмечают разработчики алгоритма, он должен быть нечетным и не меньшим 7. С его увеличением вариации сезонных колебаний уменьшаются. Нами было выбрано значение s.window = 13, дающее умеренное постоянство сезонных колебаний (рис. 1). На графике сезонная и остаточная составляющие ряда увеличены втрое для наглядности.

В отличие от первой модели, воспроизводящей и прогнозирующей весь ряд изучаемого показателя, вторая модель воспроизводит лишь сглаженный ряд («тренд»), даваемый stl. Мы намеренно отбрасываем сезонную и остаточную составляющие как имеющие меньшее экономическое значение по сравнению со сглаженным рядом с точки зрения его долгосрочной динамики.

Построение модели было осуществлено в два этапа. На первом этапе был вычислен ряд первых разностей сглаженного ряда с использованием команды auto.arima пакета расширения forecast [8; 9]. Эта команда осуществляет поиск модели ARIMA, оптимальной по заданному информационному критерию. Для поиска были заданы следующие параметры: d = 0, max.p = 5, max.q = 5, max.order = 10, stationary = T, seasonal = F, stepwise = F, parallel = T, что соответствует моделям стационарных рядов без разностей, с

-♦

максимальным порядком авторегрессии и скользящего среднего равным 5, без сезонности, с отключением пошагового подбора и использованием режима параллельных вычислений. Для сравнения моделей использовался скорректированный критерий Акаике (AICc), предлагаемый по умолчанию. В результате была отобрана модель ARMA(4,4) с константой. Диагностика этой модели показала наличие значимой отрицательной автокорреляции остатков для лага 12 месяцев, однако тест Бокса - Льюнга не выявил значимых автокорреляций.

Последующая попытка использовать команду auto. arima для самого сглаженного ряда с целью получения прогнозной модели ARIMA(4,1,4) привела к сбою программы. Поэтому дальнейшее моделирование и прогнозирование было выполнено в пакете gretl (модель ARIMA). Для оценки модели использовался точный метод максимального правдоподобия. Первоначальная модель имела полную структуру ARIMA(4,1,4), критерий BIC - -199,4211, единственный незначимый коэффициент скользящего среднего theta_2 и значимую автокорреляцию для лага 12. Поэтому в модель была введена сезонная авторегрессия первого порядка. Критерий BIC уменьшился до -257,3799, число незначимых коэффициентов модели возросло до 4, остались несколько значимых автокорреляций остатков, близких к -0,15. Далее модель была упрощена путем последовательного исключения незначимых коэффициентов, в результате чего была получена модель, включающая константу (0,738618), авторегрессионные члены с лагами 1, 3, 4, 12 и скользящее среднее с лагом 3. Интересно отметить, что коэффициент скользящего среднего равен 1. Такая структура связана с особым характером продифференцированной сглаженной составляющей, имеющей промежутки постоянства длины 3 на всем протяжении ряда. Эта модель также имеет небольшие значимые автокорреляции остатков, все ее коэффициенты значимы, стандартное отклонение инноваций составляет 0,095%, критерий BIC - -277,1535.

Наиболее важный параметр модели - константа соответствует среднегодовому (логарифмическому) темпу прироста стоимости набора 8,86%. Эта модель была использована для прогнозирования, результаты которого представлены на рис. 3.

После трех месяцев относительного постоянства стоимости минимального набора продуктов питания в Саратовской области набора (без учета сезонности): в мае 2016 г. - 2946 руб., в июне - 2951 руб., в июле -2956 руб., модель предсказывает ускорение темпов прироста показателя в конце 2016 г. и первой половине 2017 г., за которым ожидается его снижение. В декабре 2016 г. прогнозируется стоимость 3076 руб., в апреле 2017 г. - 3217 руб., в июле 2017 г. - 3314 руб., в декабре 2017 г. - 3428 руб., в декабре 2018 г. - 3708 руб., в апреле 2019 г. - 3840 руб.

Проведенное исследование позволяет сделать следующие выводы:

1) простая эконометрическая модель, включающая линейный тренд, сезонные фиктивные переменные и случайное возмущение, подчиненное модели AR(2), дает очень точное описание динамики исследуемого показателя и соответствующий прогноз;

янв янв янв янв янв янв янв янв янв янв 2001 2003 2005 2007 2009 2011 2013 2015 2017 2019

Рис. 3. Стоимость минимального набора продуктов питания в Саратовской области с января 2001 г. по апрель 2016 г. и прогноз до апреля 2019 г. с помощью модели АР!МА(4,1,3)

2) использование современного варианта классического сезонного разложения, даваемого командой

пакета Я, позволяет сконцентрировать внимание на экономически наиболее значимом аспекте динамики показателя - долгосрочной тенденции с наложенными на нее циклическими колебаниями;

3) «автоматические» процедуры отбора моделей не всегда дают приемлемый конечный результат и требуют уточнения вручную;

4) подход эконометрического моделирования и прогнозирования позволяет скорректировать выводы, которые могут быть получены лишь из визуального рассмотрения графика динамики изучаемого показателя; так, поведение преобразованного ряда и его сглаженного варианта в начале 2016 г. на рис. 1 подсказывают снижение изучаемого показателя в краткосрочном периоде, в то время как обе разработанные модели предсказывают его дальнейший рост, что согласуется с качественным анализом ситуации на продовольственном рынке.

1. Банк России. Динамика потребительских цен // Информационно-аналитические комментарии. 2016. №5. Май. и^: http://www.cbr.ru/dkp/inf_com/INF_2016-05.pdf.

2. Грахольская Л.В. Практика использования современного ПО при изучении экономико-математических дисциплин // Саратовской области - 80 лет: история, опыт развития,

перспективы роста: сб. тр. по итогам междунар. науч.-практ. конф. (г. Саратов, 11 апреля 2016 г.). Саратов, 2016.

3. Пакет gretl (Библиотека GNU для регрессий, эконометрики и временных рядов). URL: http://gretl.sourceforge.net/ru.html.

4. Федеральная служба государственной статистики (РОССТАТ). База данных стоимости условного (минимального) набора продуктов питания. URL: http://www.gks.ru/db-scripts/cbsd/DBInet.cgi?pl=1923003.

5. Федеральная служба государственной статистики (РОССТАТ) / Приказ № 733 «Об утверждении наборов потребительских товаров и услуг для ежемесячного наблюдения за ценами и тарифами» от 30 декабря 2014 г.

6. Федеральная служба государственной статистики (РОССТАТ) / Приказ № 734 «Об утверждении Официальной статистической методологии организации статистического наблюдения за потребительскими ценами на товары и услуги и расчета индексов потребительских цен» от 30 декабря 2014 г.

7. Cleveland R.B., Cleveland W.S., McRae J.E., and Terpen-ning I. (1990) STL: A Seasonal-Trend Decomposition Procedure Based on Loess. Journal of Official Statistics, 6, pp. 3-73.

8. Hyndman R.J. (2015). Forecast: Forecasting functions for time series and linear models. R package version 6.2. URL: http:// github.com/robjhyndman/forecast.

9. Hyndman R.J. and Khandakar Y. (2008). Automatic time series forecasting: the forecast package for R. Journal of Statistical Software, 26(3), pp. 1-22. URL: http://ideas.repec.org/a/jss/ jstsof/27i03.html.

10. R Core Team (2016). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL: https://www.R-project.org/.

Кристина Геннадьевна Журавская,

аспирантка кафедры прикладной математики и информатики, Саратовский социально-экономический институт (филиал)

РЭУ им. Г. В. Плеханова

СРАВНЕНИЕ МОДЕЛЕЙ ФОРМИРОВАНИЯ СТОИМОСТИ МОЛОКА НА РЕГИОНАЛЬНЫХ РЫНКАХ

Цель работы состоит в построении и сравнении моделей формирования стоимости молока в субъектах Приволжского федерального округа. В работе с помощью критерия Фостера - Стюарта проверено наличие тренда в рядах; путем сравнения трех моделей выбрано лучшее уравнение тренда; путем анализа остатков

Ь^г [email protected]

УДК 330.4

i Надоели баннеры? Вы всегда можете отключить рекламу.