Научная статья на тему 'Статистические подходы к анализу и прогнозированию демографических данных'

Статистические подходы к анализу и прогнозированию демографических данных Текст научной статьи по специальности «Экономика и бизнес»

CC BY
1848
316
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ ВРЕМЕННЫХ РЯДОВ / ARIMA-МОДЕЛИ / SARIMA-МОДЕЛИ / ARFIMA-МОДЕЛИ / СТАТИСТИЧЕСКИЕ МЕТОДЫ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Копнова Е. Д., Родионова Л. А.

В статье рассмотрены возможности применения ARIMA-моделирования к анализу и прогнозированию временных рядов демографических показателей. Зарубежные исследова-ния показали, что наряду с традиционными демографическими методами ARIMA-модели дают хорошие результаты при прогно-зировании таких показателей, как численность населения, уро-вень рождаемости и смертности, продолжительность жизни на-селения. Методика исследования. В работе использовалась методология Бокса Дженкинса анализа и прогнозирования временных рядов, в частности, применительно к демографиче-ским данным: коэффициенту суммарной рождаемости в России (1990-2014 гг.), количеству заключенных браков по месяцам в России (2005-2015 гг.), общему коэффициенту рождаемости во Франции (1740-2014 гг.) и уровню безработицы в России (1996-2016 гг.). Были проанализированы ARIMA-, SARIMAи ARFIMA-модели в зависимости от характера динамики исследуемого показателя. Результаты. Проведенный анализ показал, что оцененные ARIMA-модели для коэффициента суммарной рож-даемости и количества заключенных браков являются адекват-ными, имеют хорошие статистические и прогностические свой-ства. На основании полученных моделей построены прогнозы. В случае длинных рядов наличия свойств процессов с длинной памятью выявлено не было.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Копнова Е. Д., Родионова Л. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Статистические подходы к анализу и прогнозированию демографических данных»

УДК 519.246.8; 314.1; 311.17

СТАТИСТИЧЕСКИЕ ПОДХОДЫ К АНАЛИЗУ И ПРОГНОЗИРОВАНИЮ ДЕМОГРАФИЧЕСКИХ ДАННЫХ

Е. Д. Копнова

кандидат технических наук, доцент департамента статистики и анализа данных, Национальный исследовательский университет «Высшая школа экономики», Москва E-mail: [email protected]

Л. А. Родионова

кандидат экономических наук, доцент департамента статистики и анализа данных, Национальный исследовательский университет «Высшая школа экономики», Москва E-mail: [email protected]

Введение. В статье рассмотрены возможности применения ARIMA-моделирования к анализу и прогнозированию временных рядов демографических показателей. Зарубежные исследования показали, что наряду с традиционными демографическими методами ARIMA-модели дают хорошие результаты при прогнозировании таких показателей, как численность населения, уровень рождаемости и смертности, продолжительность жизни населения. Методика исследования. В работе использовалась методология Бокса - Дженкинса анализа и прогнозирования временных рядов, в частности, применительно к демографическим данным: коэффициенту суммарной рождаемости в России (1990-2014 гг.), количеству заключенных браков по месяцам в России (2005-2015 гг.), общему коэффициенту рождаемости во Франции (1740-2014 гг.) и уровню безработицы в России (19962016 гг.). Были проанализированы ARIMA-, SARIMA- и ARFIMA-модели в зависимости от характера динамики исследуемого показателя. Результаты. Проведенный анализ показал, что оцененные ARIMA-модели для коэффициента суммарной рождаемости и количества заключенных браков являются адекватными, имеют хорошие статистические и прогностические свойства. На основании полученных моделей построены прогнозы. В случае длинных рядов наличия свойств процессов с длинной памятью выявлено не было.

Ключевые слова: анализ временных рядов, ARIMA-модели, SARIMA-модели, ARFIMA-модели, статистические методы.

DOI: 10.18500/1994-2540-2016-16-3-306-315

Введение

Демографическое прогнозирование является неотъемлемой частью анализа социально-экономических процессов в целом. Необходимость построения прогноза движения населения и предвидение будущей демографической ситуации: как изменится численность населения, возрастно-половая структура, рождаемость, продолжительность жизни, смертность - все это важные составляющие при развитии и планировании различных сфер экономики и общества (социальной инфраструктуры, здравоохранения, образования, пенсионной системы) при принятии важных политических решений.

В демографическом прогнозировании используют различные подходы: математические методы, метод передвижки возрастов (когортно-компонентный метод), статистические методы. Одним из статистических методов прогнозирования в демографии является одномерное ARIMA-моделирование. В основе этого метода лежит подход «чистого временного ряда»: текущие значения демографического показателя связаны с его прошлыми значениями, а для прогнозирования будущих значений используется информация о прошлых значениях изучаемого показателя. Подход ARIMA-моделирования был предложен Боксом и Дженкинсом в 1970 г. [1] к анализу экономических процессов, кроме того, авторы ввели реализацию данного подхода в компьютерные пакеты статистических программ по всему миру. Вскоре ARIMA-модели (Autoregressive Integrated Moving Average Model) стали использовать во многих областях науки, в том числе и демографии. В работах 1970-х гг. демографы моделировали численность населения, уровень рождаемости и смертности (Hiorns, 1972; Lee, 1974; Pollard, 1970; Saboia, 1974) [2-5]. Кашьяп и Рао в 1976 г. сравнили различные методы анализа и прогнозирования временного ряда численности населения в США за 1900-1971 гг., для которого была получена удовлетворительная модель ARIMA(1,1,0) в логарифмах [6]. Сабой применил ARIMA-модели к анализу уровня рождаемости по данным Норвегии за 1919-1974 гг., наиболее адекватными моделями оказались ARIMA(4,1,1) и ARIMA(3,1,2), на основании которых был построен прогноз на период 1976-2000 гг. с 50%-ным доверительным интервалом [7]. Пфла-умер в 1992 г. проанализировал численность населения США за 1900-1988 гг., на основании модели ARIMA(2,2,0) и модели ARIMA(1,1,0) в логарифмах был построен прогноз до 2080 г. с 95%-ным доверительным интервалом [8].

За последние два десятилетия во многих странах заметно увеличилась средняя продолжительность жизни мужчин и женщин. Ряд авторов применили ARIMA-модели к анализу

средней продолжительности жизни мужчин и женщин в Италии и США за 1900-2006 гг. Наиболее удовлетворительными моделями оказались АЯ1МА(2,1,1) для женщин и АЯ1МА(1,1,1) для мужчин, на основании которых были построены прогнозы до 2050 г. с 80%-ным и 95%-ным доверительными интервалами [9-11]. Интересным является результат, что средняя продолжительность жизни к 2050 г. для женщин составит 97 лет, для мужчин 88 лет.

Отметим, что отечественные демографы при построении прогнозов по демографическим данным, как правило, отдают предпочтение математическим методам и когортно-компонентному анализу. Основной целью данной работы является развитие статистической методологии анализа

и прогнозирования демографических данных. В своем исследовании подробнее остановимся на применении АЫМА-моделей к демографическим данным по России и продемонстрируем возможности прогнозирования с использованием данного класса моделей.

Методика исследования

ЛШМЛ-модели: теоретические предпосылки. Рассмотрим временной ряд наблюдений у1,у2....,уп некоторого демографического показателя, в частности, суммарного коэффициента рождаемости в России за 1990-2014 гг. (рис. 1). Эти наблюдения будут рассматриваться как реализация случайных величин, которые описываются некоторым стохастическим процессом.

Рис. 1. Суммарный коэффициент рождаемости в России [12]

Ключевым понятием при АЫМА-модели-ровании является стационарность случайного процесса. Случайный процесс принято называть слабо стационарным, если среднее, дисперсия и ковариация у, не зависят от времени Е (У,) = Ц<ж, V(у,) = ^ соу(у, у,_к) = ук [13].

Заметим, что многие демографические временные ряды не являются стационарными, имеют сложную структуру, и их элементы формируются под воздействием различных факторов, как и многие другие явления нашего общества. В исследованиях, как правило, выделяют четыре типа факторов [14]. Долговременные факторы формируют общую тенденцию изменения анализируемого показателя у,, описываемую неслучайной функцией - функцией тренда. Например, ряды коэффициента суммарной рождаемости (см. рис. 1), ожидаемой продолжительности жизни для мужчин и женщин (рис. 2) в России и г. Москве за период 1990-2014 гг. содержат трен-

ды. Однако, как показывает визуальный анализ графиков, функции, описывающие трендовые составляющие для рассматриваемых процессов, могут различаться.

Сезонные факторы формируют периодически повторяющиеся в определенное время года колебания анализируемого показателя. В качестве примера можно рассмотреть количество браков, заключенных по месяцам, в России в период 2005-2015 гг. (рис. 3). Легко заметить, что данный показатель носит сезонный характер.

Как отмечают демографы, в современной России в мае регистрируется в три-четыре раза меньше браков, чем в августе. Сравнительно мало браков заключается также в январе-марте, а больше всего - в августе и сентябре, снижение частоты заключения браков в декабре и апреле связывают с распространением церковной регистрации и обряда венчания (на эти месяцы обычно приходятся посты). В 2010 г. больше всего браков

82,0 80.0 78.0 76,0 74,0 72,0 70.0 68.0 66,0 64,0 62,0 60,0 58.0 56,0

. »»

-Л-«

V**

А-

А- ■А-

* Л!

А А"

к. А А -м -м А. Л

# ^ ^ # / / / # / ^

О ^

—Россия (мужчины) -С—Россия (женщины)

ж- - Москна (мужчины) --♦-- Москна (женщины)

Рис. 2. Ожидаемая продолжительность жизни мужчин и женщин при рождении в России и г. Москве (число лет) [12]

■Г .Г 'Г -Г -Р # Рис. 3. Число зарегистрированных браков (тыс.) по месяцам регистрации [12]

было зарегистрировано в июле (164,3 тыс., что 4 раза больше, чем в мае), а в 2012 г. - в августе (168,0 тыс. - в 3,7 раза больше, чем в мае) [15]. Похожая динамика сохранилась и в 2013-2015 гг. Отметим, что сезонность присутствует также в ряде других демографических показателей: рождаемости, смертности, заболеваемости, миграции. Третий тип - циклические факторы - формируют изменения анализируемого признака, обусловленные действием долговременных циклов (в частности демографических). Отметим, что для изучения демографических циклов требуются длинные временные ряды. И последний тип факторов - случайные факторы - не поддаются учету, их воздействие на формирование значений временного ряда обусловливает стохастическую природу элементов ряда.

Существует несколько способов определения, является ли ряд стационарным. Во-первых, графический анализ: наличие тренда или периодической составляющей, возрастание или убывание разброса наблюдений со временем является индикатором нестационарности ряда. Так, на рис. 1-2 изучаемые временные ряды - коэффициент суммарной рождаемости, ожидаемая продолжительность жизни мужчин и женщин - являются нестационарными временными рядами из-за наличия тренда. Во-вторых, анализ графика выборочной автокорреляционной функции (ЛСБ) (коррелограммы) и частной автокорреляционной функции (РЛСБ), характеризующей «чистую корреляцию» между у, и при исключении влияния промежуточных значений У,_1,У,_2,...,У,_к+1. Для стационарных временных рядов графики автокорреляционной

функции и частной автокорреляционной функции «быстро убывают» после нескольких первых значений лагов. В-третьих, использование статистических тестов на стационарность, например, расширенного ADF-теста Дики - Фуллера (Dickey, Fuller), PP-теста Филлипса - Перрона (Phillips, Perron), KPSS-теста Квятковского - Филлипса - Шмидта - Шина (Kwiatkowski, Philips. Schmidt, Shin) [13].

Модель авторегрессии и скользящего среднего ARMA(p, q) (Autoregressive Moving Average) в общем виде выглядит следующим образом:

У, ~а1 У,-1 -... ~арУ,-p = = р + et -Qiet-1 -... -в et-

(1)

где в{ - белый шум, обладающий свойствами: математическое ожидание /л = 0, дисперсия у0 = с2, ковариации = 0, к > 0. На практике используют, как правило, ЛЯМЛ-модели не выше 2-го порядка. При моделировании демографических явлений исследователи сталкиваются с нестационарными процессами, которые могут быть приведены к стационарному виду при помощи оператора последовательной разности. По определению, первая разность - это Ду, = у, - уг-1. Пусть случайный процесс уг после того, как к нему применили ё раз оператор последовательной разности, стал стационарным процессом Дёу, удовлетворяющим одной из ЛЯМЛ(р, q)-моделей. В этом случае процесс у, принято называть интегрированным процессом авторегрессии и скользящего среднего ЛЯ1МЛ(р, d, q). Такой процесс в общем случае имеет вид:

Дау, = £ + ±а,Дёу,_1 + е, + £ в^^ . (2)

1=1 ]=1

Также в литературе распространена запись ЛЯ1МЛ(р, d, q)-модели через лаговый оператор:

а^у, =р + вч (Ь)е,, (3)

где 1у(=у,_1, Ьку(=у_к. «р(Ь) = 1 - о^Ь - «2Ь2.. - ар Lp, вч (Ь) = 1 + + #2Ь2.. + вч Ь.

Отметим, что на практике встречаются процессы с порядком интегрирования ё не более двух. В основе прогнозирования с использованием ЛЯ1МЛ-моделей лежит методология Бокса - Дженкинса, которая содержит три этапа: идентификация модели, оценивание и проверка адекватности модели, прогнозирование. На этапе идентификации модели необходимо протестировать ряды на стационарность и подобрать ЛЯ1МЛ-модель для дальнейшего оценивания. На втором этапе параметры ЛЯ1МЛ-моделей оцениваются методом максимального правдоподобия. Для проверки адекватности полученных ЛЯ1МЛ-моделей и их сравнения используют

несколько критериев: оценки коэффициентов модели должны быть статистически значимыми, остатки модели должны обладать свойствами белого шума (анализ автокорреляционной функции pk = 0, критерий Льюинга - Бокса, тест Брой-ша - Годфри). В случае, когда несколько ARIMA-моделей оказываются адекватными, необходимо выбрать модель с наименьшим количеством параметров и наилучшими статистическими характеристиками качества подгонки модели, для чего обычно используют информационный критерий Акаике (AIC) и критерий Шварца (BIC) [13]. Отметим, что данная методика реализована в большинстве статистических пакетов, например Stata, R, Gretl, Eviews и др.

SARIMA: моделирование сезонных эффектов в демографических данных. Одним из расширений ARIMA-моделей является учет сезонности, оценивание так называемых SARIMA-моделей, сочетающих в себе сезонную составляющую и обычную ARIMA-модель. В сезонных SARIMA-моделях необходимо также оценить дополнительные параметры сезонных компонент: SARIMA(p, d, q)(Ps, Ds, Qs), Ps - сезонный порядок авторегрессии, Ds - порядок сезонной разности, Qs - сезонный порядок скользящего среднего. В общем виде мультипликативная сезонная модель SARIMA(p, d, q)(Ps, Ds, Qs) в записи через лаговый оператор имеет вид

«р (L)«Ps (L)Ad A^Sdy, = 0q (L)^ (L)e,, (4)

где aPs (L) = 1 - as1Ls - as2L2s.. - asPLPs,

^qs(L) = 1 + ^Ls + + ^SQLQs.

Построение SARIMA-моделей аналогично анализу ARIMA-моделей.

ARFIMA: моделирование процессов с долгой памятью в демографии. Обобщением модели ARIMA(p, d, q), когда параметр d может принимать любое действительно число, являются модели ARFIMA(p, d, q) (Fractionally Integrated Autoregression and Moving Average), представи-мые в виде

\ d

^ У, =&q (L)et'

v., ,«p(L) = 1 -o^L^L2.. „p.

9q (L) = 1 + 6'1L + #2L2.. + вчLq,-1<d<1. Показано,

что в случае —0.5<d<0.5 ARFIMA-процесс является стационарным и обратимым, а автокорреляции pk убывают с гиперболической скоростью. Формально стационарный процесс определяется как процесс с длинной памятью, если существуют такие числа а, с (0<а<1, с>0), что для автокорреляционной функции исследуемого процесса выполняется соотношение

ap (L)(1 - L) dyt =0q (L)e,, (5) где Lv,=У,-1 Lky,=yt-k. «p(L) = 1 - «1L - «2L2.. - aPLp,

lim-^- = 1. (6)

k ck

Для идентификации процессов с длинной памятью традиционно используется R/S-анализ, предложенный Херстом [16] и Мандельбротом [17]. В предложенном подходе анализируется R/S-статистика, вычисляемая как отношение размаха частичных сумм (R) центрированных значений ряда к его стандартному отклонению (S). Идея R/S-анализа состоит в том, что в предположении полного отсутствия памяти размах ряда увеличивается пропорционально корню из величины временного промежутка, т.е. R/S ~ ctH, H = 0,5 (показатель степени H называют показателем Херста). В противном случае показатель Херста H характеризует наличие памяти во временном ряду. При 0,5 < H < 1 процесс является персистентным, т.е. монотонно следует вдоль детерминированного тренда, а при 0 < H < 0,5 процесс называют антиперсистент-ным - обладающим свойством высокочастотной изменчивости значений относительно тренда. Для проверки гипотезы об отсутствии длинной памяти в ряду используется модифицированная статистика, предложенная Ло [18] и рассчитываемая на основе R/S-статистики.

Результаты

Анализ динамики коэффициента суммарной рождаемости (КСР) с использованием ARIMA-моделей. Рассмотрим более подробно содержание методологии Бокса - Дженкинса на примере российских демографических данных -коэффициента суммарной рождаемости за период 1990-2014 гг. Длина временного ряда составила

Характеристики точно<

24 наблюдения. АББ-тест Дики - Фуллера показал, что исследуемый процесс является нестационарным для всех спецификаций (с константой, с константой и трендом, без них) и имеет порядок интегрирования d = 1 (ряд был приведен к стационарному виду взятием первой разности). Анализ графика и его автокорреляционной и частной автокорреляционной функций свидетельствует о нестационарности изучаемых процессов, что также подтвердили АББ-тесты Дики - Фуллера, в частности, статистика ББ = -2,387 (для случая с константой и трендом). В результате оценивания и сравнения нескольких АЯ1МА-моделей (разных порядков авторегрессии и скользящего среднего) наиболее адекватной оказалась модель АЯ1МА(1,1,0) для КСР, имеющей вид (7). В круглых скобках указаны стандартные ошибки. Ду =-0,011 + 0,629Дуг_1 + в,, сг = 0,068. (7)

(0,04) (0,182) Для рассматриваемой модели КСР О-статисти-ка = 7,04, А1С = -49,261 В1С = -45,988. Значения автокорреляционных функций остатков равны нулю, О-статистика Льюинга - Бокса и статистика теста Бройша - Годфри свидетельствуют об отсутствии автокорреляции в процессе остатков, это позволяет сделать вывод о том, что процесс остатков обладает свойствами белого шума.

Наряду с оценкой адекватности модели, для оценки качества и точности прогноза по полученной модели использовались характеристики, представленные в табл. 1. Отметим, что полученные характеристики точности прогноза свидетельствуют о достаточно высоких прогностических свойствах полученной АЯ1МА(1,1,0)-модели для КСР.

Таблица 1

прогноза в модели КСР

Характеристика точности прогноза Формула вычисления Значение характеристики

Средняя квадратичная ошибка MSE У (у, - У, )2 t=1 п 0,004

Средняя абсолютная процентная ошибка 1 n У y MAPE = У у' у' ■ 100% п = У, 3,82

Средняя процентная ошибка 1 п У У MPE = Ууt ■ 100% п ,=1 У, 0,31

На рис. 4 представлены наблюдаемые значения КСР и предсказанные по АЯ1МА-модели для России, а также построен 80%-ный и 95%-ный доверительные интервалы прогноза до 2020 г. В табл. 2 приведены прогнозные значения КСР в России на основе полученной АЯТМА-модели с 80%-ным и 95%-ным

доверительными интервалами. Результаты моделирования показывают, что на протяжении 2015-2022 гг. в России будет наблюдаться замедление роста коэффициента суммарной рождаемости до значения 1,73 на одну женщину в 2022 г. и наметится тенденция к снижению данного показателя.

Рис. 4. КСР в России: наблюдаемые и предсказанные значения на основе ЛЯ1МЛ(1,1,0)-модели с 80%-ным и 95%-ным доверительными интервалами

Таблица 2

Прогнозные значения КСР в России на основе АШМА(1,1,0)-модели с 80%-ным и 95%-ным доверительными интервалами

Год Прогноз Статистическая ошибка 95%-ный доверительный интервал 80%-ный доверительный интервал

2015 1,77 0,07 (1,63, 1,89) (1,68, 1,85)

2016 1,78 0,13 (1,53, 2,02) (1,61, 1,93)

2017 1,78 0,18 (1,42, 2,12) (1,54, 2,01)

2018 1,77 0,23 (1,31, 2,22) (1,47, 2,06)

2019 1,76 0,28 (1,21, 2,30) (1,40, 2,11)

2020 1,75 0,32 (1,12, 2,37) (1,34, 2,16)

2021 1,74 0,36 (1,04, 2,44) (1,28, 2,19)

2022 1,73 0,39 (0,96, 2,50) (1,22, 2,23)

Анализ числа зарегистрированных браков в ванных браков в России носит ярко выраженный России с помощью БАШЫА-моделей. Как было сезонный характер с пиками в июле-сентябре и отмечено выше, показатель числа зарегистриро- резкими спадами в мае (рис. 5).

январь

декабрь

ноябрь

октябрь

сентябрь

февраль

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

август

Рис. 5. Число зарегистрированных браков (тыс.) по месяцам регистрации в 2005, 2010, 2014 гг. [12]

Анализ автокорреляционной и частной автокорреляционной функций исходного ряда позволил сделать предположение о периоде сезонности Б = 12. Для анализа был рассмотрен временной интервал с января 2003 г. по август

2015 г. Длина временного ряда для данного показателя составила 115 наблюдений. При моделировании была взята одна сезонная разность. Удовлетворительной оказалась модель 8ЛЯ1МЛ(0,0,1)(3,1,0)12 в виде

(1 + 0,57L12 + 0,48L24 + 0,46L36)A12yt = 0,78 + (1 + 0,34L3)et, a = 11,47. (0,08) (0,09) (0,10) (0,64) (0,09)

(8)

На основании теста Льюинга - Бокса для 24 лагов ^-статистика = 26,66) был сделан вывод, что процесс остатков для оцененной модели обладает свойствами белого шума. В табл. 3 представлены прогнозные значения числа зарегистрированных браков на 2016 г. Результаты показывают, что в целом сезонный характер показателя на будущий год останется примерно таким же, как и в предыдущие годы.

Таблица 3

Прогнозные значения числа зарегистрированных браков в России в 2016 г. по месяцам регистрации (тыс.) на основе 8АШМА-модели

Месяц Прогноз 95%-ный доверительный интервал

Январь 58,66 (34,86, 82,45)

Февраль 71,34 (47,54, 95,13)

Март 63,98 (40,18, 87,77)

Апрель 98,29 (74,49, 122,08)

Май 49,02 (25,23, 72,81)

Июнь 129,21 (105,41, 153,01)

Июль 145,11 (121,31, 168,91)

Август 167,86 (144,06, 191,65)

Сентябрь 151,17 (125,49, 176,85)

Октябрь 107,73 (82,04, 133,40)

Ноябрь 95,27 (69,58, 120,95)

Декабрь 95,34 (69,43, 121,23)

Моделирование процессов с долгой памятью в демографии. Эмпирические демографические исследования показывают, что достаточно часто встречаются процессы с длинной памятью (long-memory processes), когда существует сильная зависимость между отдаленными наблюдениями

[19]. Гранджер в 1980 г. одним из первых определил, что процессы с длинной памятью могут появляться в результате макроагрегирования традиционных стационарных временных рядов

[20]. Можно предположить, что при анализе длинных временных рядов демографических данных также встречаются процессы с длинной памятью. На сайте журнала «Демоскоп» [21] представлены длинные ряды демографических данных (за 250 лет) по некоторым показателям, таким как общий коэффициент рождаемости, общий коэффициент смертности, коэффициент суммарной рождаемости, коэффициент младенческой смертности по некоторым европейским странам. В качестве примера рассмотрим ряд общего коэффициента рождаемости во Франции за период 17402014 гг. (годовые данные) (рис. 6). Длина временного ряда составила 275 наблюдений. Динамика ряда характеризуется убывающим трендом и с резким провалом в годы Первой мировой войны. Вторым показателем для исследования процессов с длинной памятью был взят уровень безработицы в России за период с января 1996 г. по январь 2016 г. (рис. 7). Длина временного ряда составила 265 наблюдений.

Рис. 6. Общий коэффициент рождаемости во Франции (1740-2014 гг.) [21, 22]

Рис. 7. Уровень безработицы в России (январь1996 - январь 2016 гг.) [12]

Отметим, что для исследуемых процессов тельствовать в пользу моделей с долгой памятью. значения автокорреляционных функций убывают В случае уровня безработицы наблюдается также достаточно медленно (рис. 8), что может свиде- слабовыраженная сезонность.

а б

Рис. 8. АСЕ для общего коэффициента рождаемости во Франции (а) и уровня безработицы

в России (б)

В нашем исследовании Я/Б-анализ показал, что ряд общего коэффициента рождаемости во Франции и уровня безработицы в России не обладают свойствами процессов с длинной памятью. Рассчитанная тестовая Ьо-статистика показала, что на уровне значимости 0,01 гипотеза об отсутствии длинной памяти не отвергается: Ьо1 = 1,59; Ьо2 = 1,46 соответственно; значения тестовой статистики обоих показателей лежат вне интервала (0,721, 2,098). Для анализируемых показателей были подобраны обычные АЯ1МА-модели. Анализ качества оцененных моделей показал, что наиболее удовлетворительной моделью для общего коэффициента рождаемости во Франции является АЯ1МА(1,0,0) с детерминированным линейным трендом, а для уровня безработицы в России - БАЯ1МА(2,1,0)(1,1,1)12. Остатки полученных моделей обладают свойствами белого шума.

В работе были рассмотрены несколько примеров моделирования демографических процессов с помощью АЯ1МА-моделей и их обобщений: БАЯ1МА и АКЛМА-моделей. Было показано, что исследуемый в работе демографический процесс - коэффициент суммарной рождаемости удовлетворительно описывается процессом авторегрессии 1-го порядка, несмотря на небольшой объем выборки. В случае сезонности для показателя числа браков, заключенных по месяцам, в России удовлетворительной моделью оказалась 8АЯ1МА(0,0,1)(3,1,0)12. Все полученные модели оказались адекватными, а характеристики точности прогноза показали достаточно высокие прогностические свойства полученных моделей. При анализе длинных временных рядов: общего коэффициента рождаемости во Франции (Т = 275) и уровня безработицы в России (Т = 265) - при помощи Я/Б-теста свойств процессов с длинной

памятью выявлено не было, данные процессы удовлетворительно были описаны моделями ARIMA(1,0,0) с детерминированным линейным трендом и SARIMA(2,1,0)(1,1,1)12 соответственно. Развитая в работе статистическая методология анализа и прогнозирования демографических процессов может быть использована как один из способов демографического прогнозирования, которое на сегодняшний день приобретает все большую значимость как во внутренней политике при социально-экономическом планировании развития страны в целом или отдельных субъектов, так и на международной арене.

Список литературы

1. Box G. P., Jenkins G. M. Time Series Analysis Forecasting and Control. San Francisco : Holden-Day, 1970. 554 p.

2. Hiorns R. W. Mathematical Models in Demography // The Structure of Human Populations. Ed. by G. A. Harrison, A. Z. Boycl. Oxford : Clarendon Press. 1972. Р. 110-127.

3. Lee R. Forecasting Births in Post-Transition Populations // Journal of the American Statistical Association. 1974. Vol. 69. P. 607-617.

4. Pollard J. H. On Simple Approximate Calculations Appropriate to Populations with Random Growth Rates // Theoretical Population Biology. 1970. Vol. 1. P. 208-218.

5. Saboia J. L. M. Modeling and Forecasting Populations by Time Series - The Swedish Case // Demography. 1974. Vol. 11. P. 483-492.

6. Kashyap R. L., Rao A. R. Dynamic Stochastic Models from Empirical Data. N.Y. ; L. : Academic Press, 1976. 352 p.

7. Saboia J. L. M. Autoregressive Integrated Moving Average (ARIMA) Models for Birth Forecasting // Journal of the American Statistical Association. 1977. Vol. 72 (358). P. 264-270.

8. Pflaumer Р. Forecasting US population totals with the Box - Jenkins approach // International Journal of Forecasting. 1992. Vol. 8. P. 329-338.

9. Tiziana T., Vaupel J. W. Forecasting life expectancy in an international context // International Journal of Forecasting. 2012. Vol. 28. P. 519-531.

10. Alho J. M., Spencer B. D. Statistical demography and forecasting. Springer, 2005. 410 p.

11. Booth H. Demographic forecasting : 1980 to 2005 in review // International Journal of Forecasting. 2006. Vol. 22. P. 547-581.

12. Росстат. URL: http://www.gks.ru (дата обращения: 22.03.2016).

13. Мхитарян В. С., АрхиповаМ. Ю., БалашВ. А., Балаш О. С., Дуброва Т. А., Сиротин В. П. Эконометрика / под общ. ред. В. С. Мхитаряна. М. : Проспект, 2014. 384 с.

14. Айвазян С. А. Методы эконометрики. М. : ИНФРА-М, 2010. 510 с.

15. Щербакова Е. Число зарегистрированных браков и разводов в 2012 году снизилось // Демоскоп weekly. 2013. № 541-542. URL: http://demoscope. ru/weekly/2013/0541/barom04.php (дата обращения: 20.12.2015).

16. Hurst H. E. Long term Storage Capacity of Reservoirs // Transactions of the American Society of Civil Engineers. 1951. Vol. 116. P. 770-799.

17. Mandelbrot B. Statistical methodology for non-periodic cycles : From the covariance to R/S analysis // Annals of Economic and Social Measurement. 1972. Vol. 1. P. 259-290.

18. Lo A. W. Long-term memory in stock market prices // Econometrica. 1991. Vol. 59. P. 1279-1313.

19. HyndmanR. J., BoothH., YasmeenF. Coherent Mortality Forecasting : The Product-Ratio Method With Functional Time Series Models // Demography. 2013. Vol. 50, iss. 1. P. 261-283.

20. Granger C. W. Long memory relationships and the aggregation of dynamic models // Journal of Econometrics. 1980. Vol. 14, iss. 2. P. 227-238.

21. Демоскоп : [сайт]. URL: http://www.demoscope.ru/ weekly/app/long_cbr.php (дата обращения: 22.03.2016).

22. World Bank : [сайт]. URL: http://www.worldbank.org (дата обращения: 22.03.2016).

The Statistical Approach to the Analysis and Forecasting of Demographic Data

E. D. Kopnova

National Research University Higher School of Economics, 31, Shabolovka str., Moscow, 115162, Russia E-mail: [email protected]

L. A. Rodionova

National Research University Higher School of Economics, 31, Shabolovka str., Moscow, 115162, Russia E-mail: [email protected]

Introduction. Possibilities of application ARIMA-models to analysis and forecasting of demographic time series were considered in the article. Foreign studies had shown that the ARIMA-models give good results for forecasting indicators such as population, birth rates and death rates, life expectancy, along with the traditional demographic methods (cohort-component approach). Research technique. Box - Jenkins methodology of the analysis and forecasting of time series, particularly with regard to demographic data: total fertility rate in Russia (1990-2014), the number of marriages by months in Russia (2005-2015), total fertility rate in France (1740-2014) and the unemployment rate in Russia (1996-2016) was used in the work. ARIMA-, ARIMA- and ARIMA-models, depending on the nature of the dynamics of the studied indicators were analyzed. Results. The analysis had shown that the estimated ARIMA-models for the total fertility rate and number of marriages were adequate and had good statistical and prognostic properties. Forecasts were built on basis of the obtained models. In the case of long series availability of properties with a long memory processes have not been identified.

Key words: time series analysis, ARIMA-model, SARIMA-model, ARFIMA-model, statistical methods.

References

1. Box G. P., Jenkins G. M. Time Series Analysis Forecasting and Control. San Francisco: Holden-Day, 1970. 554 p.

2. Hiorns R. W. Mathematical Models in Demography. The Structure of Human Populations. Ed. by G. A. Harrison, A. Z. Boycl. Oxford, Clarendon Press, 1972, pp. 110-127.

3. Lee R. Forecasting Births in Post-Transition Populations. Journal of the American Statistical Association, 1974, vol. 69, pp. 607-617.

4. Pollard J. H. On Simple Approximate Calculations Appropriate to Populations with Random Growth Rates. Theoretical Population Biology, 1970, vol. 1, pp. 208-218.

5. Saboia J. L. M. Modeling and Forecasting Populations by Time Series - The Swedish Case. Demography, 1974, vol. 11, pp. 483-492.

6. Kashyap R. L., Rao A. R. Dynamic Stochastic Models from Empirical Data. New York, London, Academic Press, 1976. 352 p.

7. Saboia J. L. M. Autoregressive Integrated Moving Average (ARIMA) Models for Birth Forecasting. Journal of the American Statistical Association, 1977, vol. 72 (358), pp. 264-270.

8. Pflaumer P. Forecasting US population totals with the Box - Jenkins approach. International Journal of Forecasting, 1992, vol. 8, pp. 329-338.

9. Tiziana T., Vaupel J.W. Forecasting life expectancy in an international context. International Journal of Forecasting, 2012, vol. 28, pp. 519-531.

10. Alho J. M., Spencer B. D. Statistical demography and forecasting. Springer, 2005. 410 p.

11. Booth H. Demographic forecasting: 1980 to 2005 in review. International Journal of Forecasting, 2006, vol. 22, pp. 547-581.

12. Rosstat. Available at: http://www.gks.ru (accessed 22 Mart 2016).

13. Mhitarjan V. S., Arhipova M. Ju., Balash V. A., Balash O. S., Dubrova T. A., Sirotin V. P. Ekonometrika [Econometrics. Ed. by V. S. Mhitarjan]. Moscow, Prospekt Publ., 2014. 384 p.

14. Ajvazjan S. A. Metody jekonometriki [Econometrics Methods]. Moscow, INFRA-M Publ., 2010. 510 p.

15. Scherbakova E. Chislo zaregistrirovannykh brakov i razvodov v 2012 godu snizilos' (The number of registered marriages and divorces decreased in 2012). Demoskop weekly (Demoscope weekly), 2013, № 541-542. Available at: http://demoscope.ru/weekly/2013/0541/ barom04.php (accessed 20 December 2015).

16. Hurst H. E. Long term Storage Capacity of Reservoirs. Transactions of the American Society of Civil Engineers, 1951, vol. 116, pp. 770-799.

17. Mandelbrot B. Statistical methodology for non-periodic cycles: From the covariance to R/S analysis. Annals of Economic and Social Measurement, 1972, vol. 1, pp. 259-290.

18. Lo A. W. Long-term memory in stock market prices. Econometrica, 1991, vol. 59, pp. 1279-1313.

19. Hyndman R. J., Booth H., Yasmeen F. Coherent Mortality Forecasting: The Product-Ratio Method With Functional Time Series Models. Demography, 2013, vol. 50, iss. 1, pp. 261-283.

20. Granger C. W. Long memory relationships and the aggregation of dynamic models. Journal of Econometrics, 1980, vol. 14, iss. 2, pp. 227-238.

21. Demoskop. Site. Available at: http://www.demoscope.ru/ weekly/app/long_cbr.php (accessed 22 Mart 2016).

22. World Bank. Site. Available at: http://www.worldbank.org (accessed 22 Mart 2016).

УДК 336.225.66 (470.44)

К ВОПРОСУ О ЛЬГОТНОМ РЕЖИМЕ НАЛОГООБЛОЖЕНИЯ ДЛЯ СУБЪЕКТОВ МАЛОГО ПРЕДПРИНИМАТЕЛЬСТВА В САРАТОВСКОЙ ОБЛАСТИ

М. В. Голубниченко

кандидат экономических наук, доцент кафедры финансов и кредита, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского E-mail: [email protected]

Введение. В условиях экономического кризиса в России остро ощущается необходимость государственной поддержки субъектов малого предпринимательства, особенно в виде снижения налоговой нагрузки на предприятия на уровне региона. Необходимо проанализировать особенности льготного режима налогообложения для субъектов малого предпринимательства в Саратовской области и его влияние на развитие малого бизнеса в последние годы. Этим определяется актуальность исследования. Теоретический анализ. В Саратовской области

льготный налоговый режим для субъектов малого предпринимательства представлен в ряде региональных законов. В частности, установлены дифференцированные налоговые ставки при применении упрощенной системы налогообложения для отдельных категорий налогоплательщиков, введены двухлетние «налоговые каникулы» по 11 видам деятельности при патентной системе налогообложения и 72 видам деятельности при упрощенной системе налогообложения. С 1 января 2016 г. снижена стоимость патентов по отдельным видам деятельности, а также

i Надоели баннеры? Вы всегда можете отключить рекламу.