Научная статья на тему 'Методы прогнозирования в регрессионных и адаптивных моделях при анализе динамических рядов'

Методы прогнозирования в регрессионных и адаптивных моделях при анализе динамических рядов Текст научной статьи по специальности «Математика»

CC BY
1839
124
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Theoretical foundations of forecasting in adaptive and regression models and applications of these models in dynamic sequences analysis are regarded in the article. The statistical conditions of adequacy of the chosen model to the investigated process are discussed. The efficiency of the adaptive and regression models using for demographic processes forecasting is shown. A level of birth rate in Omsk region is analyzed with the help of considered models. The conclusion is made about the greatest conformity of the investigated process to the adaptive model with the factor of smoothing 0.6 and to the regression polynomial model with k = 3. It is emphasized that it is better to use the adaptive model to forecast demographic parameters when a non-stable socio economic situation holds. Regression models should be applied to the analysis of the phenomena having stable general laws of development during the period of the forecast/

Текст научной работы на тему «Методы прогнозирования в регрессионных и адаптивных моделях при анализе динамических рядов»

УДК 519.281:330.115

МЕТОДЫ ПРОГНОЗИРОВАНИЯ В РЕГРЕССИОННЫХ И АДАПТИВНЫХ МОДЕЛЯХ ПРИ АНАЛИЗЕ ДИНАМИЧЕСКИХ РЯДОВ

И.П. Геращенко

Theoretical foundations of forecasting in adaptive and regression models and applications of these models in dynamic sequences analysis are regarded in the article. The statistical conditions of adequacy of the chosen model to the investigated process are discussed. The efficiency of the adaptive and regression models using for demographic processes forecasting is shown. A level of birth rate in Omsk region is analyzed with the help of considered models. The conclusion is made about the greatest conformity of the investigated process to the adaptive model with the factor of smoothing 0.6 and to the regression polynomial model with k = 3. It is emphasized that it is better to use the adaptive model to forecast demographic parameters when a non-stable socio economic situation holds. Regression models should be applied to the analysis of the phenomena having stable general laws of development during the period of the forecast

Информационной базой для анализа социально-экономических процессов являются динамические ряды. Динамические ряды качественно отличаются от простых статистических выборок. Эти отличия заключаются в следующем:

- последовательные во времени уровни временных рядов являются взаимозависимыми, особенно это относится к близко расположенным наблюдениям;

- в зависимости от момента наблюдения уровни во временных рядах обладают разной информативностью: информационная ценность наблюдений убывает по мере их удаления от текущего момента времени;

- с увеличением количества уровней временного ряда точность статистических характеристик не будет увеличиваться пропорционально числу наблюдений, а при появлении новых закономерностей развития она может даже уменьшиться.

При исследовании динамических рядов обычно выделяют четыре основных составляющих [1, 2]: долговременную эволюторно изменяющую составляющую

0 2000 И.П. Геращенко

Омский государственный педагогический университет

(Г), долговременные циклические колебания (АД, кратковременные циклические колебания (S') (сезонную компоненту) и случайную составляющую (Е):

Три первые составляющие, в принципе, представляют собой тренд, т.е. детерминированную составляющую. Случайная составляющая образована в результате суперпозиции большого числа внешних факторов, которые не участвуют в формировании детерминированной составляющей и оказывают, каждый отдельно, незначительное влияние на изменение показателя. В целом влияние этих факторов на изучаемый показатель проявляется в изменении во времени его значений. В зависимости от взаимосвязи факторов может быть построена аддитивная или мультипликативная модель ряда динамики. Аддитивная модель ряда динамики (Y = Т + К + S + Е) характеризуется главным образом тем, что характер циклических и сезонных флуктуаций остается постоянным. В мультипликативной модели ряда динамики (Y = TKSE) характер циклических и сезонных флуктуаций остается постоянным только по отношению к тренду.

Основная задача анализа динамических рядов состоит в выделении на основе знания отрезка ряда {yt, t = 1, 2,. . . , Г} детерминированной и случайной составляющих, а также в оценке их характеристик. Получив оценки детерминированной и случайной составляющих, можно решать задачи прогноза будущих значений как самого динамического ряда, так и его составляющих.

В случае аддитивной модели динамический ряд может быть представлен следующим образом:

где yt - значения динамического ряда; f(t, xt) - детерминированная составляющая; xt - значения детерминированных признаков, влияющих на детерминированную составляющую в момент времени t; et - случайная составляющая; Т -длина ряда.

Ряды динамики, у которых в качестве признака упорядочения используется время, называются временными (трендовая модель):

Они состоят из последовательных значений (уровней) показателя, характеризующего состояние процесса в определенные, как правило, равноотстоящие друг от друга моменты времени, причем каждый показатель представлен в большинстве случаев лишь одним временным рядом.

Для аппроксимации тенденции изменения исследуемого показателя применяют аналитическое выравнивание, используя при этом разнообразные математические функции, в которых задействован только один фактор - время. В общем случае соотношение (2) принимает следующую форму [3]:

Y = f(T,K, S, Е).

Vt = + et, t = 1,2,... ,T,

(1)

Vt — f(t) + et-

(2)

k

где - известные функции времени. Например, в случае полиномиальной

зависимости Pi(t) = t\ при экспоненциальной зависимости формула (3) преобразуется в соотношение

(4)

Vt — o.0eait + et,

а в простейшем случае линейного тренда - в

Vt = a о + apt + et.

(5)

Априорные предположения о форме тренда могут быть сформулированы в виде рабочей гипотезы. На практике прибегают к анализу графического изображения уровней динамического ряда. Целесообразно использовать для этих целей графическое изображение сглаженных уровней, в которых случайные и волнообразные колебания в некоторой степени погашены. При выборе вида зависимости /(t, xt) часто используют метод конечных разностей, который основан на свойствах различных кривых, применяемых при выравнивании динамических рядов. Например, в случае рабочей гипотезы о постоянстве абсолютных приростов (первая разность): fit + 1) — fit) = Ai = const, и нулевом значении абсолютных приростов Д2 = Ai (t + 1) — ДЦЦ = 0 приходим к линейному тренду. По Б. С. Ястремскому [4] для аналитического выравнивания динамического ряда применима линейна функция, если любые три равностоящих уровня имеют нулевую вторую разность. Порядок разностей, остающихся примерно равными друг другу, принимается за степень полинома, т.е., если примерно одну и ту же величину имеют вторые разности, то для выравнивания используется парабола второго порядка. Если же имеет место гипотеза постоянства темпов роста

/(4 + 1)

/СО

= const,

то получаем экспоненциальный тренд (4), который в логарифмах приводится к линейному.

Если тренд линеен относительно своих параметров или может быть сведен к линейному посредством преобразований, а случайная составляющая имеет известную матрицу ковариаций, то задача сводится к задаче множественной регрессии. Обозначив pft) через жщ уравнение (3) можно переписать в матричной форме:

X = Хос -)- е,

где Y - вектор-столбец значений уровня ряда; a - вектор-столбец коэффициентов уравнения регрессии; е - вектор-столбец отклонений фактических от выравненных значений; X - матрица значений (дЦЦ, включая единичный столбец, отвечающий свободному члену.

Параметры тренда оцениваются по методу наименьших квадратов [5], т.е. подбираются таким образом, чтобы график функции роста располагался на минимальном удалении от точек исходных данных. Математически критерий оценки параметров регрессионной модели записывается следующим образом:

где yi определяется по формуле (3). Оценки коэффициентов тренда получают из соотношений:

а = (XTX)~1XY, М(а) = а, S2a = <т2(ХтХ). (7)

Оценку дисперсии случайной составляющей получают по формуле

52 = ТчЬтЕ(^)-^ = тчЬтЕ^ (8)

к

где yt рассчитывается по формуле yt = a0 + ^ cti<fi(t).

i—1

Прогнозные значения детерминированной составляющей для случая независимых уровней остаточной компоненты можно определить или вычислить на основе экстраполяционных методов. Точечный прогноз детерминированной составляющей на глубину г выполняется по формуле

к

/(Г + г) = Y(T + г) = Хтa = a0 + ^аг(дг(й + г). (9)

%=1

Причем

M[f(T + r)] = f(T + r), a D[f(T + T)] = a2XT(T + T)(XTX)-1X(T + T),

где Хт(Т + г) = [1, pi(Т + г),..., рк(Т + г)].

Интервальный прогноз для детерминированной составляющей на глубину г при условии, что случайная составляющая имеет нормальное распределение, задается следующей формулой:

/(Г + г) - tpSf{T+T) < f(T + т)< f(T + т) + tpSf{T+Th (10)

где tp = St~1(p, Т — к — 1) - доверительная граница распределения Стьюдента с Т — к — 1 степенями свободы, соответствующая уровню значимости р, a Sj^t+t) определяется по формуле

Sf(T+r) = Ss/XT(T + т)(ХтХ)-'Х(Т + т).

В том случае, если тренд нелинеен относительно коэффициентов и его невозможно линеаризовать, применяют нелинейные методы оценки коэффициентов, основанные на итерационных процедурах, на каждом шаге которых используются алгоритмы линейных оценок. В качестве одного из таких методов нелинейного оценивания можно предложить метод Ньютона-Гаусса [3]. Кроме этого, часто используют для линеаризации тренда метод разложения в ряд Тейлора, ограничиваясь первыми, реже - вторыми производными [6]:

У(t) — «01, «02, • • •, a0fc] +

Е

эр

da.г

(a

«о г) + • • • + е.

Аналитическое уравнение представляет собой математическую модель развития явления и дает выражение статистической закономерности, проявляющейся в рядах динамики. Следует помнить, что прием аналитического выравнивания на основе регрессионных моделей содержит в себе ряд условностей, связанных прежде всего с тем, что уровни, характеризующие тот или иной динамический ряд, рассматриваются как функции времени. В действительности развитие явлений обусловлено не тем, сколько времени прошло с отправного момента, а тем, какие факторы влияли на развитие, в каком направлении и с какой интенсивностью. Развитие явлений во времени выступает как внешнее выражение этих факторов, как их суммарное действие, оказывающее влияние на изменение уровня в отдельно взятые промежутки или моменты времени. Выявить основную тенденцию развития методом наименьших квадратов можно лишь тогда, когда выяснено, что изменяющиеся во времени процессы протекают на всем рассматриваемом промежутке времени одинаково, что их количественное и качественное изменение происходит под действием одного и того же комплекса основных факторов, определяющих движение данного ряда динамики.

Модели, учитывающие общие закономерности изменения социально-экономического явления в изучаемый интервал времени и изменения во времени влияния комплекса факторов, называют многофакторными динамическими моделями [7]. Допустим, что величина исследуемого показателя yit) зависит от изменения нескольких факторов: ад, ж2, . . ., хт. Располагая данными по некоторой совокупности объектов за ряд лет, можно построить корреляционную модель, характеризующую зависимость yit) от указанных факторов для каждого периода времени. Связь между переменной у it) и т независимыми факторами можно охарактеризовать функцией регрессии yit) = /(ад, ад,. . . , жт), которая показывает, каково в среднем значение переменной y(t), если переменные х примут конкретные значения. Данное обстоятельство позволяет использовать модель регрессии не только для анализа, но и для прогнозирования социальноэкономических явлений.

Предположим, что зависимость может быть представлена линейной функцией. Тогда модель будет иметь вид:

для периода t = 1: гд = a0i + аиад + а21Ж2 + . . . + атщт;

для периода t = 2: у2 = а02 + оц2ад + а22ж2 + . . . + ат2хт;

для периода t = 3: у3 = а03 + одзад + а23х2 + . . . + ат3хт; и т.д.

Для всех периодов получим систему из Т уравнений, и для каждого из фак-

торов будет Т коэффициентов регрессии, т.е. будем иметь временные ряды для каждого из коэффициентов регрессии:

a0i «02 (103 ... a0T

ап «12 «13 ... а1Т

«21 «22 «23 ■■■ а2Т

«ml ((m2 ((m3 ■ ■ ■ &тТ

Рассматривая каждый из этих временных рядов, можно представить ат как

функцию времени и, используя аналитическое выравнивание методом регрессионного анализа, построить прогнозы коэффициентов регрессии на период времени t, т.е. определить значения величин a0t, «и, a2t} ■ ■ ., amt.

Тогда величина признака у на период t может быть представлена как:

Значения факторов ад, ж2, . . хт необходимо определить также на момент времени t. Обычно для этого используют либо контрольные цифры, либо экстраполяцию по линии тренда.

В динамических процессах в большинстве практических случаев сбор данных или весьма затруднителен, или связан с большими затратами, поэтому чаще всего каждому значению зависимой переменной yit) соответствует только одно наблюдение независимых переменных ад, ад, • • хт. Тогда уравнение (11) преобразуется в следующее соотношение:

и его коэффициенты определяются методом наименьших квадратов по формуле (7). Интервальная оценка прогноза для У, определяемая в точке Х(Т+т) = (1, аду+т, х2Х+т, • • •, хтт+т) определяется по формуле аналогичной (10).

Следует подчеркнуть, что прогноз уровня, характеризующего определенный объект с опорой на метод аналитического выравнивания, основан на предположении, что те же самые условия, в которых формировались уровни ряда в прошлом, будут существовать и в будущем. Использование экстраполяции в изменившихся условиях, появление новых факторов, оказывающих влияние на формирование уровней временного ряда, будет сопряжено с более или менее значительными ошибками. Причем экстраполяция на отдаленные даты подвержена более значительным ошибкам, чем краткосрочная экстраполяция. Это в известной степени может объясняться определенной инерционностью развития управляемых объектов: чем выше уровень управления, тем более инерционен объект управления. Однако с удалением периода прогноза от фактических уровней временного ряда влияние инерционности развития снижается и возрастает влияние новых условий и факторов. Поэтому целесообразно постоянно обновлять временные ряды по мере получения новых данных, что обуславливает и корректировку уровней ряда.

Выделим особенности модели аналитического выравнивания уровней динамического ряда методом регрессионного анализа, которые накладывают ограничения на ее использование. Во-первых, динамические ряды, к которым применяется аппроксимация, должны быть достаточно длинными. Во-вторых, применение аппроксимации наиболее целесообразно в случае медленно и плавно меняющегося уровня. В-третьих, аппроксимация как метод моделирования практически не адаптируется к изменяющимся условиям формирования уровней ряда; при появлении новых данных построение модели должно быть проведено заново. В-четвертых, при использовании для расчета параметров уравнения

Ut — aot + aitxi + a2tx2 + • • • + amtxm

(И)

yit) = a0 + rtiXi(^) + a2X2it) + ... + amxm{t),

(12)

метода наименьших квадратов считается, что значимость информации в пределах отрезка аппроксимации одинакова независимо от давности полученных данных, в то время как более поздние данные имеют большую ценность.

Кроме этого, динамические ряды социально-экономических показателей часто имеют небольшую длину и подвержены значительным колебаниям, которые аппроксимация предвидеть не может. А в случае прогнозирования наиболее важным является не тенденция развития исследуемого процесса, сложившаяся в среднем на всем периоде предыстории, а последние значения этого процесса. Свойство динамичности развития экономического явления здесь преобладает над свойством его инерционности. Поэтому при прогнозировании более эффективными являются методы, учитывающие неравноценность уровней временного ряда и быстро приспосабливающие свою структуру и параметры к изменяющимся условиям. В практике анализа социально-экономических процессов такие методы получили название адаптивных методов моделирования и прогнозирования.

В основе адаптивных методов лежит модель экспоненциального сглаживания, возможность которой для прогнозирования была доказана Р. Брауном [3]. В отличие от линейных и нелинейных временных трендов, где на основании известного отрезка временного ряда {yt,t = 1,2,... , Г} необходимо было постулировать форму тренда с точностью до параметров, метод экспоненциального сглаживания позволяет анализировать временной ряд и получать прогноз без предварительного задания формы тренда. Требуется лишь, чтобы в области исследования тренд изменялся достаточно постепенно, эволюторно.

Сущность метода экспоненциального сглаживания заключается в том, что временной ряд сглаживается с помощью взвешенной скользящей средней, в которой веса распределяются по экспоненциальному закону. Наблюдения входят в обработку не с одинаковыми, а с экспоненциально убывающими весами, т.е. настоящие наблюдения воспринимаются с большим доверием, чем прошлые. Такая взвешенная скользящая средняя характеризует значения динамического ряда в конце интервала сглаживания, т.е. является характеристикой последних уровней ряда. В основе экспоненциального сглаживания лежит следующая теоретико-вероятностная схема:

yt = f(t) + et, M(et) = 0, D(et) = сг2, cov (ег, Cj) = 0, г ф j. (13)

Из первоначального временного ряда {yt,t = 1,2, сглаженный ряд

St(y) можно получить с помощью линейного оператора сглаживания:

St(y) = ayt + (1 - a)St-i(y) (14)

или для последнего уровня:

St (у) = °Ут + «(1 - се)уТ-1 + «(1 - а)2уТ-2 + • • • + «(1 - а)т~2у2 + (1 - a)Tyi,

где а - константа сглаживания, 0 < а < 0.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Оператор сглаживания линеен, поэтому, применяя его к отдельным составным частям теоретико-вероятностной схемы (13), можно в результате сложения получить результат сглаживания всего ряда.

Оператор сглаживания можно вновь применить к уже сглаженным значениям; в результате получим оператор сглаживания второго порядка. Применяя несколько раз оператор сглаживания, а также, подбирая соответствующим образом константу сглаживания, можно практически исключить случайную составляющую, в результате останется только преобразованная детерминированная составляющая.

Одним из главных преимуществ экспоненциального сглаживания в отличие, например, от метода скользящей средней, является то, что существует возможность построения аналитического выражения для прогнозных оценок уровней динамического ряда. Теорема Брауна, являющаяся фундаментальной в методе экспоненциального сглаживания, утверждает, что коэффициенты полиномов, по которым производится прогнозирование, определяются с помощью дисконтированного метода наименьших квадратов и аналитически выражаются через сглаженные значения ряда. Тогда для прогнозирующего полинома степени N имеем:

(Т) . Ут+т = а0 +

N АТ)

у А .

(15)

г=1

По этому полиному можно получать прогноз в точках (Т + г). Коэффициенты полинома определяются из условия:

а

При N = 1 имеем: и для коэффициентов

oo T = 1 / w AO -аУ [у*-* ~ ~fT

(t) , (t) yt+T = ay + a\ V,

mm.

4° = 2S}(y)-St(y)

А) -

а

1 — а

[бЩ) - У (у)] .

(16)

(17)

Рассчетное значение в момент времени t получаем по формуле (16):

yt = а^_1) + af_1V, где г = 1. (18)

Для прогнозирования наиболее часто используют квадратичный полином, т.е. N = 2. В этом случае формулы (16), (17) примут вид:

- АО

Ж

М)

yt+т = а'0' + а\’т + —г

(19)

и для коэффициентов:

А) -

аЬ' = 3 Sl(y)-

А) _

А) -

а

2(1 - а)

„2

а

(! - аУ

3St (у) + Sf(y),

[(6 - 5a)Sl(y) - 2(5 - 4a)Sf(y) + (4 - 3a)Sf(y)] , [Sl(y) - 2SUy) + SUy)} ■

Рассветное значение в момент времени t получаем по формуле

(t-l) . (t-l) . 1 (t-l) 2 1 /01\

yt = % ; + а) r+2a2 т’ где т = 1. (21)

Для рассчетов удобнее использовать рекуррентные формулы [3, 5], эквивалентные (17), (20), где для корректировки параметров используется ошибка прогноза:

Ф) = y(t) ~ Vt, (22)

где yt определяется по формулам (18) и (21).

При N = 1 имеем:

ao} = Ф) + (1 - а)2ф),

af* = af ^ + a2e(t). (23)

При N = 2 имеем:

(t) % = y(t) + (! - ФФ),

(t) a) ’ = af~1^ + — -a2(2 — ск)ф), (24)

(0 a 2 = + a3e(t).

Из этих формул видно, что при появлении нового наблюдения необязательно хранить весь предыдущий отрезок временного ряда, надо лишь знать коэффициенты прогнозирующего полинома, найденные по этому отрезку.

Для прогнозирования на глубину г за пределы известного отрезка используют прогнозирующий полином (15). Но если в окрестности точки Т детерминированная составляющая близка к постоянной, применяют аппарат однократного экспоненциального сглаживания, и прогноз определяют по формуле

y(T + T) = S1T(y), (25)

а доверительный интервал прогноза равен:

Y(T + г) G

ф(у)±фТ-1ф

а

2 — а

(26)

Если в окрестности точки Т детерминированная составляющая линейна, то применяют двойное экспоненциальное сглаживание, и точечный прогноз осуществляют по формуле (18) при t = Г, а доверительный интервал прогноза определяют по формуле (10) или из следующего соотношения:

Y(T + т) G

yT+T±tp(T — 2)S

a[l + 4(l — a)+ 5(1 — а)2

+ 2(4 — Зсф + 2ск2т2]

(2 —a)3

Если детерминированная составляющая нелинейна в окрестности Г, то применяют тройное экспоненциальное сглаживание и точечный прогноз определяется формулой (19) при t = Т.

Экспоненциальное сглаживание как метод выравнивания лежит в основе более сложных методов адаптивного моделирования. Например, Уинстером [4, 5] была предложена модель, учитывающая сезонную составляющую динамического ряда.

Анализ применимости той или иной модели для экстраполяции уровней динамики должен основываться на ее адекватности исследуемому процессу [8, 9]. Модель является адекватной, если математическое ожидание остаточного ряда близко или равно нулю и значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения.

Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется с использованием t-критерия Стьюдента:

t =

(28)

где eit) - среднее значение уровней остаточного ряда; Se - среднее квадратическое отклонение уровней остаточного ряда. Гипотеза отклоняется, если t > tKp, определенного по таблице Стьюдента с заданным уровнем значимости.

Проверку случайности уровней остатков можно провести методом пиков. В соответствии с ним каждый уровень ряда сравнивается с двумя рядом стоящими. Если он больше или меньше их, то эта точка считается поворотной и

pt = 1, в противном случае pt = 0. Далее подсчитывается сумма поворотных т

точек р = YlPt- В случайном ряду чисел должно выполняться строгое неравен-

t=1

ство:

р >

2(Т — 2) о /16Т - 29 3 V 90

(29)

Квадратные скобки обозначают целую часть числа.

При проверке независимости (отсутствия автокорреляции) определяется отсутствие в ряду остатков систематической составляющей. Это можно проверить на основе й-критерия Дарбина-Уотсона, основанного на автокорреляции первого порядка (et = pet-\ + щ):

£[ф)-ф- I)]2

й= —-------------. (30)

Е е2С0

t=1

Вычисленная величина этого критерия сравнивается с двумя табличными уровнями: di - нижний и du - верхний уровни, которые определяются в зависимости от числа наблюдений Т и количества регрессоров к. Если d находится в интервале от 0 до ф, то уровни остатков сильно коррелированы р ф- 0,

корреляция между уровнями положительная, а модель не адекватна. Если его значение попадает в интервал от du до 2, то уровни ряда являются независимыми р = 0. Если d превышает 2, то это свидетельствует об отрицательной корреляции и перед анализом его величину надо преобразовать: d* = 4 — d. В случае di < d < du ситуация не определена, т.е. однозначного вывода сделать нельзя и необходимо применение других критериев, например, первого коэффициента автокорреляции г(1), являющегося точечной оценкой параметра р и определяемого по формуле

£е(*)е(*- 1)

К1) = --------• (31)

Е е2С0

t=1

Присутствие в остаточном ряду существенной автокорреляции подтверждается, если первый коэффициент автокорреляции значим.

Если ошибки в исходной модели коррелированы по времени, а именно, образуют авторегрессионный процесс первого порядка, то для улучшения прогнозирования можно в качестве оценки величины Y(T + г) использовать не Хтa, а

/(Г + г) = Y(T + г) = XTa + pet = Хта + p[Y - Хта]} (32)

где р заменяют его точечной оценкой г(1).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Соответствие ряда остатков нормальному закону распределения определяют различными методами, например, с помощью ДД-критерия:

RS

^max ^min

(33)

где етах, ет;п - максимальный и минимальный уровень остатков. Если значение критерия попадает между табулированными, то гипотеза о нормальном распределении ряда принимается.

Для характеристики точности модели можно воспользоваться коэффициентом детерминации i?2, определяющим долю дисперсии y(t), объясненную регрессией г/t, или средней относительной ошибкой:

^ОТН

\ ' е(р| T'ti y{t)

■ 100%.

(34)

Если величина относительной ошибки менее 5% , модель достаточно точно описывает исследуемый процесс, ошибка 15% считается приемлемой.

Если построенная модель адекватна, т.е. выполняются все вышеперечисленные требования, то с выбранной доверительной вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития социальноэкономического явления прогнозируемая величина попадет в доверительный интервал, предсказанный на основе выбранной модели.

Покажем эффективность использования регрессионных и адаптивных моделей для прогнозирования демографических процессов. Демографические прогнозы представляют существенную часть социальных и естественно-научных прогнозов и служат мощным аналитическим средством познания и управления развития обществом. Они дают возможность вовремя заметить нежелательные отклонения в демографическом развитии страны или региона и принять соответствующие меры по их устранению. Демографические прогнозы являются основной и исходной базой для подготовки прогнозов в области трудовых ресурсов. Они необходимы также для того, чтобы заранее предусмотреть возникновение возможных диспропорций между будущей возрастной структурой населения и будущими объемами социальных требований. Так, изменение численности детей того или иного возраста необходимо учитывать при планировании развития здравоохранения, просвещения, а также многих отраслей промышленности. На базе перспективной численности определяются как будущие ресурсы общества, так и потребность общества в тех или иных благах. Поэтому для социально-экономического планирования развития страны или региона важно, чтобы эти прогнозы были как можно более достоверны.

Проанализируем на основе вышеприведенных моделей рождаемость в Омской области в 90-е годы. В таблице 1 приведены данные по анализу адекватности адаптивной модели при различных коэффициентах сглаживания и регрессионной модели при различных значениях регрессора k = 1, 2, 3. Адекватность модели оценивали при доверительной вероятности 90% и Г = 11, анализ статистики Дарбина - Уотсона и ДД-критерия проводили при уровне значимости 5%.

Таблица 1

Адаптивная модель Регрессионная модель

Коэффициент сглаживания Степень полинома

0,1 0,4 0,6 0,7 0,8 0,9 к = 1 к = 2 к = 3

% 3864,6 1511,7 1234,0 1213,2 1228,8 1269,7 1490,7 831,9 736,8

К1 0,960 0,982 0,988

t 3,10 2,24 1,09 0,73 0,47 0,28 0,12 0,22 0,25

р 4 5 5 6 4 4 4 4 5

d 0,1 0,77 1,47 1,74 1,96 1,86 0,56 1,47 1,71

г(1) 0,83 0,61 0,21 0,05 -0,07 -0,18 0,599 0,133 0,063

RS 1,85 2,20 3,01 3,34 3,54 3,65 3,301 2,88 3,46

^отн 13,5% 5,2% 4,4% 4,3% 4,1% 4,1% 4,71% 2,88% 2,44%

На основании приведенных данных можно сделать вывод, что наибольшее соответствие исследуемому процессу достигается в адаптивных моделях с коэффициентом сглаживания 0,6-0,9 и в регрессионных моделях с к = 2, 3. В линейной регрессионной модели в остаточном ряду присутствует существенная положительная автокорреляция.

В таблице 2 представлены точечные оценки прогноза уровней динамического ряда до 2004 года. Прогнозы по линейной регрессионной зависимости построены с учетом авторегрессионного процесса первого порядка. Анализ точечных прогнозов показывает, что в случае адаптивной модели оценки значений уровня ряда убывают с увеличением коэффициента сглаживания, но

в целом наблюдается значительное уменьшение уровней до 75% от уровня 1999 года. В регрессионных моделях прогнозируется также уменьшение рождаемости. Линейная регрессия дает уменьшение уровней в 2 раза по сравнению с 1999 годом. В случае же параболической зависимости, начиная с 2001 года, прогнозируется рост рождаемости, что не является следствием сложившейся демографической ситуации в области. Прогноз по полиномиальной зависимости с к = 3 показывает уменьшение уровня, аналогичное адаптивной модели.

Таблица 2

Год Фактические данные Адаптивная модель Регрессионная модель

a = 0, 6 Р II О ОС o' II Р к = 1 к = 2 СО II

1993 23300 23820 23690 23520 26200 24850 24560

1996 21500 20590 21080 21440 21560 20660 20950

1998 19800 18740 18740 18630 18470 19360 19440

1999 18500 18790 19000 19190 16922 19160 18790

2000 — 17600 17598 17530 15380 19260 18128

2001 — 16660 16650 16525 13830 19660 17390

2002 — 15720 15700 15520 12280 20360 16510

2003 — 14780 14760 14520 10737 21350 15430

2004 — 13840 13800 13520 9190 22650 14090

Любой прогноз должен основываться на знании природы прогнозируемого явления. В случае демографических прогнозов следует помнить, что население воспроизводится под непосредственным влиянием социально-экономических условий, поэтому необходима тесная взаимосвязь демографических прогнозов и перспектив социально-экономического развития региона. Так, кризис 17 августа 1998 года и последовавшие за ним негативные перемены в экономической ситуации изменили складывавшиеся ранее тенденции стабилизации рождаемости в регионе, и, как следствие, повлияли на прогнозируемые оценки. В условиях нестабильности экономики, и тем более кризисных явлений в ней, происходящих в последние годы в России, обоснование ожидаемых изменений уровня рождаемости представляет достаточно сложную задачу. Если в ближайшие годы удастся преодолеть кризисные явления в экономике, приостановить падение промышленного производства и восстановить нормальное развитие рынка, то можно ожидать постепенную стабилизацию уровня рождаемости. Если достичь успеха в этом не удастся, то снижение уровня рождаемости продолжится, и стабилизация будет возможна на более низком уровне к концу периода прогноза.

С точки зрения социально-экономического характера исследуемого явления, при сохранении сложившихся закономерностей развития наибольшее предпочтение можно отдать адаптивной модели с коэффициентом сглаживания 0,6 и полиномиальной модели с к = 3. Хотя использование полиномиальной модели для долгосрочных прогнозов динамики рождаемости не оправдано, т. к. уже к 2010 году точечный прогноз по этой модели представлен отрицательным числом, в случае же адаптивной модели уровень рождаемости 2010 года

составляет только 50% от уровня 1999 года. В таблице 3 показаны доверительные интервалы прогнозов для этих моделей до 2004 года, рассчитанные с доверительной вероятностью 80%.

Таблица 3

Год Адаптивная модель а = 0, 6 Полиномиальная модель к = 3

Нижняя граница Верхняя граница Нижняя граница Верхняя граница

2000 16680 18530 17200 19050

2001 15700 17620 16430 18350

2002 14720 16720 15510 17510

2003 13740 15830 14390 16480

2004 12740 14930 13000 15180

В целом можно отметить, что рассмотренные модели прогнозирования дают достаточно достоверные прогнозные оценки уровней динамики рождаемости. Сравнение наших данных с результатами прогнозов Госкомстата РФ [10, 11], показывает, что прогнозируемый Госкомстатом уровень рождаемости в общем попадает в доверительные пределы наших прогнозов. Отсутствие тенденции к стабилизации уровня в наших рассчетах, в отличие от прогнозов Госкомстата, связано с учетом падения уровня рождаемости в 1999 году.

Следует подчеркнуть, что адаптивная модель более приемлема для краткосрочных прогнозов и быстрее адаптируется к последним событиям. Поэтому для прогнозирования демографических показателей в условиях нестабильной социально-экономической ситуации лучше использовать эту модель. При анализе явлений, общие закономерности развития которых не меняются в течение периода прогноза, регрессионные модели являются достаточно адекватными исследуемому явлению и позволяют делать более длительные прогнозные оценки.

Литература

1. Андерсен Т. Статистический анализ временных рядов. М.: Мир, 1976. 155 с.

2. Теория статистики / Под ред. Р. А. Шмойловой. М.: Финансы и статистика,

1998. 576 с.

3. Колемаев В.А., Староверов О.В., Турундаевский В.Б. Теория вероятностей и математическая статистика. М.: Высшая школа, 1991. 400 с.

4. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. М.: ИНФРА-М, 1997. 416 с.

5. Четыркин Е.М. Статистические методы прогнозирования. М.: Статистика, 1975. 183 с.

6. Боли Б., Хуань К.Дж. Многомерные статистические методы для экономики. М.: Статистика, 1979. 317 с.

7. Ковалева Л.Н. Многофакторное прогнозирование на основе рядов динамики. М.: Статистика, 1980. 103 с.

8. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. М.: Дело, 1977. 248 с.

9. Доугерти К. Введение в эконометрику. М.: ИНФРА-М, 1997. 402 с.

10. Предположительная численность населения Российской Федерации до 2015 года // Статистический бюллетень. М.: Госкомстат России, 1998.

11. Волков А.Г. Население и рабочая сила в Российской Федерации. Тенденции и перспективы // Вопросы статистики. 1999. N 10. С.39-45.

i Надоели баннеры? Вы всегда можете отключить рекламу.