_Вестник Ставропольского государственного университета
ЭкононачЕскае ннуки
ПОЛУЧЕНИЕ ПРЕДПРОГНОЗНОЙ ИНФОРМАЦИИ НА БАЗЕ ФРАКТАЛЬНОГО АНАЛИЗА ДЛЯ ВРЕМЕННЫХ РЯДОВ ИНДЕКСА РОСТА ПРОМЫШЛЕННОГО ПРОИЗВОДСТВА
В.А. Перепелица, Ф.Б. Тебуева
THE RECEPTION OF PLEMINARY PRE-FORECASTING INFORMATION ON THE BASIS OF FRACTAL ANALYZE FOR TIME SERIES OF AN INDEX OF MANUFACTURE GROWTH
Perepelitsa V.A., Tebueva F.B.
The article is devoted to methods of reception preliminary prefocecasting information for the time series, which have long-term memory. The levels of such do not satisfy to property of independence. Because consequently the classical methods of forecasting can appear inadequate. For reception prefocecasting of the information the toolkit fractal analyze is offered. Its efficiency is showed on time series of an index of manufacture growth.
Работа посвящена методам получения предварительной прогнозной информации для временных рядов, которые обладают долговременной памятью. Уровни таких рядов не удовлетворяют свойству независимости. Поэтому классические методыI прогнозирования могут оказаться неадекватны/ми. Для получения предварительной прогнозной информации предлагается инструментарий фрактального анализа. Его эффективность продемонстрирована на временных рядах индекса роста производства.
1. Предмет и цель исследования
В контексте экономико-математического моделирования настоящее исследование относится к проблематике прогнозирования и регулирования социально-экономического развития на базе индикативного планирования [1]. Структурная перестройка экономики в развитых странах во второй половине 20-го века вызвала необходимость согласования бюджетов с показателями народно-хозяйственных прогнозов. Инструментарием такого согласования явились методы индикативного планирования, реализующие разработку системы индикаторов социально-экономического развития и включающие определение его общенациональных приоритетов, а также бюджетирование и прогнозирование. Примерами такого сочетания планирования с прогнозированием могут служить «Десятилетний план удвоения национального дохода» на 19611970 гг. в Японии, план под названием «Выбор путей экономического роста» на 19761985 гг. в Канаде, а также Прогноз Министерства труда на 1986-1995 гг. в США. Опыт этих стран характеризуется тем, что планово-прогнозные расчеты основываются на исследованиях реального состояния экономики и анализа динамики показателей социальной сферы. При этом народнохозяйственный прогноз и бюджет образует единую систему, состоящую из прогнозных показателей развития экономики и бюджетных показателей. Процедуры разработки
УДК 519.86
Ш Перепелица В.А., Тебуева Ф.Б.
«Получение предпрогнозной информации на базе фрактального анализа...»
бюджетов и социально-экономических прогнозов взаимосвязаны и адекватны реальным социально-экономическим процессам. На основе прогнозов принимаются многие макроэкономические решения как административного, так и нормативного характера.
В упомянутом выше прогнозировании ключевую роль играют временные ряды экономической динамики и социально-экономических показателей за прошедшие годы. В процессе разработки индикативных планов в указанных выше странах достаточно успешно использовались такие методы анализа и прогнозирования временных рядов, которые базировались на инструментарии математической статистики, в первую очередь, таких ее разделов, как корреляционный анализ, регрессионный анализ, кластерный анализ, дискриминантный анализ, а также модели авторегрессии [1,2]. Принципиально важно отметить, что прогнозирование на базе вышеуказанных статистических методов оказалось достаточно успешным потому, что рассмотренные временные ряды отражали эволюцию так называемых стационарных процессов. Напомним, что эволюционный процесс или его временной ряд принято называть стационарным, если его статистические свойства (характеризуемые в случае нормального распределения средним значением и дисперсией) не меняются с течением времени. Однако рассматриваемые в настоящей работе временные ряды индексов роста промышленного производства для конкретного региона и рассматриваемой страны в целом не являются стационарными
в указанном выше смысле и не удовлетворяют еще ряду условий, при которых статистические методы прогнозирования оказываются адекватными.
В настоящей работе рассматриваются 2 временных ряда (ВР) ежемесячных индексов роста промышленного производства (РПП) конкретного региона (Запорожская область) и страны (Украина): У = (у),
1 = 1,2,...,« - ВР индексов РПП Украины;
2 = (т.^ , 1 = 1,2,...,« - ВР индексов РПП Запорожской области, где индексом 1 = 1,2,...,« занумерованы месяцы календарного периода с января 1993 года по декабрь 2003 года, п = 132. Здесь численные значения уровней (наблюдений) у1 и означают проценты к базовому месяцу (100 %). В целях наглядности и визуализации динамики эти ВР представляем графически в виде гистограмм соответственно на рис. 1 и рис. 2. (в дальнейшем мы говорим соответственно о ВР страны и региона).
Приведем сначала численные значения статистических показателей этих ВР: математическое ожидание МУ = 0,856 и М2 = 1,089; дисперсия БУ = 0,032 и Б2 = 0,030; стандартное отклонение ЗУ = 0,180 и 32 = 0,174; коэффициент вариации УУ = 0,21 и ¥2 = 0,16; коэффициент асимметрии АУ = 1,22 и А2 = 0,86; коэффициент эксцесса ЕУ = 4,31 и Е2 = 3,17.
Рис. 1. Гистограмма ВР У индексов РПП страны.
1.600 -
1.400
1.200
1.000 -
0.800
0.600
0.400 -
0.200
0.000
!?!?!?)?!"!?!?!"! !"!?! !"!?!?!?! !?!?!?!?! !?!?! !"!?!?!
Рис.2. Гистограмма ВР Z индексов РПП региона
Рис. 3. Эмпирическая функция распределения ВР Y индексов РПП страны.
0,25 0,20 0,15 0,10 0,05 0,00
0,797- 0,8! 0,893 0,9
1,1791,275
1,2751,370
1,3701,466
1,4661,561
Рис. 4. Эмпирическая функция распределения ВР X индексов РПП региона.
Перечислим основные особенности статистических характеристик рассматриваемых ВР. Во-первых, достаточно одной визуализации представленных на рис. 3 и рис. 4 эмпирических функций распределения для того, чтобы утверждать, что поведение рассматриваемых ВР не подчиняется нормальному закону. К этому утверждению добавим, что ВР У и X не обладают свойством стационарности. Во-вторых, рассматривая ряды приращений Ау{ = у{+1 - у1 и
Dz. = z-,, — z-
^^г гг+1 г
i = 1, n — 1, убеждаемся, что максимальное значение абсолютных вели-этих приращений
чин max |AzJ)
1<i<n 1 1
(max AyJ и
1<i<n 1 1
превосходят соответственно
20 % от значения математического ожидания. Принимая во внимание этот факт, получаем основания утверждать, что традиционные (базирующиеся на трендах и регрессии) статистические методы предпрогноз-ного анализа [1, 2, 3] рассматриваемых ВР могут оказаться недостаточно адекватными этим рядам. В силу этого целью настоящей работы является применение принципиально новых методов предпрогнозного исследования ВР, базирующегося на методах фрактального анализа [4] и фазового анализа [3, 4].
2. Предпрогнозное исследование временных рядов на базе алгоритма R/S- анализа
Целью фрактального анализа какого-либо ВР является обнаружение наличия в нем долговременной памяти [4], оценка ее глубины, выявление показателя Херста H [4]. Кроме того, эта цель предусматривает определение такой характеристики, как трендоустойчивость или, наоборот, возврат к среднему чаще, чем в случайном поведении ВР, а также выявление квазициклов [5]. Знание перечисленных фрактальных характеристик рассматриваемого ВР представляет аналитику предпрогнозную информацию, т.е. позволяет ему оценить перспективность
400
00
080
040
0,30
1,179
31013101310131010201310131010201000131010201000131013101000102013101310102010001310102010001310131010001311131013101310100010201310100010201000100013101310131013101310102
Ш Перепелица В.А., Тебуева Ф.Б.
«Получение предпрогнозной информации на базе фрактального анализа...»
надежного прогнозирования ВР с помощью клеточно-автоматной прогнозной модели [6].
Основным инструментарием фрактального анализа ВР является алгоритм анализа, краткое описание которого можно найти в [4,7]. Приведем его более подробное описание, используя обозначения ВР Z и его начальных отрезков = z1,z2,..., , т = 3,4,...,п , для каждого из которых вычис-
- 1 т
текущее среднее 2т = — ^ 21 . Далее
ляем
для каждого фиксированного 2т, т = 3,4,...,п вычисляем накопленное отклонение для его отрезков длины т:
Xrf =
Y^t - Ur ),
t = 1,T .
i=1
После чего вычисляем разность между максимальным и минимальным накопленными отклонениями
R = R(r) = max (Xrt) - min (Xrt),
V 7 1<t<rV r' ' 1<t<rv r,t'
которую принято называть термином «размах R». Этот размах нормируется, т.е. представляется в виде дроби R/S, где S = S(r) -
стандартное отклонение для отрезка ВР Zr,
3 < r < n .
Показатель Херста H = H (r) получаем из соотношения RS = (a -r)H , H = H(r) . Логарифмируя обе части этого равенства и полагая согласно [4] a = 1/2, получаем значения декартовых координаты (xr, yr ) точек H - траектории, ординаты которых log (R(r )/ S (r))
У
= H (r ) = -
и абсциссы
log (т/2) xt = т, т = 3,4,...,n .
На выходе алгоритма R/S -анализа получается также R/S - траектория, которая представляется в логарифмических координатах последовательностью точек, у которых абсциссы xt = log (т/2), а ординаты ут = log(r(tVS(т)). Соединяя отрезком соседние точки (xr, Ут ) и (xr+1, Ут+1) , т = 3,4,...,n -1, получаем графическое пред-
ставление Я/8 - траектории (//-траектории) в логарифмических координатах (в обычных декартовых координатах).
Одной из основных фрактальных характеристик ВР является цвет шума [4,8], который соответствует этому ряду на том или другом временном отрезке. Значения Н > 0,6 определяют собой черный цвет шума. Чем больше значение Н е [2/3,1], тем большая трендоустойчивость присуща соответствующему отрезку ВР. Значения Н в окрестности 0,4 < Н < 0,6 определяют собой окрестность белого шума, который соответствует « хаотичному поведению ВР» и, следовательно, наименьшей надежности прогноза. Значения Н в окрестности ~ 0,3 ± 0,1 определяют собой пребывание соответствующего отрезка ВР в области розового шума. Розовый шум говорит о присущем рассматриваемому отрезку ВР свойстве анти-персистентности [4] в случае, который означает, что ВР реверсирует чаще, чем ряд случайный (частый возврат к среднему). Рассматриваемым в настоящей работе рядам присущи черный и белый шумы, а также, нестрого говоря, «серый шум», соответствующий области нечеткого разграничения между областями черного и белого шумов.
Основанием для утверждения о том, что ВР Z обладает долговременной памятью, является выполнение следующего условия: его /-траектория через несколько своих начальных точек оказывается в области черного шума, а для его Я/8-траектории эти точки вхождения в черный шум демонстрируют собой наличие тренда. Глубину этой памяти определяет такой номер т = I, для которого выполняется следующее условие: в точке I /-траектория получает отрицательное приращение, а Я/8-траектория в этой точке демонстрирует так называемый «срыв с тренда» [4, 7], т.е. резкое изменение тренда предшествующих точек И/8-траектории.
Фрактальный анализ рассматриваемого ВР Z в целом начинается с формирования на базе этого ВР семейства М{2) = {2Г},
i =1
r = 1,2,...,m , состоящего из m < n временных рядов Zr = ^z[j , i = 1,2,...,nr, где ряд
Z r получается путем удаления первого элемента z1r—1 в ряде zr 1. Здесь m определяется как наибольшее значение индекса r
m
такое, что ряд z еще имеет точку смены тренда в его R/S-траектории. Исходный ВР Z также принадлежит семейству M (Z), в котором ему присвоено значение индекса r=0.
В качестве иллюстративного примера рассмотрим на рис.5 R/S -траекторию и Н -
гу16
траекторию для отрезка Z из семейства
M (Z ) рассматриваемого ВР Z , учитывая при этом то, что представление этих траекторий начинается с третьей точки (i = 3 ), т.е. на графиках R/S- и H-траекторий не представляются в точки i = 1 и i = 2 силу особенностей алгоритма R/S- анализа.
На основании визуализации представленных на рис. 5 траекторий можно сформулировать следующее заключение: смена тренда R/S-траектории в точке t = 4 , сопровождаемая уходом Н-траектории в зону белого шума H (4)» 0,5, позволяет "глубину
памяти о начале ряда" Z е M (Z ) оценить числом l = 4 .
точка срыва с тренда
R/S-траектория
H -траектория
Чч смена тренда
1,8 -|
1,6 -
1,4 -
1,2 -
1 -
0,8 -
0,6 -
0,4 -
0,2 -
0 — 0
Рис. 5. R/S- и H- траектории ВР Z16 е M(Z)
Осуществляя R / S - анализ для каждого представителя семейств M(Y) и M (Z ), получаем соответственно последовательности значений l'r = l (y[ ) и l"r= l (zr ),
г = 1,2,...,т глубины памяти о начале каждого из соответствующих ВР Уг е М (У ) и
Хг е М(X).
На рисунках 6 и 7 представлены эмпирические распределения значений глубины памяти соответственно для ВР У и ВР X . На основании этих данных с помощью представленного ниже алгоритма вычисляется глубина памяти для каждого из рассматриваемых ВР в целом. "Память конкретного ряда в целом" адекватно представляется нечетким множеством (НМ) [9], которое для ВР X обозначим через Ь(2)={(/; т(I))}, где
областью определения носителей I [9] является множество значений глубины памяти о
начале ряда для каждого ВР 2Г из семейства м (X).
Алгоритм оценки глубины долговременной памяти всего ряда в целом и представления ее в виде нечеткого множества состоит из 3 этапов.
Этап 1. Формирование на базе ВР X
семейства М(X) = {^г}, 2г = (, 1 = 1,2,...,пг, г = 1,2,...,т , состоящего из т
временных рядов 2Г, где индексом 1 занумерованы элементы г -го ряда, получаемого из (г -1) -го ВР 2Г-1 путем удаления
его первого элемента -1. Здесь т определяется как наибольшее значение ин-
2т т\
,, , х ,, = (г ),
1 = 1,2,...,пт еще имеет точку смены тренда в его Я / S -траектории; исходный ВР X также принадлежит семейству М (X) , в котором ему присвоено значение индекса г = 1.
Этап 2 осуществляет Я / S -анализ временных рядов из семейства М (X ) и формирование нечеткого множества значений "глубины памяти о начале ряда" для каждого ВР из этого семейства.
Пусть для каждого из ВР = (гП,
i = 1, nr , r = 1, m в результате его R / S -анализа построены R / S -траектория и H -
0,5
1,5
2
Ш Перепелица В.А., Тебуева Ф.Б.
«Получение предпрогнозной информации на базе фрактального анализа...»
траектория, определяющие собой номер точки ¡г, в которой произошла смена тренда, т.е. ¡г - это номер 1 = ¡г находящейся «выше» зоны белого шума первой по порядку точки, в которой Н -траектория получила отрицательное приращение, а Я / 8 -траектория сменила тренд.
Введем следующие обозначения:
N(¡) - количество всех рядов 2Г из семейства М (2), у каждого из которых номер точки смены тренда ¡г равен числу
l; l0 = min 1 L = max 1
m
1£ r £ m
N (l)
1£ r £ m
= N (I);
i=iu
й ^) =- - доля таких рядов в 8(2), у
т
каждого из которых потеря памяти произошла на глубине /; Ь( 2) = {¡} - множество значений номеров точек смены тренда в рядах из семейства М(2); Ь(2) = {^,/л^))}, ¡ е Ь{2) - нечеткое множество (НМ) глубины памяти для начального ВР 2 в целом, / {¡ ) - это значения функции принадлежности «глубины /« нечеткому множеству М (2). Значения /л () пропорциональны числам й^), ¡ е Ь(2), они получаются путем нормирования значений долей й ^) так, что / (7) < 1 для всякого ¡ е Ь(2). Результат
работы этапа 2 для ВР 2 индексов РПП по Запорожской области представлены в табл. Значения элементов / (l) последней строки в табл. вычисляются следующим образом. Сначала находим максимальную долю d* = max d(l) (в табл. значение d* = 0,27)
leb(2) W
и соответствующую ей глубину l* = (d(l*)) = l*, (в табл. значение l* = 6).
7*
Далее для каждой глубины l экспертным путем устанавливается значение функции принадлежности /л * = /л (Г) (в табл. значение
/л*=Л(6)=0.9). После чего для остальных элементов l е L(2) соответствующие им
значения функции принадлежности / (l)
*
вычисляются по формуле /(l) = d(l).
d*
Этап 3. Формирования НМ для семейства M (2) осуществляется путем попарного объединения элементов первой и последней строк таблицы. Например, конкретно из таблицы получаем НМ
L(2) ={(4;0,68), (5;0,85), (6;0,90), (7;0,56), (8; 0,30), (9; 0,30), (10; 0,17),(11; 0,17), (12; 0,17), (13;0,17), (14;0,30), (15;0,21), (16;0,04), (17; 0,13), (19; 0,04), (20; 0,04)}.
Таблица
0
l 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
N(l) 0 0 0 16 20 21 13 7 7 4 4 4 4 7 7 5 3 0 1 1
d(l) 0 0 0 0,13 0,16 0,17 0,10 0,06 0,06 0,03 0,03 0,03 0,03 0,06 0,06 0,04 0,02 0 0,01 0,01
m (i) 0 0 0 0,68 0,85 0,90 0,56 0,30 0,30 0,17 0,17 0,17 0,17 0,30 0,30 0,21 0,13 0,00 0,04 0,04
1
0,9 -
0,8 -
0,7 -
0,6
0,5
0,4
0,3
0,2
0,1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Рис. 6. Эмпирическое распределение глубины памяти о начале ряда для ВР X семейства
М(X), г = 1,2,...,т , т = 124 .
1
0,9 -0,8 -0,7 -0,6 -0,5 0,4 -0,3 -0,2 -0,1 -0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Рис. 7. Эмпирическое распределение глубины памяти о начале ряда для ВР У г семейства
М(У), г = 1,2,...,т , т = 124 .
3. Качественные выводы о предпосылках надежного прогнозирования рассматриваемых временных рядов
Каждый из рассмотренных ВР У и X обладает долговременной памятью, относительно которой можно отметить как схожие, так и различительные характеристики. Из полученных результатов фрактального анализа вытекают следующие утверждения.
1. Говоря о схожести, можно отметить практически одинаковую область значений глубины памяти I: I е {4,5,...,18 } и I е {4,5,...,20 } для ВР У и X соответственно. Причем преобладающее значение глубины памяти в обоих случаях принадлежит первой половине каждого из этих множеств.
2. В процессе реализации фрактального анализа проявилась схожесть характера трендоустойчивости рассмотренных рядов: для преобладающих значений I, т.е. чаще
всего Н -траектория достигала области «черного» шума, точнее значений Н > 0,8 , а в точке срыва с тренда Н -траектория уходила в область «серого» или «белого» шума (типичное поведение Я / S - и Н -траекторий). При этом для обоих рядов преобладающее (т.е. малое) значение глубины памяти I возникали в заключительной стадии фрактального анализа этих рядов. Последнее означает, что вторая часть обоих ВР является более структурированной с точки зрения надежности прогноза.
3. Как для ВР X, так и для ВР У значение функции принадлежности ¡1 (I) превосходит 0,5 для четырех значений глубины памяти в обоих случаях: соответственно I = 4,5,6,7 и I = 6,7,8,9 (см. рис. 6 и рис. 7). Вместе с тем, на основании визуализации рис. 1 и рис. 2 можно утверждать, что наиболее часто встречающееся значение глубины памяти проявляется более концентрировано для ВР X (региона) по сравнению с ВР У (страны в целом). Иными словами, распределение значений глубины памяти для ВР У носит более размытый характер по сравнению с ВР X . Более того, в поведении ВР X (региона) более отчетливо проявляется цикличность с нечетким периодом, равным полугодию.
Из сформулированных выводов вытекает основание ожидать достаточно высокой степени надежности прогнозирования рассматриваемых ВР индекса роста промышленного производства для страны и отдельного региона с помощью моделей, базирующихся на использовании долговременной памяти, в частности с помощью клеточ-но-автоматной прогнозной модели [6].
ЛИТЕРАТУРА
1.
2.
Басовский Л.Е. Прогнозирование и планирование в условиях рынка: Учебное пособие. -М.: ИНФРА-М, 2003. - 260 с. Сигел Э.Ф. Практическая бизнес-статистика. - М.: Издательский дом «Вильямс», 2002. - 1056 с.
3. Лукашин Ю.П. Адаптивные методы прогнозирования временных рядов: Учеб. пособие. -М.: Финансы и статистика, 2003. - 416 с.
4. Петерс Э. Хаос и порядок на рынках капи-
0
Ш Перепелица В.А., Тебуева Ф.Б.
«Получение предпрогнозной информации на базе фрактального анализа...»
тала. Новый аналитический взгляд на циклы, цены и изменчивость рынка. - М.: Мир, 2000.
- 333 с.
5. Перепелица В.А., Тебуева Ф.Б., Узденов Р.Х. Квазициклы временных рядов жилищного строительства // Новые технологии в управлении, бизнесе и праве: Труды III Международной конференции. - Невинномысск: ИУБиП, 2003. - С. 159-163.
6. Перепелица В.А., Касаева М.Д., Тебуева Ф.Б., Темирова Л.Г. Использование инструментария клеточных автоматов для формирования прогнозных нечетких значений урожайности на базе временного ряда // Известия вузов. Северо-Кавказский регион. Естественные науки. - 2003. - № 4. - С. 5-11.
7. Перепелица В.А., Попова Е.В. Математиче-
ские модели и методы оценки рисков экономических, социальных и аграрных процессов.
- Ростов-н/Д.: Изд-во Рост. ун-та, 2002. -208 с.
9.
Шредер М. Фракталы, хаос, степенные законы. Миниатюры из бесконечного рая. -Ижевск: НИЦ «Регулярная и хаотичная динамика», 2001. - 528 с.
Алтунин А.Е., Семухин М.В. Модели и алгоритмы принятия решений в нечетких условиях. - Тюмень: Изд-во ТюмГУ, 2000. - 352 с.
Об авторах
Перепелица Виталий Афанасьевич, профессор доктор физико-математических наук, профессор кафедры организации и защиты информации Ставропольского государственного университета. Сфера научных интересов - нелинейные модели экономической динамики, дискретная математика и ее приложения.
Тебуева Фариза Биляловна, кандидат физико-математических наук, доцент Карачаево-Черкесской государственной технологической академии. Сфера научных интересов - нелинейные модели экономической динамики, дискретная математика и ее приложения.