Научная статья на тему 'Применение метода «Нечеткая гусеница» для краткосрочного прогнозирования индекса ММВБ'

Применение метода «Нечеткая гусеница» для краткосрочного прогнозирования индекса ММВБ Текст научной статьи по специальности «Математика»

CC BY
122
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ЭКОНОМЕТРИКА / ГЛАВНЫЕ КОМПОНЕНТЫ / ФАКТОРНЫЙ АНАЛИЗ / ECONOMETRICS / MAIN COMPONENTS / FACTORIAL ANALYSIS

Аннотация научной статьи по математике, автор научной работы — Щигрев С. В.

В статье предлагается нечеткая модификация метода «Гусеница» для анализа временных рядов. На примере краткосрочного экспериментального прогноза индекса ММВБ выполнено статистическое сравнение методов «Гусеница» и «Нечеткая гусеница».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Щигрев С. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF METHOD «FUZZY CATERPILLAR» FOR SHORT-TERM FORECASTING AN INDEX OF THE MICEX

In clause fuzzy updating of a method «Caterpillar» for the analysis of time numbers is offered. On an example of the short-term experimental forecast of an index of the MICEX statistical comparison of methods «Caterpillar» and «Fuzzy caterpillar» is executed.

Текст научной работы на тему «Применение метода «Нечеткая гусеница» для краткосрочного прогнозирования индекса ММВБ»

СТАТИСТИЧЕСКИЕ ИЗМЕРЕНИЯ И ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ

УДК 330.43 + 336.7

С. В. Щигрев

Институт экономики и организации промышленного производства СО РАН пр. Акад. Лаврентьева, 17, Новосибирск, 630090, Россия

E-mail: [email protected]

применение метода «нечеткая гусеница» для краткосрочного прогнозирования индекса ММВБ

В статье предлагается нечеткая модификация метода «Гусеница» для анализа временных рядов. На примере краткосрочного экспериментального прогноза индекса ММВБ выполнено статистическое сравнение методов «Гусеница» и «Нечеткая гусеница».

Ключевые слова: эконометрика, главные компоненты, факторный анализ.

Ключевыми показателями динамики рыночной экономики и состояния фондового рынка являются фондовые индексы, которые позволяют оценивать текущее состояние экономики и финансов на разных уровнях системы управления фондовым рынком и тем самым создают основу для принятия диагностических и управленческих решений по инвестированию капитала в регионы и отрасли экономики, страны и транснациональные корпорации. Учитывая значение фондовых рынков в экономике, фондовые индексы широко используются для прогнозирования и макроэкономической ситуации.

В настоящее время существует множество математических моделей анализа временных рядов, позволяющих делать прогнозы на будущее. К числу таких методов относятся регрессионный анализ, анализ Фурье, модели Бокса - Дженкинса и множество других методов (см. [1]). Среди статистических методов прогнозирования наиболее теоретически продвинутым является метод главных компонент. Применительно к временным рядам метод главных компонент в научной литературе известен в виде комплекса процедур под названием «Гусеница» (см. [2]). Разработка отечественной теории данного метода явилась результатом практики по математической биологии в МГУ в 1961 г., под руководством А. Н. Колмогорова выпускника механико-математического факультета ЛГУ О. М. Калинина. Метод был сформулирован О. М. Калининым

в 1969 г. и впервые изложен в дипломной работе М. Д. Белонина, а затем опубликован в 1971 г. в обзоре «Факторный анализ в нефтяной геологии» [3]. Первоначально метод использовался для выявления периодических составляющих временных рядов, в частности низкочастотных колебаний. С тех пор этот метод подвергался анализу и развитию в самых различных направлениях. Первым опубликованным практическим применением данного метода можно считать диссертацию М. М. Кислицына, выполненную под руководством О. М. Калинина в 1977 г. (см. [2]).

Основные процедуры метода «гусеница» 1

Пусть имеется числовой ряд

/,, (= 1, ..., N. (1)

Выбираются два натуральных числа т и п так, чтобы т + п - 1 = N. По ряду (1) строится матрица наблюдений X = (X. У=1{',тп состоящая из т строк и п столбцов, в которой X.. = /+ г Далее, вычисляется матрица вторых моментов полученной многомерной выборки

1 г

С = -XXг. п

1 Методика изложения данного раздела заимствована из работы [2].

ISSN 1818-7862. Вестник НГУ. Серия: Социально-экономические науки. 2008. Том 8, выпуск 3 © С. В. Щигрев, 2008

г

Здесь через X обозначена процедура транспонирования матрицы X. Применение метода главных компонент позволяет приводить матрицу С к диагональному виду с одновременным нахождением собственных чисел X. и соответствующих им собственных векторов V-') = (у!'),у2'),..., . При этом пред-

полагается, что собственные векторы упорядочены по убыванию собственных чисел,

т. е. X > Х2 >... > Хт > 0 . Обозначим через

V = (у(1),у(2),...,У(т)) матрицу, столбцами которой являются собственные векторы.

Далее применяются обычные для анализа главных компонент операции вычисления

главных компонент и = V1’X и восстановления исходной выборки по первым г главным компонентам:

Величину

X = (v(1),..., О

UT

После восстановления матрицы X исходная последовательность /г восстанавливается усреднением по побочным диагоналям матрицы X :

f =

—Z X t-^ m <t< n

m *=—

N -1 +

1 N-t+1

— Z

t + 1 t—

x.+t .+,, n < t < N.

i+t-m, n-i+1 5

Обозначим через Iматрицу І = V\

через w - вектор w = (V“,V“-1), а через Q -

вектор Q = (_т+2,..., )Т и рассмотрим сис-

тему уравнений

Zh = Q.

(2)

Эта система, вообще говоря, несовместна. Рассматривается обобщенное решение системы (2) как решение следующей системы уравнений:

ZTZh = ZTQ.

(3)

b = wh,,

(4)

где h* - решение системы (3), называют обобщенным продолжением ряда (1) по методу

«Гусеница», т. е. fN+1 = b.

Нечеткое обобщение метода «гусеница»

Если элементы f ряда (1) определены с ошибками, то матрица Z, вычисленная по ряду (1), также содержит неопределенность. Поэтому в методе «Нечеткая гусеница» элементы матрицы Z представляются в виде нечетких треугольных чисел (см. [4]). В этом случае решение системы (3) h* будет также нечетким множеством в пространстве Rr, а следовательно, число b = wh* будет нечетким множеством на вещественной прямой.

Для построения функции принадлежности нечеткого множества fN +1 = b применяем стохастический алгоритм, предложенный в [5]. Далее находится наиболее правдоподобное значение х на вещественной прямой, и это число объявляется наиболее правдоподобным

значением для fN+1.

Надежность нечеткого прогноза оценивается функцией правдоподобности совпадения нечетких множеств (см. [5])

T(A, B) = min {Pl(A, B), Pl(B, A)},

где Pl(A, B) =-

oo

Jc ArB ( x)dx да________________.

да !

Jc a (x)dx

%А(х) - функция принадлежности нечеткого множества А.

Статистическая проверка восстановления методом «гусеница»

Данное исследование проведено на статистике индекса ММВБ за период со 2 июля 2007 г. по 20 мая 2008 г. Число N = 220.

i=i

i=i

Усреднение значения индекса в течение дня выполнялось по формуле:

( = I +1 +1 +1

6 1 3 1 3 1 6 1

Здесь /О - значение индекса при открытии торгов; / - максимальное значение индекса в течение дня; // - минимальное значение

индекса в течение дня; - значение индекса при закрытии торгов. Динамика индекса за выбранный период изображена на рис. 1.

В расчетах было выбрано т = 100 главных компонент. Таким образом, длина рядов

в матрице X оказалась равной 121. В табл. 1 представлено распределение полной дисперсии по главным компонентам. Видно, что информативность главных компонент резко падает с увеличением номера компоненты. Из теории статистического анализа следует, что наиболее информативные компоненты оказываются также наиболее устойчивыми к случайным факторам, причем при увеличении числа т устойчивость первых главных компонент возрастает.

Результаты восстановления ряда (1) по главным компонентам можно охарактеризовать следующим образом. Полная дисперсия индекса за период (1 ^ N равна 10447,34. Восстановление по первой главной компоненте объясняет 9,22 % дисперсии. Результат изображен на рис. 2. Восстановление ряда по первым двум компонентам объясняет 59,28 % дисперсии. Результат изображен на рис. 3. Восстановление ряда по первым 42 компонентам объясняет 99,33 % дисперсии. Результат изображен на рис 4. На рис. 5 представлены результаты исследования остатков восстановления по первым 42 компонентам.

Анализ автокорреляционной функции ряда остатков показывает отсутствие автокорреляции. Применение двустороннего критерия Аббе и БКР-критерия (значение статистики 0,924) доказывают стационарность ряда остатков.

Для проверки принадлежности данного ряда к семейству нормальных распределений, воспользуемся критерием нормальности «оме-

га-квадрат». Он проверяет сложную гипотезу о том, что выборка (ряд остатков) принадлежит нормальному распределению с неизвестными средним и дисперсией. Проанализировав рис. 5 и учитывая результаты тестирования ряда критерием нормальности «омега-квадрат», который практически приближается к идеальному варианту и равен 0,975, можно сделать вывод, что данный ряд имеет распределение очень близкое к нормальному.

Таким образом, можно говорить о стационарности ряда остатков восстановления, что в свою очередь наряду с принадлежностью этого

2000 1950 1900 1850 1800 1750 1700 1650 1600 1550 1500

1 14 27 40 53 66 79 92 105 118 131 144 157 170 183 196 209

Рис. 1. Фактическая динамика индекса ММВБ за период 02.07.2007-20.05.2008

2000 1950 1900 1850 1800 1750 1700 1650 1600 1550 1500

1 14 27 40 53 66 79 92 105 118 131 144 157 170 183 196 209

Рис. 2. Восстановление рядаf по первой компоненте

2000 1950 1900 1850 1800 1750 1700 1650 1600 1550

1500

1 14 27 40 53 66 79 92 105 118 131 144 157 170 183 196 209

Рис. 3. Восстановление рядаf по первым двум компонентам

Таблица 1

Распределение объясненной дисперсии по главным компонентам

Номер компо- ненты Объясненная дисперсия, % Номер компо- ненты Объясненная дисперсия, % Номер компо- ненты Объясненная дисперсия, % Номер компо- ненты Объясненная дисперсия, %

1 99,656874 26 0,000267 51 0,000060 76 0,000015

2 0,176792 27 0,000256 52 0,000058 77 0,000012

3 0,068249 28 0,000196 53 0,000054 78 0,000011

4 0,023298 29 0,000171 54 0,000051 79 0,000010

5 0,021931 30 0,000165 55 0,000050 80 0,000010

6 0,011848 31 0,000162 56 0,000043 81 0,000010

7 0,010370 32 0,000144 57 0,000041 82 0,000010

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8 0,003942 33 0,000128 58 0,000041 83 0,000009

9 0,003790 34 0,000128 59 0,000040 84 0,000008

10 0,002597 35 0,000124 60 0,000036 85 0,000008

11 0,002405 36 0,000118 61 0,000033 86 0,000007

12 0,002047 37 0,000114 62 0,000033 87 0,000007

13 0,001944 38 0,000113 63 0,000031 88 0,000007

14 0,001641 39 0,000107 64 0,000030 89 0,000005

15 0,001574 40 0,000106 65 0,000028 90 0,000004

16 0,001387 41 0,000100 66 0,000026 91 0,000003

17 0,001169 42 0,000085 67 0,000024 92 0,000003

18 0,000691 43 0,000082 68 0,000023 93 0,000003

19 0,000679 44 0,000081 69 0,000021 94 0,000002

20 0,000588 45 0,000079 70 0,000020 95 0,000002

21 0,000547 46 0,000077 71 0,000019 96 0,000002

22 0,000456 47 0,000075 72 0,000017 97 0,000001

23 0,000447 48 0,000073 73 0,000016 98 0,000001

24 0,000344 49 0,000068 74 0,000016 99 0,000001

25 0,000332 50 0,000063 75 0,000015 100 0,000001

2000 1950 1900 1850 1800 1750 1700 1650 1600 1550

1500

1 14 27 40 53 66 79 92 105 118 131 144 157 170 183 196 209

Рис. 4. Восстановление рядаf по первым 42 компонентам

Рис. 5. Остатки восстановления ряда (1) по первым 42 главным компонентам

ряда к нормальному распределению свидетельствует о справедливости гипотезы отнесения ряда остатков восстановления к «Гауссовскому белому шуму».

Окончательный вывод: стандартная методика главных компонент позволяет устойчиво и достаточно эффективно восстанавливать временной ряд.

Сравнение качества ретропрогноза методами «гусеница» и «Нечеткая гусеница»

Выберем период прогнозирования 7 дней (21.05.2008-29.05.2008). Фактические значения индекса ММВБ за этот период известны:

21 мая 22 мая 23 мая 26 мая

1939,357 1922,518 1898,537 1897,125

27 мая 28 мая 29 мая

1881,615 1858,9 1890,94

Эти значения нам необходимы для оценки качества прогнозов.

Используя методику обобщенного продолжения «Гусеница» по первым 42 главным компонентам, получаем следующий ряд:

21 мая 22 мая 23 мая 26 мая

1944,019 1919,415 1870,509 1861,473

27 мая 28 мая 29 мая

1871,601 1894,149 1940,7863

Учитывая нормальность и независимость остатков, оцениваем доверительный интервал прогноза по 1-процентному критерию (табл. 2). Окончательные результаты прогноза представлены на рис. 6. «Средняя величина квадрата отклонения» прогноза по методу «Гусеница» от фактических данных равна 845,068.

Нечеткий прогноз выполнен по методу «Нечеткая гусеница», описанному выше. Сначала элементы матрицы Z и вектора ^ были представлены треугольными числами с носителями, составляющими 10 % от абсолютного значения параметра, затем по стохастическому алгоритму были построены функции принадлежности каждого из семи прогнозируемых показателей, Результаты расчетов изображены на рис. 7.

Здесь самый высокий пик функции принадлежности соответствует первому нечеткому прогнозируемому показателю (прогнозируемое значение индекса ММВБ на 21 мая 2008 г.). Самый низкий пик соответствует прогнози-

руемому показателю на 29 мая. Общее правило расшифровки графика: чем дальше от 20 мая текущая дата прогноза, тем ниже пик функции принадлежности соответствующе -го показателя.

Для оценки надежности в качестве множества В при вычислении Т(А, В) было взято нечеткое множество, описывающее данный прогнозный показатель. В качестве множества А был выбран некоторый эталонный нечеткий показатель с функцией принадлежности с(х -/к ), где с - одна и та же функция для каждого из семи прогнозируемых показателей (табл. 3).

Конечно, в общем случае оценка надежности зависит от выбранного эталонного показателя. Однако в работе [6] показано, что если длина носителя 2(у) = {х: с(х) > 0} функции с меньше размаха каждой из выборок, то оценка надежности носит асимптотический харак-

о ООООООО ОООООО О ООО О О О О ОООООО

CMCMCNCNICMCNCNCM CMCMCMC-JCMCM

О ООО О О О о ОООООО т— СОЮЬ- 05 т- со ю г~- о> СО Ю t"

Факт- - Прогноз -Min -Мах

Рис. 6. Результаты краткосрочного прогноза индекса ММВБ по методу «Гусеница»

Рис. 7. Функции принадлежности каждого из семи прогнозируемых показателей

Таблица 2

Границы доверительных интервалов прогноза

Граница 21 мая 22 мая 23 мая 26 мая 27 мая 28 мая 29 мая

Міп 1921,603 1887,715 1831,684 1816,642 1821,478 1839,243 1881,480674

Мах 1966,434 1951,115 1909,333 1906,304 1921,723 1949,056 2000,092012

Таблица 3

Наиболее правдоподобный прогноз по методу «Нечеткая гусеница»

Показатель 21 мая 22 мая 23 мая 26 мая 27 мая 28 мая 29 мая

Прогноз 1953,798 1936,827 1893,931 1896,728 1905,744 1836,436 1903,158

Надежность, % 93,46 64,14 47,49 38,00 32,88 30,32 27,27

тер и выбор другого эталонного показателя с носителем, обладающим такими же свойствами, приводит к пропорциональному изменению всех показателей надежности.

В заключение вычислим ту же самую статистику: «средняя величина квадрата отклонения» прогноза по методу «Нечеткая гусеница» от фактических значений показателя. Получится число 238,68, которое составляет всего лишь 28,2 % от аналогичного показателя «гусеничного» прогноза, равного 845,068, что свидетельствует о более высокой эффективности алгоритма «Нечеткой гусеницы».

Список литературы

1. Суслов В. И., Ибрагимов Н. М., Талыше-ва Л. П., Цыплаков А. А. Эконометрия. Новосибирск: Изд-во СО РАН, 2005. 744 с.

2. Главные компоненты временных рядов: метод «Гусеница» / Под ред. Д. Л. Данило-

ва, А. А. Жиглявского. СПб.: Изд-во СПбГУ, 1997. 351 с.

3. Белонин М. Д., Татаринов И. В., Калинин О. М. и др. Факторный анализ в нефтяной геологии / ООНТИ; ВИЭМС. M., 1971.

4. Zadeh L. A. Fuzzy Sets // Inf. And Control. 1965. Vol. 8. Р. 338-353.

5. Павлов А. В., Павлов В. Н. Применение интегральных преобразований в исследовании экономической неопределенности // Вестн. Новосиб. гос. ун-та. Серия: Социально-экономические науки. 2007. Т. 7, вып. 2. С. 21-30.

6. Павлов А. В., Павлов В. Н. Нечеткое согласование макроэкономических показателей // Вестн. Новосиб. гос. ун-та. Серия: Социально-экономические науки. 2008. Т. 8, вып. 2. С. 27-38.

Материал поступил в редколлегию 03.06.2008

s. V. schigrev

APPLICATION OF METHOD «FuzzY CATERPILLAR»

for short-term forecasting an index of the micex

In clause fuzzy updating of a method «Caterpillar» for the analysis of time numbers is offered. On an example of the short-term experimental forecast of an index of the MICEX statistical comparison of methods «Caterpillar» and «Fuzzy caterpillar» is executed.

Keywords: econometrics, main components, factorial analysis.

i Надоели баннеры? Вы всегда можете отключить рекламу.