УДК 004.032.26
О. П. Солдатова
ИССЛЕДОВАНИЕ ПОГРЕШНОСТИ ПРОГНОЗИРОВАНИЯ КОТИРОВОК АКЦИЙ ПРИ ПОМОЩИ МОДЕЛИ НЕЧЕТКОЙ НЕЙРОННОЙ СЕТИ ВАНГА - МЕНДЕЛЯ
Аннотация.
Актуальность и цели. Прогнозирование котировок акций является актуальной задачей, однако не менее актуальной является задача выявления корреляционной зависимости между прогнозируемой последовательностью и последовательностями биржевых цен на другие товары. Целью данной работы является исследование эффективности прогнозирования котировок акций с использованием корреляционной зависимости с ценами на сырьевые товары при помощи модели нечеткой нейронной сети Ванга - Менделя.
Материалы и методы. Все исследования проводились в среде разработанного комплекса программ, в котором реализована программная модель сети Ванга - Менделя, обучение сети проводилось тремя различными алгоритмами и отображение результатов обучения и прогнозирования в виде графиков и значений погрешностей. Предложена методика определения корреляционных зависимостей между обучающими выборками по графикам корреляционных функций и значениям временных задержек, расчета корреляционной зависимости прогнозируемой последовательности и обучения сети Ванга - Менделя. Исследования проводились на котировках акций нефтегазовых компаний: ОАО «Лукойл», ОАО «Роснефть» и ОАО «Транснефть». Для исследования корреляционной зависимости были выбраны цены на нефть двух марок - Brent и WTI, а также цены на мазут.
Результаты. Использование корреляционной зависимости между прогнозируемой последовательностью и обучающими выборками улучшает прогнозирующие способности сети Ванга - Менделя, значительно уменьшая максимальную относительную погрешность прогнозирования. Анализ эффективности прогнозирования показал преимущество использования не менее двух коррелирующих выборок со средними задержками (не более 60-70 дней). Анализ влияния алгоритмов обучения на погрешность прогнозирования показал преимущество адаптивного алгоритма и алгоритма наискорейшего спуска с инициализацией алгоритмом ^-усреднений по сравнению с алгоритмом наискорейшего спуска с инициализацией адаптивным алгоритмом.
Выводы. Предложенные методики, модели и алгоритмы, а также проведенные исследования, позволили получить численные оценки погрешности прогнозирования без использования и с использованием корреляционной зависимости обучающих выборок, на основании которых можно сделать обоснованный выбор коррелирующих выборок и алгоритмов обучения сети.
Ключевые слова: котировки акций, прогнозируемая последовательность, корреляционная зависимость, обучающие выборки, нечеткая нейронная сеть Ванга - Менделя, адаптивный алгоритм обучения, алгоритм наискорейшего спуска, алгоритм ^-усреднений, погрешность прогнозирования.
O. P. Soldatova
STUDY OF STOCK PRICE PREDICTION ERROR USING THE WANG-MENDEL'S FUZZY NEURAL NETWORK MODEL
Abstract.
Background. Stock prices forecasting is an important task, but the problem of identifying a correlation between a predicted sequence and exchange prices for other goods is important too. The goal of this study is to investigate the effectiveness of stock prices forecasting with a correlation of commodity prices by using the Wang-Mendel's fuzzy neural network model.
Materials and methods. All studies were conducted in custom software implementing the Wang-Mendel's network model; the network used three different training algorithms and displayed the results of learning and forecasting as graphic lines and error values. The article describes a method for determining correlations between training samples from graphs of correlation functions and time delay values, adduces calculations of the forecasting sequence correlation and Wang-Mendel's network training. The research used prices of the following oil and gas companies: "LUKOIL", "Rosneft" and "Transneft". To investigate the correlation the author used prices of two oil markers - Brent and WTI, as well as fuel oil prices.
Results. Usage of the correlation between the forecasting sequence and the training samples improves the predictive ability of the Wang-Mendel's network, significantly reducing the maximum relative error of the forecast. Analysis of the forecasting effectiveness shows the advantage of using at least two correlated samples with an average delay (not more than 60-70 days). Analysis of the training algorithms influence on the forecasting error shows the advantage of the adaptive algorithm and the steepest descent algorithm with k-averages initialization in comparison with the steepest descent algorithm with adaptive initialization.
Conclusions. The proposed methods, models and algorithms, as well as the conducted research have provided numerical estimates of the forecasting error with and without using the correlation between training samples, on this basis of which one can make a choice of correlating samples and network training algorithms.
Key words: stock prices, forecasting sequence, correlation, training sample, Wang-Mendel's fuzzy neural network, adaptive learning algorithm, steepest descent algorithm, k-averages algorithm, forecasting error.
Введение
Существуют различные подходы к прогнозированию, и выбор конкретного метода зависит от имеющейся информации и свойств исследуемой последовательности данных. Традиционным методом прогнозирования временных рядов выступает регрессионный анализ. При этом предполагается, что значения ряда представляют собой случайную функцию времени, либо предыдущих значений временного ряда (авторегрессионная модель), и задача заключается в верной идентификации модели. Выбор того или иного вида функции не формализован и целиком зависит от опыта эксперта. В то же время нейронная сеть выступает в качестве универсального аппроксиматора обучающих данных, поэтому применение нейронных сетей для прогнозирования является весьма перспективным. При работе нейронная сеть принимает значения входных переменных и выдает значения выходных переменных. Важным условием применения нейронных сетей для прогноза является наличие связи между известными входными значениями и неизвестными выходными значениями. Эффективность использования регрессионных и нейросе-тевых моделей для прогнозирования временных рядов исследована в работах [1-4]. Проблема неточности, неполноты, недетерминированности многих
временных рядов привела в настоящее время к использованию для этих целей нечетких нейронных сетей [5, 6]. В данной работе анализируется эффективность прогноза нечеткой сетью Ванга - Менделя для традиционных временных рядов котировок акций с использованием предложенной методики корреляционного анализа для формирования обучающих выборок на основе временных рядов цен на сырьевые товары, имеющих корреляционную зависимость с прогнозируемым рядом.
1. Методика корреляционного анализа обучающих выборок
При обычном обучении с использованием одномерной обучающей выборки входная последовательность данных подается последовательно, при этом происходит формирование обучающей выборки разделением данных на векторы размерностью, равной заданному прогнозному окну.
При использовании корреляционных зависимостей обучающих выборок обучающая выборка включает одно эталонное значение (известной котировки акции) и по одному элементу последовательностей цен на биржевые товары, коррелирующих с прогнозируемыми данными. Таким образом, получается многомерная обучающая выборка, но сохраняется одномерность входной последовательности. В данном случае размер прогнозного окна равен количеству коррелирующих с прогнозируемыми котировками данными.
Для определения корреляционных зависимостей рассчитывалась нормированная корреляционная функция, имеющая вид
N
2 (Xt - MX- Ж)
t=1
cor(t) = -
\
N N
2 (Xt - MX)2 2 (Y - MY)2
t=1 t=1
(1)
где Xt и - элементы пары исследуемых выборок; MX = — 2 Xt ,
N t=1
1 N
MY =— 2Yt, N = шт(NX,), -1 < ^г(X,Y,0 < 1, NX и - мощности
N t=1 выборок.
Для оценки корреляционных зависимостей между выборками использовались задержки - количество дней от начала отсчета до момента времени, когда корреляционная функция впервые достигла своего максимального значения.
2. Модель сети Ванга - Менделя и методика обучения
Сеть Ванга - Менделя относится к классу нечетких продукционных нейронных сетей, который объединяет возможности нечеткого логического вывода, присущие базам продукционных правил, и способности нейронных сетей обучаться на ограниченном множестве примеров. Правило вывода для сети Ванга - Менделя имеет следующий вид:
если х это А, то у =р0,
где р0 - вес, подбираемый в процессе обучения. Структура сети представлена на рис. 1.
Рис. 1. Структура сети Ванга - Менделя
Сеть представляет собой четырехслойную структуру, в которой первый слой выполняет фуззификацию входных данных, второй - агрегирование значений активации условия нечеткого правила вывода, третий (линейный) -агрегирование М правил вывода (первый нейрон) и генерацию нормализующего сигнала (второй нейрон), тогда как состоящий из одного нейрона выходной слой осуществляет нормализацию, формируя выходной сигнал у(х). Только первый и третий слои являются параметрическими. В первом слое это параметры функции фуззификации (с(к),),Ь)), а в третьем слое -
веса сьС2,..., см [1].
Выходной сигнал данной нечеткой сети определяется по формуле
M
Z «
i=1
y = f (X) =-
N
П exp j=1
f
(i) Xj - j
M
Z
i=1
N
П exp
j=1
( (i) ^) Xj - cj
Л)
(2)
где cj,с2,..., см - веса; с(\c(j\bj) - параметры функции фуззификации (центр, параметры разброса и кривизны); xj - элементы массива входных
данных; M - число правил вывода; N - число входных переменных.
В разработанной программной модели сети реализованы три алгоритма обучения: алгоритмы самоорганизации - адаптивный и ^-усреднений, градиентный алгоритм обучения наискорейшего спуска, который используется вместе с методом обратного распространения ошибки [1]. При помощи адаптивного алгоритма и алгоритма наискорейшего спуска можно уточнить как параметры функции фуззификации, так и веса сети. Алгоритм ^-усреднений предназначен только для расчета центров функции фуззификации, поэтому автором предложена методика обучения сети Ванга - Менделя в виде последовательного применения двух алгоритмов обучения: ^-усреднений и наискорейшего спуска. Кроме того, предложена методика последовательного применения адаптивного алгоритма и алгоритма наискорейшего спуска. При таких режимах обучения алгоритмы самоорганизации исполняют функции первичной инициализации параметров сети, а алгоритм наискорейшего спуска служит для их уточнения в процессе обучения [6].
3. Экспериментальные исследования корреляционной зависимости
В работе были проведены исследования корреляционной зависимости котировок акций трех нефтяных компаний: «Лукойл», «Роснефть» и «Транснефть». В качестве биржевых цен на сырьевые товары были выбраны цены на нефть марок Brent и WTI и цена на мазут [7]. Для компании «Лукойл» были сделаны исследования корреляционной зависимости котировок акций и цен на природный газ, драгоценные металлы и медь, а также проведен корреляционный анализ зависимости котировок акций всех трех компаний. В табл. 1 показаны результаты корреляционного анализа.
Из табл. 1 видно, что не всегда малое значение временной задержки означает сильную корреляционную зависимость между выборками. Наиболее сильная корреляционная зависимость существует между самими котировками акций и ценами на мазут и нефть двух марок, поскольку временная задержка небольшая и в то же время отлична от нуля [6].
4. Экспериментальные исследования погрешности прогноза
В проведенных исследованиях сеть Ванга - Менделя обучалась стандартным методом при помощи временного ряда котировок акций и с помощью коррелирующих выборок.
При обычном обучении с использованием одномерной обучающей выборки временная последовательность данных подается итерационно со сдвигом на один отсчет, при этом размер входного вектора определяется размерностью прогнозного окна. Обучающие данные разделяются на два непересекающихся множества, одно из которых используется непосредственно для обучения, а второе - для тестирования работы сети. В среднем объем выборки составляет около 302 значений (котировки акций на период с 10.01.2013 по 09.04.2014 за вычетом выходных дней, когда торги не происходят). Из них около 20 значений отводится на данные для тестирования (прогнозирования), т.е. 7 % от общего объема выборки.
Таблица 1
Результаты корреляционного анализа
Компания Название биржевого товара Значение корреляционной функции Значение временной задержки
Мазут 0,2293 1
Нефть Brent 0,3084 1
Нефть WTI 0,3087 1
Золото 0,2413 184
Роснефть 0,6281 0
Лукойл Транснефть 0,8015 0
Серебро 0,0169 250
Платина -0,1642 46
Природный газ 0,2506 152
Палладий -0,0159 55
Медь 0,2597 0
Мазут 0,6232 1
Роснефть Нефть Brent 0,7107 2
Нефть WTI 0,7099 2
Мазут 0,4364 1
Транснефть Нефть Brent 0,5452 2
Нефть WTI 0,5446 2
При использовании корреляционных зависимостей обучающая выборка включает одно эталонное значение (известной котировки акции) и по одному элементу временных последовательностей цен на биржевые товары, коррелирующих с прогнозируемыми данными. При этом элементы коррелирующих выборок подаются со сдвигом вправо относительно элементов прогнозируемой выборки, равным временной задержке. Таким образом, получается многомерная обучающая выборка, но сохраняется одномерность входной последовательности. В данном случае размер прогнозного окна равен количеству коррелирующих с прогнозируемыми котировками данных, увеличенному на единицу (прогнозируемая выборка).
В работе рассчитывалась средняя относительная погрешность обучения и тестирования (прогнозирования). Формула расчета данной погрешности для пары «теоретическое значение - рассчитанное значение» выглядит следующим образом:
e =
y - yval
yval ■ N
(3)
val
где y¡ - вычисленное значение выходного сигнала сети; y¡ - эталонное значение выходного сигнала сети; N - размерность выборки.
В табл. 2 представлены результаты прогнозирования стандартным способом и прогнозирования с применением корреляций. Во втором случае в качестве коррелирующих выборок использовались цены на нефть марки Brent, нефть марки WTI и мазут.
Таблица 2
Результаты прогнозирования без использования корреляционных зависимостей и прогнозирования с применением корреляций
Компания Название алгоритма обучения Относительная погрешность
Без ко рреляции С кор реляцией
обучения тестирования обучения тестирования
Лукойл Адаптивный 0,0007 0,0133 0,0051 0,0081
Наискорейшего спуска 0,0108 0,0100 0,0104 0,0077
Последовательный 0,0616 0,0431 0,2120 0,0080
Роснефть Адаптивный 0,0047 0,0060 0,0057 0,0058
Наискорейшего спуска 0,0093 0,0046 0,0104 0,0050
Последовательный 0,0133 0,0052 0,0164 0,0054
Транснефть Адаптивный 0,0029 0,0077 0,0057 0,0085
Наискорейшего спуска 0,0146 0,0094 0,0105 0,0079
Последовательный 0,6387 0,5453 0,0395 0,0099
Из табл. 2 видно, что при использовании корреляционных зависимостей значительно уменьшаются погрешности прогнозирования, особенно в случае адаптивного алгоритма обучения. Обучение при помощи алгоритма наискорейшего спуска не всегда дает лучший результат при использовании корреляции.
Для оценки корреляционных зависимостей между выборками использовалось разное число коррелирующих выборок. В табл. 3 приведены значения погрешности прогнозирования котировок акций «Лукойла» для разного числа коррелирующих выборок. При этом использовались выборки с одинаковыми значениями задержки: нефть марки Brent, нефть марки WTI и мазут.
Таблица 3
Значения погрешности прогнозирования и обучения для разного числа коррелирующих выборок
Название алгоритма обучения Относительная погрешность
Одна выборка Две выборки Три выборки
обучения тестирования обучения тестирования обучения тестирования
Адаптивный 0,0061 0,0078 0,0048 0,0068 0,0051 0,0081
Наискорейшего спуска 0,0102 0,0072 0,0085 0,0072 0,0079 0,0075
Последовательный 0,0193 0,0096 0,0289 0,0076 0,2120 0,0080
Как видно из табл. 3, наилучший результат получается при использовании двух выборок, связанных корреляционной зависимостью с прогнозируемой выборкой. Это значит, что наиболее подходящий размер прогнозного окна равен 2.
Исследования влияния алгоритмов обучения на погрешность прогнозирования проводились для двух коррелирующих выборок с временной за-
держкой (!) не больше 70 дней. Результаты исследований для акций компании «Лукойл» приведены в табл. 4, «Транснефть» - в табл. 5, «Роснефть» -в табл. 6.
Таблица 4
Значения погрешности обучения и прогнозирования акций компании «Лукойл» для различных алгоритмов обучения
Название алгоритма обучения Относительная погрешность
Нефть WTI и мазут (d = 1) Платина (d = 46) и палладий (d = 55)
обучения тестирования обучения тестирования
Адаптивный 0,0036 0,0070 0,0005 0,0157
Наискорейшего спуска 0,0107 0,0071 0,0350 0,0161
Последовательный 0,0249 0,0089 0,1445 0,0801
Таблица 5
Значения погрешности обучения и прогнозирования акций компании «Транснефть» для различных алгоритмов обучения
Название алгоритма обучения Относительная погрешность
Нефть WTI и мазут (d = 1) Платина (d = 43) и палладий (d = 70)
обучения тестирования обучения тестирования
Адаптивный 0,0056 0,0080 0,0037 0,0287
Наискорейшего спуска 0,0118 0,0076 0,0350 0,0070
Последовательный 0,1252 0,0817 0,1056 0,0675
Таблица 6
Значения погрешности обучения и прогнозирования акций компании «Роснефть» для различных алгоритмов обучения
Относительная погрешность
Название алгоритма Нефть WTI (с! = 2) Платина (d = 43)
обучения и мазут (! = 1) и палладий (d = 70)
обучения тестирования обучения тестирования
Адаптивный 0,0067 0,0053 0,0166 0,0079
Наискорейшего спуска 0,0137 0,0050 0,0137 0,0059
Последовательный 0,0112 0,0055 0,1406 0,0417
Как видно из табл. 4-6, при малых временных задержках погрешности тестирования при обучении сети адаптивным алгоритмом и алгоритмом наискорейшего спуска примерно одинаковые, при увеличении временных задержек алгоритм наискорейшего спуска обеспечивает минимальную погрешность прогнозирования. Последовательный (алгоритм обратного распространения ошибки с инициализацией адаптивным алгоритмом) дает максимальную погрешность прогнозирования при любых временных задержках.
Заключение
Следует отметить, что выбор в пользу использования коррелирующих выборок имеет смысл при наличии сильной зависимости. Сам факт наличия корреляционной зависимости не дает основания утверждать, что одна из выборок является причиной изменений значений другой выборки, а не наблюдается действие третьего фактора. Коррелирующие выборки могут успешно использоваться для прогнозирования спада или роста котировок, при этом не всегда гарантируя высокую точность прогнозируемых цен. По проведенным исследованиям можно дать следующие рекомендации по использованию корреляционных зависимостей:
1. Использование корреляционных зависимостей улучшает прогнозирующие способности сети Ванга - Менделя, существенно уменьшая ошибку прогнозирования.
2. Наилучшие результаты прогнозирования получаются при использовании двух коррелирующих выборок.
3. При прогнозировании с использованием корреляций наиболее эффективен для обучения алгоритм наискорейшего спуска с инициализацией алгоритмом ^-усреднений.
Список литературы
1. Оссовский, С. Нейронные сети для обработки информации / C. Оссовский ; пер. с пол. И. Д. Рудинского. - М. : Финансы и статистика, 2002. - 344 с.
2. Khashei, M. A novel hybridization of artificial neural networks and ARIMA models for time series forecasting / M. Khashei, M. Bijari // Applied Soft Computing. - 2011. -Vol. 11, №. 2. - С. 2664-2675.
3. Zhang, G. P. Neural networks for time-series forecasting / G. P. Zhang // Handbook of Natural Computing. - Berlin : Springer Berlin Heidelberg, 2012. - P. 461-477.
4. Yan, W. Toward automatic time-series forecasting using neural networks / W. Yan // Neural Networks and Learning Systems, IEEE Transactions on. - 2012. - Vol. 23, № 7. -P. 1028-1039.
5. Khashei, M. Fuzzy artificial neural network (p, d, q) model for incomplete financial time series forecasting / M. Khashei, M. Bijari // Journal of Intelligent and Fuzzy Systems. - 2014. - Vol. 26, №. 2. - P. 831-845.
6. Солдатова, О. П. Анализ результатов прогнозирования котировок акций с использованием корреляционной зависимости обучающих выборок / О. П. Солдатова, Д. А. Панкратова, В. Г. Литвинов // Перспективные информационные технологии (ПИТ 2015) : тр. Междунар. науч.-техн. конф. (Самара, СГАУ, 28-30 апреля 2015 г.). - Самара : Изд-во Самар. науч. центра РАН, 2015. - Т. 1. - C. 214-217.
7. Цены сырьевых товаров. - URL: http://www.finanz.ru/birzhevyye-tovary.
References
1. Ossovskiy S. Neyronnye seti dlya obrabotki informatsii [Neural networks for information processing]. Transl. from Polish by I. D. Rudinskiy. Moscow: Finansy i statisti-ka, 2002, 344 p.
2. Khashei M., Bijari M. Applied Soft Computing. 2011, vol. 11, no. 2, pp. 2664-2675.
3. Zhang G. P. Handbook of Natural Computing. Berlin: Springer Berlin Heidelberg, 2012, pp. 461-477.
4. Yan W. Neural Networks and Learning Systems, IEEE Transactions on. 2012, vol. 23, no. 7, pp. 1028-1039.
5. Khashei M., Bijari M. Journal of Intelligent and Fuzzy Systems. 2014, vol. 26, no. 2, pp. 831-845.
6. Soldatova O. P., Pankratova D. A., Litvinov V. G. Perspektivnye informatsionnye tekhnologii (PIT 2015): tr. Mezhdunar. nauch.-tekhn. konf. (Samara, SGAU, 28-30 aprelya 2015 g.) [Prospective information technologies (PIT 2015): proceedings of the International scientific and technical conference (Samara, SSAU, 28-30 April 2015)]. Samara: Izd-vo Samar. nauch. tsentra RAN, 2015, vol. 1, pp. 214-217.
7. Tseny syr'evykh tovarov [Primary product prices]. Available at: http://www.finanz.ru/ birzhevyye-tovary.
Солдатова Ольга Петровна кандидат технических наук, доцент, кафедра информационных систем и технологий, Самарский государственный аэрокосмический университет имени академика С. П. Королева (Национальный исследовательский университет) (Россия, г. Самара, Московское шоссе, 34)
E-mail: [email protected]
Soldatova Ol'ga Petrovna
Candidate of engineering sciences, associate
professor, sub-department of information
systems and technologies, Samara State
Aerospace University named
after S. P. Korolev (National Research
University) (34 Moskovskoe highway,
Samara, Russia)
УДК 004.032.26 Солдатова, О. П.
Исследование погрешности прогнозирования котировок акций при помощи модели нечеткой нейронной сети Ванга - Менделя / О. П. Солдатова // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2015. - № 4 (36). - С. 17-26.