Использование искусственных нейронных сетей для прогнозирования американского фондового рынка в период кризиса
Predicting the Falling U.S. Stock Market via Artificial Neural Networks
Г оловачев Сергей Сергеевич
Аспирант кафедры Международных валютно-финансовых отношений
факультета МЭ и МП НИУ-ВШЭ [email protected]
Аннотация
В статье рассматривается применение искусственных нейронных сетей на американском фондовом рынке во время мирового финансового кризиса. За основу модели взяты карты самоорганизации (сеть Кохонена) с использованием методов главных компонент и различными вариантами обучения. Также анализируется возможность прогнозирования американского фондового рынка на длительном (10 лет) промежутке времени - для этого в модель добавляется синергетическая сеть Хакена и закладываются элементы из теории информации. Полученные результаты позволяют говорить о разработке новой эффективной искусственной нейронной сети - сети Кохонена-Хакена
Abstract
In this paper the application of artificial neural networks on the U.S. stock market during the financial crisis is analyzed. Self-organizing maps were chosen as the basis for predicting model with the application of Principal Component Analysis and various training methods. The paper also focuses on application of synergetic Haken network which was added to the model for long-term (10 years) predicting as well as some elements related to the information theory. Judging from the predicting results we may talk about the development of a new efficient neural network - Kohonen-Haken network.
Ключевые слова: искусственные нейронные сети, карты самоорганизации, сеть Кохонена, метод главных компонент, сеть Хакена, относительная энтропия.
Key words: artificial neural networks, self-organizing maps, Kohonen network, Principal Component Analysis, relative entropy.
Введение
Мировой финансовый кризис 2008 года стал потрясением для инвесторов, потому что за крайне короткий промежуток времени они были вынуждены нести значительные финансовые потери, многие практические полностью лишились своих капиталов. Однако, как говорит теория, процессы, происходящие на фондовом рынке, являются игрой «с нулевой суммой». Иными словами, там, где одни инвесторы вынуждены подсчитывать фантастические убытки, другие игроки рынка получают сопоставимые прибыли. Отсюда очевидна потребность инвестиционного сообщества в прогнозировании падающего, даже обрушающегося рынка. И дело здесь не только в спекулятивных мотивах, но и в необходимости иметь стратегию, которая бы в значительной степени хеджировала риски потерь капитала в условиях сильного медвежьего тренда.
В рамках данной статьи мы попытаемся построить торговую стратегию для прогнозирования американского фондового рынка в период его наиболее резкого падения во время кризиса. Для достижения этой цели мы будем использовать методы искусственных нейронных сетей - инструмент, получивший в последние годы широкое распространение при обработке и прогнозировании данных как в финансовой математике, так и в смежных науках. При этом нашей целью будет являться хорошая прогнозная эффективность не только в период кризиса, но и на более долгосрочном временном промежутке в несколько лет.
В ходе построения прогнозной модели с использованием искусственных нейронных сетей мы сделаем важное отступление от канонического способа задания начальных значений модели, которые, как правило, задаются случайно. В рамках нашей модели начальные значения искусственной нейронной сети карт самоорганизации будут детерминированы спецификацией самой модели, что позволит устранить влияние случайной составляющей на результат работы.
Для повышения эффективности работы модели мы также будем применять различные подходы к обучению сети, а также сделаем ещё одно принципиальное нововведение - объединим карты самоорганизации с синергетической нейронной сетью Хакена. Полученная сеть Кохонена-Хакена позволяет добиваться хороших прогнозных результатов на длительном временном промежутке.
1. Искусственные нейронные сети в финансах
Искусственные нейронные сети являются попыткой сконструировать аналог биологических нейронных сетей головного мозга человека. Мозг - это децентрализованная структура, состоящая из миллиардов клеток-нейронов. Постоянно изменяющиеся во времени связи между нейронами - это и есть сети, которые определяют механизм функционирования структуры. Эффективность биологических нейронных сетей столь высока, что их пытаются имитировать в различных областях науки, в том числе и в финансовом моделировании.
Данная задача хотя и является необычайно сложной, тем не менее открывает блестящие перспективы в понимании и прогнозировании фондового, валютного и других финансовых рынков, поскольку может пролить свет на то, каким образом участники рынка взаимодействуют друг с другом и влияют на процесс ценообразования. Таким образом, задача использования искусственных нейронных сетей на финансовом рынке в общем случае подразумевает создание механизма, который с достаточно высокой степенью точности воспроизводит поведение субъектов принятия решения.
Это крайне важная базовая предпосылка, которая основывается на предположении о том, что ценообразование на рынке - это не результат случайного блуждания, броуновского движения, но агрегированный результат решений многих отдельных индивидуумов, принятых на основе субъективных суждений. Броуновское движение - это случайный процесс с нормальным Гауссовым распределением, который получается - согласно центральной предельной теореме - как предельный переход при достаточно большом количестве взаимно независимых случайных процессов (ожиданий). Поэтому фигура лица, принимающего решения, выдвигается на передний план только при том условии, что агрегированную динамику ценового процесса можно представить как протоколы решений некоего представительного агента, а не суммы разнородных независимых агентов. Подобная точка зрения открывает возможность для прогнозирования рынка, хотя ещё множество вопросов (таких как, например, выбор репрезентативного инвестора, кластеризация различных игроков и др.) требуют внимательного рассмотрения.
В рамках данной статьи мы будем пытаться построить модель поведения инвесторов на американском фондовом рынке в условиях падения (кризиса), а обоснованием верности нашей модели будет служить динамика виртуального инвестиционного портфеля, рассчитываемого на реальных исторических данных.
Однако прежде чем перейти к прогнозированию рынка, необходимо изложить основы использования искусственных нейронных сетей в финансовом моделировании.
Во-первых, необходимо задать архитектуру искусственной нейронной сети. В общем виде архитектура выглядит так, как изображено на Рис. 1. Обычно в искусственной нейронной сети выделяют три группы слоёв: входной (он содержит исходные данные х - как правило, эмпирические значения), скрытые (их может быть несколько, и они определённым образом преобразуют данные, полученные из входного слоя) и выходной (значения у которого являются результатом работы сети).
Рис. 1
Стоит отметить, что отличительной особенностью конструкции искусственной нейронной сети является то, что входное значение для каждого нейрона скрытого слоя представляет собой сумму S значений входного слоя X по весам w (либо взвешенную сумму предыдущего скрытого слоя), Рис. 2.
Формально это положение запишем так (Выражение 1):
(1)
n
S = I X. * wi
і
і =1
Рис. 2
На первый взгляд может показаться, что мы имеем дело лишь со сложной регрессией с большим количеством коэффициентов, однако это не так, потому что архитектура искусственной нейронной сети содержит в себе нелинейное преобразование. Это означает, что взвешенная сумма S каждого нейрона скрытого слоя является аргументом нелинейной функции f(S), которая создаёт выходное значение скрытого слоя Y на Рис. 2.
То есть (Выражение 2):
(2) Y = f (S)
Использование нелинейной функции преобразования также является отсылкой к биологическим нейронным сетям. В головном мозге человека нейрон, получая информацию от другого нейрона, определённым образом «решает», реагировать на неё, т.е. передавать сигнал дальше по нейронной сети, или нет. Это называется функцией активации нейрона, и обычно она является пороговой вида (Выражение 3):
if S>0
(3) J (S) (-1 otherwise
Однако при построении искусственных нейронных сетей достаточно редко используют пороговую функцию активации, поскольку это затрудняет применение дифференциального исчисления. Вместо пороговой функции обычно применяют такие функции активации, область значений которых близка к пороговой.
В практических построениях популярны следующие нелинейные функции активации (Выражение 4
и 5):
(4)
(5)
f (s) = —1— - стандартная логистическая функция с областью значений [0;1]
1 + es
f (s) =------- - гиперболический тангенс с областью значений [-1;1]
После того, как архитектура искусственной нейронной сети (количество слоёв, количество нейронов в них, функция активации нейронов скрытого слоя) определена, необходимо задать способ обучения сети. Под обучением искусственной нейронной сети подразумевается итеративный процесс оптимизации значений весов w, которые определяют связи между нейронами и общую эффективность работы сети. Итеративный процесс означает, что существует некая процедура, которая позволяет пошагово
двигаться от начального (иногда случайного) значения к оптимуму. Некоторые базовые принципы обучения можно почерпнуть из работы (Krose, van der Smagt, 1996).
То, каким образом искусственная нейронная сеть обучается, является, пожалуй, наиболее сложным элементом данного процесса. Здесь не существует раз и навсегда определённых догм и правил, и поэтому нередко исследователи определяют наиболее эффективный способ обучения опытным путём. Тем не менее, можно выделить два основных подхода. Первый - это обучение «с учителем», когда искусственная нейронная сеть обучается на заранее представленном ей наборе примеров. Второй способ - самообучение. В этом случае сеть самостоятельно ищет оптимальные значения, не имея эталонных значений-примеров. Это означает, что процесс обучения целиком зависит от внутренней спецификации сети.
Традиционно считается, что самообучающиеся нейронные сети более эффективны и дают более точные и корректные прогнозы, поскольку они учитывают одну из наиболее важных и значимых особенностей человеческого мозга - способность к самостоятельному обучению, обобщению и принятию решений.
2. Наша модель
При построении нашей модели для прогнозирования рынка в условиях кризиса мы обратимся к картам самоорганизации (также называемой сетью Кохонена)1, детальное описание которых можно найти, например, в работах [(Хайкин, 2006, (Kohonen, 1982, 1990, 1997)]. Эта сеть примечательна тем, что в основе её построения лежит принцип конкуренции между различными нейронами за право активации, что роднит её с генетическими алгоритмами и механизмом естественного отбора в природе.
Карты самоорганизации в плане архитектуры представляют собой несколько иную структуру, чем изображённая на Рис.1. По сути, в картах самоорганизации речь идёт о различных отображениях исходных векторов-сигналов в пространстве выходного слоя, который имеет большую размерность (Рис. 3). В качестве весов, которые обычно оптимизируются при работе с искусственными нейронными сетями, в картах самоорганизации будут выступать группы координат, которые задают отображения исходного вектора в выходном пространстве.
Построение отображений в выходном слое делается с целью составления т.н. карты признаков (систем координат) исходного вектора, где каждое отображение должно содержать в себе значимую информацию о какой-то характеристике исследуемого объекта. Здесь можно провести аналогию карт самоорганизации с методом главных компонент, поскольку там мы также проецируем исходный вектор в новой системе координат (новом базисе), см., например, работу (Ritter,2005). После того, как такая новая система координат построена, мы, можем использовать её отдельные оси (а в случае сети Кохонена - карту признаков) для дальнейшей работы, в итоге сократив размерность данных из входящего пространства.
Рис. 3
В ходе работы по прогнозированию фондового рынка мы будем использовать карту признаков сети Кохонена в качестве сигнальной системы. Это означает, что в зависимости от того, какой нейрон победил на данной итерации (т.е. активировался), мы будем судить о степени влияния того или иного признака на рынок и на основе этой информации принимать инвестиционное решение.
Переходя к механизму обучения карт самоорганизации, необходимо сказать, что это самообучающаяся искусственная нейронная сеть. Отображения исходного вектора (или векторов) конкурируют между собой, в результате чего и происходит активизация одного из нейронов. После того, как победивший нейрон активировался, он начинает формировать вокруг себя упорядоченную топологическую область, которая содержит значимую информацию об исходном векторе.
Процесс оптимизации сети Кохонена представляет собой встраивание других отображений в топологическую область вокруг победившего нейрона, отсюда и название сети - карты самоорганизации.
1 Здесь и далее в данной статье мы отождествляем понятия «карты самоорганизации» и «сеть Кохонена».
4
Процесс определения упорядоченной топологической области вокруг отображения-«победителя» называется процессом кооперации, а подстройка других отображений под свойства данной топологической области - процессом адаптации.
Важно ещё раз подчеркнуть, что оптимизация отображений в сети Кохонена производится не на основе сравнения с обучающим примером-эталоном (как, например, при использовании метода наименьших квадратов), а благодаря конкуренции между несколькими векторами-отображениями, в результате чего достигается эффективность функционирования сети.
Если попытаться представить итеративный процесс оптимизации карт самоорганизации пошагово, то он будет выглядеть так:
1. Случайным образом задаются отображения исходного вектора Х. Сразу оговорим, что в данной работе мы будем использовать один входной вектор, состоящий из пяти значений. Здесь мы также укажем на то, что метод задания отображений вектора Х случайным образом является наиболее часто используемым в финансовой математике. Это объясняется тем, что такой способ достаточно просто и удобно реализовать на практике. К нему также прибегают в тех случаях, когда нет возможности с достаточным обоснованием задать начальные условия внутри модели (т.е. детерминистски), или же это делается намеренно - чтобы внести случайную составляющую в процесс. Однако такой метод имеет очевидный недостаток - зависимость от генератора случайных чисел (который, вообще говоря, в чистом виде создать невозможно), а кроме того -потенциальная чувствительность модели к начальным условиям, что и будет продемонстрировано в разделе 3 настоящей статьи. Мы полагаем, что для более эффективного и корректного функционирования модели необходимо, чтобы начальные значения были детерминированы внутри модели, что будет сделано в разделе 4 статьи.
2. Осуществляется поиск отображения-«победителя» (процесс конкуренции). Напомним, что в выходном слое мы хотим получить такие отображения исходного вектора Х, которые бы содержали его важные свойства и характеристики. Поэтому мы будем стремиться к тому, чтобы отличие исходного вектора Х от его отображения в выходном пространстве было минимальным. Классическим способом оценить это отличие является Евклидово расстояние (норма разности) между двумя векторами. Такими образом, победителем признаётся то отображение, которое обладает наименьшим Евклидовым расстоянием по отношению к исходному вектору X (Выражение 6):
(6)
for jeL..<J Sj =| wj -X\ ,
match (min( S ),S )0
где
win - номер отображения-«победителя» на данной итерации,
X - исходный эмпирический вектор, который подаётся на вход искусственной нейронной сети, j - номер вектора-отображения исходного вектора X,
4 - количество векторов-отображений исходного вектора Х (ещё раз напомним, что у нас их пять),
□j - Евклидово расстояние между j-тым отображением и исходным вектором X,
match(min( □), □ )0 - функция, которая определяет номер отображения победителя (win) исходя из
наименьшего Евклидова расстояния между исходным вектором X и всеми его отображениями.
Следует отметить, что Евклидово расстояние является не единственным (и, возможно, не лучшим) способом определить различие между двумя векторами, поэтому в одном из следующих разделов данной статьи мы будем рассчитывать меру различия между векторами на основе теории информации.
З. Определяется топологическая окрестность вокруг отображения-«победителя», которая определяет то, как остальные отображения должны измениться в зависимости от значения отображения»-победителя». Топологическую окрестность мы будем находить на основе Евклидова расстояния между отображением-«победителем» и всеми остальными векторами-отображениями (ещё раз отметим, что существуют и другие подходы к определению такого расстояния). Эти расстояния мы будем использовать в качестве аргументов функции Гаусса (Выражение 7), которая будет экспоненциально убывать во времени (т.е. на каждой последующей итерации). Отметим, что именно использование Гауссовой функции обеспечивает нелинейное преобразование в сети Кохонена:
(7)
-її I
h =
2 (<л70 J2
w
w
І n
где
hnJ- функция топологической окрестности, w - вектор-отображение, j - номер вектора-отображения,
n - номер итерации, на которой производится обучение сети,
win - номер отображения-«победителя» на данной итерации. Это очень важное уточнение, потому что, строго говоря, в процессе обучения на каждой итерации может быть разное отображение-«победитель». Именно этот механизм и обеспечивает самоорганизацию - непрерывное изменение карты признаков во времени.
с - стандартное отклонение Г ауссова распределения, т0 - временная константа.
4. Производится подстройка других отображений под отображение-«победитель» (процесс адаптации) с помощью следующей итеративной процедуры обучения (Выражение 8):
/оч w = w , + Т * e ТІ * h * їх-w^ , I,
(8) n n-І n L n-ІЛ'
-n
где
X - исходный эмпирический вектор, w - вектор-отображение, j - номер вектора-отображения,
п - номер итерации, на которой производится обучение сети,
Ьп- функция топологической окрестности,
П - параметр, влияющий на скорость обучения сети. Одним из условий стохастической аппроксимации является зависимость параметра обучения от времени, что обеспечивается с помощью множителя на основе экспоненциальной функции (в нашем случае параметр обучения будет убывающим). т2 - временная константа.
Однако после того как мы получили оптимизированные отображения вектора X, перед нами неизбежно встаёт вопрос интерпретации полученных данных. Напомним, мы хотели бы использовать результат работы сети для прогнозирования фондового рынка. В то же время после процедуры обучения и подстройки отображений под топологическую окрестность победившего нейрона, мы получаем в выходном слое пять векторов вместо одного, т.е. 25 отдельных значений в пяти группах по пять координат.
Вновь проведём параллель с методом главных компонент. Когда мы построили новый ортогональный базис - координатные оси, вдоль которых разброс признака максимален, мы имеем возможность выбрать, например, одну самую «главную» (отсюда и названия метода), в результате чего значительно сокращается объём данных, нуждающихся в интерпретации.
В случае с картами самоорганизации, после процесса оптимизации, мы не можем заранее идентифицировать то отображение (группу координат), которая бы в наилучшей степени характеризовала исходный вектор Х. Другими словами, у нас нет подсказки относительно того, какой из признаков-сигналов использовать для прогнозирования рынка.
В этой связи мы принимаем решение заранее не отдавать предпочтение какому-либо из отображений, а формировать прогноз с использованием всех групп координат. Для этого мы будем рассчитывать сумму скалярных произведений S (Выражение 9) исходного вектора Х с каждым из его отображений w. Итоговое значение работы сети Y, которое будет использовано для прогноза, будет получено нами путём подстановки скаляра S в функцию активации в виде гиперболического тангенса (Выражение 10). Это также можно трактовать как добавление ещё одного дополнительного скрытого слоя в сеть.
е5 -е-5
(9) У =----------,
е5 + е - 5
где
(10) 5 = Д( *х)’
где
X - исходный эмпирический вектор,
w - вектор-отображение исходного вектора X,
j - номер вектора-отображения исходного вектора X,
4 - количество векторов-отображений исходного вектора Х.
Таким образом, наша искусственная нейронная сеть примет следующий итоговый вид (Рис.4). Ещё раз отметим, что в отличие от Рис. 1 X и w здесь являются векторами, а не скалярными значениями.
Заметим, что формально мы решили задачу по снижению размерности входного пространства: из исходного вектора, состоящего из пяти значений, получилось одно скалярное значение. Вместе с тем, мы не смогли выполнить ранжирование и идентификацию наиболее значимых признаков вектора Х, т.е. отобрать одно или несколько отображений для построения прогноза сети. Мы попробуем это сделать в одном из следующих разделов данной статьи.
Рис. 4
3. Первые эмпирические результаты
Прежде чем перейти к обзору результатов прогноза нашей модели, необходимо указать на данные, которые были использованы для тестирования карт самоорганизации. Мы предоставляли сети ежедневные логарифмированные значения доходностей американского фондового индекса Dow Jones за период с 27 мая 2007 года по 31 марта 2009 года, т.е. данные значения охватывали предкризисный период, дно кризиса и начало периода восстановления.
Наша гипотеза состоит в том, что если с помощью торговой стратегии, основанной на использовании карт самоорганизации, нам удастся превзойти рост рынка (а в нашем случае, скорее не упасть глубже, чем рынок), то это будет сигналом того, что данный алгоритм способен с некоторой степенью достоверности воспроизводить поведение участников рынка.
Под ростом или падением рынка мы будем понимать динамику доходности самого индекса Dow Jones во времени (рыночный портфель), при том, что в начале рассматриваемого периода мы принимали его значение равным 1 (обозначение на графиках Market). Начальное значение портфеля, формируемого на основе прогнозов искусственной нейронной сети карт самоорганизации (виртуальный инвестиционный портфель, обозначение на графиках Portf), также было равно 1. Далее, в зависимости от прогноза сети, мы ежедневно вставали в длинную, либо в короткую позицию.
Исходный эмпирический вектор X определялся как пять последовательных логарифмированных значений доходности индекса Dow Jones с лагом в два дня по отношению ко дню прогноза. Начальные векторы-отображения мы получали из случайного нормального распределения, обладающего тем же средним и стандартным отклонением, что и эмпирическая выборка.
Необходимо также указать на то, что при расчете прогноза сети мы использовали метод «скользящего окна». Это означает, что при расчете прогноза для каждого последующего торгового дня, мы также на один день сдвигали «вправо» по временной оси наш исходный вектор Х. Благодаря этому искусственная нейронная сеть карт самоорганизации постоянно обучалась на актуальной информации. Это
крайне важно для прогнозирования финансовых рынков, где данные стремительно устаревают и становятся нерелевантными.
Наша торговая стратегия состояла в следующем: в случае, если абсолютное значение прогноза сети в торговый день к было больше или равно значению прогноза сети в торговый день к-1, мы вставали в длинную позицию, в противном случае - в короткую (Выражение 11). Мы намеренно не использовали некое пороговое значение (например, «покупай, если, прогноз сети больше 0») по причине сложности определения подобной переломной точки - значения прогнозов сети слишком волатильны.
Следует отметить, что мы намеренно старались использовать достаточно примитивное торговое правило, для того чтобы, по возможности, минимизировать влияние самого торгового правила на общий результат.
Формально наше торговое правило выглядит так:
G _rkif Єk ~^k-1
(11) k - rk otherwise
где
Gk - логарифмированная доходность виртуального инвестиционного портфеля в торговый день k. Чтобы вернуться к обычным доходностям, мы затем применяли экспоненциальную функцию для вычисления динамики виртуального инвестиционного портфеля. rk - логарифмированная доходность индекса Dow Jones в торговый день k,
- скалярное значение прогноза нейронной сети для торгового дня k.
По итогам торговой сессии были получены интересные результаты (Рис. 5,6,7) На конец рассматриваемого периода значение рыночного портфеля составило 0,57, а значение виртуального портфеля сильно варьировалось в зависимости от того, какими были начальные векторы-отображения, сгенерированные случайно.
Рис. 5
По горизонтальной оси отложены торговые дни (k), по вертикальной - величина портфеля. Market - рыночный портфель, Portf-виртуальный инвестиционный портфель, построенной на основе прогноза сети карт самоорганизации. Начальные значения портфелей равны 1.
в
По горизонтальной оси отложены торговые дни (k), по вертикальной - величина портфеля. Market - рыночный портфель, Portf-виртуальный инвестиционный портфель, построенной на основе прогноза сети карт самоорганизации. Начальные значения портфелей равны 1.
Рис. 7
Т---------------------1---------------------1---------------------г
1.7x1а’ 1.8x10* 1.9x10* 2x10s i.lxlo’ 2.2x10і
По горизонтальной оси отложены торговые дни (k), по вертикальной - величина портфеля. Market - рыночный портфель, Portf-виртуальный инвестиционный портфель, построенной на основе прогноза сети карт самоорганизации. Начальные значения портфелей равны 1.
Как видно из графиков, динамика виртуального инвестиционного портфеля очень сильно зависит от выбора начальных векторов-отображений: портфель ведёт себя хуже рынка, примерно наравне с ним или даже обыгрывает.
Данный результат наглядно демонстрирует две важные проблемы, связанные с использованием искусственных нейронных сетей в финансовом моделировании. С одной стороны, в ходе итеративной процедуры оптимизации, крайне важным оказывается выбор начальной точки, т.е. «места», из которого мы начинаем улучшать функционирование сети. С другой стороны, для подбора случайных значений векторов-отображений мы вынуждены прибегать к генератору случайных значений, инсталлированного в программное обеспечение, которое мы используем для расчетов (в данном случае, программу MachCAD). При этом идеальный генератор случайных чисел создать практически невозможно, а значит, наши начальные векторы-отображения будут в меньшей или большей степени детерминированы используемым ПО.
Как результат этих двух обстоятельств, мы не можем адекватно оценить эффективность работы карт самоорганизации, используя случайные начальные значения векторов-отображений. Более того, если подойти с позиции инвестора, то его, безусловно, не могут устроить такие значительные колебания портфеля в зависимости от начальных значений. Это обуславливает необходимость совершенствования модели, что мы и попытаемся сделать в следующем разделе статьи.
4. Усовершенствование модели - удаление случайной составляющей из начальных данных
Для того чтобы адекватно оценить эффективность работы карт самоорганизации на падающем рынке, нам необходимо убрать или минимизировать влияние случайной начальной составляющей на процесс оптимизации. Это означает, что нужно использовать принципиально иной способ определения начальных векторов-отображений: не случайный (а, скорее, псевдослучайный), а детерминированный самой моделью, её спецификацией. Следует отметить, что это принципиально важное положение, потому что в большинстве нейросетевых моделей начальные значения задаются именно случайно.
Существуют самые различные подходы к детерминистскому заданию начальных значений (в нашем случае векторов-отображений) искусственной нейронной сети. К примеру, мы могли бы сделать все начальные векторы-отображения единичными. Однако нам бы хотелось, чтобы отображения вектора Х были в некоторой степени похожи на него, содержали значимую информацию о нём. В этой связи в качестве начальных векторов-отображений мы предлагаем использовать эмпирические значения самого вектора Х, предварительно обработанные.
На сегодняшний день существует несколько методов предварительной обработки данных. В рамках данной работы мы обратимся к уже упоминавшемуся выше методу главных компонент (Principal Component Analysis, см., например, работу (Jolliffe, 2002)). В виду сходства карт самоорганизации и метода главных компонент, мы будем использовать именно этот механизм.
В случае с методом главных компонент мы проецируем эмпирический вектор Х на новые координатные оси, вдоль которых его дисперсия максимальна. Для отображения эмпирических данных в этом новом пространстве используется специальная кодирующая матрица, а именно ковариационная матрица, из которой, затем, извлекают её собственные векторы.
Принципиальное отличие нашей усовершенствованной модели от других исследований в области карт самоорганизации будет состоять в том, что мы будем использовать ковариационную матрицу вектора Х для определения начальных векторов-отображений (предварительно задав матрицу так, чтобы из размерности совпадали). Таким образом мы уйдём от стохастического подхода в определении начальной точки оптимизации, а также избежим возможных дефектов в генераторе случайных чисел, встроенных в ПО.
Теперь наши начальные векторы-отображения будут эндогенно задаваться внутри модели. Это выполнение именно того требования в отношении карт самоорганизации, которое было изложено в начале статьи: благодаря использованию метода главных компонент мы задаём карту признаков, которые фиксируют важные характеристики исходного вектора Х в другом пространстве.
После того как мы удалили случайную составляющую в задании начальных векторов-отображений, мы вновь попробуем спрогнозировать рынок. На Рис. 8 приведена сравнительная динамика рыночного и виртуального инвестиционного портфеля.
Рис.8
По горизонтальной оси отложены торговые дни (к), по вертикальной - величина портфеля. Market - рыночный портфель, Portf-виртуальный инвестиционный портфель, построенной на основе прогноза сети карт самоорганизации. Начальные значения портфелей равны 1.
Значение рыночного портфеля на конец торговой сессии составило 0,71, а виртуального инвестиционного портфеля с использованием сети Кохонена - 0,41. Результат, который мы получили, вновь не может быть признан удовлетворительным ни с инвестиционной точки зрения, ни с точки зрения понимания процессов ценообразования на падающем рынке, поскольку виртуальный инвестиционный портфель «упал» ещё глубже рынка. Это означает, что наш алгоритм опять нуждается в доработке. Вместе с этим задача удаления случайной составляющей в задании начальных векторов-отображений была выполнена, и теперь они детерминированы свойствами исходного вектора Х.
5. Усовершенствование модели - повышение эффективности обучения
Чтобы повысить прогнозную эффективность нашей нейронной сети, начальные значения которой заданы детерминистски, мы попытаемся усовершенствовать процесс её обучения. До сих пор в качестве исходного вектора X мы брали вектор из пяти последовательных логарифмированных доходностей индекса Dow Jones с лагом в два дня по отношению ко дню торговли. Именно на основе этой информации осуществлялась оптимизация работы сети, а затем принималось инвестиционное решение (длинная или короткая позиция).
Теперь мы попробуем несколько изменить этот алгоритм. Логично предположить, что для того, чтобы повысить прогнозную эффективность сети, она должна, как минимум, предсказывать наибольший рост или падение на рынке - «выбросы» во временном ряде - и одновременно игнорировать шумовую компоненту.
Как показывают полевые исследования, для удачной игры на рынке вовсе необязательно угадывать направление движения рынка в каждый торговый день. Впечатляющую инвестиционную динамику портфеля обеспечит верный прогноз в чуть более половине случаев. Главное требование, которое предъявляется в данной ситуации к прогнозной модели - эффективно фиксировать все выбросы на каждом временном промежутке.
Для реализации этой цели мы изменим способ задания исходного вектора Х, из которого с помощью метода главных компонент затем будут сформированы начальные векторы-отображения. Определяя исходный вектор, X мы будем рассматривать временной период за 15 дней до торгового дня. Выбор более длинного временного отрезка может оказаться не вполне эффективным, поскольку информация на фондовом рынке стремительно устаревает. Также отметим, что мы сохраняем метод «скользящего окна», т.е. данный 15-дневный отрезок сдвигается вперёд во времени на каждом торговом шаге.
Внутри 15-дневного промежутка мы будем находить день с максимальным абсолютным логарифмированным приростом индекса, а затем формировать начальный вектор X как вектор из пяти последовательных значений, предшествующих дню максимума. После этого мы проводим итеративную процедуру обучения сети, описанную выше (Выражение 8).
Однако это является лишь первым этапом обучения, «обучением на максимуме». После его завершения мы переходим ко второму этапу - «обучению на минимуме». На этот раз исходный вектор X формируется из пяти логарифмированных значений, предшествующих минимуму - наименьшему абсолютному приросту индекса Dow Jones на том же 15-ти дневном отрезке. Следует отметить, что на этом втором этапе мы не формируем начальные векторы-отображения заново, но используем те, которые были получены в процессе оптимизации первого этапа - «обучения на максимуме».
Наш расчет будет состоять в том, что сеть в процессе обучения сможет извлечь информацию о формировании максимумов и минимумов в прошлом (ведь она анализировала значения доходностей, непосредственно предшествовавших им) и затем с помощью этой информации успешно прогнозировать выбросы в будущем.
На Рис. 9 представлены результаты, полученные с помощью нашей модели после усовершенствования процесса обучения (архитектура сети и торговая стратегия не менялись.
J|---------------------------1--------------------------1--------------------------1--------------------------г
l.MdP : .i^Ltr І.ЬЛІҐ Mij] 2.U1G1 Э^МО?
t
По горизонтальной оси отложены торговые дни (k), по вертикальной - величина портфеля. Market - рыночный портфель, Portf-виртуальный инвестиционный портфель, построенной на основе прогноза сети карт самоорганизации, Regr - виртуальный инвестиционный портфель, построенный на основе прогноза авторегрессии. Начальные значения портфелей равны 1.
Как видно из графика, нам удалось значительно превзойти рынок и обеспечить практически 150% рост виртуального портфеля в самый тяжёлый для фондового рынка период. На конец торговой сессии значение рыночного портфеля составило 0,55, а портфеля, построенного на основе прогнозов сети, - 2,41.
На данном графике мы также привели сравнение нашей модели с простой авторегрессией, также построенной по методу «скользящего окна» (Выражение 12):
(12) = ak+Pk * rk-b
где
* ч I
rk - прогноз авторегрессионной модели для торгового дня k,
ak, Pk -коэффициенты авторегрессии для торгового дня k,
rk-1 - логарифмированное значение доходности индекса Dow Jones в день (k-1).
Инвестиционный портфель, построенный с помощью этой авторегрессии, обозначен на графике как Regr. Торговое правило при его формировании было аналогично Выражению 10: мы вставали в длинную позицию, если значение прогноза авторегрессии в день k было больше либо равно его значению в день k-1. На конец торговой сессии значение виртуального инвестиционного портфеля, построенного с помощью авторегрессии составило 0,04. Это говорит о том, что такая модель не только значительно уступила в эффективности нашей сети Кохонена, но и проиграла рынку.
В качестве дополнительной проверки эффективности нашей модели мы выясним, является ли превышение доходности виртуального инвестиционного портфеля (Portf) над рыночным (Market) случайным, либо такая динамика закономерна. Если связь между рыночной и портфельной доходностью полностью отсутствует, это будет означать, что наши инвестиционные результаты могли получиться в результате случайного стечения обстоятельств. Напротив, если между двумя рядами существует статистически значимая взаимосвязь, это будет означать, что результаты работы модели в некоторой степени обусловлены реальными эмпирическими данными и их обработкой сетью Кохонена.
Для выполнения этой задачи мы начнём с расчета коэффициента корреляции Пирсона между временными рядами Portf и Market. Его значение равно 0,86, и он является статистически значимым на 95% доверительном интервале (t-статистика равна 145,34 при t-критическом - 1,97, что говорит о необходимости отвергнуть нулевую гипотезу о незначимости коэффициента).
Однако мы не ограничимся расчетом коэффициента корреляции и проверкой его значимости для оценки взаимозависимости временных рядов Portf и Market. Мы проведём тест причинности Грейнджера (Granger causality test, см. работу (Granger, 1969)), с помощью которого выясним, существует ли причинная
зависимость ряда Portf от ряда Market. Нулевая гипотеза теста Грейнджера будет состоять в том, что временной ряд Market причинно не обуславливает временной ряд Portf. Соответственно, мы должны выяснить, можно ли эту гипотезу отвергнуть.
Для выполнения теста Грейнджера необходимо построить две регрессии. Первая - простая авторегрессия для временного ряда Portf с лагом в два дня (Выражение 13):
(13) Portf* = а + Р* P°rtfк-2’+ек,
где
Portfk* - прогнозное значение авторегрессии,
Portfk-2 - значение виртуального инвестиционного портфеля, построенного по прогнозам сети Кохонена в торговый день k-2, а и в - коэффициенты авторегрессии. ek - остатки авторегрессии.
При этом мы обязательно должны подобрать лаги регрессора так, чтобы коэффициент при нём был значимым. В нашем случае t-статистика для коэффициента в равна 255,47 при t-критическом - 1,97, что говорит о необходимости отвергнуть нулевую гипотезу о незначимости коэффициента.
После этого мы строим вторую регрессию, в которую включаем значения временного ряда Market, также с лагом в два торговых дня (Выражение 14):
(14) Portf* = а+ Р* P°rtf*-2 + 7 * Marketk-2 + Цк , где
Portfk* - прогнозное значение регрессии,
Portfk-2 - значение виртуального инвестиционного портфеля, построенного по прогнозам сети Кохонена в торговый день k-2,
Marketk-2 - значение рыночного портфеля в торговый день k-2,
а, в, Y - коэффициенты регрессии,
^k - остатки регрессии.
Мы вновь должны подобрать лаг переменной Market2 так, чтобы коэффициент при ней был статистически значимым. В нашем случае t-статистика для коэффициента у равна -101,62 при t-критическом - -1,97, что говорит о необходимости отвергнуть нулевую гипотезу о незначимости коэффициента.
После того, как обе регрессии построены, мы рассчитываем на основе сумм их квадратичных ошибок F-статистику, которая и должна дать итоговый ответ по тесту Грейнджера. В нашем случае F-статистика равна 101,67, при F-критическом - 3,02. Это говорит о том, что нулевая гипотеза теста Грейнджера о том, что временной ряд Market причинно не обуславливает временной ряд Portf , должна быть отвергнута.
Таким образом, мы можем с уверенностью утверждать, что существует значимая статистическая взаимосвязь между реальной рыночной доходностью и нашим виртуальным инвестиционным портфелем. Это означает, что положительная динамика портфеля относительно рынка не может быть признана случайной.
Итак, мы можем ещё раз констатировать, что полученные результаты свидетельствуют о том, что карты самоорганизации могут являться эффективным инструментов для работы на падающем рынке. Более того, инвестиционный успех стратегии, основанной на использовании данной сети, говорит о том, что карты самоорганизации с некоторой степенью подобия воспроизводят поведение инвесторов на рынке.
6. Работа модели в долгосрочном периоде
Искусственная нейронная сеть карт самоорганизации может быть использована в качестве эффективного инструмента падающего, кризисного рынка. Однако нам бы хотелось понять, можно ли использовать сеть Кохонена на более длительном промежутке времени, фиксирующим не только падение, но и рост, а также общую смену режима функционирования рынка, обусловленную новыми законодательными инициативами, структурными и институциональными изменениями и другими факторами.
2 Заметим, что может быть использована регрессия с несколькими по-разному лагированными переменными, что может повлиять на итоговые результаты теста Грейнджера.
Здесь также стоит указать на одну интересную и небезосновательную точку зрения (см. работу (Евстигнеев, 2009)). Она заключается в том, что стремительное падение (как и взрывной рост) - в действительности более простая ситуация для участников рынка в плане принятия решений, а ситуация умеренного тренда или отсутствия значимых колебаний на рынке - более сложная.
Это означает, что наша модель «научилась» работать в простых ситуациях, но может быть не столь эффективна в сложных. При этом, справедливости ради, также стоит отметить, что периоды стремительных взлётов и падений на рынке краткосрочны. При грамотном выборе торговой стратегии инвестор может приумножить свой капитал в эти короткие периоды, однако для более длительной и эффективной работы на фондовом рынке необходимо иметь модель, которая будет успешно прогнозировать рынок и в периоды относительно спокойной динамики, которые и формируют картину фондового рынка в долгосрочной перспективе.
Чтобы оценить эффективность работы сети в долгосрочном периоде, мы представим ей более длинный массив данных - логарифмированные значения доходностей индекса Dow Jones с 30 июня 2000 года по 31 марта 2009 года (заметим, что эти данные включают в себя более короткий, «кризисный» массив).
На Рис. 10 представлены результаты работы нашей сети на этом практически десятилетнем массиве данных (архитектура сети и торговая стратегия не менялись
Рис. 10
к
По горизонтальной оси отложены торговые дни (к), по вертикальной - величина портфеля. Market - рыночный портфель, Portf-виртуальный инвестиционный портфель, построенной на основе прогноза сети карт самоорганизации, Regr - виртуальный инвестиционный портфель, построенный на основе прогноза авторегрессии. Начальные значения портфелей равны 1.
Значение рыночного портфеля на конец торговой сессии составило 0,72, виртуального инвестиционного портфеля с использованием сети Кохонена - 3,44, виртуального инвестиционного портфеля, построенного на основе авторегрессии - практически 0 (т.е., мы полностью потеряли наш начальный капитал).
Используя торговую стратегию на основе нейронной сети карт самоорганизации, мы смогли в значительной степени превзойти динамику рынка и модель с использованием простой авторегрессии. Однако на графике видно, что только в периоды падений и кризисов фондового рынка наша модель демонстрирует хорошие результаты. Резкий рост виртуального инвестиционного портфеля на графике соответствует краху доткомов в начале 2000-х гг. и мировому финансовому кризису 2008 года. В тоже время в период стабильности и устойчивого роста фондового рынка виртуальный инвестиционный портфель показывает отрицательную динамику. Это говорит о том, что в периоды роста и относительно спокойной ситуации на рынке (бокового тренда) наша сеть неэффективна, а, значит, не может воспроизводить модель принятия решений участниками рынка.
Для того чтобы оптимизировать работу нашей модели в долгосрочном периоде, нам необходимо каким-то образом выделять те векторы-отображения карты признаков, которые внесли решающий вклад в формирование доходности на данном торговом дне, о чём уже говорилось в начале статьи. Напомним, что в
отличие от метода главных компонент, мы не имеем возможности идентифицировать наиболее важный вектор-признак и поэтому при формировании итогового прогноза сети в равной степени учитывали каждый из них (Выражение 10).
Теперь нашей главной задачей станет внедрение в сеть Кохонена метода, который будет способен провести отбор среди карты признаков, состоящей из векторов-отображений.
Мы считаем, что в качестве такого инструмента может быть использована синергетическая сеть Хакена (см. работу (Хакен, 2001)). Изначально, сеть Хакена разрабатывалась как модель распознавания образов, однако в рамках данной работы мы применим её свойства в совершенно новом качестве, соединив с сетью Кохонена.
Сеть Хакена распознаёт предъявляемый ей образ (зашумлённый или искажённый) путём обращения к своей памяти, подобно тому, как, увидев знакомое лицо в толпе, мы начинаем вспоминать, где могли видеть этого человека в прошлом (принцип ассоциативной памяти). Технически это означает, что сеть Хакена будет стремиться «свести» предъявляемые ей на вход значения к одному из уже содержащихся в её библиотеке априорных знаний. Именно это свойство сети Хакена крайне ценно для нас, потому что мы можем использовать нашу карту признаков в качестве библиотеки априорных знаний. Затем, в процессе оптимизации, сеть будет сопоставлять зашумленный исходный вектор Х с его топологически упорядоченными отображениями, сводить к одному из них и на основе этого доминирующего признака реконструировать новый вектор.
Процесс работы сети Хакена выглядит следующим образом (Выражение 15):
q - это вектор, который оптимизируется сетью. Его исходное значение - это искусственно зашумлённый исходный вектор, состоящий из M элементов. В качестве вектора q мы будем брать наш исходный вектор Х, состоящий из пяти логарифмированных значений доходности индекса Dow Jones с лагом в два дня. Значение пятого элемента вектора будет всегда равно нулю - таким образом мы будем его зашумлять.
процедуру, описываемую Выражением 13, мы также будем осуществлять в течение определённого числа итераций.
V - матрица из к столбцов, являющаяся библиотекой априорных знаний. В нашем случае роль библиотеки будут играть оптимизированные векторы-отображения (карта признаков) исходного вектора Х.
X - параметр, влияющий на скорость обучения сети,
В и С - константы, влияющие на сходимость сети.
После завершения итеративной процедуры оптимизации мы будем брать среднее значение реконструированного вектора q и подставлять его в функцию активации (ей, по-прежнему, является гиперболический тангенс) - это и будет являться итоговым прогнозным значением нашей модели Кохонена-Хакена. Ещё раз подчеркнём, что подобное соединение двух самообучающихся нейронных сетей является новаторским подходом и делает нашу модель в своём роде уникальной.
Однако прежде чем перейти к прогнозированию динамики фондового рынка с помощью сети Кохонена-Хакена, мы внесём ещё одно изменение в модель. Ранее в данной работе уже отмечалось, что Евклидово расстояние является далеко не единственным критерием, по которому мы можем определять сходство вектора Х с его отображениями на карте признаков.
Достаточно эффективный инструментарий в этой области может быть предложен на основе теории информации. В частности, в качестве нововведения для карт самоорганизации мы предлагаем использование величины относительной энтропии в качестве критерия «похожести» вектора Х и его отображений.
Относительная энтропия - это разница между информационной ёмкостью двух случайных процессов, чем она меньше, тем меньше различие (подробнее см. работу (Ки11Ьаск, Leibler, 1951)).
В общем виде относительная энтропия выражается так (Выражение 16):
(15)
к=1
к=1
где
*
q - реконструированный вектор, который получается в результате работы сети Хакена. Отметим, что
(16)
где
Н - величина относительной энтропии,
р(х) и р(х) - два случайных процесса,
к - параметр, задающий пределы интегрирования.
Следует отметить, что в практических построениях достаточно использовать только первое слагаемое Выражения 14, что мы и будем делать для увеличения скорости вычислений.
Мы вполне можем трактовать величину относительной энтропии как расстояние между распределением, содержащим вектор Х, и распределениями, содержащими каждое из его отображений на карте признаков.
Поскольку в ходе оценки величины относительной энтропии мы должны работать не с векторами, а с распределениями, содержащими эти вектора, то вначале мы зададим распределения исходного вектора Х и его отображений. Мы будем считать, что это нормальные распределения, причём предположим, что распределения отображений вектора Х более волатильны, чем распределение самого вектора. Делая такое предположение, мы основываемся на эмпирических данных о волатильности выходных значений нашей модели до применения метода вычисления относительной энтропии. Волатильность результатов работы сети в несколько раз превышала волатильность исходных данных (логарифмированного значений доходности индекса Dow Jones).
Также очень важно отметить, что мы будем работать с распределениями субъективных вероятностей, что также вынуждает нас несколько скорректировать нормальные распределения. Мы исходим из теории перспектив (подробнее см. (Kahneman, Tversky, 1979)), которая постулирует, что индивиды (в нашем случае - участники фондового рынка) строят свои прогнозы на основе субъективных ожиданий, которые задают распределения, отличные от Гауссовых. В частности, в ситуации нормального, спокойного рынка люди склонны завышать рыночный риск (дисперсию), вследствие чего распределение имеет «толстые хвосты». Для того, чтобы скорректировать нормальное распределение на субъективные ожидания индивидов, мы будем использовать специальный множитель для дисперсии.
В итоге в нашей сети Кохонена-Хакена мы заменим Евклидово расстояние в Выражениях 6 и 7 значениями относительной энтропии (Выражения 17 и 18):
(17)
а ІР
J
~а ж * Г 2n
-Р~
j2 (r-mean(Wq ))
2(Ж*Г)
2
Ж * Г In
j2 (r - mean ( Wq ))
Г 2n
2(Ж*Г)
2
(r - mean (X))
2
2с
2
) dr
*
e
2
*
*
e
2
*
e
( r - mean ( wj-1 ))2 ( r - mean ( wJn-1 ))2 ----------------P- * e 2(l*CT)
а ІР P 2( ж*г)2 Ж * 2
(18) J ---------j= * e *log.,(--------------------------------:---;----) dr,
-ах * a^2n l~ - Pr-mean(w'W'-A ))
^ . ~P 2Г2
e
стЛІ 2n
где
r - логарифмированная доходность индекса Dow Jones, а - константа, задающая пределы интегрирования,
в - корректирующий множитель для дисперсии, который позволяет задавать субъективные распределения вероятностей на основе теории перспектив, mean - функция среднего значения, с - стандартное отклонение нормального распределения,
X - корректирующий множитель, который задаёт более высокую волатильность (стандартное отклонение) в распределениях, содержащих отображения вектора Х.
Результаты работы сети Кохонена-Хакена на долгосрочном периоде наблюдений представлены на Рис. 11. Мы вставали в длинную позицию, если абсолютное значение прогноза сети было больше или равно логарифмированному значению доходности индекса Dow Jones в предпрогнозный день. Причины выбора такого торгового правила аналогичны описанным выше, с той разницей, что теперь мы сравниваем прогноз сети не с самим собой на предыдущем шаге, а с логарифмированным значением доходности индекса Dow Jones
Формально наше новое торговое правило выглядит так (Выражение 19):
(19) Gk =
rkif sk > rk-1 - rk otherwise
где
Gk - логарифмированная доходность виртуального инвестиционного портфеля в торговый день k. Чтобы вернуться к обычным доходностям, мы затем применяли экспоненциальную функцию для вычисления динамики виртуального инвестиционного портфеля. rk - логарифмированная доходность индекса Dow Jones в торговый день k,
^ - скалярное значение прогноза нейронной сети для торгового дня k.
Рис. 11
О Ъс10:
По горизонтальной оси отложены торговые дни (k), по вертикальной - величина портфеля. Market - рыночный портфель, Portf-виртуальный инвестиционный портфель, построенной на основе прогноза сети карт самоорганизации, Regr - виртуальный инвестиционный портфель, построенный на основе прогноза авторегрессии. Начальные значения портфелей равны 1.
Значение рыночного портфеля на конец торговой сессии составило 0,72, виртуального инвестиционного портфеля с использованием сети Кохонена-Хакена - 5,02, виртуального инвестиционного портфеля, построенного на основе авторегрессии - практически 0.
За исключением двух очевидных провалов (в 2002 и 2007 гг.), динамика нашего виртуального инвестиционного портфеля была положительной. В течение нескольких лет наша модель приносила устойчивую доходность на нормальном, умеренно растущем рынке, после чего буквально «выстрелила» в период кризиса. При этом сеть Кохонена-Хакена не только значительно обыграла рынок, но и оставила далеко позади авторегрессионную модель.
Мы вновь, как и в разделе 6 данной статьи, проверим, не является ли динамика нашего виртуального инвестиционного портфеля случайной по отношению к рынку. Для этого мы опять прибегнем к расчету коэффициента корреляции Пирсона между временными рядами Portf и Market, а также проведём тест Г рейнджера для выявления причинной зависимости временного ряда Portf от ряда Market.
Коэффициент корреляции Пирсона оказался равен 0,15, и он является статистически значимым на 95% доверительном интервале (t-статистика равна 8,13 при t-критическом - 1,97, что говорит о необходимости отвергнуть нулевую гипотезу о незначимости коэффициента).
F-статистика двух регрессий (аналогичных приведёнными в Выражениях 13 и 14) оказалась равна 12,67 при F-критическом равным 3,00.Все коэффициенты регрессий также были значимы. Это говорит о том, что нулевая гипотеза теста Грейнджера о том, что временной ряд Market причинно не обуславливает временной ряд Portf, должна быть отвергнута. Как следствие, мы вновь должны констатировать, что динамика нашего виртуального инвестиционного портфеля не может считаться случайной по отношению к рынку.
Таким образом, полученные результаты с использованием сети Кохонена-Хакена позволяют говорить о том, что при такой спецификации наша модель может не только эффективно прогнозировать рынок в период катастрофических падений, но и адаптироваться к «спокойным» состояниям фондового рынка. С другой стороны, это также свидетельствует о том, что модель с достаточной степенью
достоверности воспроизводит механизм принятия решений участниками рынка, а это и было главной задачей данной работы.
В качестве развития исследования карт самоорганизации планируется дальнейшее улучшение прогнозных качеств модели, поскольку на некоторых временных промежутках сеть проигрывала рынку (Рис. 11). Помимо этого, будет выполнено тестирование модели на ещё более длительном промежутке времени, а также на торговых данных после 2009 года - когда фондовый рынок предположительно в очередной раз изменил режим своего функционирования. Не исключено также, что карты самоорганизации могут оказаться полезны для прогнозирования динамики других финансовых рынков, например, валютного.
Заключение
В рамках данной работы мы пытались прогнозировать динамику американского фондового рынка в период мирового финансового кризиса. Для этой цели мы использовали методы искусственных нейронных сетей. За основу модели были взяты карты самоорганизации (сеть Кохонена). Базируюсь на первых прогнозных результатах, мы модифицировали модель, используя в качестве начальных значений обработанные с помощью метода главных компонент эмпирические данные. Это позволило задавать начальные значения не случайным образом (как это часто делается при построении искусственных нейронных сетей), а детерминистки внутри модели. В результате удалось минимизировать влияние начальных значений на конечный результат работы сети.
В дальнейшем мы оптимизировали процесс обучения сети и внедрили в модель синергетическую нейронную сеть Хакена с применением метода расчета относительной энтропии на основе теории информации. В итоге нам удалось получить принципиально новую искусственную нейронную сеть - сеть Кохонена-Хакена, которая совмещает метод конкурентного обучения и последующую сортировку оптимизированных векторов-отображений исходного вектора Х.
Полученные эмпирические результаты (динамика виртуального инвестиционного портфеля) демонстрируют, что карты самоорганизации могут быть эффективно использованы для прогнозирования рынка в период глубоких падений. Более того, модифицированная модель с использованием сети Кохонена-Хакена позволяет получать хорошие результаты и в долгосрочной перспективе, при отсутствии резких, ярко выраженных колебаний рынка (как вниз, так и вверх).
Более важный результат, чем потенциальный инвестиционный успех торговой стратегии, основанной на использовании карт самоорганизации, заключается в том, что искусственные нейронные сети такого типа могут с достаточной степенью точности воспроизводить механизмы поведения и принятия решений участниками фондового рынка. Только в случае успеха подобной имитации наша модель была бы успешна в инвестиционном плане. Дальнейшие исследования в этой области имеет смысл сосредоточить на анализе функционирования искусственных нейронных сетей на различных временных сегментах фондового рынка, а также на других видах финансовых рынков (в частности, валютном).
Список литературы
1. Круглов В.В., Борисов В.В. Искусственные нейронные сети: Теория и практика. - М.: Горячая линия-Телеком, 2002 - 382 с.: ил.
2. Рубцов Б.Б. Мировые рынки ценных бумаг. - М.: «Издательство «Экзамен», 2002. - 448 с.
3. Евстигнеев В.Р. Прогнозирование доходности на рынке акций. - М.: Маросейка, 2009. - 192 с.
4. Хайкин С. Нейронные сети: полный курс, 2е издание. : Пер. с англ. М. Издательский дом Вильямс", 2006 -1104 с.: ил.
5. Хакен Г. Принципы работы головного мозга: Синергетический подход к работе мозга, поведению и когнитивной деятельности. - М.: ПЭР СЭ, 2001 - 351 с.
6. Bishop C.M. Neural Networks for Pattern Recognition. Oxford University Press, 1995 - 483 p.
7. Granger, C. W. J. Investigating Causal Relations by Econometric Models and Cross-spectral Methods. Econometrica 37 (3), 1969, p. 424-438
8. Jolliffe I.T. Principal Component Analysis, Springer-Verlag (2nd Ed.), 2002.
9. Kahneman D.,Tversky A. Prospect Theory: An Analysis of Decision Under Risk, Econometrica, Volume 47, Issue 2 (Mar.,1979), p. 263-292.
10. Ко^шп Т. "Self-organized formation of topologically соп-ect feature maps", Bio1ogical Cybernetics, 1982, vo1. 43, р. 59-69.
11. Kohonen Т. "The self-organizing mар", Proceedings of the Institute of Electrical
and Electronics Engineers, 1990, vo1. 78, р. 1464-1480.
12. Kohonen Т. "Exploration of very large databases Ьу self-organizing maps", 1997 Interactional Conference оп Neural Networks, 1997, vo1. 1, р. PL1-PL6,
Houston.
13. Krose B., van der Smagt P. An Introduction To Neural Networks, Eight Edition, November 1996.
14. Kullback S., Leibler R.A. On Information and sufficiency, Annals of Mathematical Statistics 22 (1), 1951, p. 7986
15. Ritter H. "Self-organizing feature maps: Kohonen maps", in M.A. Arbib, ed., The Handbook of Brain Theory and Neural Networks, 1995, p. 846851, Cambridge, MA: MIT Press.