Научная статья на тему 'Прогнозирование финансовых временных рядов методом скрытых марковских моделей'

Прогнозирование финансовых временных рядов методом скрытых марковских моделей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1977
766
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФИНАНСОВЫЕ ВРЕМЕННЫЕ РЯДЫ / FI TIME SERIES / СКРЫТЫЕ МАРКОВСКИЕ МОДЕЛИ / HIDDEN MARKOV MODELS / СЛАБАЯ ГИПОТЕЗА ЭФФЕКТИВНЫХ РЫНКОВ / A WEAK EFFI MARKET HYPOTHESIS / АЛГОРИТМИЧЕСКАЯ ТОРГОВЛЯ / ALGORITHMIC TRADING / ИНСТИТУЦИОНАЛЬНЫЕ ИНВЕСТОРЫ / INSTITUTIONAL INVESTORS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шкляев А. О.

Статья посвящена исследованию альтернативного метода анализа и прогнозирования временных рядов методу скрытых моделей Маркова (СММ). В первой части статьи дан краткий математический аппарат, который позволит сформировать понимание алгоритма данного метода, далее будут проанализированы ограничения использования метода, недостатки и преимущества.Актуальность данного исследования состоит в использовании преимуществ скрытых марковских цепей, в частности выявления скрытых закономерностей внутри ряда, для прогнозирования динамики финансового актива. Целью работы является формулирование правил торговли на финансовом рынке на основе концепции скрытых марковских цепей. Объектом исследования является курс EURUSD. Автор предлагает базовый алгоритм торговой стратегии и актуальные направления улучшения метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шкляев А. О.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article presents the Hidden Markov Model (HMM) as an alternative method of analyzingfinancial time series. The paperdiscusses the reasons of its growing popularityamong investors. First, the method’s theoretic framework will be reviewed, then the pros and cons will be analyzed, and, fi, the practical aspects of the method’s implementation will be discussed.The paper discusses theadvantages of using Hidden Markov Models for the forecasting of financial time series, particularlyfor the purpose of identifying hidden patterns within a time series andpredicting the dynamics of financial assets. The paper attempts to establish a trading system based on the concept of Hidden Markov chains, using the EURUSD exchange rate as a real time example. The paper outlines the basic algorithm of the trading strategy and identifies the waysof improving the method.

Текст научной работы на тему «Прогнозирование финансовых временных рядов методом скрытых марковских моделей»

УДК 330.42

Прогнозирование финансовых временных рядов методом скрытых марковских моделей

Аннотация. Статья посвящена исследованию альтернативного метода анализа и прогнозирования временных рядов - методу скрытых моделей Маркова (СМИ)". В первой части статьи дан краткий математический аппарат, который позволит сформировать понимание алгоритма данного метода, далее будут проанализированы ограничения использования метода, недостатки и преимущества.

Актуальность данного исследования состоит в использовании преимуществ скрытых марковских цепей, в частности выявления скрытых закономерностей внутри ряда, для прогнозирования динамики финансового актива. Целью работы является формулирование правил торговли на финансовом рынке на основе концепции скрытых марковских цепей. Объектом исследования является курс EURUSD. Автор предлагает базовый алгоритм торговой стратегии и актуальные направления улучшения метода.

Ключевые слова: финансовые временные ряды; скрытые марковские модели; слабая гипотеза эффективных рынков; алгоритмическая торговля; институциональные инвесторы.

Abstract. The article presents the Hidden Markov Model (HMM) as an alternative method of analyzingfinancial time series. The paperdiscusses the reasons of its growing popularityamong investors. First, the method's theoretic framework will be reviewed, then the pros and cons will be analyzed, and, finally, the practical aspects of the method's implementation will be discussed.

The paper discusses theadvantages of using Hidden Markov Models for the forecasting of financial time series, particularlyfor the purpose of identifying hidden patterns within a time series andpredicting the dynamics of financial assets. The paper attempts to establish a trading system based on the concept of Hidden Markov chains, using the EURUSD exchange rate as a real time example. The paper outlines the basic algorithm of the trading strategy and identifies the waysof improving the method.

Keywords: financial time series; Hidden Markov Models; a weak efficient market hypothesis; algorithmic trading; institutional investors.

Шкляев А.О.,

студент магистратуры Финансового университета Н [email protected]

Развитие современных технологий позволило получить простой и удобный способ доступа к биржевым торгам. Еще совсем недавно желание попробовать свои силы на фондовых рынках многим казалось почти невозможным. Однако за прошедшие 20 лет технологический про-

гресс открыл мир не доступных прежде возможностей для многих людей. Между тем с ростом интереса к финансовым рынкам естественным образом выросла потребность в знаниях о том, как же устроен и как работает «механизм» под названием «рынок».

В данной статье рассматривается универсальный алгоритм моделирования и прогнозирования финансовых временных рядов методом скрытых марковских цепей (СМЦ). Этот метод основан на хорошо известной теории марковских цепей, но при условии, что мы не знаем фактическое состояние системы, а только наблюдаем выходные значения. Иными словами, данный алгоритм позволяет

Научный руководитель: Трегуб И.В., доктор экономических наук, кандидат технических наук, профессор кафедры «Системный анализ и моделирование экономических процессов».

* Модель обычных марковских цепей позволяет описать структуру взаимосвязи наблюдаемых данных, в то время как СММ ставят задачу отыскания неизвестных данных на основе наблюдаемых.

а 22 = 0.2

Рис. 1. Пример марковской цепи

исследовать скрытые связи внутри данных (напо- следующие значения: цена возрастет, цена снизит-

добие нейронных сетей), которые нельзя наблю- ся или цена не изменится1, а вероятности перехода

дать напрямую. от одного состоянии к другому - ау — вероятность

Первые приложения СММ были использованы перехода от состояния / в состояние у (рис. 1). в распознавании речи и телекоммуникационных К примеру, вероятность повышения цены за-

системах. втра при условии, что сегодня цена не изменилась

Марковская цепь определяется следующим на- (по отношению к вчерашней цене), равно а13 = 0.2.

бором параметров: Естественно ввести условие равенства единице

всех вероятностных переходов из каждого состо-

£ = {, s2,..., — набор состояний; янии, т.е.

N _

А = {а11,а12,...,аш} — матрица переходов со- Xау -1, I -1,N ,

у-1

стояний системы, где а1у. отражает вероятность пе- где N-количество состояний системы2.

рехода из состояния / в состояние у, при условии Важное свойство марковских цепей — это зави-N симость текущего состояния системы только от пре-

^ау -1, V/, дыдущего значения, т.е.:

у -1

П - {л1,л2,...,л^ — начальная матрица состо-

Р(Я, IЯ,_1,...,01) = Р(Я, IЯ,-1)

где Р(я, | Я,-1) — условная вероятность наступле-

яний, где — вероятность попасть в состояние I

N ния события Я, при условии, что предыдущее со-

в начальный момент времени. Так же = 1.

i=1

Таким образом, марковскую цепь можно задать набором параметров ^ = {А,П} .

бытие было д(-1.

1 Цена считается неизменной, если ее значение отклонилось на

небольшую величину от текущего положения; границы значимости

Для иллюстрации рассмотрим пример курса задает исследователь. валюты EURRUB. Состояние системы sl принимает 2 Условие ограничения для / указано для полной СММ.

Исходя из примера выше, постараемся выяснить, нимают одно из возможных значений из дискрет-какова вероятность того, что последующие три дня

обменный курс EURRUB будет расти, если сегодня ного алфавита V = {,....,, он снизился (по отношению к вчера , = 0) , = 1.

А = {а11, а12,...,а^} — матрица переходов состояний системы, где ау отражает вероятность перехода из состояния I в состояние у, при условии

Имеется последовательность наблюдений О = {3,s1,s1,s1} для , = 1,2,3,4, и мы хотим определить вероятность О, имея модель^, указанную на рис. 1. Искомая вероятность равна:

tas = 1, i = 1,N ,

j j=1

В - Ь(о,)— эмиссионная последовательность вероятностей или вероятность появления наблюде-

P(O |Г) = P(s3, sl, sl, sj^) =

= P(s3)-P(Sj |s3) • P(s»P(sjsj) = = 1 • 0.25• 0.4-0.4 = 0.04, ния ot из состояния st во время t

П - {л1,л2,...,л^ — начальная матрица состо-

где Р(^. | Sj) — условная вероятность наступления события ^ при условии, что предыдущее со- яний, где — вероятность попасть в состояние / бытие было s¡. N

Марковская цепь, в которой между любыми в начальный момент времени. Так же = 1. двумя состояниями вероятность перехода не равна ^

нулю, называется полной, или эргодической. Дви- Таким образом, модель СМЦ задается набором жение цен активов часто можно полагать марковским процессом. Это значит, что все, что нам не- Х-{А, В, П}. обходимо для прогноза, — это текущее значение

актива, а вся предыдущая история считается не- Данная модель включает два предположения. значимой. Первое. Текущее состояние модели зависит толь-

Марковское свойство цен активов отража- ко от предыдущего: ет так называемую слабую форму эффективного

рынка, согласно которой текущая цена отражает Р(я, |Я,-1,....,Я1) = Р(Я,, IЯ,-1). всю прошлую информацию, касающуюся данного

актива. Второе. Вероятность появления наблюдения о(

Марковские цепи полезны, когда мы хотим подсчитать вероятность конкретной последовательно- зависит только от текущего состояния системы Я, сти событий. Однако интересующие нас события

часто нельзя наблюдать напрямую. В таком случае и не зависит от предыдущих состояний: используют скрытые модели Маркова (СММ).

Р(о, | Я),Я)........Я1,о(-1,...,О1) = Р(о, | я)).

СММ задается следующими параметрами:

£ = {,s2,...,— множество N скрытых со- Для понимания «устройства» скрытых моде-стояний; лей Маркова рассмотрим пример. Допустим, вы

инвестор в 2030 г. и хотите изучить, какой был Q = {я1, Яг,..., Я^ — последовательность длины рынок в России в 2015 г. К сожалению, у вас нет

никакой информации об индексе РТС (или другом Т, берущая значения из £, аналогичном), но есть дневник некоего стаже-

ра, в котором записана история динамики акций О = {о1, о2,..., о^ — наблюдаемая последова- Сбербанка.

Формулируя задачу в терминах СММ, имеем по-тельность, содержащая Т значений, которые при- следовательность наблюдений О = {,...,о36Л , где

t

Рис. 2. Пример СММс наиболее вероятной последовательностью состояний (s2,s1,s2)

каждое принимает одно из значений дискретного

алфавита V - {рост,падение,флет}, в зависимости

от того, как вели себя акции Сбербанка на протяжении 2015 г.: росли, падали или же оставались на прежнем уровне. Задача исследователя - корректно

отыскать последовательность Q = {у,...,q365 } с возможными состояниями: рынок акций рос (^) и рынок акций падал (s2). К примеру, в момент t -1 акции Сбербанка падали, в момент t «покоились»3 и падали - в t +1. Наиболее вероятное состояние

скрытой марковской цепи для указанных трех дней может быть представлено в виде последовательности qt_1 - s2, qt - s2, qu1 - s2. Другими словами, рынок рос на протяжении всех трех дней.

3 Условие относительного «покоя цены» выбирается на усмотрение исследователя.

Обсудив теоретический аппарат метода СММ, перейдем к проблемам, возникающим при использовании данного алгоритма в практических целях [1].

Имея представление о структуре алгоритма работы СММ, важно также указать ряд проблем, связанных с данным методом.

Проблема 1. Вычисление вероятности. Зная параметры модели СММ X и последовательность наблюдений О , определить вероятность P(O| X).

Проблема 2. Декодирование. Зная параметры модели СММ X и последовательность наблюдений О , определить наилучшую последовательность Q .

Проблема 3. Обучение. Зная последовательность наблюдений О и набор состояний СММ, «обучить» СММ X для достижения наиболее точных результатов.

Для нахождения вероятности P(O| X) используется Форвард- Бэквард (Forward-Backward) алгоритм. Данный способ, к примеру, при 5 состояниях системы и 100 наблюдениях требует всего около 2500 итераций вместо 1072 при классическом подходе к расчету вероятности [1].

Для решения второй задачи часто используют алгоритм Ветерби (Veterbi algorithm) [2, 3].

Третья, самая важная задача решается вводом новой переменной

^ = P(q = st, q+i = sj1 O,'k),

где <^t — вероятность нахождения модели в момент t в состоянии st, а в момент t +1 — в состоянии Sj. Максимизация данной вероятности достигается путем исследования форвард- и бэквард-переменных, введенных при решении проблемы 1 [2, 4].

Для создания торговой стратегии необходимо ввести правила входа-выхода из стратегии. Помимо исследования исходного ряда цен финансового актива, будем также рассматривать другие временные ряды или индикаторы, построенные по данным исходного ряда, для увеличения качества прогноза. Причина, по которой будет проводиться одновременный анализ «производных» временных рядов, в том, что существует так называемый эффект следования (sideway movements) в долгосрочных трендах. Для отслеживания этого эффекта и увеличения точности прогноза будет проводиться анализ «производных» данных. В качестве вспомогательных рядов могут быть взяты как макроэкономические данные (процентная ставка, торговый баланс, индекс ожиданий и пр.), цены иных активов, хорошо коррелирующих с анализируемым рядом (к примеру, цены сырьевых товаров), так и индикаторы, построенные по данному же временному ряду (скользящие средние, RSI и т.д.) [5, 6].

Для удобства переведем вспомогательные ряды в множество f0 - {—1;0;1}. Предположим, что доходность цен на золото хорошо коррелирует с курсом EURUSD, тогда в данном контексте единица присваивается значениям больше нуля, минус единица — соответственно отрицательным доход-ностям.А ноль присваивается околонулевой доходности, где параметры значимости доходности вводятся исследователем. К примеру, Z - (-е;е) можно считать уровнем незначимости изменения доходности прие = 0,01.

Одним из возможных способов определения максимально возможного состояния системы завтра является предположение, что q*+1 = sr, полагая, что

r - argmax j {atj},

где t — наиболее вероятное состояние сегодня согласно алгоритму Ветерби, т.е. qt - si и r -1,N — количество состояний модели.Теперь нам необходимо знать наиболее вероятное наблюдение о*+1 = ots+1. Но поскольку матрица B недоступна к моменту t +1, можно использовать последнюю

известную матрицу B . Основываясь на этом, имеем хорошую оценку модели:

s = argmax k {br (of )},

где k = 1,D - количество возможных наблюдений. Зная прогнозное o*+1 и значение вспомогательных рядов (которые принимают значения из множества {-1,0,1} ), можем считать, что торговый сигнал определен. К примеру, доходность золота положительна, тогда /0 = 1, другие индикаторы также приняли значение 1, в таком случае следует занять длинную позицию.

При максимизации точности прогноза можно так же исследовать air и br(ost ). Для этого в модели СММ всегда выбирается состояние системы и прогнозное значение с максимальной вероятностью появления (согласно модели СММ), иначе говоря, решается своего рода задача максимизации. Хотя в иных случаях, зная прогнозный вектор bj (ot+1), мы можем перейти к непрерывной модели и найти математическое ожидание (при условии, что данных достаточно для подобного рода анализа) или определить вид распределения и методом Монте Карло вычислить наиболее вероятное значение цены в момент времени t +1.

Указанный пример использования СММ для создания торгового сигнала является базовым. Как указано выше, метод может быть дополнен посредством анализа непрерывных данных (с целью исключить потерю значимой информации, как это происходит в случае дискретной модели) и увеличения количества анализируемых сопутствующих производных временных рядов.

литература

1. Indvall P., Jonson C. Algorithmic Trading. Hidden Markov Models on Foreign Exchange Data, Master's Thesis - LinkopingsUniversitet, 2008.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Hassan R., Nath B. and Kirley M. A Fusion Model of HMM, ANN and GA for Stock Market Forcasting, Expert Systems with Applications, 2007.

3. Jurafsky D. and Martin J.H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 2nd Edition, Pearson Prentice Hall, London, 2006.

4. Yingjian Z. Prediction of Financial Time Series with Hidden Markov Models, Simon Fraiser University, Burnaby, 2004.

5. Трегуб И. В. Технический анализ фондового рынка. М.: ПТСМ, 2011.

6. Трегуб И.В. Применение адаптивных моделей для прогнозирования временных рядов финансовых инструментов / Материалы VI Международной конференции. М., 2010.

i Надоели баннеры? Вы всегда можете отключить рекламу.