Научная статья на тему 'Сигнальная модельдля внутреннего денежного рынка'

Сигнальная модельдля внутреннего денежного рынка Текст научной статьи по специальности «Экономика и бизнес»

CC BY
119
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Прикладная эконометрика
Scopus
ВАК
Область наук
Ключевые слова
ДЕНЕЖНЫЙ РЫНОК / ВРЕМЕННЫЕ РЯДЫ / СЕГМЕНТИРОВАНИЕ / КЛАСТЕРИЗАЦИЯ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТИ / MONEY MARKET / TIME-SERIES / SEGMENTATION / PROBABILITY DISTRIBUTION CLUSTERING

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Исаков А. В.

В данной работе предлагается модификация алгоритма сегментирования временных рядов, позволяющая идентифицировать однородные сегменты функционирования денежного рынка на основе кластеризации многомерных распределений и использовать новые наблюдения, поступающие по мере кластеризации. Предлагаемый подход позволяет систематически принимать решения о необходимом количестве уровней номинальной переменной, описывающей состояние денежного рынка, и направляет исследователя в выборе подходящих переменных с точки зрения мониторинга состояния денежного рынка.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Stress indicator construction for internal money market

In this article we propose a modification of time-series segmentation algorithm which allows to identify homogenous periods of money market history by clustering multidimensional probability distributions of relevant variables. We provide step-by-step instructions to systematically choose how many distinct states of the nominal variable is sufficient for precise description of the money market historical conditions and hint at variables which might be suitable for monitoring money market form a central bank’s point of view.

Текст научной работы на тему «Сигнальная модельдля внутреннего денежного рынка»

А. В. Исаков

Сигнальная модель для внутреннего денежного рынка1

В данной работе предлагается модификация алгоритма сегментирования временных рядов, позволяющая идентифицировать однородные сегменты функционирования денежного рынка на основе кластеризации многомерных распределений и использовать новые наблюдения, поступающие по мере кластеризации. Предлагаемый подход позволяет систематически принимать решения о необходимом количестве уровней номинальной переменной, описывающей состояние денежного рынка, и направляет исследователя в выборе подходящих переменных с точки зрения мониторинга состояния денежного рынка.

Ключевые слова: денежный рынок; временные ряды; сегментирование; кластеризация распределений вероятности.

JEL classification: C81; C82; C87; G19.

1. Введение

Для историка или биолога границы исторических периодов функционирования объекта исследования часто определены, а длина однородных временных промежутков может достигать многих лет. Историк выделит периоды правления отдельных групп, развития политических режимов, биолог — доминирования вида или климата. Напротив, исследователям финансовых рынков и тем более денежного рынка приходится иметь дело со значительно более короткими горизонтами наблюдения и отсутствием общепринятых критериев или сигналов перехода рынка из одного качественного состояния в другое. В данной работе предлагается модификация подхода (Bemaola-Galvan et al., 2001) и примеры ее применения для идентификации однородных сегментов функционирования денежного рынка и переходных точек между ними. Предлагаемый метод является достаточно общим и подходит для изучения других объектов (фондовый рынок, рынок труда).

Алгоритмы сегментирования временных рядов развиты и распространились во многих отраслях науки: медицине (Cohen, 1997; Tomek, 1974; Sacks, 1990; Choudhury et al., 2010), компьютерной графике (Wang et al., 2011), гидрологии (Mishra et al., 2013) и других (Li et al., 2011)2. В прикладной экономической и финансовой литературе большее распространение получили исследования, направленные на идентификацию структурного сдвига, т. е. переломной точки, разделяющей периоды функционирования системы (см., например, (Broemling, Tsurumi, 1987; Andrews et al., 1996)), современные алгоритмы сегментирования начинают завоевывать популярность (Berkes et al., 2004; Wong et al., 2009).

1 Мнение автора может не совпадать с официальной позицией Банка России.

2 Обзор приложений предлагается в работе (Poor, Hadjiliadis, 2009).

Выделение однородных периодов можно рассматривать как полезный предварительный этап построения эконометрических моделей. Более важным кажется то, что обработанный ряд позволяет исследователю получить представление о том, насколько изменчива система (как часто требуется обновление моделей / переоценка коэффициентов) и получить координаты точек перехода системы между состояниями. Такая информация позволит изолировать ключевые события / факторы изменений или, если такие события известны, сформировать представление о длине лагов между событием и его воздействием на систему. Наконец, сегментирование дает возможность построить номинальную переменную состояний системы3, которая может быть использована в качестве индикатора при принятии решений и для тестирования гипотез о взаимосвязи состояния денежного рынка с другими показателями.

Замечательный обзор теоретических основ сегментирования и идентификации переломных точек предлагают Poor, Hadjiliadis (2009), прагматичное введение и современный подход к классификации алгоритмов есть в работе (Keogh et al., 2004). Согласно данной классификации, алгоритмы можно разделить по направлению сегментирования на «сверху—вниз», в том случае если алгоритм предполагает последовательное разделения всего набора данных на меньшие сегменты, «снизу—вверх», если алгоритм пошагово объединяет сегменты минимальной длины, и «скользящее окно»4; по природе данных алгоритм сегментирования можно назвать «офлайн», если набор наблюдений зафиксирован, и «онлайн», если предполагается поступление новых наблюдений. Классические подходы «сверху—вниз» и «снизу—вверх» являются офлайн-алгоритмами, а «скользящее окно» — онлайн-алгоритмом. В данной работе не уделяется внимания вычислительной сложности алгоритмов. Объем наблюдений не позволяет обнаружить различия в скорости алгоритмов, а продолжительность вычисления пренебрежительно мала в сравнении с частотой поступления новых наблюдений.

Настоящее исследование построено следующим образом. Во втором разделе приводится обзор алгоритма сегментирования согласно работе (Wong et al., 2009). После обзора базового алгоритма предлагаются две его модификации: для сегментирования многомерных рядов и онлайн-версия, по аналогии с (Keogh et al., 2004). Денежный рынок — сложный объект, и для целей исследования необходимо рассматривать его состояние в отдельный момент времени как координату в пространстве наиболее важных его характеристик. Для этого в третьем разделе работы дается обзор индикаторов, которые в рамках данной работы считаются наиболее точно указывающими на состояние объекта исследования. Денежный рынок рассматривается в первую очередь с точки зрения денежных властей, с уделением особого внимания стоимости заимствования, стабильности структуры денежного рынка, индикаторам неопределенности и кредитного риска. В качестве главного индикатора стоимости заимствования используется ставка RUONIA5 (несмотря на то что межбанковский рынок депозитов является только частью денежного рынка наряду с рынками РЕПО и своп). В третьем разделе приводятся также и результаты применения алгоритмов.

3 По аналогии с тем, как Национальное бюро экономических исследований (National Bureau of Economic Research, NBER) предлагает исследователям номинальный индикатор рецессий, денежные власти, заинтересованные в стимулировании независимых исследований денежного рынка, могли бы предложить индикатор его состояния.

4 Кроме перечисленных, в работе (Keogh et al., 2004) предлагается комбинация двух последних подходов.

5 Согласно официальному сайту http://www.ruonia.ru, RUONIA является индикативной ставкой однодневного кредитования в рублях и отражает стоимость беззалогового заимствования для надежных российских банков.

Следует отметить, что алгоритм относится к подходам «обучения без учителя», для ко- | торых определение точности классификации является по своему существу нетривиальной 8 задачей. Для оценки качества итогового сегментирования тестируется способность алгорит- ^ мов идентифицировать следующие ключевые события, которые были отобраны в результате внутреннего опроса экспертов Банка России6:

• переход от повышенного уровня ликвидности к достаточному уровню в мае—июне

2011 г.;

• переход к дефициту ликвидности в сентябре 2011 г.;

• «февральская оттепель» — сравнительно высокий уровень ликвидности в феврале

2012 г.;

• переход к умеренному дефициту ликвидности в марте 2012 г.

Целью данного исследование является демонстрация подхода (Wong et al., 2009) и его развитие для построения номинальной переменной состояний денежного рынка на основе ключевых индикаторов. Алгоритм реализован в пакете Mathematica (версия 8.0) компании Wolfram Research, и код доступен по запросу.

Также намечены границы применения алгоритма на практике. Задача прогнозирования ряда в настоящей работе не ставится.

2. Алгоритм сегментирования временного ряда

Обозначим состояние денежного рынка как набор точек X = [ X1, X2,..., XN ], где Xi — индикатор, который, по мнению наблюдателя, характеризует состояние рынка, N — количество наблюдений.

Алгоритм сегментирования A() позволяет получить набор сегментов из наблюдений X: A(X) + S = [Si, S2,..., Sk ] = [[Xi, X2,..., Xm ],...,[ Xj,..., Xn ]]. (1)

Алгоритм требует двух предположений, которые закреплены в выборе следующих параметров:

w — минимальная длина сегмента. Количество наблюдений должно быть достаточно для оценки параметров локального распределения индикатора на сегменте. Так, для одномерного ряда, предполагая локальное нормальное распределение, достаточно взять w = 2; для оценки «-мерной плотности вероятности требуется w> n наблюдений для того, чтобы возможно было найти S"1, и w>> «, чтобы матрица S была хорошо обусловленной;

d — минимальная величина расстояния Дженсена-Шеннона между последовательными сегментами Si и Si+1, которая позволяет считать их различными. Результаты тестирования различных значений говорят о том, что алгоритм сравнительно слабо чувствителен к d, рекомендуемый диапазон значений dG [5,100]. В Приложении предлагается анализ чувствительности алгоритма к d (рис. 7).

6 Перечисленные точки выбраны также и в силу того, что они находятся на временном отрезке, на котором доступны все рассматриваемые ряды данных. Среди точек, которые либо не были единогласно названы экспертами, либо не входят в период наблюдения одного или нескольких показателей, были следующие: начало кризиса в конце июня 2008 г., выход из острой фазы в конце 2009 г. и переход к избытку ликвидности в мае 2010 г.

Расстояние Дженсена-Шеннона Дг, одна из первых формулировок которого дается в работе (Burbea, Rao, 1982), представляет собой популярную меру различия между двумя распределениями. Формально Дг является полусуммой расстояний Кульбака-Лейблера (Kullback,

Leibler, 1951) от распределений dl, d2 до «среднего» распределения d12 = — (d— + d2):

где KL (dJ, d2 ) = f ln

A(, d2 ) =

1 dj (x) \

KL (dj, dj2) + KL (d 2, dj2)

d2 (x)

j (x)dx для непрерывных распределений с плотностями di (x)

(для дискретных распределений формула аналогична с естественной заменой интеграла на сумму, а плотностей — на вероятности принимаемых значений).

Подробный обзор свойств At и его интерпретации с точки зрения математической статистики, теории информации и статистической физики предлагается в работе (Grosse et al., 2002). Альтернативными к перечисленным выше являются расстояния Хеллинджера (см., например (Pollard, 2002)) и Бхаттачария (Bhattacharyya, 1943), которые опираются на размер пересечения двух плотностей вероятности. Так, для непрерывных распределений dj и d2 расстояние

Бхачаттария определено следующим образом: A Ba (dj, d2) = f ^ dj (x)d2 (x)dx. Подробный

обзор расстояний между распределениями можно найти в работе (Cha, 2007). Альтернативные расстояния были протестированы. Результаты оказались неудовлетворительными из-за повышенной чувствительности к параметру ó, отсутствия достаточно широкого интервала значений параметра, на котором было бы возможно получить стабильные и интерпретируемые результаты.

На первом шаге алгоритма набор наблюдений X разделяется на две части XL = [ Xj,..., Xw ] и XR = [ Xw+j,..., XN ], и подсчитывается расстояние Дженсена-Шеннона между распределением, оцененным на всей выборке X, и смесью двух нормальных распределений XL и XR:

A = ln

<P2 (t)X

P

(2)

где

p=П

J

=f -\/2tfS

exp

(xt -m)

2s2

2 \

J /

— значение функции правдоподобия для нормального

распределения, Р2 (т) — значение функции правдоподобия смеси этих двух нормальных распределений:

Pp2 (t) = П

J

:=J \/2Я(

ЯСТ,

exp

(xt -mL)

2s 2

J

й

exp

(x -mR)

2

2s2

(3)

В работе (Wong et al., 2009) предлагается упростить (2), так что

Дг = N ln о — nL ln oL — nR ln oR + 0.5,

где nL — длина левой части, nR — длина правой части, что приводит к существенному ускорению расчетов.

2

Подробнее о связи Dt с расстоянием Дженсена-Шеннона см. (Li, 2001). |

Значение Dt рассчитывается для всех t G [w, w +1,...,N — w], и определяется временная 8 координата первого структурного сдвига tmax : Dt = max(Dt). Приведенный алгоритм по- щ следовательно применяется для сегментирования полученных правого и левого сегментов S1 и S2 до тех пор, пока для каждого из сегментов будет выполняться одно из условий:

• для всех возможных точек перехода Dt меньше d;

• при разделении сегмента в любой из точек длина одного из итоговых сегментов окажется меньше w.

Чтобы избежать проблемы чувствительности итогового сегментирования к положению ранних точек перехода, на которую указывают работы (Wong et al., 2009; Cheong et al., 2009), после остановки алгоритма тройки прилежащих сегментов последовательно склеиваются, и сегментирование повторяется еще раз. На практике количество таких итераций следует ограничить тремя—пятью, но в силу того, что продолжительность расчета мала по сравнению со скоростью поступления новых данных, в расчетах использовалось 15 итераций.

Модифицированный алгоритм. Алгоритм (1) можно переписать так, чтобы вместо одного индикатора X состояние рынка характеризовалось в каждый момент времени вектором xt G Rn, который на сегменте St имеет многомерное нормальное распределение N(Mi,S):

Д = ln

П f (Xt) П fR (x)

t=i_t=t+i_

N

П f ( Xt)

(4)

1 / 1 т _ \ где /(х) = , = ехр|— (х _М) 2 (X _М)1 — нормальная функция плотности ве-7(2я)и \ 2 )

роятности с параметрами М и 2, оцененными на соответствующем сегменте.

Еще одним направлением модификации базовой модели является алгоритм для сегментирования онлайн-наблюдений по аналогии с предложениями работы (Keogh et а1., 2004).

1. Доступные наблюдения сегментируются согласно базовому алгоритму -4(Х) ^ S.

2. Часть крайних сегментов (обычно 5-6) считается подлежащей дополнительному сегментированию. Обозначим этот набор В. Остальные сегменты считаются сформированными окончательно.

3. Новое наблюдение Хм+1 присваивается крайнему правому сегменту Si . Все сегменты объединяются, и В сегментируется согласно базовому алгоритму.

4. Для В рассчитывается число наблюдений 1еп(В) и сравнивается со средним числом наблюдений в сегменте avg (¡еп(Б)):

а) если ¡еп(В) > avg(¡еп(£)), то крайний левый сегмент В считается сформированным окончательно и удаляется из В;

б) иначе алгоритм переходит к шагу 5.

5. Процесс ожидает поступления нового наблюдения и переходит к шагу 3.

Следующий раздел предлагает практическое сравнение модифицированного и классического подходов к сегментированию.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

i=i

3. Расчетная база

Настоящая работа рассматривает денежный рынок, прежде всего, с позиции денежного регулятора, который заинтересован в управлении стоимостью заимствования, снижении уровня неопределенности и воспринимаемого кредитного риска. Для наглядности выбран период с начала 2006 г. по конец июля 2012 г. Этот период иллюстрирует утверждение о высокой изменчивости состояния денежного рынка, которое было выдвинуто во Введении. За данный период система находилась в состояниях структурного избытка и дефицита ликвидности, на фоне укрепления и ослабления национальной валюты. Дефицит ликвидности, если не приводит к острому росту воспринимаемого участниками кредитного риска и закрытию межбанковских денежных рынков, является нормальной ситуацией и необходимым условием эффективного применения инструментов управления ставками.

В качестве претендентов были рассмотрены следующие показатели и их комбинации:

1) разница между минимальной ставкой на аукционе РЕПО с Банком России и уровнем ставки RUONIA7;

2) наименьшее из абсолютных значений разностей между уровнем процентной ставки RUONIA и ставками по депозитным операциям и операция РЕПО Банка России;

3) оборот межбанковского рынка депозитов между банками с низким кредитным риском8;

4) объем операций РЕПО по фиксированной ставке с Банком России;

5) MOSPRIME-ROISFIX спред9;

6) МЬАт-МЬА^ Ю спред10;

7) прирост валютного курса.

Подготовленные данные были стандартизированы, на рис. 1 приведены результаты сегментирования базовым алгоритмом. Полученные результаты свидетельствуют о том, что лучше других идентифицирует переходы между режимами, упомянутыми во Введении, спред между RUONIA и минимальной ставкой на аукционе РЕПО с Банком России (далее RRS).

Ниже используется для иллюстрации одномерной версии алгоритма. Для экономии места приводятся результаты сегментирования лишь одного ряда. В качестве расчетной базы для многомерной модификации RRS дополнен объемом сделок РЕПО по фиксированной ставке. Вместе оба показателя позволяют получить представление об общем состоянии денежного рынка и подчеркнуть неравномерное распределением залога в банковской системе, что приводит, в частности, к наблюдаемой небольшой корреляции спроса на РЕПО по фиксированной ставке и ставок денежного рынка.

7 Ставка на аукционе де-факто являлась верхней границей целевого коридора процентных ставок Банка России перехода к дефициту ликвидности осенью 2012 г.

8 В данном случае использовались обороты по RUONIA, при их расчете происходит отсеивание нерыночных сделок.

9 По аналогии с известным спредом LIBOR-OIS, спред МОБРЫМЕ-ЯО^ПХ указывает на оценку участниками рынка риска невозрата номинала кредита, поскольку и МОБРЫМЕ, и ROISFIX являются оценками стоимости заимствования, однако ROISFIX является сделкой своп и не предполагает передачи номинала кредита контрагенту, а значит не содержит платы за вероятность его невозврата.

10 Разность между средней стоимостью беззалогового заимствования на межбанковском рынке и стоимостью заимствования для кредитных организаций, имеющих кредитный рейтинг не ниже инвестиционного.

RUONIA - минимальная ставка на аукционе РЕПО с ЦБ РФ

3/10 5/10 7/10 9/10 11/10

3/11 5/11 7/11 9/11

1/12 3/12 5/12 7/12 9/12 11/12

0Q §

I

3/10 5/10 7/10 9/10 11/10

3/11 5/11 7/11 9/11

1/12 3/12 5/12 7/12 9/12 11/12

Наименьшее из разности между ставкой RUONIA и минимальной ставкой аукциона РЕПО с ЦБ РФ и депозитной ставкой

1/12 3/12 5/12 7/12 9/12 11/12

1/12 3/12 5/12 7/12 9/12 11/12

Оборот межбанковского рынка депозитов между банками с низким кредитным риском

3/10 5/10 7/10 9/10 11/10

3/11 5/11 7/11 9/11

1/12 3/12 5/12 7/12 9/12 11/12

11И111 У

¿1

3/10 5/10 7/10 9/10 11/10 1/11 3/11 5/11 7/11 9/11

1/12 3/12 5/12 7/12 9/12 11/12

Объем сделок РЕПО по фиксированной ставке с ЦБ РФ

1/09 3/09 5/09 7/09 9/09 11/09 1/10 3/10 5/10 7/10 9/10 11/10 1/11 3/11 5/11 7/11 9/11 11/11 1/12 3/12 5/12 7/12 9/12 11/12

It I МЫ IJii.l

iL jl.lu

1/09 3/09 5/09 7/09 9/09 11/09 1/10 3/10 5/10 7/10 9/10 11/10 1/11 3/11 5/11 7/11 9/11 11/11 1/12 3/12 5/12 7/12 9/12 11/12

-1

200

150

00

50

MOSPRIME-ROISFIX спред

5/11 7/11 9/11 11/11 1/12 3/12 5/12 7/12 9/12 11/12

.III.....Jill II IIJ. II1 ||| ll u, lull lili

5/11 7/11 9/11 11/11 1/12 3/12 5/12 7/12 MIACR-MIACR IG спред 1/10 3/10 5/10 7/10 9/10 11/10 1/11 3/11 5/11 7/11 9/11 11/11 1/12 3/12 9/12 11/12 5/12 7/12 9/12 11/12

J ilUbilf 1. L i, k, flf.uil ,1« li

1/10 3/10 5/10 7/10 9/10 11/10 1/11 3/11 5/11 7/11 9/11 11/11 1/12 3/12 5/12 7/12 9/12 11/12

0.005

-0.005

-0.015

Рис. 1. Результаты сегментирования одномерных показателей

Прирост валютного курса USD/RUB

1/06 3/06 5/06 7/06 9/06 11/06 1/07 3/07 5/07 7/07 9/07 11/07 1/08 3/08 5/08 7/08 9/08 11/08 1/09 3/09 5/09 7/09 9/09 11/09 1/10 3/10 5/10 7/10 9/10 11/10 1/11 3/11 5/11 7/11 9/11 11/11 1/12 3/12 5/12 7/12 9/12 11/12

3.1. Одномерный алгоритм

Классический подход дает возможность получить сегментирование § = [51, £2,..., 8к ] целевого показателя, так что состояния денежного рынка в последовательных сегментах различны, т. е. расстояние Дженсена-Шеннона между распределениями индикатора на последовательных сегментах составляет как минимум б.

В то же время предположим, что среди выделенных сегментов существуют группы, соответствующие некоторому набору качественных состояний. Следует отметить, что предварительных предположений о числе состояний не делается.

Учитывая гипотезу о нормальности локальных распределений (результаты тестирования этой гипотезы приведены в Приложении), введенную в разделе 2, продолжим считать,

что состояние рынка можно характеризовать оценками параметров распределения для сегмента. Тогда запишем координаты Ki сегмента Si как Кi = |е(^),^JE(sf)^(Ë(S~):f|.

Для того чтобы определить класс, к которому принадлежит сегмент, и центры кластеров сегментов в пространстве параметров распределений, используется алгоритм ^средних, в качестве входных данных используются стандартизированные координаты сегментов К,

Для определения количества кластеров (т. е. типичных состояний денежного рынка) используется «правило локтя» — эвристика, которая состоит в том, что следует выбирать такое количество кластеров, превышение которого не приводит к существенному увеличению качества кластеризации. Подробнее см. (ТЪот^ке, 1953), альтернативный подход на основе ^-статистики предлагается в (Т^Ыгаш et а1., 2001). В качестве индикатора такого качества кластеризации принято использовать сумму расстояний от членов кластеров до соответствующих им центров:

с k

f (m.K .j):

QQ §

I

Hi «i

i=1 j=1

где / (х,, у1) = ^Х^у^Т+Х^у^" — функция расстояния, например, т, — центр кластера ,, ki — количество наблюдений, относящихся к кластеру ,.

На рисунке 2а продемонстрирован расчет «правила локтя» для RSS. Качество кластеризации перестает существенно изменяться при с > 4. Рисунок 2б иллюстрирует положение параметров отдельных сегментов вокруг центров кластеров их классов. Заметим, что перед кластеризацией координаты К стандартизируются (этим объясняются отрицательные значения о на рис. 2б).

180 160 140 120

Л

100 80 60 40

• • •

5 10 15

к — количество кластеров

а) правило локтя

-0.5 0.0

/I

б) результаты кластеризации методом ^средних

Рис. 2. Кластеризация сегментов RSS

Наконец, на рис. 3 приводится результат классификации сегментов. Очевидно, что такие макросегменты оказываются более крупными по сравнению с теми, которые были получены после предварительного сегментирования.

20

1 2 1 212 1 2 12 1 2 12 1 2 12 13 13 12 1 2 43 43 43 4 3 1 43 4 3 4 3 4 343 4 3 4

4 3 2 1

0

1/2010 3/2010 5/2010 7/2010 9/2010 11/2010 1/2011 3/2011 5/2011 7/2011 92011 11/2011 1/2012 3/2012 5/2012 7/2012 9/2012 11/2012

Рис. 3. Выделение кластеров сегментов показателя RRS (вертикальными линями и надписями сверху указаны точки окончания сегментов)

Изучение полученной кластеризации позволяет интерпретировать 1-й сегмент как период избытка ликвидности, 2-й — краткосрочные всплески в уровне спреда, для которых характерны высокие уровни волатильности, 3-й — периоды близкого к целевому уровня процентной ставки, 4-й — дефицит ликвидности. Алгоритм верно выделил многие ключевые особенности временного ряда: переход от профицита ликвидности к дефициту в середине сентября 2011 года, период низких ставок в первом квартале 2012 года и другие.

3.2. Модифицированный подход

Основное момент при использовании онлайн-подхода состоит в выборе критерия для решения о формировании сегмента и удалении из набора В наблюдений. В качестве такого критерия в п. 3.1 предлагается использовать размер буфера, т. е. количество наблюдений в В, что позволяет избавиться от неопределенности относительно того, когда новый сегмент будет сформирован. Исследователь может предпочесть сумму квадратных отклонений от линейного тренда в В, следуя работе (Keogh et я1., 2004).

При формировании сегментирования, изображенного на рис. 4, в качестве критерия использовалось условие о минимальном размере буфера в 30 наблюдений. Данный график демонстрирует способность онлайн-алгоритма воспроизводить близкие результаты к сегментированию

4 3 2 1

0

1/2010 3/2010 5/2010 7/2010 9/2010 11/2010 1/2011 3/2011 5/2011 7/2011 9/2011 11/2011 1/2012 3/2012 5/2012 7/2012 9/2012 11/2012

Рис. 4. Выделение кластеров сегментов показателя RRS онлайн (вертикальными линями и подписями сверху указаны точки окончания сегментов)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 21 2 1 2 1 21 2 1 2 1 2 1 21 21 2

Г

ii

Ui/i

32

с полным набором данных: точно идентифицированы переход к дефициту ликвидности | (сегмент 3) и периоды с низким уровнем ставок, но высокой (сегмент 1) или низкой (сег- 8 мент 2) дисперсией, однако онлайн-версия алгоритма нашла на одно качественное состоя- ^ ние рынка меньше, не различив периоды острого дефицита ликвидности и близости ставок к целевому уровню.

Более формальный подход к тестированию согласованности «действительной» и оценочной сегментаций ряда предлагается в (Beeferman et а1., 1999), однако его применение лежит за пределами настоящей работы, в том числе потому, что подход предполагает наличие некой «правильной» сегментации, близость к которой оценивается. Подобной идеальной сегментации в данном случае нет.

3.3. Многомерный подход

В то время как модификация подхода для многомерных векторов состояний денежного рынка практически тривиальна, более интересной задачей является кластеризация многомерных распределений. Для кластеризации одномерных параметрических распределений логично использование расстояний между точками, обозначенными параметрами распределения, что позволяет использовать метод ^средних. Для кластеризации многомерных распределений такой способ не подходит, поскольку в данном случае распределение определено вектором средних и ковариационной матрицей.

В настоящей работе предлагается построить матрицу расстояний между распределениями на сегментах D £ Rkxk с элементами

D1, ,■ =/(I, (X,, 2,) - (X, 2, ))2 <Ь,

где i,, = 1,..,k (номера сегментов).

Исследователь может использовать один из альтернативных подходов и рассчитать матрицу расстояний Дженсена-Шеннона или Махаланобиса. На основе матрицы D производится иерархический агломеративный кластерный анализ методом дальнего соседа. Результаты использования других методов (ближнего соседа, средней связи и Уорда) приводятся в Приложении (см. рис. 8).

Рис. 5. Дендрограмма. RRS и объем сделок РЕПО по фиксированной ставке с Банком России

При выборе оптимального количества кластеров ориентируемся на полученную на основе О, дендрограмму, приведенную на рис. 5, которая указывает на наличие по меньшей мере трех различных кластеров распределений. Результаты применения многомерного подхода к системе денежного рынка, задаваемой парой координат {RRS, объем операций РЕПО по фиксированной ставке с Банком России}, приведены на рис. 6.

2 1 0 -1

-2

1/2010 3/2010 5/2010 7/2010 9/2010 11/2010 1/2011 3/2011 5/2011 7/2011 9/2011 11/2011 1/2012 3/2012 5/2012 7/2012 9/2012 11/2012

а) RRS

13 13 1 31 3 1 31 3 13 2 1 31312 1 2 1212

-0.06 -0.08 -0.10 -0.12 -0.14 -0.16

1/2010 3/2010 5/2010 7/2010 9/2010 11/2010 1/2011 3/2011 5/2011 7/2011 9/2011 11/2011 1/2012 3/2012 5/2012 7/2012 9/2012 11/2012

б) РЕПО

Рис. 6. а) Выделение кластеров сегментов RRS; б) объем сделок РЕПО по фиксированной ставке с Банком России (на графике приведены стандартизированные значения индикаторов, вертикальными линями и подписями сверху указаны точки окончания сегментов)

Полученное сегментирование позволяет интерпретировать полученные типы периодов как:

1) периоды повышенной волатильности процентных ставок на фоне высокого спроса на РЕПО по фиксированной ставке (1-я зона);

2) периоды наличия спроса на РЕПО по фиксированной ставке на фоне сравнительно стабильной стоимости заимствования (2-я зона);

3) периоды отсутствия спроса на РЕПО по фиксированной ставке в совокупности с низкими ставками денежного рынка (3-я зона).

Результаты использования онлайн-модификации многомерного подхода лежат за пределами данной статьи.

4. Заключение §

*

I

В настоящей работе использован подход (Wong et al., 2009) для идентификации однород- щ ных периодов функционирования денежного рынка, который позволяет точно определить переходные точки между его состояниями и построить соответствующую номинальную переменную, систематизировать и дополнить экспертное выделение качественно различных состояний функционирования. В статье предложены подходы к осуществлению обоих шагов алгоритма, так что он может быть использован и для сегментирования многомерных рядов.

Применение разработанного подхода на практике позволяет утверждать, что выбор подходящего одномерного индикатора, характеризующего динамику интересующей системы, вместе с предложенным алгоритмом дает возможность идентифицировать состояния системы и представить ее эволюцию в сжатом символьном виде. В качестве такого показателя для денежного рынка предлагается использовать спред между минимальной ставкой заимствования на аукционе однодневного РЕПО с Банком России и индикативной ставкой RUONIA.

Несмотря на то что многомерный подход требует число наблюдений, значительно превышающее размерность вектора n (даже при небольшом n = 3 требует более недели в качестве минимального размера сегмента), построенный таким образом индикатор мог бы быть полезен для среднесрочного мониторинга состояния денежного рынка и позволил бы идентифицировать не только изменения в уровнях и волатильности показателей, но и в структуре их ковариационной матрицы.

Предложенный подход оставляет большое число степеней свободы для модификации алгоритмов, например, возможны вариации критериев остановки сегментирования и обработки набора в случае онлайн-версии подхода.

Автор выражает признательность анонимному рецензенту за детальные и ценные комментарии, которые внесли значительный вклад в работу.

Список литературы

Andrews D. W. K., Lee I., Ploberger W. (1996). Optimal changepoint tests for normal linear regression. Journal of Econometrics, 70 (1), 9-38.

Burbea J., Rao C. R. (1982). On the convexity of some divergence measures based on entropy functions. IEEE Transactions on Information Theory, 28 (2), 489-495.

Beeferman D., Berger A., Lafferty J. (1999). Statistical models for text segmentation. Machine Learning, 34 (1-3), 177-210.

Berkes I., Gombay E., Horvath L., Kokoszka P. (2004). Sequential change-point detection in GARCH(^, q) models. Econometric Theory, 20 (6), 1140-1167.

Bernaola-Galvan P., Ivanov P. C., Amaral L. A. N., Stanley H. E. (2001). Scale invariance in the nonsta-tionarity of human heart rate. Physical Review Letters, 87 (16), 6026-6029.

Bhattacharyya A. (1943). On a measure of divergence between two statistical populations defined by their probability distributions. Bulletin of the Calcutta Mathematical Society, 35, 99-109.

Broemling L. D., Tsurumi H. (1987). Econometrics and structural change. Marcel Dekker Incorporated.

Cha S.-H. (2007). Comprehensive survey on distance/similarity measures between probability density functions. International Journal of Mathematical Models and Methods in Applied Sciences, 1 (4), 300-307.

Cheong S.-A., Stodghill P., Schneider D. J., Cartinhour S. W., Myers C. R. (2009). The context sensitivity problem in biological sequence segmentation. http://arxiv.org/abs/0904.2668.

Choudhury K. R., Kasman I., Plowman G. D. (2010). Analysis of multi-arm tumor growth trials in xenograft animals using phase change adaptive piecewise quadratic models. Statistics in Medicine, 29 (23), 2399-2409.

Cohen M. S. (1997). Parametric analysis of fMRI data using linear systems methods. Neurolmage, 6 (2), 93-103.

Grosse I., Bernaola-Galvan P., Carpena P., Roman-Roldan R., Oliver J., Stanley H. (2002). Analysis of symbolic sequences using the Jensen-Shannon divergence. Physical Review E, 65 (4), 041905.

Keogh E., Chu S., Hart D., Pazzani E. K. (2004). Segmenting time series: A survey and novel approach. In: Data mining in Time Series Databases, World Scientific, 1-22.

Kullback S., Leibler R. A. (1951). On information and sufficiency. Annals of Mathematical Statistics, 22 (1), 79-86.

Li W. (2001). New stopping criteria for segmenting DNA sequences. http://arxiv.org/pdf/physics/0104026. pdf.

Li H., Guo C., Qiu W. (2011). Similarity measure based on piecewise linear approximation and derivative dynamic time warping for time series mining. Expert Systems with Applications, 38 (12), 14732-14743.

Mishra P. K., Vessilinov V., Gupta H. (2013). On simulation and analysis of variable-rate pumping tests. Groundwater, 51 (3), 469-473.

Poor H. V., Hadjiliadis O. (2009). Quickest detection. Cambridge, UK, Cambridge University Press.

Pollard D. E. (2002). A user's guide to measure theoretic probability. Cambridge, UK, Cambridge University Press.

Sacks E. (1990). Automatic qualitative analysis of dynamic systems using piecewise linear approximations. Artificial Intelligence, 41 (3), 313-364.

Thorndike R. L. (1953). Who belongs in the family? Psychometrika, 18 (4), 267-276.

Tibshirani R., Walther G., Hastie T. (2001). Estimating the numbers of clusters in a data set via the gap statistic. Journal of the Royal Statistical Society: Series B, 63 (2), 411-423.

Tomek I. (1974) Two algorithms for piecewise-linear continuous approximation of functions of one variable. IEEE Transactions on Computers, 23 (4), 445-448.

Wang H., O'Brien J. F., Ramamoorthi R. (2011). Data-driven elastic models for cloth: Modeling and measurement. ACM Transactions on Graphics, 30 (4), 71.

Wong J. C., Lian H., Cheong S. A. (2009). Detecting macroeconomic phases in the Dow Jones Industrial Average time series. Physica A: Statistical Mechanics and its Applications, 388 (21), 4635-4645.

ПРИЛОЖЕНИЕ

1. Выбор d. Естественно, что по мере увеличения d количество сегментов, которые идентифицирует алгоритм, снижается. Для целей настоящего исследования использовалась d = 6, что позволяло выделить около 70 сегментов до кластеризации, как наглядно видно на рис. 7, но качественно близкие результаты можно получить, используя d в диапазоне от 5 до 100.

-2 0 2 4 6 8 10 12

1О8(<5)

Рис. 7. Чувствительность алгоритма сегментирования к д 2. Дендрограммы для методов ближнего соседа, средней связи и Уорда.

1

а) метод ближнего соседа б) метод средней связи

в) метод Уорда г) метод медианного расстояния

Рис. 8. Дендрограммы для альтернативных методов иерархической кластеризации

3. Тестирование нормальности локальных распределений. Для проверки гипотезы о возможности использования локального нормального распределения была проведена

серия стандартных тестов (Колмогорова-Смирнова, Крамера-фон Мизеса, Андерсена-Дарлинга). На рисунке 9 приведена гистограмма Р-значений для сегментов ряда разностей между RUONIA и минимальной ставкой по РЕПО с Банком России, полученных с помощью теста Колмогорова-Смирнова.

14 12 10 8 6 4 2

0 _____

0.0 0.2 0.4 0.6 0.8 1.0

р-значение

Рис. 9. Гистограмма Р-значений теста Колмогорова-Смирнова на нормальность распределения

Использование иных тестов для данной и других переменных приводит к аналогичным результатам. Таким образом, в подавляющем количестве случаев отвергнуть гипотезу о нормальности распределения невозможно.

i Надоели баннеры? Вы всегда можете отключить рекламу.