Новикова М.А., Янчушка З.И.
Уфимский государственный нефтяной технический университет E-mail: [email protected], [email protected]
МЕТОДИКА ФОРМИРОВАНИЯ ПОРТФЕЛЯ ЦЕННЫХ БУМАГ С ПОМОЩЬЮ КОМИТЕТОВ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ И ТЕОРИИ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ
Статья посвящена анализу теоретических аспектов применения комитетов искусственных нейронных сетей для формирования портфеля ценных бумаг и краткосрочного прогнозирования динамики рынка ценных бумаг в предположении выполнения условий гипотезы фрактального рынка.
Ключевые слова: инвестиционный портфель, комитеты нейронных сетей, вейвлет-преобразование, фрактальный рынок.
Финансовые рынки, имеющие большое значение для функционирования экономики страны и экономического роста, характеризуются существенной нестабильностью, вызванной чередующимися подъемами и спадами деловой активности в экономике и влиянием различных, зачастую непредсказуемых факторов. Наличие нелинейных и динамических связей между основными параметрами финансового рынка и вероятностный характер протекающих на нем процессов предъявляют повышенные требования к качеству экономико-математического инструментария для моделирования рыночной доходности активов.
Существует ряд противоположных предположений, объединенных в гипотезу эффективного и гипотезу фрактального рынка. Сущность гипотезы эффективного рынка заключается в том, что финансовый рынок является стационарным и равновесным, цены отражают всю публичную информацию и следуют случайному блужданию, вероятностное распределение случайных величин доходностей ценных бумаг приблизительно является нормальным, все инвесторы рациональны. Тем не менее действительность демонстрирует противоположную ситуацию, которая не может быть описана в рамках данной гипотезы - кризисы и, как следствие, отсутствие равновесия, неста-ционарность поведения цен, нерациональность участников, нелинейные зависимости, фрактальные распределения курсов ценных бумаг. Следовательно, с научной точки зрения гипотеза фрактального рынка является существенно более приближенной к реальному положению дел на финансовых рынках. Современный анализ финансовых рынков проводится
на основе методов нелинейной динамики, в частности методов теории фракталов. Заметный вклад в разработку этого нового направления внесли Б. Мандельброт, М.Л. Кричев-ский, Э. Петерс, В.А. Перепелица, Е.В. Попова, Л.П. Яновский и другие. Развитие данного направления преимущественно ориентировано на адаптацию методов нелинейной динамики к проблемам прогнозирования финансовых временных рядов и не затрагивает вопросов модернизации аппарата обоснования инвестиционных решений.
Для эффективной работы на рынке ценных бумаг необходимо совершенствование существующих и разработка новых подходов к анализу и прогнозированию состояния фондового рынка, а также более эффективные методы управления портфелем ценных бумаг.
Фондовый рынок можно представить как своеобразную информационную систему, на вход которой поступают данные финансовой отчетности предприятий, газетные публикации, информация рейтинговых агентств и иные сведения макро- и микроэкономического характера; а на выходе - реакция фондового рынка в виде изменения курсов ценных бумаг.
В связи с этим актуальным направлением исследования является включение в методику формирования портфеля ценных бумаг инструментария нейронных сетей, реализующего адаптивные свойства и способность выявлять сложные зависимости между данными. Использование нейронных сетей позволяет создавать модели, учитывающие как российскую специфику, так и конкретную ситуацию на рынке.
Нейронные сети в своей основе нелинейны, не требуют глубокого понимания связей между исходными данными и получаемыми результатами и демонстрируют серьезные преимущества перед традиционными методами статистической обработки данных [1]. Многочисленные эксперименты показывают, что адаптивные сети на коротких промежутках времени прогнозируют всегда лучше, чем стандартные статистические модели [2].
Методы нейронных сетей и вопросы их применения на фондовом рынке исследованы в работах многих ученых - А. Барского, Д. Бестенса, В. Ван ден Берга, Д. Вуда, Ф. Уос-сермена, М. Рогова, Д. Рудковской, С. Хайки-на и многих других. Теоретические основы теории нейронных сетей и модель нейрона были разработаны У. Маккалохом и У. Питсом. Серьезное развитие моделей нейронных сетей связано с работами Ф. Розенблата, Амари, Андерсона, Карпентера, Кохонена и особенно Хопфил-да, который является основоположником современного математического моделирования нейронных вычислений.
Нейронные сети представляют новую и весьма перспективную вычислительную технологию, дающую новые подходы к исследованию динамических задач в финансовой области. Способность к моделированию нелинейных процессов, работе с зашумленными данными и адаптивность дают возможность применять нейронные сети для решения широкого круга задач [3].
Нейронные сети позволяют не только решить широкий круг разнообразных задач, но и обладают значительными преимуществами:
1. Решение задач при неизвестных закономерностях.
По критерию согласия х2 Пирсона была проверена гипотеза о нормальном распределении генеральной совокупности значений курсов наиболее ликвидных акций крупнейших российских эмитентов нефтегазовой отрасли: ОАО «Лукойл» (с 1997 г. по 2012 г.), ОАО «Роснефть» (с 2007 г. по 2012 г.), ОАО «Газпромнефть» (с 2000 г. по 2012 г.) и ОАО «Сургутнефтегаз» (с 1997 г. по 2012 г.), и
были построены гистограммы частот. В результате проведенных исследований для акций каждой компании гипотеза отклоняется на уровне значимости а = 0,01,т. к. критические значения критерия х2кр оказались меньше наблюдаемых значений критерия Х2набл, т. е. распределения не являются нормальными. На рисунках 1-4 приведены гистограммы частот распределения дневных курсов анализируемых акций за период с 11.02.2011 по 11.02.2012.
На рисунке 1 наблюдаемое значение критерия Х2на6л = 107,76899, а критическое значение критерия %2кр = 21,66599 при уровне значимости а =0,01 и числе степеней свободы і/ =9. Поскольку Х2на6л > Х2кр гипотезу о нормальном распределении генеральной совокупности курсов акций ОАО «Лукойл» отвергаем.
Histogram: Лукойл K-Sd= 11198. р<,01 ; Lilliefc-rs р<.01 Shapiro-Willc W=,94921. р= 00000
70
ео
50 ® 40
z 30 20
10 0
1460 1600 1560 1600 1650 1700 1750 1800 1850 1900 1950 2000 2050 2100 X <= Category Boundary
Рисунок 1. Гистограмма частот распределения курсов акций ОАО «Лукойл»
Histogram: Роснефть K-S d=,04234, р> .20; Lilliefors р> .20 Shapiro-Willc W=.98740. р=.02514
55 50 45 40 35 ! 30
О 25 20 15 10 5 0
160 170 180 1Э0 200 210 220 230 240 250 260 270 280
X <= Category Boundary
Рисунок 2. Гистограмма частот распределения курсов акций ОАО «Роснефть»
На рисунке 2 наблюдаемое значение критерия %2на6л = 145,98767, а критическое значение критерия %2кр = 26,21697 при уровне значимости а =0,01 и числе степеней свободы й/=12. Поскольку %2на6л > %2кр гипотезу о нормальном распределении генеральной совокупности курсов акций ОАО «Роснефть» отвергаем.
На рисунке 3 наблюдаемое значение критерия Х2на6л=174,78943, а критическое значение критерия %2кр = 24,72497 при уровне значимости а =0,01 и числе степеней свободы й/=11. Поскольку %2на6л > %2кр гипотезу о нормальном распределении генеральной совокупности курсов акций ОАО «Газпромнефть» отвергаем.
На рисунке 4 наблюдаемое значение критерия Х2набл=103,09876, а критическое значение критерия %2кр = 20,09024 при уровне значимости а =0,01 и числе степеней свободы й/=8. Поскольку %2набл > %2кр гипотезу о нормальном распределении генеральной совокупности курсов акций ОАО «Сургутнефтегаз» отвергаем.
Отметим, что гипотеза о нормальном распределении генеральной совокупности курсов акций была отвергнута нами для всех эмитентов за весь период исследования, т. к. везде имели место либо асимметрия, либо лептоэксцесс, либо тяжелые хвосты.
2. Устойчивость к шумам во входных данных.
Рыночные котировки акций за определенный период времени представляют собой динамический ряд. Как правило, анализ временных рядов предполагает, что данные содержат систематическую составляющую и случайный шум. В результате анализа курсов вышеперечисленных акций проведена оценка случайной составляющей и доказано наличие шума в исходных данных (рисунок 5-8).
3. Потенциальное сверхвысокое быстродействие.
4. Отказоустойчивость при аппаратной реализации нейронной сети.
В данной статье рассматриваются теоретические аспекты применения методов нейросетевого моделирования для формирования портфеля ценных бумаг и ре-
Histogram: Газп ром Нефть K-S <1=08569. р<,05 ; Lilliefors р<.01 Shapiro-Wilk W=.96672. р=.00001
IIP Ж IIP IIP Ці i! W////J '
1||г IIP lip ■
100 105 110 115 120 125 130 135 140 145 150 155 160
X <= Category Boundary
Рисунок 3. Гистограмма частот распределения курсов акций ОАО «Газпромнефть»
Histogram: Сургутнефтегаз K-S d=.07356. р<.15 ; Lilliefors р<.01 Shapiro-Wilk W=97793. р=00055
20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
X <= Category Boundary
Рисунок 4. Гистограмма частот распределения курсов акций ОАО «Сургутнефтегаз»
Рисунок 5. Случайная составляющая курсов акций ОАО «Лукойл»
шение проблемы краткосрочного прогнозирования рыночной динамики в предположении выполнения условий гипотезы фрактального рынка.
Таким образом, целью исследования является развитие математического аппарата формирования портфеля ценных бумаг на основе прогнозных оценок динамики неоднородного рынка.
Цель исследования определяет круг решения следующих задач:
- разработать методику подготовки входных данных для нейросетевого анализа временных рядов в зависимости от интересов и предпочтений инвесторов в отношении ликвидности акций (голубые фишки, акции второго эшелона), принадлежности к определенной отрасли (например, нефтегазовой);
- сформировать метод прогнозирования финансовых временных рядов в условиях гипотезы фрактального рынка;
- предложить подход к созданию и использованию нейросетевых технологий для формирования портфеля ценных бумаг.
Для решения поставленных задач предлагается использование различных видов искусственных нейронных сетей. Эмпирически феномен повышения точности и надежности результата при объединении нескольких мнений в одно был замечен давно [4]. В данной работе применяется технология объединения нейронных сетей в так называемые комитеты. Выбор нейронных сетей зависит от особенностей имеющейся статистической информации -полнота информации, регулярность ее поступления, наличие информационных выбросов. В качестве исходных данных подразумевается рыночная доходность или цены финансовых активов.
В таблице 1 приведена модель для выбора видов нейронных сетей с учетом типа решаемых задач и характеристики анализируемых информационных потоков.
С точки зрения использования методов математического моделирования на финансовых рынках можно выделить следующие формализованные задачи:
1. Кластеризация - разбиение совокупности ценных бумаг на несколько класте-
ров, число и характеристики которых заранее неизвестны. Согласно результатам исследования в работе [5] авторами было установлено, что группа акций, входящих в кластер, является однородной, а зависимость определенных факторов устанавливается с большей достоверностью, чем для отдельных акций.
2. Классификация - отнесение ценных бумаг к выделенным заранее классам.
Рисунок 6. Случайная составляющая курсов акций ОАО «Роснефть»
Рисунок 7. Случайная составляющая курсов акций ОАО «Газпромнефть»
Рисунок 8. Случайная составляющая курсов акций ОАО «Сургутнефтегаз»
3. Прогнозирование, проводимое на основе обработки статистических ретроспективных данных, характеризующих ценные бумаги по выделенным классам.
В рамках данной модели предлагается использовать следующие виды нейронных сетей:
1. Нейронная сеть встречного распространения - многослойная сеть, состоящая из входного слоя и слоев нейронов Кохонена и Грос-сберга. Данная сеть осуществляет обобщение при неполном или зашумленном входе.
2. Нейронная сеть Хопфилда - однослойная сеть нейронов с одинаковым числом входов и выходов сети, которая применяется для восстановления зашумленных образов по неполной искаженной информации.
3. Нейронная сеть Хэмминга - двухслойная сеть, которая вычисляет расстояния от входного вектора до всех известных векторов-образцов и позволяет устанавливать соответствие входного образа одному из известных ей классов. Для работы сети Хэмминга требуется меньший объем выборки, чем для сети Хопфилда.
4. Сеть с радиальными базисными функциями (RBF) - двухслойная сеть, которая содержит скрытый слой радиально симметричных скрытых нейронов и моделирует нелинейную функцию с помощью одного промежуточного слоя.
5. Вероятностная нейронная сеть (РКК) -многослойная сеть, которая содержит несколько скрытых радиальных слоев. В данной сети наблюдение соответствует радиальному элементу, имеющему гауссову функцию распределения.
6. Обобщенно-регрессионная нейронная сеть (GRNN) построена по аналогии с вероятностной сетью, но используется для решения задач регрессии.
7. Нейронная сеть Ворда - многослойная сеть, внутренние слои нейронов которой раз-
биты на блоки. Данные сети используются для решения задач прогнозирования и классификации.
8. Нейронная сеть Коско - однослойная сеть с обратными связями, которая основана на основных положениях теорий Гроссберга и Хопфилда и используется для обобщения и прогнозирования при искажениях входной информации.
Нейросетевое моделирование в чистом виде базируется лишь на данных, не привлекая никаких априорных соображений. Имеющихся данных может не хватить для обучения, размерность потенциальных входов может оказаться слишком велика. Также для успешного прогнозирования необходима эффективная обработка входных данных, в частности минимизация случайных флуктуаций и шума. В финансовых приложениях данные зашумлены особенно сильно. Пропуск значений или неполную информацию также иногда рассматривают как шум: в таких случаях берется среднее или наилучшее значение, и это, конечно, приводит к за-шумлению базы данных. Для понижения шумовой составляющей в данном методе предлагается использовать вейвлет-анализ.
При многоуровневом одномерном вейвлет-анализе сигнал раскладывается на аппроксимирующие коэффициенты сА^ и детализирующие коэффициенты сВ1....сВ}. Эти векторы получаются сверткой исходного сигнала Б с фильтром нижних частот Ь0 В для аппроксимации и с фильтром высоких частот И. В для детализации, а затем сопровождаются двоичной децимацией. Вейвлет-разложение сигнала Б, проведенное до уровня N является вектором, который имеет следующую структуру: [сА№ сВ1....сВ}].
Результаты разложения удобно изображать графически в виде дерева, изображенного на рисунке 9:
Таблица 1. Модель выбора варианта нейронной сети
Информация Тип задачи
Составление прогноза Классификация Кластеризация
Полная Сеть с радиальными базисными функциями Вероятностная нейронная сеть Нейронная сеть встречного распространения
Неполная Обобщенно-регрессионная нейронная сеть Сеть Хемминга
Нерегулярная Сеть Хопфилда + сеть Ворда Сеть Хемминга
Выбросы Сеть Коско + сеть Ворда Сеть Коско + сеть Хемминга
Рисунок 9. Дерево разложения
Полученные при разложении аппроксимирующие коэффициенты представляют сглаженный сигнал, а детализирующие коэффициенты описывают колебания. Следовательно, шумовая компонента больше отражается в детализирующих коэффициентах Сй. Поэтому при удалении шума обрабатывают обычно детализирующие коэффициенты. Удаление шума реализуется с помощью метода пороговой обработки коэффициентов (трешолдинг) и заключается в обнулении значений коэффициентов, меньших некоторого порогового значения [6].
Структурная модель, реализующая предложенный подход комитетов нейронных сетей, представлена на рисунке 10.
Предлагаемая структура модели включает четыре основных программных модуля:
1. Подготовка исходной информации о фондовом рынке (рыночные котировки акций) -вычисление статистических оценок фрактальной размерности и вейвлет-преобразование с целью избавления от зашумленности.
2. Определение весовых коэффициентов а для управления программным коммутатором, которые определяют вклад результата использования частных нейронных сетей в консолидированный результат применения структурной модели в целом.
3. Модель комитетов нейронных сетей формирования портфеля ценных бумаг, которая реализует представленные в таблице 1 виды нейронных сетей.
4. Программный коммутатор, применяемый для предварительного отбора используемых нейронных сетей исходя из условий решаемой задачи.
Результат работы предложенной комплексной модели можно представить следующим образом [3]:
Рисунок 10. Структурная модель использования методов интеллектуального анализа информации для
формирования портфеля ценных бумаг
у* "І D у І В
D"
B
і=і
K K
о при м я k Z k І aik < о ,5,
k "1 / k "1
K K
І при М я k Z k І aik > 0,5,
- k "1 / k "1
K K
І а kZ k І а k
k "І / k "1
NK
І (Іа^ k Іа ік)
i=1 k "І
D >о ,5
k "І
где О; - бинарная переменная, отражающая применение (при 1) или отклонение (при 0) частной нейронной сети для дальнейшего использования; В ; - средневзвешенный вклад в консолидированный результат г-ой частной модели, сформированной по &-му правилу с
Л *
уровнем «отсечения» ак ; у - выход комплексной модели; у; - выход г-ой частной модели; - выход &-ого правила для г-ой частной модели; а к - уровень «отсечения» для предпосылки &-ого правила для г-ой частной модели; N - количество частных моделей; К - количество правил.
Например, если при решении задачи прогнозирования коммутатором были выбраны частные модели на основе нейронных сетей ЯБГ и GRNN, то общий выход модели будет иметь вид:
B
RBF
X - Xt
t "І
a,
) +B
T
І yt-g (
GRNN t=1
X - Xt
S)
t "І
X - Xt
S)
K
*
где X - нормированные характеристики ценной бумаги; Хг, у( - точки обучающей выборки; wt - весовые коэффициенты для модели ЯБР, ог - отклонение £-ой характеристики для модели ЯБГ; С - отклонение в модели СЯММ; вКБР, бсшм - вклад моделей ЯБ¥ и СЯММ соответственно в консолидированный результат; Т - объем выборки.
Таким образом, предлагаемая методика формирования портфеля ценных бумаг включает следующие этапы:
1. Анализ фондового рынка с целью определения факторов, влияющих на рыночную стоимость ценных бумаг.
2. Формирование базы данных доходности ценных бумаг за конкретный период времени.
3. Проверка данных на предмет пригодности для формирования прогноза.
4. Построение экономико-математической модели на основании комитета нейронных сетей (задание основных характеристик).
В дальнейшем предполагается выбор алгоритмов обучения нейронных сетей, видов передаточных функций и других характеристик с последующей реализацией в среде МаЫаЬ.
21.03.2012
Список литературы:
1. Ежов А.А., Шумский С.А. Нейрокомпьютеринг и его применение в экономике и бизнесе. - М.: Изд-во МИФИ, 1998. -222 с.
2. Couver C., Couver P. Neural network and statistics: a naive comparison // Beigian journal of operation research and computer sciences. - 2007. - №4. - P. 36.
3. Хайкин, С. Нейронные сети: полный курс. 2-е изд.: Пер. с англ. - М.: Издательский дом «Вильямс», 2006. - 1104 с.
4. Терехов, С.А. Гениальные комитеты умных машин // Лекции по нейроинформатике. Ч.2 Всероссийская научная конференция «Нейроинформатика» - 2007. - Москва: МИФИ, 2007. - С. 11-42.
5. Новикова М.А., Янчушка З.И., Бахтизин Р.Н. Формирование оптимального портфеля акций российских эмитентов нефтегазовой отрасли на основе использования кластерного анализа и нейронных сетей // Нефтегазовое дело. Научно-технический журнал. - 2011. - T. 9. - №1. - С. 125-130.
6. Смоленцев, Н.К. Основы теории вейвлетов. Вейвлеты в Matlab. - М.: ДМК Пресс, 2008. - 448 с.
Сведения об авторах:
Новикова Марина Александровна, аспирант Уфимского государственного нефтяного
технического университета 450062, г. Уфа, ул. Космонавтов, 1, e-mail: [email protected] Янчушка Златица Игоревна, доцент кафедры математики Уфимского государственного нефтяного технического университета, кандидат экономических наук, доцент 450062, г. Уфа, ул. Космонавтов, 1, e-mail: [email protected]
UDC 336.467.471
Novicova M.A., Yanchushka Z.I.
E-mail: [email protected], [email protected]
METHOD OF THE SECURITIES PORTFOLIO FORMATION BY MEANS OF ARTIFICIAL NEURAL NETWORKS COMMITTEES AND WAVELET TRANSFORMATION THEORY
This article is devoted to the analysis of the theoretical aspects of the artificial neural networks committees usage for securities portfolio formation and short-term forecasting of the securities market dynamics, assuming the conditions of the fractal market hypothesis.
Key words: investment portfolio, committees of neural networks, wavelet transform, fractal market.
Bibliography:
1. Ezhov A.A., Shumsky S.A. Neyrokompyutering and its application in economics and business. - M.: Publishing House of Moscow Engineering Physics Institute, 1998. - 222 p.
2. Couver C., Couver P. Neural network and statistics: a naive comparison // Beigian journal of operation research and computer sciences. - 2007. - №4. - P. 36.
3. Haykin, S. Neural Networks - A Comprehensive Foundation. second edition: Per. from English. - M.: Publishing house Williams, 2006. - 1104 p.
4. Terekhov, S. Brilliant committees intelligent machines // Lectures on neuroinformatics. Part 2, All-Russian Scientific Conference Neuroinformatics - 2007. - Moscow Engineering Physics Institute, 2007. - P.11-42.
5. Novikova M.A., Yanchushka Z.I., Bahtizin R.N. Russian oil and gas issuers stocks optimal portfolio formation with use of cluster analysis and neural networks // Oil And Gas Business. Scientific and Technical Journal. - 2011. - V.9. - №1. -P. 125-130.
6. Smolentsev, N.K. Foundations of the theory of wavelets. Wavelets in Matlab. - Moscow: DMK Press, 2008. - 448 p.