методика прогнозирования
количества открытых вкладов, основанная на экспертно-лингвистических
закономерностях
В.Г. ЧЕРНОВ, кандидат технических наук, профессор Владимирский государственный университет
К.А. ГРАДУСОВ, специалист отдела информационных технологий,
Филиал ВРУОАО «МИнБ»
Применяемые в банковской практике инструментальные средства, способствующие решению задач финансового анализа и прогнозирования, в большей своей части основаны на методах математической статистики, базирующихся на концепции усреднения по выборке данных. Однако динамизм процессов внешней среды (финансовых рынков, законодательной и нормативной базы, бизнеса клиентов и др.) обусловливает необходимость своевременного выявления изменений тенденций этих процессов в целях оперативного и адекватного управления банковской деятельностью. В статье рассмотрены возможности использования технологий интеллектуального анализа данных в банковском финансовом менеджменте, в частности в прогнозировании количества открытых вкладов.
Прогнозирование, или предсказание, количества открытых вкладов того или иного типа на уровне филиала, региона и т. д. является необходимым элементом организации экономической деятельности коммерческих банков. С формальной точки зрения эта задача относится к широкому классу задач прогнозирования дискретных последовательностей (совокупности значений в фиксированные моменты), которые возникают не только в банковской сфере, но и в физике, технике, медицине, социологии и других областях.
Нетривиальность прогнозирования дискретных последовательностей обусловлена тем, что, в отличие от хорошо алгоритмизированных процедур интерполяции, прогнозирование требует экстраполяции данных о прошлом на будущее. Кроме того, существующие методики прогнозирования в большинстве своем основываются на анализе большого набора информации, которая в силу
специфики решаемой задачи в требуемом объеме отсутствует.
При прогнозировании необходимо учитывать неизвестную закономерность о явлении, лежащем в основе процесса, который генерирует дискретные последовательности. Разработке математических моделей прогнозирования посвящено большое количество исследований. Наиболее распространенными являются методы, построенные на базе вероятностно-статистического аппарата [1, 2]. Однако их использование требует значительного количества экспериментальных данных, которые не всегда удается собрать в условиях событий, состоявшихся относительно недавно.
В последнее время в задачах прогнозирования возродился интерес к использованию искусственных нейронных сетей, которые могут «обучаться» распознаванию неизвестных закономерностей. Но, как и в случае вероятностно-статистических методов, для обучения нейронных сетей требуется большая выборка экспериментальных данных.
В силу этих предположений предлагается подход к прогнозированию открытых вкладов, который объединяет экспериментальные данные о количестве вкладов с экспертно-лингвистической информацией о закономерностях, которые удается увидеть в существующих данных. Использование экспертно-лингвис-тических закономерностей, которые формализуются с помощью нечеткой логики, позволяет построить модель прогнозирования в условиях малых экспериментальных выборок. Предлагаемый ниже подход идеологически достаточно близок к так называемому нейронечеткому подходу, объединяющему способности нейронных сетей к обучению и легкую интерпретируемость нечетких правил «ЕСЛИ — ТО».
Таблица1
Распределение количества открытых вкладов
Месяц 01 02 03 04 05 06 07 08 09 10 11 12 01 02 03 04
Кол-во открытых вкладов 109 143 161 136 161 163 213 220 162 194 164 196 245 252 240 225
1. Фактические данные. Рассмотрим количество вкладов, открытых в 2005 — 2006 гг. в разные месяцы, которые представлены в табл. 1.
Наблюдая динамику изменения количества открытых вкладов по рис. 1, легко заметить наличие четырехмесячных циклов.
Обозначим эти циклы следующим образом: X = {[х;: ] = 1,2,3,4]'': i = 1^},
где i — номер четырехмесячного цикла;
N — количество четырех месячных циклов на интервале наблюдения;
х{ — количество открытых вкладов за первый месяц квартала;
X — количество открытых вкладов за второй месяц квартала;
X — количество открытых вкладов в третий месяц квартала;
X — количество открытых вкладов в четвертый месяц квартала.
Введенные обозначения будут использованы в дальнейшем при формировании закономерностей, необходимых для прогнозирования.
2. Экспертно-лингвистические закономерности. Закономерности, которые можно увидеть на рис. 1, легко записать в виде четырех экспертных высказываний на естественном языке. Эти высказывания являются продукционными правилами «ЕСЛИ — ТО»,
260 -Кол-во
вкладов
220
180
140
100
\
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Месяцы
Рис. 1. Динамика изменения количества открытых вкладов
которые связывают количество открытых вкладов в г-м и (г+1)-м циклах:
F1: если х{ = низкое и х2 = ниже среднего, то х3 = ниже среднего;
если х{ = ниже среднего и х2 = ниже среднего, то х3 = выше среднего;
если х{ = ниже среднего и х2 = среднее, то х3 = ниже среднего;
если х{ = высокое и х2 = высокое, то х3 = высокое; F2: если х{ = низкое и х2 = ниже среднего, то х4 = ниже среднего; если х{ = ниже среднего и х2 = ниже среднего, то х4 = выше среднего; если х{ = ниже среднего и х2 = среднее, то х4 = среднее; если х{ =
высокое и Х2 = высокое, то Хз = выше среднего;
F3: если х4 = низкое, то х[+1 = ниже среднего; если х4 = выше среднего, то х{+1 = ниже среднего; если х4 = среднее, то х{+1 = высокое;
F4: если х4 = низкое и х{+1 = ниже среднего, то х2+1 = ниже среднего; если х4 = выше среднего и х{+1 = ниже среднего, то Х2+1 = среднее;
если х4 = среднее и х{+1 = высокое, то Х2+1 = высокое.
3. Модель прогнозирования. Сеть зависимостей, которая объединяет сформированные выше правила, показывает, что по двум первым месяцам г-го цикла можно прогнозировать на четыре месяца вперед: на два последних месяца г-го цикла и на два первых месяца следующего (г+1) -го цикла (рис. 2, 3).
Для экспертно-лингвистических высказываний F1+ F4 используется аппарат теории нечетких множеств, согласно которой лингвистические оценки <низкий>, <ниже среднего> и другие формализуются с помощью функций принадлежности (х), которые характеризуют субъективную меру (в диапазоне [0, 1]) уверенности эксперта в том, что четкое значение х соответствует нечеткому терму Т. Наибольшее распространение в практических приложениях получили треугольные, трапециевидные и колоколообразные (гауссовы) функции принадлежности, параметры которых позволяют менять форму функций.
ФИНАНСЫ И КРЕДИТ
25
Рис. 2. Функциональные связи между открытыми вкладами
В рассматриваемой задаче используется простая и удобная для настройки аналитическая модель функций принадлежности переменной х произвольному нечеткому терму Т в виде:
т 1
цт(X)=-
1+
(х - b)2
Лингвистические оценки переменных Параметр
г . 1 х1 — Х4 b c
Низкая (Н) 100 50
Ниже среднего (нС) 160 30
Средняя (С) 195 25
Выше среднего (вС) 222 20
Высокая (В) 260 30
Низкая
Полученные при этом функции принадлежности показаны на рис. 5.
Помимо выбранных выше функций принадлежности, могут быть использованы и другие функции, содержащие три и четыре настраиваемых параметра, у соответственно.
Обозначим через [хт)п, х 1 диапазон возможных
тах-1
значений количества открытых вкладов. Разобьем этот диапазон на пять базовых О множеств (рис. 6), которые ЮО ассоциируются с лингвисти-
рис. 3. Сеть зависимостей для прогнозирования
где Ь и с — параметры настройки; Ь — координата максимума функции цт(х), цт(Ь) = 1; с — коэффициент концентрации — растяжения функции цт (х) (рис. 4). Для нечеткого терма Тчисло Ь представляет наиболее возможное значение переменной х.
Выбранные экспертом параметры Ь и с для разных лингвистических оценок, которые используются в правилахFl —F4, представлены в табл. 2.
Таблица 2
Параметры функций принадлежности до настройки
рис. 4. Варианты функции принадлежности.
ческими оценками: низкая (Н), ниже среднего (нС), средняя (С), выше среднего (вС), высокая (В).
Тогда, используя нечетко-логические операции min (И), max (ИЛИ) и операцию дефаззификации для преобразования функции принадлежности к четкому числу, можно записать модель прогнозирования в явном виде:
F1: хз =
Х1 ИнС (х3 ) + Х3 ИвС (х3 ) + Х4 Ид (х3 ) . ИнС(Х3 ) + ИиС(х3 ) + Ид (х3 )
ИиС (х'3) = тах{тт[и# (Х), ИнС(х2)], min^^X), Ис (х2)]};
Ниже среднего Средняя Выше среднего Высокая
140 180 220
Рис. 5. Функции принадлежности лингвистических оценок
260
2
c
х + х
4
Н
нС
С
вС
Хшш
Рис. 6. Построение базовых множеств лингвистических значений
(Х) = шт[й„с (х1), Цнс (х2)] йв (х)=ш1п[цл (X), Цз(х2)];
X =
хш1п Йп (х4 ) + х2 Й< (х4 ) + х4 ЙвС (х4). ЙпК ) + Йс(X4 ) + ЙвС(< )
ЙР (х4) = шт[|йя (X;), Йнс( x2)] Йс (х4)=ш1п[|ис (X), Йс( x2)];
Йвс (х3) = шах{шт[й„с (x;), ЙнС (x2)],
ш1п[|в( X!), ЙЛ (*2)П; '+1 ^ЙбсС'О + X4 Йл С^Г ) .
F3 : X+1 =
ЙнС (х1+') + Йл ^Г)
ЙнС (Х1+1) = шах[йн (x4), ЙвС (x4)];
Йв(х1+1) = Йс (x4) ;
'+1 = X ЙнС ^ ) + X2 ЙС ^ ) + X4 ЙЛ (x2+1) ,
FЛ• ^ =
ЙнС^1) + Йc(x2+1) + ЙЛ ^ л+1 \ ^^ Г.. \ ,, +1
1 2 3
4 5 6 7
4. Настройка модели прогнозирования. Задача настройки состоит в подборе таких параметров функций принадлежности лингвистических оценок (см. рис. 5), которые обеспечат минимум расхождения между теоретическим и фактическим количеством открытых вкладов. В соответствии с методом наименьших квадратов эта задача формулируется так: найти такие параметры, что
£ (X -X)2+£ X -*2)2+£ (X -ЛХ )2 +£К -*4)2=шп /=1 /=1 /=1 /=1 ь,с
где X, х2, х3, х4 — прогнозные количества открытых вкладов, которые зависят от параметров Ь и с функций принадлежности;
X1 , X 2 , X з , X 4 — фактические количества открытых вкладов,
N — число циклов, которые используются для настройки модели.
После настройки модели прогнозирования при N = 3, что соответствует использованию данных за 11 месяцев, получены параметры функций принадлежности, представленные в табл. 3.
Таблица 3
Параметры функций принадлежности после настройки
ЙИС (х2+ ) = Ш1п[Йн (х4 X Йн€(Х+ )];
йс (х2+1)=ш1п[й«с (x4), ЙнС (Х+1)];
ЙЛ(х2+1) = ш1п[йс(x4), Йв(x1+1)].
С помощью полученной модели можно грубо прогнозировать количество открытых вкладов, как показано на рис. 7.
Для повышения точности прогноза необходимо перейти к настройке модели.
Кол-во откр. вкладов
Лингвистические оценки переменных Параметр
' . ' Xl ~ x4 Ь с
Низкая (Н) 100,385 14,148
Ниже среднего (нС) 146,602 21,046
Средняя (С) 195,650 7,621
Выше среднего (вС) 234,457 19,760
Высокая (В) 251,836 36,640
п-1-1-1-1-1-г
9 10 11 12 13 14 15 16 17 18 19 20
Месяцы
Рис. 7. Сопоставление фактических данных и прогнозируемых: 1 — прогнозные значения, 2 — фактические
Функции принадлежности после настройки приведены на рис. 7. В расчет принималось:^^ 100,л:1 = 140,хг=180,хз = 210, х=240,х =100.
4 ' шах
Использование настроенных функций принадлежности дает модель прогнозирования, которая достаточно близка к фактическим данным (рис. 9).
Поскольку фактические значения количества открытых вкладов в 13 — 16 месяцах не использовались при настройке модели, то близкие результаты теории и эксперимента в этих месяцах свидетельствуют о достаточном для практики качестве построенной модели прогнозирования. Ошибка модели прогноза, а также прогноз количества открытых вкладов представлены в табл. 4.
В
8
Низкая
100
Ниже среднего
Средняя Выше среднего Высокая
140
180
220
260
рис. 8. Функции принадлежности лингвистических оценок после настройки
О
4
Месяцы
Рис. 9. Сопоставление фактических данных и прогнозных после настройки модели: 1 — прогнозные значения, 2 — фактические значения
Таблица 4
Экспериментальное и теоретическое количество открытых вкладов
Месяц 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20
Эксперимент 109 143 161 136 161 163 213 220 162 194 164 196 245 252 240 225
Теория 163 135 158 165 199 222 159 201 168 198 234 247 231 232 154 199 163 195
Ошибка абс. /отн. (%) 2/1,2 1/0,7 3/1,9 2/1,2 14/6,6 2/0,9 3/1,8 7/3,6 4/2,4 2/1 11/4,5 5/2 9/3,7 7/3,1
Приведенная в данной статье методика позволяет достаточно надежно (средняя ошибка 2,4 %) прогнозировать динамику открытия вкладов и динамику привлечения денежных средств населения коммерческими банками, что будет способствовать улучшению качества финансового менеджмента.
Литература
1. Дубров А. М., Мхитарян В. С., Трошин Л. И. Многомерные статистические методы. — М.: Финансы и статистика, 1998. 352 с. ISBN 5279-01945-3.
2. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов. М.: Финансы и статистика, 2003. 416 с. ISBN 5-279-02740-5.