А.В.Кузнецов, О.А.Кузнецова*
УПРАВЛЕНИЕ КРЕДИТНЫМ РИСКОМ С ИСПОЛЬЗОВАНИЕМ МОДЕЛИ МНОГОСЛОЙНОГО ПЕРСЕПТРОНА (МЬР), ОБУЧЕННОГО АЛГОРИТМОМ ОБРАТНОГО РАСПРОСТРАНЕНИЯ ОШИБКИ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ФОРМИРОВАНИЯ ОБРАЗА ЗАЕМЩИКА БАНКА, НА ПРИМЕРЕ СТРУКТУРЫ СЕТИ, ХАРАКТЕРИЗУЮЩЕЙСЯ ДВОЙНОЙ РАЗМЕРНОСТЬЮ
Основной финансовый риск банка — это кредитный риск. Поэтому возникает проблема поиска альтернативных методов снижения банковских рисков за счет эффективной классификации потенциального заемщика. Предлагается для классификации заемщика использовать искусственные нейронные сети (ИНС). В связи с этим возникает задача обучения ИНС распознаванию образа потенциально невозвратного кредита. Так как данная задача характеризуется большой размерностью математической модели сети, приводится упрощенный пример в виде описания модели сети двойной размерности, а также показан алгоритм обратного распространения ошибки, применяемый для обучения модели многослойного персептрона, характеризующейся восемнадцатимерным пространством.
Окружающая среда банковского менеджмента отличается достаточно высокой динамичностью. Для рыночной экономики характерна определенная нестабильность, порождаемая конкурентной средой, неустойчивыми потребительскими предпочтениями, циклическими перестройками продуктовых рядов и другими факторами. Все это проявляется в сфере банковского предпринимательства в виде многочисленных и разнообразных рисков, прямо или косвенно влияющих на функциональность и устойчивость кредитных организаций. Основной финансовый риск банка — это кредитный риск. При выдаче кредита основной опасностью является то, что заемщик может несвоевременно возвратить кредит или возвратить его не в полном объеме, или вообще не вернуть. Кредитный риск связан также с процентным и ликвидным рисками. Это объясняется тем, что кризис ликвидности или угроза неплатежеспособности банка не возникают неожиданно, а причиной их бывает чрезмерно высокий кредитный риск, проявляющийся в непогашении больших сумм кредитов.
Кредитный риск влияет и на процентную ставку кредита, характеризующую его доходность, так как банк вынужден использовать методы компенсации данной категории рисков. Сильная зависимость процентной ставки кредита от величины риска вынуждает банки уделять большое внимание ее определению для каждого заемщика и каждого кредитного договора. При существенном риске невозврата премия за риск банку оказывается настолько большой, что заемщик откажется от кредита. Когда
* © Кузнецов А.В., Кузнецова О.А., 2006
Кузнецов Александр Владимирович — кафедра «Финансы и кредит» НОУ ВПО «Мир»
Кузнецова Ольга Александровна — кафедра менеджмента Самарского государственного уни-
верситета
кредитный риск небольшой, банку удается скомпенсировать потери. Таким образом, премия банка за риск ограничена конкуренцией на рынке ссудного капитала и не может существенно превосходить среднестатистического рыночного значения. Именно с этим связана проблема поиска альтернативных методов снижения банковских рисков.
В последнее время стали использоваться методы, позволяющие учесть неполноту и искаженность информации для задач классификации, а также вероятностную природу получаемых заключений. К ним, в частности, относятся нечетко-множественный и логико-вероятностный методы. К этой группе методов примыкает класс математических моделей, к которым относятся искусственные нейронные сети и генетические алгоритмы. Системы искусственного интеллекта, ориентированные на задачу распознавания сильно зашумленных образов, позволяют справиться с подобными задачами [1.С.78-83].
В 1958 году Ф. Розенблатт в работе, посвященной персептрону, предложил новый подход к решению задачи распознания образов.
В наиболее простом виде персептрон (рис.1) состоит из совокупности чувствительных (сенсорных) элементов (8-элементов), на которые поступают входные сигналы. 8-элементы случайным образом связаны с совокупностью ассоциативных элементов (А-элементов), выход которых отличается от нуля только тогда, когда возбуждено достаточно большое число 8-элементов, воздействующих на один А-эле-мент. А-элементы соединены с реагирующими элементами (Я-элементами) связями, коэффициенты усиления (у) которых переменны и изменяются в процессе обучения. Взвешенные комбинации выходов Я-элементов составляют реакцию системы, которая указывает на принадлежность распознаваемого объекта определенному образу. Если распознаются только два образа, то в персептроне устанавливается только один Я-элемент, который обладает двумя реакциями — положительной и отрицательной.
Если образов больше двух, то для каждого образа устанавливают свой Я-элемент, а выход каждого такого элемента представляет линейную комбинацию выходов А-элементов [2.С.45]:
, (1)
г=1
где $ — реакция /-го Л-элемента; х,- — реакция г-го Л-элемента; V, — вес связи от г-го Л-элемента к /'-му ^-элементу; ©у- — порог/-го Л-элемента.
Аналогично записывается уравнение г-го Л-элемента:
= Е Ук. (2)
к=1
Здесь сигнал ук может быть непрерывным, но чаще всего он принимает только два значения: 0 или 1. Сигналы от 8-элементов подаются на входы А-элементов с постоянными весами, равными единице, но каждый А-элемент связан только с группой случайно выбранных 8-элементов. Предположим, что требуется обучить пер-септрон различать два образа V: и У. Будем считать, что в персептроне существует два Я-элемента, один из которых предназначен образу У , а другой — образу У. Пер-септрон будет обучен правильно, если выход Я: превышает Яг, когда распознаваемый объект принадлежит образу У, и наоборот. Разделение объектов на два образа можно провести и с помощью только одного Я-элемента. Тогда объекту образа У должна соответствовать положительная реакция Я-элемента, а объектам образа У — отрицательная.
Персептрон обучается путем предъявления обучающей последовательности изображений объектов, принадлежащих образам У и У . В процессе обучения изменяются веса VI А-элементов. В частности, если применяется система подкрепления с коррекцией ошибок, прежде всего, учитывается правильность решения, принимаемого персептроном. Если решение правильно, то веса связей всех сработавших А-элементов, ведущих к Я-элементу, выдавшему правильное решение, увеличиваются, а веса несработавших А-элементов остаются неизменными. Можно оставлять неизменными веса сработавших А-элементов, но уменьшать веса несработавших. В некоторых случаях веса сработавших связей увеличивают, а несработавших — уменьшают. После процесса обучения персептрон сам, без учителя, начинает классифицировать новые объекты.
Если персептрон действует по описанной схеме и в нем допускаются лишь связи, идущие от бинарных 8-элементов к Л-элементам и от А-элементов к единственному Я-элементу, то такой персептрон принято называть элементарным персептроном [3.С.164].
Обработка информации в МЬР сети состоит из взаимодействия между слоями нейронов в системе, в результате которой нейроны выходного слоя передают результат взаимодействия во внешнюю среду. Таким образом, проектирование связей между нейронами эквивалентно программированию системы для обработки входа и создания желаемого выхода.
Для разработанной методики формирования образа клиента-заемщика банка использована структура персептрона, характеризующаяся полной связью нейронов (каждый нейрон первого слоя связан с каждым нейроном второго слоя); двунаправленной связью, при которой нейроны первого слоя связаны с нейронами второго, которые, в свою очередь, имеют связь с нейронами первого слоя. Нейронная сеть имеет три слоя нейронов с иерархической связью (нейроны нижнего слоя связаны только с нейронами следующего уровня).
Первый слой является входным слоем, который получает внешние данные в виде финансовых коэффициентов, характеризующих состояние предприятий. Нейроны входного слоя посылают сигналы всем нейронам следующего слоя. Изначально весовые коэффициенты между первым и вторым слоем фиксированы и равны 1. Нейроны второго слоя отмечают свойства финансовых коэффициентов анализируемых организаций. Третий слой является выходным, и каждый нейрон в нем выдает или не выдает сигнал. Этот слой имеет обратную связь со вторым слоем. В начале работы персептрон не имеет полной связи между вторым и третьим слоями. Она создается в процессе обучения персептрона. Нейроны второго и третьего слоя вычисляют их вход, используя уравнение:
где OUTj — выходы из нейронов предыдущего слоя. Нейроны третьего слоя имеют влияние фактора OUT с фиксированным значением w<,i=l. Вес фактора Woi изменяется в процессе обучения. В этом контексте фактор OUT можно представить как выход нейрона второго слоя, равный 1.
Процесс обучения сети под задачу формирования образа заемщика заключается в формировании весов связей между вторым и третьим слоями в соответствии со следующим уравнением:
где Wji — весовая связь нейрона j второго слоя с нейроном i третьего слоя, DESOUTi— или правильный выход нейрона i третьего слоя и OUT, — реальный выход нейрона i.
Если нейрон i посылает правильный импульс (выход) во внешнюю среду, тогда веса к нейронам второго слоя не изменяются. Однако, если выход нейрона i равен единице, когда он должен быть равен нулю, тогда весовые связи с нейронами второго слоя уменьшаются путем умножения на величину а . Если, с другой стороны, нейрон i имеет выход 0, когда правильный импульс равен 1, то весовые связи к нейронам второго слоя увеличиваются путем умножения на величину а, где 0<а<1 .
Обучение персептрона происходит следующим образом. На вход персептрона подают множество совокупностей финансовых коэффициентов, характеризующих заемщика, из обучающего подмножества по одному и подстраивают веса до тех пор, пока не будет достигнут требуемый выход. За конечное число шагов сеть научилась разделять классы с состояниями предприятий, соответствующих фактам погашения ссудной задолжности при условии, что множество линейно разделимо.
Для определения количества состояний предприятий, которое требуется подать на вход персептрона, чтобы его обучить, и выбрать последовательность проведения обучения с тем, чтобы минимизировать данный процесс, вводится величина, которая равна разности между требуемым или целевым выходом DESOUT и реальным выходом OUT:
(3)
j = w+ а(DESOUT. - OUT.) ,
Jl Jl ii7
(4)
8 = (DESOUT - OUT) .
(5)
В этом случае алгоритм обучения персептрона сохраняется, если умножается на величину каждого входа х,, и это произведение добавляется к соответствующему весу.
С целью обобщения вводится коэффициент скорости обучения, который умножается на 5 • х что позволяет управлять средней величиной изменения весов, то есть:
А. = 5 ; (6)
(п +1) = (п) + А. , (7)
где 5г- — коррекция, связанная с /-м входом х ; (п) и (п+1) — значения весов
соответственно до и после коррекции.
Таким образом, для задачи формирования образа заемщиков изменяют веса в соответствии с требуемым и реальным значениями выхода каждой полярности как для непрерывных, так и для бинарных входов и выходов.
Для упрощения покажем сущность работы заданного персептрона для задачи исследования в случае двойной размерности. Предположим, используются только два атрибута в каждом применении: коэффициент ликвидности (проходной — 1, непроходной — 0), обозначаемый через х^; коэффициент удельного веса заемных средств в пассивах (проходной — 1, непроходной — 0), обозначаемый через х2. Возможные пары значений (0,0), (1,0), (0,1) и (1,1) соответствуют четырем точкам а,Ъ,с,й на плоскости. Теперь изобразим данный аспект с помощью персептронной сети (рис.2). Видно, что структура сети характеризуется прямой связью из входного слоя ко второму слою с весовыми коэффициентами, равными 1. Второй слой имеет два нейрона. Каждый из них получает вход из входного слоя и посылает их выходы на выходной слой.
Выходной слой имеет один нейрон, который означает одобрение (1) или неодобрение (0) кредитной заявки. Весовые связи со второго в третий слой обозначены через ^11 и W21 для связей нейронов 1 и 2 во втором слое к нейрону 1 в третьем слое. Вход к нейрону в третьем слое (выходном) равен:
ИЩ = + Юцх + ю21 х2 . (8)
Вышеприведенное уравнение (8) — уравнение прямой с известными значениями х1 и х2 и неизвестными значениями весов.
Входной Средства детекторного Слой
слой слоя \ персептрона
Рис.2. Структурное изображение примера для формирования образа заемщика с двумя переменными
Предположим, что желаемый выход в случае одобрения кредита, когда клиент имеет проходной коэффициент ликвидности (х1=1), и коэффициент удельного веса заемных средств в пассивах у клиента либо проходной (х2=1), либо плохой (х2=0).
Обучение сети определяет значение весов в уравнении (8), так что точки й (1,1) и Ь (1,0) располагаются по одну сторону прямой и точки а (0,0) и с (0,1) — по другую сторону.
Веса можно было бы определить так, чтобы точки Ь и й являлись бы выходом из сети со значениями, равными 1, а другие точки со значениями, равными 0. Таким образом, уравнение (8) относится к прямой, которая разделяет банковские кредиты на «одобренные» и «неодобренные».
Для определения весов требуется решить следующую систему уравнений:
^ + *>п 1 + ^1 •1 = 1,
Ы0 + ^ • 0 + ^1 0 = О (9)
^ + ^1 1 + ^1 0=1,
^0 + Щ1 0 + ^1 •0 = 0.
Когда число атрибутов увеличивается до трех, прямая представляется плоскостью в трехмерном пространстве. Когда число атрибутов более трех, линия раздела является гиперплоскостью в п-мерном пространстве. Но идея остается той же. Для функционирования персептрона входные коэффициенты должны быть такими, чтобы возможные ответы можно было ранжировать на п частей гиперплоскостью в п-мер-ном пространстве [4.С.283-289].
Рассмотренные возможности персептрона применительно к задаче формирования образа заемщика показывают, что нейронные сети способны представлять сложные отношения между входными и выходными данными путем использования простых математических формул. Таким образом, для разработки нейронных сетей применительно к задаче исследования нет необходимости математического описания отношений между входными и выходными данными, а вместо этого возникает необходимость проектирования структуры и решения проблемы обучения нейронной сети. Поэтому в нейронных сетях поиск и программирование математических функций, связанных с получением выходных данных на основе входных, заменяются поиском соответствующей структуры и параметров для системы. Это свидетельствует, что структура и процесс обучения играют решающую роль в надежности и эффективности нейронных сетей.
Ограниченные возможности однослойных сетей и отсутствие теоретически обоснованного алгоритма для обучения многослойных искусственных сетей привели к тому, что для эффективного и точного формирования образа заемщика в исследовании использовался алгоритм обратного распространения ошибки в сети, состоящей из двух слоев с прямым распространением (рис.3).
Перед началом обучения присвоим весам небольшие начальные значения (0,1), чтобы избежать насыщения сети большими значениями весов. Организационно алгоритм обучения сети обратного распространения под задачу классификации заемщика, математическая алгоритмизация которого приведена выше, включает в себя следующие шаги:
1.Выбрать очередную обучающую пару (Х,У) из обучающего множества и подать входной вектор X на вход сети.
2.Вычислить выход сети.
3.Вычислить разность между реальным (вычисленным) выходом сети и требуемым выходом (целевым вектором обучающей пары).
4.Подкорректировать веса сети так, чтобы минимизировать ошибку.
5.Повторить шаги с 1 по 4 для каждого вектора обучающего множества до тех пор, пока ошибка на всем множестве не достигнет приемлемой величины.
Рис.3. Структура трехслойного персептрона для задачи формирования образа заемщика коммерческого банка, обученная алгоритмом обратного распространения ошибки
Вычисления в сети выполняются послойно. На шаге 3 каждый из выходов сети OUT вычитается из соответствующей компоненты целевого вектора с целью получения ошибки. Эта ошибка используется на шаге 4 для коррекции весов сети, причем знак и величина изменений определяются алгоритмом обучения.
Шаги 1 и 2 можно рассматривать как «проход вперед», так как сигнал распространяется по сети от входа к выходу. Шаги 3 и 4 составляют «обратный проход», здесь вычисляемый сигнал ошибки распространяется обратно по сети и используется для подстройки весов.
Процесс подстройки одного веса от нейрона р в скрытом слое j к нейрону q в выходном слое происходит следующим образом. Выход OUT слоя k, вычитаясь из целевого значения Т, дает ошибку, которая умножается на производную сжимающей функции [OUT(1-OU7)], вычисленную для этого нейрона слоя k, давая, таким образом, величину
Ъ=ОиТ{\-ОиТ){7 . (10)
Затем 8 yмнoжaeтcя на величин OUT нeйpoнa j, из ^TOpora выводит paccмaтpи-ваемый вес
A*W=Ttfq,k OUTp,c , (11)
где 8^^ — величина 8 для нeйpoнa q в вы^дтом raoe k; OUTt,q — величина выщда для нeйpoнa в сбытом raoe j.
Это пpoизвeдeниe в cвoю oчepeдь yмнoжaeтcя на ^эффициент oбyчeния П (0,01 <п< 1) и peзyльтaт ^ибавляется к вєсу. Такая же npo^,nypa выгодняется для каждаю веса от нeйpoнa сбытою cлoя к нeйpoнy в выгодтом raoe:
(» + !) = ™pq,k in) + Awpq i , (12)
где wpq,k(n) — величина веса oт нeйpoнa в cкpытoм cлoe k к нeйpoнy q в вы^дтам raoe на шаге n (дo кoppeкции) (индекс oтнocитcя к cлoю, в кoтopoм заканчивается
данный вес, с которым он объединен); (n+1) — величина веса на шаге n+1 после коррекции.
Каждый нейрон скрытого слоя, предшествующего выходному, передает свои выходы к нейронам выходного слоя через соединяющие их веса. В процессе обучения эти веса функционируют в обратном направлении, пропуская величину 8 от выходного слоя к скрытому. Каждый из этих весов умножается на величину 8 нейрона, к которому он присоединен в выходном слое.
Величина 8, необходимая для обучения нейрона скрытого слоя, равна сумме всех таких произведений, умноженной на производную сжимающей функции:
5р,; = OUTP,Al-OUTP,j)(LKk • ^ . (13)
После получения величины 8 веса скрытого слоя корректируются с помощью формул (11) и (12).
Для каждого нейрона в данном скрытом слое требуется вычислить 8 и подстроить все веса, связанные с этим слоем. Этот процесс повторяется слой за слоем по направлению к входу, пока все веса не будут подкорректированы.
Данная операция в векторной форме выглядит следующим образом. Пусть Dk — множество величин выходного слоя и Wk — множество величин выходного слоя. Для получения 8 -вектора Dj, выходного слоя необходимо провести следующие операций:
1. Умножить 8-вектор выходного слоя Dk на транспонированную матрицу весов W'k , соединяющую скрытый слой с выходным.
Dj=Dk-Wl. (14)
2. Умножить каждую компоненту полученного произведения на производную сжимающей функции соответствующего нейрона в скрытом слое:
$[OUTj(I-OUTj)] , (15)
где оператор $ обозначает покомпонентное произведение векторов; OUT — выходной вектор слоя j и I — вектор, все компоненты которого равны 1.
Таким образом, в ходе исследования, обучив и проверив различные структуры персептронов, получили две модели сети, эффективно решающие задачу исследования. Характеристика персептронных сетей для оценки кредитоспособности юридического лица представлена в табл. 1 и 2.
Таблица 1
Характеристика персептронных нейросетей для оценки кредитоспособности юридического лица
№ Модель Количество нейронов Ошибка обучения инс Качество инс
Входных Выходных Скрытых
1 А 15 3 4 0,35 0,87
2 в 18 3 11 0,34 0,89
Представленные нейросетевые модели по ошибке обучения и их качеству были оценены положительно. Наибольший эффект достигается при использовании следующих финансовых коэффициентов: коэффициент текущей ликвидности и удельный вес заемных средств в пассивах (текущие активы-текущие обязательства)/все активы; нераспределенная прибыль/все активы; прибыль до уплаты процентов и налогов/все активы; собственный капитал/заемный капитал; (прибыль от реализации/краткосрочные обязательства, оборотные активы/сумма обязательств; краткосрочные обязательства/сумма активов); оборотный капитал/сумма активов, прибыль от реализации/сумма активов, нераспределенная прибыль/сумма активов; нераспределенные прибыли прошлых лет/совокупные активы; объем реализации/совокупные активы; прибыль до уплаты налогов/совокупные активы; долговые обязательства/совокупные активы; текущие пассивы/совокупные активы; 1оg (материальные активы); оборотный капитал/полная задолженность. Следовательно, данный комплекс финансовых коэффициентов при использовании полученной методики позволяет с высокой точностью классифицировать юридических лиц, клиентов кредитного отдела банка.
Таблица 2
Характеристики нейросетевых моделей
Модель Контрольное множество Тестовое множество
Чувстви- тельность Специ- фичность Точ- ность Чувстви- тельность Специ- фичность Точ- ность
А 76% 88% 86% 78% 83% 87%
В 69% 86% 88% 61% 71% 89,6%
На основе проведенных исследований установлено:
- улучшить позиции современного коммерческого банка на рынке ссудного капитала возможно на основе существенного увеличения юридических лиц в структуре клиентской базы банка. Для увеличения сегмента юридических лиц в структуре клиентской базы банка необходимо усилить его конкурентные позиции, для чего следует уменьшить премию за риск. В свою очередь, это влечет за собой снижение процентной маржи и прибыли в связи с банковскими рисками из-за потери активов, во избежание чего и следует использовать аппарат ИНС для отбраковки высокорисковых и ненадежных заемщиков;
- для классификации клиентов-заемщиков коммерческого банка нейросетевое моделирование способно обеспечить более высокий уровень точности до 90%, по сравнению с наиболее часто используемыми методиками классификации, точность которых в среднем не превышает 80%. Разработанная методика использует адаптивный математический инструментарий и обучается в процессе анализа большего количества кредитных заявок, что позволяет ей настраиваться на макроэкономическую среду, в которой осуществляют свою деятельность потенциальные заемщики, через изменение финансовых индикаторов их внутрихозяйственной деятельности и учитывать изменчивость данной среды, что позволяет получить стабильную точность разработанной методики в динамике.
Сравнение полученных результатов проведенного нейросетевого анализа и фактического результата погашения кредитов и обслуживания долга той же выборкой клиентов банка позволяет сделать заключение о возможности дальнейшего использования нейросетевого анализа на основе многослойного персептрона с учетом комплексной оценки заемщика.
Библиографический список
1. Нейронные сети для обработки информации / пер. с польск. И.Д. Рудинского. — М.: Финансы и статистика, 2004. — 344 с.
2. Сотник, С.Л. Конспект лекций по курсу «Основы проектирования систем искусственного интеллекта» / С.Л. Сотник. — М., 1997-1998.
3. Прикладные нечеткие системы / под ред. Т. Тэрано, К.Асаи, М. Сутэно. М.: Мир, 1993. — 368с.
4. Змитрович, А.И. Интеллектуальные информационные системы / А.И. Змитрович. — Минск: ТетраСистемс, 1997. — 367с.
A.V. Kuznetsov, O.A. Kuznetsova
CREDIT RISK MANAGEMENT BY USING MODEL OF MULTILAYER PERCEPTRON (MLP), TRAINED BY THE ERROR REVERSE DISTRIBUTION ALGORITHM TO RESOLVE THE PROBLEM OF FORMING A BANK BORROWER FIGURE USING THE EXAMPLE OF NETWORK STRUCTURE WITH DOUBLE DIMENSION
The main financial risk of a bank is credit risk. This brings up the problem of looking for alternative ways of reducing bank risk through efficient classification of a potential borrower. We propose to use artificial neuron networks (ANN) for borrower classification. The problem of teaching ANN to identify the image of potentially irrevocable credit is raised. As the task is characterized by a big dimension of the network mathematical model a simplified example is given in the form of description of a double dimension network as well as an algorithm of error reverse distribution used to teach the model of multilayer perceptron characterized by 18-dimensional space.