ОЦЕНКА КРЕДИТНОЙ ИСТОРИИ ФИЗИЧЕСКИХ ЛИЦ НА ОСНОВЕ НЕЧЕТКИХ МОДЕЛЕЙ
Кузнецов Л. А., Перевозчиков А. В.
(Липецкий государственный технический университет,
Липецк)
[email protected], [email protected]
Предложена методика формализации задачи оценки кредитной истории физических лиц на основе использования нечетких моделей. Рассматриваются принципы построения баз знаний с помощью основных показателей, применяемых в ряде российских банков для определения качества выполнения заемщиком обязательств по выплате основного долга и процентов. Показаны возможные методы анализа кредитной истории, на основе которых могут быть построены алгоритмы теории нечетких множеств.
Ключевые слова: нечеткая логика, функция принадлежности, лингвистическая переменная, кредитная история, база знаний.
Введение
Проблема своевременного возвращения кредитов актуальна для банков. Ее решение в значительной мере зависит от «качества» оценки потенциальных заемщиков, которая осуществляется экспертами на основании ретроспективной информации о кредитных историях физических лиц, хранящейся в базе данных банка.
Бухгалтерская отчетность дает достаточно полную информацию о финансовом состоянии юридических лиц и позволяет выработать объективные критерии принятия решения о выдачи кредита. Оценка кредитоспособности физических лиц часто осуществляется по различного рода косвенным характеристи-
кам, содержащимся в кредитной истории и допускающим достаточно широкий спектр толкования.
В системе кредитования большого количества банков, оценка кредитной истории производится экспертом, который, в основном, опирается на свой опыт и интуицию, что может приводить к внесению в решение не имеющих достаточных оснований субъективных соображений. В реальной ситуации мнения разных аналитиков часто различаются, особенно если рассматриваются спорные ситуации, имеющие множество альтернативных решений.
Вследствие этого в оценке чрезмерный вес может приобретать субъективное мнение эксперта и следующая из него некомпетентная или преднамеренная интерпретация информации, приводящая к принятию решений, ущербных для банка.
Особенно сложным является описание характеристик, определяющих кредитную историю заемщика. Задание жестких (четких) ограничений на значения ее составляющих (количество дней на просрочке за определенный период, общее количество просрочек и т. п.), если их диапазоны узки, может привести к исключению из рассмотрения целого ряда потенциальных клиентов, и снижению прибыли финансово-кредитной организации, и наоборот, излишнее «расширение» границ сопровождается ухудшением качества кредитного портфеля и повышением рисков банка.
Снижение возможности влияния эксперта на решение и повышение в нем доли объективных факторов может быть обеспечено формализацией прогноза поведения заемщика и процедуры принятия решения о выдаче кредита.
В отношении физических лиц основой для обучения подобной системы являются ретроспективные кредитные истории, которые представляют собой в значительной степени документы вербальные и вследствие этого нечеткие. Одним из способов формализации вербальных величин и преобразования их в количественные, допускающие применение математических операций и упорядочивания, представляется теория нечетких отношений и множеств Л. А. Заде [4].
В будущем оценка кредитной истории будет осуществляться посредством запроса в Бюро кредитных историй, в котором уже содержатся определенные данные о договорах, по которым рассматриваемое физическое лицо имеет обязательства перед банком.
Предоставленная информация в основном касается параметров кредитной сделки, таких как срок, сумма, вид кредита, а данные, относящиеся к срокам погашения задолженности и фактам наличия просроченных платежей, не будут содержать рекомендаций об оценке уровня платежной дисциплины. В результате перед экспертом ставится задача по обобщению и систематизации ряда факторов, отражающих качество выполнения обязательств физического лица, по кредитному договору.
В работе приведен метод анализа кредитного портфеля банка на предмет оценки качества исполнения обязательств заемщиков по погашению задолженности, основанный на построении функций принадлежности (алгоритм Мамдани), применение которого с определенной степенью позволит разделить кредитные истории клиентов, расплатившихся по своим обязательствам, на «положительные» и «отрицательные».
В дальнейшем, имея в наличии информацию о «хороших» и «плохих» кредитах и сведения о соответствующих им клиентах (анкетные данные, справки о доходах, наличии в собственности имущества и т. п.) возможно построение функционального соответствия, представляющего зависимость качества кредитной истории от характеристик заемщика. Таким образом, на этапе рассмотрения кредитной заявки рассчитанная математическая модель позволит сделать вывод о наиболее вероятном уровне платежной дисциплины потенциального клиента.
1. Описание характеристик кредитной истории с использованием лингвистических переменных
Разработка математической модели для анализа качества выполнения обязательств заемщика требует наличия адекватно-
го формального представления, которое учитывало бы особенности кредитования физических лиц.
Для изучения систем, на поведение которых сильное влияние оказывают суждения, восприятия или эмоции человека (гуманистические системы), Л. А. Заде предложил использовать так называемые лингвистические переменные [4], т. е. переменные, значениями которых являются слова или предложения естественного языка.
Процесс оценки кредитной истории может быть описан в терминах теории нечетких множеств с использованием лингвистических переменных.
Лингвистическая переменная может быть задана в виде набора <Х, Т, и, О, М> [1].
Применительно к задаче анализа кредитной истории переменным может быть приписан следующий содержательный смысл:
Х - лингвистическая переменная с именем «кредитная история»;
Т- терм-множество переменной X, т. е. множество значений лингвистической переменной X, областью определения каждого из которых является множество и.
В банковской практике кредитную историю наиболее часто классифицируют по следующим категориям:
«положительная» - за период действия договора отсутствуют факты задержки оплаты, или нормативные документы кредитной организации позволяют отнести кредитную историю с некоторым количеством просроченных платежей к данной категории;
«приемлемая» - наиболее часто встречающаяся ситуация, когда имеет место несколько фактов задержки платежей;
«отрицательная» - выдача кредита нецелесообразна вследствие систематического нарушения условий договора по погашению задолженности.
Поэтому множество значений кредитной истории может быть, например следующим:
Т = {«положительная», «приемлемая», «отрицательная»}.
Множество и представляет собой набор количественных характеристик, на основании которых возможно определить принадлежность кредитной истории к значениям, входящим в Т. Например, оно может иметь вид: и = {«количество просроченных платежей», «количество дней в течении которых погашение не производилось» и т. п.}.
О - синтаксические правила, часто в виде грамматики, порождающие название термов.
Элементы множества О предназначены для формирования новых значений Х, детализирующих кредитные истории. На основе комбинаций элементов t е Т и g е О, могут быть введены дополнительные значения множества Т.
Например, при О = {«не», «очень», «более-менее»}, кредитной истории могут быть приданы следующие лингвистические значения: «не отрицательная», «более-менее приемлемая», «не положительная».
М - семантические правила, задающие функции принадлежности нечетких термов, порожденных синтаксическими правилами О.
Нечеткие множества, полученные с помощью семантических правил М, характеризуются простотой определения функций принадлежности, для расчета которых не требуется применения специализированных методов, а достаточно использовать стандартные математические операции.
Семантические правила М представлены в таблице 1.
Таблица 1. Правила расчета функций принадлежности
Квантификатор t е Т Функция принадлежности ф(и) при и е и, t е Т
не t 1 - ф(и)
очень t (ф(и))2
более-менее t (и )
Функция принадлежности ф(и) е [0; 1] ставит в соответствие значению и е и число из интервала [0; 1], характеризующее
степень принадлежности и к терм-множеству ґ є Т. Фактически это позволяет формализовать процедуру выбора наиболее подходящей кредитной истории по вербальным характеристикам заемщика.
2. Построение функций принадлежности на основе метода парных сравнений
Следующим этапом после определения структуры лингвистической переменной является переход к представлению зависимости статуса кредитной истории от выбранной характеристики, т. е. требуется найти степень принадлежности рассматриваемой кредитной истории к значениям, определенным в множестве Т.
Исходной информацией для построения подобной функциональной зависимости являются экспертные парные сравнения. Для каждой пары элементов множества V эксперт оценивает преимущество одного элемента над другим по отношению к значениям нечеткой переменной.
Парные сравнения удобно представлять следующей матрицей:
и1 и . ип
и1 а11 а12 . п1 а1
(1) и 2 А = 2 а 21 а22 . п 2 а
ип п1 а 1 2 п а .. апп
где аі}- - уровень преимущества элемента иі над и (і, у = 1, п), определяемый по девятибалльной шкале (см. таблицу 2), разработанной математиком Т. Саати [8] для решение задач, ориентированных на анализ множества альтернатив, как правило, соответствующих естественному ходу человеческого мышления. Эффективность использования данной шкалы подтверждена многолетней практикой, она применяется в ряде систем поддержки принятия решений.
Таблица 2. Шкала преимуществ Саати
Степень важности Определение Комментарии
1 Отсутствует преимущество элемента и над элементом и. Два значения вносят одинаковый вклад в достижение цели.
3 Имеется слабое преимущество и, над и, Опыт и суждение дают легкое предпочтение одному значению над другим.
5 имеется существенное преимущество и, над и, Опыт и суждение дают сильное предпочтение одному значению над другим.
7 имеется явное преимущество и, над и, Преимущество одного значения над другим очень сильно.
9 имеется абсолютное преимущество и, над и, Свидетельства в пользу предпочтения одного значения в высшей степени убедительны.
2,4,6,8 Промежуточные значения между соседними значениями шкалы. Ситуации, когда необходимы компромиссные решения.
Исследуются все показатели и,, включаемые в и, например: количество дней на просрочке за определенный период; общее количество просрочек; отношение количества просроченных платежей к «удачным» и т. п. Конкретное наполнение элементов и должно отображать политику финансовой организации по отношению к кредитным рискам.
Построение матрицы А должно быть произведено для каждого значения нечеткой переменной ^ е Т.
Для снижения размерности матрицы А на основании априорных сведений о ^ целесообразно исключить все элементы и,
степень принадлежности которых, к рассматриваемому значению равна единице.
Матрица парных сравнений является обратно симметричной: (а.. = , /, у = 1,п).
' а,г
Степени принадлежности принимаются равными соответствующим координатам собственного вектора Ж = ^1, ^2, ..., ^п) матрицы парных сравнений:
(2) (и1) = wi, 7 = 1, п .
Собственный вектор матрицы А находится из следующей системы уравнений [10]:
(3)
Г
1^1
=Лтах* & ,
w1 + w2 +... + wn
= 1.
где Лтах - максимальное собственное значение матрицы А.
Для примера рассмотрим определение значений функции принадлежности для нечеткого терма «несколько просроченных платежей» = {3, 5, 7, 8}, в качестве элементов которого было принято количество пропущенных периодов оплаты по кредиту, взятых для четырех кредитных историй.
Матрица парных сравнений для этого случая имеет вид:
7
А =
3
1
1/3
1/5
1/6
5
3
1
1/3
1/5
5
3
1
1/3
Первым этапом является определение максимального собственного числа Лтах матрицы парных сравнений А. Для этого составляется и решается характеристическое уравнение матрицы А. Максимальное собственное значение оказывается равным Лтах = 4,095
Далее находится собственный вектор Ж, соответствующий Лтах, элементы которого удовлетворяют второму равенству системы уравнений (3):
Ж = {0,562; 0,256; 0,122; 0,06}
Нечеткое множество с функцией принадлежности, определяемой вектором Ж, получилось субнормальным [1]. Для нормализации все степени принадлежности делятся на максимальное значение 0,562. Результаты представлены в таблице 3.
Таблица 3. Нормализация нечеткого множества
щ 3 5 7 8
^несколько просроченных платежей (щ) (субнормальное нечеткое множество) 0,562 0,256 0,122 0,06
^несколько просроченных платежей (щ) (нормальное нечеткое множество) 1 0,06 0,217 0,106
Данная функция принадлежности позволяет определить для каждой кредитной истории степень, с которой ее допустимо считать относящейся к нечеткому терму «несколько просроченных платежей».
Для того чтобы полученные результаты были адекватны ситуации, в которой принимается решение, необходимо, чтобы в матрице парных сравнений достигались требуемые уровни согласованности данных.
Под согласованностью матрицы парных сравнений понимается численная (кардинальная) согласованность и транзитивная (порядковая)согласованность.
Пример кардинальной несогласованности. Пусть параметр А (четыре просроченных платежа) лучше параметра В (пять просроченных платежей) в 3 раза, а параметр В лучше параметра С (шесть просроченных платежей) в 4 раза, таким образом, А лучше С в 3 * 4 = 12 раз. Нарушение этого равенства в рамках выбранной шкалы (шкала Саати имеет градацию от 1 до 9) считается кардинальной несогласованностью.
Пример транзитивной несогласованности. Пусть параметр А предпочтительнее параметра В (обозначим как А > В), а параметр В предпочтительнее параметра С (В > С), следовательно, А предпочтительнее С (А > С). Нарушение последнего неравенства называется транзитивной несогласованностью.
Таким образом, для оценки однородности суждений эксперта необходимо использовать отклонение величины максимального собственного значения 1тах от порядка матрицы N. Однородность суждений оценивается индексом однородности (ИО) или отношением однородности (ОО) в соответствии со следующими выражениями:
ИО = (Атах - - 1); ОО = ИОМ(ИО).
где М(ИО) - среднее значение (математическое ожидание) индекса однородности случайным образом составленной матрицы парных сравнений, основанное на экспериментальных данных.
В качестве допустимого используется значение ОО < 0,10. Если для матрицы парных сравнений отношение однородности ОО > 0,10 то это свидетельствует о нарушении логичности суждений, допущенных при заполнении матрицы, поэтому эксперту предлагается пересмотреть данные, использованные для построения матрицы, чтобы улучшить однородность.
При согласованных парных сравнениях процедура построения функций принадлежности значительно упрощается. В этом случае матрица А обладает следующими свойствами:
• она обратно симметрична, т. е. элементы, симметричные относительно главной диагонали, связаны зависимостью аь- = Иап, I, j = 1, п;
• она транзитивна, т. е. ак * а^ = ау, I, j, к = 1, п .
Наличие этих свойств позволяет определить все элементы матрицы парных сравнений, если известно (п - 1) недиагональных элементов. Например, если известна к-тая строка, то произвольный элемент ау определяется так:
(4) ау = а^аы, I, у, к = 1, п.
После определения всех элементов матрицы парных сравнений, степени принадлежности нечеткого множества вычисляются по формуле:
(5) и (щ) =--------1--------, г = 1, п .
% + а2г + ... + апг
Таким образом, возможно рассчитать значения функции принадлежности не применяя трудоемких вычислительных процедур поиска собственных чисел и векторов.
3. Аналитическое построение функций принадлежности на основе априорной информации о нечетком множестве
Другой способ построения функций принадлежности основывается на обобщении знаний и опыта эксперта по отношению к характеристикам, определяющим кредитную историю заемщика.
Анализ терм-множества ^ е Т можно начать на основании субъективных причин и неформальных сведений о выбранном показателе просроченной задолженности и возможных ограничениях, накладываемых на область определения функции и(щ), которые задаются экспертом и согласуются с внутренними документами кредитной организации (при наличии таковых).
Естественным является также и требование непрерывности функции и(и), которое формализует представление о том, что если два элемента из множества V отличаются друг от друга лишь незначительно, то значения соответствующих функций принадлежности также близки.
Конкретный вид функции принадлежности определяется на основе различных дополнительных предположений о свойствах этой функции (симметричность, монотонность и т. д.) с учетом специфики имеющейся неопределенности [1].
Подобные предположения позволяют упростить процедуру построения функции принадлежности, в частности, выделить значения, при которых степень принадлежности элементов
и е V к рассматриваемому терм-множеству t е Т равна нулю и единице, т. е. найти область определения функции и(и).
Например, кредитную историю можно считать отрицательной, при отсутствии платежей за период в три месяца, т. е. и(и) = 1 при и е [3 месяца; срок кредита], t = «отрицательная». Результаты позволяют сделать следующий вывод: когда заемщик задерживает с выплатой по кредиту более чем на три месяца, его кредитная история относится к «отрицательной» категории.
Аналитическое представление дает возможность не применять трудоемкие вычислительные процедуры расчета степеней принадлежности. В качестве недостатков такого подхода можно отметить более низкую точность по сравнению с математическими методами и высокие требования, предъявляемые к квалификации эксперта.
Следует отметить, что важной составляющей предлагаемых подходов является непосредственное участие эксперта как при построении матрицы парных сравнений (см. таблицу 2), так и при выборе аналитической формы функции принадлежности.
Необходимость разработки унифицированной методологии особенно актуальна в случае отсутствия в финансово-кредитной организации нормативных документов, регламентирующих процесс определения качества кредитной истории физических лиц и порядок разрешения спорных ситуаций.
Рассмотренные методы позволяют получить математическую интерпретацию опыта эксперта, отражающего общую стратегию принятия решений по оценке кредитной истории.
Применение единой методологии на основе синтеза знаний высококвалифицированной группы экспертов необходимо для устранения субъективного влияния кредитных аналитиков, не обладающих достаточным опытом работы в сфере кредитования физических лиц, а также минимизации рисков от возможного злоупотребления служебным положением со стороны инсайдеров банковской организации.
4. Построение базы знаний
На практике процесс анализа кредитной истории представляет собой рассмотрение ряда показателей, применяемых для оценки исполнения обязательств заемщика по погашению задолженности. В зависимости от подхода, применяемого в кредитной организации, наиболее распространенными являются следующие характеристики: количество платежей, количество просроченных платежей, отношение общего просроченных платежей к сроку кредита и т. п.
При анализе кредитной истории рассуждения эксперта состоят в выборе нескольких параметров, оказывающих, по его мнению, наиболее сильное влияние на качество кредитной истории заемщика, на основании которых он составляет соответствующие заключения.
Для приведения задачи классификации кредитной истории к форме, позволяющей учитывать совокупное влияние показателей на принимаемое решение, целесообразно использовать понятие составной лингвистической переменной [1]. В этом случае процесс классификации разбивается на анализ взаимодействия ряда частей, которые будут включены в состав лингвистической переменной «кредитная история», что позволит сформировать зависимость результата от комбинаций элементов данной переменной.
Для задания подобных многомерных зависимостей строится набор условных правил нечеткого логического вывода вида ”Если «Набор условий», то «Вывод»” [9].
Нечеткая база знаний может быть представлена в следующем виде:
ЕСЛИ (х: = аид) И (Х2 = а2,1Д) И ... И (Хп = ап,к,1)
ИЛИ (Х1 = аи,2) И (Х2 = а2,1,2) И ... И (Хп = ап,к,2)
(6) ...
ИЛИ (Х1 = аг,к,р) И (Х2 = а2,к,р) И ... И (Хп = апХр),
ТО у = у
где аг к - нечеткий терм (немного, несколько, много и т. п.), которым оценивается лингвистическая переменная хг е X= 96
= (хь х2, ..., хп) (количество просроченных платежей, временной интервал задержки платежа и т. п.) в правиле под номеромр, г = 1,п , к = 1,q ,р = 1,1; у = (ёх, ё2, ..., - значения нечеткого
логического вывода у- («положительная», «приемлемая», «отрицательная» и т. п.), - = 1,т ; т - количество значений нечеткого логического вывода; п - количество лингвистических переменных; I - количество правил в базе знаний; q - количество нечетких термов, которыми оценивается лингвистическая переменная хг е X = = (хь х2, ., хп).
Система условных обозначений используется для отражения смысла применяемых математических преобразований.
Приведем простейший пример базы знаний, показывающей зависимость между количеством просроченных платежей (х) и возможностью оценки качества кредитной истории (у), как «отрицательная»:
(7) ЕСЛИ х = несколько, ТО у = низкая;
ЕСЛИ х = много, ТО у = высокая.
5. Классификация кредитной истории с
использованием нечетких моделей типа Мамдани
Применительно к процессу оценки кредитной истории при кредитовании физических лиц задача классификации состоит в определении качества выполнения заемщиком обязательств по выплате основного долга и процентов по ряду критериев, сформулированных кредитным экспертом.
Рассмотрим алгоритм Мамдани [10] как один из возможных вариантов решения поставленной задачи. В качестве основных этапов данного метода можно выделить следующую последовательность операций:
1. Построение нечеткой базы знаний.
2. Фаззификация входных параметров [10].
3. Определение результирующего нечеткого множества.
4. Дефаззификация.
Построение нечеткой базы знаний
Построение нечеткой базы знаний заключается в представлении опыта эксперта в виде определенного набора правил (6), отражающих процесс принятия решения в рассматриваемой области.
С помощью операций и (ИЛИ) и П (И) перепишем (6) в более компактном виде:
(8) и (
р=1Ч
Фаззификация входных параметров Фаззификацией, или введением нечеткости, называется процесс построения функций принадлежности для входных переменных системы нечеткого вывода хг е X = (хь х2, ..., хп) на основе соответствующих им терм-множеств аг,к,р.
Определение результирующего нечеткого множества На данном этапе происходит определение подмножеств, построение которых производится по всем нечетким логическим выводам для соответствующих правил из базы знаний.
Для дальнейшего рассмотрения алгоритма Мамдани введем следующие обозначения: ик,р(хг)- функция принадлежности
лингвистической переменной хг нечеткому терму аг,к,р; ий (у) -
функция принадлежности значения нечеткого логического вывода терму й-.
Степень принадлежности лингвистической переменной хг нечетким термам й- из базы знаний определяется следующей системой нечетких логических уравнений:
(9) и^ (Х)= ^ А[ик,р (хг )] - = 1 т .
-> р=1,1г=1,п
где V (а) - операция из 5-нормы (-нормы), т. е. из множества реализаций логической операций ИЛИ (И). Наиболее часто используются следующие реализации: для операции ИЛИ -нахождение максимума и для операции И - нахождение минимума.
і=1
і,к, р
т
Далее нечеткие подмножества, назначенные для каждой выходной переменной, объединяются вместе, чтобы сформировать одно результирующее нечеткое множество.
Нечеткое множество ~ , соответствующее вектору X, определяется следующим образом:
(10) y = agg (X imp — (X X Mdj (y)) / y),
j=1,m y
где imp - импликация, обычно реализуемая как операция нахождения минимума; agg - агрегирование нечетких множеств, которое наиболее часто реализуется операцией нахождения максимума.
Дефаззификация
Четкое значение у, соответствующее вектору X определяется в результате дефаззификации нечеткого множества ~ .
Наиболее часто применяется дефаззификация по методу центра тяжести:
X djVdj(X)
(П) у = ^------------—.
X —(X)
j=1,m
Физическим аналогом этой формулы является нахождение центра тяжести плоской фигуры, ограниченной осями координат и графиком функции принадлежности нечеткого множества ~ .
Таким образом, после выполнения нечеткого логического вывода статус кредитной истории определяется по максимальной степени принадлежности результата дефаззификации к оценкам качества выполнения обязательств по погашению задолженности, сформулированных экспертом в базе знаний.
Для иллюстрации работы метода рассмотрим пример нечеткого логического вывода по базе знаний (7) при значении входной переменной х = 4. В качестве зависимости, представляющей функцию принадлежности для нечеткого терма «несколько просроченных платежей» (рис. 1а), взяты рассчитанные
параметры нормализованного нечеткого множества из таблицы 3. Используя метод парных сравнений, аналогично была определена функция принадлежности для нечеткого терма «много просроченных платежей» (рис. 1в).
Треугольные функции принадлежности и(у) значений нечеткого логического вывода (возможность оценки качества кредитной истории как «отрицательная») термам «низкая» и «высокая» были выбраны на основе аналитического представления. Следует отметить, что подобная зависимость является простейшей и служит для демонстрации работы метода.
Исследование логики суждений, применяемых при формировании выводов, для каждого правила из базы знаний заключалось в определении характера поведения функции и(у) на интервале [0; 1]. В связи с этим численное увеличение принадлежности кредитной истории к «отрицательной» категории предполагает, что возможность оценить ее как «низкая» должна уменьшаться и, соответственно, возрастать при «высокой».
Данные функции и нечеткие логические выводы по правилам из базы знаний представлены на рис. 1 б и рис. 1 г.
Графическая интерпретация результатов заключается в выделении множества, полученного при отсечении и(у) на уровне значения функции принадлежности для входной переменной х = 4.
Следующим этапом решения задачи является агрегирование нечетких множеств по (10). Графически данный алгоритм заключается в выделении множества, ограниченного линиями функций, представляющих результаты нечетких логических выводов и имеющих наибольшее значение на всей области определения. Операция агрегирования методом нахождения максимума представлена на рис. 2.
а) Нечеткое множество «несколько» 6) Нечеткий вывод для правила №1
в) НеЧеТКОе МНОЖеСТВО {{МНОГО}}
г) Нечеткий вывод для правила №2
Рис.1. Нечеткие логические выводы по базе знаний
Координаты вершин полученной фигуры, определяют результирующее нечеткое множество в следующем виде: у ={0/0; 0,73/0; 0,73/0,267; 0,286/0,712; 0,286/1; 0/1}
Далее, применяя к нечеткому множеству у дефаззифика-цию методом центра тяжести (11), находится четкое значение у:
0*0 + 0*0.73 + 0.267*0.73+0.712*0.286+1*0.286+1*0 у=--------------------------------------------------= 0.392.
0 + 0.73+0.73 + 0.286+ 0.286+ 0
Результирующее нечеткое множество
Результаты позволяют сделать вывод о том, что полученная оценка характеризует кредитную историю заемщика, пропустившего четыре платежных периода, как имеющую «низкую» степень принадлежности к отрицательной категории.
Необходимо отметить, что в примере отражены общие подходы, используемые для решения поставленной задачи. Наиболее эффективное применение метода на этапе формирования базы знаний предполагает рассмотрение всех возможных комбинаций причинно-следственных связей между предпосылками модели и соответствующими им выводами.
Проведение подобного анализа для всего кредитного портфеля позволит разделить кредитные истории на категории с «положительной» и «отрицательной» оценкой качества выполнения заемщиками условий договора по погашению задолженности.
Для проверки достоверности результатов, полученных при использовании предлагаемого подхода, рассмотрим метод нечеткой классификации по сравнению с одним из распространенных способов многомерного статистического анализа (дискриминантный анализ [5]) на примере кредитного портфеля одного из коммерческих банков.
Оценка кредитных историй физических лиц была проведена по двум группам: «положительная» и «отрицательная».
В качестве элементов, входящих в первую категорию, были выбраны кредитные истории без просроченных платежей и с одной просрочкой, которая была погашена в десятидневный срок, количество - 3 289.
Вторая категория была сформирована по выборке из кредитных договоров, по которым для взыскания задолженности требовалось обращение в судебные органы, а также договора со сроком нахождения на просрочке свыше 180 дней, т. е. задолженность по которым классифицирована как «безнадежная» [7], количество - 637.
На основании традиционной практики, применяемой кредитными работниками в рассматриваемом банковском учреждении для оценки качества исполнения заемщиком обязательств по погашению задолженности, были сформулированы основные критерии, по которым осуществлялся анализ кредитной истории.
В качестве независимых переменных были выбраны следующие показатели:
• количество просрочек за весь срок пользования кредитом (Х1);
• максимальный срок недоплаты в днях (х2).
Зависимая переменная - оценка кредитной истории (у).
В связи с особенностями алгоритма Мамдани, требующего для своей работы наличие нечеткой базы знаний, был сформулирован свод правил, представляющих собой синтез знаний и опыта эксперта в сфере оценки кредитоспособности физических лиц.
Для построения базы знаний были использованы нечеткие термы, которыми в повседневной жизни для принятия оптимальных решений оперирует каждый человек.
Применяемая база знаний
1. ЕСЛИ XI = «много», ТО у = «отрицательная».
2. ЕСЛИ XI = «небольшое количество» И х2 = «небольшой»,
ТО у = «более-менее положительная».
3. ЕСЛИ XI = «небольшое количество» И
х2 = «совсем небольшой» ТО у = «положительная».
4. ЕСЛИ XI = «небольшое количество» И х2 = «большой», ТО у = «отрицательная».
5. ЕСЛИ х2 = «большой» ТО у = «отрицательная».
Результаты классификации представлены в таблице 4.
Таблица 4. Сравнительные оценки работы методов
Оценка кредитной истории Качество предска- зания (%) Коли- чество ошибок Минимальное значение оценки принадлежности к группе Максимальное значение оценки принадлежности к группе
Дискриминантный анализ (выполнен в среде 81ай8йса 6.0)
Положи- тельная 100 0 «1 «1
Отрица- тельная 74,72 161 0,52 1
Метод нечеткой классификации (выполнен в среде МаШаЬ 7.0.1)
Положи- тельная 100 0 0,91 0,94
Отрица- тельная 100 0 0,72 0,94
Результаты позволяют сделать вывод о недостаточной точности классификации кредитных историй, входящих в «отрицательную» категорию, методом дискриминантного анализа по сравнению с алгоритмом Мамдани.
Полученный диапазон оценки принадлежности значений к «отрицательной» группе (0,52-1) характеризует традиционный метод как позволяющий принимать заявки с высоким уровнем риска и, соответственно, оказывающий более сильное влияние на возможное снижение качества кредитного портфеля, чем предлагаемый.
Дальнейшее исследование предполагает выделение характеристик физических лиц, кредитная история которых попадает в «отрицательную» категорию, с целью создания «образа» потенциального должника и построение модели, позволяющей установить платежную дисциплину клиента, обратившегося за получением денежных средств.
Выводы
Показана возможность формального подхода к представлению задачи анализа кредитной истории физических лиц с использованием математического аппарата теории нечетких множеств. Рассмотрены методы построения функций
принадлежности и баз знаний с помощью составных лингвистических переменных, а также последующее применение нечетких логических выводов на их основе. Задачи, представленные в работе, интерпретированы в терминах известных методов нечетко-математического моделирования, что открывает широкое поле для их практического использования.
Литература
1. АЛТУНИН А. Е., СЕМУХИН М. В. Модели и алгоритмы принятия решений в нечетких условиях: Монография. Тюмень: Издательство Тюменского государственного университета, 2000. - 352 с.
2. ГАНТМАХЕР Ф. Р. Теория матриц. М.: Наука, 1966. -576 с.
3. ЕДРОНОВА В. Н., ХАСЯНОВА С. Ю. Модели анализа кредитоспособности заемщиков. М.: Финансы и кредит, 2002, № 6. С. 9-15.
4. ЗАДЕ Л. А. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. - 161 с.
5. КИМ ДЖ. О, МЬЮЛЛЕР Ч. У., КЛЕККА У. Р. И ДР. Факторный, дискриминантный и кластерный анализ. М.: Финансы и статистика, 1989. - 215 с.
6. КУЗНЕЦОВ Л. А. Применение нечетких моделей для решения задач управления качеством проката. Известия ВУЗОВ Черная металлургия, 2001, № 5. С. 61-65.
7. ПОЛОЖЕНИЕ ЦБ РФ от 26.03.2004 № 254-П. Положение о
порядке формирования кредитными организациями резервов на возможные потери по ссудам, по ссудной и приравненной к ней задолженности. [Электронный ресурс]:
http://www.bestpravo.ru/fed2004/data06/tex20171.htm.
8. СААТИ Т. Принятие решений. Метод анализа иерархий. М.: Радио и связь, 1993. - 316 с.
9. ЧЕРНОВ В. Г., ИЛЛАРИОНОВ А. В. Методика оценки кредитоспособности предприятий сферы малого бизнеса, основанная на нечеткомножественной математической модели. М.: Финансы и кредит, 2006, № 20. С. 72-78.
10. ШТОВБА С. Д. Введение в теорию нечетких множеств и нечеткую логику. [Электронный ресурс]: http://matlab.exponenta.ru/fuzzylogic/book1.
11. ALTMAN E. I., AVERY, R. B., EISENBEIS, R. A., SINKEY J. Application of Classification Techniques in Business, Banking and Finance. JAI Press, Greenwich, CT, 8 (1981). P. XX-418.
12. JONSON R. W., THOMAS L. C., CROOK J. N. AND EDELMAN D. B. Legal, Social and Economic Issues Implementing Scoring in the US. Credit Scoring and Credit Control, Oxford University Press, Oxford, 1992. P. 19-32.
Статья представлена к публикации членом редакционной коллегии Ф. Т. Алескеровым.