Научная статья на тему 'Статистические методы оценки кредитоспособности'

Статистические методы оценки кредитоспособности Текст научной статьи по специальности «Экономика и бизнес»

CC BY
1118
104
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Фот Н. П.

В статье рассматривается возможность применения методов многомерного статистического анализа при оценке кредитоспособности заемщиков коммерческих банков. Также проведен анализ применения ряда рассмотренных методов к известным кредитным историям.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Статистические методы оценки кредитоспособности»

Фот Н.П.

ГОУ ВПО «Оренбургский государственный университет»

СТАТИСТИЧЕСКИЕ МЕТОДЫ ОЦЕНКИ КРЕДИТОСПОСОБНОСТИ

В статье рассматривается возможность применения методов многомерного статистического анализа при оценке кредитоспособности заемщиков коммерческих банков. Также проведен анализ применения ряда рассмотренных методов к известным кредитным историям.

Оценке кредитоспособности заемщиков коммерческих банков сопутствует явное противоречие: с одной стороны кредитный отдел не способен рассматривать каждую заявку индивидуально ввиду большой трудоемкости и длительности процесса, с другой - есть необходимость увеличения количества и объема выдаваемых кредитов. Одним из путей разрешения данного противоречия является ско-ринг-кредитование, получившее в последнее время большую популярность в крупных кредитных организациях. Скоринг-кредитование позволяет исключить риск влияния субъективного мнения менеджера на принятие решения о выдаче кредита, значительно упрощает процесс кредитования, способствует дальнейшему наращиванию объемов кредитования [4].

Скоринг-модель обладает такими ключевых преимуществами, как:

1) Сокращение сроков принятия решения о предоставлении кредита. Увеличение числа и скорости обработки заявок за счет минимизации документооборота при выдаче кредита частным клиентам;

2) Эффективная оценка и постоянный контроль уровня рисков конкретного заемщика;

3) Снижение влияния субъективных факторов при принятии решения о предоставлении кредита. Обеспечение объективности в оценке заявок кредитными инспекторами во всех филиалах и отделениях банка;

4) Оценка и управление риском портфеля кредитов частным лицам банка в целом, включая его отделения. Учет уровня доходности и риска кредитного портфеля при определении параметров новых кредитов.

В основе математической модели скоринга, предложенной зарубежными представителями банковской деятельности, заложены методы прогнозирования поведения заемщика на основе имеющейся обширной статистики. Однако при использование зару-

бежных данных в разработке скоринг-моде-ли для отечественных кредитных организаций возникает проблема, связанная с отсутствием достаточного количества достоверных кредитных историй (вследствие кратковременности работы отечественных организаций на рынке банковских услуг).

Методология решения базируется на анализе специфики деятельности банка. При этом учитываются как группы клиентов (отраслевая и региональная принадлежность и др.), так и кредитные продукты банка для физических лиц. Исходя из потребностей банка в развитии бизнеса и имеющихся данных, могут быть построены скоринг-модели, основанные на экспертных знаниях банковского менеджмента, на статистических данных (модели обучения «с учителем» и «без учителя»), на учете макроэкономических данных о социально-экономическом развитии конкретных регионов и отраслей. Наиболее мощными по точности оценки кредитного риска являются модели, использующие комплексный подход, т.е. учет всех данных и экспертных знаний менеджмента банка [4].

При построении скоринг-моделей используют три основных варианта. Первый - это настройка модели под профиль некоего целевого клиента, второй— приобретение уже готовой модели, списанной с другой страны (однако здесь банку придется оттачивать требования к заемщикам на основе собственного опыта использования этой модели) и третий

- создание собственной модели, настроенной на индивидуальные особенности банка.

Третий вариант зачастую используют мощные банки, выходящие на рынок с новыми продуктами. Для этого на первом этапе от применения скоринга отказываются в принципе, давая кредиты всем желающим. Банк устраивает клиентам лишь стандартный security check, чтобы отсечь мошенни-

ков. Набрав историю по паре тысяч дефолтов, банк может приступать к разработке своей скоринговой модели, причем такой подход выливается в достаточно крупные денежные затраты (так, при средней сумме кредита в5-10 тыс. долларов цена опыта составит порядка 10-20 млн. долларов) [4].

В данной работе, посвященной разработке универсального алгоритма оценки кредитоспособности заемщиков в кредитных организациях, проведен анализ совместного использования методов многомерного статистического анализа и методов непараметрической статистики на базе известных 1209 кредитных историй одного из банков Оренбургской области, с последующим выявлением факторов влияния и оценки влияния на показатели кредитоспособности.

На первом этапе исследования, посредством методов кластерного анализа, проведена классификация всех имеющихся кредитных историй.

Под классификацией мы подразумеваем разделение рассматриваемой совокупности объектов на однородные в определенном смысле группы. В общем случае понятие однородности объекта определяется правилом задания вычисления величины рй, характеризующей либо расстояние^О^О^) между объектамиО, и 0;, либо степень близости (сходства) г(0,,0)). Если задана функция ф,оД то близкие в смысле этой метрики объекты считаются однородными, принадлежащими одному классу (2). .

В качестве метрики между объектами также выбирается обычное Евклидово расстояние, а между группами объектов - расстояние, вычисленное по принципу «ближайшего соседа»:

Р (1)

Однако ряд показателей, представляемых в анкетах банков, не имеют количественной оценки (пол, возраст, образование и т.п.), и поэтому использование обычных метрик при вычислении расстояний между объектами, предусмотренных в методах классификации «без учителя» (кластерном анализе), будет неправильным. В этой связи, представляется возможным 2 подхода: исключение качествен-

ных показателей из рассмотрения и проведение классификации только по количественным признакам или применение вида расстояния, предложенного Б.А. Лагошей [3].

В первом подходе предлагается рассмотреть отдельно качественные и количественные признаки объектов, а потом на их основе построить выпуклую линейную комбинацию.

Высчитывается коэффициент связности сй, учитывающий одновременно качественные и количественные признаки, по формуле:

п - п, _ п, _

С.. =--С- +-СУ----------У-У

пп

(2)

где п - общее число признаков;

п1 - число количественных из них; сч; ~ - коэффициенты связности, обусловленные качественными и количественными признаками, при этом больший вес получают те признаки, количество которых больше.

Использование данного метода позволяет всесторонне оценить кредитоспособность заемщиков, учитывая разную физическую природу идентифицируемых показателей, однако, его использование возможно только при разработке соответствующего программного обеспечения, реализации которого нет ни в одном из разработанных статистических модулей.

Во втором подходе - при исключении качественных показателей, как правило, пользуются агломеративными методами кластерного анализа [2].

На базе известных кредитных историй, с целью определения количества классов заемщиков банка, автором была произведена классификация агломеративными методами кластерного анализа заемщиков по 11 социально-экономическим признакам (результаты представлены в таблице 1) и выявлены 4 социально-экономических класса. В таблице 2 представлены средние значения показателей для каждого класса.

В результате анализа данных были выявлены некоторые особенности представителей каждого класса. Первый класс преимущественно составляют женатые мужчины в возрасте 25-30 лет, имеющие высшее или неоконченное высшее образование, с высоким уровнем доходов. В кредит берут суммы,

Таблица 1. Количественное распределение кредитных историй по классам

Номер класса Количество кредитных дел Количество должников Процент невозврата (в процентах)

класс 1 76 8 10,67

класс 2 420 78 18,62

класс 3 378 13 3,45

класс 4 322 19 5,92

Таблица 2. Средние значения показателей каждого класса

Показатель Класс 1 Класс 2 Класс 3 Класс 4

Сумма кредита, руб. 333167,1 92503,64 101076,1 116063,5

Процентная ставка, % 16,58 19,35 14,72 15,1

Срок кредита, мес. 44,79 33,74 45,27 48,33

Сумма поручительств, руб. 498216,1 138292,7 92645,51 152595,6

Сумма залога, руб. 170680,7 1976,88 19017,46 19230,8

превышающие среднюю величину, под высокий процент.

Холостые мужчины в возрасте 35-45 лет, имеющие среднее образование с небольшим совокупным доходом, берущие в кредит небольшие суммы на небольшой период и под высокую процентную ставку, а также не имеющие поручителей и не предоставляющие имущество под залог, составляют второй класс.

Третий класс в равной степени состоит как из мужчин, так и из женщин со среднеспециальным образованием, имеющих семью и не высокий уровень совокупного дохода. В кредит берут небольшую сумму, под низкий процент на длительный срок, имеют одного поручителя.

И четвертый класс - в основном состоит из одиноких женщин в возрасте 45-50 лет, имеющих средне-специальное образование, невысокий уровень дохода. В кредит берут небольшие суммы под низкую процентную ставку, на длительный период.

Учитывая опыт зарубежных банков, достаточно весомыми при решении о выдаче кредита являются такие показатели, как образование, возраст, пол и т.п. (например, в

Германии приоритет при получении кредита имеют пенсионеры). Выявление таких признаков для отечественных представителей кредитных организаций было проведено методами непараметрического корреляционного анализа (ранговой корреляции), в частности, с использованием коэффициентов ранговой корреляции Спирмэна и Кендалла [1].

Коэффициент корреляции Спирмэна служит показателем степени тесноты связи и направления связи между ранжировками Х(к) = (х(к),х2к),...,хПк))т и хи) = (х('),х(2'),...,хП'))т между признаками k и ]:

6 П 2

т% = 1 -^-X(х(к) -х(й) . (3)

п - п 1=1

Для совпадающих ранжировок (т.е. при х*к) = х(') 1 = 1,..п) т <!!)ч = 1, а для противоположных (т.е. при х(к) = п - х(+) 1 = 1,..п) - т % = -1.

Во всех остальных случаях | т| < 1.

Другой широко используемой характеристикой является ранговый коэффициент корреляции Кендалла т (К)Ч между признаками х(к) и х0), вычисляемый по формуле:

,К, , 4v<x^■>,x^»)

т '=1 - п(п -1) • (4)

где v<x(k),x(J)) - минимальное число обменов соседних элементов последовательности х0) ( х(к) ), необходимых для приведения ее к упорядочению х(к) (хи)).

Аналогично, при совпадающих ранжировках (т.е. при х(к) = хш) т (К)Ч = 1 (так как v<x(k),x(J)) = 0), а при противоположных ранжировках (т.е. при х(к) = п - х(+)) т (К)к, =-1 (так

как v<х(k),x(J)) = 1 п(п -1)), во всех остальных

случаях - | г(К)ч < 1.

В программном продукте «81аИ8Иса 6.0» были вычислены значения ранговых коэффициентов Спирмена и Кендала между показателем «статус заемщика» (данному показателю присваивалось значение «1», если заемщик имеет задолженность и «0», если ее нет) и показателями, являющиеся неколичественными (такие как, пол, образование и т.п.). Необходимо отметить, что данный программный продукт позволяет сразу проверить значимость полученных коэффициентов - дополнительно вычисляется вероятность при-

нятия гипотезы о значимости коэффициентов, при этом значимые показатели выделяются на экране красным.

Причиной для отказа в выдаче кредита заемщику - мужчине, отнесенного после предварительной классификации в первый класс, может являться взятие кредита на короткий срок и под высокую процентную ставку.

При отнесении потенциального заемщика во второй класс банк принимает на себя меньший риск при выдаче кредита людям среднего и пожилого возраста, имеющим семью.

При оценке кредитоспособности заемщика, отнесенного к третьему классу, менеджер должен отдавать предпочтение людям, имеющим высшее или неоконченное высшее образование, берущим кредит на длительный период и имеющим два и более поручителей.

В четвертом классе также, как и для первого класса, в невыигрышном положении оказываются заемщики, берущие кредит под высокую процентную ставку на короткий срок.

Однако даже совместное применение методов кластерного анализа и ранговой корреляции позволяют только выделить количество классов и сделать выводы о социальном статусе заемщиков, а граница между полученными классами носит формальный характер. В связи с этим, на следующем этапе исследования были использованы методы дискриминантного анализа, что позволило определить численное значение параметра, выполняющего роль границы между выделенными классами.

Основной принцип классификации в дискриминантном анализе заключается в следующем: объект следует отнести к тому классу (т.е. к той генеральной совокупности), в рамках которого он выглядит более правдоподобным [1].

Ключевым является понятие процедуры классификации (решающее правило дискриминантной функции) 5(х). Данная функция может принимать только целые положительные числа от 1 до к, причем те значения х, при которых она принимает значение, равное ., относятся к классу . т.е. SJ ={х: 8(х) = ^}. SJ - это п-мерные области в пространстве Р(х) возможных значений анализируемого признака х, причем 5(х) строится таким образом, чтобь^ +... + Sk запол-

няли все пространство Р(х) и чтобы они попарно не пересекались.

Процедура классификации называется оптимальной (байесовской), если она сопровождается минимальными потерями среди всех других процедур классификации. Процедура классификации, при которой потери будут минимальными, определяется следующим образом:

^пт =|х: ^lІЁ,пifI<x)c<J/1) = тш^ (5)

Т.е. объект ху (у=1...К) будет отнесен к классу . тогда, когда средние удельные потери от его отнесения в этот класс окажутся минимальными по сравнению с потерями при отнесении этого объекта в любой другой класс.

В случае равных потерь правило классификации приобретает более простой вид. Наблюдение ху будет отнесено к классу . тогда, когда

^(0 = тах , (6)

т.е. максимизируется взвешенная правдоподобность этого наблюдения в рамках класса, где в качестве весов выступают априорные вероятности п..

В вышеприведенных отношениях задаются лишь теоретически оптимальные классификации. Для их реализации необходимо знание априорных вероятностей п1,...,п к и знание распределения в каждом классе, т.е. ^ (x),...,fk(x).

На практике решение этой задачи осуществляется при замене теоретических характеристик соответствующими оценками, построенными на базе обучающих выборок.

Априорные вероятности п. оценивается следующим образом:

Таблица 3. Показатели, выявленные

посредством методов ранговой корреляции

№ класса Значимые показатели

1 пол, процентная ставка, срок кредита в месяцах

2 семейное положение, возраст

3 образование, срок кредита, число поручителей

4 пол, процентная ставка, срок кредита в месяцах

п=

, п б = п, +... + п.

п ’ общ 1 к

общ

(7)

Правило классификации в случае к=2 заключается в следующем: наблюдение х

относится к классу J0 ^

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

f• (хп. -

или 1п.—^ > 1п—1- V. = 1..к

f• (х,,) п • —

•о ^ > —-V. = 1..к

•х v) п

f• (х v) п •

Л ^ •о

В случае нормальных плотностей Г (х),

т.е. Г (х) =

д/(2п)°

=ехр

- 2(х - aJ)т х-1(х - aJ)

соотношение эквивалентно следующему:

1 ^т п

-2(о -• £-1((о -•>1пп1 (8)

Данное соотношение задает вид дискриминантной функции в задаче различения нормальных классов при постоянных значениях потерь от неправильной классификации. Если обучающие выборки одинакового объема, то соотношение можно представить в следующем виде:

^-2(о -• £-1(аь -• >0 (9)

\ /

При выполнении этого соотношения объект х v следует отнести к классу

Лт

V

, то

(10)

Если обозначить £-1(a• - а- )В =

N •0 • '

получают соотношение

х в>1 (в+атв)b1x1v +

и 2 ^ •о • ’ 1 ^

+ Ь2х2v > 2 + Ь2а2•о )+ Ми + Ь2а2• )],

где Ь1 ,Ь 2 - коэффициенты дискриминантной функции.

В двухмерном случае дискриминантная линейная функция - это прямая, по одну сторону от которой лежат объекты, принадлежащие одному классу, по другую - объекты, принадлежащие другому классу. Эта прямая задается уравнением

Г = С, (11)

где Г = Ь^ + Ь 2 х, С = - (С1 + С 2), С1 = Г (aJ0), С2 = г (aJ). 2

Оценка ковариационной матрицы определяется следующим образом:

Х = -

1

N - к

+ (П 2 - 1)^ 2 + + (Пк - 1)^ к ], (12)

где N = п + п 2 + К + пк;

к - число классов или обучающих выборок;

п - объем •-й обучающей выборки;

X • - оценка ковариационной матрицы, найденной по .-й обучающей выборке.

Для первого класса, выделенного методами кластерного анализа, были сформированы обучающие выборки (все заемщики разделены на 2 класса - должники и вовремя уплатившие заемщики). С помощью «81аИ8Иса 6.0» для него получены следующие значения дискриминантных функций:

Г1 (зЬ, зк, зр, sz) = -3,183 + 0,849зЬ -- 0,055зк + 1,443зр + 0,218sz Г.1 (зЬ, зк, зр, sz) = -3,968 - 1,0ШЬ +

+ 0,649зк + 1,603зр - 1,061sz

(13)

' 4,302 4 ' 5.695 '

- 31,262 Ь1 = - 30,063

54,08 Ь = 51,765

25,799 24,209

Ь1 =

Ь^хк + ЬZxk > 111,25

(14)

где 8Ъ - совокупный баланс; 8к - сумма кредита; 8р - сумма поручительств;

sz - сумма залога; Ь ,Ьz- коэффициенты дискриминантной функции

Полученные результаты применения дискриминантного анализа позволили определить количественную границу первого класса. То есть, при классификации нового заемщика его стоит отнести к первому выделенному классу, если выполняется следующее неравенство:

Ь^хк + bZxk > 111,25 (15)

Здесь необходимо добавить, что на предварительном этапе применения дискриминантного анализа было проверено соблюдение условия о законе распределения всех рассмотренных значений показателей. Установлено, что все количественные показатели, используемые для анализа, имеют нормальный закон распределения.

Аналогичным образом определяются значения для всех классов.

1

v

Для каждого класса должно выполнятся условие:

- для второго: ЬХ + ЬХ > 0,424 (16)

- для третьего: ЬХ + ЬХ > 3,076 (17)

- для четвертого: ЬХ + ЬХ > 4,027 (18)

Общие выводы

1. Совместное применение методов многомерного статистического анализа при оценке кредитоспособности потенциального заемщика позволяет подбирать наиболее

приемлемые условия кредита как для заемщика, так и для банка, уменьшая тем самым общий кредитный риск банка.

2. Предложенные методы могут быть реализованы при разработке соответствующего программного обеспечения индивидуально для каждой кредитной организации, в соответствии со спецификой его деятельности и возможностью выбора наиболее важных с этой точки зрения показателей, удобным интерфейсом.

Список использованной литературы:

1. Айвазян, С.А. Прикладная статистика и основы эконометрики: учебник для вузов / С. А. Айвазян, В. С. Мхитарян. -М.: ЮНИТИ, 1998. - 1022 с.

2. Дубров, А.М. Многомерные статистические методы / А.М. Дубров, В. С. Мхитарян, Л. И. Трошин - М.: Финансы и статистика, 2000. - 152с.

3. Лагоша, Б.А. Оптимальное управление в экономике : учеб. пособие для вузов / Б.А. Лагоша. - М.: Финансы и статистика, 2003. - 192 с.

4. Скоринг- оценка заемщиков - физических лиц. [Электронный ресурс]. - Режим доступа: http://www.consumer1end1ng.ru/ products/App11cat1onScor1ng/MacroScor1ng/methodo1ogy/scor1ng/ - Загл. с экрана.

Статья рекомендована к публикации

i Надоели баннеры? Вы всегда можете отключить рекламу.