Научная статья на тему 'Компьютерная технология классификации банков банковского сектора России'

Компьютерная технология классификации банков банковского сектора России Текст научной статьи по специальности «Экономика и бизнес»

CC BY
41
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
МЕТОД ГЛАВНЫХ КОМПОНЕНТ / METHOD OF PRINCIPAL COMPONENTS / КЛАСТЕРНЫЙ АНАЛИЗ / CLUSTER ANALYSIS / КОМПАКТНОСТЬ КЛАСТЕРОВ / COMPACT CLUSTERS / МЕТОД K-СРЕДНИХ / K-MEANS METHOD / CH-ИНДЕКС КЛАСТЕРИЗАЦИИ / CLUSTERING TECHNIQUES / МЕТОДЫ КЛАСТЕРИЗАЦИИ / ДИСКРИМИНАНТНЫЙ АНАЛИЗ / DISCRIMINANT ANALYSIS / ОБУЧАЮЩАЯ ВЫБОРКА / CH-CLUSTERING INDEX / LEARNING SET

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Банников Валерий Аркадьевич

Цель. Описать компьютерную технологию классификации банков России с целью последующего ее использования для разработки финансовой стратегии развития на основе ранжирования банков, их классификации и на основе построения сценариев развития для краткосрочного и среднесрочного прогнозирования. Материалы и методы. В статье представлена компьютерная технология классификации участников банковского сектора России с применением эконометрического пакета программ Stata методом кластерного анализа k -средних. Анализ проведен с использованием выборки по 11 показателям деятельности 740 российских банков в 2008-2013 гг. Результаты. В соответствии с разработанным автором алгоритмом на основе показателя «размер банка» проведена классификация банков России и выделены 10 групп наблюдений, или кластеров. Для определения числа кластеров использовался CH -индекс кластеризации. Из каждого кластера для исследования функционирования выбраны сходные по величине в кластере банко-годы, а затем с целью изучения динамики рыночной конъюнктуры банков и динамики их переходов в кластерах проведены сравнения переходов из одного кластера в другой по годам. По результатам кластеризации построена обучающая выборка, предназначенная для дальнейшего применения дискриминантного анализа с целью оценки прогностических вероятностей принадлежности новых банко-годов каждому из 10 кластеров и построения сценариев развития для финансовой стратегии банковского сектора России.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Computer technology for bank classification in the Russian banking sector

Aim. This study describes computer technology for bank classification in Russia, aiming at its subsequent use for developing financial strategies based on the ranking of banks, and presents a bank classification system based on constructing scenarios for short-term and mediumterm forecasting. Materials and methods. This study employs the kmeans method of cluster analysis and an econometric software package (Stata) to present a computer technology for bank classification in Russia. A sample of 11 indicators of the 740 Russian banks in 2008-2013 was employed to conduct the analysis. Results. Based on an algorithm developed by the author according to the “size of bank” indicator, banks were classified and subdivided into 10 groups or clusters. CH-clustering index was employed to determine the number of clusters. From each cluster, bank years that were comparable in volume for the given cluster were selected to examine the functioning of banks. Then, transitions were compared year-by-year to examine the dynamics of banks’ market situation and their transition from one cluster to another. According to the results of the clustering, a learning set was designed for further applications of discriminant analysis to assess the probability for future bank years to belong to one of the 10 clusters and to develop scenarios for creating a financial strategy for the Russian banking sector.

Текст научной работы на тему «Компьютерная технология классификации банков банковского сектора России»

со s

с; <

i <

.о i

Компьютерная технология классификации банков банковского сектора России

Computer Technology for Bank Classification in the Russian Banking Sector

УДК 336.7:004

Ш

О ^

О ш т

ш

I-<

Банников Валерий Аркадьевич

доцент Московской школы экономики Московского государственного университета им. М. В. Ломоносова, кандидат физико-математических наук, доцент 119991, Москва, Ленинские горы, д. 1, стр. 61

Bannikov Valeriy Arkad'evich

Moscow State University's Moscow School of Economics

Leninskie gory 1/6, Moscow, Russian Federation, 119991

Цель. Описать компьютерную технологию классификации банков России с целью последующего ее использования для разработки финансовой стратегии развития на основе ранжирования банков, их классификации и на основе построения сценариев развития для краткосрочного и среднесрочного прогнозирования.

Материалы и методы. В статье представлена компьютерная технология классификации участников банковского сектора России с применением эконометрического пакета программ Stata методом кластерного анализа ^-средних. Анализ проведен с использованием выборки по 11 показателям деятельности 740 российских банков в 2008-2013 гг.

Результаты. В соответствии с разработанным автором алгоритмом на основе показателя «размер банка» проведена классификация банков России и выделены 10 групп наблюдений, или кластеров. Для определения числа кластеров использовался CH-индекс кластеризации. Из каждого кластера для исследования функционирования выбраны сходные по величине в кластере банко-годы, а затем с целью изучения динамики рыночной конъюнктуры банков и динамики их переходов в кластерах проведены сравнения переходов из одного кластера в другой по годам.

По результатам кластеризации построена обучающая выборка, предназначенная для дальнейшего применения дискриминантного анализа с целью оценки прогностических вероятностей принадлежности новых банко-годов каждому из 10 кластеров и построения сценариев развития для финансовой стратегии банковского сектора России.

Ключевые слова: метод главных компонент, кластерный анализ, компактность кластеров, метод ^-средних, CH-индекс кластеризации, методы кластеризации, дискриминантный анализ, обучающая выборка

Aim. This study describes computer technology for bank classification in Russia, aiming at its subsequent use for developing financial strategies based on the ranking of banks, and presents a bank classification system based on constructing scenarios for short-term and medium-term forecasting.

Materials and methods. This study employs the k-means method of cluster analysis and an econometric software package (Stata) to present a computer technology for bank classification in Russia. A sample of 11 indicators of the 740 Russian banks in 2008-2013 was employed to conduct the analysis.

Results. Based on an algorithm developed by the author according to the "size of bank" indicator, banks were classified and subdivided into 10 groups or clus-

ters. CH-clustering index was employed to determine the number of clusters.

From each cluster, bank years that were comparable in volume for the given cluster were selected to examine the functioning of banks. Then, transitions were compared year-by-year to examine the dynamics of banks' market situation and their transition from one cluster to another.

According to the results of the clustering, a learning set was designed for further applications of discriminant analysis to assess the probability for future bank years to belong to one of the 10 clusters and to develop scenarios for creating a financial strategy for the Russian banking sector.

Keywords: method of principal components, cluster analysis, compact clusters, fc-means method, CH-clus-tering index, clustering techniques, discriminant analysis, learning set

1. Введение

В исследовании финансовой стратегии того или иного сектора экономики в настоящее время все шире применяются компьютерные технологии эконометрики и математические методы. При написании данной статьи использовались компьютерные технологии с применением эконометрического пакета программ Stata, задействованного в обучении студентов магистратуры по программам I и II курсов в Московской школе экономики МГУ.

В нашем исследовании была проанализирована выборка данных о деятельности 740 российских банков в 2008-2013 гг. Все финансовые показатели имеют одни и те же единицы измерения (тыс. руб. в сопоставимых ценах 2007 г.), рассчитанные с помощью дефлятора, используя значения базового индекса инфляции Росстата. Совокупность 11 исходных показателей выбрана на основе баланса банка.

Ниже приводится список финансово-экономических показателей (переменных) деятельности банков, которые были выбраны нами в качестве исходных показателей для свертки информации методом главных компонент и применения кластерного анализа.

Код переменной

1. assets — активы банка, всего.

2. corp_credit — портфель кредитов банка корпоративным клиентам, включая просроченную задолженность.

3. ret_credit — портфель кредитов банка физическим лицам, включая просроченную задолженность.

4. corp_deposit — объем депозитов корпоративных клиентов банка.

5. ret_deposit — объем депозитов физических лиц.

6. provis_income — доходы банка от восстановления резервов.

7. nperc_income — чистые процентные доходы банка.

8. сошт1з_п1псоше — чистые комиссионные доходы банка.

9. о"ЬЬег_п1псоше — чистые прочие доходы банка.

10. орег_ехрепзеэ — операционные расходы банка.

11. регс_ехрепзеэ — процентные расходы банка.

В результате применения компьютерной технологии свертки информации методом главных компонент в первом приближении была вычислена первая главная компонента, условно названная «размер банка», которая объясняет 97,18% информации, содержащейся в совокупности всех 11 исходных показателей, что является оценкой свертки информации высокого качества.

В настоящей статье описана компьютерная технология кластерного анализа в первом приближении классификации банков России (разделение на кластеры (группы) банков) на основе первой главной компоненты. Первая главная компонента представляет собой обобщенный показатель, синтезирующий разносторонние особенности функционирования банковского сектора, которые измеряются совокупностью выбранных исходных показателей. Она была использована для ранжирования банков.

Применяемый метод классификации (кластерный анализ) предназначен для определения «естественных» кластеров наблюдений. В нашем случае наблюдение представляется «банко-годом» — результатами функционирования банка в соответствующем году. Мы идентифицируем число кластеров и их состав в виде «подобных (похожих) по размеру» банко-годов.

Процесс разбиения множества наблюдений на кластеры, т. е. процесс кластеризации, реализуется таким образом, чтобы значения первой главной компоненты по наблюдениям внутри кластеров были максимально близкими (свойство компактности кластеров), а значения первой главной компоненты по наблюдениям в разных кластерах имели бы максимальные различия (свойство отделяемости кластеров друг от друга).

Сначала в выбранном диапазоне изменения числа кластеров мы реализуем алгоритм кластерного анализа последовательным применением метода ^-средних с вычислением значений СН-индекса кластеризации. Затем по правилу остановки на основе максимального значения СН-индекса определим оптимальное «естественное» число кластеров и выберем для него полученное в процессе кластеризации решение. Далее мы представим характеристики полученных кластеров в порядке убывания значений первой главной компоненты, «размера банков», по годам с 2008-го по 2013 г. Из каждого кластера выберем для сравнения несколько «типичных по размеру» банко-годов с целью изучения рыночной конъюнктуры «типичных по размеру» в кластерах банко-годов. Для получения некоторого визуального представления о «размере банка» в динамике для нескольких банков построим объединенные графики значений для первой главной компоненты и для пяти выбранных наиболее важных переменных по 6 годам.

2. Кластерный анализ

Кластерный анализ относится к методам классификации без обучения. Методы кластерного анализа предназначены для определения «естественных» кластеров (групп) наблюдений. Кластеризация — это процесс разбиения множества наблюдений в многомерном пространстве переменных на кластеры таким образом,

чтобы значения переменных по наблюдениям внутри ™ одного и того же кластера были максимально близ- ^ кими (свойство компактности кластеров), а значения ^ переменных по наблюдениям в разных кластерах име- >х ли бы максимальные различия (свойство разделения ^ (отделимости) кластеров) [1, р. 708]. 2

В кластерном анализе отсутствует понятие «р-зна- £ чения», присутствующее во многих областях экономе- ^ трики, в моделировании и прогнозировании. Поэтому ш он рассматривается как исследовательская методика ^ анализа данных. Методы кластеризации в значитель- < ной степени предназначены для генерирования гипо- о тез, а не их тестирования. ^

Существует большое количество различных ме- ш тодов кластерного анализа. Первым основным по- о нятием в кластерном анализе является расстояние ^ между наблюдениями, вторым — расстояние между о кластерами наблюдений. о

В большинстве методов кластерного анализа для ^ определения сходства или различия между наблюде- ^ ниями применяются разнообразные меры расстояния. 2 Многие из применяемых в кластерном анализе мер не ^ удовлетворяют определению функции метрического 2 расстояния, и поэтому вместо расстояния употребляются общие термины «мера различия» и «мера сходства».

Существует бесконечное количество мер сходства и мер различия. В нашем случае классификации банков мы будем применять только функции расстояния й(х¡, х¡) между наблюдениями х1 и хОпределение функции расстояния (метрики) см., н апример, у Б. Дю-рана и П. Оделла [2].

В кластерном анализе могут быть минимальные, максимальные и средние расстояния между кластерами наблюдений (или расстояния ближнего, дальнего и среднего соседа соответственно [3]). Они вычисляются путем перебора всех возможных расстояний между всеми возможными парами двух наблюдений из каждых двух разных кластеров. Затем в зависимости от выбора расстояния между двумя кластерами в кластеризации определятся либо минимальное, либо максимальное, либо среднее расстояние в совокупности всех расстояний между всеми возможными парами двух наблюдений из каждых двух разных кластеров. При этом такие методы кластеризации называются односвязными, среднесвязными или полносвязными методами кластеризации соответственно. В нашем случае классификации банков мы используем диви-зивный (разделяющий) метод кластеризации — метод ^-средних.

Возможно, что в случаях исходных данных, преобразованных данных и/или отбора переменных можно заранее определить «естественное» известное число кластеров, на которые разбиваются данные. Его можно сделать правилом остановки, т. е. выбором числа кластеров, что на практике случается достаточно редко.

3. СН-индекс кластеризации для выбора числа кластеров

В нашем случае классификации банков число кластеров неизвестно. Для того чтобы определить их, используются различные индексы, которые называются индексами кластеризации [4, р. 637; 5, р. 321; 6]. В литературе рассматриваются различные индексы кластеризации, которые приводят к правилу остановки, определяющему число кластеров. Наиболее часто на практике используется СН-индекс Калинского — Ха-

ребеза [7], подпрограмма которого для проведения кластерного анализа предоставлена в пакете Б1а1а. СН-индекс (псевдо-Р-индекс Калинского — Харебеза) для k кластеров и N наблюдений имеет следующий вид:

о х о

CH index =

tr (S

between

)/(k -1)

tr (S within )/(N - k)

(1)

где ^ обозначает след матрицы, ^ (БЬа ) — след мат рицы межкластерной суммы квадратов и произведений расстояний (измерение среднего разделения (отделимости) кластеров):

о

tr (S

i=i

[d(c1 - c)]2

(2)

где п. — количество наблюдений в кластере ], - с) — функция расстояния между центром кластера с. и центром наблюдений с, 1г №шНЫп) — след матрицы внутрикластерной суммы квадратов и перекрестных произведений расстояний (измерение средней компактности кластеров):

tr(Swithin) = £ £[d(xt - Ci)]2, j=1 i=1

(3)

где й(х1 - с1) — функция расстояния между наблюден ием х1 и центром кластера с.

CH-индекс является глобальным, а не локальным, поскольку используется информация кластеризации только для заданного числа кластеров, и его применение возможно для любого метода кластеризации со сравнением числа кластеров для одного и того же метода в одном и том же пространстве переменных. Большие значения ОТ-индекса показывают более отчетливую структуру кластеров, а малые — менее ясно определенную структуру кластеров. Выбор числа кластеров проводится с помощью сравнения значений ОТ-индекса. Выбор его наибольшего значения приводит к выбору числа кластеров.

Следует отметить, что ОТ-индекс приводит к некорректной оценке проведенной кластеризации в условиях зашумленности исходных данных, а также в значительно меньшей степени в условиях, когда совокупность исходных данных имеет скошенные (ассиметричные) плотности распределений. Например, известно, что в экспериментах моделирования методами Монте-Карло ОТ-индекс обнаруживает некорректность всего лишь при 5%-ной зашумленности пространства значений переменных. В нашем случае кластеризации банков по первой главной компоненте, которая «объясняет» 97,18% информации, содержащейся в совокупности 11 выбранных исходных показателей, потерянная информация (составляющая лишь 2,82%) исключает некоторую зашумленность в значениях первой главной компоненты (т. е. исключаются мелкие вариации в ее значениях). Поэтому можно предположить, что оценка проведенной кластеризации и определение числа «естественных» кластеров улучшаются.

4. Кластеризация банков методом /г-средних с выбором числа кластеров по СН-индексу

Дивизивный метод кластеризации ^-средних предполагает, что число кластеров задано и представляет собой итерационную процедуру, которая разбивает данные на & кластеров. Процедура начинается с & выбранных начальных центров для кластеров. За-

тем последовательно наблюдения приписываются кластеру с самым близким центром. Далее вычисляются средние значения, приписанные каждому кластеру, и эта процедура повторяется. Итерации продолжаются до тех пор, пока все наблюдения не остаются в одном и том же кластере из предыдущей итерации. Процесс кластеризации методом ^-средних может зависеть от спецификации начальных центров для & кластеров, что может привести к получению локального, а не глобального решения кластеризации. Поэтому для получения глобального решения методом ^-средних в пакете Б1а1а рекомендуется выполнить все следующие пять способов спецификации начальных центров для & кластеров.

1) Из всего количества наблюдений, подлежащих кластеризации, выбираются первые & наблюдений.

2) Из всего количества наблюдений, подлежащих кластеризации, выбираются последние & наблюдений.

3) Генерируются & случайных начальных центров. Значения выбираются случайно из равномерного распределения в диапазоне данных. Для генератора псевдослучайных чисел можно (и следует) специфицировать начальное число.

4) Для формирования & кластеров первой группе присваиваются наблюдения 1, 1+&, 1+2&, ...; второй группе присваиваются наблюдения 2, 2+&, 2+2&, ...; и т. д. В качестве начальных центров к кластеров используются средние значения этих k групп.

5) В данных формируются & почти равных разбиений. Приблизительно первые Ы/& наблюдений будут приписаны первой группе, вторые 10 рt наблюдений — второй группе и т. д. В качестве начальных центров & кластеров используются средние значения этих & групп.

Для кластеризации банков методом &-средних с определением (выбором) числа кластеров по CH-индексу мы используем следующий разработанный нами алгоритм.

1. Задаем диапазон изменения числа кластеров: & = = 2, 3, 4, ..., & о.

2. Затем последовательно для каждого заданного числа кластеров & применяем метод &-средних, используя все пять перечисленных выше способов спецификации начальных центров & кластеров, и вычисляем значение ОТ-индекса.

3. Далее для определения оптимального «естественного» числа кластеров & * применяем правило остановки на основе максимального значения ОТ-индекса.

4. И, наконец, выбираем это оптимальное число кластеров и полученное для него решение в процессе кластеризации.

5. Результаты кластеризации банков

В нашем случае кластеризация банков была проведена по значениям первой главной компоненты наблюдений (банко-годов) при & 0 = 20, т. е. был использован метод &-средних с числом кластеров в диапазоне от 2 до 20 по алгоритму выше.

Следует отметить, что Сбербанк России, ВТБ и Газпромбанк попадают в отдельные кластеры. Поэтому мы исключили их из последующей кластеризации. Эти банки имеют крупные размеры (т. е. большие значения первой главной компоненты) и являются уникальными. Их моделирование следует проводить по отдельности.

В табл. 1 представлены числа кластеров и соответствующие значения ОТ-индекса. Вывод результатов

в пакете выполняется на английском языке,

поэтому точка в числах соответствует десятичной запятой. Мы видим, что наибольшее значение CH-индекса, равное 29 100,92, соответствует 10 кластерам. Оно определяет правило остановки процесса кластеризации: оптимальное число кластеров равно 10. Поэтому мы выбираем решение кластеризации для 10 кластеров.

Таблица 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Число кластеров и соответствующие значения СН-индекса

+-

- +

Cluster number

CH-index

2 | 10834 79

3 | 12489 59

4 | 16493. 67

5 | 20031. 85

6 | 25186. 97

7 | 27131. 02

8 | 27015. 99

9 | 27376. 09

10* | 29100. 92

11 | 27643. 83

12 | 26724. 56

13 | 25087. 42

14 | 23490. 62

15 | 22182. 95

16 | 20832. 61

17 | 19636. 15

18 | 18518. 11

19 | 18104. 02

20 | 17169. 49

+-

-+

* Правило остановки: 10 кластеров.

Примечание: Cluster number — число кластеров.

В табл. 2 представлены характеристики кластеров в порядке убывания значений первой главной компоненты, «размера» банко-годов с 2008-го по 2013 г. Мы видим, например, что кластер номер 1 является самым маленьким. Он включает 10 банко-годов (см. в табл. 2 столбец Obs).

Кластер 1 содержит самые крупные банко-годы с наибольшими «размерами», поскольку среднее значение первой главной компоненты в этом кластере наибольшее среди других кластеров и равно 1.25e+09 (см. в табл. 2 столбец Mean). Это число представлено в научной системе обозначений (scientific notation) для очень больших чисел. Символ e+09 обозначает 109, и число 1.25e+09 соответствует числовому значению 1,25, умноженному на 109, т. е. числу, равному 1 250 000 000 000 руб.

Стандартное отклонение, минимальное и максимальное значения первой главной компоненты в кластере 1 соответственно равны значениям 1.61e+08; 1.06e+09 и 1.58e+09 (см. в табл. 2 колонки Std. Dev., Min и Max соответственно). Минимальное и

максимальное значения первой главной компоненты являются соответственно нижней и верхней границей кластера 1.

По мере убывания «размеров» банко-годов их число в кластерах возрастает. Последний кластер с номером 10 — самый большой и содержит 3277 банко-годов. Кластер 10 содержит самые мелкие банко-годы с наименьшими «размерами», поскольку среднее значение первой главной компоненты в этом кластере наименьшее среди других кластеров и равно 2 898 925 000 руб., и кластер 10 имеет самое маленькое стандартное отклонение среди других кластеров (наименьшую вариацию), равное 2 829 219 000 руб. в интервале [11870.53; 1.21е+07].

Кроме того, по мере убывания «размеров» банко-годов в кластерах разности между верхней границей кластера и нижней границей предшествующего кластера снижаются. Например, верхняя граница кластера 10 практически с точностью до трех значащих цифр совпадает с нижней границей кластера 9. Эти границы равны 1.21е+07, т. е. происходит «размывание» кластеров — оценки вероятностей принадлежности банко-годов вблизи этих границ к кластеру 9 и к кластеру 10 становятся приблизительно равными. Это можно показать с помощью применения дис-криминантного анализа. Данная ситуация чревата ошибками в классификации банков.

Некоторое представление о содержании кластеров можно получить, рассмотрев, например, кластер 5, содержащий 33 банко-года со средним значением и стандартным отклонением первой главной компоненты кластера, соответственно равными 2,55е+08 и 2.82е+07, в интервале [2,14е+08; 3,06е+08]. На рис. 1 представлена диаграмма рассеивания значений двух первых главных компонент кластера 5, которые «объясняют» 99,54% информации исходных переменных (вторая главная компонента «объясняет» всего лишь 2,37%).

Учитывая существенную важность первой главной компоненты по сравнению со второй (см. выше), на этом графике мы видим, что банко-год 533_12 совпадает до трех значащих цифр со средним значением первой главной компоненты, равным 2.55е+08. Этот банко-год является наиболее «типичным по размеру» в кластере 5. Значения первой главной компоненты для банко-годов 437_12, 56_09, 9_11 наиболее близки к банко-году 533_12 и также «типичны по размеру» в кластере 5. Банко-годы, находящиеся вблизи нижней и верхней границ этого кластера, имеют наиболее значительные особенности (отличия) по «размеру». Они приближаются к особенностям банко-годов, находящихся вблизи верхней границы предыдущего кластера и нижней границы последующего кластера соответственно.

Таким образом, из каждого кластера для исследования функционирования выбираются «типичные по размеру» в кластере банко-годы, а затем с целью изучения динамики рыночной конъюнктуры банков и динамики их переходов в кластерах для банков проводятся сравнения перехода из одного кластера в другой по годам.

Для получения некоторого визуального представления о «размере банка» в динамике построим объединенный график значений для первой главной компоненты и для пяти выбранных наиболее важных переменных по шести годам. Выберем, например, банки с кодовыми номерами 702, 634, 311 и 437. Значения по оси ординат на всех графиках выражены в тыс. руб. в ценах 2007 г. По оси абсцисс справа от значения года в скобках на всех графиках проставлен

о

<

I

<

Таблица 2

Характеристики кластеров в порядке убывания значений первой главной компоненты «размера» банко-годов

с 2008-го по 2013 г.

—+---

| Cluster

| number Obs Mean Std. Dev. Min Max I

I 1 + 10 1. 25e+09 1.61e+08 1. 06e+09 1 58e+09 I

I 2 11 8. 48e+08 8.2 0e+07 7. 45e+08 1 01e+09

I 3 22 5. 73e+08 6.93e+07 4. 90e+08 6 99e+08

I 4 18 4. 01e+08 4.7 8e+07 3. 29e+08 4 70e+08

I 5 33 2. 55e+08 2.82e+07 2. 14e+08 3 06e+08

I 6 48 1. 70e+08 1.97e+07 1. 40e+08 2 11e+08

I 7 78 1. 05e+08 1.64e+07 8. 19e+07 1 35e+08

I 8 184 5. 81e+07 1.15e+07 3. 98e+07 8 10e+07 I

I 9 437 2. 13e+07 7077915 1. 21e+07 3 88e+07 I

I 10 —+--- 3277 2 898925 2829219 11 870.53 1 21e+07 I

Примечание: Cluster number, Obs, Mean, Std. Dev., Min, Max обозначают, соответственно, номер кластера, число банко-годов в кластере, среднее значение, стандартное отклонение, минимальное и максимальное значения первой главной компоненты в кластере.

н 1,0 е+08 и

я> X о в

о К

5,0 е+07

-5,0 е+07

-1,0 е+08

-1,5 е+08

О

656 12

О 533 12

О 533_13

О 656 13

О 467 13

574_12

О

О 467 12

ОЗИ 12

477 11 ~ О 369_11

О........

437 10

О

338 09

437_11........

° О 437 12

2,2 е+08

2,4 е+08

2,6 е+08

2,8 е+08

О 63.....13

467_08

° 9 10ftftn 56 08 9-11 56-10

О.......° " ¿"Ж;........ ».....ст?» 0S........... "

9 08 477 13 О 9 12

О 467_11 О 56 12

О 437 13

3,0 е+08 Компонента 1

Рис. 1. Диаграмма рассеивания банко-годов кластера 5

Примечание: Коды слева от кружков обозначают номер банка и соответствующий год. Например, 656_12 обозначает банк номер 656 в 2012 г.

номер кластера, в который попадает соответствующий банко-год. Например, на графике рис. 2 обозначение 2008 (2) по оси абсцисс соответствует банку с номером 702 в 2008 г., находящемуся в кластере 2, а обозначение 2013 (1) соответствует этому банку в 2013 г., находящемуся в кластере 1, т. е. представлена

динамика перехода из кластера 2 в более крупный «по размеру» кластер 1.

На рис. 2 представлен соответствующий график для банка с номером 702, имевшего в 2013 г. ранг, равный 20. На графике видно, что значения показателей функционирования этого банка растут приблизительно

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

да

© А + *

<u о ю

Россельхозбанк

05

О

+

<11 о о

о х О

00

о

+

а о о

о

А

V ■

о о

2008 (2)

2009 (2)

2010(2) 2011(1) time

2012(1)

2013(1)

■ перв. главн. компонента (рис. 1)

— активы банка

— — портфель кредитов корпор. клиентам — портфель кредитов розн. клиентам

— объем депозитов корпор. клиентам Ф — объем депозитов розн. клиентам

Рис. 2. Объединенный график значений для первой главной компоненты и для пяти исходных переменных

по годам для банка с номером 702

РОСБАНК

time

-•--перв. главн. компонента (рис. 1) ---Ш-— — активы банка

.....А-.....— портфель кредитов корпор. клиентам — портфель кредитов розн. клиентам

— объем депозитов корпор. клиентам Ф — объем депозитов розн. клиентам

Рис. 3. Объединенный график значений для первой главной компоненты и для пяти исходных переменных

по годам для банка с номером 634

линейно и имеют большие значения по исходным показателям (портфель кредитов и объем депозитов корпоративных клиентов с превышением портфеля кредитов над объемом депозитов). В 2008-2010 гг. этот банк находится в кластере 2, а в последующие

годы происходит его укрупнение «по размеру», вследствие чего она переходит в кластер 1 (см. значения на оси абсцисс этого графика), в том числе и за счет сближения портфеля кредитов и объема депозитов корпоративных клиентов.

со

X

<

< 00

х +

^ a) о

S ш tj!

— О

X со

о +

Ф

ш о

X со

<

со

О 00

CL +

X ^ CD О

ш N

^

О

5 00

+

О ш

о

V

О гЧ

zr

X

<

S ш О

— <

S

Московский коммерческий банк

2008 (8)

2009 (7)

2010 (6)

time

2011(6)

2012 (5)

2013 (4)

■■+----_

перв. главн. компонента (рис. 1) ---■-— — активы банка

портфель кредитов корпор. клиентам — портфель кредитов розн. клиентам

объем депозитов корпор. клиентам Ф — объем депозитов розн. клиентам

Рис. 4. Объединенный график значений для первой главной компоненты и для пяти исходных переменных

по годам для банка с номером 311

РОССИЯ

+

о о

со

00 +

ш о

00 +

0) о

-х-

-X-

-X-

2008 (7)

2009 (7)

2010(5) 2011(5)

time

2012 (5)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- перв. главн. компонента (рис. 1)

2013(5)

---■■— — активы банка

"Ат.....— портфель кредитов корпор. клиентам — портфель кредитов розн. клиентам

— объем депозитов корпор. клиентам Ф — объем депозитов розн. клиентам

Рис. 5. Объединенный график значений для первой главной компоненты и для пяти исходных переменных

по годам для банка с номером 437

На рис. 3 приведен соответствующий график для банка с номером 634, имевшего в 2013 г. ранг, равный 15. В 2008-2010 гг. значения показателей этого банка снижаются, и он переходит в кластер 4, а затем возвращается в кластер 3.

Следует отметить значительное превышение значений активов банка с номером 634 от значений остальных исходных показателей, что отображает его значительную (нереализованную) потенциальную кредитоспособность.

Таблица 3

Ежегодные средние значения первой главной компоненты и пяти исходных переменных

для банковского сектора России в 2008-2013 гг.

-------------+--------------------------------------------------------

Variable I Obs Mean Std. Dev. Min Max -------------+--------------------------------------------------------

| 2008 г. -------------+--------------------------------------------------------

pc1 I 686 1.87e+07 7.63e+07 11870.53 8.17e+08

assets_1 I 736 1.57e+07 6.53e+07 1593.468 7.49e+08

corp_credi~2 I 717 6433083 2.96e+07 268.9472 3.67e+08

ret_credit_3 I 708 2802380 1.44e+07 16.69933 2.71e+08

corp_depos~8 I 731 5166941 2.18e+07 239.0641 2.54e+08

ret_deposi~9 I 701 2949572 1.36e+07 1.757825 2.68e+08 -------------+--------------------------------------------------------

| 2009 г. -------------+--------------------------------------------------------

pc1 I 691 1.84e+07 7.42e+07 38415.05 9.05e+08

assets_1 I 737 1.54e+07 6.28e+07 1646.647 7.93e+08

corp_credi~2 I 716 5961635 2.85e+07 5.639204 4.35e+08

ret_credit_3 I 710 2307105 1.27e+07 128.8961 2.62e+08

corp_depos~8 I 733 5225064 2.17e+07 169.9817 2.58e+08

ret_deposi~9 I 704 3710408 1.72e+07 .8056005 3.49e+08 -------------+--------------------------------------------------------

| 2010 г. -------------+--------------------------------------------------------

pc1 I 690 2.09e+07 8.16e+07 88783.02 9.64e+08

assets_1 I 737 1.72e+07 6.82e+07 1714.754 8.14e+08

corp_credi~2 I 712 6725626 3.17e+07 42.49609 4.78e+08

ret_credit_3 I 710 2496750 1.40e+07 39.5139 3.01e+08

corp_depos~8 I 735 5885176 2.53e+07 42.49609 3.27e+08

ret_deposi~9 I 702 4741134 2.19e+07 1.491091 4.70e+08 -------------+--------------------------------------------------------

| 2011 г. -------------+--------------------------------------------------------

pc1 I 685 2.44e+07 9.75e+07 139216.7 1.23e+09

assets_1 I 737 1.99e+07 8.18e+07 1682.726 1.04e+09

corp_credi~2 I 712 7752117 3.57e+07 39.79891 5.59e+08

ret_credit_3 I 709 3213332 1.83e+07 88.67477 3.96e+08

corp_depos~8 I 735 7024935 3.27e+07 105.4322 5.07e+08

ret_deposi~9 I 701 5578507 2.60e+07 1.396453 5.75e+08 -------------+--------------------------------------------------------

| 2012 г. -------------+--------------------------------------------------------

pc1 I 683 2.75e+07 1.09e+08 99771.79 1.33e+09

assets_1 I 737 2.26e+07 9.21e+07 27353.99 1.15e+09

corp_credi~2 I 712 8206301 3.77e+07 2.623192 5.89e+08

ret_credit_3 I 705 4224409 2.43e+07 83.94213 5.21e+08

corp_depos~8 I 735 7281273 3.27e+07 25.57612 4.46e+08

ret_deposi~9 I 703 6441779 2.94e+07 2.623192 6.44e+08 -------------+--------------------------------------------------------

| 2013 г. -------------+--------------------------------------------------------

pc1 I 683 3.00e+07 1.23e+08 182873 1.58e+09

assets_1 I 737 2.46e+07 1.04e+08 8065.529 1.37e+09

corp_credi~2 I 715 8715922 4.03e+07 43.11141 6.28e+08

ret_credit_3 I 709 5170732 3.15e+07 41.26378 7.06e+08

corp_depos~8 I 735 7618854 3.46e+07 82.52756 4.92e+08

ret_deposi~9 I 702 7320196 3.62e+07 1.231755 8.25e+08 -------------+--------------------------------------------------------

о x о

О

о о

о х о

о

о о

t-

+

01 о

t-+

CD

о

t-

+

ш о

Ежегодные средние значения

Банковский сектор России

2008

2009

2010

2011

2012

2013

time

- перв. главн. компонента (рис. 1) ---■-— — активы банка

■ портфель кредитов корпор. клиентам — портфель кредитов розн. клиентам

■ объем депозитов корпор. клиентам ^ — объем депозитов розн. клиентам

Рис. 6. Объединенный график средних значений для первой главной компоненты и для пяти исходных переменных

по годам для банковского сектора России в 2008-2013 гг.

На рис. 4 представлен график для банка с номером 311, имевшего в 2013 г. ранг, равный 13. Он был признан лучшим коммерческим банком 2013 г. Этот банк отличает экспоненциальный рост первой главной компоненты и сравнительно большие значения по показателям портфель кредитов корпоративным клиентам и объем депозитов розничных клиентов (с превышением портфеля кредитов корпоративным клиентам над объемом депозитов розничных клиентов). При этом динамика рассматриваемого банка такова, что за 6 лет он 4 раза переходил в следующий более крупный «по размеру» кластер (динамика укрупнения «по размеру»).

График для банка с номером 437, имевший в 2013 г. ранг, равный 100, показан на рис. 5. Следует отметить, что его портфель кредитов значительно ниже объема депозитов корпоративным клиентам и объема активов.

6. Динамика банковского сектора России

В табл. 3 показаны ежегодные достаточно точные оценки среднего значения (Mean), стандартного отклонения (Std. Dev.), минимального (Min) и максимального (Max) значений первой главной компоненты и пяти исходных переменных для банковского сектора России по годам, что дает представление о его динамике в 2008-2013 гг. и позволяет ее описать.

Мы видим последовательное возрастание ежегодных средних значений и стандартных отклонений первой главной компоненты, за исключением снижения в 2009 г. из-за кризиса. Таким образом, в рассматриваемом периоде происходили последовательное укрупнение банковского сектора и ежегодное возрастание его вариации («по размеру» банков). При этом крупные банки в среднем укрупняются значительно быстрее, чем мелкие (см.

нижние (Min) и верхние (Max) границы банковского сектора).

На рис. 6 представлен график средних значений для первой главной компоненты и для пяти исходных переменных по годам для банковского сектора России. Отметим, что этот график пропорционален графику суммарных значений показателей банковского сектора России с точностью до имеющегося в нем количества банков.

Представленные на рис. 6 данные позволяют сделать вывод о сбалансированности показателей развития банковского сектора. Активы банковского сектора значительно выше остальных исходных показателей, что говорит о его общей кредитоспособности и ликвидности. Объем портфеля кредитов корпоративным клиентам несколько выше объема соответствующих депозитов, а объем портфеля кредитов розничным клиентам несколько уступает объему соответствующих депозитов. Следовательно, банки используют средства населения для кредитования юридических лиц (фирм, частных и государственных корпораций и т. п.).

7. Заключение

В статье описана одна из наиболее простых компьютерных технологий классификации участников банковского сектора России с применением экономе-трического пакета программ Stata методом кластерного анализа fe-средних. По разработанному автором алгоритму на основе показателя «размер банка» в первом приближении представлена классификация банков России (с обоснованным разделением на 10 «естественных» групп наблюдений). Для определения количества кластеров использовался СН-индекс кластеризации.

Из каждого кластера для исследования функционирования выбраны «типичные по размеру» в

кластере банко-годы, а затем с целью изучения динамики рыночной конъюнктуры банков и динамики их переходов в кластерах для банков проведены сравнения перехода из одного кластера в другой по годам.

Для получения визуального представления о кластеризации банков по показателю «размер банка» для нескольких банков в динамике построены объединенные графики значений для показателя «размер банка» и для пяти наиболее важных исходных показателей по 6 годам. Кроме того, построен график средних значений для первой главной компоненты и для пяти исходных переменных по годам для банковского сектора России в целом. Он показал достаточно хорошую сбалансированность показателей функционирования банковского сектора.

И, наконец, по результатам кластеризации была построена обучающая выборка. Имеется в виду выборка, в которой каждое наблюдение имеет известную принадлежность к соответствующему кластеру. Она предназначена для применения дискриминантного анализа (классификации с обучением) с целью оценки прогностических вероятностей принадлежности новых банко-годов к каждому из 10 кластеров. Из-за ограничений объема статьи указанная обучающая выборка и полученные результаты дискриминантного анализа здесь не приводятся.

Свертка информации функционирования банковского сектора России, ранжирование банков и их классификация могут использоваться для разработки финансовых стратегий на основе построения сценариев развития в рамках кратко- и среднесрочного прогнозирования.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Литература

1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. М.: Юнити, 1998. 1022 с.

2. Дюран Б., Оделл П. Кластерный анализ. М.: Статистика,

1977. 128 с.

3. Calinski T., Harabasz J. A dendrite method for cluster analysis // Communications in Statistics. 1974. N 3. Р. 1-27.

4. Duda R. O., Hart P. E., Stork D. G. Pattern Classification. 2nd ed. N. Y: Wiley, 2001. 738 p.

5. Everitt B. S., Landau S., Leese M., Stahl D. Cluster Analysis. 5th ed. Chichester, UK: Wiley, 2011. 346 p.

6. Milligan G. W., Cooper M. C. An examination of procedures for determining the number of clusters in a dataset // Psychometrika. 1985. N 50. Р. 159-179.

7. Rencher A. C. Methods of Multivariate Analysis. 2nd ed. N. Y.: Wiley, 2002. 732 p.

References

1. Ayvazyan S. A., Mkhitaryan V. S. Prikladnaya statistika iosnovy ekonometriki [Applied statistics and econometrics basics]. Moscow, Yuniti Publ., 1998. 1022 p.

2. Duran B. S., Odell P. L. Cluster analysis. A survey. New York, 1974. 140 p. (Lecture notes in economics and mathematical systems). (Russ. ed.: Dyuran B., Odell P. Klasternyy analiz. Moscow, Kniga po Trebovaniyu Publ., 2012. 128 p.).

3. Calinski T., Harabasz J., A dendrite method for cluster analysis. Communication in Statistics, 1974, pp. 1-27.

4. Duda R. O., Hart P. E., Stork D. G. Pattern classification. 2nd ed. New York, John Wiley & Sons Publ., 2001. 738 p.

5. Everitt B. S., Landau S., Leese M., Stahl D. Cluster Analysis. 5th ed. New York, Wiley Publ., 2011. 346 p.

6. Milligan G. W., Cooper M. C. An examination of procedures for determining the number of clusters in a data set. Psychometrika, June 1985, vol. 50, no. 2, pp. 159-179.

7. Rencher A. C. Methods of multivariate analysis. New York, John Wiley & Sons, Inc., Publ., 2002. 732 p.

о

о о

Издания СПбУУиЭ

Княжицкая О. И. Научно-исследовательская работа — ключевой ресурс интеллектуального капитала: монография. — СПб.: Издательство Санкт-Петербургского университета управления и экономики, 2014. — 164 с.; илл.

Читателю предлагается анализ особенностей и методов научного исследования, проблем регламентации и унификации научных исследований, вопросов формирования инновационной культуры и научной этики в процессе создания интеллектуального капитала, рекомендации по оформлению научных работ. Книга является путеводителем по этапам научной работы и предназначена для магистрантов, студентов, тех, кто делает первые шаги в исследовательской деятельности, а также состоявшихся специалистов, заинтересованных в повышении культуры научной работы.

Торгунакова Е. В. Механизм управления корпоративной культурой предпринимательских структур:

учебное пособие. — СПб.: Издательство Санкт-Петербургского университета управления и экономики, 2014. — 176 е.; илл.

В учебном пособии раскрыта сущность корпоративной культуры как ресурса предпринимательских структур, представляющего собой систему базовых представлений и ценностей, разделяемых большинством членов данной организации, на основе которого создается особая технология управления организацией. Выявлена роль корпоративной культуры в повышении конкурентоспособности предпринимательских структур, предложены метод рейтинговой оценки предприятий по уровню ее развития и система показателей развития корпоративной культуры, включающая финансовые и нефинансовые показатели; разработаны методические рекомендации по управлению корпоративной культурой предпринимательских структур.

Издание ориентировано на преподавателей, студентов и аспирантов вузов, собственников и руководителей предприятий, менеджеров.

i Надоели баннеры? Вы всегда можете отключить рекламу.