ISSN 2304-120X
ниепт
научно-методический электронный журнал
Деркаченко О. В. Кластеризация и дискриминантный анализ регионов Приволжского федерального округа по уровню отдельных социально-экономических показателей // Концепт. - 2016. - № 02 (февраль). - ART 16028. -0,3 п. л. - URL: http://e-koncept.ru/2016/16028.htm. - ISSN 2304-120X.
ART 16028 УДК 332.025.12
Деркаченко Олег Валентинович,
кандидат экономических наук, начальник лаборатории ФГУ «3 Центральный научно-исследовательский институт» Министерства обороны Российской Федерации, г. Москва [email protected]
Кластеризация и дискриминантный анализ регионов Приволжского федерального округа по уровню отдельных социально-экономических показателей
Аннотация. В статье приводятся результаты кластеризации регионов Приволжского федерального округа по социально-экономическим показателям и дана интерпретация кластеров. Построены дискриминантные функции для определения принадлежности «новых» регионов к кластерам. Выявлена принадлежность отдельного региона к кластеру со средним уровнем социально-экономических показателей. Получена эконометрическая модель объема инвестиций в основной капитал в зависимости от валового регионального продукта.
Ключевые слова: регионы, показатели, информация, кластерный анализ, интерпретация кластеров, дискриминантные функции, принадлежность, «новые» регионы, эконометрическая модель. Раздел: (04) экономика.
В условиях экономического кризиса и усиливающейся международной конкуренции устойчивость российской экономики во многом зависит от способности каждого региона успешно развиваться и конкурировать на рынках. Изменения в мире, вызванные политическими и экономическими причинами, требуют новых подходов к социально-экономическому развитию российских регионов. Социально-экономическое положение регионов неоднородно. По одним показателям регион может находиться в числе передовых, а по другим, наоборот, имеет средние или вообще низкие значения. Каждый регион обладает своими уникальными природно-климатическими условиями, географическим и геополитическим положением, в каждом - особая демографическая ситуация. В таких условиях для учета региональных различий по уровню социально-экономических показателей целесообразно воспользоваться статистическими методами многомерной классификации субъектов РФ, в частности методом кластерного анализа.
Главная особенность кластерного анализа состоит в том, что различия между объектами, входящими в выделенную группу (кластер), незначительны, а различия между группами существенны.
Методы кластерного анализа позволяют:
- объединять объекты в группы (кластеры) все более высокой общности на основе критерия минимума расстояния в пространстве изучаемых показателей, описывающих эти объекты;
- разбивать множество объектов на заданное число кластеров [1-3].
Дискриминантный анализ является разделом многомерного статистического
анализа, который включает в себя методы классификации многомерных наблюдений по принципу максимального сходства при наличии обучающих признаков. В кластерном анализе рассматриваются методы многомерной классификации без обучения. В дискриминантном анализе новые кластеры не образуются, а формулируется правило,
Деркаченко О. В. Кластеризация и дискриминантный анализ регионов Приволжского федерального округа по уровню отдельных социально-экономических показателей // Концепт. - 2016. - № 02 (февраль). - ART 16028. -0,3 п. л. - URL: http://e-koncept.ru/2016/16028.htm. - ISSN 2304-120X.
по которому объекты подмножества, подлежащего классификации, относятся к одному из уже существующих (обучающих) подмножеств (классов) на основе сравнения величины дискриминантной функции классифицируемого объекта, рассчитанной по дискриминантным переменным, с некоторой константой дискриминации. Дискрими-нантная функция в общем виде запишется так:
У = Ьо + Ь1Х1+ Ь2Х2 +...+ bkXk. (1)
В качестве зависимой переменной выступает номинальная переменная, идентифицирующая принадлежность объектов (регионов) к одной из нескольких групп (кластеров). Независимые переменные (xi, Х2 ... xk) такие же, как и в регрессионном анализе (количественные и качественные).
В данной статье рассматривается применение кластерного и дискриминантного анализа для решения задачи классификации регионов Приволжского ФО по социально-экономическим показателям за 1-й квартал 2015 г. Для этого используется новая статистическая информация, приведенная на сайте Росстата (www.gks.ru), а именно ежеквартальное электронное издание «Статистическое обозрение» № 3 (94) 2015 г. [4] Статистические данные отдельных социально-экономических показателей регионов Приволжского ФО приведены в табл. 1. Для выделения однородных регионов Приволжского ФО по уровню отдельных социально-экономических показателей используется кластерный анализ [5]. Общая модель кластеризации имеет вид:
dab = aldlb + af dfb + pdlf + Y(dlb - dfb), (2)
где ai, af, в, y - параметры, определяющие алгоритм образования кластеров; dib, dfb, dif - расстояние между соответствующими кластерами.
При определенных значениях параметров ai, af, в, y общее уравнение (2) преобразуется в конкретный алгоритм. В данном исследовании использовался алгоритм «средняя связь»:
dab = Ni/(Ni + Nf) dib + Nf/(Ni + Nf) dfb, (3)
где - Ni, Nf соответственно кластеры «i» и «f» с числом объектов N.
Зависимость (3) получена из общего уравнения (2) при следующих значениях параметров:
ai = Ni/(Ni + Nf); af = Nf/(Ni + Nf) и в = Y = 0.
Для классификации регионов на однородные группы используется пакет прикладных программ '^а^Иса" (модуль - кластерный анализ). Схема работы следующая: Ввод исходных данных в таблицу - Анализ - Многомерный анализ - Кластерный анализ - Иерархическая классификация - ОК - Файл данных (исходные данные). Переменные строки. Правило объединения: метод полной связи. Мера близости: евклидово расстояние - ОК - Выбор переменных (Var1-Var5) - ОК - Вертикальная дендрограмма -Результат: дендрограмма классификации 14 регионов Приволжского ФО по пяти переменным (х1-х5). На рисунке: по оси абсцисс - номера регионов, по оси ординат - евклидово расстояние. Для выделения кластеров используется граничное значение евклидова расстояния, которое задается в пределах d^ = (0,5 - 0,9)dmax. Из рисунка видно, что dmax = 18,0. Задаемся коэффициентом, равным 0,6. Следовательно, граничное значение равно 10,8. Для этого значения проведем на рисунке линию, параллельную оси абсцисс, которая позволит выделить три кластера (см. табл. 2).
ISSN 2Э04-120Х
ниепт
научно-методический электронный журнал
Деркаченко О. В. Кластеризация и дискриминантный анализ регионов Приволжского федерального округа по уровню отдельных социально-экономических показателей // Концепт. - 2016. - № 02 (февраль). - ART 16028. -0,3 п. л. - URL: http://e-koncept.ru/2016/16028.htm. - ISSN 2304-120X.
Таблица 1
Социально-экономические показатели регионов Приволжского ФО
за 1-й квартал 2015 г.
Регионы Приволжского ФО Уровень безработицы, в процентах от экономически активного населения, х1 Среднедушевые денежные доходы населения (в месяц), тыс. рублей, х2 Среднедушевые денежные расходы населения на покупку товаров и оплату услуг (в месяц), тыс. рублей, хз Среднеме-сяч- ная номинальная начисленная заработная плата, тыс. рублей, х4 Средний размер назначенных пенсий (на 1 апреля 2015 г.), тыс. рублей, хв
С1. Республика Башкортостан 6,5 21,225 18,721 24,166 11,432
С2. Республика Марий Эл 5,2 15,628 11,285 19,880 10,732
С3. Республика Мордовия 4,6 14,954 10,725 20,249 10.823
С4. Республика Татарстан 4,8 25,840 21,080 27,208 11,601
С5. Удмуртская Республика 4,9 20,957 14,186 23,524 11,807
С6. Чувашская Республика 5,7 16,559 12,681 19,901 10,911
С7. Пермский край 6,0 29,351 19,363 26,271 11,983
С8. Кировская область 5,2 19,208 14,319 20,637 11,779
С9. Нижегородская область 4,2 26,974 18,975 25,137 11,884
С10. Оренбургская область 5,8 18,459 14,502 22,794 11,000
С11. Пензенская область 4,7 18,420 14,601 21,767 11.039
С12. Самарская область 4,3 22,072 17,981 25,067 11,816
С13. Саратовская область 5,1 16,787 13,044 21,250 10,958
С14. Ульяновская область 5,5 20,452 13,889 21,139 11,069
Таблица 2
Номера регионов в кластерах
Номер кластера Номер региона
1 9, 7, 4
2 13, 6, 3, 2
3 11, 10, 14, 8, 5, 12, 1
ISSN 2304-120Х
ко ниепт
научно-методический электронный журнал
ISSN 2Э04-120Х
ниепт
научно-методический электронный журнал
Деркаченко О. В. Кластеризация и дискриминантный анализ регионов Приволжского федерального округа по уровню отдельных социально-экономических показателей // Концепт. - 2016. - № 02 (февраль). - ART 16028. -0,3 п. л. - URL: http://e-koncept.ru/2016/16028.htm. - ISSN 2304-120X.
Первый кластер характеризуется низким уровнем безработицы и высокими показателями Х2-Х5 по сравнению с другими кластерами. Второй кластер - средний уровень безработицы, но в регионах низкие доходы, заработная плата и пенсия. Третий кластер имеет более высокую безработицу, но средние социально-экономические характеристики. К этому кластеру относится Пензенская область. Поэтому по уровню отдельных социально-экономических показателей первый кластер характеризуется как кластер с хорошими показателями, третий - со средними и второй - с удовлетворительными.
Результаты кластеризации регионов по социально-экономическим показателям
Следующим этапом исследования является решение задачи отнесения «нового» региона к определенному кластеру. Новый регион - это регион, не участвующий в кластеризации, например Тамбовская область. Такую задачу можно решить, используя дискриминантный анализ [6]. Построив дискриминантные функции и подставив в них социально-экономические характеристики Тамбовской области, можно определить, к какому кластеру она относится. Показатели Тамбовской области приведены в табл. 3.
Таблица 3
Показатели Тамбовской области
Х1 Х2 Хз Х4 Х5
4,6 19,853 16,135 20,016 10,751
Деркаченко О. В. Кластеризация и дискриминантный анализ регионов Приволжского федерального округа по уровню отдельных социально-экономических показателей // Концепт. - 2016. - № 02 (февраль). - ART 16028. -0,3 п. л. - URL: http://e-koncept.ru/2016/16028.htm. - ISSN 2304-120X.
По данным табл. 1 и дискриминантного анализа в ППП "Statistica" построены три модели для каждого кластера:
Yi = - 1168,94 + 42,14Xi - 23,34X2 - 10,59Хз + 23,34X4 + 199,75Хб.
Y2 = - 1241,78 + 49,80Xi - 34,92X2 - 12,59Хз + 25,26X4 + 219,93Хб.
Y3 = - 1256,87 + 48,24Xi - 30,55X2 - 11,61Хз + 24,65X4 + 218,21Хб.
В каждую модель подставим характеристики Тамбовской области (см. табл. 3) и определим дискриминантные функции. Имеем: Yi = 1004,821; Y2 = 1000,67; Y3 = 1010,568. По максимальному значению функции выбирается кластер, к которому принадлежит «новый» объект. В данном случае Тамбовская область входит в третий кластер. Принадлежность региона к кластеру можно определить на основе апостериорной вероятности (табл. 4). Из таблицы видно, что Тамбовская область (15) относится к третьему кластеру с вероятностью 0,995.
Таблица 4
Вероятности отнесения регионов к кластеру
Апостериорные вероятности (Таблица^а) Неправильные классификации отмечены *
Номер Наблюдения G_1:1 G_2:2 G_3:3
1 G_3:3 0,000000 0,000i4i 0,999859
2 G_2:2 0,000000 0,997006 0,002994
3 G_2:2 0,000000 0,999385 0,0006i 5
4 G_i:i i,000000 0,000000 0,000000
5 G_3:3 0,000000 0,002394 0,997606
6 G_2:2 0,000000 0,9658i5 0,034i85
7 G_i:i i,000000 0,000000 0,000000
8 G_3:3 0,000000 0,033395 0,966605
9 G_i:i i,000000 0,000000 0,000000
10 G_3:3 0,000000 0,296256 0,703744
11 G_3:3 0,000000 0,040532 0,959468
12 G_3:3 0,000007 0,000004 0,999989
13 G_2:2 0,000000 0,9i 7579 0,08242i
14 G_3:3 0,000000 0,00i775 0,998225
15 — 0,004909 0,000057 0,995034
Таким образом, применение кластерного анализа позволило выявить однородные регионы Приволжского ФО по социально-экономическим показателям, установить кластеры с хорошими, средними и удовлетворительными характеристиками. Для кластера с удовлетворительными показателями целесообразно разработать сценарий развития этих субъектов с целью перехода в третий или первый кластер. На основе дискриминантного анализа построены дискриминантные модели и выявлена принадлежность Тамбовской области к кластеру со средними показателями.
Рассмотренные отдельные социально-экономические показатели регионов Приволжского ФО в значительной степени зависят от инвестиций в основной капитал. Эти инвестиции сильно связаны с валовым региональным продуктом (ВРП). Поэтому возникает необходимость в разработке статистической модели связи инвестиций в основной капитал с ВРП. Статистические данные приведены в табл. 5.
ISSN 2304-120Х
ниепт
научно-методический электронный журнал
ISSN 2Э04-120Х
ниепт
научно-методический электронный журнал
Деркаченко О. В. Кластеризация и дискриминантный анализ регионов Приволжского федерального округа по уровню отдельных социально-экономических показателей // Концепт. - 2016. - № 02 (февраль). - ART 16028. -0,3 п. л. - URL: http://e-koncept.ru/2016/16028.htm. - ISSN 2304-120X.
Таблица 5
Инвестиции в основной капитал и ВРП регионов Приволжского ФО
за 1-й квартал 2015 г.
Регион Инвестиции в основной капитал, млн руб. (у) Валовой региональный продукт, млн руб. (z)
Республика Башкортостан 152842,1 1154 056
Республика Марий Эл 30603,6 117 598
Республика Мордовия 35320,4 132 474
Республика Татарстан 322327,6 1 436 933
Удмуртская Республика 60236,7 371 498
Чувашская Республика 34853,9 217 034
Пермский край 183029,7 897 598
Кировская область 39683,3 212 370
Нижегородская область 175091,0 838 599
Оренбургская область 118522,1 629 370
Пензенская область 53535,0 240 335
Самарская область 226694,2 941 611
Саратовская область 89561,6 477 352
Ульяновская область 42080,2 244 230
По статистическим данным (табл. 5) с использованием MS Excel (этап - регрессия) построена однофакторная модель (табл. 6).
Таблица 6
Результаты построения однофакторной модели
ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,953491729
R-квадрат 0,909146477
Нормированный R-квадрат 0,90157535
Стандартная ошибка 27966,55242
Наблюдения 14
Дисперсионный анализ
df SS MS F
Регрессия 1 93918510877 93918510877 120,080734
Значим.F
Остаток 12 9385536650 782128054,1 1,32Е-07
Итого 13 1,03304E+11
Коэффици- Стандартная t-стати- P-Значе-
енты ошибка стика ние
Y-пересечение -1834,883389 12778,52472 -0,143591176 0,88820642
1,32127E-
Переменная X 1 (Z) 0,200993314 0,018341926 10,95813552 07
Эконометрическая модель имеет вид:
У = - 1834,883 + 0,201 7.
Из табл. 6 видно, что коэффициент детерминации (К2) равен 0,909 и по критерию Фишера модель является значимой. Полученная эконометрическая модель может
Деркаченко О. В. Кластеризация и дискриминантный анализ регионов Приволжского федерального округа по уровню отдельных социально-экономических показателей // Концепт. - 2016. - № 02 (февраль). - ART 16028. -0,3 п. л. - URL: http://e-koncept.ru/2016/16028.htm. - ISSN 2304-120X.
быть использована для прогнозирования объема инвестиций в зависимости от валового регионального продукта.
Без вложения инвестиций в основной капитал не может быть эффективного развития региональной экономики.
Ссылки на источники
1. Деркаченко В. Н., Зубков А. Ф. Многомерные статистические методы: учеб. - Пенза: Изд-во Пен-зен. гос. технол. акад., 2011. - 179 с.
2. Статистика: учеб. / под ред. В. С. Мхитаряна. - М.: Экономистъ, 2006. - 671 с.
3. Деркаченко В. Н. Эконометрика: учеб. пособие. - Пенза: Изд-во Пензен. гос. технол. акад., 2013. -140 с.
4. Статистическое обозрение. - М., 2015. - № 3(94).
5. Деркаченко В. Н., Зубков А. Ф. Указ. соч.
6. Там же.
ISSN 2304-120Х
ко ниегтг
научно-методический электронный журнал
Oleg Derkachenko,
Candidate of Economic Sciences, the chief of the laboratory of federal office of state "3 the central scientific
research institute of the RF Ministry of Defense", Moscow
Clustering and the discriminant analysis of the regions of the Volga federal region on the level of the separate social and economic indices
Abstract. The paper deals with the results of clustering the regions of the Volga federal region according to the social and economic indices interpretation to clusters are given. Discriminators for determining the belonging "new" regions with the clusters are constructed. The belonging of separate region with the cluster with the average level of social and economic indices is revealed. The econometric model of the volume of fixed asset formation depending on gross regional product is obtained.
Key words: regions, indices, information, cluster analysis, interpretation of clusters,. References
1. Derkachenko, V. N. & Zubkov, A. F. (2011). Mnogomernye statisticheskie metody: ucheb., Izd-vo Penz. gos. tehnol. akad., Penza, 179 p. (in Russian).
2. Mhitarjan, V. S. (ed.) (2006). Statistika: ucheb., Jekonomist#, Moscow, 671 p. (in Russian).
3. Derkachenko, V. N. (2013). Jekonometrika: ucheb. posobie, Izd-vo Penz. gos. tehnol. akad., Penza, 140 p. (in Russian).
4. (2015). Statisticheskoe obozrenie, Moscow, № 3(94) (in Russian).
5. Derkachenko, V. N. & Zubkov, A. F. (2011). Op. cit.
6. Ibid.
ISSN 2304-120X
Рекомендовано к публикации:
Горевым П. М., кандидатом педагогических наук, главным редактором журнала «Концепт»^ЯЛ
Поступила в редакцию Received 28.12.15 Получена положительная рецензия Received a positive review 30.12.15
Принята к публикации Accepted for publication 30.12.15 Опубликована Published 29.02.16
© Концепт, научно-методический электронный журнал, 2016 © Деркаченко О. В., 2016