Эконометрическое моделирование влияния элементов национального богатства на ВРП регионов России по результатам многомерной
группировки Econometric modeling of influence of elements of national wealth GRP regions of Russia according to the results of multidimensional grouping Лимонова Наталья Г еннадьевна
Заместитель директора по учебной, научной, воспитательной работе и безопасности. Акбулакский филиал федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Оренбургский государственный университет», п. Акбулак
E-mail: [email protected]
Аннотация. В данной статье проводится построение эконометрических моделей зависимости ВРП от элементов национального богатства, при этом выделяются три группы: воспроизводимый, природный и человеческий капитал. Модели основаны на результатах выделения однородных групп субъектов Российской Федерации, что достигалось посредством построения многомерной группировки методом кластерного анализа. По итогам моделирования влияния, делаются предположения о дальнейшем развитии групп регионов.
Ключевые слова: национальное богатство, структура, вариация,
группировка, дифференциация, кластерный анализ, типологическая регрессия Abstract. In given to article creation of econometric models of dependence of a gross regional product from elements of national wealth is carried out, three groups of elements are thus allocated: the reproduced, natural and human capital. Models are based on results of allocation of uniform groups of subjects of the Russian Federation that was reached by means of creation of multidimensional
group by a method of the cluster analysis. Following the results of influence modeling, assumptions of further development of groups of regions become.
Key words: national wealth, structure, variation, group, differentiation, cluster analysis, typological regression
Проведение эконометрического моделирования при наличии значительного количества факторов, сопряжено с проблемой снижения их числа, что связано с возможным возникновением проблемы мультиколлинеарности при совместном их использовании в модели. Многие ученые отмечают, что экономические показатели, как правило, находятся друг с другом в тесной корреляционной зависимости, отсюда и возникает озвученная проблема.
Переход к парной регрессионной модели исключает проблему мультиколлинеарности, но приводит к потере значительного объема данных. Отсюда следует, что поиск оптимального количества переменных одна из важнейших задач стоящих перед эконометрикой. Выходом из подобной ситуации является применение аппарата нейросетевого моделирования, но также можно прибегнуть к более простым способам построения моделей, одним из которых является типологическая регрессия.
Суть подхода заключается в разделении исходной совокупности на однородные группы и введение в уравнение фиктивной (дискретной) переменной, которая будет характеризовать принадлежность единиц к одной из групп. В связи с этим, в данной статье проведем построение подобной регрессии применительно к изучению влияния элементов национального богатства на ВРП субъектов РФ.
На первом этапе остановимся на особенностях формирования матрицы исходных показателей, накладываемых на данные ограничениях и допущениях. Прежде всего, стоит заметить, что официальная государственная статистика осуществляет сбор сведений по усеченному кругу показателей характеризующих национальное богатство [2]. Также
стоит указать на несопоставимость элементов национального богатства в связи с отсутствием по ряду элементов стоимостной оценки [4], данная проблема решалась путем использования методики группировки, которая не накладывает жестких ограничений на природу исходных данных. Соответственно в рамках данной статьи ограничимся усеченным кругом показателей.
Источниками информации послужат годовые сборники Росстата (Российский статистический ежегодник и Регионы России) и ежемесячный журнал «Бюллетень банковской статистики» выпускаемый Центральным Банком России [3].
В качестве периода анализа был взят 2011 г., что объясняется наличием информации о ВРП и большинства показателей, характеризующих элементы национального богатства за данные периода.
Итак, в расчетах были использованы три группы показателей, отражающие элементы национального богатства [1]:
Элементы национального богатства
—► 1 блок. Воспроизводимый капитал (переменные обозначаются как NFAj от английского not financial assets и от английского financial assets): -"Ч " стоимость основных фондов (основной капитал), млн. руб. -^s " число легковых автомобилей находящихся во владении граждан, ед. -^з " площадь жилья находящегося во владении граждан, млн. кв. м ^ 1 “ вклады (депозиты) юридических лиц, привлеченные кредитными организациями, млн. руб. -Т-1 “ вклады (депозиты) физических лиц, привлеченные кредитными организациями, млн. руб. -"’■s - задолженность по кредитам, предоставленным кредитными организациями юридическим лицам, млн. руб. ;L" Л " задолженность по кредитам, предоставленным кредитными организациями физическим лицам, млн. руб. -''■5 " кредиторская задолженность, млн. руб.
—► ~ И 3 ■ 2 блок. Человеческий капитал (переменные обозначаются как i от английского human resources): Xp. 1 _ численность населения, тыс. чел. РI “ численность экономически активного населения, тыс. чел. _
—► ~ ИГ- ~ 3 блок. Природный капитал (переменные обозначаются как J от английского natural capital) : ■i " площадь сельскохозяйственных угодий, тыс. га. ■'■'■а ~ общий запас древесины, млн. м. куб.
Рисунок 1 - Система показателей, характеризующая национальное богатство субъектов РФ
Решение задачи, анализа неравномерности распределения элементов национального богатства по территории РФ, видится в использовании метода группировок, но в силу наличия 16-ти показателей описывающих изучаемую проблему, одномерный подход несостоятелен, в связи с этим обратимся к многомерной группировке (классификации) объектов [5].
Так как в нашем распоряжении нет априорной информации о структуре совокупности, наилучшим способом кластеризации будет являться иерархическая классификация.
Имеющаяся информация является количественной, в связи с этим, в качестве алгоритма объединения наилучшим образом подойдет метод Варда, поскольку он базируется на дисперсионном анализе. В результате применения данного метода получаем дендрограмму с глубоко гипертрофированно разделенными кластерами (рисунок 2).
Рисунок 2 - Древовидная дендограмма разбиения совокупности
субъектов РФ по уровню национального богатства, находящегося на их территориях
По оси абсцисс расположены субъекты РФ, по оси ординат отражено значение интегрального показателя, представляющее величину, сформированную на основе отобранных показателей. Данный показатель не имеет единицы измерения, и является своего рода многомерной статистической оценкой.
Согласно представленных на рисунке 2 результатов кластеризации, можно сделать вывод о наличии двух кластеров и двух выбросов (г. Москва и Тюменская область). Так как выбросами являются объекты с максимальными значениями, они не будут рассматриваться в дальнейшем анализе.
В первый кластер вошли 24 субъекта (объекты заключены между Свердловской обл. и Воронежской обл.), данная группа характеризуется самыми высокими средними значениями показателей. Второй кластер включает 52 района (объекты заключены между Республикой Алтай и Белгородской обл.) с наименьшими запасами национального богатства.
Так как в нашем распоряжении имеются данные, представленные двумя группами, обратимся к методике использования в классической линейной регрессии фиктивных переменных и построим модель на основе всей совокупности. Данный подход обладает следующими важными преимуществами:
Во-первых, дает возможность выявить новые закономерности;
Во-вторых, имеется простой способ проверки, является ли воздействие качественного фактора значимым;
В-третьих, при условии выполнения определенных предположений регрессионные оценки оказываются более эффективными.
В нашем случае имеем дело с регрессионной моделью, в которой фиктивная переменная находится в правой части модели и имеет две
альтернативы:
{О, субъект относится к 1 — му кластеру
jl !»■ ^ ________________
1Г цуиьекг итнииится к Z — му кластеру
Регрессионная модель примет следующий вид:
где: GRP (от англ. gross regional product) - валовой внутренний продукт субъектов РФ.
Коэффициент аг в приведенной модели называется дифференциальным коэффициентом свободного члена, так как он показывает, на какую величину отличается свободный член модели при значении фиктивной переменной,
равной единице, от свободного члена модели при базовом значении фиктивной переменной.
В результате ожидаемый объем ВРП при соответствующем значении фактора х будет:
. /(у\х, &иир = о) = ав +- а±хь для 1-го кластера;
- ^у\х,СЕиР = 1) = ащ + + а^СИиР = (ав +- а,) + а^х1 дЛЯ 2-го кластера.
Оценка уравнения включающего все независимые переменные, наряду с фиктивной переменной, не дала нам желаемых результатов, т.е. не была сформирована множественная модель, содержащая все имеющиеся регрессоры. В связи с этим, рассмотрим регрессии, отражающие различия между кластерами по каждому независимому показателю (таблица 1).
Согласно представленным в таблице 1 результатам, все коэффициенты при фиктивной переменной получены с отрицательным знаком, что указывает на перевес в сторону первого кластера (так как в качестве базы выбран первый кластер), выявленная закономерность подтверждает сделанные выше заключения о лидирующих позициях субъектов первого кластера и отстающих второго.
Таблица 1 - Значения параметра при переменой при различных
сочетаниях регрессоров
Регрессоры Параметр при ошр /-статистика Стьюдента параметра при СЯ11Р Д1
и СИиР * -36920 -0,798 0,912
№РА. и снир ** -114457 -2,086 0,866
N Р Лэ и ОКиР ** -178226 -2,843 0,817
Ри £гКиР ** -435523 -7,600 0,759
д СЯСУР ** -250666 -5,323 0,871
РЛ3 0 СЯСУР ** -267263 -7,021 0,910
и снир ** -108166 -2,802 0,931
РД5 и £гКиР ** -309241 -7,993 0,901
РАъ и саир ** -306232 -7,845 0,900
РЛ7 и с?кир ** -544616 -7,991 0,627
НК, и скир * -117115 -1,834 0,829
НИ. и скир * -82023 -1,355 0,851
НК3 и сяир* -42747 -0,671 0,848
14€1 и сяир ** -686050 -8,667 0,528
Л1С- и окир ** -647065 -9,010 0,531
мс3 и окир ** -621652 -7,352 0,528
Примечание: *- различия по группам отсутствуют; **- различия по группам присутствую, при этом наблюдается перевес в сторону первого кластера
Опираясь на значение /-статистики Стьюдента, можно утверждать об отсутствии статистически значимых различий в случае дифференциации субъектов по величине переменной N РА! и группе переменных, характеризующих человеческий капитал. Существенное различие наблюдается по переменным, относящимся к группе финансовых активов, о чем свидетельствуют высокие значения коэффициента детерминации.
Для иллюстрации информативных возможностей моделей с фиктивными переменными выберем вариант с наибольшим значением £:, результаты оценки уравнения представим в таблице 2.
Таблица 2 - Результаты оценивания множественного линейного
уравнения регрессии с фиктивной переменной
в Стандартная ошибка в Параметры уравнения Стандартная ошибка параметров /(73) ^-уровень значимости
Свободный член уравнения 237887 79094,27 3,008 0,004
РА* 0,877 0,043 6,387 0,31 20,405 0,000
скир -0,120 0,043 -108166 38605,72 -2,802 0,007
Значение коэффициента Я равное 0,965 показывает, что между
выделенными независимыми переменными и ВРП существует сильная
взаимосвязь. Значение коэффициента детерминации показывает, что учтенные в модели регрессоры обуславливают 93,1% вариации зависимой переменной, а оставшиеся 6,9% приходятся на неучтенные (не включенные) факторы. В свою очередь высокое значение ^-статистика Фишера (491,63) при уровне значимости р<0,00 указывает на статистическую значимость модели в целом. Также стоит отметить о значимости всех параметров уравнения по /-статистике Стьюдента.
Из общего уравнения можно сформировать частные:
_ = 237887 +- 6,387К44;. для 1_г0 кластера;
- 0И?1 = 129721 +- 6,387^4,. для 2-го кластера.
В пакете STATISTICA возможно представить результаты построения модели с фиктивными переменным в наглядном виде, для этого обратимся рисунку 3.
2.6Е6
2,4Е6
2,2Е6
2Е6
1.8Е6
1.6Е6
1,4Еб
1,2Еб
1Е6
8Е5
6Е5
4Е5
2Е5
О
-2Е5 -50000
1 1 1 1 1 1 1 1 1 1111 1111 ■ III 1111 1 1 1 1 1 1 1 1 1
о
Частное уравнение регрессии для 1 кластера
° 8
- Л "о Частное уравнение регрессии для 2 кластера
и . С®' Мл о
^ О
0
50000
1Е5
2.5Е5
ЗЕ5
3.5Е5
4Е5
1.5Е5 2Е5
FAA
о Фактические занчения ВРП □ Предсказанные значения ВРП Рисунок 3 - Результаты построения регрессионной модели зависимости объема ВРП от переменных и СЯУР
Представленный график наглядно демонстрирует преобладание субъектов вошедших в первый кластер над субъектами второго кластера, опираясь на приведенные модели можно сформировать матрицу предсказанных значений ВРП (таблица 3).
Таблица 3 - Предсказанные значения ВРП при различных значениях регрессоров
№ кластера Варианты Значения РАЛ Точечное предсказание Доверительная граница
нижняя верхняя
1 кластер среднее 114020 857929 812960 902898
минимум 22119 271486 199355 343618
максимум 348231 2352497 2201893 2503100
2 кластер среднее 27167 195589 165609 225568
минимум 1380 31035 -2865* 64934
максимум 69788 467565 427779 507351
Примечание: *-не имеет экономической интерпретации
Приведенные данные свидетельствуют о значительном влиянии на размер ВРП закредитованности физических лиц, особенно большое значение это имеет для субъектов, вошедших в 1 кластер.
В результате проделанной работы, можно сформулировать ряд выводов:
Во-первых, имеющиеся данные не позволили нам сформировать множественного уравнения (со всеми показателями характеризующие элементы национального богатства) с фиктивной переменной, характеризующей дифференциацию субъектов РФ на кластеры, что объясняется высокой коллинеарностью регрессоров.
Во-вторых, уравнения регрессии при различных сочетаниях регрессоров и фиктивной переменной показали, что человеческий капитал не является причиной разграничения субъектов на группы (вероятно, имеется различия не в параметре а в параметре %), в свою очередь показатели из блока «финансовые активы» оказывают существенное влияние на дифференциацию.
В-третьих, отрицательный знак параметра при фиктивной переменной указывает на доминирование субъектов вошедших в первый кластер, этот факт объясняется тем, что в первую группу вошли «сильные» субъекты с развитой инфраструктурой, промышленностью и торговлей.
Библиографический список:
1. Лимонова Н.Г. Сравнительная характеристика методик измерения элементов национального богатства / Н.Г. Лимонова // Научное обозрение. 2012. № 3. С. 395-399.
2. Лимонова Н.Г. Структурные и институциональные проблемы оценки национального богатства / Н.Г. Лимонова // Казанская наука. 2011. № 1. С. 147-148.
3. Цыпин А.П. Качество официальных статистических материалов / А.П. Цыпин // Интеллект. Инновации. Инвестиции. 2013. № 1. С. 88-93.
4. Цыпин А.П. Сопоставимость показателей, явлений и процессов во времени: постановка проблемы / А.П. Цыпин // Вестник Оренбургского государственного университета. 2010. № 13 (119). С. 243-248.
5. Цыпин А.П. Статистический анализ трансформации экономики России : диссертация на соискание ученой степени кандидата экономических наук / А.П. Цыпин. - Оренбург : 2005. № 61 05-8/4386. - 199 с.
Bibliography:
1. Limonova N.G. Comparative characteristic of techniques of measurement of elements of national wealth // Scientific review. - 2012. - № 3. - P. 395-399.
2. Limonova N.G. Structural and institutional problems of an assessment of national wealth // Kazan science. - 2011. - № 1. - P. 147-148.
3. Tsypin A.P. Quality of official statistical materials // Intelligence. Innovations. Investments. - 2013. - № 1. - P. 88-93.
4. Tsypin A.P. Comparability of indicators, the phenomena and processes in time: problem statement // Messenger of the Orenburg state university. - 2010. № 13 (119). - P. 243-248.
5. Tsypin A.P. Statistical analysis of transformation of economy of Russia : the thesis on competition of a scientific degree of Candidate of Economic Sciences
- Orenburg : 2005. № 61 05-8/4386. - 199 p.