Анализ канонических корреляций показателей эколого-социально-экономического развития региона
Сыровацкая Ирина Владимировна Аспирант кафедры статистики и эконометрики Оренбургский государственный университет
Irina [email protected]
Аннотация. В статье рассмотрен метод анализа канонических корреляций системы статистических показателей, характеризующих экологосоциально-экономическое развитие региона.
Abstract. In article the method of the analysis of initial correlations of system of the statistics characterizing ecological, social and economic development of region is considered.
Ключевые слова: эколого-социально-экономическое развитие
региона, система статистических показателей, анализ канонических корреляций.
Keywords: ecological, social and economic development of region, system of statistics, the analysis of initial correlations.
Изучение закономерностей развития системы экономика-общество-природа является в настоящее время весьма актуальным: в центре внимания многих учёных находится важная задача соизмерения экономического развития с качеством жизни населения и возможностями окружающей природной среды воспринимать последствия такого развития.
Статистическое исследование эколого-социально-экономического развития региона возможно в рамках системного подхода, т.е. когда изучению подлежит влияние не отдельных факторов на процессы развития и их результаты, а целая система факторов и результатов [8]. Обоснование
того, что система показателей региональной статистики соответствует принципам системного подхода, представлено в работе [6, с.17- 18].
На основе системы статистических показателей, построенной в соответствии с принципами системного анализа и адекватно отражающей состояние и развитие экономики, общества и окружающей природной среды, может быть получена полная, своевременная и достоверная статистическая информация, которая будет в дальнейшем использована для принятия управленческих решений на уровне региона и его административнотерриториальных образований.
В соответствии со Стратегией социально-экономического развития Оренбургской области [1] нами была предложена система статистических показателей, характеризующая экологическое, социальное и экономическое развитие региона в целом и в разрезе его административно-территориальных образований (городов и районов) [7].
Рис. 1 - Блочная архитектура системы статистических показателей, характеризующих эколого-социально-экономическое развитие региона
Докажем, что сформированная нами система статистических показателей, характеризующая эколого-социально-экономическое развитие региона является системой, отвечающей принципам системного анализа, а не произвольным набором, перечнем показателей, посредством изучения наличия, тесноты и направления связи между структурными элементами системы показателей. Ставится задача статистического исследования зависимостей между направлениями и блоками показателей сформированной системы методом анализа канонических корреляций. Практическая реализация метода осуществлялась в ППП Statistica 6.0 [2].
Анализ канонических корреляций проводился по 47 административнотерриториальным образованиям (12 городам и 35 районам) Оренбургской области, относящейся к группе регионов со слабой устойчивостью тенденции роста экономики, которую формируют более одной трети регионов РФ, обеспечивающих экономический рост [5]. Период исследования определён шестилетием, начиная с 2004 г. Этот период характерен завершением перехода государственной статистики в РФ к новой системе классификации -по видам экономической деятельности, и учётом экономических показателей согласно ОКВЭД. Показатели, имеющие стоимостные единицы измерения, были пересчитаны в сопоставимые цены 2009 года с помощью индекса-дефлятора валового регионального продукта. Чтобы избежать так называемой «привязки» к территории, часть показателей была получена расчётным путём (на душу населения; на 1000 человек трудоспособного населения; на 1000 населения). Для анализа использовались официальные публикации территориального органа Федеральной службы государственной статистики по Оренбургской области.
В ходе проверки предпосылок применения метода канонических корреляций выявлено, что совокупность из 57 показателей имеет многомерное нормальное распределение. Анализ вариации показал, что практически по всем рассмотренным показателям наиболее выделяется г. Оренбург, т.е. является “выбросом”. При проведении анализа
канонических корреляций рекомендуется выявлять и исключать выбросы. Однако исключать выявленный “выброс” из совокупности городов и районов Оренбургской области не целесообразно, так как г. Оренбург представляет собой субъект экономической деятельности, имеющий хозяйственные связи с другими городами и районами региона.
Канонический анализ позволяет исследовать зависимость между двумя множествами переменных (в нашем случае - блоками показателей), при этом достаточно ограничиться рассмотрением небольшого числа наиболее коррелированных линейных комбинаций из каждого множества (блока показателей) [4].
Для рассмотрения берутся взвешенные суммы по множествам, чтобы веса, приписанные отдельным слагаемым, соответствовали реальной “структуре” переменных, т.е. их взаимной значимости:
а1У1 + а2У2 + ... + арУр = Ь1Х1 + Ь2Х2 + ... + Ъс1Хс1 , (1)
При этом под знаком “ = ”, подразумевается наличие стохастической взаимосвязи между линейными комбинациями переменных обоих множеств.
Таким образом, если имеются два множества, содержащие р и q переменных соответственно, то будет исследоваться зависимость между взвешенными суммами переменных из каждого множества (т.е. между линейными комбинациями р и q переменных соответственно).
После того как сформулировано в общем виде “уравнение модели” для канонической корреляции, определяются веса для двух наборов переменных. При подборе весовых коэффициентов исходят из условия максимальной коррелированности двух множеств, т.е. рассматриваются все максимально коррелированные взвешенные суммы (максимизируется значение корреляции между каноническими переменными). При этом последовательно получаемые пары канонических переменных не коррелированны друг с другом и объясняют всё меньшую и меньшую долю изменчивости.
Взвешенные суммы определяют канонический корень, или каноническую переменную, число канонических корней равно числу переменных в меньшем множестве.
Проанализируем корреляции внутри и между множествами -показателями направлений “Развитие человеческого потенциала” и “Общеэкономические ориентиры”. В первом множестве (показатели направления “Развитие человеческого потенциала”) наибольшая зависимость наблюдается между переменными Y3 - На 1000 человек трудоспособного возраста приходится лиц старше трудоспособного возраста и Y5 -Коэффициент смертности (на 1000 человек населения): коэффициент парной корреляции равен 0,87. Во втором множестве (показатели направления “Общеэкономические ориентиры”) сильная зависимость наблюдается между Х1 - Сальдированный финансовый результат (прибыль минус убыток) деятельности организаций на одно предприятие (тыс. руб.) и Х4 - Инвестиции в основной капитал на душу населения (в сопост. ценах; руб.): коэффициент парной корреляции равен 0,92. Для переменных из разных множеств наибольшая корреляция выявлена между Y28 - Оборот розничной торговли на душу населения (руб.) и Х14 - Грузооборот автомобильного транспорта организаций всех видов деятельности (тыс. тонно-км): коэффициент парной корреляции равен 0,93. Предположительно, что переменные Y3, Y5, Y28, Х1, Х4 и Х14 будут определять значение канонической корреляции между двумя множествами показателей.
Далее вычислено столько собственных значений матрицы В = R 1 pp • Rpq • R ^ • Rqp, сколько имеется канонических корней (т.е. столько,
сколько переменных содержит наименьшее множество). Собственные значения матрицы B, ранжированные по убыванию, равняются квадратам канонических корреляций (коэффициентам корреляций между множествами). Для каждого канонического корня значения канонической корреляции, статистики %2, р - уровень приведены на рис. 2.
Root Removed Chi-Square Tests with Successive Roots Removed (Среди
Canonicl R Canonicl R-sqr. Chi-sqr. df P Lambda Prime
0 0,999841 0,999682 755,5494 434 0,000000 0,000000
1 0,996830 0,993669 570,3406 390 0,000000 0,000000
2 0,992050 0,984163 453,9078 348 0,000122 0,000000
3 0,986153 0,972498 358,5627 308 0,025516 0,000000
4 0,963917 0,929136 275,9126 270 0,389812 0,000006
5 0,934259 0,872839 215,0317 234 0,807270 0,000087
6 0,908247 0,824912 167,5987 200 0,953385 0,000684
7 0,865402 0,748921 127,5220 168 0,991189 0,003909
8 0,823866 0,678756 95,7362 138 0,997577 0,015569
9 0,791569 0,626581 69,6185 110 0,999039 0,048466
10 0,743221 0,552378 46,9622 84 0,999637 0,129790
11 0,659626 0,435107 28,4747 60 0,999819 0,289954
12 0,642993 0,413440 15,3390 38 0,999602 0,513291
13 0,353432 0,124914 3,0690 18 0,999967 0,8750861
Рис. 2 - Канонические корреляции между показателями направлений “Развитие человеческого потенциала” и “Общеэкономические ориентиры”
Данный рисунок показывает, что статистически значимым являются первые десять канонических корней, которым соответствуют первые десять пар канонических переменных. Однако мы ограничимся рассмотрением первой пары канонических переменных, для которой наблюдается максимальное значение канонической корреляции R = 0,9998:
^ V1 = ОД4у1 + 0,13у2 + ...1,04^9 - 0,93у20 +... - 0,55Уз0 + 0,09^3! и1 = 0,36х1 - 0,19х2 +... - 0,06х11 - 0,24х12 + 0,11х13 +1,17х14
Значение канонической корреляции R = 0,9998, свидетельствует о наличии сильной зависимости между показателями направлений “Развитие человеческого потенциала” и “Общеэкономические ориентиры”. Статистика X1 = 755,5 и уровень значимости р = 0,00 показывают значимость данной канонической корреляции.
Так как канонический корень представляет собой две взвешенные суммы, по одной на каждое множество, то для толкования “смысла” канонического корня рассматриваются канонические веса, сопоставленных каждому множеству переменных. Чем больше приписанный вес (т.е.
абсолютное значение веса), тем больше вклад соответствующей переменной (показателя) в значение канонической переменной. Рассмотрение канонических весов позволяет увидеть, как конкретные переменные (показатели) в каждом множестве влияют на взвешенную сумму (т.е. каноническую переменную).
Из выражения (2) видно, что для левого множества (показатели направления “Развитие человеческого потенциала”) наибольший вклад в значение первой канонической переменной вносят Y19 - Численность врачей на 10000 человек населения. Для правого множества (показатели направления “Общеэкономические ориентиры”) наибольший вклад в значение первой канонической переменной вносит Х14 - Грузооборот автомобильного транспорта организаций всех видов деятельности (тыс. тонно-км).
Канонические веса соответствуют уникальному вкладу, вносимому соответствующей переменной (показателем) во взвешенную сумму или каноническую переменную; коэффициенты канонической корреляции соответствуют корреляции между взвешенными суммами по двум множествам переменных. Однако, они не говорят ничего о том, какую часть изменчивости (дисперсии) каждый канонический корень объясняет в переменных.
Тем не менее, можно сделать заключение о доле объясняемой дисперсии, рассматривая нагрузки канонических факторов. Нагрузки канонических факторов представляют собой обычные корреляции между каноническими переменными и показателями из каждого множества, и их можно интерпретировать так же, как и в факторном анализе (таблица 1).
Наиболее тесная корреляционная связь существует между канонической переменной V1 и показателями первого множества Y28 -Оборот розничной торговли на душу населения (коэффициент корреляции равен 0,69) и Y19 - Численность врачей на 10000 человек населения (коэффициент корреляции равен 0,63).
Таблица 1 - Факторная нагрузка канонических переменных V1 и U1
Каноническая переменная V1 Каноническая переменная и1
У1 0,17 У17 0,08 Х1 0,11
У2 -0,14 У18 0,42 Х2 -0,37
У3 0,02 У19 0,63 Х3 -0,03
У4 -0,17 У20 0,27 Х4 0,12
У5 0,00 У21 0,29 Х5 -0,06
У6 -0,07 У22 0,17 Х6 0,09
У7 -0,23 У23 -0,04 Х7 0,09
У8 -0,17 У24 0,01 Х8 0,21
У9 -0,18 У25 0,09 Х9 -0,07
У10 -0,12 У26 -0,05 Х10 0,08
У11 0,08 У27 0,04 Х11 -0,06
У12 0,11 У28 0,69 Х12 -0,02
У13 -0,03 У29 0,49 Х13 0,09
У14 -0,12 У30 0,17 Х14 0,84
У15 0,14 У31 -0,03
У16 0,21
Каноническая переменная U1 тесно связана с Х14 - Грузооборот автомобильного транспорта организаций всех видов деятельности (коэффициент корреляции равен 0,84).
На основе этих корреляций между каноническими переменными и показателями из каждого множества получают меру избыточности множества переменных, которая показывает насколько реальная изменчивость в одном множестве переменных объясняется другим множеством. Общая избыточность для первого множества составляет 56,1 %, т.е. показатели направления “Развитие человеческого потенциала” объясняют 56,1 % вариации показателей направления “Общеэкономические ориентиры”; которые в свою очередь объясняют 79,7 % вариации показателей первого множества.
Аналогичным образом были исследованы взаимосвязи показателей направлений “Развитие человеческого потенциала” и “Создание комфортной
среды обитания”; “Общеэкономические ориентиры” и “Создание комфортной среды обитания” (таблицы 2 и 3 соответственно).
Таблица 2 - Общие результаты анализа канонических корреляций между направлениями “Развитие человеческого потенциала” и “Создание комфортной среды обитания”
Направление “Развитие человеческого потенциала” Направление “Создание комфортной среды обитания”
Каноническая корреляция R = 0,99740. Зависимость сильная X1 = 589.46 р = 0,0000 Каноническая корреляция значима. Максимальная корреляция между показателями: У21 - Число больничных коек на 10000 человек населения и 29 - Уровень преступности (коэффициент парной корреляции гху =0,71).
Левое множество Правое множество
Общая избыточность: 49,3% Наибольший вклад в зависимость вносит: У19 - Численность врачей на 10000 человек населения Общая избыточность: 78,1% Наибольший вклад в зависимость вносит: 29 - Уровень преступности
Существующую зависимость направлений “Развитие человеческого потенциала” и “Создание комфортной среды обитания” во многом определяют показатели У19 - Численность врачей на 10000 человек населения и 29 - Уровень преступности (таблица 2). Общая избыточность правого множества составляет 78,1%, левого - 49,3%.
Взаимосвязь направлений “Общеэкономические ориентиры” и “Создание комфортной среды обитания” наиболее сильно проявлена через вклад показателей Х4 - Инвестиции в основной капитал на душу населения и 28 - Наличие квартирных телефонных аппаратов сети общего пользования на 1000 человек населения (коэффициент канонической корреляции равен
0,95). Рассматриваемые множества в равной степени объясняют вариацию друг друга (таблица 3).
Таблица 3 - Общие результаты анализа канонических корреляций между направлениями “Общеэкономические ориентиры” и “Создание комфортной среды обитания”
Направление “Общеэкономические ориентиры” Направление “Создание комфортной среды обитания”
Каноническая корреляция R = 0,95287 З X2 = 250.49 р = 0,0000 Каноническая Максимальная корреляция между показат Х8 - Число организаций, имевших веб-сайг телефонных аппаратов сети общего поль (коэффициент парной корреляции гху =0,7 ависимость сильная корреляция значима елями: п и 28 - Наличие квартирных зования на 1000 человек населения 4).
Левое множество Правое множество
Общая избыточность: 43,4% Наибольший вклад в зависимость вносит: Х4 - Инвестиции в основной капитал на душу населения Общая избыточность: 44,1% Наибольший вклад в зависимость вносит: 28 - Наличие квартирных телефонных аппаратов сети общего пользования на 1000 человек населения
Анализ канонических корреляций между блоками показателей внутри направления “Развитие человеческого потенциала” выявил, что наиболее сильная зависимость существует между блоками показателей “Демографическая структура и воспроизводство населения” и “Сфера образования, культуры и искусства” (коэффициент канонической корреляции равен 0,942). Наибольший вклад в зависимость двух множеств вносят показатели: У3 - На 1000 человек трудоспособного возраста приходится
лиц старше трудоспособного возраста и У24 - Число мест в учреждениях культурно-досугового типа на 1000 человек населения.
Внутри направления “Общеэкономические ориентиры” показатели Х4 - Инвестиции в основной капитал на душу населения и Х12 - Ввод в действие жилых домов на 1000 человек населения вносят наибольший вклад в сильную зависимость между блоками “Финансы и инвестиции” и “Производство товаров и услуг (по основным видам экономической деятельности” (коэффициент канонической корреляции составил 0,853).
Внутри направления “Создание комфортной среды обитания” между блоками “Экологическая сфера” и “Жилищные условия населения” проявлена умеренная зависимость (коэффициент канонической корреляции равен 0,725), отметим, что показатели блока “Жилищные условия населения” способствуют существенным изменениям в социальной сфере -каноническая корреляция с блоком “Безопасность социальной сферы” равна 0,571.
Аналогичным образом проводился анализ канонических корреляций между блоками показателей различных направлений.
Таким образом, результаты канонического анализа показателей сформированной системы (рис. 1) показал наличие статистической зависимости между структурными элементами. Данное обстоятельство говорит о том, что предложенная нами система статистических показателей эколого-социально-экономического развития региона не является произвольным перечнем показателей, отвечает основным принципам системного анализа и является системой как таковой.
Библиографический список:
1. Стратегия развития Оренбургской области до 2020 года и на период
до 2030 года [Электронный ресурс] : утверждена постановлением
Правительства Оренбургской области от 20 августа 2010 года № 551-пп. -Оренбург, 2010. - Режим доступа : http://www.orenburg-
gov.ru/magnoliaPublic/regportal/strateg/2030.html. - Дата обращения 15.10.2010.
2. Боровиков, В. П. STATISTICA. Искусство анализа данных на компьютере : для профессионалов. - СПб. : Питер, 2003. - 688 с.
3. Дрогобыцкий, И. Н. Системный анализ в экономике : учеб. пособие / И. Н. Дрогобыцкий. - М. : Финансы и статистика, 2007. - 512 с.
4. Дубров, А. М. Многомерный статистические методы : учеб. / А. М. Дубров, В. С. Мхитарян, Л. И. Трошин. - М. : Финансы и статистика, 2000. -352 с.
5. Зарова, Е. В. Качество экономического роста региона : методологические аспекты статистического исследования / Е. В. Зарова, М. А. Котякова // Вопросы статистики, 2006. - № 5. - С. 51-61.
6. Региональная статистика : учеб. / под ред. Е. В. Заровой. - М. : Финансы и статистика, 2006. - 624 с.
7. Сыровацкая, И. В. Формирование системы статистических показателей, характеризующих социально-экономическое развитие региона: методологические аспекты / И. В. Сыровацкая // Вестник СГЭУ, 2011. -№5 (79). - С.86-90.
8. Юзбашев, М. М. Системный эффект в экономике и жизни / М. М. Юзбашев, Т. М. Михайлова // Вопросы статистики, 2007. - № 11.-С.71-73.