Жгун Т.В.1, Липатов А.В.2, Лемешова Д.Д.3
1 Новгородский государственный университет им. Ярослава Мудрого, г.Великий Новгород, к.ф.-м.н., доцент кафедры прикладной математики и информатики, zhtv @. mail.ru
2 Новгородский государственный университет им. Ярослава Мудрого, г.Великий Новгород,
аспирант
3 Новгородский государственный университет им. Ярослава Мудрого, г.Великий Новгород,
магистрант
ПРИМЕНЕНИЕ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ ДЛЯ ПОСТРОЕНИЯ ОБЪЕКТИВНЫХ ПОКАЗАТЕЛЕЙ ИЗМЕНЕНИЯ КАЧЕСТВА СИСТЕМЫ
КЛЮЧЕВЫЕ СЛОВА
Качество системы управления, интегральная характеристика качества, изменение характеристики качества, интегральные индикаторы качества жизни, шум в измеряемых данных, отношение сигнал/шум, метод главных компонент, информативность метода главных компонент.
АННОТАЦИЯ
В статье предложен алгоритм определения композитного индекса изменения качества системы на основе метода главных компонент с учетом наличия шума в измеряемых данных. Построение латентной интегральной характеристики рассматривается как задача выделения полезного сигнала из массива данных в условиях априорной неопределенности и решается на основании задаваемого отношения сигнал/шум. Алгоритм был использован для получения интегральных индикаторов качества жизни населения субъектов Российской Федерации.
Введение
Интегральные характеристики качества системы используются при решении задач управления для совершенствования механизмов управления на основании сопоставления интегральных индикаторов рассматриваемых объектов и рейтингов объектов, определяемых их интегральными характеристиками, и являются показателем степени достижения цели управления. Сводные (интегральные) показатели различных синтетических категорий социально-экономического развития (в том числе качества жизни населения) широко используются как в межстрановом и межрегиональном макроэкономическом анализе, так и в теории и практике социально-экономического управления [1]. С 1974 года выходит специальный международный журнал Social Indicators Research, который публикует результаты исследований, касающихся измерения качества жизни муниципальных, региональных, национальных и международных систем.
К числу наиболее часто используемых показателей качества жизни относится Индекс развития человеческого потенциала (ИРЧП), который активно используется Организацией объединенных наций начиная с 1990 года. В рамках ежегодных «Докладов о человеческом развитии» даются определенные представления о соотношении качества жизни в разных странах мира на основании этого рейтинга [2]. Среди отечественных исследований, наиболее обоснованным подходом к оценке качества жизни населения регионов России, следует отметить работы С.А. Айвазяна [3-4]. Согласно его методике, вектор интегральных индикаторов есть проекция матрицы предобработанных данных А на первую главную компоненту. Этот метод используется для оценки статических систем, когда первая главная компонента хорошо приближает моделируемую ситуацию, т.е. если максимальное собственное число ковариационной матрицы дает вклад не менее 70% в сумму всех собственных чисел. Такое соотношение выполняется, если рассматривается небольшое количество признаков (не более пяти) и одно из свойств системы доминирует над остальными. При описании социально-экономических систем число переменных значительно более пяти, и структура системы не допускает простого приближения. В качестве выхода из этой ситуации рассматривается согласно [4] понижение порога информативности до 55% и деление исходной системы на подсистемы, описываемые
меньшим количеством переменных. Однако применение этой методики для ряда последовательных наблюдений дает неудовлетворительные результаты.
В статье предлагается алгоритм построения интегральной характеристики изменения качества системы. Построение латентной интегральной характеристики производится на основе метода главных компонент с учетом наличия шума в измеряемых данных. При этом информативность получаемого решения оценивается апостериорно на основании дисперсионного критерия и выбранного параметра отношения сигнал/шум. С помощью предложенного алгоритма построены интегральные индикаторы качества жизни субъектов Российской Федерации за 20072012 годы.
1 Постановка задачи вычисления интегральной характеристики изменения качества системы
Рассмотрим построение интегральной оценки системы из т объектов, для которой известны таблицы описаний объектов для ряда наблюдений - матрицы размерностью тхп
лt_( ] п, т _„
А ={ } ' t = 1, 2, ... , р. . Для каждого момента t вектор интегральных показателей
'i,j=l имеет вид
t t t
где qt = (q 1 q qm )T - вектор интегральных индикаторов момента t,
q
t-Atwt, (1)
wt = (w 1 w^ wtmУ - вектор весов показателей для момента t, Ac -матрица
предобработанных данных для момента t. Для построения интегрального индикатора качества системы требуется найти веса показателей W для каждого момента времени.
Будем рассматривать оцениваемый объект как сложную (не поддающуюся удовлетворительной формализации), большую (число состояний выше современных вычислительных возможностей) систему. Такими системами являются как каждый биологический объект, так и любая социальная система. Система доступна для наблюдения, и известно конечное, достаточно большое число регистрируемых с некоторой точностью численных характеристик этой системы в разные моменты времени. Значимость регистрируемых показателей для функционирования системы в общем случае неизвестна. Для решения задачи управления требуется дать мотивированную оценку каждого наблюдаемого объекта на всем промежутке наблюдений, т.е. вычислить в динамике интегральную характеристику качества системы. Численные характеристики системы предварительно подвергнуты унификации - приведению значений переменных на отрезок [0, 1] по принципу: «чем больше, тем лучше».
Любое измерение, в том числе и статистическое, неизбежно связано с точностью измерительного прибора, поэтому результат измерения неизбежно содержит неустранимую ошибку. Построение интегральной характеристики системы можно рассматривать как задачу выделения полезного сигнала на фоне шумов в условиях отсутствия априорной информации о статистических характеристиках аддитивного шума и полезного сигнала при наличии единственной реализации измеряемого процесса. Эта задача аналогична задаче восстановления цифровых изображений, искаженных белым гауссовским шумом. Метод главных компонент (МГК) позволяет выделить структуру в многомерном массиве данных и с успехом применяется для распознавания изображений и для шумоподавления.
Количественные характеристики конкретной системы, функционально связанные с ее структурными особенностями и условиями ее работы, зависят от отношения сигнала к шуму. Это отношение часто используется для количественной оценки эффективности различения сигналов в оптико-электронных, телевизионных автоматических системах, в средствах контроля и диагностики.
ОСШ - отношение сигнал/шум (англ. signal-to-noise ratio, сокр. SNR) представляет собой отношение сигнала (а если точнее, суммы сигнала и шума) к шуму. Величина может быть вычислена либо как безразмерное отношение амплитуды сигнала к амплитуде шума: SNR = As / An ; либо в децибелах: SNR ( dB) = 20-log10(As/ An) . Эта величина наиболее полно описывает качество воспроизведения сигнала в телевизионных системах, в системах мобильной связи, в астрофотометрии.
Выбор порогового значения отношения полезного сигнала к шуму фона, позволяющего различить сигнал на фоне шума, обоснован в [5]. Современные технические системы (и человеческий глаз) уверенно выделяют сигнал из шума, если уровень ОСШ системе составляет
около 7 дБ (или в безразмерных единицах 2,2). Такое пороговое значение используется в фотометрии слабых объектов: при регистрации сигнала от тусклых звезд необходимо, чтобы отношение сигнал/шум превышало 2,2. Телевизионные системы могут восстановить неповрежденную картинку, если отношение уровня сигнала к уровню шумов превосходит пороговое значение около 7дБ.
Статистические данные неизбежно содержат погрешность измерения. Любой результат, полученный на основании этих данных, будет содержать неустранимую ошибку. Переход к другому моменту времени означает изменение данных, которое при неизменной структуре системы вызвано как изменением ситуации, так и случайными ошибками. Метод главных компонент на основании различных для разных моментов значений собственных векторов и собственных значений описывает неизменную структуру системы. Следовательно, именно значения собственных чисел и собственных векторов будут тем сигналом, который нужно распознать, т.е. по имеющимся реализациям выделить сигнал из зашумленных данных.
Предположение о том, что при вариации входных данных у собственных чисел имеется общая тенденция, иллюстрирует рис. 1, где представлены значения упорядоченных по убыванию собственных чисел для разных наблюдений. В среднем значении рассматриваемых величин хорошо просматривается тенденция (сигнал) и случайное отклонение от нее.
Номер собственного числа
Рис. 1. Собственные значения ковариационной матрицы переменных для различных моментов наблюдения
Собственные вектора определяются с точностью до направления, в отличие от собственных чисел, определяемых однозначно. Среднее значение факторных нагрузок переменных зависит от выбранного направления и не может однозначно характеризовать сигнал. Следовательно, на основе вычисленных для различных наблюдений собственных векторов (упорядоченных в порядке убывания собственных чисел) нужно распознать случайные и неслучайные компоненты этих векторов и определить значения координат неслучайных
Рис. 2. Согласование направлений собственных векторов для первой главной компоненты. Слева - исходные направления собственных векторов, справа - выбор направления собственных векторов, обеспечивающего максимальную сумму амплитуд действующих сигналов
Наличием неслучайного (т.е. значимого) вклада переменной в структуру главных компонент будем считать не большую величину факторной нагрузки, а инвариантность факторной нагрузки при возмущениях, признаком которой будет величина отношения сигнал/шум, определяемая средними значениями переменной и среднеквадратичным отклонением. Если это отношение выше порогового значения, такую переменную считаем неслучайной - действующей. При невыполнении такого соотношения переменная характеризует шумовую составляющую сигнала и не участвует в дальнейшем рассмотрении.
Для проверки этого условия нужно согласовать направления собственных векторов, которые определяются с точностью до направления, в отличие от собственных чисел, определяемых однозначно. На рис. 2 представлен выбор направления собственных векторов для первой главной компоненты.
2 Алгоритм построения интегральной характеристики изменения качества системы на основании регистрируемых измерений как решение задачи выделения полезного сигнала на фоне шумов
Приведем алгоритм построения интегральной характеристики изменения качества системы для ряда наблюдений на основании регистрируемых измерений, который обеспечивает решение задачи выделения сигнала в многомерном массиве данных в условиях априорной неопределенности о свойствах полезного сигнала на основании задаваемого отношения сигнал/шум. Алгоритм включает следующие шаги: 1 шаг. Подготовка данных.
• выбор значения ОСШ для рассматриваемой системы;
• определение набора переменных и деление исходных переменных на блоки, исходя из содержательных соображений;
• обеспечение однородности выборки: устранение пропущенных значений, коллинеарности данных; унификация показателей.
Если исходный показатель связан с анализируемым интегральным свойством качества жизни монотонной зависимостью, то при унифицировании исходных показателей (приведении их на отрезок [0, 1] по принципу «чем больше, тем лучше») переменные Ху для каждого момента наблюдения преобразовываются по правилу:
где Sj = 0, если оптимальное значение у -го показателя максимально и Sj = 1, если оптимальное значение у -го показателя минимально, ту - наименьшее значение у-го показателя по всей выборке (глобальный минимум), Му - наибольшее значение у-го показателя по всей выборке (глобальный максимум).
Если исходный показатель связан с анализируемым интегральным свойством качества жизни немонотонной зависимостью (т.е. внутри диапазона изменения данного показателя существует некоторое оптимальное значение х°р1, при котором достигается наивысшее качество), то значение соответствующего унифицированного показателя рассчитывается по формуле:
Дальнейшие шаги проделываем для каждого блока отдельно.
2 шаг. Определение априорных собственных векторов и собственных чисел для каждого наблюдения.
• центрирование унифицированных переменных;
• вычисление по центрированным значениям унифицированных показателей ковариационной матрицы, совпадающей в этом случае с матрицей корреляций;
• нахождение для каждого наблюдения собственных значений ковариационной (корреляционной) матрицы, ранжированных по убыванию;
• нахождение собственных векторов, соответствующих соответствующим собственным числам.
Каждый новый элемент центрированной матрицы данных вычисляется по формуле:
а. — а. 7 — ' 1 1
^— s. '
I
1 т 1 т где а~. — — X а. . - выборочная средняя, 5 2 — — X (X. . — X. )2 - выборочная дисперсия, т.е.
1 т 1 11 ] т — 11 1
- выборочное среднеквадратичное отклонение.
3 шаг. Определение эмпирических собственных чисел. Согласование направлению собственных векторов и определение эмпирических главных компонент.
• вычисление эмпирических значений собственных чисел как среднего значения собственных чисел для различных выборок;
• выбор направлению собственных векторов, которое максимизирует сумму ОСШ у действующих переменных (у переменных, для которых вычисленное ОСШ превосходит заданный порог);
• определение эмпирических главных компонент: факторные нагрузки у недействующих переменных обнуляются, для действующих переменных в качестве значения факторной нагрузки принимаем среднее значение по всем наблюдениям (при согласовании направлений собственных векторов);
• выбор числа эмпирических главных компонент (ЭГК) N ( N < П ). Количество выбранных ЭГК N должно обеспечивать заданную информативность у .
4 шаг. Согласование направлений главных компонент.
• нормирование главных компонент, умножением на квадратный корень из соответствующего эмпирического собственного числа;
• согласование направлений нормированных эмпирических главных компонент;
* * *
• нахождение весовых коэффициентов целевой функции ^* — (w 1 w 2 ... w п)
Р
суммированием нагрузок согласованных эмпирических главных компонент ж ■ — X ,
} С—1
у=1, ...и, ( = 1, ... , р.
• вычисление интегрального показателя как сумму произведений значений вектора весов и матрицы унифицированных показателей А1
Я — А1-Ш*, (2)
Для фиксированного момента t интегральную оценку для объекта с номером i записывают в виде аддитивной свертки данных с весами, определяемыми вектором Ш*:
п Р
Я — X ж1 , i = 1, 2, ... т, ж * — X ж* , = 1, 2.....п. (3)
1—1 (—1
5 шаг. Определение весовых коэффициентов блоков и вычисление интегральной характеристики системы.
1)вес блока к, где к = 1, ..., К, определяем пропорционально его информативности У к :
Ук к
жк
X —1 ~ >0;
X Ук к —1
к— 1
2)вычисляем характеристику всей системы, учитывая веса блоков.
Определение информативности интегральной характеристики изложено ниже.
3 Информативность интегральной характеристики изменения качества системы
В алгоритмах вычисления интегральной характеристики по ОСШ-методу [5-8] используется традиционное для МГК понятие информативности, которое определяет число главных компонент 1, используемых для вычисления интегральной характеристики.
X, + X 2+ ... + X,
у=—-2-'- > в (4)
и X+Х2 + ... + X 1)
12 п
Однако размерность пространства признаков в задачах вычисления интегральной характеристики качества сложной системы не является чересчур большой, и вычислительных
проблем при определении собственных чисел и векторов не возникает. А качественное описание структуры системы требует либо всех главных компонент, либо их достаточно большого количества. Может оказаться, что ценная для конкретной задачи информация содержится как раз в направлениях с меньшей дисперсией._Например, при создании цифровой модели рельефа, которая строится по оцифрованным снимкам, восьмая и девятая главные компоненты дают искомый рельеф, а главные компоненты 12 и 13 в методе «Гусеница» свидетельствует о наличии в анализируемых данных периодики с дробным периодом [9, 10].
Подходы к оценке числа главных компонент по необходимой доле объясненной дисперсии формально применимы всегда, однако неявно они предполагают, что нет разделения на «сигнал» и «шум», и любая заранее заданная точность имеет смысл. При разделении данных на полезный сигнал и шум задаваемая точность теряет смысл и требуется переопределить понятие информативности.
Выбор порогового значения ОСШ для рассматриваемой системы определяет выбор связанного с ОСШ параметра информативности в, определяющего относительную доля разброса У0 , приходящуюся на первые I главных компонент согласно (4). Если информативность У = У0 выражается в долях единицы, величину отношения сигнал/шум можно представить как отношение полезной части используемой информации у к неиспользуемой информации 1-у, и
У
тогда
БШ
1-у
Если рассматриваемое значение отношения сигнал/шум не менее порогового
значения в, то справедлива оценка информативности
У ^
0
(5)
0 + 1 '
Соотношение (5) дает априорную оценку (снизу) информативности выбранной системы признаков в зависимости от используемого значения ОСШ. В таблице 1 представлены некоторые значения, связывающие рассматриваемые показатели.
Увеличивая значения ОСШ, можно надеяться, что информативность будет выше, при этом число используемых эмпирических главных компонент для вычисления интегральной характеристики увеличивается. Однако величина SNR=2,2 является оптимистичной величиной для статистических данных, и при увеличении этого значения хотя бы до трех единиц большая часть переменных эмпирических главных компонент (ЭГК) окажется просто нулевыми, что не увеличит их информативности.
Таблица 1. Связь дисперсионной информативности с используемым значением ОСШ
SNR 1.2 1.5 2.0 2.2 3.0 4.0 5.7 9.0 19.0
Информативность, Y SNR 0.55 0.60 0.67 0.69 0.75 0.80 0.85 0.90 0.95
Очевидно, что ОСШ-информативность ЭГК определяется параметрами найденных действующих переменных. Аналогично дисперсионной информативности согласно (4) можно определить ОСШ-информативность для выбранного числа эмпирических главных компонент N
У БЫЯ
Б11 + Б12+ ••• + Б1N Б 21 + Б 22+ ••• + Б 2 N
(6)
где Slk - сумма величин ОСШ у действующих переменных к-ой ЭГК, S2k, - сумма ОСШ всех переменных к-ой ЭГК. В отличие от дисперсионной информативности, ОСШ-информативность не может достигать 100% по логике построения. Информативность выбранной системы признаков определяется дисперсионной и ОСШ-информативностью:
У = Уа- YSNR . (7)
4 Вычисление интегральных индикаторов качества жизни с помощью предложенного алгоритма
Рассмотрим работу алгоритма для вычисления интегральной характеристики качества жизни. Для построения интегрального индикатора воспользуемся списком переменных из исследования, выполненного под руководством С.А. Айвазяна (табл. 2), являющегося признанным авторитетом в исследовании качества жизни [11]. Деление переменных на блоки произведено авторами исследования [11].
Таблица 2. Переменные для вычисления интегральных индикаторов качества жизни населения
Уровень благосостояния населения
1 Отношение ВРП на душу населения к прожиточному инк. единиц
Покупательская способность среднейушевых денежных доходов по отношению к наборам
2 прожиточного минимума (%)
3 Доля численно с тн населения с денежными доходами ниже величины прожиточного минимума
4 Отношение совокупных доходов 20% самых богатых и 20% самых бедных
5 Обеспеченность населения собственными легковыми автомобилями (автомобилей! 000 чел.)
6 Доля семей, состоящих на >чете на получение жилья (%)
7 Приходится общей площади жилищного фонда на одного жителя (кв. м -10 чел )
8 Доля ветхого н аварипног а жилья {%}
9 Плотность автомобильных дорог общего пользования (км 10 ООО кв. км)
Качество населения
10 Ожидаемая продолжительность жизни при рожденш! (лйг)
11 Число умерших детей в возрасте до 1 года на 1000 населения (чел.)
12 Коэффициент естественного прироста (на 1000 населения)
13 Число умерших от инфекционных и парэз1гт арных болезней и туберкулеза на 100 ООО
14 Число умерших от новообразований на 100 ООО населения (чел.)
15 Число %-мерщих от болезней системы кровообращения из 100 000 населения (чел,)
16 Число умерших от болезней органов дыхания на 100 ООО населения Счел.)
17 Число умерших от болезнен органов пищеварения на 100 000 населения (чел.)
18 Заболеваемость от травм, отравлений и некоторых других внешних причин на 100 000
19 Число инвалидов на 1 000 населения (чел.)
20 Зарегистрировано случаев заболевания врожденными аномалиями на 1 000 населения
21 Доля специалистов с высшим образованием среди занятых в экономике (%)
Приведенная производительность труда (ВРП на среднегодовую численность занятых в
22 экономике, тыс. руб./чел)
23 Количество выпускников высших и средних учебных заведений на 10ОО населения
Качество социальной сферы
24 ■Уровень безработицы (%)
Доля работников занятых во вредных и опасных условиях труда в среднегодовой численности
25 занятых в экономике (%)
Численность пострадавших на производстве со смертельным исходом или с утратой
26 трудоспособности на 1 раб. день и более на 1 ООО работающих (чел.)
27 Коэффициент миграционного прироста на 10 000 населения
Число зарегистрированных умышленных убийств и покушений на убийство на 100 000
23 населения (случаев)
Число зарегистрированных фактов умышленного причинения тяжкого вреда здоровью на
29 100 000 населения (случаев)
Число зарегистрированных изнасилований и покушений на изнасилование на 100 000 населения
30 (случаев)
31 Число разбоев, грабежей краж из квартир граждан в расчете на 100 000 населения (случаев)
Число зарегистрированных незаконных присвоений или растрат в расчете на 100 ООО
32 населения (случаев)
Число больных,, состоящих на учете С диагнозом наркомания и токсикомания в расчете на
33 ] 00 000 населения (чел.)
34 Число больных, состоящих на учете с диагнозом алкоголизм в расчете на 100 ООО населения
35 Число больных, инфицированных ту беркулезом в расчете на 100 000 населения (чел.)
36 Смертность от внешних причин (на 100 000 человек населения)
37 Число больных психическими расстройств амн на 100 000 населения
Отсутствующие в открытом доступе данные заменим на близкие к ним (выделено цветом в табл.2). Все значения переменных взяты из открытых справочников Росстата [12]. Отсутствующие единичные значения дополнены средними значениями по тому федеральному округу, к которому относится рассматриваемый субъект. Отсутствующие значения показателей для ряда лет восстановлены линейной интерполяцией.
Среди перечисленных переменных переменные 1, 2, 5, 7, 9, 10,12, 21, 22, 23 связаны с вычисляемой характеристикой монотонной возрастающей зависимостью, когда оптимальное значение j-го показателя максимально.
Для остальных показателей, кроме переменной 27, оптимальное значение показателя минимально. Для переменной 27 «Коэффициент миграционного прироста» примем =0, ]=27. Значение соответствует ситуации, когда количество выбывших из региона совпадает с количеством приехавших.
Согласование направлений собственных векторов и определение четвертой эмпирической главной компоненты представлено в табл. 3. Направления собственных векторов, соответствующих четвертому по убыванию собственному числу для каждого наблюдения выбраны, чтобы максимизировать сумму значение ОСШ у действующих переменных, для которых выполнено ОСШ-условие: вычисленное отношение сигнал/шум не менее 2,2. Темным цветом в табл. 3 выделены действующие переменные.
Таблица 3. Определение четвертой эмпирической главной компоненты Блока 1
4 ГК Переменные
1 2 3 4 5 6 7 8 9
2007 -0.25 0.16 0.40 0.23 -0.32 -0.54 0.41 -0.12 0.36
2008 -0.17 0.03 0.38 0.30 -0.16 -0.41 0.69 -0.23 -0.07
2009 0.07 -0.04 0.27 0.33 -0.15 -0.56 0.66 -0.19 0.05
2010 0.07 -0.05 0.37 0.30 -0.24 -0.41 0.68 -0.24 -0.16
2011 0.18 0.01 0.36 0.38 -0.28 -0.03 0.56 -0.55 -0.06
2012 0.02 0.08 0.32 0.38 -0.22 0.30 0.31 -0.71 -0.03
Среднее, т -0.01 0.03 0.35 0.32 -0.23 -0.27 0.55 -0.34 0.01
Выб. ср.квадр.откл., s 0.16 0.08 0.05 0.06 0.07 0.34 0.16 0.23 0.18
ОСШ 0.09 0.41 7.57 5.51 3.42 0.80 3.46 1.45 0.08
Сумма ОСШ ЭГК 22.80
Сумма действующих ОСШ ЭГК 19.97
В таблице 4 представлены все нормализованные и согласованные по направлению эмпирические главные компоненты (ЭГК) первого блока. Факторные нагрузки ЭГК имеют разные знаки.
Таблица 4. Эмпирические главные компоненты Блока 1
№ Собствен ные Переменные
ГК числа 1 2 3 4 5 6 7 8 9
1 3.07 0.73 0.88 0.79 -0.77 0.55 0.30 0.27
2 2.03 -0.22 -0.30 0.38 0.40 0.65 0.64 0.70
3 1.14 -0.23 0.20 -0.40 0.77
4 0.79 0.31 0.28 -0.20 0.49
5 0.63 0.08 0.48 -0.36
6 0.51 0.03 0.19 0.00
7 0.46 0.44 -0.09 -0.23 0.30
8 0.30 0.17 0.25 0.33 -0.25 0.13 -0.09
9 0.08 0.00 0.22 -0.12 0.13 0.02
В таблице 5 приведен пример определения информативности интегрального показателя Блока 1: Уровень благосостояния населения согласно (6) и (7).
Таблица 5. Определение информативности интегрального показателя Блока 1
Номер эмпирической главной компоненты
1 2 3 4 5 6 7 8 9
Сумма ОСШ к -ой ЭГК 99.2 67.1 30.3 22.8 12.9 12.9 21.9 46.7 59.7
Сумма действующих ОСШ
к -ой ЭГК 98.6 64.5 23.6 20.0 10.1 8.1 17.0 43.2 55.6
Накопленные %%, У SNR 26.4 43.7 50.0 55.3 58.0 60.2 64.8 76.3 91.2
Эмпирические
собственные числа 3.1 2.0 1.1 0.8 0.6 0.5 0.5 0.3 0.1
Накопленные %%, У а 34.1 56.6 69.2 78.0 85.0 90.7 95.8 99.1 100.0
Информативность,
Уа' ^ , % 9.0 24.7 34.6 43.1 49.3 54.6 62.0 75.6 91.2
Суммарная информативность этого блока увеличивается при увеличении числа используемых ЭГК. При рассмотрении всех 9 ЭГК суммарная информативность максимальна и составит около 91%.
Веса всех блоков определяем пропорционально их информативности (табл.6). Эта таблица дает также суммарную оценку информативности решения: действующие переменные объясняют в структуре данных 83,9% информации сигнала при использовании всех ЭГК, когда дисперсионная информативность составляет 100%. Это максимально возможное в этом случае значение информативности.
Таблица 6. Определение весов блоков
Блок 1 2 3 По всем блокам
Сумма ОСШ 373.4 875.1 431.9 1680.4
Сумма действующих ОСШ 340.6 742.4 326.5 1409.5
ОСШ-информативность блока, у SNR % 91.2 84.8 75.6 83.9
Дисперсионная информативность блока, Уа % 100 100 100 100
Информативность блока у , % 91.2 84.8 75.6 83.9
Вес блока 0.242 0.527 0.232
На рис.4 показаны изменения интегральной характеристики качества жизни для некоторых субъектов России. Следует отметить, что из 37 рассматриваемых показателей 20 отражают физиологическое благополучие человека, что и объясняет (вкупе с особенностями национальной статистики) фантастические показатели национальных республик (Ингушетии, Чечни, Дагестана и пр.). В этих субъектах России значительно меньше шансов заболеть, умереть, подвергнуться криминальному насилию. Ожидаемая продолжительность жизни в Ингушетии наибольшая по России, в частности, превышает этот параметр по Новгородской области на 10 лет. С учетом этого обстоятельства низкий уровень ВРП и высокий уровень безработицы не кажутся столь уж важными в интегральной характеристике качества жизни - меньше работать и дольше жить предпочтительнее, чем наоборот.
Заключение
В работе рассмотрено решение задачи построения латентной интегральной характеристики изменения качества системы на основании регистрируемых измерений для ряда наблюдений. Задача относится к классу задач выделения полезного сигнала из массива данных в условиях априорной неопределенности и решается на основании задаваемого отношения сигнал/шум. Предложен алгоритм построения интегральных характеристик с определением неслучайных составляющих главных компонент, характеризующих структуру рассматриваемой
системы. Также предложен новый подход к выбору числа главных компонент, к определению весов рассматриваемых подсистем и к определению информативности полученной характеристики на основании дисперсионного критерия и выбранного параметра отношения сигнал/шум. Алгоритм был использован для получения интегральных индикаторов качества жизни населения субъектов Российской Федерации. Предлагаемая методика может быть использована для вычисления интегральных оценок изменения качества плохо формализуемых систем.
о _
: |
з р-
i
7Z
5.5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5
2007 200ä 2009 2010 2011 2012 Годы
- — - г. Москва
»Московская область г. Санкт-Петербург
■ Лештгрплская область
■ Новгородская область
Рис. 4. Интегральная характеристика качества жизни некоторых субъектов Российской Федерации за 2007-
2012годы
Работа выполнена при финансовой поддержке проектной части государственного задания в сфере научной активности Министерства образования и науки Российской Федерации, проект № 1.949.2014/K
Литература
1. Рейтинги стран мира / РВК-рейтинг, 1995-2015.- URL: http://rating.rbc.ru/category.shtml7macro. - (дата обращения: 13.09.2015).
2. Доклады ООН о развитии человека (Human Development Reports). 1990-2013. /United Nations Development Programme, 1990-2014. — URL: http://hdr.undp.org/en/reports/ (дата обращения: 13.09.2015).
3. Айвазян С. А. Интегральные индикаторы качества жизни населения: их построение и использование в социально-экономическом управлении межрегиональных сопоставлениях. — М.: ЦЭМИ РАН, 2000. — 56с.
4. Айвазян С.А. К методологии измерения синтетических категорий качества жизни населения // Экономика и математические методы. — 2003. — Т. 39. — № 2. — С. 33-53.
5. Жгун Т.В. Построение интегральной характеристики изменения качества системы на основании статистических данных как решение задачи выделения сигнала в условиях априорной неопределенности // Вестн. Новг. гос. унта. Сер.: Технические науки. — 2014. — № 81. — С.10-16.
6. Жгун Т.В. Построения интегральной характеристики демографического развития территорий на примере муниципальных образований Новгородской области //Региональная экономика: теория и практика. —2013. — № 36(315),сентябрь. — С.2-12.
7. Жгун Т.В. Вычисление интегрального показателя эффективности функционирования динамической системы на примере интегральной оценки демографического развития муниципальных образований Новгородской области / / Вестн. Новг. гос. ун-та. Сер.: Физико-математические науки. — 2013. — № 75. — Т.2. —С.11-16.
8. Жгун Т.В. Исследование формальных методов построения латентной характеристики качества систем // Вестн. Новг. гос. ун-та. Сер.: Физико-математические науки. — 2014. — № 80. —.13-19.
9. Голяндина Н.Э., Усевич К.Д., Флоринский И.В. Анализ сингулярного спектра для фильтрации цифровых моделей.//Геодезия и картография 2008. — №5. — С. 21-28. URL://http://iflorinsky.narod.ru/Florinsky-2008c.pdf (дата обращения: 13.01.2014).
10. Голяндина Н.Э. Метод «Гусеница»- SSA: анализ временных рядов.- Спб.: Спб ун-т, 2004.- 74 с.
11. Исакин М.А. Модификация метода k -средних с неизвестным числом классов // Прикладная эконометрика. — 2006. — Выпуск № 4. —С. 62-70.
12. Федеральная служба гос. статистики / Федеральная служба гос. статистики. - М., 2002-2014. - URL: http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/publications/catalog/doc_1137674209312 (дата обращения: 13.09.2015).