Научная статья на тему 'Некоторые постановки задач ранжирования и их решение на основе принципа самосогласованности'

Некоторые постановки задач ранжирования и их решение на основе принципа самосогласованности Текст научной статьи по специальности «Математика»

CC BY
536
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДВУХУРОВНЕВАЯ ЗАДАЧА РАНЖИРОВАНИЯ / ВЕСА И РАССТАНОВКА ОБЪЕКТОВ / ЗНАЧИМОСТИ ХАРАКТЕРИСТИЧЕСКИХ ПРИЗНАКОВ / ПРИНЦИП САМОСОГЛАСОВАННОСТИ / DOUBLE-LEVEL PROBLEM OF RATING / WEIGHTS AND RANKS FOR OBJECTS / ESTIMATES OF IMPORTANCE OF INDICES / SELF-CONSISTENCY PRINCIPLE

Аннотация научной статьи по математике, автор научной работы — Беленький Виталий Зиновьевич, Гребенников Валерий Григорьевич

Рассматривается задача ранжирования (упорядочения) N объектов, каждый из которых характеризуется значениями M различных признаков (как позитивных, так и негативных), так что исходной информацией является матрица P(N × M). Главная особенность работы в том, что ранжируются не только сами объекты, но определяются также и оценки (значимости) характеризующих их признаков. Решение задачи дается двухконтурным итеративным алгоритмом, сходимость которого интерпретируется как достижение самосогласованности полученных результатов. Приведены несколько примеров экспериментальных расчетов; рассмотрен пример реальной задачи ранжирования субъектов РФ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Some Statements of Rating Problem and Their Solution on the Base of Self-Consistency Principle

The paper considers a problem of rating (ordering) for N objects, and each of them is characterized by values of M different indices (possibly positive or negative) so that the initial data is a matrix P(N x M). The main feature of the work is that as a result not only the very objects are ranked, but also the estimates of importance of different indices characterizing them are defined. For the solution of corresponding mathematical model a double-contour iterative algorithm is proposed; its convergence is interpreted as complying the self-consistency principle for final results. Several experimental examples of calculations are provided and one real example of rating problem for RF-subjects is considered.

Текст научной работы на тему «Некоторые постановки задач ранжирования и их решение на основе принципа самосогласованности»

НЕКОТОРЫЕ ПОСТАНОВКИ ЗАДАЧ РАНЖИРОВАНИЯ И ИХ РЕШЕНИЕ НА ОСНОВЕ ПРИНЦИПА САМОСОГЛАСОВАННОСТИ1

В.З. Беленький, В.Г. Гребенников

гностики изменений в структуре анализируемой совокупности объектов или структуре состояний изучаемого объекта во времени и т.п. Проблеме упорядочения в группе объектов посвящена обширная литература мы, упомянем здесь наиболее близкие нам работы Т. Саати (Саати, Кернс, 1991) и Б.Г. Миркина (Миркин, 1974).

В работе рассматриваются два вида постановок задачи ранжирования - одноуровневая и двухуровневая.

Рассматривается задача ранжирования (упорядочения) N объектов, каждый из которых характеризуется значениями М различных признаков (как позитивных, так и негативных), так что исходной информацией является матрица P(N х М). Главная особенность работы в том, что ранжируются не только сами объекты, но определяются также и оценки (значимости) характеризующих их признаков. Решение задачи дается двухконтурным итеративным алгоритмом, сходимость которого интерпретируется как достижение самосогласованности полученных результатов. Приведены несколько примеров экспериментальных расчетов; рассмотрен пример реальной задачи ранжирования субъектов РФ. Ключевые слова: двухуровневая задача ранжирования, веса и расстановка объектов, значимости характеристических признаков, принцип самосогласованности.

0. ВВЕДЕНИЕ

Методы парных сравнений занимают сегодня важное место в факторном анализе систем различной природы, в том числе социально-экономических, политических и др. Они находят применение в широком спектре задач выбора, выявления предпочтений, диа-

© Беленький В.З., Гребенников В.Г., 2013 г.

1 Работа выполнена при финансовой поддержке Российского гуманитарного научного фонда

(проект № 11-02-00-261).

0.1. Одноуровневая постановка

В этой постановке задача состоит в упорядочении группы объектов (в количестве Решение этой задачи мы даем на основе результатов их парных сравнений, которые задаются квадратной матрицей A(N х N (первичная информация). Конечным результатом решения задачи является «ранжирование» объектов (т.е. упорядочение их по рангам); мы пользуемся также синонимом этого термина -«расстановка» (по местам).

В основе нашего подхода к построению расстановки лежит присвоение (исходя из результатов парных сравнений) каждому объекту его веса, так что расстановка объектов строится по убыванию их весов. Таким образом, задача построения расстановки сводится к расчету весов объектов. В статье предложен метод расчета весов, основанный на принципе самосогласованности2; этому посвящен раздел 1, материал которого - это несколько сокращенный вариант нашей предварительной публикации (Беленький, Гребенников, 2012), в которой одноуровневая постановка задачи ранжирования рассмотрена подробно.

2 Выдвинутом В.Г. Гребенниковым в докладе «К построению расстановок на основе парных сравнений» на семинаре ЦЭМИ РАН «Неизвестная экономика» в июне 2012 г.

0.2. Двухуровневая постановка

В этом случае каждый объект описывается вектором значений характеристических признаков (в количестве Ы), так что первичная информация задается матрицей признаков Р(Ы х Ы), на основе которой строится квадратная матрица А = А(Р) парных сравнений, и затем решается задача первого уровня, описанная в п. 0.1. Второй уровень состоит в том, что по результатам решения задач первого уровня (точнее, по полученному вектору х е Я+Ы весов объектов) самим характеристическим признакам присваиваются оценки их значимости, так что решением задачи второго уровня является вектор оценок признаков w е Я+.

С учетом оценок, матрица признаков Р корректируется Р ^ Р(ч>), и на ее основе строится новая матрица парных сравнений А = А(Р(ц')). Возникает, таким образом, двуз-венный итеративный контур

:= (1,1,

А : = А(Р(м>к)) ^ хк

■ Щ

к+1,

к = 0, 1,

(1)

Принцип самосогласованности в широком смысле состоит в том, что решением двухуровневой задачи в целом считается такая пара векторов (х, что в процессе (1) последовательные векторы совпада-

ют (соответственно, совпадают и векторы хк, хк+1). Постановка и метод решения этой задачи описан в разделе 2.

1. ПЕРВЫЙ УРОВЕНЬ -РАССТАНОВКА ОБЪЕКТОВ ПО РЕЗУЛЬТАТАМ ИХ ПАРНЫХ СРАВНЕНИЙ

1.1. Исходная информация

Исходной информацией является количество объектов N и матрица А(Ы х Ы) результатов их парных сравнений, предполагаемая

неотрицательной. Элементы а{р а/ отражают результат сравнения /-го и ]-го объекта. Сравнение объектов может проводиться в количественной либо в качественной (булевой) форме.

Количественную форму сравнения удобнее всего описать на языке спортивных соревнований, считая, что элемент ау матрицы результатов показывает количество «голов» (в широком смысле), забитых участником (объектом) / во встрече с участником у. Например, в футболе это число голов (в узком смысле), в баскетболе - число попаданий в корзину соперника, в фехтовании - число нанесенных уколов и т.п. Вообще говоря, результирующие числа могут быть и нецелыми, выражающими, например, среднюю силу ударов, наносимых боксерами друг другу. Количество забитых голов можно связать с числом признаков одного объекта, по которым он превосходит (если признак позитивный) или уступает (если признак негативный) в сравнении с другим объектом.

При качественном сравнении принимается а// = 0

(а^ = 1, а^ = 0) если 7 лучше, чем ], (аи = ап =1)

если 7 и ] эквивалентны.

(2)

Отношение превосходства может быть задано непосредственно (например, экспертом) или синтезировано на основе ряда характеристических признаков (свойств).

Представление результата качественного сравнения в форме (2) позволяет рассматривать его как количественный; поэтому в дальнейшем мы будем в любом случае иметь дело только с количественной матрицей А, интерпретируя ее в спортивном («футбольном») смысле. Тогда элементы фиксированной строки / показывают количества голов, забитых игроком / всем остальным игрокам (полагаем ай = 0); элементы фиксированного столбца ] суть количества голов пропущенных участником у во встречах с остальными участниками.

Подчеркнем, что важным преимуществом отношения предпочтения, построенного на парных сравнениях, является то, что оно не обязано быть транзитивным.

1.2. Веса участников

Как можно было бы характеризовать силу участников футбольного турнира с помощью весовых коэффициентов, составляющих в совокупности неотрицательный вектор х = (х1, ..., Наиболее простой способ - это взять отношение сумм забитых и пропущенных голов, т.е. по формуле

N

х = £

з* I

3 *1

I = 1,

, N.

(3)

Такой подход исходит из неявного предположения, что априори все участники равносильны: этим объясняется прямое суммирование в (3). Однако апостериори (по результатам турнира) это предположение, вообще говоря, не подтверждается: значения хг оказываются различными; это означает, что формула (3) внутренне противоречива и нуждается в корректировке. Логично наделить всех участников весами (х) так, чтобы скорректированное с их помощью выражение в правой части (3) давало, при всех г, то же значение, что и слева - принцип самосогласованности.

Один из возможных подходов к корректировке правой части (3) таков3: гол, забитый участнику j, засчитывать с весом х, а гол, пропущенный от участника, засчитывать с обратным весом 1/х.. При таком подходе правая часть (3) заменится выражением

£ 3

3

£ 3 х)

=: / (х), г = 1,

, N

(4)

3 *1

и условие самосогласованности выражается векторным нелинейным уравнением

3 Описываемый вариант определения весов опробован нами хронологически первым (раньше других, которые мы считаем его модификациями). Именно в этом варианте был сформулирован принцип самосогласованности, который здесь выступает в наиболее логичной форме, и который был заложен затем во все последующие модификации.

X = Ях),Я= Я ...,Л),х е Я* (5)

Таким образом, искомые апостериорные веса участников турнира (назовем их абсолютными) образуют вектор, являющийся решением уравнения (5).

Примечание. С математической точки зрения уравнение (5) требует специального анализа относительно существования и единственности решения, а также вычислительного метода его нахождения. Здесь мы этих вопросов не касаемся, ограничившись приводимым ниже методом решения, показавшим4 свою эффективность в экспериментальных расчетах.

Поскольку веса используются нами как инструмент ранжирования участников, в этом качестве вектор весов х = (хг), может определяться с точностью до произвольного нормирующего множителя. Удобно нормировать веса, введя вектор у := х/у, подобрав знаменатель V (скаляр) так, чтобы среднее значение

N

у : N '££ у1

(6)

равнялось единице (черта сверху будет использоваться и далее для обозначения среднего, в смысле (6), значения компонент того или иного вектора в Я^); определенный таким способом вектор нормированных весов (уг) назовем равновесным.

1.3. Метод решения

Для равновесного вектора правая и левая части (5) отличаются некоторым положительным множителем V > 0, и уравнение самосогласованности имеет вид

У = V/(У).

(7)

Условие нормировки у = 1 позволяет выразить скаляр V непосредственно через у:

4 В регулярном случае (т.е. за исключением особых ситуаций (см. (Саати, Кернс, 1991, п. 2.3)).

1 = У = У/(У) ^ V = 7^ /(У)

(8)

и, таким образом, уравнение самосогласованности приобретает нормированную форму

у = Р (У ):= да, / (У)

(9)

где вектор / определен в (4).

Экспериментальные расчеты на компьютере показывают, что уравнение (9) в регулярном случае эффективно решается методом прямых итераций:

У° := (1,...,1), Ук := Р(Ук-1), к = 1, 2, ... . (10)

1.4. Некоторые варианты модификаций

X = X ау (XJ / Х7) - X аР (Х7 / XJ ),

, = 1, ..., N. (12)

Эта форма уравнения прямо неприемлема, так как правая часть может быть отрицательной; но, учитывая, что в процессе суммирования значение х/ остается постоянным, можно записать (11) в виде

71 + Хх а 7 / XJ\ = ]Х

V !

= X а7Х7 »

^ X =

х 3

ч1/2

3

1 +Х а7 / Х3

V з*7 у

=: /(2)( х).

(13)

Далее записываем нормированное уравнение (9) и итеративный процесс (10).

Можно предложить различные модификации описанного выше подхода, которые сохраняют основную идею самосогласованности, выраженную уравнением (5). В этом пункте мы приведем несколько вариантов, в которых метод решения прошел экспериментальную проверку.

1.4.1. Первый вариант модификации

Идея состоит в том, что гол, забитый участником у во встрече с участником /, за-считывается не с абсолютным весом х,, а с относительным весом х/х,. Функции (4) теперь таковы

X аз(хз / Х)

/(1)( X) := , , = 1, ..., N. (11)

X а7(х/ хз)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

з

Уравнение (9) и итеративный процесс (10) полностью сохраняются.

1.4.2. Второй вариант модификации

Вторая идея, дополняющая первую, состоит в том, что вместо отношений сумм, как в (4) берется их разность; тогда имеем

1.4.3. Третий вариант модификации

Этот вариант можно считать «гибридом» абсолютного и относительного, но относительное надо понимать не в смысле дроби х1х,, а в смысле разности х, - х,. Уравнение (5) запишем в виде

Х7 = X аззХз - X аз, (Х, - Хз X , = 1, ..., N,

33*'

(забитый гол считается с абсолютным весом, а пропущенный - с относительным), или

Х (1 + С ) = X а + а,г )Х,, С := X а,г,

3 *

3 *

, = 1, ..., N.

Таким образом, уравнение самосогласованности таково:

Х = X 53Хз

3

а а + а37

-3-, , = 1, ..., N. (14)

1 + с

Это система линейных уравнений, которая в векторной форме записывается в виде х = Бх =: /3)(х), где квадратная матрица х N состоит из элементов з,. Так как система (14) однородна, то она имеет в общем случае (ког-

да матрица невырождена - ее определитель отличен от нуля) только тривиальное решение х{ = 0 при всех г. Чтобы получить нетривиальное нормированное решение у надо заменить условие равенства (5) на условие пропорциональности (7), которое, как обычно, сводится к нормированному уравнению (9) с последующим применением процесса (10).

Примечание. В данном случае мы получили стандартную задачу линейной алгебры на нахождение нормированного собственного вектора у и собственного числа V данной неотрицательной матрицы 5. В силу теоремы Фробениуса-Перрона она всегда (в случае невырожденности) имеет положительное собственное число V (называемое спектральным радиусом матрицы 5) и отвечающий ему нормированный собственный вектор у е Я^. Решение единственно, и итеративный процесс (10) всегда сходится.

1.4.4. Четвертый вариант модификации

Этот вариант отличается от базового варианта тем, что в формуле (4) вместо отношения сумм забитых и пропущенных голов берется их разность. Уравнение самосогласованности таково

х = £азхз - £ (аз1/ хз^ г = 1 ..., ж (15)

3*1 3*1

Заметим, что хотя функция (15) монотонна на Я^, но она обращается в -да при х = 0, поэтому прямое применение формулы (15) неприемлемо. Однако если мы ищем нормированное (в смысле (6)) решение, то всегда найдется константа К > 0 такая, что для любого нормированного вектора у будет выполняться неравенство

/(4)(У):= £"зУз-£а /уз) + К>0,

3*1 3*1

г = 1, ..., N. (16)

Можно показать, что при больших К решение нормированного уравнения (9) с функцией (16) стремится к единичному вектору е = (1, 1, ..., 1). Однако, оказывается, что су-

ществует такое (минимальное) значение Кмин, после которого упорядочение объектов (т.е. их места в расстановке) перестает зависеть от K, и эту установившуюся расстановку можно считать решением задачи, а в качестве весов принять вектор, отвечающий значению Кмин. Значение Кмин может быть вычислено теоретически, но для практики достаточно найти его прямым численным экспериментом.

Отметим, что при каждом данном K решение уравнения (9) находится, как обычно, прямым итеративным алгоритмом (10).

1.5. Анализ экспериментальных расчетов

По всем описанным вариантам были проведены экспериментальные расчеты. Исходная матрица A генерировалась либо случайным образом, либо на основе какой-либо замысловатой формулы, дающей достаточно разнообразный спектр значений.

Приведенный ниже в табл. 1 пример для N = 8 иллюстрирует типичную картину результатов. Исходная матрица генерировалась формулой

a у = TRUNC[21 sin(z/) | -(2 + cos(/ - 2j))],

в которой функция TRUNC (в языке PASCAL) вычисляет целую часть аргумента; очевидно, элементы a^ - целые числа в интервале [0, 5].

Вверху таблицы показана матрица A, а затем идут результаты расчета по основному варианту (его номер «0»), и четырем вариантам модификаций; показаны нормированные веса участников (равновесный вектор у) и соответствующее ранжирование (с номером ранга m) в порядке убывания веса. Дополним эти данные числом итераций k в процессе типа (10) с критерием остановки

1 N

N - Ук_1I<S' при е = 10-6.

Вариант 0 1 2 3 4

k = 423 10 15 10 9

1.6. Сопоставительный анализ

Для сопоставления вариантов построим следующие две симметричные сопоставительные С-таблицы, в каждой из которых строки и столбцы отвечают различным вариантам 0 - 4 табл. 1.

В табл. 2 элемент ек1 показывает суммарное отклонение в ранжировании участников при сравнении данной пары вариантов, именно

N

X

j=1

cki :=X I mj - mj I;

в дополнительном столбце в строке к показано среднее отклонение

4 -X си.

4 ы

В табл. 3 этот же элемент показывает расхождение (количество несовпадающих позиций) между вариантами (к, I).

1.7. Обсуждение результатов

1. Как видим разные варианты моделей дают разные результаты, причем, как показывают табл. 2, 3, различия существенны. Наиболее «сбалансированным» оказался вариант 2 - его отличие от других вариантов наименьшее, но это не означает, что его надо использовать во всех случаях. Думается, выбор того или иного варианта построения весов, должен диктоваться смыслом исследуемой проблемы.

2. При заданной точности, число требуемых итераций к во всех вариантах примерно одинаково, кроме варианта «0»; не ясно, почему это так.

Таблица 1

Результаты экспериментальных расчетов

i 1 2 3 4 5 6 7 8

1 0 1 0 4 2 1 3 2

2 5 0 0 5 2 1 5 1

3 0 1 0 2 3 1 3 5

4 2 5 1 0 5 3 0 3

5 1 2 3 1 0 5 0 2

6 0 1 4 2 2 0 3 1

7 3 2 4 1 0 4 0 1

8 5 0 2 3 2 2 3 0

0. вес 0,922 1,484 0,934 1,137 0,874 0,742 0,862 1,025

M 5 1 4 2 7 8 6 3

1. вес 0,948 1,150 1,010 1,028 0,958 0,913 0,962 1,029

M 7 1 4 3 6 8 5 2

2. вес 0,931 1,219 1,004 1,051 0,939 0,874 0,946 1,036

M 7 1 4 2 6 8 5 3

3. вес 0,754 1,386 1,175 1,231 0,972 0,716 0,769 0,998

M 7 1 3 2 5 8 6 4

4. вес 0,954 1,130 1,010 1,030 0,963 0,919 0,964 1,030

M 7 1 4 3 6 8 5 2

Примечание. В четвертом варианте константа K = Кмин = 50.

Таблица 2 Суммарные отклонения между вариантами ранжирования

\ l к \ 0 1 2 3 4 Среднее

0 - 6 4 6 6 6,50

1 6 - 2 6 0 3,50

2 4 2 - 4 2 3,00

3 6 6 4 - 6 5,50

4 6 0 2 6 - 3,50

Таблица 3

Количество расхождений между вариантами

l к 0 1 2 3 4 Среднее

0 - 5 3 4 5 4,25

1 5 - 2 5 0 3,00

2 3 2 - 4 2 2,75

3 4 5 4 - 5 4,50

4 5 0 2 5 - 3,00

3. В общем виде предложенная нами схема описывается так. Подсчитываются взвешенные суммы числа забитых 51 и пропущенных 52 голов, они имеют вид

= £ а13Ф1(X, х3 X ^ = £ а,,ф2(х,, X), (17)

где ф1, ф2 - взвешивающие функции, зависящие от весов участников. Содержательный смысл требует, чтобы функция ф) возрастала по второму аргументу (кому забивают) и не возрастала по первому (кто забивает), а функция ф2 - наоборот. В условии самосогласованности (5) берется либо отношение, либо разность этих двух сумм.

Представляется, что такая схема плодотворна и допускает многие модификации взвешивающих функций. Кроме приведенных пяти вариантов нами были испробованы и некоторые другие; те варианты, для которых мы не смогли дать простой итеративный метод решения вида (10), остались вне рамок статьи.

2. ДВУХУРОВНЕВАЯ ПОСТАНОВКА ЗАДАЧИ РАНЖИРОВАНИЯ

В данном разделе дается сначала описание задачи ранжирования объектов не в «футбольных» терминах (как в предыдущем разделе), а в более содержательной постановке, когда матрица парных сравнений А не является первичной, а строится на основе матрицы характеристических признаков Р(Ы х М), которая и является исходной информацией. Затем дается постановка двухуровневой задачи и итеративный метод ее решения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2.1. Построение матрицы парных сравнений на основе таблицы (матрицы) признаков

Каждый объект г е [1, N в подлежащей ранжированию группе характеризуется

вектором признаков р1 е Я+М; совокупность этих векторов образует матрицу признаков Р(Ы х М). Предполагаем, что каждый признак имеет свою единицу измерения; для позитивных признаков большее его значение повышает вес объекта, для негативных - наоборот. Будем говорить, что значение признака лучше, если оно повышает вес объекта.

Опишем предлагаемую в статье процедуру построения по заданной матрице Р матрицы парных сравнений А = А(Р). Полагаем, что для любой пары участников (объектов) элемент а.. вычисляется по формуле

а :=

число компонентов вектора pi, которые лучше соответствующих компонент вектора р, плюс половина числа равных компонент этой пары векторов

; (18)

на «футбольном» языке это означает, что каждая лучшая компонента интерпретируется как «гол», забитый участником г во встрече с участникома при равенстве компонент каждому участнику добавляется 1/2.

Примечание. Значения аг. не зависят от единиц измерения признаков, при этом сумма а. + а. всегда равна М.

Формула (18) неявно предполагает (аналогично (3)), что все признаки, безотносительно к их содержанию, эквивалентны в смысле влияния на результаты сравнений. Ясно, что в реальных приложениях описываемой модели такое предположение выполняется далеко не всегда; модель требует корректировки, содержательный смысл которой - приписать каждому признаку оценку его значимости в контексте рассматриваемой задачи ранжирования. Приписывая признаку к е [1, М] оценку юк, мы корректируем матрицу Р, заменяя в столбце к элемент рк на р1к, и с полученной матрицей Р(ю) применяем описанный выше подход.

Таким образом, предлагаемая процедура требует задания в исходной информации помимо матрицы Р также и вектора оценок

ю е ЯМ.

2.2. Двухуровневая задача ранжирования

Расширим постановку задачи ранжирования так, чтобы требуемый для построения матрицы А вектор оценок w не задавать экзо-генно (в качестве дополнения к матрице Р), а находить его эндогенно, т.е. так, чтобы на выходе мы получали не только равновесный вектор весов объектов у, но и вектор оценок признаков w; такую постановку мы и назвали двухуровневой. По аналогии с теорией двойственности можно назвать задачу нахождения вектора у (задача первого уровня) прямой, а задачу нахождения вектора w (задача второго уровня) двойственной.

Каждый вектор w определяет матрицу Р = Р^), и процедура, описанная в предыдущем пункте, строит матрицу парных сравнений А = А(Р^)) и находит равновесный вектор у е как решение соответствующей прямой задачи (получаемое по одному из вариантов, описанных в разделе 1). Это означает, что мы имеем отображение w ^ у = Y(w). Если теперь мы построим отображение обратного перехода у ^ w = Щ(х), то можно определить двузвенный оператор Т: Я+Ы^Я+, действующий по формуле Ту?) := Щ^^)). Принцип самосогласованности в широком смысле выражается условием

щ = Т(щ), щ е Я?, (19)

Выполнение условия (19) означает, что найдена пара векторов у) такая, что выполняются равенства

У = г ( щ), Щ = Ж (У); (20)

нахождение этой согласованной пары и является двухуровневой задачей.

Отображение Y(w) уже описано в предыдущем пункте. Для полного описания задачи осталось определить отображение Щ(у), где у - произвольный нормированный вектор в этому посвящен следующий пункт.

2.3. Процедура второго уровня -построение оценок характеристических признаков

В п. 2.1 мы обозначили ,-ю строку матрицы Р как векторр1 е Я++ значений различных признаков на объекте ,; обозначим здесь через zk е ЯN столбец к матрицы Р, т.е. вектор значений признака к на различных объектах. Можно считать, что столбцы исходной матрицы Р нормированы в смысле (6) (отметим, что нормировка не влияет на отображение Y(w)), и тогда можно считать, что каждый вектор zk представляет собой вектор весов объектов «с точки зрения» к-го признака.

Пусть у - некоторый вектор весов объектов, получаемый как равновесный в результате итеративной процедуры первого уровня; сравним с ним каждый из векторов zk, т.е. вычислим вектор отклонений 5 = (5к)

5 := |\гк - У||, к = 1, ..., N (21)

где || - || обозначает некоторую норму (метрику) в пространстве Величина 5к отражает отклонение в ранжировании объектов с точки зрения к-го признака от равновесного ранжирования. Логично полагать, что чем больше такое отклонение, тем менее значим соответствующий признак, и поэтому в качестве оценки признака можно взять некоторую убывающую функцию от его отклонения, т.е. принять

щ :=у(5к), к = 1, ..., N (22)

где у - некоторая неотрицательная убывающая функция, задаваемая вариантно; таким образом, в качестве оценок характеристических признаков мы принимаем вектор w = Щ(у) с компонентами (22).

2.4. Итеративный метод решения двухуровневой задачи

Полная постановка двухуровневой задачи требует исходного информационного паспорта со следующими позициями:

1) количество объектов N и признаков М;

2) матрица признаков Р;

3) вариант решения прямой задачи (см. п. 1.4), или, в общем случае, функций ф15 ф2 (см. п. 1.7);

4) метрика || • ||, см. (21);

5) функция у, см. (22).

Эта информация однозначно определяет отображения у = Y(w), ю = Щу) и тем самым двухуровневую задачу (20); задача решается итеративным процессом (1), использующим указанные отображения. Экспериментальные расчеты показывают, что итеративный процесс (1) эффективен: если он сходится, то сходится быстро (возможны нерегулярные случаи, когда возникают особые ситуации, см. сноску 2).

3. КОМБИНИРОВАННАЯ ПОСТАНОВКА ДВУХУРОВНЕВОЙ ЗАДАЧИ

В п. 2.1 была описана постановка задачи первого уровня на основе матрицы признаков Р и задаваемого дополнительно вектора оценок ю значимостей различных признаков, который задавался экспертом экзоген-но. В следующем пункте 2.2 сформулирована постановка двухуровневой задачи, в которой вектор ю не задается, а находится эндогенно в процессе решения, и тогда участие эксперта не требуется. В данном разделе описывается промежуточный вариант постановки задачи, когда участие эксперта предполагается в слабой форме: эксперт не должен задавать численные значения компонент вектора ю (оценки значимостей признаков), а требуется лишь задать булеву матрицу В(М х М) сравнительной силы признаков. Будем считать, что эксперт задает матрицу В в следующей форме

Г1, если признак к "сильнее" I; Ьк1 := < 0, если признак к "слабее" I;

[1/2, если признак к, I "равносильны",

к,I е [1,М]; (23)

отметим, что при таком подходе Ьк1 + Ь1к = 1

V к, I, что содержательно означает, что засчи-тывается каждая пара сравнений.

Роль матрицы В в данной постановке состоит в том, что в итеративной схеме двухуровневой задачи построение оценок признаков, описанное в п. 2.3, заканчивается не вектором с компонентами (22), а вектором с компонентами

М

Щ :=£Ьк!у(5;), к е [1,М], (24)

I=1

во всем остальном эндогенная процедура сохраняется. Такую постановку мы называем комбинированной.

Примечание. Сравнивая (22) и (24), видим, что в векторно-матричной форме связь между эндогенным и комбинированным векторами оценок дается равенством

Щ к = ВЩ .

комбин. эндоген.

4. ПРИМЕНЕНИЕ: РАНЖИРОВАНИЕ СУБЪЕКТОВ РФ ПО ДОСТУПНОСТИ ЖИЛЬЯ

Описанную выше процедуру покажем на примере ранжирования субъектов РФ по уровню доступности жилья. Исходя из имеющейся статистической информации5 были выбраны следующие признаки, по которым проводилось парное сравнение указанных объектов: 1 - среднедушевой доход; 2 - ввод жилья; 3 - среднедушевой жилищный фонд; 4 - величина прожиточного минимума; 5 -

5 Авторы с благодарностью получили ее в пользование от Н.Н. Ноздриной (ИНП РАН), одного из ведущих в стране специалистов в области исследования жилищных проблем, и обладающего опытом межрегиональных сравнений по доступности жилья (см., например, (Ноздрина, Шнейдерман, 2012)).

степень дифференциации доходов; 6 - цена жилья на первичном рынке; 7 - доля ветхого и аварийного фонда6.

Признаки 5, 6 и 7 негативны, их более высокие значения соответствуют понижению уровня доступности жилья. Регионы, для которых отсутствуют данные по одному или нескольким выбранным признакам, не включены в рейтинг. Расчет весов объектов (первый уровень итеративного круга) проводился по варианту 4 (см. п. 1.4.4); значение константы Кмин = 2000 было найдено экспериментально; расчет оценок значимости признаков (второй уровень итеративного круга) проводился по эндогенному варианту.

В табл. 4 показан итоговый порядок субъектов РФ по возрастанию занятых ими мест в рейтинге. В табл. 5 приведены нормированные оценки значимости признаков w (среднее значение равно единице). Подробный анализ представленных результатов не входит в задачи настоящей работы и заслуживает отдельного рассмотрения.

В дальнейшем прежде всего предстоит сравнить эти результаты с имеющимся опытом межрегиональных сравнений доступности жилья, использующим другие способы ранжирования. Здесь мы сделали это применительно к одному из таких способов, когда регионы упорядочиваются по среднему месту, занимаемому каждым из них по всему набору признаков (определяется место региона по каждому признаку отдельно, а затем берется среднее значение); в табл. 6 дана сравнительная по двум методам расчета (по среднему месту и по нашему) выборка из десяти ведущих и десяти замыкающих регионов.

Как видим, различия достаточно существенны. Среди лидеров не совпадают 3 региона, в нижней десятке таких несовпадений 4. К тому же различается и порядок тех, кто входит в составы десяток при применении обоих методов ранжирования. Более подробный анализ будет дан в последующих публикациях.

6 Единицы измерения признаков не влияют на результат, поэтому мы их не указываем.

Таблица 4

Рейтинг-лист субъектов РФ по доступности жилья

Место Субъект РФ Место Субъект РФ

1 Курская обл. 40 Ростовская обл.

2 Липецкая обл. 41 Мари Эл

3 Чувашия 42 Кировская обл.

4 Белгородская обл. 43 Тульская обл.

5 Сев. Осетия 44 Еврейская авт.обл.

6 Татарстан 45 Санкт-Петербург

7 Саратовская обл. 46 Астраханская обл.

8 Тамбовская обл. 47 Карелия

9 Адыгея 48 Псковская обл.

10 Калининградская обл. 49 Оренбургская обл.

11 Брянская обл. 50 Ярославская обл.

12 Пензенская обл. 51 Свердловская обл.

13 Мордовия 52 Новосибирская обл.

14 Челябинская обл. 53 Алтайский кр.

15 Воронежская обл. 54 Хакасия

16 Новгородская обл. 55 Томская обл.

17 Смоленская обл. 56 Архангельская обл.

18 Омская обл. 57 Ненецкий АО

19 Московская обл. 58 Камчатский АО

20 Рязанская обл. 59 Тюменская обл.

21 Орловская обл. 60 Алтай

22 Ульяновская обл. 61 Курганская обл.

23 Башкортостан 62 Самарская обл.

24 Ставропольский кр. 63 Магаданская обл.

25 Вологодская обл. 64 Красноярский кр.

26 Краснодарский кр. 65 Приморский кр.

27 Карачаево-Черкесия 66 Хабаровский кр.

28 Калмыкия 67 Сахалинская обл.

29 Костромская обл. 68 Бурятия

30 Нижегородская обл. 69 Пермский кр.

31 Тверская обл. 70 Забайкальский кр.

32 Калужская обл. 71 Коми

33 Кемеровская обл. 72 Амурская обл.

34 Ленинградская обл. 73 Москва

35 Владимирская обл. 74 Ханты-Мансийский АО

36 Дагестан 75 Тыва

37 Волгоградская обл. 76 Иркутская обл.

38 Удмуртия 77 Якутия

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

39 Ивановская обл. 78 Ямало-Ненецкий АО

Что касается табл. 2, то обращают на себя внимание контрастирующие оценки значимости позитивных признаков «среднедушевые доходы» и «среднедушевой жилфонд», выпадающие из ряда близких друг к другу оценок значимости других признаков.

Литература

Беленький В.З., Гребенников В.Г. Некоторые методы ранжирования объектов по результатам их

парных сравнений // Анализ и моделирование экономических процессов. Вып. 9. М.: ЦЭМИ РАН, 2012.

Миркин Б.Г. Проблема группового выбора. М.: Наука, 1974.

Ноздрина Н.Н., Шнейдерман И.М. Социально-экономические проблемы обеспечения населения жильем // Народонаселение. 2012. № 3.

Саати Т., Кернс К. Аналитическое планирование. Организация систем. М.: Радио и связь, 1991.

Рукопись поступила в редакцию 15.08.2013 г.

Таблица 5

Оценка значимости признаков w

Признак Оценка

Среднедушевой доход 0,353

Годовой ввод жилья 0,700

Среднедушевой жилой фонд 2,145

Прожиточный минимум 1,084

Степень дифференциации доходов 0,977

Цена жилья на первичном рынке 0,905

Доля ветхого и аварийного фонда 0,836

Таблица 6

Сравнение методов ранжирования (слева - на основе средних мест объектов, справа - парных сравнений)

Верхняя десятка Нижняя десятка

Субъект РФ Субъект РФ Субъект РФ Субъект РФ

Московская обл. Курская обл. Амурская обл. Пермский кр.

Липецкая обл. Липецкая обл. Магаданская обл. Забайкальский кр.

Белгородская обл. Чувашия Ханты-Мансийский АО Коми

Чувашия Белгородская обл. Коми Амурская обл.

Ямало-Ненецкий АО Северная Осетия Санкт-Петербург Москва

Курская обл. Татарстан Ямало-Ненецкий АО Ханты-Мансийский АО

Северная Осетия Саратовская обл. Дагестан Тыва

Саратовская обл. Тамбовская обл. Якутия Иркутская обл.

Калининградская. обл. Адыгея Тыва Якутия

Тамбовская обл. Калининградская. обл. Москва Ямало-Ненецкий АО

i Надоели баннеры? Вы всегда можете отключить рекламу.