УДК 519.816
РЕЙТИНГОВАНИЯ БЕЗ КОМПЕНСАЦИЙ И ИХ ПРИМЕНЕНИЕ1
A.A. Гончаров, В.В. Чистяков
На основе функции перечисления, представляющей пороговое правило лексимин сравнения альтернатив, определены два рейтинговых индекса с учетом и без учета весов. Показано, что при отсутствии компенсаций (когда плохие свойства альтернатив не компенсируются хорошими свойствами) индексы выражают как количественные, так и качественные рейтинговые показатели. Приведен пример применения индексов к рейтингованию учащихся, успеваемость которых выражается векторами большой размерности с целочисленными компонентами.
Ключевые слова: предпочтение, лексимин, компенсация, функция перечисления, рейтинговый индекс.
ВВЕДЕНИЕ
Составление рейтингов применяется повсеместно и касается разнообразных явлений и жизненных ситуаций. Первый по рейтингу объект (субъект, альтернатива) — самый предпочтительный, второй по рейтингу — менее предпочтителен и т. д. по убыванию предпочтения. Определение этих объектов обусловливает задачи о коллективном выборе или анализ многокритериальных задач принятия решений. Этому направлению исследований посвящена обширная литература [1—8]. Настоящая работа связана с некоторыми его приложениями.
Нас будут интересовать ситуации, когда рей-тингуемые альтернативы характеризуются большим количеством целочисленных оценок. Удобной мотивацией этому служит положение дел, сложившееся в системе образования. Например, сессия из трех экзаменов с итоговыми оценками 3, 3 и 3 считается сданной, а с оценками 5, 2 и 5 — несданной, что можно выразить в виде: набор оценок (3, 3, 3) «предпочтительнее», чем набор (5, 2, 5). Сложение оценок (3 + 3 + 3 = 9 и 5 + 2 + 5 = 12) и сравнение сумм (9 < 12) говорит лишь о том, что принятая в системе образования шкала оценок не количественная, а качественная (более высокая
1 Работа выполнена при финансовой поддержке Научного фонда НИУ ВШЭ (проект «Учитель — Ученики» № 11-04-0008), Лаборатории алгоритмов и технологий анализа сетевых структур НИУ ВШЭ (грант Правительства РФ, дог. 11.G34.31.0057) и лаборатории ТАПРАДЕСС НН.
оценка отражает более качественное знание; подробнее см. работу [8]). При сложении низкие оценки компенсируются высокими, чего не происходит при «действиях с качествами». Именно последнее обстоятельство будет играть далее определяющую роль.
Цель настоящей статьи заключается в применении теории порогового агрегирования, развитой в работах [9—18] и основанной на правиле сравнения лексимин, к рейтингованию альтернатив, оцененных по многим критериям. Для этого с каждым многомерным целочисленным вектором оценок связывается рейтинговый индекс, при помощи которого можно эффективно рейтинговать эти векторы при отсутствии упомянутого эффекта компенсирования. Предполагается, что оценки равноваж-ны (в системе образования неудовлетворительная оценка по любой дисциплине приводит к отчислению) и анонимны в том смысле, что очередность оценок не играет роли. Отсутствие компенсирования, например, при рейтинговании учащихся (и во многих подобных контекстах) приводит к положительному эффекту: неуспевающий по некоторым дисциплинам учащийся никогда не будет иметь больший рейтинг, чем успевающий по всем дисциплинам.
1. РЕЙТИНГОВАНИЕ И РАНЖИРОВАНИЕ АЛЬТЕРНАТИВ
Пусть X — конечное множество с числом элементов X не менее двух, которое интерпретируется как множество альтернатив. Слабым порядком на X ([6, 7]) называется бинарное отноше-
ние Р с X х X, являющееся транзитивным (если (х, у) е Р и (у, г) е Р, то (х, г) е Р), антирефлексивным (если х е X, то (х, х) £ Р) и отрицательно транзитивным (если х, у, г е X, (х, у) £ Р и (у, г) £ Р, то (х, г) £ Р). Отношение Р удобно называть (строгим) предпочтением на X, включение (х, у) е Р для х, у е X записывать в виде хРу и читать "х предпочтительнее у". Предпочтение Р индуцирует на X отношение безразличия I = = {(х, у) е X х X: (х, у) £ Р и (у, х) £ Р}, так что эквивалентные записи (х, у) е I и х1у означают, что «х и у неразличимы (безразличны)» по отношению к Р. Тогда I — отношение эквивалентности на X: оно рефлексивно (если х е X, то х1х), симметрично (если х1у, то у1х) и транзитивно.
Типичным примером предпочтения на множестве X служит отношение вида Рр = {(х, у) е X х X: Дх) > Д(у)}, порожденное непостоянной вещественной функцией Д на X. Индуцированное Рр отношение безразличия имеет вид 1р = {(х, у) е е Xх X: Дх) = Ду)}.
Если для отношения Р на X и функции Д: X ^ К. имеет место равенство Р = Рр, то Р называется Д-представимым, а Д (определяемая по Р, вообще говоря, неоднозначно) — функцией предпочтения для Р.
Множество альтернатив X, на котором задано предпочтение Р, разбивается на классы безразличия (являющиеся классами эквивалентности) по убыванию или возрастанию предпочтения Р следующим образом [19]. Для А с X класс п(А) = = {х е А: (у, х) £ Р для всех у е А} есть множество наиболее предпочтительных относительно Р альтернатив из А. Положим XI = л^), и если к > 2 и непустые непересекающиеся подмножества XI, ..., Xk_ 1 множества X, такие, что XI и ... и Xk_ 1 ^ X, уже построены, то положим Xk = XI и ... и X'!_ 1 )). Поскольку X конечно, то найдется номер 5, такой, что X = XI и ... и X/ . Альтернативам из XI присваивается рейтинг 1, чуть менее предпочтительным альтернативам из X2 — рейтинг 2, и т. д. до номера 5, который получают наименее предпочтительные альтернативы. Тем самым получено каноническое рейтингование альтернатив из X (по убыванию предпочтения Р). Обращая порядок следования множеств, т. е. полагая Xk = X/ _ к +1 для к = 1, 2, ..., 5, получим семейство непересекающихся множеств X1, ^2,..., X/, в объединении дающих все множество X и обладающих свойством: хРу для х, у е X тогда и только тогда, когда х е XL и у е Xk для некоторых чисел 1 < к < Ь < 5. Указанное семейство ранжирует множество X (в порядке возрастания предпочтения Р): более пред-
почтительные альтернативы лежат в классах XL с большими номерами Ь. Для индуцированного отношения безразличия I имеем: х1у для х, у е X эквивалентно тому, что х е Xk и у е X, где 1 < к < 5.
Определим функцию N : X ^ {1, 2, ..., 5} следующим образом: поскольку любое х е X лежит в Xk при некотором 1 < к < 5, то положим ^х) = к. Функция N называется функцией перечисления для Р [14, 15]. Она определена корректно и однозначно и является сюрьективной функцией предпочтения для Р. Кроме того, она наиболее «эффективна» (поскольку присваивает альтернативам порядковые номера, по значениям которых удобно судить о предпочтительности альтернатив) и «экономна» среди всех функций предпочтения (поскольку 5 < 1X1, а зачастую значение 5 намного меньше, чем число элементов 1X1 в множестве X).
2. РЕЙТИНГОВАНИЕ ПОСРЕДСТВОМ НАБОРОВ ОЦЕНОК
Предположим, что вместе с множеством альтернатив X заданы два целых числа п > 2 и т > 2. Множество М = {1, 2, ..., т} интерпретируется как набор (упорядоченных по значимости) оценок, а число п — как количество этих оценок в следующем смысле. Пусть в результате какой-либо процедуры оценивания (например, серии из п экзаменов, тестов, испытаний, сравнений) каждая альтернатива х из X получает в соответствие п рав-новажных оценок х1, х2, ..., хп, где все х; лежат в М. Требуется на основе знания оценок х1, х2, ..., хп для всех х из X ранжировать множество X (или рейтин-говать его элементы). Поскольку любая альтернатива характеризуется своими наборами оценок, будем считать, что она «совпадает» со своими оценками, и для х из X писать х = (х1,..., хп). Тем
самым имеется вложение X в множество Мп всех п-мерных векторов с компонентами из М. Ранжирование (или рейтингование) Мп при помощи некоторого отношения (строгого) предпочтения приводит к ранжированию и множества X как подмножества Мп. Отметим, что |Мп| = тп.
Для описания применяемых далее методов сравнения альтернатив приведем три простых поясняющих примера.
Пример 1. Предположим, что альтернативы оцениваются по т = 2 оценкам, т. е. М = {1, 2}. Ранжировать Мп при любом п можно при помощи двух естественных отношений предпочтения. Пусть х, у е Мп. Обозначим через У1(х) количество оценок 1 в векторе х и через У2(х) — количество оценок 2 в х. Первое отношение: скажем, что
п п
хОу, если ^ х. > ^ у.. Второе отношение: скажем, что
г = 1
г = 1
хРу, если у1(х) < У1(у). Нетрудно видеть, что Р = 0: дей-
п
ствительно, так как ^ х; = У1(х) + 2у2(х) и У1(х) +
г = 1
п
+ У2(х) = и, то ^ х = 2и — У1(х).
г = 1
Порядковый номер вектора оценок х = (х^..., хп) е И" при упорядочении относительно Р = 0 вычисляется по формуле #(х) = У2(х) + 1, определяющей функцию перечисления для этого отношения. Ранжирование вида И" = Х1 и ... и X задается правилом Хк = {х е И" : #(х) =
= к} для к = 1, 2, ..., где л = и +1 < 2" = |И" | [14, разд. 3].
В случае, когда т > 3, естественные обобщения отношений 0 и Р (снова обозначаемые через 0 и Р) уже не совпадают и дают принципиально различные ранжирования множества оценок И".
Пример 2. Пусть И = {1, 2, 3}. Векторы х = (2, 2, 2) и у = (1, 3, 3) из И покомпонентно несравнимы, но поскольку 1 + 3 + 3 = 7 > 6 = 2 + 2 + 2, то у0х (это же справедливо для векторов у = (3, 1, 3) или у = (3, 3, 1)).
Следуя работам [9, 10], для х, у е И" скажем, что хРу, если либо у1 (х) < У1(у), либо У1(х) = У1(у) и У2(х) < ^(у). Аксиоматическое описание предпочтения Р, называемого пороговым, приведено в работах [11, 12]. Поскольку
у1(х) = 0 < 1 = у1(у) для х = (2, 2, 2) и у = (1, 3, 3) е И3, то хРу.
Пример 3. Предположим, что результаты экзаменов по и = 3 дисциплинам оцениваются по пятибалльной шкале И = {1, 2, 3, 4, 5}. Будем рассматривать векторы оценок х = (х1, х2, х3) е И с упорядоченными по неубыванию координатами (такой вектор однозначно определяет и все векторы, полученные из него перестановками координат). Применяя для ранжирования И3 предпочтение 0 из примера 1, получим: [(1, 1, 1)1]; [(1, 1, 2)2]; [(1, 1, 3)3, (1, 2, 2)3]; [(1, 1, 4)4, (1, 2, 3)4, (2, 2, 2)4]; [(1, 1, 5)5, (1, 2, 4)5, (1, 3, 3)5, (2, 2, 3)5]; [(1, 2, 5)6, (1, 3, 4)6, (2, 2, 4)6, (2, 3, 3)6]; [(1, 3, 5)7, (1, 4, 4)7, (2, 2, 5)7, (2, 3, 4)7, (3, 3, 3)7]; [(1, 4, 5)8, (2, 3, 5)8, (2, 4, 4)8, (3, 3, 4)8]; [(1, 5, 5)9, (2, 4, 5)9, (3, 3, 5)9, (3, 4, 4)9]; [(2, 5, 5)ю, (3, 4, 5)ю, (4, 4, 4)^; [(3, 5, 5)п, (4, 4, 5)п]; [(4, 5, 5)12]; [(5, 5, 5)13].
Здесь нижний индекс справа у вектора означает его порядковый номер в перечислении, и чем больше этот номер, тем предпочтительнее должен быть результат сдачи трех экзаменов. Но так ли это? Проанализируем эту ситуацию. В приведенном выше перечислении знак «точка с запятой» разделяет классы безразличия Хк относительно 0 в ранжировании И = Х1 и ... и Х^, где Хк = {х е И : #(х) = к}, функция перечисления имеет вид #(х) = х1 + х2 + х3 — 2, к = 1, 2, ..., л, и число классов безразличия равно л =13. Например, класс Х3, обозна-
ченный через [(1, 1, 3)3, (1, 2, 2)3], состоит из векторов (1, 1, 3), (1, 3, 1), (3, 3, 1), (1, 2, 2), (2, 1, 2) и (2, 2, 1). Векторы х, у е И безразличны по отношению к 0, если #(х) = #(у), т. е. х1 + х2 + х3 = у1 + у2 + у3, а потому классы безразличия оказываются «большими» множествами. Другими словами, 0 «не различает» успешные и неуспешные исходы трех экзаменов: например, #(х) = 10 для х = (3, 4, 5), (4, 4, 4) (сдано) и х = (2, 5, 5) (не сдано). Итак, ранжирование И при помощи 0 неадекватно описывает положение, сложившееся в системе образования. Предпочтение 0 применимо лишь в случае количественных шкал оценок И [8, разд. 1.3, 2.1]: в результате сложения низкие оценки в векторах компенсируются высокими. В системе образования оценки по различным дисциплинам предполагаются одинаково содержательными, характеризующими качество знаний по дисциплине, и шкала И = {1, 2, ..., т} упорядочена по значимости качеств (а не в смысле упорядоченности количеств, выражаемых числами): чем выше оценка, тем качественнее считается знание дисциплины (в другом контексте — качественнее какой-либо интересующий нас объект, например, дорога, пища, услуга и др.).
В модели рейтингования, рассматриваемой в настоящей работе, предполагается, что ни одно «плохое качество» альтернативы х е Х не может быть компенсировано никаким количеством ее «самых хороших качеств» («модель полного совершенства», рейтингование без компенсаций). Точный смысл этому дан в § 3 (определение порогового отношения Р). Введем обозначения, используемые всюду ниже, и вернемся к примеру 3.
Для у е И и х = (х1, ..., х") е И" обозначим количество оценок у в х через ^(х) = |{1 < г < и: х; = у}|. Ясно, что
п
^ у;(х) = и для всех х е И". Вектор с упорядоченными
г = 1
по неубыванию координатами, получающийся из х перестановкой его координат, обозначается через х*:
VI (х) У2(х)
Vm - 1(х)
^(х)
х* = (1, ..., 1, 2, ..., 2, ..., т — 1, ..., т — 1, т, ..., т) =
и
V-, V", V 1 V
= (1 , 2 , ..., (m - 1) , m ), (1)
где Vj = ^(х) = ^(х*) есть кратность оценки у в векторах х и х*. Положим также (И")* = {х*: х е И"} и X* = = {х*: х е X} для Xс И".
Обратимся снова к примеру 3, в котором и = 3 и т = 5. Предпочтение Р, обобщающее аналогичные отношения из примеров 1 и 2, определяется по правилу [13, 16]: скажем, что х е И3 (порогово) предпочтительнее, чем у е И , и будем писать хРу, если либо v1(x) < v1(y), либо v1(x) = v1(y) и ^(х) < ^(у), либо v1(x) = v1(y), V2(x) = V2(y) и Vз(x) < Vз(y), либо ^(х) = ^(у), V2(x) = V2(y), v3(x) = ^(у) и ^(х) < ^(у) (напомним, что v1(x) + ^(х) + + v3(x) + ^(х) + v5(x) = и). Применяя Р для ранжирова-
ния множества И3, получим следующее упорядочение множества (И3)*:
(1, 1, 1)!; (1, 1, 2)2; (1, 1, 3)з; (1, 1, 4)4; (1, 1, 5)5;\\ (1, 2, 2)6; (1, 2, 3)7; (1, 2, 4)8; (1, 2, 5)9;\\
(1, 3, 3)10; (1, 3, 4)ш (1, 3, 5)12;\\
(1, 4, 4)13; (1, 4, 5)14; (1, 5, 5)15;\\
(2, 2, 2)15; (2, 2, 3)17; (2, 2, 4)18; (2, 2, 5)19; \\
(2, 3, 3)20; (2, 3, 4)21; (2, 3, 5)22;\\
(2, 4, 4)23; (2, 4, 5)24; (2, 5, 5)25;\\
(3, 3, 3)26; (3, 3, 4)27; (3, 3, 5)28;\\
(3, 4, 4)29; (3, 4, 5)30; (3, 5, 5)зр\\
(4, 4, 4)32; (4, 4, 5)33; (4, 5, 5)34; (5, 5, 5)35.
В этом ранжировании И = Х1 и ... и Xчисло классов безразличия Хк = {х е И N (х) = к}, к = 1, 2, ..., я, равно ^ = 35, где функция перечисления N для Р имеет (не столь простой как для 0) вид (3), указанный в § 3 при п =3 и т = 5. Например, (1, 2, 4)8 обозначает класс Х8, состоящий из векторов (1, 2, 4), (1, 4, 2), (2, 1, 4), (2, 4, 1), (4, 1, 2) и (4, 2, 1). До знака «\\» упорядочение происходит естественным образом по возрастанию отдельных координат (Парето-доминирование), а сам знак «\\» символизирует так называемый пороговый переход [14, разд. 5.2, 7.2 и 8.1]. Предпочтение Рне обладает тем «дефектом», который ранее был отмечен для 0: начиная с номера 26, соответствующего вектору (3, 3, 3), все трехмерные векторы оценок дают успешный исход сдачи трех экзаменов. Кроме того, векторы, соответствующие номерам от 32 до 35, содержат оценки не ранее 4 (поэтому получившим их полагается стипендия или другое поощрение!). Таким образом, используя некомпен-сируемость низких оценок высокими (как в предпочтении Р), можно получить качественную картину успеваемости, не зная всего набора оценок, а опираясь лишь на порядковые номера в перечислении.
3. ФУНКЦИЯ ПЕРЕЧИСЛЕНИЯ ДЛЯ ПОРОГОВОГО ПРЕДПОЧТЕНИЯ Р
Для х, у е М" (при любых п и т) скажем, что х (порогово) предпочтительнее, чем у, и будем писать хРу, если гх(х) < V Ду) или найдется такой номер 2 < / < т — 1, что V (х) = у.(у) для всех номеров
1 < у < I — 1 и ^.(х) < ^.(у). Правило Р аксиоматически обосновано в работе [17] (см. также [14, 20]). Под названием симметрически-лексикографического оно изучалось в работах [21, 22]. Отметим, что Р эквивалентно правилу лексимин [2, 20]: с векторами оценок х, у е М" связываются вектора х * и у * из выражения (1) с упорядоченными по неубыванию координатами, и считается, что х предпочтительнее, чем у, в смысле лексимина, если х * строго
лексикографически в [" предпочтительнее, чем у * [18, лемма 1].
В работах [13, 14, 17] установлены следующие свойства предпочтения Р. Индуцированное Р
отношение безразличия I имеет вид: х1у лишь, когда .х) = у..(у) для всех 1 < 7 < т, т. е. векторы
х, у е М" могут быть получены друг из друга перестановками их координат. Если для х е М" обозначить через I = {у е М" : у1х} класс эквивалентности элемента х, то семейство {Хк : 1 < к < 5} из § 1, построенное для Р, совпадает с фактор-множеством М"/1 = {1х: х е М"}. Количество 5 всех классов безразличия в этом случае вычисляется по формуле:
5 = |(М")*| = С-!- ! = С"+ т - ! = = (п + т - 1)!/(п!(т - 1)!),
(2)
где С" = п! / (к!(п — к)!) — биномиальные коэффициенты при целом 0 < к < п, 0! = 1. При п =3 и т = 5 имеем 5 = 35 (сравн. с примером 3 из § 2). Отношение Р, суженное на множество (М")* элементов вида (1), является линейным порядком на (М")*, т. е. оно транзитивно, антирефлексивно и связно
(если х, у из (М")* и х ^ у, то хРу или уРх). Это позволяет ограничиться упорядочением относительно
Р лишь множества (М")* «монотонных представителей» х * альтернатив х. Таблицы упорядочений
(М")* при различных п и т приведены в работах [14, 18].
В общем случае невозможно выписать все таблицы упорядочений элементов множества (М")* при произвольных целых п > 2 и т > 3, поэтому принципиально важное значение имеет функция перечисления N для порогового предпочтения Р,
которая альтернативе х е М" присваивает порядковый номер Д(х) е {1, 2, ..., 5} этой альтернативы
в ранжировании М" относительно Р. Она имеет вид [13, 15], [18, теорема 1 ]
т - 2
Д(х) = £ С.- х) + т - 1 + ^(х) + 1, } = 1
х е М", (3)
где Г(7, х) = v1(x) +...+ у..(х), С^ — биномиальные
коэффициенты при целом 0 < к < п и С^ _ 1 = 0 при 1 < к < п, и обладает свойством Парето-доминиро-вания: если х < у (у > х) означает, что хг < уг- для всех
/ = 1, 2, ..., п, то из х < у для х, у из М", вытекает, что
Д(х) < N00. (4)
Функция предпочтения для Р, не являющаяся функцией перечисления, построена в работе [21]: Д(х) = /(х) + 1 - ((т" - 1)/(т - 1)), где х = (х1, ...,
хп) е Мп и / (х) = ^ тп 1 х* есть значение в деся-
1 = 1
тичной системе счисления числа х* х*...х*п, составленного из координат вектора х* = (х*, х*, ..., хП) из выражения (1) и записанного в т-ичной системе счисления «1, 2, ..., т».
4. РЕЙТИНГОВЫЕ СУММЫ И ИНДЕКСЫ
В Национальном исследовательском университете — Высшая школа экономики (НИУ ВШЭ) принята десятибалльная шкала оценок: 1, 2, 3 — неудовлетворительно, 4, 5 — удовлетворительно, 6, 7 — хорошо и 8, 9, 10 — отлично. Изучаемым дисциплинам присваиваются зачетные единицы (веса), называемые кредитами, сумма которых равна 60 (дисциплины с нулевыми кредитами не рассматриваются). Максимальная сумма баллов, которую может набрать учащийся за один год, равна 60-10 = 600. При неуспешной сдаче экзамена по дисциплине учащийся не получает кредита по этой дисциплине (кредит зануляется).
Для того чтобы иметь возможность сравнивать итоговые рейтинги, будем «нормировать» приводимые далее две компенсаторные рейтинговые суммы и два некомпенсаторных рейтинговых индекса на 600 единиц.
Пусть в результате серии из п экзаменов получен вектор оценок х = (х1, ..., хп), где 1 < х. < 10 — целое число. Здесь п — число дисциплин в годовой нагрузке, х1 — итоговая оценка учащегося х за экзамен по 1-й дисциплине, и если w¡ > 0 — кредит 1-й дисциплины (также предполагаемый целым числом), где I = 1, ..., п, то w1 + w2 + ...+ wn = 60. Множество X всех учащихся х одной учебной группы обладает тем свойством, что (их оценки)
X с Мп, где М будет конкретизировано в п. 4.2.
4.1. Рейтинговые суммы
Первая рейтинговая сумма Ап, основанная на среднем арифметическом, вычисляется без учета весов дисциплин по формуле:
Ап(х) = ((х1 + ... + хп)/п)-60 для х из Х;
при этом предполагается, что все оценки в векторе х — «положительные»: 4 < х. < 10 для I = 1, ..., п (нет учащихся с задолженностями).
Вторая рейтинговая сумма Sn, стандартная для НИУ ВШЭ, учитывает кредиты дисциплин w¡ и имеет вид:
£п(х) = Ы1х1 + ... + Ыпхп для х из Х,
где для 1 < I < п положено: и. = 0 при х. = 1, 2 или 3, и Ы = wi при 4 < х < 10 (напомним, что w1 + ... + + ып = 6 0).
Обе рейтинговые суммы Ап и Б носят компенсаторный характер (см. обсуждение в § 2, пример 3).
4.2. Рейтинговый индекс без учета весов
Для определения третьего рейтингового выражения, некомпенсаторного индекса N (х) при п < 60, основанного на формуле (3), потребуется переобозначение в (так называемые) действующие оценки, осуществляемое по правилу: оценки 1, 2 и 3 в векторе х, не считающиеся «положительными» (и дающие 0 кредитов), обозначаются через 1, а остальные оценки
у обозначаются через у — 2 для у = 4, 5, 6, 7, 8, 9, 10.
(5)
Иными словами, если х = (х1, ..., хп) — вектор из «положительных» оценок с 4 < х1 < 10, то действующими оценками являются компоненты вектора х - (2п) = (х1 - 2, ..., хп - 2) е Мп, где (2п) = = (2, ..., 2) (см. обозначение (1), в котором оценки кратности 0 в записи опускаются) и М = {1, 2, ..., 8}.
При вычислении значения (3) на векторе х — (2п) при т = 8 будут учитываться именно количества оценок исходного вектора х = (х1, ..., хп): действительно, для к = 2, 3, 4, 5, 6, 7, 8 находим, что
ук(х - (2п)) = |{1 < I < п: х1 - 2 = к}| = = |{1 < I < п: х1 = к + 2}| = ук + 2(х),
где к + 2 принимает соответственно значения 4, 5, 6, 7, 8, 9, 10.
Далее в этом разделе предполагаем, что М = {1, 2, ..., 8}, т. е. в векторах х е Xс Мп все оценки действующие. Множество векторов (Мп)* с упорядоченными по неубыванию координатами разобьем на 6 непересекающихся блоков оценок В1, В2, ...,
В6 с (Мп)* следующих видов.
К блоку Вк при к = 1, 2, 3, 4, 5 отнесем те векторы х из (Мп)*, для которых (кп) < х < (к1, 8п - 1) (см. выражения (1) и (4)), а к блоку В6 — те х, для
которых (6п) < х < (8п). Чем больше номер блока, тем более предпочтительными векторы этого блока являются относительно порогового предпочтения Р (кратко Вк + 1РВк): из х е Вк + 1 и у е Вк вытекает, что у(х) = 0 = ^.(у) при 1 < у < к — 1 и Ук(х) = 0 < 1 < Ук(у), а потому, хРу. Учащиеся с оценками из В1 считаются неуспевающими (имеющими пересдачи) ввиду наличия единиц в их оценках, символизирующих оценки 1, 2, 3. Уча-
п
щиеся с оценками из Вк при 2 < к < 5 имеют (см. выражение (5)) наименьшую оценку к + 2 по десятибалльной системе, а с оценками из В6 — отличники с минимальной оценкой, равной 6 + 2 = 8.
Рейтинговый индекс Д(х) вектора х е Вк при п < 60 определяется следующим образом в зависимости от значения к: 1 < к < 5 или к = 6.
При 1 < к < 5 в силу выражения (4) имеем N((0) < Д(х) < Щк1, 8" - !)), и поэтому, для х е Вк, х ф (к1, 8" - полагаем
Д"(х) = (к - 1)-100 + 1 + [(Д(х) -- Д((к"))-100/(Д((к!, 8" - !)) - Д((к")))], (6)
и Д"((к!, 8" !)) = к -100. Здесь значения функции N на указанных векторах вычисляются по формуле (3) при т = 8 (см. далее) и через [г] обозначена целая часть числа г, поэтому ^(х) принимает целые значения от (к - 1)-100 + 1 до к-100 (округление, имеющее место в формуле (6), несущественно для целей рейтингования). Для х е Вб имеем
N((6")) < Дх) < N((8")) снова в силу выражения (4), поэтому полагаем
^(х) = 501 + [№) - Щ6"))-100/(Щ8")) -- N((6")))], х ф (8"), (7)
и N"((8")) = 600, так что величина ^(х) в этом случае принимает целые значения от 501 до 600.
Для применения индекса ^(х) вычислим ^(к")) и Щк1, 8" - !)) при 1 < к < 5, N((6")) и N((8")). При 2 < к < 5 для х = (к") и у = (к1, 8" - 1) имеем: Г(1, х) = ... = Г(к - 1, х) = 0, V (к, х) = ... = = ^6, х) = п и v8(x) = 0, а также Щ, у) = ... = = Р(к - 1, у) = 0, V{k, у) = ... = Р(6, у) = 1 и ^(у) = п - 1, поэтому в силу формулы (3) находим, что (приводимые формулы верны и при к = 1, если принять соглашение в первых суммах о том, что сумма по 7 от 1 до 0 равна нулю)
к -1
щк"» = £ с„8 +-7 -} + 1,
-=1
к-1 о •
а о" - — -}
6
->8 -}
Щк1, 8" - 1)) = £ С"+7 -} + £ С"+6 -}
+ п,
} = 1 } = к
5 ->8 -}
и аналогично N((6")) = £ С„ +7 -} + 1 и N((8")) =
} = 1
= |(М")*| = С„7+7 .
4.3. Рейтинговый индекс с учетом весов
Прежде чем определить рейтинговый индекс отметим, что функция ^(х) из п. 4.1 из-за наличия весов не симметричная, т. е. при перестановке местами координат вектора х = (х1, ..., х") изменяется ее значение, а функция ^х) из (3) симметричная. Для учета кредитов дисциплин запишем сумму £"(х) в виде:
зд =
= х, + ... + х, + х, + ... + ... + х + ... + х .
1 12 2 " "
раз
раз
раз
Так как + + ... + = 60, то значение ^(х) совпадает со значением симметричной функции
60
от 60 независимых переменных Щ(у) = £ уг, вы-
г = 1
численной на 60-мерном векторе у = (ур ..., уб0) =
/ ж 2 \ т^
= (х1 , х2 , ..., х" ). Кредит wi учитывается в том
смысле, что за г-ю дисциплину одна и та же оценка хг проставляется wг. раз. Переводя оценки у в действующие согласно выражению (5), получим новый 60-мерный вектор с компонентами, принимающими значения от 1 до 8. Для него определяем рейтинговые индексы (6) и (7) при п = 60, которые и обозначаются через ^0(х).
Идея повторения значений хг по wг. раз предлагалась и использовалась в различных контекстах в работах [23—27].
5. ПРАКТИЧЕСКОЕ РЕЙТИНГОВАНИЕ
Модель рейтингования, основанная на пороговом предпочтении, при т = 3 применялась в работах [28, 29]. Здесь эта модель используется в контексте многоградационных ранжировок на примере рейтингования учащихся по их успеваемости за один учебный год (см. также работу [30]).
Учебная нагрузка и оценки группы учащихся (студентов), состоящей из 14 чел. (А, ..., приведены в табл. 1. Изучаемые дисциплины Д-1, ..., Д-15 (п = 15) указаны в первой строке, соответствующие им кредиты — во второй, и в оставшихся строках — итоговые оценки за экзамены. Оценка 0 означает неуспешную сдачу экзамена (зачета и т. п.) по дисциплине и используется для расчета рейтинговых сумм А15 и ^15. Для вычисления рейтинговых индексов и оценка 0 заменяется на 1. Примеры расчета этих индексов приведены в работе [31, разд. 7.3, 7.4].
Таблица 1
Учебная нагрузка и оценки учащихся
Студент Д-1 Д-2 Д-3 Д-4 Д-5 Д-6 Д-7 Д-8 Д-9 Д-10 Д-11 Д-12 Д-13 Д-14 Д-15
3 5 3 4 4 6 3 4 6 4 4 1 5 3 5
А 8 6 9 8 9 10 7 6 6 10 10 10 8 7 8
В 7 6 8 8 8 9 7 6 6 10 10 10 8 8 8
С 6 10 8 8 9 10 10 6 4 9 10 10 8 9 9
Б 5 6 8 6 6 6 5 5 4 10 7 10 6 7 7
Е 6 6 7 6 8 7 6 5 4 8 8 10 5 5 5
Е 5 5 9 5 7 8 4 5 6 10 9 10 4 5 7
в 6 5 8 6 6 7 5 4 4 7 6 10 6 5 5
Н 6 4 8 5 7 4 0 4 4 6 6 10 7 4 9
I 4 4 8 4 4 7 0 5 4 4 5 10 5 5 7
/ 4 7 8 6 6 6 6 5 4 6 5 10 6 7 0
К 4 9 7 4 7 6 4 5 4 7 9 10 6 5 0
Ь 5 4 8 4 5 5 4 4 4 4 4 10 5 6 0
М 4 5 8 4 4 4 0 4 4 6 0 10 5 6 6
N 4 4 8 4 4 6 0 4 4 5 5 10 5 4 0
Рейтинги и рейтинговые суммы и индексы учащихся приведены в табл. 2. В первом столбце указан рейтинг учащегося, т. е. его порядковый номер в рейтинговании в зависимости от значения рейтинговой суммы или индекса, в столбцах Студент перечислены учащиеся (студенты), соответствующие этим порядковым номерам, а в остальных столбцах указаны соответствующие суммы А
15
и
^15 и индексы N15 и N60.
В табл. 2 учащийся С занимает первую позицию согласно А15 и ^15, тогда как на основе N15 и он — лишь третий, поскольку имеет удовлетворительные оценки. Студенты же А и В в соответствии
с А15 и ^15 занимают вторую и третью позиции, а согласно индексам N15 и — первые две позиции, и являются стипендиатами. Из таблицы также видно, что А и В — хорошисты (с оценками из блока В4), С, Д Е, Еи О имеют не менее, чем удовлетворительные оценки (из блока В2) без пересдач, а учащиеся Н, I, /, К, Ь, М и N — неуспевающие (с оценками из блока В1). Рейтинги на основе А15 и ^15 практически идентичны, тогда как рейтинг значительно более чувствителен по отношению к весам, чем N15, что хорошо видно из средней части табл. 2 (позиции 6—11).
Таблица 2
Рейтинги (номера) учащихся
ЗАКЛЮЧЕНИЕ
№ Ст. А15 Ст. *15 Ст. *15 Ст. N,0
1 С 504 С 496 А 353 А 335
2 А 488 А 481 В 353 В 335
3 В 476 В 468 С 197 С 161
4 Е 396 Е 387 Б 179 Б 157
5 Б 392 Б 376 Е 176 Е 156
6 Е 384 Е 368 в 152 Е 145
7 в 360 в 344 Е 151 в 136
8 К 348 К 333 / 80 Н 72
9 / 344 Н 324 К 72 I 72
10 Н 336 / 322 Н 71 / 59
11 I 304 I 295 I 69 К 57
12 Ь 288 М 264 Ь 68 Ь 57
13 М 280 Ь 262 М 45 М 44
14 N 268 N 251 N 44 N 39
В целях рейтингования определены два рейтинговых индекса: ^ при п < 60 (без учета весов) и (с учетом весов). Проведено сравнение индексов N и с суммами Ап (без учета весов) и Б (с учетом весов). Показано, что рейтинги на основе Ап и Б практически «параллельные». Рейтинговые индексы ^ и дают более адекватную картину успеваемости учащихся по сравнению с Ап и Б . Индексы ^ и позволяют:
— классифицировать учащихся по успеваемости (рейтинг неуспевающего студента не будет больше рейтинга успевающего);
— квалифицированно присваивать порядковое рейтинговое значение каждому учащемуся;
— получать качественную картину успеваемости всех учащихся.
Поскольку рейтингование проводилось в контексте системы образования, то существенным образом учитывалось количество низких оценок в векторах-альтернативах. В работах [17, 18] развита также двойственная модель порогового агрегирования, в которой наибольшее внимание уделяется наличию высоких оценок в векторах-альтернативах. Эта модель, включающая в себя явные формулы для двойственных функций перечисления, может быть применена в ситуациях, когда хотя бы одно хорошее качество альтернатив играет определяющую роль.
Подытоживая, можно утверждать, что рейтин-гования, основанные на некомпенсаторных индексах, подобных индексам N и могут представлять значительный интерес во многих реальных ситуациях, когда компенсирование «плохого» посредством «хорошего» не представляется возможным.
Авторы выражают благодарность Ф.Т. Алеске-рову, В.А. Калягину и В.В. Подиновскому за интерес к работе и ценные замечания, а также Е. А. Пикуль-киной за помощь при оформлении рукописи.
ЛИТЕРАТУРА
1. Arrow K.J. Social Choice and Individual Values. — New Haven: Yale University Press, 1963. Перевод: Эрроу К. Дж. Коллективный выбор и индивидуальные ценности. — М.: Изд. дом ГУ ВШЭ, 2004.
2. Sen A.K. Collective Choice and Social Welfare. — San Francisco: Holden-Day, 1970.
3. Миркин Б.Г. Проблема группового выбора. — М.: Физмат-лит, 1974.
4. Фишберн П. Теория полезности для принятия решений. — Там же, 1978.
5. Moulin H. Axioms of Cooperative Decision Making. — Cambridge: Cambridge University Press, 1988.
6. Айзерман М.А., Алескеров Ф.Т. Выбор вариантов (основы теории). — М.: Наука, 1990.
7. Aleskerov F. Arrovian Aggregation Models. — Dordrecht: Klu-wer Academic Publishers, 1999.
8. Подиновский В.В. Введение в теорию важности критериев в многокритериальных задачах принятия решений. — М.: Физматлит, 2007.
9. Алескеров Ф.Т, Якуба В.И. Об одном методе агрегирования ранжировок специального вида // II Междунар. конф. по проблемам управления. — М.: ИПУ РАН, 2003. — С. 116.
10. Алескеров Ф.Т., Якуба В.И. Метод порогового агрегирования трехградационных ранжировок // Доклады РАН. — 2007. — Т. 413, № 2. — C. 181—183.
11. Алескеров Ф.Т, Юзбашев Д.А, Якуба В.И. Пороговое агрегирование трехградационных ранжировок // Автоматика и телемеханика. — 2007. — № 1. — С. 147—152.
12. Aleskerov F, Yakuba V, Yuzbashev D. A 'threshold aggregation' of three-graded rankings // Mathematical Social Sciences. — 2007. — Vol. 53, N 1. — P. 106—110.
13. Калягин В.А, Чистяков В.В. Модель некомпенсаторного агрегирования с произвольным набором оценок // Доклады РАН. — 2008. — Т. 421, № 5. — С. 607—610.
14. Калягин В.А., Чистяков В.В. Аксиоматическая модель некомпенсаторного агрегирования. Препринт WP7/2009/01. — М.: Изд. дом ГУ ВШЭ, 2009. — 76 с.
15. Чистяков В.В. Функция перечисления в многокритериальной задаче порогового агрегирования // Тр. Матем. центра им. Н. И. Лобачевского. — Казань: Изд-во Казан. матем. об-ва. — 2009. — Т. 38. — С. 304—306.
16. Aleskerov F, Chistyakov V.V., Kalyagin V. The threshold aggregation // Economics Letters. — 2010. — Vol. 107, N 2. — P. 261—262.
17. Aleskerov F.T, Chistyakov V.V., Kalyagin V.A. Social threshold aggregations // Social Choice and Welfare. — 2010. — Vol. 35, N 4. — P. 627—646.
18. Aleskerov F.T, Chistyakov V.V., Kalyagin V.A. Multiple criteria threshold decision making algorithms. Препринт WP7/2010/02. — М.: Изд. дом ГУ ВШЭ, 2010. — 40 с.
19. Хаусдорф Ф. Теория множеств. — М.: ОНТИ, 1934.
20. Vilkas E. An axiomatic definition of the leximin // European Journal of Political Economy. — 1986. — Vol. 2/4. — P. 455—463.
21. Подиновский В.В. Многокритериальные задачи с однородными равноценными критериями // Журнал выч. мат. и мат. физики. — 1975. — № 2. — С. 330—344.
22. Подиновский В.В. Симметрически-лексикографические задачи оптимизации и антагонистические игры // Автоматика и вычислительная техника. — 1981. — № 5. — С. 55—60.
23. A multicriterial method for personnel allocation among bank branches / F. Aleskerov et al. // Yapi Kredi Discussion Paper Series. — Istanbul, Turkey, 1998. — N 98—01.
24. Aleskerov F, Ersel H, Yolalan R. Personnel allocation among bank branches using a two stage multicriterial approach // European Journal of Operational Research. — 2003. — Vol. 148, N 1. — P. 116—125.
25. Подиновский В.В. Критерий вероятностно-лексикографического максимина // Вестник Московского университета / Сер. 15. Вычислительная математика и кибернетика. — 1983. — № 2. — С. 33—38.
26. Подиновский В.В. Количественные оценки важности критериев в многокритериальной оптимизации // Науч.-техн. информация / Сер. 2. Информационные процессы и системы. — 1999. — № 5. — С. 22—25.
27. Подиновский В.В. Количественная важность критериев // Автоматика и телемеханика. — 2000. — № 5. — С. 110—123.
28. Сравнительный анализ развитости гражданского общества в трех регионах России / Ф.Т. Алескеров и др. // В кн.: Человеческий фактор в управлении. — М.: КомКнига, 2005. — С. 83—109.
29. Алескеров Ф.Т, Беляева Н.Ю. Количественный анализ развитости гражданского общества в регионах России: параметры, методика, пилотные исследования // Полития. — 2008. — № 1. — С. 160—168.
30. Гончаров А.А., Чистяков В.В. Некомпенсаторное агрегирование и рейтингование студентов / В кн.: XI Междунар. науч. конф. по проблемам развития экономики и общества. — М.: Изд. дом НИУ ВШЭ, 2011. — Кн. 2. — С. 89—99.
31. Гончаров А.А., Чистяков В.В. Агрегирование предпочтений без учета компенсаций и рейтингование. Препринт WP7/2010/04. — М.: Изд. Дом ГУ ВШЭ, 2010. — 40 с.
Статья представлена к публикации членом редколлегии
Ф.Т. Алескеровым.
Гончаров Алексей Александрович — студент магистратуры,
Чистяков Вячеслав Васильевич — д-р физ.-мат. наук,
вед. науч. сотрудник, S (831) 416-96-49, И [email protected],
Национальный исследовательский университет —
Высшая школа экономики, г. Нижний Новгород.