УДК 519.8
И. И. Поспелова1, Н.М. Новикова2
1 Московский государственный университет им. М. В. Ломоносова 2Вычислительный центр им. А. А. Дородницына РАН
Компромисс в многокритериальных играх с противоположными интересами
В данной работе исследуется вопрос определения решения многокритериальной игры двух лиц, в которой выигрыш каждого игрока задается вектор-функцией. Формальное расширение классических определений теории игр не приводит к удовлетворительному результату в случае нескольких критериев оценки выигрыша. В работе предлагается новый подход к понятию равновесия в многокритериальной игре, построенный на основе не формальных, а содержательных соображений.
Ключевые слова: многокритериальная игра, равновесие, компромисс, векторный критерий, наилучший гарантированный результат
1. Введение
Традиционно для математического описания конфликтов, возникающих в реальной жизни, используются теоретико-игровые модели [1,2]: конфликтующие стороны называются игроками, возможности каждого игрока задаются множеством его стратегий, а результат выбора стратегий игроками оценивается функциями выигрыша. Целью исследования игровой модели является поиск решения игры — набора стратегий, являющихся наиболее предпочтительными с точки зрения игроков, для последующей выработки рекомендаций реальным участникам конфликта. В классической теории игр каждый игрок имеет единственную функцию выигрыша, значение которой он стремится увеличить, и решение игры определяется с позиции наличия в ней равновесия — состояния, отклонение от которого не выгодно ни одному игроку (по отдельности), либо (в играх с непротивоположными интересами) состояния, устраивающего всех игроков одновременно.
Однако в практических ситуациях лицо, принимающее решение (ЛПР) в условиях конфликта, оценивает свои действия и действия других сторон с точки зрения нескольких факторов. Формально это означает, что функции выигрыша в игровой модели являются векторными, тогда игра называется многокритериальной — в ней каждый из игроков оценивает решение сразу по нескольким критериям.
Формальная запись многокритериальной игры в нормальной форме выглядит следующим образом:
Г = (N, (Хг)геИ, (Fl)teN), где N = {1,... ,п} — множество игроков, Xi — множество стратегий г-го игрока,
Fl(xi, ...,хп) = (Л(XI, ...,хп), ...,flki(XI, ..., Хп))
вектор-функция выигрыша ¿-игрока, содержащая ki частных критериев. Как и в классической теории игр, считаем, что каждый игрок стремится к увеличению своей функции выигрыша, и, таким образом, приходим к набору задач многокритериальной оптимизации (максимизации) — задач поиска максимума вектор-функций:
F%(x) ^ Max, х е ®iXi, г = 1,...,п.
Решением задачи многокритериальной оптимизации является множество недоминируемых значений аргумента вектор-функции [3,4]. Множество недоминируемых значений самой вектор-функции образует в пространстве критериев (критериальном пространстве)
множество Парето, которое более наглядно показывает решение задачи многокритериальной оптимизации, нежели соответствующие значения аргумента.
Основным свойством решения задачи многокритериальной оптимизации является существенная множественность значений оптимума. По сути это означает наличие у ЛПР внутренней (субъективной) неопределенности собственных интересов, наряду с (объективной) неопределенностью по отношению к интересам и действиям другого игрока. По этой причине формализация понятия решения в многокритериальной игре является нетривиальной задачей. Оказывается, что совмещаемые при определении многокритериальной игры подходы теории игр и многокритериальной оптимизации противоречат друг другу. Задача теории игр состоит в том, чтобы дать конкретные рекомендации по выбору оптимальной стратегии, а при наличии многих критериев все парето-оптимальные значения являются несравнимыми, и выбор конкретной точки множества Парето остается за ЛПР. Поэтому представляет интерес попытаться определить равновесие в многокритериальной игре так, чтобы можно было хотя бы сузить множество парето-оптимальных исходов.
2. Подходы к определению равновесия в многокритериальной игре
Естественным путем формализации понятия равновесия в игре с многими критериями является распространение известных определений для классических скалярных игр [5-8]. Наиболее общим определением равновесия в игре в нормальной форме является равновесие Нэша [2], аналогами которого для многокритериальных игр являются равновесия по Парето [6] и взвешенное равновесие Нэша [8]:
Определение 1. Исход (х\,... ,хп) называется равновесием по Парето в игре Г, если для каждого игрока г его стратегия Xi € Х^ является парето-оптимальной, т.е. не существует такой стратегии ^ € Xi, что Р'1(у.1,х-.1) ^ Fi(xi,x-i).
Определение 2. Исход (х\,... ,хп) называется взвешенным равновесием Нэша в игре Г относительно весовых коэффициентов Ш = (Ш1,..., Шп), если для каждого игрока г и любой его стратегии ^ € Х^,
№i,Fi(Xi,X-i)) >
Применение определений 1 и 2 с целью помощи ЛПР в выборе решения в условиях конфликта затруднительно. Равновесие по Парето не позволяет выбрать единственное решение или хотя бы ограничить множество решений в том случае, когда множество исходов игры не содержит доминируемых по Парето значений. В этом случае равновесными могут оказаться все стратегии игроков. Взвешенное равновесие Нэша обладает другим недостатком
— необходимостью выбрать (задать) веса. Наличие весов снимает внутреннюю неопределенность ЛПР, причем существуют разные способы взвешивания критериев, называемые функциями свертки [4,9]. Однако проблема состоит в том, что наличие у ЛПР нескольких критериев оценки решения означает невозможность определить их относительную значимость, т.е. веса. При этом метод сверток оказывается удобным для параметризации множества Парето [10,11].
В исследовании операций основным подходом к выбору решения в условиях неопределенности является принцип гарантированного результата [9], согласно которому ЛПР должен выбирать наилучшую для себя стратегию при условии наихудших для себя значений неопределенных факторов. В многокритериальной игре неопределенным фактором являются действия других игроков, а наихудшие их действия направлены на уменьшение выигрыша рассматриваемого ЛПР.
Для иллюстрации принципа гарантированного результата рассмотрим многокритериальную игру двух лиц с противоположными интересами: С = (Х,У, Ф(х,у)), где X — множество стратегий 1-го игрока, У — множество стратегий 2-го игрока, Ф = ,..., )
— вектор-функция выигрыша 1-го игрока и проигрыша 2-го, т.е. первый игрок стремится к максимизации Ф, а второй — к минимизации Ф (максимизации —Ф). Для простоты и
наглядности иллюстраций будем считать, что множества стратегий игроков конечны. В таком случае игра С является многокритериальным аналогом антагонистической матричной игры, решением которой является седловая точка (если она существует), т.е. точка, где выполняется равенство наилучших гарантированных выигрышей игроков (максимина 1-го игрока и минимакса 2-го).
Применяя формально принцип гарантированного результата, получаем, что в отсутствие информации о действиях противника наилучший гарантированный результат 1-го игрока задает МахМтФ(х,у), а наилучший гарантированный результат 2-го игрока —
хЕХ уЕУ
уеУ хеХ v
Для того, чтобы определить эти выражения, в [3,10,12] предложено перейти от значений вектор-функции к их оценкам, т.е. вместо точки Ф(х,у) рассматривать множество {■ф ^ Ф(х,у)} для 1-го игрока и множество {ф ^ Ф(х,у)} — для второго. Правомерность перехода к оценкам объясняется следующим свойством:
Ф(х,у) = Мах{^|^ < Ф(х,у)} = > Ф(х,у)}.
Рис. 1. Оценки значения векторного критерия
На рис. 1 показаны оценки значения вектор-функции 1-м и 2-м игроком.
После перехода к игре в «оценках» согласно [10,11]
МахМтФ(х,у) = Max У р| {ф\ф < Ф(х,у)} = МахФ<;
жех yeY xeXyeY
МтМахФ(х,у) = Min У Q [ф\ф ^ Ф(х,у)} = МтФ^.
yeYxeX
В данном случае рассматривается ситуация отсутствия у игроков информации о действиях противника. На рис. 2 показан гарантированный результат в антагонистической игре двух лиц, в которой каждый из игроков имеет по две стратегии: X = {х\,х2}, Y = {у\,у2}. Выражения для гарантированных выигрышей игроков в различных условиях информированности можно найти в [12].
Понятие гарантированного результата, определенное для игры в «оценках», не решает вопроса об определении равновесия в многокритериальной игре, поскольку в нетривиальных случаях общего положения пересечение множеств Ф^ и Ф^ гарантированных результатов игроков в пространстве всех критериев будет пустым. Также игра в «оценках» обладает следующими двумя недостатками:
1) оценки векторного критерия, вообще говоря, не являются достижимыми, поэтому может не быть (и, как правило, нет) стратегии, приводящей к гарантированному результату, т.е. гарантированный результат является пессимистическим;
2) после перехода к оценкам игра перестает быть антагонистической в силу разного отношения игроков к одной и той же точке (разной оценки одной и той же точки).
Таким образом, для игры в «оценках» также не получается определить понятия решения игры на основе известных подходов теории игр и исследования операций. Поэтому попробуем «пойти» не от формальных определений, а от сути решения игры как достигнутого противоборствующими сторонами компромисса.
Рис. 2. Гарантированные выигрыши игроков в многокритериальной игре
3. Множество компромиссов
Продолжим рассматривать игру G c конечными множествами стратегий игроков. Предположим, что вектор-функция Ф содержит все возможные критерии для оценки стратегий игроков, однако игроки, понимая, что получить оптимум по всем критериям все равно не удастся, выбирают из них наиболее значимые. Получаем, что цель каждого из игроков выражается лишь частью (первоочередных) критериев вектор-функции Ф.
Обозначим через К множество всех критериев, | = к. Пусть М С К — подмножество критериев, выражающее интересы 1-го игрока, а N С К — подмножество критериев, выражающее интересы 2-го игрока. Рассмотрим игру Gmn = {Хм,Yn, Фм, Фм), в которой Фм = {fi{x,y)i£M), Фм = {fi{%,y)i£N) (порядок следования критериев сохранен из исходной вектор-функции Ф), множества стратегий игроков Хм, Ум получены из исходных множеств стратегий X и Y соответственно в результате исключения доминируемых стратегий. При переходе в критериальное пространство меньшей размерности строится проекция исходного множества значений вектор-функции Ф на это пространство, при этом некоторые стратегии игроков могут оказаться доминируемыми и их следует исключить из рассмотрения. Заметим, что исключаемые стратегии зависят от выбора множеств М и N.
Гарантированные результаты 1-го и 2-го игрока в игре Gmn являются соответственно множествами
Max Min Фм {х,у) = Max II П П {ф е RIM ^ < ^ {х,у)} = МахФ^,
х£Хм V&N I I I I
" х£Хм У&N
Min Max Ф^ (x,y) = Min II О e RINI^i > <fii(x,y)} = МтФ^.
у£YN X€.XM I I I I ^
M yeyn X£Xm ieN
Множества гарантированных результатов и представляют собой проекции множеств Ф^ и Ф^ на подпространства М и N критериев соответственно. Заметим, что исключение доминируемой стратегии не влияет на гарантированный результат.
Определение 3. Назовем множеством компромиссов в игре G множество "Emn точек исходного критериального пространства (К критериев), полученное в результате пересечения множеств гарантированных результатов Ф^ и Ф^, помещенных в исходное критериальное пространство.
и
Отметим следующее свойство множеств гарантированных результатов в многокритериальной игре, которое позволяет описать структуру множества компромиссов:
ф^ с{е\е < с*}, ^
где
£* = max min шi(x,y),ri* = min max i£i(x,y). xeXyeY yeYxex
Множество компромиссов обладает следующими свойствами.
1. При условии подходящего выбора игроками подмножеств критериев М С К и N С К множество компромиссов включает в себя решения многокритериальной игры при наличии лексикографического порядка [1] критериев у каждого из игроков.
Действительно, пусть игроки применяют лексикографическое упорядочивание критериев. Не ограничивая общности, будем считать, что у первого игрока наиболее предпочтительным является 1-й критерий, а у второго игрока — 2-й критерий. Тогда решение игры (в критериальном пространстве) будет состоять из векторов £ £ Rk таких, что
£1 = max min <р\(х,у) и = min max р2(х,у). Остальные компоненты вектора £ произ-xeX yeY y&Y xeX
вольны. При необходимости дополнительного отбора стратегий используются следующие по предпочтению критерии. Если для обоих игроков наиболее предпочтительным является один и тот же критерий, то существование равновесия зависит от наличия решения в однокритериальной игре с выбранным критерием.
Множество компромиссов 5mn при условии М = {1} и N = {2} состоит из векторов ф, у которых компоненты множества М критериев фм £ Ф М и компоненты множества N критериев фn £ Ф N. В рассматриваемом случае это означает, что ф1 ^ и ф2 ^ а остальные компоненты вектора ф произвольны. Таким образом, в 5 mn включаются векторы, являющиеся оптимальными с точки зрения лексикографического порядка.
2. Структура множества компромиссов зависит от наличия седловых точек частных критериев и общих интересов игроков (т.е. непустоты множества М Р| N).
Обозначим через S С К множество критериев, имеющих седловые точки: 5 = {г £ К= V*}.
а) Если интересы игроков не пересекаются, т.е. если М Р| N = 0, тогда множество компромиссов 5mn непусто.
б) При наличии общих интересов игроков, т.е. при М Р| N = 0, множество компромиссов непусто, только если М Р| N С S.
Действительно, если Mf^\N = 0, то множество 5 mn состоит из векторов С = (Ы,Cn,Ск\(МUN)) таких, что
См = = ШieM, Cn = = Ц*)ieN, £к\(мun) = - любая)ieK\(MUN).
Если же Mf^\N = 0, то множество 5 mn состоит из векторов С = (£м C\N ,См\(М HN ),Cn\(М HN ),^K\(M UN)) таких, что
СМ\( М HN) = (Ci = Ш ieM\(М HN), СN\(М HN) = (6 = Vi)i eN\(М QN),
Ск\(мUN) = (б - любая)ieK\(мUN), а компоненты вектора QN должны быть общими для векторов, принадлежащих множествам гарантированных результатов ФМ и Ф N. Это возможно в силу свойства множеств гарантированн ых результатов только тогда, когда ^ = = т.е. для подмножества критериев М Р| N существуют седловые точки.
На рис. 3 приведены примеры двухкритериальных игр, для которых в критериальном пространстве изображены гарантированные результаты каждого из игроков в случае двух критериев и в случае отказа от одного из критериев. На рис. 3а значения максиминов и минимаксов обоих критериев совпадают, поэтому множество компромиссов непусто независимо от того, какие критерии выберут игроки (на рис. 3a М = 1, N = 2, Фм = {^l^i ^ {*},
= {^1^2 ^ На рис. 3б максимины обоих критериев строго меньше соответству-
ющих минимаксов, поэтому при выборе игроками одного и того же критерия множество компромиссов будет пустым (на рис. 3б М = N = 1, Ф^ = ^ £*}, Ф^ = ^ ^1}).
а) б)
Рис. 3. Множества компромиссов
4. Обсуждение
Проанализируем предложенное новое понятие множества компромиссов с содержательной точки зрения.
1. Непустота множества компромиссов зависит от существования седловых точек частных критериев вектор-функции выигрыша. Наличие седловой точки в антагонистической матричной игре означает фактически отсутствие конфликта (игра является несущественной [2]). В случае векторной функции выигрыша критерии с седловыми точками отражают противоположные интересы игроков, по которым «достигается договоренность».
2. Если множества стратегий игроков конечны, то у всех частных критериев существуют седловые точки в смешанных стратегиях. Это значит, что множество компромиссов всегда будет непустым, однако седловые точки для разных критериев в общем случае получаются на разных парах стратегий игроков, поэтому нельзя дать однозначных рекомендаций по выбору стратегий в многокритериальной игре.
3. Наличие большого числа критериев при относительно небольшом числе стратегий и наличии седловых точек частных критериев дает возможность решения игры с несколькими критериями — найдется пара стратегий, являющаяся седловой сразу для нескольких критериев.
4. Игра Смы, вообще говоря, не является антагонистической. Поэтому можно говорить о том, что понятие множества компромиссов определено для любой игры с многими критериями, а не только для игр с противоположными интересами.
5. Заключение
В настоящей работе для многокритериальной игры двух лиц с противоположными интересами предложено новое понятие - множество компромиссов, которое содержит недоминируемые значения вектор-функции, являющиеся приемлемыми для обоих игроков в смысле отсутствия противоречия. Такие значения или их часть может рассматриваться как решение игры с векторным критерием в пространстве критериев. Поиск стратегий, позволяющих прийти к компромиссу, является отдельной сложной задачей, являющейся предметом будущих исследований авторов. Дело в том, что в случае многих критериев каждой стратегии игрока, даже при фиксированной стратегии противника, соответствует множество значений в критериальном пространстве. Поэтому, в отличие от скалярного случая, где поиск стратегии, дающей равновесное значение функции выигрыша, является
формальным, задача поиска стратегии, приводящей к компромиссу для векторной функции выигрыша, является весьма не тривиальной. Сложность здесь состоит еще и в том, что на выбор стратегии влияет не только наличие компромисса между игроками, но и внутренняя неопределенность у игроков.
Литература
1. Гермейер Ю.Б. Игры с непротивоположными интересами. — М. : Наука, 1976.
2. Мулен Э. Теория игр с примерами из математической экономики. — М. : Мир, 1985.
3. Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. — М. : Наука, 1982.
4. Лотов А.В., Поспелова И.И. Многокритериальные задачи принятия решений. — М. : МАКС Пресс, 2008.
5. Shapley L.S. Equilibrium points in games with vector payoffs // Naval Research Logistics Quarterly. — 1959. — V. 6, N 1. — P. 57-61.
6. Borm P., Vermeulen D., Voorneveld M. The Structure of the Set of Equilibria for Two Person Multicriteria Games // European Journal of Operation Research. — 2003. — V. 148.
— P. 480-493.
7. Krus L., Bronisz P. On n-person Noncooperative Multicriteria Games Described in Strategic Form // Annals of Operation Research. — 1994. — V. 51.— P. 83-97.
8. Wang S. Y. Existence of a Pareto equilibrium //J. Optim. Theory Appl. — 1993. — V. 79.
— P. 373-384.
9. Гермейер Ю.Б. Введение в теорию исследования операций. — М. : Наука, 1971.
10. Крейнес Е.М., Новикова Н.М., Поспелова И.И. Многокритериальные игры двух лиц с противоположными интересами // Ж. вычисл. матем. и матем. физ. — 2002. — T. 42, № 10. — С. 1487-1502.
11. Novikova N.M., Pospelova I.I. Multicriteria Decision Making Under Uncertainty// Math Prog. Series B. — 2002. — V. 92, N 3. — P. 537-554.
12. Поспелова И.И. Классификация задач векторной оптимизации с неопределенными факторами // Ж. вычисл. матем. и матем. физ. — 2000. — T. 40, № 6. — С. 860-876.
Поступила в редакцию 15.12.2014.