УДК 519.83
МАТВЕЕВ Владимир Александрович, кандидат физико-математических наук, доцент кафедры алгебры и геометрии Псковского государственного педагогического университета. Автор 80 научных публикаций, в т.ч. трех учебно-методических пособий
СРЕДНЕКВАДРАТИЧНОЕ РАВНОВЕСНОЕ РЕШЕНИЕ
В ИГРОВОЙ ЗАДАЧЕ
В работе рассматривается математическая модель: игровая задача для N лиц с векторными выигрышами. Обычно в таких случаях в качестве решения используется равновесие Нэша-Парето. Как правило, таких решений бесконечно много. Возникает проблема уточнения равновесия. Предлагается концепция среднеквадратичного равновесия. В работе представлены условия существования такого решения и приводится модельный пример.
Бескоалиционная игра, векторный выигрыш, среднеквадратичное равновесие
Рассматривается бескоалиционная игра п лиц с векторными выигрышами
( N. {X , {/«Ми )• (1)
Здесь N = {1,2,..., п} - конечное множество номеров игроков. Множество X(г> ^ Rfa состо-
о. (() / (() (() (()\
ит из стратегий х = (X ,х2 ,..., хк ) игрока ( е N. Стратегия отождествляется с точкой ki - мерного евклидового пространства. Набор стратегий всех игроков называется ситуацией и
множество всех ситуаций X = П= 1X((). Заданы векторные функции /(() : X ^ RIг, которые каждой ситуации ставят в соответствие
вектор /г (х) = (// (x), У2( (x>,..., / (х)) выигрышей игрока г е N.
Партия игры развивается следующим образом: каждый из игроков г е N выбирает свою
(г) ^(г)
стратегию х е X , в результате чего складывается общая ситуация х е X. После этого игроки получают свои выигрыши
/(х) = (/1()(x), /2((Ч^... Л(0(х)) , равные
значению своей векторной функции в сложившейся ситуации х е X. Цель игрока г е N состоит в выборе такой своей стратегии, которая позволит достичь возможно большего значения каждой компоненты векторной функции выигрыша.
В последние годы игровые задачи с векторными выигрышами активно изучаются [1-3]. Ранее в России начались исследования по антагонистическим игровым задачам с векторными выигрышами. В этом направлении результаты связаны с именем профессора В.И. Жуковского и его учеников [4, 5].
Рассмотрим задачу (1 ) при условии ^ = 1, г е N. В таком случае наиболее часто используется концепция равновесия по Нэшу. «Так как в такой игре [бескоалиционная игра N лиц] переговоры невозможны, то ее решение должно быть устойчивым, то есть равновесием по Нэшу» [6]. Применим концепцию равновесия по Нэшу к задаче (1) с векторными выигрышами у игроков.
Определение 1. Ситуация х* е X игры (1) называется равновесием Нэша-Парето, если
3/ е N, х(г) е X(0, k е {1,2,..., I г}, что
/к}(х* | х(г}) > /к \х*), то следует
3 е {1,2,..., ,} и /;Г)(х*\хт) < /;Г)( х*), причем (х* | х(,)) = (х(1) ,х(2)*,...,х(,-1)*,х(,),х(,+1)*,...,х(и)*).
Это определение является достаточно общим. Оно включает как частный случай определение равновесия по Нэшу для игры (1) при
I. = 1, / е N и максимума по Парето при
N = {1}.
Содержательно ситуация Нэша-Парето означает, что если игрок / е N, уклонившись от нее в одностороннем порядке, улучшит свой результат по какой-либо компоненте векторной функции выигрыша, то найдется другая компонента этой функции, результат по которой ухуц-шится.
Равновесие по Нэшу-Парето в игровой задаче с векторными выигрышами (1) является первым шагом в процессе выбора решения. Как правило, таких решений достаточно много. Для выбора единственного решения требуется уточнение концепции равновесия.
В проблеме уточнения решения для задачи векторной оптимизации один из путей состоит в использовании такой ситуации, что в критериальном пространстве доставляет минимальное отклонение от некоторого «идеального» состояния [4]. Рассмотрим аналогичный подход к игровой задаче с векторными выигрышами (1). Для каждого игрока г е N и набора страте-
о. (—г) л/г(~/)
гий остальных игроков х е X ^
^ П^ ,& X(1) рассмотрим множество в пространстве критериев Яг‘
Ф«(х(—г)) = {/(г)(х(—°, х(0) | х(0 е X(г)}. (2)
Для этого множества определим числа
/,(г)*(х(—)) = тах /,(г)( х(_г), х(г)),
1 = 1,2,... ,1 г (3)
и набор таких чисел
/ (1)* = / (г)*( х (—г)) =
=(/,»’•(х<-',...,х'4')) е Е'г (4)
назовем точкой утопии в пространстве критериев игрока г е N.
Рассмотрим параметрическое семейство задач векторной оптимизации (максимизации) относительно игрока г е N
V(г) (х(—г)) = {X(г), /(г) (х(—г), х(г))}. (5)
В этой задаче параметром является набор стратегий х(—г) е П,& X(1) . Этот набор составляют стратегии всех игроков, кроме / — го.
В пространстве критериев Яг‘ будем использовать евклидово расстояние, т. е. V/(г), g(г) е Я1‘
<] (1g (г)> = (^ (1(г)—g ,г))2),,!.
Определение 2. Стратегия х(г)* е X(г) игрока г е N называется среднеквадратичным решением в задаче векторной оптимизации
V (г)( х(—г)) из (5), если
х(г)* е а^тт^еX(,) ё(/(г)*(х(—г)),/(г)(х(—г),х(г))
(6)
где точка утопии /(г)* = /(г)(х(—г)) е Я1‘ определена в (3), (4).
Отметим, что среднеквадратическое решение в задаче векторной оптимизации (5) зависит от параметра - набора стратегий х(—г) всех игроков кроме г — го.
Определение 3. Ситуация х = = (х(1)*,...,х(и)*) е Xназывается среднеквадратичным равновесием в игровой задаче с векторным выигрышами (1), если V; е N
(г) л/" (г)
х е X выполнено неравенство
ё(/{г)\х(—)*), /(г) (х(—)*, х(г)*)) <
< ё (/ (г)*( х(—)*), /(г) (х Н)*, х(г))). (7)
Здесь точка утопии / (г)*( х(-г)*) определена в (3) и (4), если в последнем положить х(—г) = (х(1)*,..., х(г—1)*, х(г—1)*,..., х(и)*). Отметим, что ситуация (х(-1)*, х(г)*) = х *.
Это определение является достаточно полным. Во-первых, оно включает как частный случай определение равновесия по Нэшу для игры (1) при ,г= 1, г е N. Действительно,
в этом случае (f (г)*( x( г)*), f (г)(х( г)*, x(г)*)) = 0 и неравенство (7) верно Vi е N Х(i) е X(i).
Во-вторых, оно сводится к среднеквадратичному решению в задаче векторной оптимизации. Пусть в игре (1) имеется один игрок, т.е. N = {1} . В этом случае в (5) представлена задача векторной оптимизации
V(1) = {X(1), f (1)( x(1))}. Тогда, согласно определению 2, стратегия x(1)* из (6) является среднеквадратичным решением задачи векторной оптимизации.
Содержательно среднеквадратичное равновесие означает, что игрок i е N, уклонившись в одностороннем порядке от этой ситуации, не может в «своем» критериальном пространстве перейти в такое новое состояние, что в евклидовой метрике будет располагаться ближе к точке утопии. В частности, отсюда следует, что, если игрок i е N, уклонившись в одностороннем порядке от равновесной ситуации, улучшит какую-либо компоненту «своей» векторной функции выигрыша, то, обязательно, найдется другая компонента, результат по которой ухудшится. Из последнего, с учетом содержательного смысла равновесия Нэша-Парето в игровой задаче (1), следует
Утверждение 1. В игровой задаче (1) каждое среднеквадратичное равновесие является равновесием Нэша-Парето.
Обратное утверждение неверно, что демонстрирует пример 1.
Для доказательства теоремы существования установим вспомогательный результат, имеющий и самостоятельное значение.
Лемма. Пусть функции g1(x),...,gk(x) определены, неотрицательны и выпуклы на выпуклом множестве X œ Rn. Тогда функция h(x) = (g2(x) +... + g2k(x))1/2 выпукла на X.
Доказательство. По условию функции g1( x),..., gk ( x) выпуклы. Это означает, что
Vx, y е X,a е [0,1] выполнены неравенства
0 < g, (ax +(1 - a)y) < agi(x) +(1 - a)g, (y), i = 1,...,k.
После возведения в квадрат и группировки получаем
0 < g2(ш• + (1 — а)у) +... +
+ g2k(ах +(1 — а)У) < а2(gl2(х) + ..
... + ^к( х)) +(1 — а)2 (^( у) +... +
+ gl(У)) + 2а(1 — а)( gl(х) gl(У) + ..
... + gk(х) gk(у)). (8)
Используем неравенство Коши-Буняковско-го для векторов g(х) = (gl(х),...,gk(х)) и
g(у) = (^(УХ...,gk(у)) получаем:
(gl(х)gl(У) +... + gk(х)gk(У)) <
< (gl2 (х) +... + g¡ (х))( g2 (У) +... + g¡ (У)). Усилим неравенство (8)
0 < gl2(aх + (1 — а)у) +... +
+ g2k (ах + (1 — а)У) < а"^2(х) + ..
... + ^к( х)) + (1 — а )2( ^( у) +... +
+ g2k(У)) + 2а(1 — а)( g2 (х) + ..
+ gk2( х))( g2( У) +...
... + gk2( У)).
Правая часть последнего неравенства есть полный квадрат. Таким образом, имеем
0 < gl2(aх + (1 — а)у) +... +
+ g2k (ах + (1 — а)У) < (а(^2 (х) + ..
... + g2( х))1/2 + (1 — а)(( g2( у) +... + g2( у))1/2)2
Перепишем последнее неравенство, используя обозначения функции
И( х) = (g2( х) +... + g2( х))1/2,
0 < И2 (ах + (1 — а)у) < (аИ(х) + (1 — а)И(у))2.
Извлекая квадратные корни, получаем 0 < И(ах + (1 — а)у) < (аИ(х) + (1 — а)И(у)). Это есть определение выпуклости функции И(х) на множестве X, что и требовалось доказать.
Условия существования среднеквадратичного равновесия представлены в
Утверждение 2. Пусть в игре (1) для любого игрока г е N выполнены условия:
а) множество стратегий X(г) с Я ‘ - непустой выпуклый компакт;
б) векторная функция / (г)( х) непрерывна на X;
в) векторная функция / (г)( х(—г), х(г)) вогнута на X(г) для любого набора стратегий
/,1)*(х( г))— /(г)(х( г),х(г)), 1 = 1,...,^ выпуклы
<гу(—г) (г)
х(—г) е X(—г) с
П
X(1). Тогда в игре существует среднеквадратичное равновесие.
Отметим, что векторная функция /(г)(х(—г), х(г)) вогнута на X(г), если на этом множестве вогнута каждая его компонента
/“(х("°, х <■>), 1 = 1,2,..., ,г
Доказательство основано на применении теоремы Какутани о неподвижной точке [7, 8]. Согласно этой теореме многозначное отображение непустого, компактного и выпуклого множества X с Яр в себя с непустыми, компактными и выпуклыми значениями и полунепрерывное сверху по включению должно иметь хотя бы одну неподвижную точку. Покажем выполнение условий этой теоремы.
Так как множество стратегий X(г) с Як‘ есть непустой и выпуклый компакт, то таким же будет и множество всех ситуаций
X = ПгеNX(г) С ЯР , Р = ^ + - + kn . Определим непрерывное отображение р : X ^ X . Каждой ситуации х е X и игроку г е N поставим в соответствие точку утопии / (г)*из (4) в пространстве его критериев Я1. Компоненты этой точки определяются по правилу (3) и непрерывно зависят от параметра х(—г) и, значит, от ситуации х. Зная точку утопии /(г) , рассмотрим задачу минимизации (6) для функции ё(/(г)*(х(—)),/(г)(х(—г),х(г)) на множестве
X(г).
По условию функции /1(г)(х( г), х(г)), г = 1,2,...,^ вогнуты на X(г) при любом
X
(—г)
с
П
на X(г). Кроме того, эти функции являются неотрицательными на X(г), что следует из условия (3). Для набора функций
(г)
/Г(х(—))—/Ч^,х()), 1 = 1,...,,, на X выполнены условия леммы. Итак, получаем, что функция
ё (/(г)*, / (г)( х(—), х(г))) =
= (((П"(. х /Г( х'—), хт))2 + ...
... + </,")V-’)-/¡"(х'-", х |,|))2)|/! (9)
непрерывна на X и выпукла на множестве стратегий X(г). Для нахождения среднеквадратичного равновесия рассмотрим множество тех х(г)* е X(г), что выполнено условие (7). Множество этих х(г)* составляют все решения задачи минимизации (6). Обозначим это множество
X (г)*( х Н)) =
= argmlnх^„ ё(/(г)*(х(—г),/(г)(х(—г),х(г)). (10)
Отметим, что функция ё (/ (г)*( х(—г)), /(г)(х(—г), х(г))) непрерывна по совокупности аргументов и выпукла на X(г), а множество X (г)*( х(—) ) из (6) непусто, замкнуто (компактно) и выпукло. Кроме того, это множество, которое зависит от набора стратегий х( г) е X( г) с П1 & X(г), является полунепрерывным сверху по включению [9].
Таким образом, для любой ситуации х е X и игрока г е N однозначно определяется множество X(г)*(х(—)) с X(г) с Як‘. Определим отображение р : X ^ X следующим образом: р(х) = (X(1)*(х(-1}),...,X(п)*(х(-п))) с X =
П X(г) с Яр,р =k 1+... + kn.
± ±геN 1 п
(11)
jеN, ] &
X(1). Тогда функции
Из свойств множества X (г)*( х( г)), г = 1,2,..., п, определенного в (8), следует, что многозначное отображение р имеет непустые компактные и выпуклые значения и является
полунепрерывным сверху по включению. Тогда по теореме Какутани существует ситуация х* е X, что р(х*) = х * .
Покажем, что эта ситуация является среднеквадратичным равновесием в игровой задаче с векторными выигрышами (1). Действительно, если игрок г е N в одностороннем порядке уклонится от своей стратегии х(г) е X(г), входящей в среднеквадратичное равновесие
* / (1)* (г)* (п)*\
х = (х '' ,..., хК) ,..., х ; ), то это не изменит его точку утопии /(г) (х( г)) из (4). Тогда, учитывая условие (10), получаем
ё(/(г)*(хН)*),/(г)(х(г)*,х(г)*)) <
< ё(/(г)*(х(—)*),/(г)(х(г)*,х(г))).
Последнее неравенство есть определение среднеквадратичного равновесия (7) в игровой задаче (1). Теорема доказана.
Представленная выше теорема показывает, что среднеквадратичное равновесие в задаче (1) является неподвижной точкой многозначного отображения (11), компоненты которого определены в (10). Эти условия в некоторых случаях позволяют вычислить среднеквадратичное равновесие.
Анализируя доказательство утверждения 1, следует выделить основной пункт. Это доказательство выпуклости функции ё(/(г)*(х(—г)), / (г)( х(г), х(г))) из (9) на множестве стратегий X(г). Условия теоремы можно усилить, потребовав в условии выпуклость соответствующей функции. На этом пути получаем
Утверждение 3. Пусть в игре (1) для любого игрока г е N выполнены условия:
а) множество стратегий X(г) с Як‘ непустой выпуклый компакт;
б) векторная функция / (г)( х) непрерывна на X;
в) для любого набора стратегий
х(—г) е X(—г) с ПlеN, 1&г X(1) функдия ё ( / (г)*( х(—г)), / (г)( х(—г), х(г))) =
= ((^.1l(г)*( х Н)) — /1(г)( х(—г), х(г)))2 + ...
... + (/,(°*( х(—г)) — /,(г)( х(—г), х (г)))2)1/2
из (9) выпукла на X(г). Тогда в игре существует среднеквадратичное равновесие.
Доказательство в основном повторяет доказательство утверждения 1. Выпуклость функции ё (/ (г)*( х(-г)), / (г)( х(—г), х(г))) из (9) на X(г) гарантирует нужные свойства многозначному отображению (11), что и доказывает утверждение.
Пример 1. В качестве примера рассмотрим конечную бескоалиционную игру двух лиц с векторными двухкритериальными выигрышами из [3]. Такая игра определяется аналогично биматричной игре из [10]. Отличие состоит в том, что выигрыши игроков представлены векторами, размерности два.
(9,0) (9,0) (1,4) (10,9)
(10,9) (1,4) (4,1) (4,1)
Рис. 1. Биматричная игра двух лиц с двухкритериальным выигрышем у каждого игрока
В этой игре два игрока, т.е. N = {1,2}. Первый игрок выбирает строки (первая, вторая строка), а второй игрок - столбцы (первый, второй столбец). Каждая клетка таблицы соответствует ситуации игры. В клетках представлены векторы выигрышей: в верхнем левом углу выигрыш первого игрока, в нижнем правом углу - второго игрока. Векторы выигрыш е й я вл я ют с я д вух комп он ен т н ыми , т. е. К, = , = 2. Смешанные стратегии - это векторы, составляющие фундаментальный симплекс в евклидовом пространстве Я2. Стандартным образом определяются выигрыши игроков при использовании смешанных стратегий как математическое ожидание, вычисленное для каждой компоненты векторного выигрыша отдельно.
В [3 ] показано, что в этой игре множество всех равновесных по Нэшу-Парето ситуаций в смешанных стратегиях
Р = {((а, 1 — а);(Р, 1 — Р)|0 < а < 0,25;
0 < Р < 0,25} и {((а, 1 — а); 0) | 0,25 < а < 1} и
{(0; (р, 1 — Р)) | 0,25 < р < 1}. (12)
Выделим из этого множества одно решение, которое является среднеквадратичным равновесием. Проведем рассуждения для первого игрока. В силу симметрии матрицы выигрышей, рассуждения для второго будут аналогичны. Напомним, что множество смешанных стратегий первого (второго) игрока составляют фундаментальный симплекс в евклидовом пространстве Я2 и обозначаются X(1) = {х(1) = (а, 1 — а) | 0 < а < 1}
X(2) = {х(2) = (Р, 1 — Р) | 0 < р < 1}). Определим множество Ф (1)( х(-1)) из (2). В нашем случае Ф (1)( х(-1)) = Ф (1)(Р) и представляет собой отрезок АВ в пространстве Я2, где А(1 + 8р, 4 —4Р) и В(4 + 6р, 1 + 8Р). Поскольку, согласно утверждению 1, среднеквадратичные равновесия находятся среди равновесий по Нэшу-Парето, то, учитывая (10), ограничимся рассмотрением стратегий второго игрока с условием 0 < Р < 0,25 . Отметим, что и для первого игрока будем также учитывать только стратегии, у которых 0 < а < 0,25.
Определим точку утопии для первого игрока /(1)* = /(1)*(Р) из (4). Из рис. 2 следует, что /(1)* = (4 + 6Р, 4 —4Р). Рассмотрим параметрическое семейство задач векторной оптимизации (5) для первого игрока
V (1)(Р) = {X(1) = [0,0,25], / (1)(а, Р) =
= (4 — 3а + 6Р + 2аР, 1 + 3а + 8Р — 12аР)}.(13) В данных условиях для каждого Р е [0,0,25] найдется единственное значение а = а(Р) е [0,0,25], что является решением включения (6). Эта функция а = а(Р) будет непрерывной при Р е [0,0,25] .
Получаем, что функция а = 2,25(16Р2 — — 8Р +1) /(9 — 42 Р + 74Р2) предписывает пер-
вому игроку его наилучший ответ относительно критерия (6) на любой выбор второго игрока Р = [0,0,25].
Как было сказано выше, по аналогичной схеме определяется функция Р = Р(а), которая для каждого выбора первого игрока а е [0,
0,25] указывает наилучший относительно критерия (6) ответ второго. Получаем, что Р = 2,25(16а2 —8а +1)/(9 — 42а + 74а2).
«утопии» и(4 + 6Р,4 — 4Р)
Согласно определению 3, среднеквадратичное равновесие в рассматриваемой задаче составляют пара стратегий первого и второго игроков, каждая из которых является наилучшей реакцией игрока на действие партнера. Эта ситуация определяется как решение системы уравнений
а = 2,25(16Р2 — 8Р +1)/(9 —42Р + 74Р2),
Р = 2,25(16а2 —8а +1)/(9 — 42а + 74а2).
Численное решение этой системы (с точностью до четырех знаков после запятой) имеет вид а = Р = 0,1542. Итак, рассматриваемая игровая задача имеет единственное среднеквадратичное равновесие
х * = (х (1)\ х(2)*),
где х(1)* = (0,1542, 0,8458)
и х (2)* = (0,1542, 0,8458). = / (2)(х(1)*, х (2)*) = (4,5103, 2,4110).
В этом случае игроки получают равные Таким образом, предлагаемое среднеквад-векторные выигрыши ратичное равновесие является строгим уточне-
/(1)(х(1)* х(2)*) = нием равновесия Нэша-Парето.
Список литературы
1. VanMegen F., Borm P., TijsS. A Preference Concept for Multicriteria Game // Mathematical Methods of OR. 1999. Vol. 49. J№. 3. P 401-412.
2. Wang S. Existence of a Pareto Equilibrium // J. of Optimization Theory and Applications. 1993. Vol. 3. P. 61-63.
3. Матвеев В.А. Игровая задача с векторным выигрышем // Изв. Ин-та математики и информатики Удмурт. гос. ун-та. Ижевск, 2001. Вып. 1(21). С. 67-82.
4. Zhukovskii VI., SalukvadzeM.E. The Vector-Valued Maximin. Boston, San Diego, New-York, London, 1994.
5. Многокритериальные модели при неопределенности и их приложения: межвуз. сб. науч. тр. Челябинск, 1988.
6. Damme Eric van. Refinement of the Nash Equilibrium Concept. Springer - Verlag, 1983.
7. КанторовичЛ.В., АкиловГ.Г. Функциональный анализ. М., 1972.
8. FudenbergD., Tirole J. Game Theory. Cambridge, 1993.
9. ОбенЖ.-П., ЭкландИ. Прикладной нелинейный анализ. М., 1988.
10. Петросян Л.А., Зенкевич Н.А., СеминаЕ.А. Теория игр. М., 1998.
Matveev Vladimir
ROOT-MEAN-SQUARE EQUILIBRIUM IN GAME PROBLEM
The paper considers the following mathematical model: a game problem for n persons with vector payoffs. The Nash-Pareto equilibrium is usually used as a solution in this case. As a rule, there is an infinite set of such solutions, so a refinement problem arises. The root-mean-square equilibrium is suggested. The paper presents the existence conditions of this solution and adduces a model example.
Контактная информация: e-mail: [email protected]
Рецензент - ПатроноваН.Н., кандидат педагогических наук, доцент кафедры прикладной математики Поморского государственного университета имени М.В. Ломоносова