Сер. 10. 2009. Вып. 3
ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
УДК 519.8 В. Л. Крепс
КОНЕЧНЫЕ БЕСКОАЛИЦИОННЫЕ ИГРЫ С ЕДИНСТВЕННЫМИ СИТУАЦИЯМИ РАВНОВЕСИЯ
1. Введение. В работе рассматриваются конечные бескоалиционные игры N лиц размера mi х m2 х ... х mn. Решается вопрос - может ли заданная вполне смешанная ситуация этого размера быть единственной ситуацией равновесия по Нэшу для некоторой игры из исследуемого класса. Для случая двух игроков (биматричные игры) ответ на данный вопрос дан в работе Миллхема [1]. Необходимым и достаточным условием является равенство числа чистых стратегий игроков, mi = m2. В настоящей работе демонстрируется, что для произвольного числа игроков N необходимое и достаточное условие - выполнение неравенства
_max (mi - 1) = mi0 - 1 ^^2 (mi - 1). (1)
i=io
Поскольку (mi — 1) есть размерность симплекса смешанных стратегий игрока i, неравенство (1) означает, что максимальная размерность симплексов смешанных стратегий игроков не превосходит суммы таких размерностей остальных игроков. Для биматрич-ных игр неравенство (1) сводится к равенству mi = m2.
В случае более чем двух игроков вопрос о существовании конечной бескоалиционной игры, для которой заданная произвольная (не обязательно вполне смешанная) ситуация - это единственная ситуация равновесия для некоторой конечной бескоалиционной игры, остается открытым. Для матричных игр ответ на него следует из результатов Гейла и Шермана [2]. Необходимое и достаточное условие состоит в равенстве мощностей спектров (числа ненулевых компонент) стратегий, составляющих данную ситуацию. Оказывается, что тот же факт верен и для биматричных игр.
Приведенные результаты обобщают результаты наших работ [3, 4].
2. Определения и свойства. Конечная бескоалиционная игра (см. [5, 6]) задается тройкой
Г =< I,Si,Ai, i е I >,
где I = {1,...,N} - множество игроков; Si = {1,...,mj_} - множество чистых стратегий игрока i; многомерная вещественная матрица
Ai = ,l=1,-,N
задает выигрыши игрока i в ситуации (j1,...,ji,... ,jN) (при выборе игроком l стратегии ji, l = 1,...,N).
Крепс Виктория Леонидовна — старший научный сотрудник Санкт-Петербургского экономикоматематического института РАН. Количество опубликованных работ: 54. Научные интересы: теория игр, теория вероятностей, финансовая математика. E-mail: [email protected].
© В. Л. Крепс, 2009
Множество смешанных стратегий (вероятностных смесей чистых стратегий) Xг игрока г представляет собой симплекс размерности ] = тг — 1:
Шг
Х1 {хг Х^шг ) , ^ ° ^ ^ 1} •
3 = 1
При использовании игроками смешанных стратегий х^ функция выигрыша игрока г, г = 1,..., N в ситуации х = (х1, . ..,х[, ,х^) имеет вид
N
Н(х) = 53 ^..^ПХк3к.
31,...,3Ы к=1
Ситуация х* = (х*,..., xN) называется ситуацией равновесия по Нэшу [7] в игре Г, если для всех игроков г = 1,...,Ы справедливы равенства Нг(х*)=тахХгЁхг Нг (х* ||хг), где х* ||х = (х*,..., х*—1, хг, х*+1,..., xN) - ситуация, в которой все игроки, за исключением игрока г, выбрали свои стратегии-компоненты ситуации равновесия х*.
Стратегия х игрока г называется вполне смешанной, если все х3 > 0, ] = 1,...,тг. Ситуация х = (х1 ,...,ХN) называется вполне смешанной, если все входящие в нее стратегии х вполне смешанны.
Принимая во внимание тот факт, что Х1Ш1 =1 — ^Ш=_ 1 Х3, функцию выигрыша Н игрока г можно переписать, как функцию переменных хц,..., х1ш1_1, I = 1,...,Ы. Эта функция при фиксированных стратегиях остальных игроков есть аффинная функция его собственных стратегий хц, ..., хШг _1. Легко видеть, что любой N -набор функций такого вида соответствует некоторой конечной бескоалиционной игре N лиц размера т-1 х т-2 х ... х mN.
Используя аффинность функции Н от стратегий игрока г при фиксированных стратегиях других игроков, можно ее переписать в виде
ш г _ 1
Нг(х)=Е П(х)хгз + Г(х% (2)
3=1
где хг = П к=г(хк1,..., xx.dk) - вектор размерности П = ]к, а Р и - некоторые функции от хг. Отметим, что компоненты хкШк, к = г, не входят в вектор хг.
Пусть х - ситуация равновесия в игре Г. Ниже перечисленные свойства являются непосредственным следствием определений:
1) если для некоторых г и ] /3(хг) < 0, то Х3 = 0;
2) если для некоторых г и ] f3■(xг) > 0, то хШг = 0;
3) если ситуация х вполне смешанна, то fj(xl) = 0 для всех г = 1,...,N и ] = 1,...,тг — 1.
3. Конечные бескоалиционные игры N лиц с заданными единственными ситуациями равновесия.
Теорема 1. Пусть х* = (x*,...,xN) вполне смешанна. Необходимым и достаточным условием существования конечной бескоалиционной игры Г, для которой х* - единственная ситуация равновесия, является выполнение неравенства
тах ] = < > ]г, (3)
г=1,...,м ^
г=%0
где = тг — 1 - размерность симплекса смешанных стратегий игрока г.
Доказательство. В работе [8] установлено, что если для некоторого г0, 1 ^ г0 ^ N, верно неравенство
mг0 >^2mi — N,
г=го
то для любой вполне смешанной ситуации равновесия х конечной бескоалиционной игры N лиц размера ml х m2 х ... х mN существует другая ситуация равновесия х* = х||х*о, где стратегия х*о игрока го не вполне смешанна. Необходимость утверждения теоремы 1 непосредственно следует из этого факта.
Достаточность. Пусть выполняется неравенство (3). Не ограничивая общности
N
будем считать, что с],1 ^ ]2 ^ ... ^ dN. Положим ] = ^ ]г. Таким образом, условие (3)
г=2
означает ] ^ ]1.
Каждому набору стратегий х2,..., ХN игроков 2,...^ сопоставим ]-мерный вектор у,
у = (Х21, ..., Х2d2 ,Х31, ..., Хзdз , ..., ХN1, . .., ХNdN ).
Тогда каждому игроку г = 2,...^ соответствует набор номеров 1п^г): Ind(2) =
О^.. ]2},
г_ 1 г
Ind(г) = {1 + ^ ]к,.. .,^]и }, г = 3,...^,
к=2 к=2
а любой стратегии хг игрока г, г = 2,...^, - набор {у3, 3 € Ind(г)}.
Положим р(з), 1 ^ з ^ ]1, равным остатку от деления (] — 3 + 1) на ]1, если он больше нуля, и равным ]1 в противном случае.
Определим конечную бескоалиционную игру N лиц Г(х*) размера ml х m2 х ...хmN со следующими функциями выигрыша в форме (2):
dl
Н1(х) = ^2(Ур(з] — ур(з)) • Х13
3=1
и для игроков i = 2,...,N
где
Hi(x) = yj • aj (x*, x),
jelnd(i)
I (x*id_j+i - xid-j+i), если j > d - di, aj (x , x) = < J
{ (yj+di - yj+d1 ), если j < d - d1.
Нетрудно проверить, что при всех i = 1,...,N имеет место равенство
max Hi(x* ||xi) = 0 = Hi(x*),
т. е. x* - ситуация равновесия игры T(x*).
Покажем, что эта ситуация равновесия единственна. Пусть х = (xi,..., xn) - другая ситуация равновесия игры r(x*). Предположим, что xi = xi.
Случай 1. Для некоторого з0, 1 ^ 30 ^ ]1, справедливо Х1зо > х13о. Положим 31 = ] — зо + 1. Тогда ] — ]1 < 31 ^ ]. Для некоторого г1, 2 ^ г1 ^ N, имеем 31 € Ind(гl).
Рассмотрим функцию выигрыша игрока г1 при фиксированных стратегиях хг других игроков:
Так как 31 > ] — ]1, коэффициент 3 (х*, х) при уз1, который равен
а31 (х , х) = Х1d_j1 +1 — x1d_jl + 1 = Х130 — Х13о ,
отрицателен. Отсюда по свойству 1) получаем Уз1 = 0.
Если 31 > ]1, то положим 32 = 31 — ]1. Для некоторого г2, 2 ^ г2 ^ N, имеем 32 € Ind(г2). Далее рассмотрим Нг2 (х||хг1). Так как 32 ^ ] — ]1, при уз2 коэффициент
ввиду того, что все стратегии, входящие в х*, вполне смешанны. Снова по свойству 1) имеем Уз2 = 0.
Если 32 > ії, то продолжим этот процесс дальше, положив 33 = 32 — ії. Через конечное число шагов мы придем к Узп =0, зп ^ ії. Легко видеть, что в соответствии с определением р(з)
т. е. ур3о) °.
Рассмотрим теперь функцию выигрыша игрока 1 при фиксированных стратегиях ххг других игроков:
то, как и прежде, находим Х13о = 0, что противоречит предположению случая Х13о > Х13о > 0.
Осталось рассмотреть дополнительный случай 2: для всех 3, 1 ^ 3 ^ ]1 = ml — 1, выполняются неравенства Х3 ^ Ху и, следовательно, Х1Ш1 > х1Ш1. Так как
х* - вполне смешанная ситуация, имеем х|Ш1 > 0. Таким образом, Х1Ш1 > 0. Принимая во внимание свойство 2), получаем, что при всех 3 = 1,..., ]1 коэффициенты при Х13 в функции выигрыша игрока 1 Н1(х||х1) должны быть не больше нуля. Следовательно, при всех 3, 1 ^ 3 ^ ]1, справедливы неравенства ур(3) — ур(3) ^ 0, т. е.
уз — у* ^ 0 при всех 1 ^ 3 ^ ]1 .
Далее, поскольку х1 = х|, существует такой номер 30, 1 ^ 30 ^ ]1, что Х1 < х|. Аналогично случаю 1, полагая 31 = ] — 30 + 1, установим, что коэффициент при уз1
Зєіпа(іі)
где
если з > і — ії, если з ^ і — ії.
( + — N — + — + + ^ г\
х ,х) = уз 2— У32+йі = Узі — у Зі = —уЗі < 0,
ії > 3п = 31 — (п — 1)ії = (і — зо + 1) — (п — 1)ії = р(зо),
<іі
3=1
Так как коэффициент при ж1зо равен
ур(3) — УР(3) = —УР(3) < 0,
в функции выигрыша Нг1 (х||хг1) игрока г1, г1 : 31 € Ind(г1), равный (х|3-о — х1зо),
положителен. Отсюда по свойству 2) имеем Хг1 Шг1 = 0.А так как х*1 ш > 0, то нетрудно проверить, что для некоторого 31, 31 € Ind(гl) имеет место неравенство уз^ > у* .
Если 31 ^ ]1, то получаем противоречие с тем фактом, что уз ^ у*з для всех 3 — 1,..., ]1. Если 31 > ]1, то, положив 32 = 31 — ]1, снова имеем, что Хг2Шг = 0, где г2 определяется условием 32 € Ind(г2). Следовательно, существует такой номер
32 € что у з32 > у*з'2.
Заметим, что, так как ]1 ^ ]2 ^ ... ^ , имеет место неравенство г2 < г1 и, таким
образом, 32 < 31. Если 32 > ]1, то положим 33 = 32 — ]1 и так далее. Для некоторого конечного п мы получим 3'п ^ ]1, у 3^ > у*, , что противоречит полученному выше неравенству у 3 ^ у* при всех 1 ^ 3 ^ ]1.
Разбор случаев 1 и 2 показал, что х* = х*. В частности, это означает, что стратегия х* игрока 1, входящая в ситуацию равновесия х, вполне смешанна. Следовательно, по свойству 3) находим, что для всех 3 = 1,..., ]1 выполняются равенства у3 — у* =0.
Если ] = ]1 (размерность симплекса смешанных стратегий игрока 1 равна сумме размерностей симплексов смешанных стратегий остальных игроков), то это уже означает совпадение ситуаций равновесия хх и х .
Пусть ] > ]1. Так как ]2 ^ ]1, заведомо имеем 323 = х23- при всех 1 ^ 3 ^ ]2,
т. е. стратегии х2 и х2 игрока 2 совпадают и, следовательно, стратегия х2 игрока 2 вполне смешанна. Снова по свойству 3) получаем у3-+^ — у*+^1 = 0 для всех 3, 1 ^ 3 ^ тт(]2, ] — ]1). Если ] — ]1 ^ ]2, то это означает у 3 = у* для всех 3 = 1,...,], т. е. совпадение ситуаций равновесия х и х*. Если же ] — ]1 > ]2, то, так как ]з ^ ]2, заведомо имеем 333 = х33- при всех 1 ^ 3 ^ ]з, т. е. совпадение стратегий хз и х3 игрока 3. Аналогично получим х4 = х4,..., ХN = xN. Таким образом, ситуация равновесия хх совпадает с ситуацией равновесия х . Теорема 1 доказана.
4. Биматричные игры с заданными единственными ситуациями равновесия. Ниже будут рассмотрены биматричные игры размера ml х m2 (число игроков N = 2). Матрицы выигрышей игроков будем обозначать А = [а^-], г = 1,..., ml, 3 = 1,..., m2 для игрока 1 и соответственно В = [63 ] для игрока 2.
Отбросим используемое в п. 3 для произвольного числа игроков ограничение вполне смешанности заданной ситуации
х* = (х* , х2), х* = (х*1,...,хШг), г = 1, 2,
и получим необходимое и достаточное условие существования биматричной игры размера ml х m2 с единственной ситуацией равновесия по Нэшу х *.
Обозначим через к(х\) (соответственно к(х|)) количество положительных компонент вектора х! (х2), а через 8ирр(х!) (соответственно 8ирр(х|)) - множество индексов, соответствующих этим компонентам.
Теорема 2. Для того чтобы существовала m1 х m2-биматричная игра с заданной единственной ситуацией равновесия х * = (х£, х|), необходимо и достаточно выполнение равенства к(х* 1) = к(х*2).
Доказательство. Из результатов Гейла и Шермана [2] следует, что если равны мощности к(х * 1) и к(х * 2) спектров стратегий х * 1 и х * 2, то существует матричная игра (А = —В) с единственной ситуацией равновесия х* = (х* 1, х *2). Это обеспечивает достаточность условия теоремы.
Необходимость. Пусть к1 = к(х* 1) > к2 = к(х*2). Не ограничивая общности, можно считать, что в векторах х 1 и х 2 отличны от нуля первые к1 и соответственно к2 координат, т. е. Эирр(х* 1) = {1,...,^} и 8ирр(х*2) = {1,...,к2}.
Пусть Г - биматричная игра с ситуацией равновесия х * = (х * 1, х*2), Покажем, что х не единственная ситуация равновесия этой игры.
Рассмотрим две системы:
^2 Х1г (Ьг3 — Ъц)=0 для 3 = 2,...,к2,
г=1
Ш1
I] Х1г(Ъг3 — Ъг 1) < 0 для 3 = к2 + 1,...^2,
,г=1
(4)
Х23 (аг3 а13) 0 для 3 ^
3=1
т2
^2 Х23(аг3 — а 13) < 0 для 3 = к1 + 1, ..., ml,
(5)
3=1
где аг3 и Ъг3 - элементы матриц А и В, задающих игру Г.
Из того, что х * = (х * 1, х * 2) - ситуация равновесия игры Г, следует, что х* 1 - решение системы (4), а х*2 - решение системы (5). Обозначим через к'2 — 1 число равенств, которое получается при подстановке х* 1 в систему (4), а через к* — 1 число равенств, которое получается при подстановке х *2 в систему (5). Будем считать, что это первые к2 — 1 и соответственно к* — 1 равенств. Очевидно, к1 ^ к* ^ ml и к2 ^ к'2 ^ m2.
Если стратегия х* игрока 1 со спектром, содержащемся в множестве {1,...,к'*}, является решением системы (4), то ситуация (х*, х*2) - ситуация равновесия игры Г. Аналогично, если стратегия х2 игрока 2 х2 такая, что 8ирр(х2) С {1,..., к2} является решением системы (5), то ситуация (х* *, х2) - также ситуация равновесия игры Г. Поэтому достаточно рассмотреть случай, когда х* - единственное решение системы (4), такое что 8ирр(х1) С {1,..., к*}, и х2 - единственное решение системы (5), такое что Эирр(х2) С {1,...,к2}.
Покажем, что в этом случае к'2 > к2. Отметим, что если предполагать стратегию х * 2 игрока 2 вполне смешанной, т. е. к2 = m2, то это завершило бы доказательство теоремы 2.
Предположим обратное: к'2 = к2. Тогда справедливо к'2 < к*. Рассмотрим новую систему
I] хц (Ъг3 — Ъц)=0 для 3 = 2,...,к2,
г=1
к1
I] Х1г(Ъг3 — Ъг1) < 0 для 3 = к2 + 1,..
г=1
к1
Е Х1г = 1,
(6)
которая получается из системы (4), если в ней положить хц = 0 для г > к* и добавить
к1
уравнение Е х1г = 1.
г=1
Система (6) состоит из к2 уравнений и m2 — к2 неравенств относительно к* неизвестных. Очевидно, (х*1 ,... ,х*к ) - ее решение. Поскольку к* > к2, существуют решения к* уравнений, отличные от решения (х**,. ..,х*к1) и сколь угодно близкие к нему. Так как подстановка (х**,... ,х*к ) в неравенства из (6) дает строгие неравенства, можно предположить, что существует решение системы (6)
(х11 ,...,Х1к1) = (хц ,...,Х1к1 ),
где х*г > 0, г = 1,..., к*. Таким образом, ml-мерная смешанная стратегия х* =
Ш1
(Хц,..., Х*к1, 0,..., 0), ^2 хц = 1 игрока 1, отличная от стратегии х1, является реше-
г=1
нием системы (4). Поскольку Бирр(х*) С {1,..., к*} и к* ^ к*, получаем
8ирр(х*) С {1,...,к[}.
Это противоречит единственности решения с таким свойством у системы (4).
Итак, к2 > к2 и, следовательно, m2 > к2. Рассмотрим игру Гр - сужение игры Г
на множество ситуаций Х\ х Х2, где Х2 = Х2 П {^^=1 х2j ^ (1 — ^)}, Р = 2, 3,, Хр - замкнуто, выпукло и не пусто ^2 > к2). Тогда при любом р игра Гр имеет ситуацию равновесия (хр, хр).
Для продолжения доказательства теоремы 2 понадобятся два утверждения, описывающих свойства игры Гр. Первое утверждение мы приводим без доказательства, ввиду его простоты.
Лемма 1. Если для некоторого х2 € Хр, такого, что Х21 > 0, и некоторого х 1 € X 1 выполняется
Я2(хь х2) = тах Щ^х*, х2),
Х2ЁХР
где Н2(х*, х2) = х*Вх2, то
Ш1
^2хц(Ъг3 — Ъц) = 0, если 323 > 0, 3 < к2,
г=1
Ш1
^^Х1г(Ъг3 — Ъг*) < 0, если 3 > к2.
г=1
Лемма 2. Если для некоторого х2 € Х^
Н2(х * 1, х2) = тах Н2(х * *, х2),
Х2ЁХР
то 8ирр(х2) С{1,... ,к2}, здесь х** и к2 те же, что в доказательстве теоремы 2.
Доказательство. Предположим, что существует номер 3о > к'2 такой, что Х23о > 0. Рассмотрим х2, где Х23- = Х23-, если 3 = к'2 и 3 = 30; Х23о = 0, Х2к2 =
Х2к2 + Х23о .
Поскольку по определению к'2 при 3 > к'2
Ш1 Ш1
^ ^ Х1г (Ъгк2 Ъг3 ) ^ ^ Х1г (Ъг1 ^13 ) > 0,
г=1 г=1
имеем
Ш1
Н2(х* 1, х2) — Н2 (х * 1, х2) = Х23о ^ Х*ц (Ъгк22 — Ъг3о ) > 0,
г=1
что противоречит условию леммы 2.
Продолжим доказательство теоремы 2. Предположим, что (х 1, х 2) - единственная ситуация равновесия игры Г. Возьмем произвольную сходящуюся подпоследовательность последовательности (хр, хр) ситуаций равновесия игр Гр. Эта подпоследовательность, которую по-прежнему будем обозначать (хр, хр), при р ^ ж сходится к (х 1, х 2) - единственной ситуации равновесия игры Г.
Поскольку при p, стремящемся к бесконечности, x2 ^ x * 2, при достаточно больших p Supp(xp) D Supp(x*2). Отсюда, используя лемму 1, получаем, что xp является решением системы (4). Далее, так как xp ^ x * 1, при достаточно больших p имеем Supp(xp) D Supp(x* 1). Следовательно, xp - решение системы (5).
Покажем, что из последовательности {p} можно извлечь такую подпоследовательность, которую снова обозначим через {p}, что Supp(xp) с{1,..., к'^}.
Пусть это невозможно. Тогда для любого достаточно большого p можно найти такое i(p), к[ < i(p) ^ mi, что xii(p) > 0. Не ограничивая общности, можно считать, что lim i(p) = io > к'1. p——
Так как dpi > 0 и X.i(p) > 0, имеем
m2
^ ^ x2 j (ai(p)j — a1j ) 0.
j = 1
Переходя к пределу при p ^ж, получаем
m2
^ у x2j (aioj a1j ) 0, i0 > к1,
j = 1
что противоречит определению к1.
Итак, Supp(xp) с {1,..., к[}, xp G Xi и xf - решение системы (4). Следовательно, xp = x*i. Отсюда по лемме 2 Supp(x2) с {1,...,к2}. А поскольку xp G X\ с X2 и является решением системы (5), получаем xpp = x*2, что противоречит тому, что x *2 не принадлежит множеству Xp. Таким образом, предположение о единственности ситуации равновесия в игре Г неверно. Теорема 2 доказана.
Литература
1. Millham C. Constructing bimatrix games with special properties // Nav. Res. Log. Quart. 1973. Vol. 19, N 4. P. 709-714.
2. Гейл Д., Шерман С. Решения конечных игр двух лиц // Матричные игры / под ред. Н. Н. Воробьева. М.: Физматгиз, 1961. С. 45-61.
3. Kreps V. Bimatrix games with unique equilibrium points // Intern. Journ. of Game Theory. 1974. Vol. 3, N 2. P. 115-118.
4. Kreps V. Finite N -person non-cooperative games with unique equilibrium points // Intern. Journ. of Game Theory. 1981. Vol. 10, N 3/4. P. 125-129.
5. Воробьев Н. Н. Основы теории игр. Бескоалиционные игры. М.: Наука, 1984. 496 с.
6. Печерский С. Л., Беляева А. А. Теория игр для экономистов: вводный курс. СПб.: Изд-во Европ. ун-та. 2001. 342 с.
7. Нэш Дж. Бескоалиционные игры // Матричные игры / под ред. Н. Н. Воробьева. М.: Физматгиз, 1961. C. 205-221.
8. Chin H., Parthasarathy T., Raghavan T. Structure of equilibria in N-person non-cooperative games // Intern. Journ. of Game Theory. 1974. Vol. 3, N 1. P. 1-19.
Статья рекомендована к печати проф. Л. А. Петросяном.
Статья принята к печати 5 марта 2009 г.