УДК 519.883
DOI: 10.14529/mmph150403
КОЭФФИЦИЕНТНЫЕ КРИТЕРИИ ПРИ ВЫБОРЕ КОНЦЕПЦИЙ РАВНОВЕСИЯ (НА ПРИМЕРЕ ЛИНЕЙНО-КВАДРАТИЧНОЙ ИГРЫ ДВУХ ЛИЦ)1
В.И. Жуковский1, Ю.А. БельскиХ3, С.П. Самсонов4
Найдены коэффициентные критерии и явный вид равновесных по Бержу и по Нэшу ситуаций в бескоалиционной игре двух лиц, а также коэффициентные условия отсутствия этих равновесий.
Ключевые слова: бескоалиционная игра двух лиц; матрицы; вектора; равновесие по Нэшу; равновесие по Бержу.
Введение
Те, кто занимался теорией устойчивости по Ляпунову, помнят коэффициентные условия устойчивости. Суть в том, что по знакам коэффициентов дифференциального уравнения, соотношениям между ними иногда можно судить об устойчивости невозмущенного движения. В предлагаемой читателю статье такая же идея осуществлена для линейно-квадратичной бескоалиционной игры двух лиц. Именно по свойствам коэффициентов функций выигрыша решаются два вопроса: а) существует или отсутствует равновесие по Бержу или по Нэшу; б) если существует, то каков его явный вид.
Постановка задачи и вспомогательные сведения
Рассматриваем бескоалиционную линейно-квадратичную игру
Г2 =({1,2},{ X = R"' Ц,{ f (х2)}г=1^
Особенность Г2 в том, что отсутствуют ограничения на множества стратегий X7 , именно стратегиями 7-го игрока могут быть любые "7 -векторы-столбцы х7 (из " -мерного евклидова пространства Я" с обычной евклидовой нормой ||-|| и скалярным произведением); функция выигрыша игрока 7 пусть имеет вид
/7 (х1, х2) = х1 А7х1 + 2 х1 В7х2 + х2 С7х2 + 2а7 х1 + 2с7 х2, (7 = 1,2), (1)
где постоянные симметричные матрицы А7 , С7 , прямоугольная В7 и постоянные вектора а7 , с7 соответствующих размерностей; штрих сверху означает операцию транспонирования; det А означает определитель матрицы А; далее А<0 (>,<) означает, что квадратичная форма г1 Az определенно отрицательна (соответственно положительна, неположительна); будем использовать следующие операции дифференцирования билинейных форм по векторному аргументу [1, с. 13—16]:
(
д
дх1
X1BiX2
= Bix2
> ( д
/
V
дх
X1BiX2
2
= B' х1 А --
_Э дх1
X1 A^i X1
= 2 Ai X1 А -—
_э
dX1
2a1 X1
Л
= 2a,
(2)
dX
2 XiAiXi = 2Ai;
для скалярной функции ¥(х) и векторного к-мерного аргумента х достаточными условиями реализации тах ¥(х) = ¥(х*) будут
хеЯк
2
д
1 Работа выполнена при финансовой поддержке РФФИ (грант № 14-01-90408 Укр_а) и НАН Украины (грант № 03-01-14).
2 Жуковский Владислав Иосифович - доктор физико-математических наук, профессор, кафедра оптимального управления, Московский государственный университет им. М.В. Ломоносова.
E-mail: zhkvlad@yandex.ru
3 Бельских Юлия Анатольевна - кандидат физико-математических наук, доцент, Московский государственный университет технологий и управления.
E-mail: fozbelskih@rambler.ru
4 Самсонов Сергей Петрович - кандидат физико-математических наук, доцент, кафедра оптимального управления, Московский государственный университет им. М.В. Ломоносова.
E-mail: samsonov@cs.msu.ru
Жуковский В.И., Бельских Ю.А., Самсонов С.П.
Коэффициентные критерии при выборе концепций равновесия (на примере линейно-квадратичной игры двух лиц)
1)
2)
dY (х)
Эх Э 2Y( х)
Эх2
= grad Y( х)| х_ х* = О*
< 0,
(3)
здесь 0k - нулевой k-вектор.
Для бескоалиционных игр вида Г2 в последние годы получили распространение два вида равновесий по Нэшу и по Бержу.
Игра Г2 происходит следующим образом: каждый i-ый игрок, не объединяясь с другим в коалицию, выбирает свою стратегию xt е R" (i _ 1,2), в результате образуется ситуация
х _ (х1, х2) е R" (" _ "1 + "2). На множестве таких ситуаций определены функции выигрыша / (х) для i-го игрока, значение которой определяет выигрыш i-го игрока.
Определение. Ситуация х _ (х0, х0) называется равновесной по Бержу в игре Г2, если
max / (х || хгв) _ / (хВ )(i _ 1,2),
(х\\хВ )eR""i
а ситуация х _ (хе, хе2) - равновесна по Нэшу, если
max / (хе х,) _ / (хе) (i _ 1,2);
xieR"i
здесь f1(х || Zj) _ /1(Zj, х2), /2(х ||z2) _ /2(х1, z2). Каждое из двух равновесий имеет свои позитивные и негативные свойства [2-4]. Зная коэффициенты в функциях выигрыша (1), выясним какое из равновесий существует, а какое отсутствует, и, если существует, найдем его явный вид.
Равновесная по Бержу ситуация
С учетом (1) и с помощью (3) приходим к следующему достаточному условию существованию равновесной по Бержу ситуации в игре Г2. Утверждение 1. Пусть в игре Г2
А2 < 0, С1 < 0 (4)
det
c1 - b1a2102
Ф 0.
Тогда равновесная по Бержу ситуация х _ (х0, х0) примет вид
х1В _ -A-102 [Q -B1 a^b2 j (B^A^a2 -C1) - A"^, х20 _ [Q -BA-1B2]-1 (B^A^a2 - C1).
(5)
(6)
Доказательство. Согласно определению, ситуация х _ (х0, х0) равновесия по Бержу игры
Г2, формализуется двумя равенствами
В силу (3) и (1) достаточные условия
х2
max /Дх1 , х2) _ fi(х ),
X2еR 2
max /2(х1,х0) _/ДхВ).
х-YeR"1
реализации первого равенства из (7) сводятся к
(7)
Э/1( х0, х2)
Эх
2
_ 2В1 х0 + 2С1х0 + 2с1 _ 0 ,
х2 _ х2
д 2М х1в, х2)
Эх9
_ 2C1.
х2 _х2
Аналогично для второго равенства из (7)
*
—
х_ х
и
2
Э/2( x2 )
Эхх
Э2 / ( X2 )
= 2 A2 xBB + 2B2 x2B + 2a2 = 0K
Эх12
= 2 Л.
Так как согласно (4), матрицы С1 < 0 и А2 < 0 , то ситуация равновесия по Бержу (х1В, хВ) игры Г2 найдется из матричной системы неоднородных линейных уравнений
i а2 х1 + b2 х2 = a2,
b xb + c1x2 = c1.
(8)
Согласно импликации [А2 < 0] ^ [det А2 Ф 0]
ЗА.
-1
. Умножим первое из (8) слева на А2 1, от-
куда сразу получим
х1 =— а2 в2 х2 — А2 а2. Подставляя его во второе уравнение из (8), приходим к
С1 - В1А-1В2 ] хВ =-с1 + в1А2-1а:
или
C1 - b1a2 B2
(B[A-la2 -C1).
Здесь учтено, что, согласно (5), будет (det C1 - B|A21B2 Ф о) ^ ($(C1 -B1A21B2) 1)
(9) (10)
(11)
и поэтому,
умножая обе части (10) слева на
C1 - B1A21B2
-1
приходим к справедливости (11). Подставляя
найденные х2 в (9), получим первые равенства из (6). ■
Аналогично, решая систему (8) умножением второго уравнения слева на С1-1, получаем Утверждение 2. Пусть в игре Г2 выполнены требования (4) и
det
а2 - b2c1 b
Ф 0.
(12)
Тогда равновесная по Бержу ситуация xB = (xj0, xB) имеет вид
-1-1
_А2 - B2C1-1B1J (B2C1-1C1 - a2),
xB = -C1-1b1 ГA2 - B2C1-1B11-1 (B2C1-1c1 - a2) - C1-1c1.
Замечание 1. Система (8) имеет единственное решение при А2 < 0 и C1 < 0. Авторам удалось привести вид одного из них к другому.
Равновесная по Нэшу ситуация
Приведем аналогичные результаты для равновесия по Нэшу. Здесь уже для игры Г2 вместо
(7) следует использовать равновесную по Нэшу ситуацию xe = (xf, xe2), которая определяется двумя условиями
max /Дx1,x2) = xe), max /»(xf,x2) = /2(xe). (13)
x^eR 1 x2eR
Достаточными условиями реализации (13) будут
§rad xj f1( x1, x2)
gradx2 /2 (x1, x2)
.Э/К x1, x2)
x1 = x1
x2 = x2
Эx1 Э/2(x1, x2)
= 2 A1 xf + 2 B1xf + 2a1 = 0„
Эx^
= 2B2 x1 + 2C2 x2 + 2C2 = °„2 ,
2
Жуковский В.И., Бельских Ю.А., Коэффициентные критерии при выборе концепций равновесия Самсонов С.П. (на примере линейно-квадратичной игры двух лиц)
¿Щ^! = 2 а1 < 0,
Эх^
= 2С2 < 0.
Эх2
Из первых двух условий получаем матричную систему линейных алгебраических неоднородных уравнений с постоянными коэффициентами
I А1х<2 + В1х21 = —а1, [ в2 х1 + с2 Х2 = —с2.
С учетом А1 < 0 и С2 < 0, как и в случае утверждений 1 и 2, приходим к справедливости следующих двух утверждений.
Утверждение 3. Пусть в игре Г2
А1 < 0, С2 < 0 (14)
С2 — в2 а1 1в1
Ф 0. (15)
Тогда ситуация равновесия по Нэшу х2 = (х2, х2) имеет вид
х2 = — А—1В1 [с2 — в2 А—1В1 ]—1 (в2 А—1а — с2) — А-'-Ч, х2 = [С2 — В2 А—1В1 ] —1( В2 А—Ч — С2).
Утверждение 4. Пусть в игре Г2 выполняются ограничения (14) и
А1 — В1 С—1В2 ф 0. (16)
Тогда равновесная по Нэшу ситуация х2 = (х2, х2) имеет вид
х2 = [а—вхс—В ]—1 (вс—с — Ч1),
х2 = —С2—1В2 [ А1 — ВХС—В2 ]—1 (ВС—С — Ч1) — С2—1С2.
Критерии отсутствия равновесия
Приведем довольно любопытное утверждение, которое позволяет отсекать игры, в которых не существует равновесия по Бержу или (и) по Нэшу.
Лемма 1. Если в игре Г2 матрица А1 > 0, то не существует х, такого, что при каждом фиксированном х2 имело место бы равенство
тах /1(х1
, х2) = Л(х1, х2), (17)
х1еЯ 1
т.е. в этом случае максимума по х1 е Я"1 функции /1(х1, х2) не существует.
Доказательство. «Заморозим» какую-либо стратегию х2 е Я"2 второго игрока. Тогда функцию выигрыша первого игрока можно представить в виде
Л (х1, х2) = х1 А1х1 + 2 х(( х2) + у( х2), где "1-вектор-столбец ((х2) и скалярная величина у(х2) зависят только от «замороженного» х2 .
По условию леммы матрица А1 > 0 (определенно положительна). Тогда характеристическое уравнение ае [А1 — ЕщЛj = 0 (Ещ - единичная "1х"1-матрица) имеет щ вещественных положительных корней (А1 симметрична) и, кроме того,
х1А1х1 >Л*\|х1 II2 "х1 е Я"1, (18)
и
где Л* > 0 наименьший из указанных корней. Максимума в (17) не существует, если, каким бы большим ни было число т > 0, существует стратегия х1(т, х2) е Я"1, такая, что /1 (х1 (т, х2), х2) > т . В силу (18) последнее неравенство имеет место, если
* и ц2 '
Л || х1(т, х2) + 2хДт, х2)^(х2) + у(х2) > т. (19)
Будем искать решение х1(т, х2) неравенства (19) в виде
^(т, х2) = /еПу, (20)
где число /> 0 построим ниже, а е^ - вектор размерности "¡, все компоненты которого равны единице.
Подставляя (20) в (19), получаем для нахождения /3 неравенство
Л/2" + 2р(е' ф(х2)) + у(х2) - т > 0. Поэтому при любых постоянных
„ „ Кр(х2^ + >/ (е'"1^(х2))2 + ЛЧ У(х2) -
Л "
и стратегиях первого игрока х1(т,х2) =/е^ выполнено /1(х1(т,х2),х2) > т и поэтому максимума в (17) не существует.
Замечание 2. Тогда, с учетом (17) в игре Г2 при А1 > 0 не существует равновесной по Нэшу ситуации. Отсюда и из утверждения 1 получаем
1. Если в игре Г2 матрицы А1 > 0 или (и) С2 > 0, а также А2 < 0 , С1 < 0 и выполнено (5), то в игре Г2 не существует равновесие по Нэшу, но существует равновесие по Бержу, причем ситуация равновесия по Бержу имеет вид (6).
Аналогично,
2. Если А2 < 0 , С1 < 0, имеет место требование (5) или (12) и А1 > 0 или (и) С2 > 0, то существует равновесие по Бержу, но отсутствует равновесие по Нэшу.
3. Если А1 < 0, С2 < 0, имеет место требование (15) или (16) и А2 > 0 или (и) С1 > 0 , то существует равновесие по Нэшу, но отсутствует равновесие по Бержу.
4. Если А1 > 0 или (и) С2 > 0 и А2 > 0 или (и) С1 > 0 , то в Г2 не существует как равновесия по Нэшу, так и по Бержу.
5. Если А2 < 0 , С1 < 0, А1 < 0, С2 < 0 и требования (5) или (12), а также (15) или (16), то в Г2 существует как равновесие по Нэшу, так и по Бержу.
Заключение
Итак, рассмотрели линейно-квадратичную бескоалиционную игру двух лиц без ограничений (Х7 е Я" (/ = 1,2)) и функциями выигрыша
(х1, х2 ) — х^ А^1 + 2 х!В^2 + х2 С^2 + 2а^ х1 + 2Сц х2,
Л( х1, х2) = х1 а2 х1 + 2 х1 в2 х2 + х2 с2 х2 + 2а2 х1 + 2с2 х2;
штрих сверху означает операцию транспонирования, А7 - симметричная постоянная порядка "1 X "1 матрица, С7 - симметричная постоянная порядка "2 X "2 -матрица, В7 - постоянная прямоугольная "1X "2 матрица, а7 (с7) - постоянные "1 (соответственно, "2)-вектора (/ = 1,2);
А > 0 (<) означает, что квадратичная форма х1' А х определенно положительна (соответственно, отрицательна); кванторы: $ - существование, V - общности, 0 - отрицание.
С помощью утверждений 1-4 можно также сформулировать коэффициентные условия существования равновесий в игре Г2 (см. таблицу). Как пользоваться таблицей?
Шаг 1. Прежде всего, проверить знакоопределенность матриц А1, А2, С1 и С2; пусть, например, матрицы А1 < 0, С2 < 0 (определенно отрицательны), а А2 > 0 (определенно положительна).
Жуковский В.И., Бельских Ю.А., Самсонов С.П.
Коэффициентные критерии при выборе концепций равновесия (на примере линейно-квадратичной игры двух лиц)
Шаг 2. Найти соответствующую строку в таблице (условия А1 < 0, С2 < 0 и А2 > 0 занимают третью строку) и проверить невырожденность соответствующей в 5-ом столбце матрицы (15), т.е.
det
C2 - b2a1 lßi
Ф 0.
Шаг 3. Сразу из столбцов 6 и 7 таблицы следует, что в такой игре Г2 не существует равновесия по Бержу, но имеется равновесие по Нэшу при любых матрицах С1, В 1 соответствующих размерностей и векторах а1, с 1.
Явный вид такого равновесия по Нэшу приведен в утверждении 3 (см. дополнительный столбец впереди таблицы).
Коэффициентные условия существования равновесий
Утверждение Существует одно из равновесий РБ РН
1 A1 > 0 A2 < 0 C1 < 0 (5) 3 0$ VC2, в, a, c i
2 A2 < 0 C1 < 0 C2 > 0 (12) $ 0$ VA1, Bi, at, c
3 A1 < 0 A2 > 0 C2 < 0 (15) 0$ $ VC^ B,, a, ct
4 A < 0 C1 > 0 C2 < 0 (16) 0$ $ VAl, Bt, at, c ,
Не существуют равновесия
A > 0 A2 > 0 0$ 0$ VC^ Bt, a t, c ,
A > 0 C1 > 0 0$ 0$ VA2, C2, Bt, at, ct
A2 > 0 C2 > 0 0$ 0$ VA1, C1, Bt-, at, c t
C1 > 0 C2 > 0 0$ 0$ VA1, A2, Bf, at, c t
Существуют оба равновесия
A < 0 A2 < 0 C1 < 0 C2 < 0 (5) и (15) $ $ VBt, c t
A < 0 A2 < 0 C1 < 0 C2 < 0 (12) и (16) $ $ VB^ ai,c t
Литература
1. Жуковский, В.И. Линейно-квадратичные дифференциальные игры / В.И. Жуковский, А.А. Чикрий. - Киев: Наукова Думка, 1994. - 320 с.
2. Жуковский, В.И. Введение в дифференциальные игры при неопределенности. Равновесие по Нэшу / В.И. Жуковский. - М.: URSS, 2010. - 168 с.
3. Жуковский, В.И. Введение в дифференциальные игры при неопределенности. Равновесие Бержа-Вайсмана / В.И. Жуковский. - М.: URSS, 2010. - 174 с.
4. Zhukovskiy, V.I. Lyapunov Functions in Differential Games / V.I. Zhukovskiy. - London: Taylor and Francis, 2003. - 281 p.
Поступила в редакцию 28 сентября 2015 г.
Bulletin of the South Ural State University Series "Mathematics. Mechanics. Physics" _2015, vol. 7, no. 4, pp. 20-26
DOI: 10.14529/mmph150403
COEFFICIENT CRITERIA IN CHOOSING EQUILIBRIUM CONCEPTIONS (ON THE EXAMPLE OF LINEAR-QUADRATIC GAME OF TWO PERSONS)
V.I. Zhukovskiy^, Y.A. Bel'skikh2, S.P. Samsonov3
Coefficient criteria and an explicit form of Berge and Nash equilibrium situations in a non-cooperative game of two persons as well as coefficient conditions of the equilibrium absence have been found.
Keywords: non-cooperative game of two persons; matrixes; vectors; Nash equilibrium; Berge equilibrium.
References
1. Zhukovskiy V.I., Chikriy A.A. Lineyno-kvadratichnye differentsial'nye igry [Linear Quadratic Differential Games]. Kiev, Naukova Dumka Publ., 1994. 320 p. (in Russ.).
2. Zhukovskiy V.I. Vvedenie v differentsial'nye igry pri neopredelennosti. Ravnovesie po Neshu [Introduction to differential games with uncertainty. Nash Equilibrium]. URSS Publ., 2010. 168 p. (in Russ).
3. Zhukovskiy V.I. Vvedenie v differentsial'nye igry pri neopredelennosti. Ravnovesie Berzha-Vaysmana [Introduction to differential games under uncertainty. Berge-Vaisman Equilibrium]. URSS Publ., 2010. 174 p. (in Russ.).
4. Zhukovskiy V.I. Lyapunov Functions in Differential Games. London: Taylor and Francis, 2003. 281 p.
Received September 28, 2015
1 Zhukovskiy Vladislav Iosifovich is Dr. Sc. (Physics and Mathematics), Professor, Optimal Control Department, Lomonosov Moscow State University, Moscow, Russia.
E-mail: zhkvlad@yandex.ru
2 Bel'skikh Julia Anatolievna is Cand. Sc. (Physics and Mathematics), Associate Professor, Moscow State University of Technologies and Management, Moscow, Russia.
E-mail: fozbelskih@rambler.ru
3 Samsonov Sergey Petrovich is Cand. Sc. (Physics and Mathematics), Associate Professor, Optimal Control Department, Lomonosov Moscow State University, Moscow, Russia.
E-mail: samsonov@cs.msu.ru