Коэффициентные критерии при выборе концепций равновесия (на примере линейно-квадратичной игры двух лиц)

Жуковский Владислав Иосифович; Бельских Юлия Анатольевна; Самсонов Сергей Петрович

УДК 519.883

DOI: 10.14529/mmph150403

КОЭФФИЦИЕНТНЫЕ КРИТЕРИИ ПРИ ВЫБОРЕ КОНЦЕПЦИЙ РАВНОВЕСИЯ (НА ПРИМЕРЕ ЛИНЕЙНО-КВАДРАТИЧНОЙ ИГРЫ ДВУХ ЛИЦ)1

В.И. Жуковский1, Ю.А. БельскиХ3, С.П. Самсонов4

Найдены коэффициентные критерии и явный вид равновесных по Бержу и по Нэшу ситуаций в бескоалиционной игре двух лиц, а также коэффициентные условия отсутствия этих равновесий.

Ключевые слова: бескоалиционная игра двух лиц; матрицы; вектора; равновесие по Нэшу; равновесие по Бержу.

Введение

Те, кто занимался теорией устойчивости по Ляпунову, помнят коэффициентные условия устойчивости. Суть в том, что по знакам коэффициентов дифференциального уравнения, соотношениям между ними иногда можно судить об устойчивости невозмущенного движения. В предлагаемой читателю статье такая же идея осуществлена для линейно-квадратичной бескоалиционной игры двух лиц. Именно по свойствам коэффициентов функций выигрыша решаются два вопроса: а) существует или отсутствует равновесие по Бержу или по Нэшу; б) если существует, то каков его явный вид.

Постановка задачи и вспомогательные сведения

Рассматриваем бескоалиционную линейно-квадратичную игру

Г2 =({1,2},{ X = R"' Ц,{ f (х2)}г=1^

Особенность Г2 в том, что отсутствуют ограничения на множества стратегий X7 , именно стратегиями 7-го игрока могут быть любые "7 -векторы-столбцы х7 (из " -мерного евклидова пространства Я" с обычной евклидовой нормой ||-|| и скалярным произведением); функция выигрыша игрока 7 пусть имеет вид

/7 (х1, х2) = х1 А7х1 + 2 х1 В7х2 + х2 С7х2 + 2а7 х1 + 2с7 х2, (7 = 1,2), (1)

где постоянные симметричные матрицы А7 , С7 , прямоугольная В7 и постоянные вектора а7 , с7 соответствующих размерностей; штрих сверху означает операцию транспонирования; det А означает определитель матрицы А; далее А<0 (>,<) означает, что квадратичная форма г1 Az определенно отрицательна (соответственно положительна, неположительна); будем использовать следующие операции дифференцирования билинейных форм по векторному аргументу [1, с. 13—16]:

(

д

дх1

X1BiX2

= Bix2

> ( д

/

V

дх

X1BiX2

2

= B' х1 А --

_Э дх1

X1 A^i X1

= 2 Ai X1 А -—

_э

dX1

2a1 X1

Л

= 2a,

(2)

dX

2 XiAiXi = 2Ai;

для скалярной функции ¥(х) и векторного к-мерного аргумента х достаточными условиями реализации тах ¥(х) = ¥(х*) будут

хеЯк

2

д

1 Работа выполнена при финансовой поддержке РФФИ (грант № 14-01-90408 Укр_а) и НАН Украины (грант № 03-01-14).

2 Жуковский Владислав Иосифович - доктор физико-математических наук, профессор, кафедра оптимального управления, Московский государственный университет им. М.В. Ломоносова.

E-mail: [email protected]

3 Бельских Юлия Анатольевна - кандидат физико-математических наук, доцент, Московский государственный университет технологий и управления.

E-mail: [email protected]

4 Самсонов Сергей Петрович - кандидат физико-математических наук, доцент, кафедра оптимального управления, Московский государственный университет им. М.В. Ломоносова.

E-mail: [email protected]

Жуковский В.И., Бельских Ю.А., Самсонов С.П.

Коэффициентные критерии при выборе концепций равновесия (на примере линейно-квадратичной игры двух лиц)

1)

2)

dY (х)

Эх Э 2Y( х)

Эх2

= grad Y( х)| х_ х* = О*

< 0,

(3)

здесь 0k - нулевой k-вектор.

Для бескоалиционных игр вида Г2 в последние годы получили распространение два вида равновесий по Нэшу и по Бержу.

Игра Г2 происходит следующим образом: каждый i-ый игрок, не объединяясь с другим в коалицию, выбирает свою стратегию xt е R" (i _ 1,2), в результате образуется ситуация

х _ (х1, х2) е R" (" _ "1 + "2). На множестве таких ситуаций определены функции выигрыша / (х) для i-го игрока, значение которой определяет выигрыш i-го игрока.

Определение. Ситуация х _ (х0, х0) называется равновесной по Бержу в игре Г2, если

max / (х || хгв) _ / (хВ )(i _ 1,2),

(х\\хВ )eR""i

а ситуация х _ (хе, хе2) - равновесна по Нэшу, если

max / (хе х,) _ / (хе) (i _ 1,2);

xieR"i

здесь f1(х || Zj) _ /1(Zj, х2), /2(х ||z2) _ /2(х1, z2). Каждое из двух равновесий имеет свои позитивные и негативные свойства [2-4]. Зная коэффициенты в функциях выигрыша (1), выясним какое из равновесий существует, а какое отсутствует, и, если существует, найдем его явный вид.

Равновесная по Бержу ситуация

С учетом (1) и с помощью (3) приходим к следующему достаточному условию существованию равновесной по Бержу ситуации в игре Г2. Утверждение 1. Пусть в игре Г2

А2 < 0, С1 < 0 (4)

det

c1 - b1a2102

Ф 0.

Тогда равновесная по Бержу ситуация х _ (х0, х0) примет вид

х1В _ -A-102 [Q -B1 a^b2 j (B^A^a2 -C1) - A"^, х20 _ [Q -BA-1B2]-1 (B^A^a2 - C1).

(5)

(6)

Доказательство. Согласно определению, ситуация х _ (х0, х0) равновесия по Бержу игры

Г2, формализуется двумя равенствами

В силу (3) и (1) достаточные условия

х2

max /Дх1 , х2) _ fi(х ),

X2еR 2

max /2(х1,х0) _/ДхВ).

х-YeR"1

реализации первого равенства из (7) сводятся к

(7)

Э/1( х0, х2)

Эх

2

_ 2В1 х0 + 2С1х0 + 2с1 _ 0 ,

х2 _ х2

д 2М х1в, х2)

Эх9

_ 2C1.

х2 _х2

Аналогично для второго равенства из (7)

*

—

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х_ х

и

2

Э/2( x2 )

Эхх

Э2 / ( X2 )

= 2 A2 xBB + 2B2 x2B + 2a2 = 0K

Эх12

= 2 Л.

Так как согласно (4), матрицы С1 < 0 и А2 < 0 , то ситуация равновесия по Бержу (х1В, хВ) игры Г2 найдется из матричной системы неоднородных линейных уравнений

i а2 х1 + b2 х2 = a2,

b xb + c1x2 = c1.

(8)

Согласно импликации [А2 < 0] ^ [det А2 Ф 0]

ЗА.

-1

. Умножим первое из (8) слева на А2 1, от-

куда сразу получим

х1 =— а2 в2 х2 — А2 а2. Подставляя его во второе уравнение из (8), приходим к

С1 - В1А-1В2 ] хВ =-с1 + в1А2-1а:

или

C1 - b1a2 B2

(B[A-la2 -C1).

Здесь учтено, что, согласно (5), будет (det C1 - B|A21B2 Ф о) ^ ($(C1 -B1A21B2) 1)

(9) (10)

(11)

и поэтому,

умножая обе части (10) слева на

C1 - B1A21B2

-1

приходим к справедливости (11). Подставляя

найденные х2 в (9), получим первые равенства из (6). ■

Аналогично, решая систему (8) умножением второго уравнения слева на С1-1, получаем Утверждение 2. Пусть в игре Г2 выполнены требования (4) и

det

а2 - b2c1 b

Ф 0.

(12)

Тогда равновесная по Бержу ситуация xB = (xj0, xB) имеет вид

-1-1

_А2 - B2C1-1B1J (B2C1-1C1 - a2),

xB = -C1-1b1 ГA2 - B2C1-1B11-1 (B2C1-1c1 - a2) - C1-1c1.

Замечание 1. Система (8) имеет единственное решение при А2 < 0 и C1 < 0. Авторам удалось привести вид одного из них к другому.

Равновесная по Нэшу ситуация

Приведем аналогичные результаты для равновесия по Нэшу. Здесь уже для игры Г2 вместо

(7) следует использовать равновесную по Нэшу ситуацию xe = (xf, xe2), которая определяется двумя условиями

max /Дx1,x2) = xe), max /»(xf,x2) = /2(xe). (13)

x^eR 1 x2eR

Достаточными условиями реализации (13) будут

§rad xj f1( x1, x2)

gradx2 /2 (x1, x2)

.Э/К x1, x2)

x1 = x1

x2 = x2

Эx1 Э/2(x1, x2)

= 2 A1 xf + 2 B1xf + 2a1 = 0„

Эx^

= 2B2 x1 + 2C2 x2 + 2C2 = °„2 ,

2

Жуковский В.И., Бельских Ю.А., Коэффициентные критерии при выборе концепций равновесия Самсонов С.П. (на примере линейно-квадратичной игры двух лиц)

¿Щ^! = 2 а1 < 0,

Эх^

= 2С2 < 0.

Эх2

Из первых двух условий получаем матричную систему линейных алгебраических неоднородных уравнений с постоянными коэффициентами

I А1х<2 + В1х21 = —а1, [ в2 х1 + с2 Х2 = —с2.

С учетом А1 < 0 и С2 < 0, как и в случае утверждений 1 и 2, приходим к справедливости следующих двух утверждений.

Утверждение 3. Пусть в игре Г2

А1 < 0, С2 < 0 (14)

С2 — в2 а1 1в1

Ф 0. (15)

Тогда ситуация равновесия по Нэшу х2 = (х2, х2) имеет вид

х2 = — А—1В1 [с2 — в2 А—1В1 ]—1 (в2 А—1а — с2) — А-'-Ч, х2 = [С2 — В2 А—1В1 ] —1( В2 А—Ч — С2).

Утверждение 4. Пусть в игре Г2 выполняются ограничения (14) и

А1 — В1 С—1В2 ф 0. (16)

Тогда равновесная по Нэшу ситуация х2 = (х2, х2) имеет вид

х2 = [а—вхс—В ]—1 (вс—с — Ч1),

х2 = —С2—1В2 [ А1 — ВХС—В2 ]—1 (ВС—С — Ч1) — С2—1С2.

Критерии отсутствия равновесия

Приведем довольно любопытное утверждение, которое позволяет отсекать игры, в которых не существует равновесия по Бержу или (и) по Нэшу.

Лемма 1. Если в игре Г2 матрица А1 > 0, то не существует х, такого, что при каждом фиксированном х2 имело место бы равенство

тах /1(х1

, х2) = Л(х1, х2), (17)

х1еЯ 1

т.е. в этом случае максимума по х1 е Я"1 функции /1(х1, х2) не существует.

Доказательство. «Заморозим» какую-либо стратегию х2 е Я"2 второго игрока. Тогда функцию выигрыша первого игрока можно представить в виде

Л (х1, х2) = х1 А1х1 + 2 х(( х2) + у( х2), где "1-вектор-столбец ((х2) и скалярная величина у(х2) зависят только от «замороженного» х2 .

По условию леммы матрица А1 > 0 (определенно положительна). Тогда характеристическое уравнение ае [А1 — ЕщЛj = 0 (Ещ - единичная "1х"1-матрица) имеет щ вещественных положительных корней (А1 симметрична) и, кроме того,

х1А1х1 >Л*\|х1 II2 "х1 е Я"1, (18)

и

где Л* > 0 наименьший из указанных корней. Максимума в (17) не существует, если, каким бы большим ни было число т > 0, существует стратегия х1(т, х2) е Я"1, такая, что /1 (х1 (т, х2), х2) > т . В силу (18) последнее неравенство имеет место, если

* и ц2 '

Л || х1(т, х2) + 2хДт, х2)^(х2) + у(х2) > т. (19)

Будем искать решение х1(т, х2) неравенства (19) в виде

^(т, х2) = /еПу, (20)

где число /> 0 построим ниже, а е^ - вектор размерности "¡, все компоненты которого равны единице.

Подставляя (20) в (19), получаем для нахождения /3 неравенство

Л/2" + 2р(е' ф(х2)) + у(х2) - т > 0. Поэтому при любых постоянных

„ „ Кр(х2^ + >/ (е'"1^(х2))2 + ЛЧ У(х2) -

Л "

и стратегиях первого игрока х1(т,х2) =/е^ выполнено /1(х1(т,х2),х2) > т и поэтому максимума в (17) не существует.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Замечание 2. Тогда, с учетом (17) в игре Г2 при А1 > 0 не существует равновесной по Нэшу ситуации. Отсюда и из утверждения 1 получаем

1. Если в игре Г2 матрицы А1 > 0 или (и) С2 > 0, а также А2 < 0 , С1 < 0 и выполнено (5), то в игре Г2 не существует равновесие по Нэшу, но существует равновесие по Бержу, причем ситуация равновесия по Бержу имеет вид (6).

Аналогично,

2. Если А2 < 0 , С1 < 0, имеет место требование (5) или (12) и А1 > 0 или (и) С2 > 0, то существует равновесие по Бержу, но отсутствует равновесие по Нэшу.

3. Если А1 < 0, С2 < 0, имеет место требование (15) или (16) и А2 > 0 или (и) С1 > 0 , то существует равновесие по Нэшу, но отсутствует равновесие по Бержу.

4. Если А1 > 0 или (и) С2 > 0 и А2 > 0 или (и) С1 > 0 , то в Г2 не существует как равновесия по Нэшу, так и по Бержу.

5. Если А2 < 0 , С1 < 0, А1 < 0, С2 < 0 и требования (5) или (12), а также (15) или (16), то в Г2 существует как равновесие по Нэшу, так и по Бержу.

Заключение

Итак, рассмотрели линейно-квадратичную бескоалиционную игру двух лиц без ограничений (Х7 е Я" (/ = 1,2)) и функциями выигрыша

(х1, х2 ) — х^ А^1 + 2 х!В^2 + х2 С^2 + 2а^ х1 + 2Сц х2,

Л( х1, х2) = х1 а2 х1 + 2 х1 в2 х2 + х2 с2 х2 + 2а2 х1 + 2с2 х2;

штрих сверху означает операцию транспонирования, А7 - симметричная постоянная порядка "1 X "1 матрица, С7 - симметричная постоянная порядка "2 X "2 -матрица, В7 - постоянная прямоугольная "1X "2 матрица, а7 (с7) - постоянные "1 (соответственно, "2)-вектора (/ = 1,2);

А > 0 (<) означает, что квадратичная форма х1' А х определенно положительна (соответственно, отрицательна); кванторы: $ - существование, V - общности, 0 - отрицание.

С помощью утверждений 1-4 можно также сформулировать коэффициентные условия существования равновесий в игре Г2 (см. таблицу). Как пользоваться таблицей?

Шаг 1. Прежде всего, проверить знакоопределенность матриц А1, А2, С1 и С2; пусть, например, матрицы А1 < 0, С2 < 0 (определенно отрицательны), а А2 > 0 (определенно положительна).

Жуковский В.И., Бельских Ю.А., Самсонов С.П.

Коэффициентные критерии при выборе концепций равновесия (на примере линейно-квадратичной игры двух лиц)

Шаг 2. Найти соответствующую строку в таблице (условия А1 < 0, С2 < 0 и А2 > 0 занимают третью строку) и проверить невырожденность соответствующей в 5-ом столбце матрицы (15), т.е.

det

C2 - b2a1 lßi

Ф 0.

Шаг 3. Сразу из столбцов 6 и 7 таблицы следует, что в такой игре Г2 не существует равновесия по Бержу, но имеется равновесие по Нэшу при любых матрицах С1, В 1 соответствующих размерностей и векторах а1, с 1.

Явный вид такого равновесия по Нэшу приведен в утверждении 3 (см. дополнительный столбец впереди таблицы).

Коэффициентные условия существования равновесий

Утверждение Существует одно из равновесий РБ РН

1 A1 > 0 A2 < 0 C1 < 0 (5) 3 0$ VC2, в, a, c i

2 A2 < 0 C1 < 0 C2 > 0 (12) $ 0$ VA1, Bi, at, c

3 A1 < 0 A2 > 0 C2 < 0 (15) 0$ $ VC^ B,, a, ct

4 A < 0 C1 > 0 C2 < 0 (16) 0$ $ VAl, Bt, at, c ,

Не существуют равновесия

A > 0 A2 > 0 0$ 0$ VC^ Bt, a t, c ,

A > 0 C1 > 0 0$ 0$ VA2, C2, Bt, at, ct

A2 > 0 C2 > 0 0$ 0$ VA1, C1, Bt-, at, c t

C1 > 0 C2 > 0 0$ 0$ VA1, A2, Bf, at, c t

Существуют оба равновесия

A < 0 A2 < 0 C1 < 0 C2 < 0 (5) и (15) $ $ VBt, c t

A < 0 A2 < 0 C1 < 0 C2 < 0 (12) и (16) $ $ VB^ ai,c t

Литература

1. Жуковский, В.И. Линейно-квадратичные дифференциальные игры / В.И. Жуковский, А.А. Чикрий. - Киев: Наукова Думка, 1994. - 320 с.

2. Жуковский, В.И. Введение в дифференциальные игры при неопределенности. Равновесие по Нэшу / В.И. Жуковский. - М.: URSS, 2010. - 168 с.

3. Жуковский, В.И. Введение в дифференциальные игры при неопределенности. Равновесие Бержа-Вайсмана / В.И. Жуковский. - М.: URSS, 2010. - 174 с.

4. Zhukovskiy, V.I. Lyapunov Functions in Differential Games / V.I. Zhukovskiy. - London: Taylor and Francis, 2003. - 281 p.

Поступила в редакцию 28 сентября 2015 г.

Bulletin of the South Ural State University Series "Mathematics. Mechanics. Physics" _2015, vol. 7, no. 4, pp. 20-26

DOI: 10.14529/mmph150403

COEFFICIENT CRITERIA IN CHOOSING EQUILIBRIUM CONCEPTIONS (ON THE EXAMPLE OF LINEAR-QUADRATIC GAME OF TWO PERSONS)

V.I. Zhukovskiy^, Y.A. Bel'skikh2, S.P. Samsonov3

Coefficient criteria and an explicit form of Berge and Nash equilibrium situations in a non-cooperative game of two persons as well as coefficient conditions of the equilibrium absence have been found.

Keywords: non-cooperative game of two persons; matrixes; vectors; Nash equilibrium; Berge equilibrium.

References

1. Zhukovskiy V.I., Chikriy A.A. Lineyno-kvadratichnye differentsial'nye igry [Linear Quadratic Differential Games]. Kiev, Naukova Dumka Publ., 1994. 320 p. (in Russ.).

2. Zhukovskiy V.I. Vvedenie v differentsial'nye igry pri neopredelennosti. Ravnovesie po Neshu [Introduction to differential games with uncertainty. Nash Equilibrium]. URSS Publ., 2010. 168 p. (in Russ).

3. Zhukovskiy V.I. Vvedenie v differentsial'nye igry pri neopredelennosti. Ravnovesie Berzha-Vaysmana [Introduction to differential games under uncertainty. Berge-Vaisman Equilibrium]. URSS Publ., 2010. 174 p. (in Russ.).

4. Zhukovskiy V.I. Lyapunov Functions in Differential Games. London: Taylor and Francis, 2003. 281 p.

Received September 28, 2015

1 Zhukovskiy Vladislav Iosifovich is Dr. Sc. (Physics and Mathematics), Professor, Optimal Control Department, Lomonosov Moscow State University, Moscow, Russia.

E-mail: [email protected]

2 Bel'skikh Julia Anatolievna is Cand. Sc. (Physics and Mathematics), Associate Professor, Moscow State University of Technologies and Management, Moscow, Russia.

E-mail: [email protected]

3 Samsonov Sergey Petrovich is Cand. Sc. (Physics and Mathematics), Associate Professor, Optimal Control Department, Lomonosov Moscow State University, Moscow, Russia.

E-mail: [email protected]

Коэффициентные критерии при выборе концепций равновесия (на примере линейно-квадратичной игры двух лиц) Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Жуковский Владислав Иосифович, Бельских Юлия Анатольевна, Самсонов Сергей Петрович

Похожие темы научных работ по математике , автор научной работы — Жуковский Владислав Иосифович, Бельских Юлия Анатольевна, Самсонов Сергей Петрович

COEFFICIENT CRITERIA IN CHOOSING EQUILIBRIUM CONCEPTIONS (ON THE EXAMPLE OF LINEAR-QUADRATIC GAME OF TWO PERSONS)

Текст научной работы на тему «Коэффициентные критерии при выборе концепций равновесия (на примере линейно-квадратичной игры двух лиц)»