УДК 519.833.2 ББК B 11
Юлия Сергеевна Токарева
кандидат физико-математических наук, Забайкальский государственный университет (Чита, Россия), e-mail: [email protected] Владимир Викторович Мазалов доктор физико-математических наук, Институт прикладных математических исследований Карельского научного центра РАН (Петрозаводск, Россия), e-mail: [email protected]
Об одной задаче наилучшего выбора с правилом консенсуса1
В работе рассматривается многошаговая игра трёх лиц. Пирог единичного размера делится между тремя игроками. Для разрешения проблемы приглашается арбитр, который представлен генератором случайных чисел с распределением Дирихле. Найдено аналитическое выражение выигрыша каждого из трех игроков в виде рекуррентных формул. Оптимальное поведение участников переговоров получено в классе пороговых стратегии.
Ключевые слова: переговоры, задача наилучшего выбора, арбитр, дисконтирование, распределение Дирихле, пороговые стретегии.
Yuliya Sergeevna Tokareva
Candidate of Physics and Mathematics, Zabaikalsky State University (Chita, Russia), [email protected] Vladimir Viktorovich Mazalov
Doctor of Physics and Mathematics, Institute of Applied Mathematical Research Karelian Research Center, Russian Academy of Sciences (Petrozavodsk, Russia), [email protected]
On a Problem of the Best Choice with Consensus Rule
This paper considers the multi-stage game of three persons. A cake of unit size is divided between the three players. To resolve the problem, an arbitrator who is represented by a random number from the Dirichlet distribution is invited. The analytical expression of each of the three winning players as recurrence formulas is found. The optimal behavior of the negotiators is obtained in the class of threshold strategies.
Keywords: negotiation problem, the best choice, arbitrator, discounting, Dirichlet distribution, threshold strategies.
Введение. Задача наилучшего выбора является классической задачей теории переговоров. Одной из наиболее известных среди них является задача о разделе пирога. Под словом «пирог» подразумевается любой ресурс, который должен быть разделен на части с учетом интересов сторон, участвующих в переговорах. Это может быть вопрос о разделении территорий, материальных ценностей, сферы влияния и т.д. Проблема состоит в том, чтобы все участники переговоров получили свой кусок пирога, считая его достаточным. Для раздела пирога существуют различные процедуры [1; 2; 11].
В данной работе рассматривается многошаговая игра трёх лиц. Для разрешения проблемы приглашается независимая сторона - арбитр, который представлен генератором случайных чисел.
Пусть для переговоров мы имеем K шагов и пирог единичного размера. На каждом шаге арбитр генерирует случайные предложения и представляет их игрокам - участникам переговоров. Пусть генератор случайных чисел представлен распределением Дирихле с плотностью
st \ Г(&1 + к2 + кз) к i к i к i
/(*„*»,«)% % ,
1 Работа выполнена в рамках Государственного задания вузу Минобрнауки РФ, № 8.3641.2011.
© Токарева !Ю. С., Мазалов В. В., 2013
105
где Г(к) - гамма-функция, при этом xi + Х2 + хз = 1, xi > 0, Х2 > 0, хз > 0.
Игроки рассматривают предложенный арбитром кусок пирога и либо отклоняют его, либо принимают. Если все игроки соглашаются с предложенияем арбитра, то игра заканчивается. Это так называемый полный консенсус. Если хотя бы один из игроков не соглашается, то игра переходит на следующий шаг. Считаем, что после каждого шага пирог «усыхает», т. е. дисконтирует на величину
S, где S < 1. Если время для переговоров закончилось (шаг k = 0), а участники так и не пришли к решению проблемы, то они получают куски пирога малого размера.
Если участники переговоров имеют равные веса, то параметры распределения Дирихле могут быть выбраны равными. Тогда процедура разделения гарантирует равные возможности для всех участников. Если у какого-либо из участников есть больший вес, то необходимо увеличить свой параметр в распределении.
Все существующие модели раздела пирога можно разделить на две группы. В первой группе участникам предлагают различные варианты дележа [4; 8; 9]. Ко второй группе относятся задачи с привлечением арбитра, который формирует предложения (куски пирога) и предлагает их участникам [3; 5; 7; 10].
В работе [14] был рассмотрен симметричный случай раздела пирога для трех игроков. Для решения проблемы использовалось или правило большинства, или правило консенсуса. Развитие данной модели представлено в работе [13], где была исследована подобная схема с параметрами распределения Дирихле k1 = k2 = k3 = 2. Проблема наилучшего выбора, рассмотренная в работе [10], является близкой к данной проблеме.
В статье [6] показано, что задача о дележе пирога с двумя игроками всегда имеет единственное равновесие по Нэшу, а в работе [12] доказано, что пирог может быть справедливо разделен среди n игроков.
Задача наилучшего выбора с правилом консенсуса. Рассматривается следующая теоретико-игровая модель переговоров. Пирог единичного размера делится на трёх игроков с помощью многошаговой процедуры. Для дележа приглашается арбитр, который на каждом шаге предлагает игрокам I, II и III куски пирога размера xi, Х2, хз, соответственно.
Пусть предложения арбитра распределены по закону Дирихле:
Г(/г1 + &2 + &з)
„fci-i
„к з-1
где + Х2 + жз = 1.
Положим, что &1 = 3, ^2 = кз = 1, тогда
/(х1, Ж2) = 12x1, Х1 + Х2 < 1,Ж1,Ж2 > 0.
Обозначим через ^1(ж1) вероятность того, что игрок I примет текущее предложение арбитра Ж1; ^2(ж2) - вероятность того, что игрок II примет предложенное Ж2 и ^з(жз) = ^з(1 — Ж1 — Ж2) -вероятность того, что игрок III примет жз. В силу симметрии игры для второго и третьего игрока полагаем ^2(ж2) = Мз(1 — Ж1 — Ж2).
Если хотя бы один из игроков отказывается, то игра переходит на следующий шаг, на котором снова арбитром генерируются случайные предложения Ж1, Ж2, Ж3. Считаем, что на каждом шаге игры пирог уменьшается и становится размером 6 < 1. Игра заканчивается, когда все три игрока одновременно примут предложения арбитра или закончится время для переговоров.
Обозначим через выигрыш г-го игрока в момент времени, когда до окончания игры оста-
лось к шагов.
Теорема. Оптимальные стратегии игроков на к-м шаге имеют вид М1(ж1) = I{x1>SH(k1]_1}, М*(ж®) = г = 2 3,
где ІA - индикатор события А.
Значение игры удовлетворяет рекуррентным соотношениям
H(1) = (1 - 2SH(-i
+
+ (SH(-)1
1 - 2SHi2\ - sh:
3
-i
(i)
-i
+ SH(-1,
i
2
з
4
4
= I Л _ 2бН^ У - о [ш(Ч V Л _ ОАН“(2) _ А И"*-1)
5
4-1/ — 2 (6Яй-1
1 — 26Н(-;1 — 6Н-1) +
5 — 106Я(2)1 — 4бя;-1
К1)
+ 6Н(2-)1.
Доказательство. Пусть до конца игры осталось к шагов. С вероятностью М1(ж1) • М2(ж2) •Мз(жз) все игроки примут предложения Ж1, Ж2, жз. С вероятностью
1 — ^1(Ж1) • М2(ж2) • мз(жз)
хотя бы один из игроков отвергнет текущее предложение и игра перейдет на следующий шаг с дисконтированным размером пирога. Тогда уравнение оптимальности для выигрыша игрока I на к-м шаге имеет вид
Я,
(1)
Г 1 Г 1-Х1 ( N
вир / ^Ж1 / { М1М2М3Ж1 + (1 — М1М2Мз)6Я(-1 [ 12ж1^ж2
М1 ./0 ./0 ^ *
1
0
М1
= вир 12 ^ I М1Ж2(ж1 — 6Я(-)1 )^Ж1
г* 1 — Х1
М2 мз^ж^ + 6Я(-)1.
Цель I-го игрока - максимизация своего выигрыша. Рассмотрим выражение при М1(ж1)
ж2(ж1 — 6я(-)1)
с 1 —Х1
м2(ж2)мз(1 — Ж1 — Ж2)^Ж2.
Будем искать равновесие в данной игре среди пороговых стратегий. Пусть М1 (Ж1) = I {Ж1 > 6} , М2 (ж2) = I {Ж2 > а} , мз(жз) = I {жз > а} .
Тогда получаем
ж2(ж1 — 6я(1-)1 )
г*1-Х1
М2 (ж2 )мз (1 — Ж1 — Ж2 )^Ж2 =
/»1-Х1 -а
ж1 (ж1 — 6Я(-)1 ) / dж2І {6 < Ж1 < 1 — 2а} +0 • I {ж1 > 1 — а}
а
= ж2(ж1 — 6Я(-)1) (1 — Ж1 — 2а) I {6 < Ж1 < 1 — 2а} , и оптимальная стратегия игрока I имеет вид
*/ \ / 1 если Ж1 < 1 — 2а,
М1 (Ж1 [ V если ж1 > 1 — 2а.
Уравнение оптимальности для выигрыша игрока I на к-м шаге примет вид
Я(1) =(1 — 26Н(->1
3
- (1 - 2<5Я,
(2)
-1
6Я
(1)
-1
+
+ (бЯ(-)1)
где
1-2гя(2Л-^я^
а = 6Я(-1, 6 = 6Я(1-)1.
Уравнение оптимальности для выигрыша игрока II на к-м шаге имеет вид
(' 1 г 1-Х2
Я
(2)
к
1 1-Х2
вир / dж2 I \ М1М2МзЖ2 + (1 — М1М2Мз)6Я(-)Л 12ж1^ж1
М2 </0 </0 ^ ^
Рассмотрим выражение при М2(у):
/* 1-Х2
(Ж2 — 6Я(-^) / ж1м1(ж1)мз(1 — Ж1 — Ж2)^Ж1
1 0
2
0
0
4
4
Для пороговых стратегий получаем
Г*1-Х2
/*1-X2
(x2 - SH(-)1W x^i^dxi
J0
— 2 (а-2 — -^) ((1 — Х2 — а)3 — Ь3) / {а < Ж2 < 1 — а — 6} +
+0 • I {ж2 > 1 — а — 6} .
Тогда уравнение оптимальности для выигрыша игрока II на к-м шаге примет вид
Н12) = 1 (1 - 26Н?\У - 2 (бН&У (1 - 26Н$\ - 6Н11\У +
5 - 10SH(2-)i - 4SH(-)i
+ SH(2)i.
Теорема доказана.
Заключение. В статье рассматривается процедура раздела пирога. Эта модель может быть адаптирована к различным реальным ситуациям. В одних случаях можно выбирать одинаковые параметры распределения Дирихле. Если же участники имеют разный вес, то можно увеличивать или уменьшать соответствующий параметр распределения. Найдено аналитическое выражение выигрыша каждого из трёх игроков в виде рекуррентных формул. Решение задачи будет зависеть от параметров модели: интервал времени, который был выделен для переговоров k, коэффициент дисконтирования пирога S, параметры распределения Дирихле. Оптимальное поведение участников переговоров получено в классе пороговых стратегий.
Список литературы
1. Brams S. J., Taylor A. D. Fair Division: from Cake-Cutting to Dispute Resolution. Cambridge University Press, 1996. 272 p.
2. Brams S. J., Taylor A. D. An envy-free cake division protocol // American Mathematical Monthly. 1995. Vol. 102, № 1. P. 9-18.
3. Crawford V. P. On Complusory arbitration schemes // Journal of Political Economy.
1973. Vol. 11. P. 13-15.
4. Dubins L. E., Spanier E. H. How to cut a cake fairly // American Mathematical Monthly. 1961. Vol. 68. P. 1-17.
5. Garnaev A. Y. Value of information in optimal stopping games // Game Theory and Applications. 2000. Vol. 5. P. 55-64.
6. Hamers H. A Silent Duel over a Cake // Mathematical Methods of Operations Research. 1993. Vol. 43. P. 119-127.
7. Mazalov V.V., Banin M.V. N-person best-choice game with voting // Game Theory and Applications. 2003. N 9. P. 45-153.
8. Mazalov V.V., Sakaguchi M., Zabelin A.A. Multistage arbitration game with random offers // Game Theory and Applications. 2002. № 8. P. 95-106.
9. Rubinstein A. Perfect Equilibrium in a Bargaining Model // Econometrica. 1982.
Vol. 50(1). 97-109.
10. Sakaguchi M. Best-choice game where arbitration comes in // Game Theory and Applications. 2003. N 9. P. 141-149.
11. Steinhaus H. The problem of fair division // Econometrica. 1948. № 16. P. 101-104.
12. Stromquist W. How to cut a cake fairly // American Mathematical Monthly. 1980.
Vol. 87, № 8. P. 640-644.
13. Мазалов В. В., Менчер А. Э., Токарева Ю. С. Переговоры. Математическая теория. СПб.: Лань, 2012. 304 с.
14. Мазалов В. В., Носальская Т. Э. Стохастический дизайн в задаче о дележе пирога // Математическая теория игр и ее приложения. 2012. Вып. 4, Т. 3. С. 33-50.
References
1. Brams S. J., Taylor A. D. Fair Division: from Cake-Cutting to Dispute Resolution. Cambridge University Press, 1996. 272 p.
2. Brams S. J., Taylor A. D. An envy-free cake division protocol // American Mathematical Monthly. 1995. Vol. 102, № 1. P. 9-18.
3. Crawford V. P. On Complusory arbitration schemes // Journal of Political Economy.
1973. Vol. 11. P. 13-15.
4. Dubins L. E., Spanier E. H. How to cut a cake fairly // American Mathematical Monthly. 1961. Vol. 68. P. 1-17.
5. Garnaev A. Y. Value of information in optimal stopping games // Game Theory and Applications. 2000. Vol. 5. P. 55-64.
6. Hamers H. A Silent Duel over a Cake // Mathematical Methods of Operations Research. 1993. Vol. 43. P. 119-127.
7. Mazalov V.V., Banin M.V. N-person best-choice game with voting // Game Theory and Applications. 2003. N 9. P. 45-153.
8. Mazalov V.V., Sakaguchi M., Zabelin A.A. Multistage arbitration game with random offers // Game Theory and Applications. 2002. N 8. P. 95-106.
9. Rubinstein A. Perfect Equilibrium in a Bargaining Model // Econometrica. 1982.
Vol. 50(1). 97-109.
10. Sakaguchi M. Best-choice game where arbitration comes in // Game Theory and Applications. 2003. N 9. P. 141-149.
11. Steinhaus H. The problem of fair division // Econometrica. 1948. № 16. P. 101-104.
12. Stromquist W. How to cut a cake fairly // American Mathematical Monthly. 1980.
Vol. 87, № 8. P. 640-644.
13. Mazalov V. V., Mencher A. E., Tokareva Yu. S. Peregovory. Matematicheskaya teoriya.
Spb.: Lan, 2012. 304 s.
14. Mazalov V. V., Nosalskaya T. E. Stokhasticheksy lizayn v zadache o delezhe piroga // Matematicheskaya teoriya igshr i eye prilozheniya. 2012. Vyp. 4. T. 3. S. 33-50.
Статья поступила в редакцию 25.05.2013