ББК В 11 УДК 519.833.2
Юлия Сергеевна Токарева,
кандидат физико-математических наук, доцент Забайкальский государственный университет, 672039, Россия, г. Чита, ул. Александре-Заводская, 30,
e-mail: [email protected]
Проблема справедливого дележа пирога с участием арбитра1
Рассмотрена стохастическая процедура распределения многокомпонентного ресурса, представленная как проблема справедливого раздела пирога. Представлена модель распределения двух разных ресурсов единичного размера между тремя игроками. Исследована многошаговая бескоалиционная игра с арбитражной процедурой, использующей случайный механизм с многомерным распределением Дирихле. Для проведения переговоров предоставлен временной интервал. На каждом шаге арбитр генерирует случайные предложения по каждому из двух ресурсов для каждого из игроков. Исследовано оптимальное поведение игроков в модели для трех участников переговоров, найдено равновесие по Нэ-шу в классе пороговых стратегий и получены соответствующие аналитические выражения для выигрышей. Рассмотрен случай, когда генератор случайных чисел (мнение арбитра) представлен распределением Дирихле с несимметричными параметрами распределения. Для исследования модели введены пороговые стратегии игроков, как вероятности того, что игрок на данном шаге примет текущее предложение арбитра по двум ресурсам. Значение игры удовлетворяет ре-куррентным соотношениям. Найдено оптимальное решение в условиях полного консенсуса. Методы исследования основываются на теоретико-игровом анализе бескоалиционных игр.
Ключевые слова: переговоры, арбитр, дисконтирование, распределение Дирихле, пороговые стретегии.
Julia Sergeevna Tokareva,
Candidate of Physics and Mathemayics, Associate Professor
Transbaikal State University, 30, Alexandre-Zavodskay St., Chita, Russia, 672039,
e-mail: [email protected]
The Problem of Fair Sharing of the Cake with the Arbitrator2
We consider the stochastic procedure of multicomponent resource allocation presented as a problem of fair sharing of the pie. The model of two different resource allocation of a single size between three playersis presented. A multistage non-cooperative game with the arbitration procedure using a random mechanism with the multi-dimensional Dirichlet distribution is studied. Time intervalis given for the negotiations. At each step, the arbitrator generates random proposals for each of the two resources for each of the players. Optimal players' behavior in the model for the three negotiators is studied, the Nash equilibrium strategies of threshold type
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 14—01—31524 мол_а.
2Research is executed with financial support of the Russian Federal Property Fund within the scientific project No. of 14-01-31524 a mol a.
© Токарева Ю. С., 2015
93
are foundand analytical expressions for the winningsare obtained. We consider the case where the random number generator (the arbitrator's opinion) is represented by theDirichlet distribution with asymmetrical distribution parameters. To study the model, threshold strategies of the players are introducedas probabilities of the fact that the player at this stage will accept a current proposal of the arbitrator on two resources. The game value satisfies the recurrence relations. We found the optimal solution in full consensus. Research methods are based on game-theoretic analysis of non-cooperative games.
Keywords: negotiation, arbitrator, discounting, Dirichlet distribution, threshold strategies
Введение. Задача справедливого дележа пирога является ключевой проблемой теории переговоров. Под пирогом подразумевается любой ресурс, который необходимо разделить на части с учётом интересов сторон, участвующих в переговорах. Все участники переговоров должны получить часть пирога, которая их удовлетворит.
Для раздела пирога могут быть использованы различные процедуры. Существующие модели дележа пирога можно разделить на две группы. В первой группе участникам предлагают различные варианты дележа [2; 4; 7]. В данной же работе предлагается арбитражная многошаговая процедура дележа одновременно двух пирогов единичного размера для трёх лиц, в которой арбитр представлен генератором случайных чисел. Близкими к данной работе являются работы, касающиеся задачи наилучшего выбора [7], где также была использована многошаговая схема случайных предложений.
В работе рассмотрена стохастическая процедура распределения многокомпонентного ресурса, представленная как проблема справедливого раздела пирога. Исследована многошаговая бескоалиционная игра с арбитражной процедурой, использующей случайный механизм с многомерным распределением Дирихле. Представлена модель распределения двух разных ресурсов единичного размера между игроками при помощи многошаговой процедуры с участием арбитра. Для проведения переговоров предоставляется временной интервал К. На каждом шаге арбитр генерирует случайные предложения по каждому из ресурсов (X, Y) для каждого из игроков. Если число участников переговоров, согласных с предложением арбитра, больше или равно, чем некоторое заданное число р, то такой делёж принимается. В противном случае игра переходит на следующий шаг с дисконтированием ресурса на заданную величину, меньшую 1. Исследовано оптимальное поведение игроков в модели для трёх участников переговоров, найдено равновесие по Нэшу в классе пороговых стратегий и получены соответствующие аналитические выражения для выигрышей. Рассмотрен случай, когда генератор случайных чисел (мнение арбитра) представлен распределением Дирихле f(X, Y) = f(X)-f(Y) с несимметричными параметрами распределения: для первого игрока параметры равны 2, для второго и третьего - 1. Для исследования данной модели вводились пороговые стратегии игроков, как вероятности того, что игрок на данном шаге примет текущее предложение арбитра по двум ресурсам. Значение игры удовлетворяет рекуррентным соотношениям. Найдено оптимальное решение в условиях полного консенсуса. Методы исследования основываются на теоретико-игровом анализе бескоалиционных игр.
Математическая модель. Три игрока I, II и III делят два разных ресурса (пирога) единичного размера. Для проведения переговоров используется многошаговая процедура и предоставляется временной интервал К. Приглашается арбитр, который на каждом шаге генерирует случайные предложения по каждому из ресурсов (X, Y) для каждого из игроков. Первому игроку предлагаются куски х\ и у\, второму предлагаются Х2 и |/2, а третьему -и уз. Предположим, что генератор случайных чисел представлен распределением Дирихле
с плотностью f(X, Y) = f(X) • f(Y), где
ffm яо х*) ~ + fc2 + fc3) fc!-i fa-i fcs-i
«v \ r(fei + k2 + fcs) fci-1 fc2-i fc3-i
= 2/2 Уз '
при этом Xi = 1, ^¿=12/г = 1, > о, Уг > 0, а Г(k) - гамма-функция.
Параметры распределения Дирихле выбираются равными, если участники переговоров имеют равные веса. Если же у одного из игроков вес больше, то необходимо увеличить соответствующий параметр в распределении.
Рассмотрим случай с несимметричными параметрами распределения. Пусть для первого игрока параметры к\ = к^ = 2, а для второго и третьего = = = к§ = 1. Таким образом, f(X,Y) = З6Ж1У1.
Предложения арбитра представляются игрокам - участникам переговоров. Игроки рассматривают предложенные кусок пирога и либо отклоняют его, либо принимают. Воспользуемся правилом полного консенсуса, при котором если все игроки соглашаются, то игра заканчивается. Если хотя бы один из игроков не соглашается, то игра переходит на следующий шаг. После каждого шага ресурсы дисконтируют на некоторую величину 6 (<5 < 1). Если за временной интервал К игроки не пришли к консенсусу (шаг А; = 0), то игра заканчивается и участники получают куски пирога малого размера.
Обозначим через ц\{х\, у{) вероятность того, что игрок I примет текущие предложения арбитра х\ и у\, /12(^2,2/2) ~~ вероятность того, что игрок II примет предложенные Х2 и а дз(жз, уз) = дз(1 — xi — х2,1 — i/2 — Уз) ~ вероятность того, что игрок III примет хз и уз. В силу симметрии игры для второго и третьего игрока полагаем /¿2(^2,2/2) = МЗ^З) Уз)-
Пусть Н^ — выигрыш I игрока в момент времени, когда до окончания игры осталось к шагов.
С вероятностью Ц\{х\, у\) ■ №(х2,2/2) ■ Мз(^з, уз) все игроки примут текущие предложения арбитра. С вероятностью
1 - ßi{xi,yi) ■ ß2(x2,y2) -Цз(хз,Уз)
хотя бы один из игроков отвергнет текущее предложение и игра перейдёт на следующий шаг с дисконтированным размером пирога.
Пусть до конца игры осталось к шагов, тогда уравнение оптимальности для выигрыша игрока I на к-м шаге имеет вид
/-1 rl /• 1-Х! ri-yi
Н^, = sup I dx 1/ dyi I / (М1М2/ЛЗ(Ж1 +Vi)+ Pi Jo J0 J0 Jo
+(1 - //1/12^3)^^1} Wx1y1dx2dy2,
где H^ = , Mi = [ii(xi,yi), ß2 = ¿¿2(^2,2/2), /¿3 = Мз(жз,2/з)-
Цель I игрока - максимизация своего выигрыша. Сгруппируем члены, содержащие множитель /х 1 (xi, 2/1)
m fl~xi f1_vi
Xiyi(xi + У! - бщ^) / H2ß3dx2dy2.
J 0 Jo
Будем искать равновесие в игре среди пороговых стратегий. Пусть Hi{x\,y\) = I{xi > Ь,уг > b}, ß2(.X2,y2) = I{x2>a,y2>a}, /¿з(жз,2/з) = 1 (^з > a, у3 > а} = / {1 - xi - Х2 > а, 1 - 2/1 - 2/2 > а} •
При Ь < х 1 < 1 — 2а, b < ух < 1 — 2а имеет место равенство г 1-хх rl-yi rl-xi—a rl-yx-a
/ / №№<lx2dy2= / / dx2dy2 = (1 — х\ — 2а) (1 — yi — 2а)
Jo ./О Ja Ja
В остальных случаях этот интеграл равен нулю.
гя(2) 6нт Учитывая, что а = —1, Ь = —^, получаем
41' - (1 - «£\+«£\)(i - + ^><1 - «2, - +
Уравнение оптимальности для // и III игроков, если до конца игры осталось к шагов, имеет вид
/-1 /-1 /-1-Х2 /-1-У2
#£; = sup / сЬ2 dy2 / {/¿1Д2Мз(>2 + Ы+
+(1 - ^МгМз)^^! 36x1y1dx2dy2,
где Я <2) = d.
При а<Ж2<1 — а — Ь, а<у2<1 — а — Ь получаем
*1-Х2 /-1-2/2
pl—X 2 /•!
J0 Л)
= ^(1 - а + Ъ - жг)(1 - а - Ь - жг)(1 — а + Ь — т/2)(1 — а — Ъ — уъ)
В остальных случаях этот интеграл равен нулю. Таким образом,
ЧЕ» = |С1 - + |ля£?ж )(1 - ий + «£>,)(! - и« - ^ + гя«.
Имитационное моделирование.
В таблице представлены значения выигрыша на предпоследнем шаге игры (к = 1) при фиксированных значениях Н^ = 0.1 и Н^ = Н^ = 0 в нескольких значениях временного интервала К и коэффициента дисконтирования 5.
Таблица
К #i 5 = 0.9 5 = 0.95 6 = 0.99
К=10 0.512874 0.646525 0.907913
Н™ 0.287201 0.325708 0.447307
К=20 ff}1) 0.45428 0.535146 0.822305
ff« 0.299914 0.310148 0.405643
К=50 0.431084 0.465811 0.670468
ЯГ 0.305885 0.329516 0.353105
Заключение
В статье рассмотрена процедура дележа пирога. Решение задачи зависит от параметров модели: интервал времени для переговоров К, коэффициент дисконтирования пирога 6, параметры распределения Дирихле. Оптимальное поведение участников переговоров получено в классе пороговых стратегии. Найдено аналитическое выражение выигрыша для каждого из трёх игроков в виде рекуррентных формул.
Список литературы
1. Crawford V. P. On Complusory arbitration schemes // Journal of Political Economy. 1973. Vol. 11. P. 13-15.
2. Dubins L. E., Spanier E. H. How to cut a cake fairly // American Mathematical Monthly. 1961. Vol. 68. P. 1-17.
3. Garnaev A. Y. Value of information in optimal stopping games // Game Theory and Applications. 2000. Vol. 5. P. 55-64.
4. Mazalov V.V., Banin M.V. N-person best-choice game with voting // Game Theory and Applications. 2003. N 9. P. 45-153.
5. Mazalov V.V., Sakaguchi M., Zabelin A.A. Multistage arbitration game with random offers // Game Theory and Applications. 2002. N 8. P. 95-106.
6. Rubinstein A. Perfect Equilibrium in a Bargaining Model // Econometrica. 1982. Vol. 50(1). 97-109.
7. Sakaguchi M. Best-choice game where arbitration comes in // Game Theory and Applications. 2003. N 9. P. 141-149.
8. Мазалов В.В., Носальская Т.Э. Стохастический дизайн в задаче о дележе пирога // Математическая теория игр и её приложения. 2012. Вып. 4, Т. 3. С. 33-50.
Статья поступила в редакцию 23.04-2015