УДК 517.9 ББК В 161.6
А. Э. Менчер
г. Чита, Россия
О дискретных арбитражных процедурах со взвешенными игроками
Рассматривается игра с нулевой суммой со взвешенными игроками, связанная с двумя арбитражными процедурами. Для случая, когда предложения арбитра равновероятно сосредоточены в точках -1, 0 и 1, найдено равновесие в игре в обеих процедурах.
Ключевые слова: арбитражная процедура, стратегия, равновесие.
A. E. Mencher
Chita, Russia
On the Issue of Discrete Arbitral Procedures with Weighted Players
We consider a zero-sum game with weighted players related with two arbitration procedures. For the case in which the arbitrator’s offers are concentrated in the points -1, 0 and 1 with equal probabilities the equilibrium in the game is found.
Keywords: arbitration procedure, strategy, equilibrium.
1. Введение
Мы рассматриваем бескоалиционную игру с нулевой суммой, в которой игроки Ь и М, именуемые, соответственно, как работник и работодатель, ведут переговоры об установлении заработной платы. Игрок Ь делает предложение х, а игрок М — предложение у; х и у - произвольные действительные числа. Если х < у, то конфликта нет и игроки соглашаются на выплату жалованья, х + У -п
равного —-—. Если же х > у, игроки апеллируют к арбитру А, который руководствуется своими
соображениями о справедливости. Обозначим решение арбитра через г.
В настоящей работе для достижения равновесия в игре используются две арбитражные процедуры. В обеих из них выигрыш имеет следующий вид: Н(х, у) = ЕН(х, у).
В первой из процедур
х + у
Hz (x,y) =
2
az — by, az — bx,
z,
если x < у,
если x > y, |x — z| < |У — z
если x > y, |x — z| > |У — z
если x > y, |x — z| = |У — z
(І)
а > 1,6 > 0.
При а =1, 6 = 0 получаем схему согласительного арбитража, а при а = 2, 6 =1 - схему арбитража с наказанием (Zeng, [3]).
В другой процедуре
Hz (x,y)
X + у
2 ’
az + by,
az + bx,
z,
если x < y,
если x > y, |x — z| < |У — z
если x > y, |x — z| > |У — z
если x > y, |x — z| = |У — z
(2)
Ь > 0.
Здесь при а =1, Ь = 0 снова получаем схему согласительного арбитража, а при а = 0, Ь =1 схему арбитража по последнему предложению (ЕагЬег, [2]).
Всюду в дальнейшем будем считать Ь > 0.
116
© Менчер А. Э., 2011
2. Постановка задачи. Оптимальные стратегии
Пусть —то <у < 0 < х< +то, а г - дискретная случайная величина, принимающая с равными вероятностями значения -1, 0 и 1.
Благодаря симметрии, цена игры равна нулю, так что достаточно указать оптимальную стратегию только для одного из игроков, например, Ь.
Для схемы (1) решение игры находим в чистых стратегиях.
Теорема 1. Для игрока Ь оптимальной стратегией является чистая стратегия х = 0. Доказательство. В самом деле,
Н(0, у)
з [-а - Ъу - Ъу + а - Ъу] = -Ъу ±[—1 + 26+а+ 26] = а+4„ь~1 5[-а - Ъу + а - Ъу] = -5Ъу 0
при у Є (-то, -2), при у = -2, при у Є (-2, 0), при у = 0.
(3)
Итак, Н(0,0) =0 и Н(0, у) > 0 для у Є (-то, 0), что и доказывает оптимальность стратегии х = 0.
Для схемы (2) равновесие будем искать среди смешанных стратегий. Обозначим через /(х) и $(у) смешанные стратегии игроков Ь и М, соответственно:
-+^о 0
/(х) > 0, У /(х)(х = 1; #(у) > 0, У #(у)(у = 1.
Здесь, благодаря симметрии, $(у) = /(—у). Функцию выигрыша игрока М при выбранной игроком Ь стратегии / (х) обозначим через Н(/(х), у). Отметим, что случай а = 0, 6 = 1 рассмотрен в работе [1].
Теорема 2. Для игрока Ь оптимальной стратегией является
/(х)
0,
если 0 < х < с, если с < х < с + 2, если с + 2 < х < +то,
(4)
где с
Доказательство. Будем искать оптимальную стратегию игрока Ь в форме
0 если 0 < х < с,
/(х) = ^ ^(х) если с < х < с +2,
0 если с +2 < х < +то,
(5)
где функция ^(х) положительна и непрерывно дифференцируема в интервале (с, с +2).
Функция Н(/(х),у) непрерывна на всей полуоси (—то, 0]. Стратегия (5) будет оптимальной, если Н(/(х), у) = 0 для у € [—(с + 2), —с] и Н(/(х),у) > 0 для у € (—то, —(с + 2)) и (—с, 0].
Пусть у € [—(с + 2), —с], тогда —у € [с, с +2] и
с+2 — у с+2
Н(/(х),у) = — J (—а-\-Ъу)$(х)(1,х-\- J Ъх/(х)(1,х-\- J Ъу/(х)(1,х-\-
с+2
+ J (а + Ьх)/(х)(х.
С
Если теперь /(х) — оптимальная стратегия, то из (6) получаем:
(6)
#(/(*),—с — 0) = -
с+2
-а - Ьс - Ьс + а + Ь J х/(х)(х
— СО
3
0
Н(/(х),-(с + 2) + 0) = -
с+2
+а+ь!х/(.1^
J х/(х)йх — 2с =0,
с+2
—а — 6(с + 2) + 6 J х/(х)йх+
С
' с+2
2 J х/(х)йх — (с + 2)
откуда следует соотношение для математического ожидания стратегии / (х) :
с+2
с+2
J х/(х)йх = 2с :
2
2
Таким образом, с = —.
Далее, для оптимальности стратегии /(х) необходимо, чтобы Н'(/(х),у) = Н"(/(х),у) = 0 в интервале ( — (с + 2), —с). Имеем:
н>и(х)/у)=ь-
с+2
1 + 2у/(—у) + J /(х)^х
откуда приходим к уравнению
3/(—у) — 2у/'(—у) = 0. Положим х = —у, тогда х € [с, с + 2], /(х) = ^(х) и
3^(х) + 2х^;(х) = 0.
Решением этого уравнения является функция
¥>(*)= “
Определим константы с и а. Из (8) получаем:
0 = Н'(/, —с — 0) = -
2а
2“^
откуда
(7)
(8)
(9)
(10)
(11)
Из (5), (10) и (11) следует, что /(х) имеет вид (4).
Проверим выполнение условий оптимальности.
Пусть у € [—(с + 2), —с]. Так как при построении стратегии /(х) были использованы равенства Н"(/(х), у) =0 в интервале ( — (с + 2), —с), Н'(/(х), —с — 0) = 0 и Н(/(х), —с — 0) = 0, то в силу непрерывности функции Н(/(х),у) заключаем, что Н(/(х),у) = 0 при у € [—(с + 2), —с].
Исследуем теперь поведение функции Н(/(х), у) вне отрезка [— (с + 2) —с].
Пусть у € (—то, —(с + 4)], тогда —у € [с + 4, +то) и
с+2 с+2
J ( — 1 + 6х)/(х)йх + J 6х/(х)йх +
а
с+2 П с+2
+ J (1 + Ьж)/(ж)с£ж =Ъ J xf(x)dx = 2bc=—b>0
Пусть у € [—(с + 4), —(с + 2)], тогда —у € [с + 2, с + 4], —2 — у € [с, с +2] и
-2 —у с+2
J ( —1 + 6х)/(х)йх + J ( —1 + 6у)/(х)йх +
с —2—у
с+2 г
+ '
и с
-2- /* у
/ х/
Н'(/(х),у) = -
с+2
с+2
—2—у
с+2
с+2
2(1+ у)/(—2 — у)^ У /(х)^х
—2—у
2Ьл/с
11
+
л/(-2 -У)3 л/с~+2
< 0.
Так как Н(/(х), —(с +2) — 0) = 0 и Н'(/(х),у) = 0 в интервале ( — (с + 4), —(с + 2)), то Н(/(х),у) > 0 для у € [—(с + 4), —(с +2)). Пусть теперь у € [—2, 0], тогда —у € [0, 2], 2 — у € [2, с +2] и
с+2 с+2
J ( —1 + 6у)/(х)йх + J 6у/(х)йх+
-2 —у
с+2
(1 + 6х)/(х)йх + J (1 + 6у)/(х)йх
—2—у
— 2 —у с+2
2у + J х/(х)йх + ^ У /(х)^х
2—у
Н'(/(х),у) = -
с+2
2 + 2( —1 + у)/(2 — у)+ у /(х)йх
—2—у
2Ьл/с “ 3
2 Ьл/с 3 '
1+
\/(2 — у)3 Vе + 2
1-Ди 1
2>/2/ •у/(2 — у)3
> 0.
Так как Н(/(х), —с + 0) > 0 и Н'(/(х),у) > 0 в полуинтервале (—с, 0], то Н'(/(х),у) > 0 при у € (—с,0].
Окончательно заключаем, что стратегия /(х) является оптимальной.
Работа выполнена при финансовой поддержке проекта 1.8.10 АВЦП «Развитие научного потенциала высшей школы».
1
1
Список литературы
1. Mazalov V. V., Mentcher A. E., Tokareva J. S. On a discrete arbitration procedure in three points, Game Theory and Applications 11, Nova Sciense Publishers, N. Y, 2005. P. 87-91.
2. Farber H. An analysis of final-offer arbitration, Journal of conflict resolution, V. 35. 1980. P. 683-705.
3. Zeng Dao-Zhi. An amedment of final-offer arbitration, Working paper Kagawa, Kagawa University, 2006.
Рукопись поступила в редакцию 29 апреля 2011 г.