УДК 519.7 ББК B 22.18
Александр Эммануилович Менчер
кандидат физико-математических наук, доцент, Забайкальский государственный университет (Чита, Россия) e-mail: [email protected]
Комбинированная арбитражная процедура с квадратичной функцией
выигрыша1
Рассматривается бескоалиционная игра с нулевой суммой. Игроки, работник и работодатель, ведут переговоры об установлении заработной платы. В конфликтной ситуации игроки апеллируют к арбитру. Предложения арбитра моделируются дискретной случайной величиной. В работе применены две арбитражные схемы с квадратичной функцией выигрыша. Найдено равновесие по Нэшу в игре в смешанных стратегиях.
Ключевые слова: арбитражная процедура, равновесие, смешанные стратегии.
Aleksandr Emmanuilovich Mencher
Candidate of Physics and Mathematics, Associate Professor, Zabaikalsky State University (Chita, Russia) e-mail: [email protected]
Combined Arbitration Procedure with Quadratic Payoff Function
We consider a non-cooperative zero-sum game. The players, the Labor and the Manager, negotiate an improvement in the wage rate. In a conflict situation the players appeal to the arbitrator. The arbitrator’s solution is a discrete random variable. In this paper we use two arbitration schemes with quadratic payoff function. A mixed strategy Nash equilibrium in this game is found.
Keywords: arbitraton procedure, equilibrium, mixed strategies.
1. Введение
Рассматривается бескоалиционная игра с нулевой суммой, в которой игроки L и M, именуемые, соответственно, как работник и работодатель, ведут переговоры об установлении заработной платы. Игрок L делает предложение x, а игрок M - предложение у. Предположим, что x и у выбираются из заданных множеств X и Y на числовой оси. Для удобства вычислений рассмотрим предложения без ограничений на знак. В реальных приложениях интервал значений можно сдвинуть в положительную часть числовой оси. Если x < у, то конфликта нет и игроки соглашаются на
x + у
выплату жалованья, равного —-—. Если же х > у, стороны апеллируют к арбитру А. Пусть выбор
арбитра является дискретной случайной величиной, принимающей три возможных значения: -1, 0,
1, - вероятность каждого из которых равна —. В работах [1 - 3] рассматривались две арбитажные
схемы: арбитражная схема по последнему предложению [1; 3] и арбитражная схема с наказанием [2; 3]. В арбитражной схеме по последнему предложению арбитр выбирает то предложение, которое ближе к его решению z, т.е. функция выигрыша в данной схеме имеет вид
x + у
Hz (x, у)
если x < у,
.., < .., (Ы)
2
x, если x > у, |x — z| < |у — z|,
у, если x > у, |x — z| > |у — z|,
z, если x > у, |x — z| = |у — z|.
В арбитражной схеме с наказанием арбитр определяет, чье предложение ближе к его решению, и к своему решению прибавляет (если предложение Ь ближе к его решению) или вычитает (если предложение игрока М ближе к его решению) разницу между своим решением и предложением
1 Работа выполнена в рамках Государственного задания вузу Минобрнауки РФ (проект № 8.3641.2011).
70
© Менчер А. Э., 2013
«провинившегося» игрока. Это рассматривается здесь, как наказание. Таким образом, функция выигрыша в схеме с наказанием имеет вид
х + у
---------, если х < у,
2
Н (х,у)=<|2г - У> если х > У’ |х - г1 < |У - г^ (1.2)
2г — х, если х > у, |х — г| > |у — г|,
если х > у, |х — г| = |у — г|.
Поскольку в функциях (1.1) и (1.2) решение арбитра г является случайной величиной, в качестве функции выигрыша будем рассматривать математическое ожидание от этих функций: Н(х, у) = ЕНг(х, у). В работе [3] найдено равновесие в игре в комбинированной арбитражной процедуре в смешанных стратегиях.
В настоящей работе мы используем две арбитражные процедуры с квадратичной функцией выигрыша, первая из которых - модификация арбитражной схемы по последнему предложению, а вторая - арбитражной схемы с наказанием. Именно: пусть х € [0, +го), у € (—го, 0]; арбитр с вероятностью р руководствуется процедурой с функцией выигрыша
{х2, если |х — г| < |у — г|,
—у2, если |х — г| > |у — г|, (1.3)
г, если |х — г| = |у — г|
и с вероятностью 1 — р - процедурой с функцией выигрыша
{2г + у2, если |х — г| < |у — г|,
2^ — х2, если |х — г| > |у — г|, (1.4)
^, если |х — г| = |у — г|.
Равновесие в игре будем искать среди смешанных стратегий. Обозначим через /(х) и $(у) смешанные стратегии игроков Ь и М, соответственно. Имеем:
р+то р 0
/(х) > 0, / /(х) ¿х = 1; #(у) > 0, / #(у) ¿у = 1.
«/ 0 «/ — то
Благодаря симметрии, цена игры равна нулю, а оптимальные стратегии симметричны относительно оси ординат, т. е. $(у) = /(—у). Следовательно, достаточно построить оптимальную стратегию только для одного из игроков, например, Ь. Обозначим через Н(/(х), у) функцию выигрыша игрока М при выбранной игроком Ь стратегии /(х).
2. Оптимальные стратегии 2
Теорема. Если р £ (-, 1], то для игрока Ь стратегия
{0, если 0 < х < с,
'--с, еслис<ж<с+2, (2.1)
х2
0, если с + 2 < х < +го,
г^е с = 2(3р — 2), является оптимальной.
Доказательство. Будем искать оптимальную стратегию игрока Ь в виде
0, если 0 < х < с,
/(х) = ^ у>(х), если с < х < с +2, (2.2)
0, если с +2 < х < +го,
где функция у>(х) положительна и дважды непрерывно дифференцируема в интервале (с, с +2).
Функция Н(/(х),у) непрерывна на всей отрицательной полуоси. Стратегия (2.2) будет оптимальной, если Н(/(х), у) = 0 для у € [—(с + 2), —с] и Н(/(х), у) > 0 для у € (—го, —(с + 2)) и (—с, 0].
Пусть у € [—(с + 2), —с], тогда —у € [с, с + 2] и
с+2
Н(/(х),у) = ^
р [ ! (—у2)/(х) ¿х + J х2/(х) ¿х+
\ С С
с+2 с+2 ч / с+2
+ ^ (—у2)/(х) ¿х + J х2/(х) ¿х | +(1 — р) I ^ (—2 — х2)/(х) ¿х+
—у с ' \ с
— у с+2 с+2 \
+ ^ у2/(х) ¿х + J (—х2)/(х) ¿х + J (2 + у2)/(х) ¿х I
(х) ах + у (—х )/(х
—У
Если теперь /(х) — оптимальная стратегия, то
с+2
р(—с2 — с2 + | х2/(х) ¿х)+
с
С+2
+ (1 — р)(—2 — J х2/(х) ¿х — J х2/(х) ¿х + 2 + с2)
сс с+2
(3р — 2) J х2/(х) ¿х = (3р — 1)с2;
с
с+2
0 = Я(/(ж) - (с+ 2) + 0) = ^Ь(-(с + 2)2 + 2 J x2f(x) с1х)+
с
С+2
+ (1 — р)(—2 — У х2/(х) ¿х + (с + 2)2 + 2 + (с + 2)2)].
откуда
Отсюда
С+2
(3р — 1) J х2/(х) ¿х = (3р — 2)(с +2)2.
С
Из (2.4) и (2.5) получаем
с+2
с = 2(3р — 2)^ У х2/(х) ¿х = 4(3р — 1)(3р — 2).
2
Из условия 0 < с < 2, получаем — < р < 1.
Далее, для оптимальности стратегии / (х) необходимо Н'(/(х),у) = Н
Н'"(/(х),у) = 0 в интервале ( — (с + 2), —с).
Имеем:
с+2
2
Н'{1{х),у) = -^[р(у + у21(-у) + У J ¡{х)<1х)+
—У
— У
+(1 — р)(у2/(—у) — у У /(х) ¿х — у)],
—У
(2.3)
(2.4)
(2.5)
(2.6)
7/(/(х),у) = (2.7)
н"(/(х),у) = -^[р(1 + Зу/(-у) + j ¡(х)г1х)-у2/'(-у)+
-У
-У
+(1 - р)(3у/(-у) - у2/ '(-у) - 1 ^ У /(ж) ¿ж)], (2.8)
2
Я'"(/(ж), у) = — — [4/(—у) - 5у/'(—у) + у2/"(-у))]. (2.9)
Так как Н (/(х), у) = 0, то, полагая у = —х, х € (с, с + 2), приходим к дифференциальному
уравнению
х2^//(х) + 5х^/ (х) + 4^>(х) = 0, (2.10)
известному из [4]. Его решением является функция
9£>(х) =
ж2
Найдем константу а:
2(3р-1)
7 х2 2(3р — 1)(3р — 1)’
2(3р—2)
откуда
а = 2(3р — 2)(3р — 1) = (3р — 1) • с. (2.11)
Итак, функция /(х) имеет вид (2.1).
Проверим выполнение условий оптимальности.
Пусть у € [—(с + 2), —с], тогда
С+2
р І У (-У2)-^~^“/(ж) ^ж + J(Зр - í)cdx+
V С С
с+2 ^
+ I (~у2) ^ х2 ^ &£+ I (Зр-1)с<ІХ> +
-У С
(с+2 —у
/ (-2 - * + /Г
с+2 с+2
+ У (-(Зр - 1)с) ¿ж + У (2 + у2) 1')С
¿ж
= ^[р {V + 2(3р - 2)(3р - 1)(-у - 2(3р - 2)) + у22(3р - 2)+
+2(3р — 2)(3р — 1)у + 4(3р — 1)(3р — 2)} +
+ (1 — р) {—2 — 4(3р — 2)(3р — 1) + 2(3р — 2)(3р — 1)у + 2(3р — 1)у2 —
—2(3р — 2)(3р — 1)2(3р — 1) — 2(3р — 2)(3р — 1)у + 2 + у2}] = 0. (2.12)
Пусть у € (—го, —(с + 4)], тогда
с+2 с+2
22
Н(/(ж),у)= р У ж2/(ж) ¿ж + (1 - р) у у2/(ж) ¿ж =
4р(3р - 2)(3р - 1) + (1 - р)у2. (2.13)
У
Пусть у € [—(с + 4), —(с + 2)], тогда —2 — у € [с, с +2]
и
—2 —у с+2 с+2
р\ I х2/(х) ¿х — у2 У / (х) ¿х + 2 У х2/(х) ¿х+
—2—У
-2 —у с+2 с+2
(х) йх + I (—2 — х2)/(х)л™ 1 ' ",2‘
+(1 — р) < У (—2 + у2)/(х) ¿х + У (—2 — х2)/(х) ¿х + I у2/(х) ¿х+
— 2—У
с+2 "
+ / (2 + у2)/(х) ¿х
(2.14)
Далее,
я(/(х), -(с + 2) - 0) = 1 [{-(с + 2)2 + 8(3р - 2)(3р - 1)}+
+ (1 — р){—4(3р — 2)(3р — 1) + 2(с + 2)2} ] =
4
= -(Зр - 1) [2р(3р - 2) -р(3р - 1) + 2(1 -р)(3р - 1)— (1 — р)(3р — 2)]=0, (2.15)
#'(/(*), у) = 1 [р {-(2 + у)2/(—2 - у) - у2/(—2 - у)-
-+2 1 ( —2—
—2у / / (х) ¿х+ (1 — р) < (—у2/(—2 — у) + 2у / / (х) ¿х—
— 2 — у ] I с
— (2 + у)2/(—2 — у) + 4у}] =
2
3
4(3р — 2)(3р — 1)
У ~
(у + 2)2 ] <2Лв»
Так как Н/(/(х), у) < 0 в интервале ( — (с + 4), —(с + 2)) и Н(/(х), —(с + 2) — 0) =0, то функция
Н(/(х), у) на отрезке [—(с + 4), —(с + 2)] строго убывает от 4р(3р — 2)(3р — 1) + (1 — р)у2 до 0.
Пусть, наконец, у € [—с, 0], тогда —у € [0, с],2 — у € [2, с +2] и
-—У -+2
р{—2у2 + У х2/(х) ¿х} — у2 У /(х) ¿х} +
2—У
- —У -+2
+ (1 — р) {У у2/(х) ¿х — У х2/(х) ¿х — 8(3р — 2)(3р — 1)}
Далее,
2—У
1
(2.17)
#(/(*), -с + 0) = - [р{—2с2 + 4(3р - 2)(3р - 1)}+
(1 — р){с2 — 8(3р — 2)(3р — 1)} =
4
= -(3р - 2) [~2р{Ър - 2)+р{?>р - 1)+
+(1 — р)(3р — 2) — 2(1 — р)(3р — 1)] =0, (2.18)
2 -+2
Д"(/(ж), — 0) = —[р У ж2/(ж) <1х + (1 — р){— У ж2/(ж) ¿х—
-8(3р - 2)(3р - 1)}] = ^ |>(3р - 2)(3р - 1) - 4(3р - 2)2(3р - 1)-
-8(1 - p)(3p - 2)(3p - 1)] = 0.
(2.19)
Найдем И'(/ (ж), у) и И''(/(ж),у). Имеем:
с+2
р{-4у - (2 - у)2/(2 - у) - у2/(2 - у) - 2у J /(ж) dx}+
2-y
2-y
+(1 - p){2^ У /(ж) dx - у2/(-2 - у) - (2 - у)2/(2 - у)}
у +
4(3p - 2)(3p - 1
1
(у - 2)2 8(3р - 2)(3р - 1 (^2?
(2.20)
< 0.
Таким образом, И(/(ж), -с + 0) = И(/(ж), -0) = 0, функция И(/(ж), у) - выпуклая вверх на интервале (-с,0) и, следовательно, положительна. Теорема доказана.
Список литературы
1. Farber H. An Analysis of Final-Offer Arbitration // Journal of Conflict Resolution.
1980. Vol. 35. P. 683-705.
2. Zeng Dao-Zhi. An Amendment to Final offer Arbitratoin // Working Paper, Kagawa:Kagawa University, 2006.
3. Mazalov V. V., Mencher A. E., Tokareva J. S. On the Equilibrium in Bargaining Model with Arbitrator // Journal of Computer and Systems Science International, 2009. Vol. 48., №
5. P. 739-745.
4. Менчер А. Э. Об одной арбитражной схеме с тремя предложениями //Математический анализ и его приложения. 2011. Вып. 10. С. 34-40.
References
1. Farber H. An Analysis of Final-Offer Arbitration // Journal of Nonflict Resolution. 1980. Vol. 35. P. 683-705.
2. Zeng Dao-Zhi. An Amendment to Final offer Arbitratoin // Working Paper, Kagawa:Kagawa University, 2006.
3. Mazalov V. V., Mencher A. E., Tokareva J. S. On the Equilibrium in Bargaining Model with Arbitrator// Journal of Computer and Systems Science International, 2009. Vol. 48. № 5. P. 739-745.
4. Mencher A. E. Ob odnoy arbirtrazhnoy skheme s tremya predlozheniyami // Matematichesky analiz i ego prilozheniya. 2011. Vyp. 10. S. 34-40.
Статья поступила в редакцию 20.05.2013