УДК 517.9 ББК 22.18
ДИСКРЕТНАЯ АРБИТРАЖНАЯ ПРОЦЕДУРА С НЕРАВНОМЕРНЫМ РАСПРЕДЕЛЕНИЕМ ВЕРОЯТНОСТЕЙ1
Менчер А.Э.2
(Забайкальский государственный гуманитарно-педагогический университет имени Н.Г. Чернышевского, Чита)
Рассматривается антагонистическая игра, связанная с арбитражной схемой Фарбера. Для случаев, когда предложения арбитра сосредоточены в трех и четырех точках с неравномерным распределением вероятностей, найдено равновесие в смешанных стратегиях.
Ключевые слова: арбитражная схема, дискретное распределение, смешанные стратегии, равновесие.
Введение
Рассмотрим бескоалиционную игру с нулевой суммой, связанную с моделью арбитражной процедуры с конечным числом предложений. Игроки Ь и М, именуемые, соответственно, как работник и работодатель, ведут переговоры об установлении заработной платы. Игрок Ь делает предложение х, а игрок М — предложение у; х и у — произвольные действительные числа.
Для достижения соглашения между игроками используется арбитражная схема Фарбера [1]. Если х ^ у, то конфликта нет и игроки соглашаются на выплату жалованья, равного
х + У ^
—-—. Если же х > у, стороны апеллируют к арбитру А. Обозначим решение арбитра через г. Тогда из предложений х и у
1 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2009. - Т. 1. № 4. - С. 78-92».
2 Александр Эммануилович Менчер, кандидат физикоматематических наук, доцент ([email protected]).
выбирается то, которое ближе к точке г. В такой игре функция выигрыша есть математическое ожидание случайной величины
Н(х, у) : Н(х, у) = £Н*(х,у), где
Гх + у .
-------, если х ^ у,
2 ’ у’
х, если х > у, |х — г\ < |у — г\,
у, если х > у, \х — г\ > \у — г\,
г, если х > у, \х — г\ = \у — г\.
Пусть —то < у ^ 0 ^ х < +то, а г - дискретная случайная величина. Если г = 0 с вероятностью, равной 1, то, очевидно, что точкой равновесия в игре является пара чистых стратегий (0, 0). В статьях [2], [3] для случаев, когда г с равной вероятностью принимает значения —1 и 1, либо — 1, 0 и 1, соответственно, найдено равновесие в смешанных стратегиях.
В настоящей работе рассматриваются ситуации, в которых предложения арбитра сосредоточены в трех и четырех точках и имеют неравномерное распределение. В обоих рассматриваемых случаях будем искать равновесие в игре среди смешанных стратегий. Обозначим через / (х) и д(у) смешанные стратегии игроков Ь и М, соответственно. Имеем:
0
/(х) ^ 0, У /(х)^х = 1; #(у) ^ 0, У 5<у)йу = 1.
0 —^
Благодаря симметрии, цена игры равна нулю, а оптимальные стратегии симметричны относительно оси ординат, то есть: й'(у) = /(—у). Следовательно, достаточно построить оптимальную стратегию только для одного из игроков, например, Ь.
1. Оптимальные стратегии при трех предложениях
Пусть арбитр выбирает одно из трех значений: —1, 0, 1, соот-
1 — р 1 — р
ветственно, с вероятностями------, р,-----. Случаи р = 1, р = 0
1
и р = — отмечены во введении.
3
Мы будем искать равновесие в игре в общем случае:
0 < р < 1.
Теорема 1. Если р е [р0, 1), где р0 - положительный корень уравнения р4+8р3+4р2+4р— 1 = 0, то для игрока Ь оптимальной я
0,
1 + р
является стратегия (
0, если 0 ^ х < с
, .__, если с<х<с + 2,
4р л/х3
0, если с + 2 ^ х < +то,
(1) / (х) =
где с =(1—р!.
2р
Доказательство. Будем искать оптимальную стратегию для
игрока Ь в следующей форме:
!0, если 0 ^ х < с,
^>(х), если с < х < с + 2,
0, если с + 2 ^ х < +то,
где функция ^>(х) положительна и непрерывно дифференцируема в интервале (с, с+2). Обозначим через Н(/(х), у) функцию выигрыша игрока М при выбранной игроком Ь стратегии / (х). Функция Н(/(х),у) непрерывна на всей полуоси (—то, 0]. Стратегия
(2) будет оптимальной, если Н(/(х), у) = 0 для у е [—(с + 2), —с] и Н(/(х), у) ^ 0 для у е (—то, —(с + 2)) и (—с, 0].
Пусть у е [—(с + 2), —с], тогда —у е [с, с + 2] и
(3) Н (/(х),у) = ^ у+
+ р
-у С+2
/*/М* + / у/М*
С -у
с+2
+ 1 - Р ^ ж/(ж)^ж.
С
Если теперь /(х) - оптимальная стратегия, то из (3) получаем
С+2
Н(/(х), —с — 0) = —1 + рс + ~—^J х/(х)^х = 0,
С
2у/(-У) ^ У /(ж)гіж
С+2
Н(/(х), —(с + 2) + 0) = —(с + 2) + 1+^У х/(х)^х = 0,
С
откуда следуют соотношения для математического ожидания стратегии / (х):
С+2
(4) [ х/(х)^х = ^^^(с + 2) = с = л/с(с + 2).
1 + р 1 — р
С
Далее, для оптимальности стратегии / (х) необходимо, чтобы Н'(/(х),у) = Н"(/(х),у) = 0 в интервале (—(с+2), —с). Имеем:
. с+2
(5) Н'(/(х),у) = 1^—Р + р
(6) Н"(/(х),у) = р(3/(—у) — 2у/-(—у)), откуда приходим к уравнению
3/(—у) — 2у/'(—у) = 0.
Положим х = —у, тогда х е (с, с + 2), /(х) = <^(х) и
3^>(х) + 2х^'(х) = 0.
Решением этого уравнения является функция
(7) р(х) = -0=.
х3
Определим константы с и а. Из (5) получаем
1 + р 2ар
0 = Я'(/, -с - 0) =
0 = Я'(/,-(с + 2) + 0) = —- Р 2аР
УСГ2 290
2
Тогда
(8)
(1 - р)2 1 + р г с =----------1------, а = —— \/с.
2 4р
Из (2), (7) и (8) следует, что /(х) имеет вид (1).
Проверим выполнение условий оптимальности.
Пусть у е [—(с + 2), —с]. Так как при построении стратегии /(х) были использованы равенства Н"(/(х),у) =0 в интервале (—(с + 2), —с), Н'(/(х), —с — 0) = 0 и Н(/(х), —с — 0) = 0, то в силу непрерывности функции Н(/(х),у) заключаем, что Н(/(х),у) = 0 при у е [—(с + 2), —с].
Исследуем теперь поведение функции Н(/ (х), у) вне отрезка [—(с + 2) —с].
Пусть у е (—то, —(с + 4)], тогда —у е [(с + 4), +то) и
С+2 2
Н(/(х), у) ^ У х/(х)^х = л/с(с + 2) = 1 2рр > 0.
С
Пусть у е [—(с + 4), —(с + 2)], тогда —у е [с + 2, с + 4], —2 — у е [с, с + 2] и
Н (/(ж),У) =
Г -2-у
1 - р
с+2
ж/(*)* + / у/(„)*,
-2-у
с+2
+ 1 + Р [ ж/(ж)^ж,
Н'(/(ж),у) =
1 - р
с+2
2(1 + У)/(-2 - у)+ I /(ж)^ж
(1 - р2)^с 4р
+
-2-у 1
л/(-2 - у)3 Vе + 2
Так как Н(/(ж),-(с + 2) - 0) =0 и Н'(/(ж),у) < 0 в интервале (-(с + 4), -(с + 2)), то Н(/(ж),у) > 0 при у є [-(с + 4), -(с + 2)].
1
Пусть у е [—с, —(с — 2)] П [—с, 0], тогда —у е [с — 2, с] П [0, с], 2 — у е [с, с + 2] П [2, с + 2] и
тип \ \ 1 + Р і 1 - Р
н(/(х) у) = —ЇТ" + —;т"
2-у с+2
/х/(х)"х + / у/(х)й"
с 2-у
ТТ>(Г( \ ^ 1+ Р I 1 - Р
н (/(х),у) = —ЇТ" + —;т"
с+2
2(-1 + у)/(2 - У)^У /(я)Жк
2-у
1 + Р + (1 - Р2 )Ус 2 4р
\/(2 - у)3 л/с + 2
Далее, так как Н(/(ж), —с + 0) = 0, а функция Н'(/(ж),у) является строго возрастающей, то, если Н'(/(ж), —с + 0) ^ 0, то
Н(/(ж), у) > 0 при у е (—с, —(с — 2)] П (—с, 0].
Имеем:
н'(/(х), -с+о)=1-+р
\/ (с + 2)3 ^С+2
Р2 + 4р - 1 (1 - р)2 р4 + 8р3 + 4р2 + 4р - 1
4р
2(1+ р)2
4р(1 + р)2
Для дальнейшего исследования заметим, что функция с =
(1 — р)2
с(р) = —--------строго убывает в интервале (0,1).
2р
Если р2 + 4р — 1 ^ 0, то р ^ \/б — 2, 0 < с ^ \/б — 1 < 2, Н'(/(ж), —с + 0) > 0 и исследование условий оптимальности окончено.
Пусть теперь р2 + 4р — 1 < 0. Рассмотрим функцию ^(р) = р4 + 8р3 + 4р2 + 4р — 1 на отрезке [0,1]. Так как ^(0) = —1 < 0, ^(1) = 16 > 0 и ^'(р) = 4р3 + 24р2 + 8р + 4 > 0, то существует единственная точка ро е (0,1) такая, что ^(р0) = 0, ^(р) < 0
при р е (0,р0) и ^(р) > 0 при р е (р0, 1).
1
1
1
1
Уточним границы для констант ро и с. В самом деле, если с ^ 2, то р < 3 — 2^2. Имеем: ^(3 — 2^2) = 1448 — 1024^2 и
—0,15468786 < 0.
Так как, очевидно, что ^(\/5—2) > 0, то р0 е (3 — 2\/2, \/5— 2) и с е (0, 2) при р е (р0,1).
Таким образом, [—с, —(с — 2)] П [—с, 0] = [—с, 0]. Легко проверить, что р0 е (1,1) С (3 —\/2, \/5—2). Окончательно заключаем, что Н(/(ж), у) > 0 для у е (—то, —(с + 2)) и (—с, 0] и теорема доказана.
2. Оптимальные стратегии при четырех предложениях
Пусть арбитр выбирает одно из четырех значений: -3, -1,
1, 3, соответственно, с вероятностями — - р, р, р, — - р. Ясно, что
0 ^ р ^ -. Случай р = - отмечен во введении, а случай р = 0 приводит к аналогичным результатам, так что мы будем искать равновесие в игре в ситуации, где 0 < р < -.
Теорема 2. Если р є ^р0, ^, где ро - положительный корень уравнения 32р5 + 16р4 + 24р3 + 8р2 - 8р + 1 = 0 из интервала ^, то для игрока Ь оптимальной является стратегия
0,
+1
(9) /(ж) =\
4рд/(ж - 1)3
0,
если 0 ^ ж < с, если с < ж < с + 2,
если с + 2 <ж<с + 4, если с + 4 ^ ж < +то,
где с = ^ЕИ - 2.
р
Доказательство. Будем искать оптимальную стратегию для
игрока Ь в следующей форме:
/
0, если 0 ^ х < с,
^>(х), если с < х < с + 2,
•0(х), если с + 2 <х<с + 4,
0, если с + 4 ^ х < +то,
ч
где функции <^(х) и ^(х) положительны и непрерывно дифференцируемы в соответствующих интервалах. Обозначим через Н(/(х),у) функцию выигрыша игрока М при выбранной игроком Ь стратегии /(х). Функция Н(/(х),у) непрерывна на всей полуоси (-то, 0]. Стратегия (10) будет оптимальной, если Н(/(х),у) = 0 для у е [-(с + 4), -с] и Н(/(х),у) ^ 0 для у е (-то, -(с + 4)) и (-с, 0]
Пусть у е [-(с + 4), -(с + 2)], тогда -у е [с + 2, с + 4],
-2 - у е [с, с + 2] и
(11)
(—2—у с+4 \
У х/(х)^х + J у/(х)^х I +
с —2—у /
с+4
1
Если теперь / (х) - оптимальная стратегия, то из (11) получаем
Н(/(х), -(с + 2) - 0) =
с+4
= -^2 - ^ (с + 2) - р(с + 2)+ 2 У х/(х)^х = 0,
С
откуда следует равенство для математического ожидания стратегии / (х):
с+4
(12) У х/(х)^х = с + 2.
Далее, для оптимальности стратегии / (х) необходимо, чтобы Н'(/(х), у) = Н"(/(х), у) =0 в интервале (-(с + 4), -(с + 2)). Имеем:
(13) Н'(/(х),у) = 2-р+Р ^2(1+у)/(-2 у) + С /(х)^х| ,
(14) Н''(/(х),у) = р(3/(-2 - у) - 2(1 + у)/'—-2 - у)), откуда приходим к уравнению
3/(-2 - у) - 2(1 + у)/'(-2 - у) = 0.
Положим х = -2 - у, тогда х е [с, с + 2], /(х) = <^(х) и
3^(х) + 2(х + 1)^'(х) = 0.
Решением этого уравнения является функция
(15) ^(х) = /( в, 1)3.
V (х + 1)3
Определим константу а. Из (13) получаем
0 = Н'(/(х),-(с + 2) - 0) = ! - 2ар
2 д/с + 1 ’
Тогда
^с + 1
(16) а = —-------.
4р
Далее, пусть у е [-(с + 2), -с], тогда -у е [с, с + 2], 2 - у е [с + 2, с + 4] и
(2—у с+4 \
У х/(х)^х + J у/(х)^х I + с 2—у /
с+4
+ (2- р) // (х)йх с
Имеем:
(18) н/(/(x), у)=2+р ^2(-1+у)/(2 - у)+У/(х)йх|,
(19) Н''(/(х), у) = р(3/(2 - у) - 2/(-1 + у)/'(2 - у)), откуда приходим к уравнению
3/(2 - у) - 2(-1 + у)/'(2 - у)) = 0.
Положим х = 2 - у, тогда х е [с + 2, с + 4], /(х) = ^(х) и
3^(х) + 2(х - 1)^'(х) = 0.
Решением этого уравнения является функция
(20) ^(х) = * .
V (х - 1)3
Определим константу *. Из (18) получаем
0 = Н'(/(х),-(с + 2) - 0) = ! - 2р*
2 \/ с + 3
тогда
(21) * = 4+! ■
4р
Найдем константу с. Имеем:
с+4 с+2 ^_______ с+4 _______
л/с +1 , [ л/с + 3
■" =ах,
4рд/(ж — 4)3 У 4рд/(ж — 1)3
с+2
откуда
с + 3 /с + 1
СП V сГз =2р
/с +1
Полагая £ = у ^, приходим к квадратному уравнению
£2+2р£ -1 = 0, положительный корень которого равен л/р2 + 1 -р. Наконец,
(22) с = Л/Р2 + 1 - 2.
р
Отметим, что функция с = с(р) строго убывает на полуоси
(0, +то). Так как по условию задачи р < -, то с(р) > с(-) =
^5 - 2 > 0. 2 2
296
Проверим выполнение условий оптимальности.
Пусть у е [—(с+4), —(с+2)]. Так как при построении стратегии /(ж) были использованы равенства Н"(/(ж), у) = 0 в интервале (—(с+4), —(с+2)), Н'(/(ж), —(с+2)—0) = 0 и Н(/(ж), —(с+ 2) — 0) = 0, то в силу непрерывности функции Н(/(ж), у) заключаем, что Н(/(ж), у) = 0 при у е [—(с + 4), —(с + 2)]. Аналогично приходим к выводу, что Н(/(ж), у) = 0 при у е [—(с + 2), —с].
Исследуем теперь поведение функции Н(/ (ж), у) вне отрезка
[—(с + 4) —с].
Пусть у е (—то, —(с + 10)], тогда —у е [с + 10, +то) и
Пусть у е [—(с + 10), —(с + 8)], тогда —у е [с + 8, с + 10],
—6 — у е [с + 2, с + 4] и
С
с+4
С
с+4
н'(/(х),у) = (2 -р) 2(3 + у)/(-6 - у)+ / /(х)йх
-6-у
и 2р ( ^(-7 - у)3 + ^С+з) < °-
1
Пусть у є [—(с + 8), —(с + 6)], тогда -у Є [с + 6, с + 8],
-6 - у Є [с, с + 2] и
Н (/(х),У) =
/ ж/(ж)<іж + / у/(ж)йж +
С -6-у
с+4
+ (2 + Р) / х/(х)^х,
С
Г с+4
Н'(/(жЫ=(2 -^ 2(3 + у)/(-6 - у)+ j /(ж)^ж
2 - р) 2р
(2р - 1) -
2устт
V(-5 - у)3
< 0.
Пусть у є [-(с + 6), -(с + 4)], тогда -у Є [с + 4, с + 6],
-2 - у є [с + 2, с + 4] и
Н (/(х),У) =
2 - р ) у + р
-2-у
У с+4
х/М* + / у/(ж)<ъ
-2-у
+
1
+ 2
с+4
ж/(ж)^ж,
с+4
Н'(/(ж),у)=^Т - ^ +р 2(1 + у)/(-2 - у)+ У /(ж)^ж ^с + 3
-2-у
< 0.
^(-3 - у)3
Так как Н(/(ж), - (с+4) -0) = 0, то функция Н(/(ж), у) > 0 на полуоси (-то, -(с + 4)).
1
Далее, пусть у є [-с, -(с-2)] П [-с, 0], тогда -у Є [с-2, с] П [0, с], 2 - у є [с, с + 2] П [2, с + 2] и
Н (/(ж),у) = 2 у + р
2-у с+4
/ ж/(ж)^ж + у/(ж)^ж
2-у
+
с+4
+ (2 - р) / ж/(ж)^ж,
Н'(/(ж),У) = 2 + Р
с+4
2(-1 + у)/(2 - у)^у /(ж)^ж
2-у
11
22
(2р - 1) +
2устт
= р + /сТТ > 0.
Если с ^ 2, то исследование окончено; при этом р є
11
_л/Ї5’ 2
Пусть теперь р є ^0, ^, тогда с > 2 и пусть у є [-(с -
2), -(с - 4)]П [-(с - 2), 0], тогда -у є [с - 4, с - 2] П [0, с - 2], 6 - у є [с + 2, с + 4)] П [6, с + 4] и
Н(/(ж),у) = ( Т+р) У +(2-Р
6-у с+4
/ж/(ж)<іж+/ у/(ж)йж
с 6-у
с+4
Н'(/(ж),У) = 2+Р+(2-р) 2(-3+у)/(6-у)^/ /(ж)йж
6-у
1 , 1,1 - 2р \/с + 3
Т+Р 4р + 2р У(5^.
Так как Н'(/(ж), у) строго возрастает в области задания, то Н'(/(ж), у) > Н'(/(ж), -(с - 2) + 0). Имеем:
Н'(/(ж),-(с - 2) + 0) = 4р2 + 4Р - 1 + 1 - 2Р
4р 2р(с + 3) ’
/2 — 1
Пусть 4р2 + 4р — 1 ^ 0, тогда р ^ ------,
С ^ С(^22—= ^^/+—/ —2 = 2^2 + 1 < 4, [—(с — 2), —(с —
4)] П [—(с — 2), 0)] = [—(с — (), 0)] и исследование окончено. Рассмотрим случай р £ [ 0, ---- ]. Решим неравенство
Имеем:
Н'(/(ж),-(с - 2) + 0) ^ 0.
т+ Р - 4р + Т-2Р (^Р2 -1 - р) ^ 0,
1 - 2р / 2 , ^ (1 - 2р)р , 1 — ^р2 + Т — - 1 - Р + 4р,
(2р(1 - 2р)^р2 + 1)2 ^ [2р2(1 - 2р) - 4р - 4р2 + 1]2
и, наконец,
-32р5 - 16р4 - 24р3 - 8р2 + 8р - 1 ^ 0.
Исследуем поведение функции ^(р) = -32р5 - 16р4 -24р3 -
^2 - 1
8р2 + 8р - 1 на отрезке
* (4-Л > 0,
0,
. Имеем: *(0) = -1 < 0,
*'(р) = -160р4 - 64р3 - 72р2 - 16р + 8, *"(р) = -640р3 - 192р2 - 144р - 16 < 0.
л/2 — 1
Следовательно, Л'(р) строго убывает на отрезке [0, —-— ] и, если Л' ^ ^ > 0, то Л'(р) > 0 на этом отрезке и функ-
ция Л(р) строго возрастает. Имеем: Л' ^^ = —152 +
108/2 и 0, 735 > 0.
Далее, из неравенства с ^ 4 следует, что р ^ ____ Найдем
у35
л ^ I: л| М = 8928—/Л!^35 < 0.
{—ад):
/35/ 352/35
Т _ 1 ^2 - ^
Тогда существует точка p0 e ,_, —-— такая, что
\ V 35 2 у
F(p0) =0, F(p) < 0 при p e ^—= ,Р^ и F(p) > 0 при
pe (po,—35
Наконец, заметим, что F ^> 0. Таким образом, p0 e
—=, 1 ) и, поскольку c < 4, то [—(c — 2), —(c — 4)] П [—(c — 35 5
2), 0] = [—(c — 2), 0] и исследование окончено.
Так как H(f(ж), —c + 0) = 0, то для p e (p0,1) функция H(f (ж),у) > 0 при y e (—c, 0]. Теорема доказана.
Литература
1. FARBER H. An analysis of final-offer arbitration // Journal of conflict resolution. - 1980. - Vol. 35. - P. 683-705.
2. MAZALOV V.V., ZABELIN A.A., KARPIN A.S. Equilibrium in arbitration game // Probabilistic Methods in Discrete Mathematics. - 2002. - P. 41-46.
3. MAZALOV V.V., MENTCHER A.E., TOKAREVA J.S. On a discrete arbitration procedure in three points// Game Theory and Applications. - 2005. - Vol. XI. - P. 87-91.
DISCRETE ARBITRATION PROCEDURE WITH NONUNIFORM DISTRIBUTION
Alexsander Mentcher, Faculty of Physics and Mathematics, Zabaikalsky State Humanitarian Pedagogical University named after N. Tchernishevsky, Chita, Cand. Sc., docent ([email protected])
Abstract: We consider a zero-sum game related to an arbitration scheme. The arbitrator’s offers are concentrated in three or four points with nonuniform distribution. The equilibrium in mixed strategies is derived.
Keywords: arbitration scheme, discrete distribution, mixed strategies, equilibrium.
Статья представлена к публикации членом редакционной коллегии А. А. Печниковым