Научная статья на тему 'Дискретная арбитражная процедура с неравномерным распределением вероятностей'

Дискретная арбитражная процедура с неравномерным распределением вероятностей Текст научной статьи по специальности «Математика»

CC BY
129
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АРБИТРАЖНАЯ СХЕМА / ДИСКРЕТНОЕ РАСПРЕДЕЛЕНИЕ / СМЕШАННЫЕ СТРАТЕГИИ / РАВНОВЕСИЕ / ARBITRATION SCHEME / DISCRETE DISTRIBUTION / MIXED STRATEGIES / EQUILIBRIUM
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Дискретная арбитражная процедура с неравномерным распределением вероятностей»

УДК 517.9 ББК 22.18

ДИСКРЕТНАЯ АРБИТРАЖНАЯ ПРОЦЕДУРА С НЕРАВНОМЕРНЫМ РАСПРЕДЕЛЕНИЕМ ВЕРОЯТНОСТЕЙ1

Менчер А.Э.2

(Забайкальский государственный гуманитарно-педагогический университет имени Н.Г. Чернышевского, Чита)

Рассматривается антагонистическая игра, связанная с арбитражной схемой Фарбера. Для случаев, когда предложения арбитра сосредоточены в трех и четырех точках с неравномерным распределением вероятностей, найдено равновесие в смешанных стратегиях.

Ключевые слова: арбитражная схема, дискретное распределение, смешанные стратегии, равновесие.

Введение

Рассмотрим бескоалиционную игру с нулевой суммой, связанную с моделью арбитражной процедуры с конечным числом предложений. Игроки Ь и М, именуемые, соответственно, как работник и работодатель, ведут переговоры об установлении заработной платы. Игрок Ь делает предложение х, а игрок М — предложение у; х и у — произвольные действительные числа.

Для достижения соглашения между игроками используется арбитражная схема Фарбера [1]. Если х ^ у, то конфликта нет и игроки соглашаются на выплату жалованья, равного

х + У ^

—-—. Если же х > у, стороны апеллируют к арбитру А. Обозначим решение арбитра через г. Тогда из предложений х и у

1 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2009. - Т. 1. № 4. - С. 78-92».

2 Александр Эммануилович Менчер, кандидат физикоматематических наук, доцент ([email protected]).

выбирается то, которое ближе к точке г. В такой игре функция выигрыша есть математическое ожидание случайной величины

Н(х, у) : Н(х, у) = £Н*(х,у), где

Гх + у .

-------, если х ^ у,

2 ’ у’

х, если х > у, |х — г\ < |у — г\,

у, если х > у, \х — г\ > \у — г\,

г, если х > у, \х — г\ = \у — г\.

Пусть —то < у ^ 0 ^ х < +то, а г - дискретная случайная величина. Если г = 0 с вероятностью, равной 1, то, очевидно, что точкой равновесия в игре является пара чистых стратегий (0, 0). В статьях [2], [3] для случаев, когда г с равной вероятностью принимает значения —1 и 1, либо — 1, 0 и 1, соответственно, найдено равновесие в смешанных стратегиях.

В настоящей работе рассматриваются ситуации, в которых предложения арбитра сосредоточены в трех и четырех точках и имеют неравномерное распределение. В обоих рассматриваемых случаях будем искать равновесие в игре среди смешанных стратегий. Обозначим через / (х) и д(у) смешанные стратегии игроков Ь и М, соответственно. Имеем:

0

/(х) ^ 0, У /(х)^х = 1; #(у) ^ 0, У 5<у)йу = 1.

0 —^

Благодаря симметрии, цена игры равна нулю, а оптимальные стратегии симметричны относительно оси ординат, то есть: й'(у) = /(—у). Следовательно, достаточно построить оптимальную стратегию только для одного из игроков, например, Ь.

1. Оптимальные стратегии при трех предложениях

Пусть арбитр выбирает одно из трех значений: —1, 0, 1, соот-

1 — р 1 — р

ветственно, с вероятностями------, р,-----. Случаи р = 1, р = 0

1

и р = — отмечены во введении.

3

Мы будем искать равновесие в игре в общем случае:

0 < р < 1.

Теорема 1. Если р е [р0, 1), где р0 - положительный корень уравнения р4+8р3+4р2+4р— 1 = 0, то для игрока Ь оптимальной я

0,

1 + р

является стратегия (

0, если 0 ^ х < с

, .__, если с<х<с + 2,

4р л/х3

0, если с + 2 ^ х < +то,

(1) / (х) =

где с =(1—р!.

Доказательство. Будем искать оптимальную стратегию для

игрока Ь в следующей форме:

!0, если 0 ^ х < с,

^>(х), если с < х < с + 2,

0, если с + 2 ^ х < +то,

где функция ^>(х) положительна и непрерывно дифференцируема в интервале (с, с+2). Обозначим через Н(/(х), у) функцию выигрыша игрока М при выбранной игроком Ь стратегии / (х). Функция Н(/(х),у) непрерывна на всей полуоси (—то, 0]. Стратегия

(2) будет оптимальной, если Н(/(х), у) = 0 для у е [—(с + 2), —с] и Н(/(х), у) ^ 0 для у е (—то, —(с + 2)) и (—с, 0].

Пусть у е [—(с + 2), —с], тогда —у е [с, с + 2] и

(3) Н (/(х),у) = ^ у+

+ р

-у С+2

/*/М* + / у/М*

С -у

с+2

+ 1 - Р ^ ж/(ж)^ж.

С

Если теперь /(х) - оптимальная стратегия, то из (3) получаем

С+2

Н(/(х), —с — 0) = —1 + рс + ~—^J х/(х)^х = 0,

С

2у/(-У) ^ У /(ж)гіж

С+2

Н(/(х), —(с + 2) + 0) = —(с + 2) + 1+^У х/(х)^х = 0,

С

откуда следуют соотношения для математического ожидания стратегии / (х):

С+2

(4) [ х/(х)^х = ^^^(с + 2) = с = л/с(с + 2).

1 + р 1 — р

С

Далее, для оптимальности стратегии / (х) необходимо, чтобы Н'(/(х),у) = Н"(/(х),у) = 0 в интервале (—(с+2), —с). Имеем:

. с+2

(5) Н'(/(х),у) = 1^—Р + р

(6) Н"(/(х),у) = р(3/(—у) — 2у/-(—у)), откуда приходим к уравнению

3/(—у) — 2у/'(—у) = 0.

Положим х = —у, тогда х е (с, с + 2), /(х) = <^(х) и

3^>(х) + 2х^'(х) = 0.

Решением этого уравнения является функция

(7) р(х) = -0=.

х3

Определим константы с и а. Из (5) получаем

1 + р 2ар

0 = Я'(/, -с - 0) =

0 = Я'(/,-(с + 2) + 0) = —- Р 2аР

УСГ2 290

2

Тогда

(8)

(1 - р)2 1 + р г с =----------1------, а = —— \/с.

2 4р

Из (2), (7) и (8) следует, что /(х) имеет вид (1).

Проверим выполнение условий оптимальности.

Пусть у е [—(с + 2), —с]. Так как при построении стратегии /(х) были использованы равенства Н"(/(х),у) =0 в интервале (—(с + 2), —с), Н'(/(х), —с — 0) = 0 и Н(/(х), —с — 0) = 0, то в силу непрерывности функции Н(/(х),у) заключаем, что Н(/(х),у) = 0 при у е [—(с + 2), —с].

Исследуем теперь поведение функции Н(/ (х), у) вне отрезка [—(с + 2) —с].

Пусть у е (—то, —(с + 4)], тогда —у е [(с + 4), +то) и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

С+2 2

Н(/(х), у) ^ У х/(х)^х = л/с(с + 2) = 1 2рр > 0.

С

Пусть у е [—(с + 4), —(с + 2)], тогда —у е [с + 2, с + 4], —2 — у е [с, с + 2] и

Н (/(ж),У) =

Г -2-у

1 - р

с+2

ж/(*)* + / у/(„)*,

-2-у

с+2

+ 1 + Р [ ж/(ж)^ж,

Н'(/(ж),у) =

1 - р

с+2

2(1 + У)/(-2 - у)+ I /(ж)^ж

(1 - р2)^с 4р

+

-2-у 1

л/(-2 - у)3 Vе + 2

Так как Н(/(ж),-(с + 2) - 0) =0 и Н'(/(ж),у) < 0 в интервале (-(с + 4), -(с + 2)), то Н(/(ж),у) > 0 при у є [-(с + 4), -(с + 2)].

1

Пусть у е [—с, —(с — 2)] П [—с, 0], тогда —у е [с — 2, с] П [0, с], 2 — у е [с, с + 2] П [2, с + 2] и

тип \ \ 1 + Р і 1 - Р

н(/(х) у) = —ЇТ" + —;т"

2-у с+2

/х/(х)"х + / у/(х)й"

с 2-у

ТТ>(Г( \ ^ 1+ Р I 1 - Р

н (/(х),у) = —ЇТ" + —;т"

с+2

2(-1 + у)/(2 - У)^У /(я)Жк

2-у

1 + Р + (1 - Р2 )Ус 2 4р

\/(2 - у)3 л/с + 2

Далее, так как Н(/(ж), —с + 0) = 0, а функция Н'(/(ж),у) является строго возрастающей, то, если Н'(/(ж), —с + 0) ^ 0, то

Н(/(ж), у) > 0 при у е (—с, —(с — 2)] П (—с, 0].

Имеем:

н'(/(х), -с+о)=1-+р

\/ (с + 2)3 ^С+2

Р2 + 4р - 1 (1 - р)2 р4 + 8р3 + 4р2 + 4р - 1

2(1+ р)2

4р(1 + р)2

Для дальнейшего исследования заметим, что функция с =

(1 — р)2

с(р) = —--------строго убывает в интервале (0,1).

Если р2 + 4р — 1 ^ 0, то р ^ \/б — 2, 0 < с ^ \/б — 1 < 2, Н'(/(ж), —с + 0) > 0 и исследование условий оптимальности окончено.

Пусть теперь р2 + 4р — 1 < 0. Рассмотрим функцию ^(р) = р4 + 8р3 + 4р2 + 4р — 1 на отрезке [0,1]. Так как ^(0) = —1 < 0, ^(1) = 16 > 0 и ^'(р) = 4р3 + 24р2 + 8р + 4 > 0, то существует единственная точка ро е (0,1) такая, что ^(р0) = 0, ^(р) < 0

при р е (0,р0) и ^(р) > 0 при р е (р0, 1).

1

1

1

1

Уточним границы для констант ро и с. В самом деле, если с ^ 2, то р < 3 — 2^2. Имеем: ^(3 — 2^2) = 1448 — 1024^2 и

—0,15468786 < 0.

Так как, очевидно, что ^(\/5—2) > 0, то р0 е (3 — 2\/2, \/5— 2) и с е (0, 2) при р е (р0,1).

Таким образом, [—с, —(с — 2)] П [—с, 0] = [—с, 0]. Легко проверить, что р0 е (1,1) С (3 —\/2, \/5—2). Окончательно заключаем, что Н(/(ж), у) > 0 для у е (—то, —(с + 2)) и (—с, 0] и теорема доказана.

2. Оптимальные стратегии при четырех предложениях

Пусть арбитр выбирает одно из четырех значений: -3, -1,

1, 3, соответственно, с вероятностями — - р, р, р, — - р. Ясно, что

0 ^ р ^ -. Случай р = - отмечен во введении, а случай р = 0 приводит к аналогичным результатам, так что мы будем искать равновесие в игре в ситуации, где 0 < р < -.

Теорема 2. Если р є ^р0, ^, где ро - положительный корень уравнения 32р5 + 16р4 + 24р3 + 8р2 - 8р + 1 = 0 из интервала ^, то для игрока Ь оптимальной является стратегия

0,

+1

(9) /(ж) =\

4рд/(ж - 1)3

0,

если 0 ^ ж < с, если с < ж < с + 2,

если с + 2 <ж<с + 4, если с + 4 ^ ж < +то,

где с = ^ЕИ - 2.

р

Доказательство. Будем искать оптимальную стратегию для

игрока Ь в следующей форме:

/

0, если 0 ^ х < с,

^>(х), если с < х < с + 2,

•0(х), если с + 2 <х<с + 4,

0, если с + 4 ^ х < +то,

ч

где функции <^(х) и ^(х) положительны и непрерывно дифференцируемы в соответствующих интервалах. Обозначим через Н(/(х),у) функцию выигрыша игрока М при выбранной игроком Ь стратегии /(х). Функция Н(/(х),у) непрерывна на всей полуоси (-то, 0]. Стратегия (10) будет оптимальной, если Н(/(х),у) = 0 для у е [-(с + 4), -с] и Н(/(х),у) ^ 0 для у е (-то, -(с + 4)) и (-с, 0]

Пусть у е [-(с + 4), -(с + 2)], тогда -у е [с + 2, с + 4],

-2 - у е [с, с + 2] и

(11)

(—2—у с+4 \

У х/(х)^х + J у/(х)^х I +

с —2—у /

с+4

1

Если теперь / (х) - оптимальная стратегия, то из (11) получаем

Н(/(х), -(с + 2) - 0) =

с+4

= -^2 - ^ (с + 2) - р(с + 2)+ 2 У х/(х)^х = 0,

С

откуда следует равенство для математического ожидания стратегии / (х):

с+4

(12) У х/(х)^х = с + 2.

Далее, для оптимальности стратегии / (х) необходимо, чтобы Н'(/(х), у) = Н"(/(х), у) =0 в интервале (-(с + 4), -(с + 2)). Имеем:

(13) Н'(/(х),у) = 2-р+Р ^2(1+у)/(-2 у) + С /(х)^х| ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(14) Н''(/(х),у) = р(3/(-2 - у) - 2(1 + у)/'—-2 - у)), откуда приходим к уравнению

3/(-2 - у) - 2(1 + у)/'(-2 - у) = 0.

Положим х = -2 - у, тогда х е [с, с + 2], /(х) = <^(х) и

3^(х) + 2(х + 1)^'(х) = 0.

Решением этого уравнения является функция

(15) ^(х) = /( в, 1)3.

V (х + 1)3

Определим константу а. Из (13) получаем

0 = Н'(/(х),-(с + 2) - 0) = ! - 2ар

2 д/с + 1 ’

Тогда

^с + 1

(16) а = —-------.

Далее, пусть у е [-(с + 2), -с], тогда -у е [с, с + 2], 2 - у е [с + 2, с + 4] и

(2—у с+4 \

У х/(х)^х + J у/(х)^х I + с 2—у /

с+4

+ (2- р) // (х)йх с

Имеем:

(18) н/(/(x), у)=2+р ^2(-1+у)/(2 - у)+У/(х)йх|,

(19) Н''(/(х), у) = р(3/(2 - у) - 2/(-1 + у)/'(2 - у)), откуда приходим к уравнению

3/(2 - у) - 2(-1 + у)/'(2 - у)) = 0.

Положим х = 2 - у, тогда х е [с + 2, с + 4], /(х) = ^(х) и

3^(х) + 2(х - 1)^'(х) = 0.

Решением этого уравнения является функция

(20) ^(х) = * .

V (х - 1)3

Определим константу *. Из (18) получаем

0 = Н'(/(х),-(с + 2) - 0) = ! - 2р*

2 \/ с + 3

тогда

(21) * = 4+! ■

Найдем константу с. Имеем:

с+4 с+2 ^_______ с+4 _______

л/с +1 , [ л/с + 3

■" =ах,

4рд/(ж — 4)3 У 4рд/(ж — 1)3

с+2

откуда

с + 3 /с + 1

СП V сГз =2р

/с +1

Полагая £ = у ^, приходим к квадратному уравнению

£2+2р£ -1 = 0, положительный корень которого равен л/р2 + 1 -р. Наконец,

(22) с = Л/Р2 + 1 - 2.

р

Отметим, что функция с = с(р) строго убывает на полуоси

(0, +то). Так как по условию задачи р < -, то с(р) > с(-) =

^5 - 2 > 0. 2 2

296

Проверим выполнение условий оптимальности.

Пусть у е [—(с+4), —(с+2)]. Так как при построении стратегии /(ж) были использованы равенства Н"(/(ж), у) = 0 в интервале (—(с+4), —(с+2)), Н'(/(ж), —(с+2)—0) = 0 и Н(/(ж), —(с+ 2) — 0) = 0, то в силу непрерывности функции Н(/(ж), у) заключаем, что Н(/(ж), у) = 0 при у е [—(с + 4), —(с + 2)]. Аналогично приходим к выводу, что Н(/(ж), у) = 0 при у е [—(с + 2), —с].

Исследуем теперь поведение функции Н(/ (ж), у) вне отрезка

[—(с + 4) —с].

Пусть у е (—то, —(с + 10)], тогда —у е [с + 10, +то) и

Пусть у е [—(с + 10), —(с + 8)], тогда —у е [с + 8, с + 10],

—6 — у е [с + 2, с + 4] и

С

с+4

С

с+4

н'(/(х),у) = (2 -р) 2(3 + у)/(-6 - у)+ / /(х)йх

-6-у

и 2р ( ^(-7 - у)3 + ^С+з) < °-

1

Пусть у є [—(с + 8), —(с + 6)], тогда -у Є [с + 6, с + 8],

-6 - у Є [с, с + 2] и

Н (/(х),У) =

/ ж/(ж)<іж + / у/(ж)йж +

С -6-у

с+4

+ (2 + Р) / х/(х)^х,

С

Г с+4

Н'(/(жЫ=(2 -^ 2(3 + у)/(-6 - у)+ j /(ж)^ж

2 - р) 2р

(2р - 1) -

2устт

V(-5 - у)3

< 0.

Пусть у є [-(с + 6), -(с + 4)], тогда -у Є [с + 4, с + 6],

-2 - у є [с + 2, с + 4] и

Н (/(х),У) =

2 - р ) у + р

-2-у

У с+4

х/М* + / у/(ж)<ъ

-2-у

+

1

+ 2

с+4

ж/(ж)^ж,

с+4

Н'(/(ж),у)=^Т - ^ +р 2(1 + у)/(-2 - у)+ У /(ж)^ж ^с + 3

-2-у

< 0.

^(-3 - у)3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Так как Н(/(ж), - (с+4) -0) = 0, то функция Н(/(ж), у) > 0 на полуоси (-то, -(с + 4)).

1

Далее, пусть у є [-с, -(с-2)] П [-с, 0], тогда -у Є [с-2, с] П [0, с], 2 - у є [с, с + 2] П [2, с + 2] и

Н (/(ж),у) = 2 у + р

2-у с+4

/ ж/(ж)^ж + у/(ж)^ж

2-у

+

с+4

+ (2 - р) / ж/(ж)^ж,

Н'(/(ж),У) = 2 + Р

с+4

2(-1 + у)/(2 - у)^у /(ж)^ж

2-у

11

22

(2р - 1) +

2устт

= р + /сТТ > 0.

Если с ^ 2, то исследование окончено; при этом р є

11

_л/Ї5’ 2

Пусть теперь р є ^0, ^, тогда с > 2 и пусть у є [-(с -

2), -(с - 4)]П [-(с - 2), 0], тогда -у є [с - 4, с - 2] П [0, с - 2], 6 - у є [с + 2, с + 4)] П [6, с + 4] и

Н(/(ж),у) = ( Т+р) У +(2-Р

6-у с+4

/ж/(ж)<іж+/ у/(ж)йж

с 6-у

с+4

Н'(/(ж),У) = 2+Р+(2-р) 2(-3+у)/(6-у)^/ /(ж)йж

6-у

1 , 1,1 - 2р \/с + 3

Т+Р 4р + 2р У(5^.

Так как Н'(/(ж), у) строго возрастает в области задания, то Н'(/(ж), у) > Н'(/(ж), -(с - 2) + 0). Имеем:

Н'(/(ж),-(с - 2) + 0) = 4р2 + 4Р - 1 + 1 - 2Р

4р 2р(с + 3) ’

/2 — 1

Пусть 4р2 + 4р — 1 ^ 0, тогда р ^ ------,

С ^ С(^22—= ^^/+—/ —2 = 2^2 + 1 < 4, [—(с — 2), —(с —

4)] П [—(с — 2), 0)] = [—(с — (), 0)] и исследование окончено. Рассмотрим случай р £ [ 0, ---- ]. Решим неравенство

Имеем:

Н'(/(ж),-(с - 2) + 0) ^ 0.

т+ Р - 4р + Т-2Р (^Р2 -1 - р) ^ 0,

1 - 2р / 2 , ^ (1 - 2р)р , 1 — ^р2 + Т — - 1 - Р + 4р,

(2р(1 - 2р)^р2 + 1)2 ^ [2р2(1 - 2р) - 4р - 4р2 + 1]2

и, наконец,

-32р5 - 16р4 - 24р3 - 8р2 + 8р - 1 ^ 0.

Исследуем поведение функции ^(р) = -32р5 - 16р4 -24р3 -

^2 - 1

8р2 + 8р - 1 на отрезке

* (4-Л > 0,

0,

. Имеем: *(0) = -1 < 0,

*'(р) = -160р4 - 64р3 - 72р2 - 16р + 8, *"(р) = -640р3 - 192р2 - 144р - 16 < 0.

л/2 — 1

Следовательно, Л'(р) строго убывает на отрезке [0, —-— ] и, если Л' ^ ^ > 0, то Л'(р) > 0 на этом отрезке и функ-

ция Л(р) строго возрастает. Имеем: Л' ^^ = —152 +

108/2 и 0, 735 > 0.

Далее, из неравенства с ^ 4 следует, что р ^ ____ Найдем

у35

л ^ I: л| М = 8928—/Л!^35 < 0.

{—ад):

/35/ 352/35

Т _ 1 ^2 - ^

Тогда существует точка p0 e ,_, —-— такая, что

\ V 35 2 у

F(p0) =0, F(p) < 0 при p e ^—= ,Р^ и F(p) > 0 при

pe (po,—35

Наконец, заметим, что F ^> 0. Таким образом, p0 e

—=, 1 ) и, поскольку c < 4, то [—(c — 2), —(c — 4)] П [—(c — 35 5

2), 0] = [—(c — 2), 0] и исследование окончено.

Так как H(f(ж), —c + 0) = 0, то для p e (p0,1) функция H(f (ж),у) > 0 при y e (—c, 0]. Теорема доказана.

Литература

1. FARBER H. An analysis of final-offer arbitration // Journal of conflict resolution. - 1980. - Vol. 35. - P. 683-705.

2. MAZALOV V.V., ZABELIN A.A., KARPIN A.S. Equilibrium in arbitration game // Probabilistic Methods in Discrete Mathematics. - 2002. - P. 41-46.

3. MAZALOV V.V., MENTCHER A.E., TOKAREVA J.S. On a discrete arbitration procedure in three points// Game Theory and Applications. - 2005. - Vol. XI. - P. 87-91.

DISCRETE ARBITRATION PROCEDURE WITH NONUNIFORM DISTRIBUTION

Alexsander Mentcher, Faculty of Physics and Mathematics, Zabaikalsky State Humanitarian Pedagogical University named after N. Tchernishevsky, Chita, Cand. Sc., docent ([email protected])

Abstract: We consider a zero-sum game related to an arbitration scheme. The arbitrator’s offers are concentrated in three or four points with nonuniform distribution. The equilibrium in mixed strategies is derived.

Keywords: arbitration scheme, discrete distribution, mixed strategies, equilibrium.

Статья представлена к публикации членом редакционной коллегии А. А. Печниковым

i Надоели баннеры? Вы всегда можете отключить рекламу.