УДК 518.9 + 517.9 ББК 65.050.2
СТОХАСТИЧЕСКАЯ МОДЕЛЬ УСТОЙЧИВОГО СОВМЕСТНОГО ПРЕДПРИЯТИЯ 1
Зенкевич Н. А. 2
(Высшая школа менеджмента, Санкт-Петербургский государственный университет, Санкт-Петербург ) Колабутин Н. В. 3
(Факультет прикладной математики - процессов управления, Санкт-Петербургский государственный университет, Санкт-Петербург )
Янг Д. В. К. 4
(Центр теории игр, Гонконгский Баптистский университет,
Гонконг )
Исследована модель динамической кооперации при создании совместного предприятия. Получено теоретическое решение задачи и проведено количественное моделирование на основе разработанного математического обеспечения как для случая детерминированной, так и стохастической динамики. Влияние случайных процессов на развитие компаний в совместном предприятии описано с помощью многомерного стохастического процесса Ито. В результате количественного моделирования получено, что при одинаковых значениях параметров и начальных данных ожидаемая прибыль определяется с помощью динамического вектора Шепли, который является устойчивым решением кооперативной игры. При различных значениях параметров устойчивость
1 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2009. - Т. 1. №1».
2 Николай Анатольевич Зенкевич, кандидат физико-математических наук, доцент ([email protected]).
3 Николай Валерьевич Колабутин, аспирант ([email protected]).
4 Дэвид Янг, доктор физико-математических наук, профессор ([email protected]).
вектора Шепли нарушается, и наблюдается непрерывное перераспределение совместной прибыли. В этом случае строится новое решение на основе процедуры распределения дележа, обладающее требуемыми свойствами устойчивости.
Ключевые слова: дифференциальная стохастическая игра, кооперативное решение, временная и позиционная состоятельность кооперативных соглашений, процедура распределения выигрыша (ПРВ), процедура распределения дележа (ПРД), позиционно состоятельный вектор Шепли, устойчивое совместное предприятие.
Введение
Кооперация представляет собой одну из основных форм поведения в бизнесе, при этом по многим практическим причинам важно, чтобы долгосрочная кооперация была устойчивой на всем временном промежутке ее реализации, при этом устойчивость понимается в первую очередь как динамическая устойчивость или состоятельность во времени кооперативных соглашений. Это свойство кооперативного соглашения означает, что в каждой подыгре с начальными условиями на оптимальной кооперативной траектории выигрыши игроков соответствуют тем принципам выбора, согласно которым был определен оптимальный дележ во всей игре.
Динамическая устойчивость (временная состоятельность) принципов оптимальности в дифференциальных играх подробно исследовалась в работах специалистов по теории игр. А.Ори [5] заметил временную несостоятельность арбитражной схемы Нэша при ее использовании в качестве принципа оптимальности в дифференциальной игре. Л.А. Петросян [1] математически формализовал понятие динамической устойчивости (временной состоятельности). Несколько позже временную несостоятельность долгосрочных планов обнаружили при решении одной специальной задачи Ф. Кидланд и Е. Прескотт [6], получившие Нобелевскую премию в области экономики в 2004 г. Впервые в журнальной ли-
236
тературе термин динамическая устойчивость появился в работе С.В. Чистякова [3]. Этим же автором практически одновременно с Л.А. Петросяном, сформулирована проблема сильной динамической устойчивости [4]. Л.А.Петросян и Н.Н.Данилов [2] ввели «понятие процедуры распределения дележа» для кооперативных решений. В работе [14] исследовано кооперативное равновесие в дифференциальных играх, в котором система угроз обеспечивает развитие игры по кооперативному пути. Л.А.Петросян со своими учениками провел подробный анализ динамической устойчивости в кооперативных дифференциальных играх и предложил метод регуляризации для построения динамически устойчивых (состоятельных во времени) решений [8, 9, 11]. Подробный анализ проблемы динамической устойчивости и связанных с ней прикладных проблемах см. в [12]. В работе [15] впервые исследованы проблемы динамической устойчивости для дифференциальных игр со стохастической динамикой, которые в дальнейшем систематически изложены в книге [16].
В данной работе рассмотрена стохастическая модель совместного предприятия, образованного тремя фирмами с целью максимизации прибыли за счет взаимной передачи технологий. Предполагается, что образование совместного предприятия является результатом долгосрочного кооперативного соглашения. Несмотря на то, что формально данная модель не вкладывается в рамки класса игр, исследованных в [4], проведенное численное моделирование показывает, что все три свойства устойчивости выполняются, если в качестве принципа оптимальности выбран динамический вектор Шепли [12, 18].
Изложение результатов проведенного исследования начнем с рассмотрения обобщенного винеровского процесса, определяющего динамику конфликтно-управляемого процесса.
1. Обобщенный винеровский процесс
Известно, что переменные, которые с течением времени меняют свое значение случайным образом, следуют стохастическому процессу. Стохастические процессы могут рассматриваться с
237
дискретным и непрерывным временем. Рассмотрим сначала случай непрерывного времени [2].
Обобщенный винеровский процесс может быть представлен в виде:
(1) ¿х = аЛЬ + Ьйг,
где а и Ь - константы, а величина ¿г равна: ¿г = в\[дИ, в - случайная величина, подчиняющаяся закону стандартного нормального распределения.
Первое слагаемое а(И в правой части уравнения (1) предполагает, что средний ожидаемый темп роста величины х в единицу времени есть а. Без второго слагаемого в правой части, процесс
(1) имеет вид (Iх = аМ или х = хо + аЬ, где хо - значение состояния процесса х при Ь = 0 и является детерминированным. Второе слагаемое Ь(1г в правой части (1) имеет смысл шума в развитии данного процесса. Эта неопределенность описывается винеровским процессом и характеризуется параметром Ь.
На малых промежутках времени АЬ изменение значений х и Ах может быть записано:
(2) Ах = аАЬ + Ьв^АЬ,
где в - случайная величина, подчиняющаяся закону стандартного нормального распределения. Уравнение (2) описывает обобщенный винеровский процесс при дискретном времени.
Дальнейшее развитие идеи винеровского процесса приводит к процессу Ито, в котором коэффициенты а и Ь являются функциями состояния х и времени Ь:
(3) ¿х = а(х,Ь)йЬ + Ь(х,Ь)йг.
В дискретном случае процесс Ито, может быть представлен следующим образом:
(4) Ах = а(х,Ь)АЬ + Ь(х,Ь)в^~АЬ.
В приведенной ниже модели будет применяться уравнение (3), а для его аппроксимации при численном моделировании применяется уравнение (4).
238
2. Стохастическая модель совместного предприятия
Рассмотрим случай, когда три компании (игроки г € N = {1, 2, 3}) заключают кооперативное соглашение на промежуток времени [¿о, T] об организации совместного предприятия с целью максимизации совместной прибыли. Прибыль компании г от совместного предприятия на этом промежутке равна
Еіо
(5) и„
Рі[Хі(в)] 2 - СгЩ(в) вхр[-ф - Ьо)]г1в + + ехр[-г(Т - іо)]ді[хі(Т)]Н ,і є N
Здесь: Е4о - оператор математического ожидания; Рг,вг, и qi
- положительные константы, г - процентная ставка; х^в) С Л+
- технологический уровень компании г в момент в, который мы будем называть состоянием игрока г, п^в) С Л+ - инвестиции в технологическое развитие, (управлением игрока г); Р^х^в)]1/2 -чистая операционная прибыль компании г при технологическом уровне х^в); с^(в) - стоимость инвестиций, qi [х^Т)]1/2 - ликвидационная стоимость технологии компании в момент Т.
Будем предполагать, что развитие технологии компании г при независимом функционировании происходит в соответствии с дифференциальным уравнением Ито:
¿х^в)= аг [^(в^^в)]^2 - 6xi(в) dв+aiXi(в)dzi(в), Xi(tо) = х0
где а,, [ni(в)xi(в)]1/2 - прибавка в технологии, полученная при объеме инвестиций щ(в), 5 - параметр устаревания технологии; последнее слагаемое в правой части представляет собой
239
неопределенность в развитии технологии (так называемый «бе-
и Qi - случайная величина, подчиняющаяся закону стандартного нормального распределения, а а^, - положительная константа (параметр волатильности).
Предполагается, что если несколько компаний заключают кооперативное соглашение (объединяются) для организации совместного предприятия с целью максимизации совместной прибыли, то компания - участник кооперативного соглашения может получить дополнительные возможности в развитии своей технологии. Поэтому в совместном предприятии динамика развития технологии изменяется. В случае, когда все три фирмы объединяются в совместное предприятие, развитие технологии компании г принимает вид
эффект передачи технологии компании г от компаний ] и к соответственно. Прибыль совместного предприятия определяется математическим ожиданием от суммы прибылей входящих в него компаний
лый шум»); ^(8) = ді\[й~8 - стандартный винеровский процесс
бхі(в) = [аі [иі(з)хі(з)}1/2 + Ь^1 [х(8)хі(8)]1/2 + (6) +ЬІМ [хк(8)хі(8)]1/2 - 5хі(в)]й8 + аіХі(в)(ігі(8)
Хі(іо) = х0, і,і, к є N = {1,2,3}, і = і = к,
ЛзЛ] т rfc.il
где и о1к - положительные константы, характеризующие
(7)
3. Выигрыш коалиции
Предполагаемая прибыль коалиции K определяется максимизацией математического ожидания суммы входящих в коалицию компаний:
Eio < ^ |~PiMs)]1/2 - CjUi(s) exp [-r(s - to)] ds
(8)
iGf
+ ^ exp [—r(T - to)] qi [xi(T)]1/2j ,
i€f J
при этом
dxi (s) =
(9)
a [ui(s)Xi(s)]1/2+^ [xj(s)Xi(s)]1/2-¿Xj(s)
j€f,j=i
ds
+aixi(s)dzi(s), xi(t0) = x0, i Є K C N = {1, 2, 3}
Для простоты записи перепишем (9) в виде:
(10) dxK(s)=/f[s,xi(s),ufo)f*(s,xf(s))]ds+ctkxk(s)dzf(s), Здесь dxK(s) = {dxi(s)}ieK, dzf(s) = {dzi(s)}ief,
/K (s) = {/f (s)b€K =
[Ui(s)Xi(s)]1/2 + ^ bjj,i] [xj(s)Xi(s)]1/2 - ¿Xi(s)
j,ief, j=i
ief
241
акхк(«) = {аiжД«)}^ .
Обозначим через Г [К; ¿0,х0] стохастическую задачу оптимального управления (8)-(10). Теоретическое решение данной задачи было найдено в [16]. Справедлива следующая теорема.
Теорема 1. Множество оптимальных управлений {иК(¿)}
дает множество оптимальных решений задачи Г [К; ¿0,хК], если существует непрерывно дифференцируемая функция W(*0)к(¿,хк) : [¿о,Т] х П Кт ^ К, являющаяся решением
уравнения Беллмана:
-^(*°)к(і, Хк) - 2 Е (і, хк) ^¿^(і, Хк)
^,с=1
шах ^ ^ [*, Хі, и,] ехр - / г(у)^у
+
+ Е ЖІ*°)К(і,хк)/К [і,хк,и] I ,
ІЄК ]
Ж(*°)к(Т,хк) = Е ехр [-/4° г(у)^у| 5і(хі),
ієк
где ді [і, хі, иі] ехр - г(у)^у - мгновенная прибыль игрока і в
момент і, дисконтированная на момент начала игры, (і,хк)
- диагональная матрица с элементами аіхі(8), і є К С N,
(і, хк) - элемент в строке Н и столбце ( матрицы (і, хк).
Определим функцию Ж(*°)к(і, хк) как максимальный выигрыш коалиции К на временном промежутке [і, Т] , іо ^ і ^ Т (функция Беллмана).
Рассмотрим задачу Г [К; т, хК], которая начинается в момент т є [іо, Т] в начальном состоянии хК. Используя теорему 1, мож-242
но показать, что:
■І
ехр / г(у)^у Ж(т)к(і,хК) = Ж(*)к(і, хК),
иК)К*(і,хК) = иК)К*(і,хК), іо ^ т ^ і ^ Т.
Заметим, что уровень технологии компании % увеличивает доход, так как дг[з, жДз), «Д«)] и ^(жДТ)) монотонно возрастают по ж,(£), компания-участник кооперации К может получить новые навыки и технологии от другой фирмы в коалиции, поэтому имеет место супераддитивность функции Беллмана, т. е.
Ж(т)к(т,хК) ^ Ж(т)ь(т,х£)+Ж(т)к\ь(т,хК\Ь), Ь с К С N,
где К \ X - дополнение Ь до К.
В нашем случае уравнение Беллмана принимает вид:
іЄК
шах{^ [РіХ2 (і) - Сіиі(і)]е г(* *°) +
(11)
+ Ж!*°)К (і, хК)/К [і, хК, иК ]Ь
іЄК
Ж(*°)К(Т,хК) = ]Т е-г(т-*°)^і(хі(Т));
іЄК
при условии
х*(і) = х0 + / /^ [8,Хі(8),и(*°)М*(8,ХМ (8))]^8 +
£°
+ СТі[8,Хі(8)]^^і(8), і Є N.
Рассмотрим три возможных варианта формирования коалиции в нашем случае. Для одной фирмы % уравнение (11) принимает вид:
—Wt(io)i(t,Xi) - 1 wj^&Xi)^ =
тах
Г) 1/2
PiX/ - CiUi
e r(t to) + Wj’7")г(i,Xj) aj(ujx,)1/2 — ¿x
(12) W^(Т,^) = ехр[-г(Т - ¿о)] & М1/2 , % е{1,2,3} .
Из этого уравнения получаем оптимальное управление:
(13) Ui = , \2 Wjto)i(t,xi)exp [r(t — to)] xi, i є {1,2,3} . 4(ci) L -I
Заменяя Ui в уравнении Беллмана, имеем:
(14)
—Wt(io)i(i,Xi) — 1 Witx)i(t,xi)a2x2 =
1
Pix1/2 exp [—r(t — to)] — ^ wito)i(i, Xi) exp [r(t — to)] Xi
4ci L
a2 і i
2Ci
Wiio)i(t, xi) exp [r(t — T)] xi — ¿W,(io)i(t, xi)xi.
Решая полученное уравнение, получаем:
(15) W (io)i(t, Xi) = ÎAi{i,(i)x1/2 + C{i,(i^exp[—r(t — to)]
где A{i}(t) = |r + =8- + fi A{i}(i) — Pi, C;'i'(i) = rC'i,(i) —
{i}/
ï{i} /
a
16Ci
A{i}(i)
(16) A{i} (T)= q , С™(Г)=0, i є {1,2,3} .
244
{i}
2
Первое уравнение в системе (16) - линейное дифференциальное уравнение первого порядка относительно А{^(£), которое решается независимо с помощью стандартной техники. Подстановка решения А{^(£) во второе уравнение (16) дает линейное
дифференциальное уравнение относительно (¿), которое затем легко решается. Явное решение здесь не приведено в силу громоздкости записи окончательного результата.
Легко получить, что
(17) Ж(т)і(і, Хі) = [4і}(і)хг1/2 + СІі}(і)1 є^ [-г(і - т)]
и оптимальное управление для компании % £ {1, 2, 3} равно:
(18)
иі(і) =
16(Сі)
2
#(і)
Соответственно уравнение (9) принимает вид:
2
^Хі(8) =
(19)
4^А{і}(8)Хі(8)1/2 - ¿Хі(8)
4Сі
^8 + аіхі(8)^гі(8),
хі(і0) = х0, і Є К с N = {1, 2, 3}.
Решая (19), получаем оптимальные траектории для индивидуального случая.
Если три фирмы образуют совместное предприятие, то урав-
245
нение Беллмана принимает вид:
-Wt(t0){1’2’3}(t,X1,X2,X3) - 1 ¿ WÍ*£){1’2’3}(t,X1,X2,X3K2
22 2 x i2
i=1
(20) = max Pi
1/2
ix/ - CiUi
exp [ r(t - to)] +
. i=1
+ ^ W^T)i(t, Xi) Oi(UiXi) 1 + j [XjXi] 2 + 6¡M [xfcXi] 2 - ¿X,
i=1
W(to){1>2>3}(T, X1, X2, X3) = ¿exp [-r(T - to)] qi [Xi]1/2,
i=1
i,j, k Є N = {1,2,3} , i = j = k.
Проведя максимизацию, получаем:
a2 г 12
(21) Ui = 7-^ Wito){1’2’3}(t,X1,X2,X3)er(t-to) Xi, i Є{1, 2, 3} . 4(ci)2 L 1 J
24б
Подставляя (21) в (20), получаем:
-Жі(*°){1’2’3}(і, х1, х2, хз) - 1 Ж^){1’2’3}(і, х1, х2, х3)ст2х2 =
і=1
2
^ [РіХг1/2Єг(*-*°) -Ы*°){1’2’3}(і,Х1,Х2,Хз)
4с
+ Е ЖІ*°){1’2’3}(і,Х1,Х2,Хз) ЖІ*°){1’2’3}(і,Х1,Х2,Хз)
' 1 2с,- 1
і=1
•ег(* *°)Хі + ? [х?Хі]1/2 + ькк,і] ХХі]1/2 - ¿Хі
(22) Ж(*°){1’2’3}(Т,Х1,Х2,Хз) = ^ ехр [-г(Т - і0)] qi [Хі]1/2
і=1
для і, і, к Є N = {1, 2, 3} , і = і = к. Решая (22), получаем:
Ж (*°){1>2>3}(і, х1, х2, х3) = А{1,2,3}(і)х1/2 + а21,2,3}(і)х1/2
(23) +А{1,2,3} (і)х3/2 + С{1'2'3} (і)! ехр [-г(і - і0)]
где А{1’2’3}(і),А{1’2’3}(і),А{1’2’3}(і) и С{1>2>3}(і)
удовлетворяют
системе
41А31(і) =
2 Г\ 7 [і,?] 7 [і,к1
г + ¥ + 2) а{1А31 (і) - VАГ31« - VАІ"2'31 (і) - Рі,
(24)
і, і, к Є N = {1,2,3} , і = і = к,
2
С {1'2'3}(і) = гС {1'2'3} (і) - V -
^ 16Сі
і=1
А
{1,2,3}
(і)
А{1,2,3}(Т) = ql, С{1,2,3}(Т) = 0.
Первые три уравнения в системе (24) образуют систему трех линейных дифференциальных уравнений, которая решается в явном виде. Подстановка решения {А{1,2,3}(і) 1 во второе урав-
нение (24) дает линейное дифференциальное уравнение относительно С{1,2,3} (¿). Оптимальные инвестиционные стратегии в совместном предприятии могут быть получены в виде:
(25) и{1'2'3}(і) = -
( ) иі (і) 16(Сі)2
А{1,2,3}(і^ 2 , і Є{1,2,3} .
Динамика траекторий развития технологий совместного производства на временном промежутке [¿о, Т] имеет вид:
^ («) =
2 4-2 А{1,2,3}(8)хі(8)1/2 + ? [х? (8)хі(8)]1/2 +ьІк,і] [хк (8)хі(8)]1/2
(26)
-¿Хі(8)] ^8 + СТіХі(8)^^і(8) ,
х/£о) = хо, %,.?’, к € N = {1,2,3}, % = ^ = к.
Решая полученное уравнение, получаем оптимальные кооперативные траектории.
Если же две из трех фирм решают создать коалицию для максимизации совместной прибыли, то для них уравнение (11) 248
2
принимает вид:
(27)
^(*°)К(і ХК) - 2 V °і Хі (і, ХК)
іЄК
таМ ЕВД (і) - сіиі(і)]е г(і *°) +
ик
иеК
+ ЖІ!°)К (і, хК )/К [і, хК, иК и,
іЄК і
Ж(*°)К(Т,хК) = V е-г(Т-*°^і(хі(Т));
іЄК
Следуя проведенному выше анализу, получаем следующие функции:
(28) и = 4Т“і)2 Жі*°){і'?}(і,хі,х?)ег(* *°) Хі,і,іє{1, 2, 3},і = і 4(сі) 1 -1
Ж (*°){і'?}(і,хі,хі) =
(29) [4і,Л(і)х!/2 + А{і,?}(і)х1/2 + С {і'?} (і)
3-г(і-і°)
{і,і}с{1, 2, 3} , і = і,
где А{і,Л(і),А{і,Л(і) и С{і'?}(і)
ний
удовлетворяют системе уравне-
А{і,Л(і) = (г + у + 2) А{і'?1(і) - ^А{{і'?1(і) - Рі,
(30)
«і
16с
і, і Є N = {1, 2, 3} , і = і
3
С{і'?}(і) = гС{і'?}(і) - Е
і=1
4і,л(т) = qi, с{і'?}(т) = о
Система (30) решается стандартными методами:
(31)
Ж(*°){і,Л(і, хі, х?) = (Ж(т){і,?}(і, хі, х?)) ехр [-г(т - і0)]
{і,і}с{1, 2, 3} , і = і.
Оптимальные инвестиционные стратегии для коалиции двух игроков принимают вид:
(32) и{і,Л(і) = ~і^ А{і,?}(і) , і Є К с{1, 2, 3} ; |К| =2
-і
2
1{і,Л
16(<*)
Динамика технологических состояний коалиции на временном промежутке [¿о, Т] имеет вид:
^Хі(8) =
4-і_ А{1,2,3}(8)хі(8)1/2+ СТіХі(8)^^і(8) + 4сі
(33) [х^(^Х^)]^2 -¿Х^)] ^
х^о) = Хо, %,; € К С N = {1, 2, 3}, % = ;', |К| =2.
Отсюда и получаем оптимальные траектории для коалиции из двух фирм.
250
2
4. Вектор Шепли в стохастическом случае
Как и в детерминированном случае, игроки будут делить совместную прибыль в соответствии с вектором Шепли. Чтобы максимизировать доход совместного предприятия фирмы будут использовать вектор управлений (25) на интервале [¿о, Т], получая из (26) соответствующие оптимальные траектории {хМ (¿)}Т=*о.
В момент ¿о и состоянии х^0 фирмы договариваются, что доля дохода фирмы % будет:
(34) ^°)^о,х0м ) =
^ (к - 1)!(И - к)\ ^(1°ж((о,хк) - (,°^(¡о.х«^)
кем п
Для динамической устойчивости необходимо поддерживать вектор Шепли на всем протяжении совместного производства, т. е. для любого момента т € [¿о, Т] должно выполняться условие:
(35) ^(т )i (т,хМ ) =
£ (к - ^ - к)! (т)К(т,ХК) - W(т)к\Чт,ХК^
к см !
Построенный вектор Шепли -и(т)(т, х]у*) = [^(т)1(т, х]у), ...,
■у(т)п(т, х^*)] удовлетворяет свойствам дележа:
П
£ ^(т ^(т^*) = W(т )м (т,хМ*),
(36) i=1
^(т),(т, хМ*) ^ W(т)i(т, хМ*) % £ N т € [¿о, Т] .
Первое условие в (36) говорит о том, что 1)(т) (т, х^*) удовлетворяет свойству оптимальности по Парето в каждый момент игры. Второе условие иллюстрирует, что вектор Шепли -и(т) (т, Х^*)
251
индивидуально рационален в любой момент игры. При выполнении условий (34)-(36) принцип оптимальности (распределение дохода в соответствии с вектором Шепли) существует в каждый момент игры вдоль оптимальной траектории, выбранной изначально, и по построению он динамически устойчив на промежутке выполнения кооперативного соглашения.
В нашем случае ожидаемая доля прибыли компании в соответствии с вектором Шепли будет равна:
«(т )і(т,х’у ) = 1 Ж(т)і(т,Х,т ) +
+1 (и,-(т№Л(т,х{„}) - Ж(т)?(Т,хт}) +
(37) 3 (Ж(т){і,к}(т, х^і,*}) - Ж(т)к(т, хЦ) +
+ 1 (w(т)(i,j,‘1(т,xУi,J,*l} - Ж(т^(т.х^,*})) ,
і, і, к Є N = {1, 2, 3} , т Є [і0, Т] .
5. Процедура распределения дележа в стохастическом случае
Как и для детерминированного случая в данной модели необходимо компенсировать переходные изменения в доходах фирм, чтобы вектор Шепли поддерживался на всем протяжении совместного производства. Для этого компоненты вектора Шепли
252
представляются в следующем виде:
) =
£
к см
(к — 1)!(п — к)!
п!
W (*°)К (іо,*К) — (*°)К\'(^о,хК\4)
т
Е° < / В* (в) ехр и°
- т /* - т /*
— Ф)*/ гів +дг(ж*(Т ))ехр — г(у)^у
. £° - £°
(38)
| Хм (¿о) = хМ }
Здесь В, (в) - платеж, получаемый компанией і в момент в Є [іо, Т] после перераспределения дохода. Более того, для і є N и і є [¿о, Т]:
•и(*0)г(іжМ) = Е° ( / В(в) ехр —[ г(у)^у
I Л°
^в+
(39)
+^г(ж*(Т)) ехр
т
г(у)йу
. ¿°
ІХМ (і) = хМ
- выигрыш игрока і от кооперации на промежутке [і, Т], где
хМ - состояние игры в момент і є [і0,Т]. Чтобы -и(*°)г(і, ХМ)
удовлетворяло (5.2), необходимо:
^(¿УМ) = ^(¿,хМ) ехр
т
— У г(у)йу
. ¿°
і Є N, і Є [¿о, Т] и ХМ Є ХМ
Поэтому задача заключается в нахождении такого ВДз), при котором г(*°)г(£, ж^) удовлетворяет (38)-(40). Отметим, что в каждый момент происходит только перераспределение прибыли, поэтому сумма доходов игроков должна оставаться неизменной, но так как здесь мы имеем дела со случайными величинами, то суммы доходов должны совпадать в среднем, т. е.
(41) #^£ #г(в)} = Е^£ [РХ1/2(в) — СИг(в)Н ,в Є [іо, Т] .
и=і
и=і
В общем случае прибыль, получаемая игроком г в момент т е [¿о, Т], равна:
Ві(т) = — £
(к — 1)!(п — к)!
КСМ
п!
Ж4(т )К (r, хК )|*=т
Ж
(т )К\і
(Т ХК\і) 1 і=т
1 + 2
£ (т,хТ)
й,С=1
Ж« (і.*; )і<=,
Ь~Ь
(42)
2
Н£ =1
^К\г(т,хТ)
^2?\г(і,*;) и=т
1
і
Поскольку частная производная Ш(т)к(т, жК)по ж^-, где ] £
Управление в социальных и экономических системах К уходит, мы можем переписать (42) более лаконично:
(43)
Ві(т) = — У,
КСМ
(к — 1)!(п — к)! п!
^(т)К(т,хК) к=т1 |^(т)К\і(т,ХК\і) к=т
+
+ £ [ЖІ^)К(т,ХК) к=т /^ т,хМ;,и(т)М*(т,ХМ;)
ІЄК
£
ЬЄК\і
ХК\і) |*=т
/М [г,*М*,«іт)М;(т,хМ;)
+
1 п
+2 £ (т,*т)
й,С=і
ЖЇК (і,*;) и=т
2 V
2
и,с=1
°Кс\*(г,хт)
Ж??\г(і,х;)і*=
где /М
т хМ;,и(т )М *(т ХМ;)
вектор, состоящий из
/М к,хМ*,и(т)М*(т,хМ*)
і К.
і
В данном случае функция В,(т) принимает вид:
Ві(т) = (—1) • (3 (Ж(т)і(т, *т) +
+ Жіт)г(т,хт)/іМ [г,ХМ*,и(т)М*(т,ХЛ*)1 + 1 ^г2(*тА +
1 (Т;г/(т ){‘,ІЬ
+ 6
(т, *{„'}) — (т,хт) + Ж(т ^(т,*^)
(44)
•/М |г,хМ*,и{^;^*(г,хМ*)
(т)М*,
+Ж^т ){і,%,*{і,Л/
т Хт* и(т)М*(т Хт*) т, , и{і,і} (Т, )
К?}'' /
—Жіт)^(r,*т)/М r,ХМ*, и(т)М*(тхл*)
+1 ^2 (*т) 2 Жіт2{м} (т, х{і,і})+
+ 1 ^(хт)2Ж#<‘Л(т, *{,.,}) — 1 ^2(*т)2^(т>>: (Т,хт)) +
1 (иг|1(т ){1,к} (т, Х{,,к}) —
— Ж,(т )к (т,4) + №-<т ){і,ч(т, *{,,*})/,
т \ .рМ
т *т* и(т)М *(т *т *) т, , и{‘,к} (т, ХМ )
+и'М<і,‘}(т,*{і,ч/ т,*;,«^"(т,*#) — Ж<т)к(т,х;)
•/к
(т )М *
т, хл*, иГ‘ (т, + 2ст2(*тх{,,к})+
11
+ 2 4(4 ^«(‘^(т,*^,) — - ^2(х» )2^<т>к: (т,хк)
U) - Wt(r){j’fc}(r,x{j)fc}) + WT){i’j’fc}(r,xN)
■ yf r,xN;,uw)N*(T,xN*)
+ <т){г^}(т,х^)/f |t,xn;,4t)n;(t,xn;)
+
+ Wk ){i’j’fc}(r,xN )/f |t,xn;,4t)N *(t,xn**)1 - wiT){j’fc}(r,xN )•
, / N T xT * .Л')N *(_. xT *) / t, , U{j,fc} (T, )
wiT){j’fc}(r,xf)/N It,xf*,ug^V,xf*)
„t \ /N
+
+ 2 ^2(х[ )2^г2{глк}(т,ху) +1 а|(хт т^р^ху) +
+ 1 ^г2«) - 1 ст2(хТ
- 2ст2(х! )2^£ х{^,к})).
Вектор Вг(т), полученный из процедуры распределения дохода, гарантирует реализуемость дележа согласно вектору Шепли на всем протяжении игры. Таким образом, мгновенные выплаты Вг(т, ) игроку г £ N обеспечивают динамическую устойчивость совместного предприятия.
6. Результаты количественного моделирования при детерминированной динамике
Подтвердим полученные математические выводы результатами численных расчетов в детерминированном случае (01 = 02 =
03 = 0).
Для начала рассмотрим симметричный случай, когда все 3 компании имеют одинаковые параметры. Все вычислительные процессы проводились в программной среде MAPLE.
Пусть
¿0 = 0 - начальный момент игры (момент начала работы совместного предприятия).
Т = 20 - конечный момент игры (момент ликвидации совместного предприятия).
г = 0,2 - процентная ставка.
5 = 0,05 - параметр устаревания технологий.
в\ = 0,5, с2 = 0,5, с3 = 0,5 - параметры инвестиционного вклада игроков в технологическое развитие.
= 0,1, д2 = 0,1, = 0,1 - параметры ликвидационной
стоимости технологий компаний на момент окончания игры.
Р\ = 0,1, Р2 = 0,1, Р3 = 0,1 - параметры чистой операционной прибыли компаний.
а\ = 0,3, а2 = 0,3, а3 = 0,3 - параметры прибавки в технологическое развитие компаний.
6? 11 = б!3’11 = 41 ’2| = 6.23’11 = 41 ’3| = (|’31 = 0,1 - параметры передачи технологий между компаниями.
Графики динамики состояний игроков, действующих индивидуально, выглядят так:
1-я компания 2-я компания з_я компания
0.11- / \ 0.11- 0.11-
0.108- / \ 0.108- / \ 0.108:
0.106- Х\
0.104- / \ 0.104- /" \ 0,104-
0.102- і 0.102- \ 0.102-
О.Ь 0 1 ■
0 5 10 15 20 0 5 10 15 20
Как мы видим, развитие всех компаний одинаково. В совместном предприятии развития уровней технологий компаний во времени также равны между собой.
1-я компания
2-я компания
3-я компания
Графики прибыли компаний во времени представлены ниже. Они также одинаковы как для индивидуального случая,
так и для совместного предприятия:
1-я компания
2-я компания
3-я компания
Для симметричного случая прибыль в соответствии с вектором Шепли должна распределяться между игроками одинаково, следовательно, здесь мы не должны наблюдать перераспределения дохода. Графики функций Б^) это подтверждают:
1-я компания 2-я компания 3-я компания
Проверим корректность наших вычислений и убедимся, что прибыль, полученная каждой компанией до перераспределения, равна прибыли этой же компании после перераспределения. Обозначим через
(45) Pri(t) = 1/2 - CiUi(t)
прибыль компании i в момент t до перераспределения выигрышей.
В данном примере не происходит перераспределения прибыли. Различие в последних цифрах - погрешность вычислений.
Несложно проверить динамическую устойчивость вектора Шепли на всем интервале существования совместного предприятия, т. е. проверить выполнение равенства:
T
v(to)i(t, xN) = J Bi(s) exp [-r(s - to)] ds +
t
(46) exp [—r(T - to)] qt [xi(T)]1/2 ,i Є N,t є [to,T] 260
Рассмотрим асимметричный случай. Сначала изменим параметр Р.
Пусть теперь Р\ = 0,1, Р2 = 0,2, Р3 = 0,05. Посмотрим, как изменится динамика состояний игроков и их выигрыши. Ниже представлены графики динамики состояний компаний для всех возможных коалиций в игре:
Индивидуальное развитие Совместное развитие
Объединение 1 и 2 Объединение 3 и 2 Объединение 1 и 3
Далее представлены графики прибыли компаний на протяжении игры для всех возможных коалиций:
Индивидуальная прибыль
Совместная прибыль
Объединение 1 и 2
Объединение 3 и 2
0.1В 0.13-
П 1РІ- Рг2 0.16- 0.08:
0.14- 0.14 Рг2 0.07:
0.12 0.12- о.оє:
и.1 -ппя- Рг1 0.1 0.08- 0.05:
0.06 0.04- РгЗ 0.06- 0.04 Ргі „ 0.04: ГЗ
0.02- 0.02- - и.02:
Объединение 1 и 3
РГ2
10 15 20
10 15 20
10 15 20
Ниже представлены графики прибылей компаний в совместном предприятии без и после перераспределения прибыли:
С перераспределением
Как мы видим, в данном случае имеет место перераспределение доходов от кооперации. Это наблюдается в различные моменты времени. Имеет место различие в величинах, но сумма доходов 262
остается неизменной за вычетом погрешности вычисления. Итак, в данном случае происходит перераспределения доходов компаний, и строится новое решение, которое является динамически устойчивым. Анализ количественных данных также подтверждает выполнение свойств стратегической устойчивости и защиты от иррационального поведения. Таким образом, анализ результатов количественного моделирования подтверждает корректность изложенных выше теоретических результатов.
7. Результаты количественного моделирования при стохастической динамике
Для сравнения используем те же параметры, что и в детерминированном случае.
Как и ранее рассмотрим сначала симметричный случай, когда все 3 компании имеют одинаковые параметры.
Пусть:
¿0 = 0 - начальный момент игры;
Т = 20 - конечный момент игры (период существования совместного предприятия);
г = 0,2 - размер дисконта;
5 = 0,05 - параметр устаревания технологий;
С1 = 0,5, с2 = 0,5, с3 = 0,5 - параметры инвестиционного вклада игроков в технологическое развитие;
q1 = 0,1, ^2 = 0,1, = 0,1 - параметры ликвидационной
стоимости технологий игроков на момент окончания процесса;
Р1 = 0,1, Р2 = 0,1, Р3 = 0,1 - константы, определяющие чистую операционную прибыль игроков;
а1 = 0,3, а2 = 0,3, а3 = 0,3 - константы, определяющие прибавку в технологии игроков;
6? 11 = б13д| = 41 ’2| = 43Д| = !>,3 ’3' = Ь32 ’3| = 0,1 - параметры, характеризующие эффекты передачи технологий между участниками совместного предприятия;
а1 = а2 = ст3 = 0,05 - параметры волатильности технологического развития.
Графики изменения состояний и прибылей игроков, действующих индивидуально, при указанных параметрах имеют вид:
Как мы видим развитие технологий всех компаний даже в симметричном случае неодинаково вследствие случайных отклонений.
При объединении в совместное предприятие траектории технологий компаний и графики прибылей компаний как функции времени приблизительно одинаковы:
Технологии компаний
Прибыли компаний
Х1 0.2'
0.18
’Х2 0.16
0 14
,Хз 0.12
0.1
0.08
0.06
0.04
10
15 20
Для симметричного случая прибыль в соответствии с вектором Шепли должна распределяться между игроками одинаково. Поэтому здесь мы не наблюдаем перераспределения дохода при кооперации. Графики функций В, (£) это подтверждают:
Прибыль до перераспределения Прибыль после перераспределения
Результаты количественного моделирования подтверждают корректность наших вычислений. В частности, нетрудно убедиться, что прибыль, полученная каждой компанией до перераспределения, равна прибыли этой же компании после перераспределения. Обозначим через
РгДг) = р^(г)}1/2 — Сгиг(Ь) — прибыль компании % в
момент £ до перераспределения. Несмотря на симметричность примера значения прибылей неодинаковы, но перераспределения прибыли не происходит. Различие имеет место из-за случайности доходов. Введем в наш случай асимметрию. Изменим параметр р.
Пусть теперь Р1 = 0,1, Р2 = 0,2, Р3 = 0,05. Посмотрим, как изменится динамика состояний игроков и их выигрыши.
Ниже представлены графики динамики состояний игроков для всех возможных коалиций в игре. Как видно из графиков, здесь имеет место сильное колебание состояний, из-за чего наблюдаются более сильные отклонения величин:
Индивидуальное развитие
Совместное развитие
2 и 3
10 15
1 и 3
Далее представлены графики прибыли компаний на протяжении игры для всех возможных коалиций:
Индивидуальная прибыль
Совместная прибыль
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
^РГ2
Ргі
Ргз
■ ■. Т~.ТТ~. ■' і ■ ."гг;
5 10 15 20
1 и 2
2 и 3
1 и 3
Ниже представлены графики прибылей компаний в совместном предприятии до и после перераспределения:
До перераспределения
После перераспределения
Как мы видим, в данном случае имеет место перераспределение на начальных стадиях, которое затем постепенно глушится. Имеет место различие в величинах, но сумма доходов остается приблизительно неизменной. Следовательно, построенное решение сохраняет динамическую устойчивость.
Литература
1. ПЕТРОСЯН Л.А. Устойчивые решения дифференциальных игр со многими участниками// Вестник Ленинградского Университета. - 1977. - №19. - С. 46-52.
2. ПЕТРОСЯН Л.А., ДАНИЛОВ Н.Н. Кооперативные дифференциальные игры и их приложения. - Издательство Томского Университета, Томск, 1982.
3. ЧИСТЯКОВ С.В. О бескоалиционных дифференциальных играх// ДАН СССР. - 1981. - Т. 259. - №5. - С. 1052-1055.
4. ЧИСТЯКОВ С.В. О построении сильно динамически устойчивых решений кооперативных дифференциальных игр// Вестник СПбГУ сер. 1. - 1992. - Вып. 1. - №1. -С. 50-54.
5. HAURIE A. A note on nonzero-sum differential games with bargaining solutions// Journal of Optimization Theory and Application. - 1976. - V. 18. - P. 31-39.
6. KIDLAND F.E., PRESCOTT E.C. Rules rather than decisions the inconsistency of optimal plans// Journal of Political Economy. - 1977. - V. 85. - P. 473-490.
7. NASH J.F. Non-cooperative games// Ann. Mathematics. -1951. -V. 54. - P. 286-295.
8. PETROSYAN L.A. Differential Games of Pursuit. - World Scientific, Singapore, 1993.
9. PETROSYAN L.A. Bargaining in Dynamic Games. In: Petrosyan L., Yeung D.W.K. (ed) ICM Millenium Lectures on Games. Springer. Verlag. Berlin. - 2003. - P. 139-143.
10. PETROSJAN L.A., ZACCOUR G. Time-consistent Shapley value allocation of pollution cost reduction// Journal of Economic Dynamics and Control. - 2003. - V. 27. - №3. -P. 381-398.
11. PETROSJAN L.A., ZENKEVICH N.A. Game Theory. -World Scientific Publishing Co. Pte. Ltd.: Singapore, 1996.
12. PETROSYAN L.A., ZENKEVICH N.A. Time-consistency of cooperative solutions in management. In: “Contributions to game theory and management”. GSOM. St. Petersburg University Publ. - 2007. - P. 233-252.
13. SHAPLEY L.S. A Value for n-Person Games. in “Contributions to the Theory of Games” (eds. H.W. Kuhn and A.W. Tucker). Princeton. Princeton University Press. -1953. - P. 307-315.
14. TOLWINSKI B., HAURIE A., LEITMANN G. Cooperative equilibria in differential games// J. of Mathematical Analysis and Applications. - 1986. - V. 119. - P. 182-202.
15. YEUNG D.W.K., PETROSYAN L.A. Subgame consistent cooperative solutions in stochastic differential games// J. Optimiz. Theory and Appl. - 2004. - V. 120. - №3. - P. 651666.
16. YEUNG D.W.K., PETROSJAN L.A. Cooperative Stochastic 268
Differential Games. - Springer, 2006.
17. ZENKEVICH N.A., KOLABUTIN N.V. Quantitative Modeling of Dynamic Stable Joint Venture. In: Preprint Vol. of the 11th IFAC Symposium "Computational Economics and Financial and Industrial Systems". IFAC. Dogus University of Istanbul. Turkey. - 2007. - P. 68-74.
STABLE JOINT VENTURE STOCHASTIC MODEL
Nickolay Zenkevich, School of Management, St. Petersburg State University, Saint Petersburg, Cand. Sc ([email protected]). Nickolay Kolabutin, Faculty of Applied Mathematics and Control Processes, St. Petersburg State University, Saint Petersburg, post-graduate student ([email protected]).
David Yeung, PhD, professor, Center of Game Theory, Hong Kong Baptist University, professor ([email protected]).
Abstract: Dynamic joint venture model is investigated. Through knowledge diffusion participating firms can gain core skills and technology that would be very difficult for them to obtain on their own. The stochastic evolution of the technology level of company underjoint venture is known as a multivariate stochastic Ito’s process. The profit of the joint venture is the expected sum of the participating firms’ profits. The member firms would maximize their joint profit and share their cooperative profits according to the Shapley value. Applying the method of regularization for dynamic cooperation problem, we constructed the control in the form of special payments, paid at each time instant on the optimal trajectory. The dynamic stable solution is obtained for the stochastic joint venture dynamic model.
Keywords: differential game, cooperative solution, time-consistency of cooperative agreement, payoff distribution procedure (PDP), imputation distribution procedure (IDP), dynamic stability, strategic stability, Shapley value, stable joint venture.