УДК 517.977.8+519.834 ББК 22.18
ДВУХУРОВНЕВЫЕ КОНФЛИКТНЫЕ СИСТЕМЫ В ЗАДАЧАХ СОВМЕСТНОЙ РАЗРАБОТКИ ПРИРОДНЫХ РЕСУРСОВ1
Королев Ю.М.2, Голубцов П.В.3
(Физический факультет, Московский государственный университет им. М.В. Ломоносова, Москва)
В работе исследуется конфликтная система, в которой взаимодействуют игроки двух принципиально разных типов - владельцы ресурса и разработчики. При этом владельцы устанавливают правила игры (налоги) для разработчиков. Проведено аналитическое исследование таких двухуровневых конфликтных систем для случая одного разработчика и многих владельцев ресурса. Решение игры найдено аналитически для функций выигрыша общего вида, удовлетворяющих некоторым естественным условиям.
Ключевые слова: теория игр, двухуровневая игра, оптимальное управление природными ресурсами, равновесие по Нэшу, игра Штакельберга с многими лидерами.
Введение
За последние десятилетия уровень технического оснащения добывающих компаний стал настолько высоким, что над многими видами природных ресурсов нависла реальная угроза исчерпания. Неадекватный учет эффектов соперничества приводит к катастрофическим последствиям в экономике и экологии. Поэтому возни-
1 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. -2010. - Т. 2. № 4. - С. 25-48».
2Юрий Михайлович Королев, аспирант ([email protected]).
3 Петр Викторович Голубцов, доктор физико-математических наук, профессор ([email protected]).
кает потребность в развитии моделей, позволяющих исследовать процесс совместной разработки природных ресурсов.
Типичным примером задачи совместной разработки природных ресурсов является промышленный лов рыбы. В классической постановке задачи несколько независимых разработчиков ведут добычу ресурса из общего бассейна. В ранних публикациях на эту тему ([3],[6]) была показана важная особенность таких систем: при отсутствии ограничений на разработку в некооперативном случае происходит исчерпание ресурса до уровня, когда его разработка становится экономически нецелесообразной. В англоязычной литературе этот эффект получил название «tragedy of commons».
Осознание того факта, что бесконтрольная добыча приводит к исчерпанию ресурса, привело к созданию различного родарегу-ляторов - организаций, в состав которых входят как государства -владельцы ресурса, так и государства - разработчики. Они призваны управлять процессом разработки природных ресурсов за счет введения различного рода ограничений и квот. Как показывает практика, не все из них оказываются эффективными.
Кроме того, во многих регионах были введены эксклюзивные экономические зоны, добыча ресурса в которых могла вестись только с разрешения государства - владельца эксклюзивного права на разработку ([12]). Владельцы этого права стали допускать других участников рынка к разработке ресурса, взимая с них определенный налог. Такое устройство системы «владельцы - разработчики ресурса» потребовало создания новых математических моделей ([8]).
Подавляющее большинство исследований в этой области базируются на численном моделировании. В этой связи стоит упомянуть работы [10] и [4], в которых рассмотрены задачи разработки природных ресурсов при неопределенности (в условиях непредсказуемых климатических изменений), а также при наличии у игроков асимметричной информации.
Конкуренция между разработчиками зачастую приводит к снижению эффективности разработки. Однако ситуация серьезно
осложняется в случае, когда владельцы ресурса также являются активными участниками событий.
Такая ситуация может быть описана как двухуровневая игра, в которой принимают участие игроки двух принципиально разных типов. Игроки первого уровня (владельцы ресурса) устанавливают правила игры для игроков второго уровня (разработчиков). При этом игроки первого уровня сами находятся в конфликтной ситуации. Доходы всех игроков, как первого, так и второго уровня, зависят от стратегий игроков обоих уровней.
Предполагается, что игроки первого владеют совершенно однородным ресурсом, и разработчику безразлично, у кого из них купить право на добычу. Однако условия разработки в различных регионах (соответствующих различным игрокам первого уровня) различны, а следовательно, различны и затраты на добычу единицы ресурса. Кроме того, эти регионы отличаются друг от друга налогами, которые устанавливают владельцы. Обычно налоги пропорциональны усилиям по разработке (в примере с ловом рыбы
- количеству судов). Эти налоги и являются стратегиями игроков первого уровня. Стратегиями игроков второго уровня является распределение их усилий по разработке между различными регионами. Стараясь привлечь к себе разработчиков, владельцы могут снижать налоги, тем самым уменьшая свой суммарный доход и провоцируя наращивание добычи ресурса.
В общем случае в игре участвуют N владельцев ресурса и М разработчиков. Игра разыгрывается в два этапа. Решением игры на втором уровне является равновесие по Нэшу между разработчиками, параметрически зависящее от стратегий игроков первого уровня - налогов. Зная эту зависимость, игроки первого уровня также приходят к равновесию по Нэшу. В работе [9] проведено аналитическое исследование игры 1 х 2, в которой участвуют два разработчика и один владелец (игра Штакельберга с одним лидером и двумя последователями). В настоящей работе изучаются эффекты, обусловленные конкуренцией между владельцами ресурса, поэтому рассматривается случай одного разработчика и многих владельцев (игра Штакельберга со многими лидерами и
одним последователем).
Все рассуждения в настоящей работе проводятся для функций выигрыша общего вида. Они должны удовлетворять некоторым вполне естественным условиям, которые получаются исходя из следующих соображений. Характерной особенностью рассматриваемых задач является зависимость удельных затрат на добычу ресурса от количества оставшегося ресурса. Интенсивность добычи в каждом регионе пропорциональна количеству оставшегося ресурса R(t), а также приложенным усилиям Е ([5]).
(1) ^ = —qER(t),
где q = const > 0 - коэффициент пропорциональности, определяющий эффективность добычи в каждом регионе.
Предположим, что время добычи ресурса равно T. Пусть R(0) = R0. Тогда, с учетом (1), доход ш разработчика от продажи ресурса в зависимости от приложенных усилий есть разница между количеством ресурса на начало и конец сезона (предполагается, что цена на ресурс не изменяется в течение всего сезона).
(2) ш(Е) = Ro(1 - e-qTE).
Выигрыш разработчика складывается из доходов от продажи ресурса, добытого в различных регионах, за вычетом налоговых выплат, а также издержек добычи.
В разделе 2 рассмотрена простейшая игра, в которой участвует по одному игроку на каждом уровне. В разделе 3 рассмотрена игра, в которой участвуют два владельца ресурса. Уже в такой простой конфигурации проявляются интересные особенности рассматриваемых систем, например, неединственность равновесия по Нэшу в игре на первом уровне. В разделе 4 рассмотрена симметричная игра с произвольным числом игроков первого уровня, изучено влияние конкуренции (количества игроков) на решение игры.
Подобные двухуровневые игры могут возникать в задачах разработки различных биологических ресурсов, водных ресурсов
(например, артезианских вод), лесных ресурсов, в сельском хозяйстве, а также в других задачах.
1. Постановка задачи
Мы формализуем задачу игрой СN х1 =
{N, Хг, У, иг, V; г = 1,..., N}, где N - множество игроков первого уровня, Хг - множества их стратегий, У - множество стратегий игрока второго уровня, и и V - функции выигрыша игроков первого уровня и игрока второго уровня соответственно.
Вектор х £ Х1 х ... х XN интерпретируется как вектор налогов, а вектор у € У определяет распределение усилий игрока второго уровня по разработке ресурса между различными регионами. Предполагается, что уг ^ 0, г = 1,..., N и ^^=1 уг ^ у0. Последнее условие выражает тот факт, что разработчик ограничен в своих возможностях (например, имеет ограниченный флот).
Функция выигрыша разработчика v(x, у) в случае N владельцев ресурса имеет следующий вид
N
(3) v(x, у) = ^ Шг(уг) - (сг + Ж*)у*,
г=1
где шг(уг) отражают доход от разработки ресурса в г-том регионе, сг - константы, характеризующие естественные затраты на разработку ресурса в г-том регионе, а хгуг - налоговые выплаты. Будем считать, что функции Шг(у) удовлетворяют следующим вполне естественным условиям
^¿(0) = 0,
(4) <£г(у) = (у) > 0,
<Р‘¿(у) = и"(у) < °.
Условия (4) означают, что доход от разработки в каждом регионе монотонно возрастает с ростом затраченных усилий, однако эффективность разработки падает с увеличением ее интенсивности. Это обусловлено исчерпанием ресурса.
Кроме того, подчиним функцию ф на отрезке [0, у0] условию
(5) 2[^(у)]2 > ^yV'^ </(у) ^ 0.
Типичным примером функции ^¿(y) является зависимость
(2), рассмотренная во введении. Легко убедиться в том, что она удовлетворяет условиями (4) и (5).
Множество стратегий игрока второго уровня - множество векторов y е Rn: yi ^ 0,£N=1 yi ^ y0. Множества стратегий игроков первого уровня Xi - лучи Xi ^ 0.
Выигрыши игроков первого уровня - налоговые выплаты, пропорциональные усилиям по добыче ресурса.
(6) Ui(x) = xiyi(x), i = 1,..., N.
Рассматриваемая игра - игра Штакельберга, в которой игроки первого уровня являются лидерами, а разработчик - последователем. При фиксированных налогах он решает следующую оптимизационную задачу.
(7) v(x, y(x)) = max v(x, y).
yeY
Зная оптимальный отклик игрока второго уровня y(x), каждый игрок первого уровня оптимизирует свой выигрыш. Оптимальным набором стратегий в такой ситуации обычно считают равновесие по Нэшу.
(8) Ui,(xeq) = maxui(xeq|xi), i = 1,..., N,
xi ^0
где xeq |Xi обозначает вектор xeq, в котором i-я стратегия заменена на Xi.
2. Игра 1 х 1
Рассмотрим простейший случай, когда на каждом уровне находится по одному игроку (т. е. N = 1). В этом случае в игре участвуют один лидер и один последователь.
Игрок второго уровня максимизирует свою функцию выигрыша v(x, y) при каждом фиксированном х, задавая функцию
у (ж) - оптимальный отклик на стратегию игрока первого уровня. Зная у (ж), владелец ресурса максимизирует свою функцию выигрыша и(ж,у(ж)). Оптимальные стратегии игроков являются решением следующей задачи.
Найдем у(ж). Для этого надо максимизировать и(ж,у) по у на отрезке [0,уо]. Для удобства мы будем искать не максимум ■и(ж, у), а минимум — -и(ж, у).
Запишем необходимые условия экстремума (условия Куна-Таккера):
по у на отрезке [0, у0], и необходимые условия экстремума превращаются в достаточные условия глобального максимума функции
V на [0, уо], причем точка максимума единственна.
Как видно из системы (10), достаточным условием достижения максимума на границе является положительность соответствующего множителя Лагранжа. Решая систему (10) при ^і > 0, ^2 = 0, у = у0 и при ^і = 0, ^2 > 0, у = 0, получаем достаточные условия достижения максимума на границе. Во внутренних точках (при ^і = 0 ) система сводится к одному уравнению. Таким образом, решение системы (10) на отрезке [0,у0] есть функция
(11) у(ж) = а(с + ж), если <^(у0) — с < ж < ^>(0) — с,
(9)
v(ж,y(ж)) = тах v(ж,y),
0<У<У0
(10)
< ^і(у — у0) = 0, ^у = 0,
Т.к. 9= —^;(у) > 0, функция — v(ж, у) строго выпукла
если ж ^ ^(у0) — с,
если ж ^ ^>(0) — с.
Рис. 1. Оптимальный отклик игрока второго уровня у (ж)
Рис. 2. Функция выигрыша игрока первого уровня
и(ж,у(ж))
Любопытно заметить, что при ж < ^>(уо) — с оптимальная стратегия разработчика у (ж) не изменяется несмотря на увеличение налога ж. При этом соответствующий множитель Лагранжа = <^(уо) — (с + ж) уменьшается и при ж = ^>(у0) — с становится равным нулю. Это наблюдение позволяет интерпретировать множители Лагранжа в системе (10) как «виртуальные налоги». Они оказывают такое же влияние на стратегию игрока второго уровня, как и реальные налоги, хотя и не выражаются в выплатах игроку первого уровня. В этой связи естественно ожидать, что игрок первого уровня будет стремиться выбирать свою стратегию таким образом, чтобы множитель Лагранжа ^1 в системе (10) был равен нулю. При этом ограничение у ^ уо фактически перестает работать. В этом легко убедиться, так как Ли(х^^х)) = уо > о при при ж < <^(уо) — с. Типичный вид функции выигрыша и(ж,у(ж)) представлен на рис. 2.
Найдем ж°Р* - оптимальную стратегию игрока первого уровня. Для этого нужно найти максимум функции и(ж, у(ж)). Т.к. при ж < <^(уо) — с функция и(ж, у(ж)) = и(ж, уо) = жуо возрастает, а при ж > ^>(0) — с значение и(ж, у(ж)) = 0, достаточно рассмотреть задачу максимизации и(ж, у(ж)) на отрезке [<^(уо) — с, ^>(0) — с].
(12) и(жор*,у(жор*)) = тах и(ж,у(ж)).
^(уо )-е<х<(р(о)-с
Найдем производную ^и(Х]Х?(х)) = ¿х(ж^-1(с+ж)) и запишем необходимые условия Куна-Такера:
(!3) ^и%Щ)= ^-1(С + ж)+ ж
(14)
^ж ^;(^-1 (с + ж))’
ж
— ^ 1(с + ж)------77 й , 77" — А1 + А2 = 0
^>'(^-1(с + ж))
А1(ж — (^(уо) — с)) =0,
Л2(ж — (^(0) — с)) = 0,
А1 ^ 0, А2 ^ 0.
Запишем выражение для Л ¿х2и) на отрезке [^(уо)—с, ^>(0)—с]:
(15) = (у—(у1))з(2[^/(у)]2—(^(у)—с)^"(у)) |у=^-1(е+х).
Условия (5) гарантируют положительность ^ ¿-2и) и, следовательно, строгую выпуклость —и(ж,у(ж)) на отрезке [^(уо) — с,<р(0) — с].
Максимум на левой границе отрезка достигается при А1 > 0, Л2 = 0. В этом случае жор* = ^>(уо) — с. Выражая А1 из первого уравнения системы (14) и учитывая знак ^>'(у), получаем достаточные условия максимума на левой границе
(16) <р(уо) + уо^'(уо) > с.
Аналогичные рассуждения для случая А2 > 0, А1 = 0 показывают, что при ^>(0) < с у(ж) = 0 и жор* - любое. В остальных случаях нужно решить первое уравнение системы (14) при А1 = А2 = 0 и учесть тот факт, что <^(у) = ж + с. Тогда для жор* получаем уравнения
(17) ( ^(у+)+ уУ(у+) = с
( ) [ж0* = <р(у*) — с.
Таким образом, xopt = ^>(y0) — с, если выполнено условие (16). Если ^>(y0) ^ с, то xopt = 0. В остальных случаях xopt находится из уравнений (17). Найденное значение xopt позволяет вычислить отклик игрока второго уровня y(xopt), а также значения функций выигрыша uopt = u(xopt, y(xopt)) и v°pi = v(xopi,y(xopi)).
Для модельной функции (2) первое уравнение системы (17) выглядит особенно просто:
(18) в-« (1 — £) = с, где £ = qy и с = c/(qR).
3. Игра 2 х 1
Теперь рассмотрим игру, в которой участвуют два игрока первого уровня и один игрок второго уровня. В зависимости от установленных налогов разработчик может увеличить интенсивность разработки в том или ином регионе, тем самым перераспределяя налоговые выплаты. Таким образом, игроки первого уровня начинают влиять друг на друга через оптимальный отклик игрока второго уровня.
3.1. ОПТИМАЛЬНЫЙ ОТКЛИК ИГРОКА ВТОРОГО УРОВНЯ Оптимальный отклик разработчика y(xi ,ж2) =
(yi(xi, x2), y2(®i, x2)) является решением следующей оптимизационной задачи в треугольной области Y = {y1,y2: y1 ^ 0,У2 ^ 0,yi + У2 < Уо}.
(19) v(xi,x2,yi(xi,x2),y2(xi,X2))= max v(xi,x2,yi,y2).
(У1,У2)еУ
Как и ранее, будем решать оптимизационную задачу (19) методом Куна-Такера. Запишем необходимые условия экстремума.
Рис. 3. Область изменения у\ и У2 и характерные участки ее границы
Рис. 4. Разбиение плоскости (х 1, Х2) и область влияния игроков первого уровня
(20)
- <£1(у1) + С1 + Х1 - Л1 + Ло = 0,
- ^2(У2) + С2 + Х2 - Л2 + Ло = 0,
Л1У1 = 0,
Л2У2 = о,
Ло(У1 + У2 - Уо) = 0,
.Л, ^ 0, г = 1,2,3.
Нетрудно проверить, что матрица вторых производных функции -^(Х1,Х2,У1, У2) (при фиксированных Х1 и Х2) положительно определена для любых У1,У2. Поэтому необходимые условия экстремума являются и достаточными условиями максимума «(Х1,Х2,У1,У2).
Рассмотрим все возможные комбинации ненулевых и нулевых коэффициентов Лагранжа Л,, г = 1,2,3. Ненулевое значение коэффициента Лагранжа означает достижение максимума на соответствующей части границы области У. На рис. 3 показана область У и занумерованы характерные участки границы.
При Л о = 0 ограничение У1 + У 2 ^ У о неактивно (оно выполняется со знаком « <»), У1 и У2 выбираются независимо и могут быть найдены по формулам раздела 2.
Значение Ло = 0 соответствует случаю, когда игроки « упираются» в ограничение У1 + У2 = Уо (участки границы 1, 2, 3 на рис. 3). Максимум может достигаться как во внутренних точках отрезка 1-3, так и в крайних точках. Рассмотрим эти случаи отдельно.
Если одно из Л,, например, Л1 = 0, то У1 = 0, У2 = Уо (точка 1). Необходимым и достаточным условием для достижения максимума в точке (0, Уо) является положительность коэффициентов Лагранжа Л1 и Ло.
(21) I Ло = ^2(Уо) - (С2 + х2) > °
I Л1 = Ло - <£>1(0) + (С1 + Х1) > 0.
Если же Л1 = Л2 = 0 (максимум во внутренних точках от-
резка), то
Ло = £1 (У1) - (С1 + Х1) > 0,
(22) Ло = £2(У2) - (С2 + Ж2) > 0,
У1 + У2 = Уо.
Для нахождения оптимального отклика (У1,У2) нужно решить относительно У следующее уравнение
(23) £1(Уо - У) - С1 - Х1 - £2(у) + С2 + Х2 = 0,
где У - оптимальный отклик У2. Заметим, что решение У зависит только от разности ж2 - х1.
(24) У = ^(Ж2 - Ж1).
Рассмотренные выше достаточные условия максимума на границе области У зависят от Ж1 и Ж2. При различных значениях Ж1 и Х2 максимум достигается в различных точках треугольной
области У. Значения множителей Лагранжа также зависят от Ж1 и Ж2. Полагая равными нулю поочередно все множители Лагранжа, мы найдем некоторое разбиение плоскости (Ж1,Ж2). В каждой из получившихся областей (¿/1, ¿/2) имеют различные аналитические выражения. Это разбиение показано на рис. 4. Кроме того, на этом рисунке показаны «образы» характерных участков границы
области У.
342
На кривой BD коэффициент Лагранжа Ао, равный
(25) Ао = ^2(^(Х2 - xi)) - (С2 + Ж2),
принимает нулевое значение. Отсюда можно найти уравнение кривой BD. Однако его можно найти и проще, если заметить, что на кривой BD оптимальные отклики, посчитанные по формулам области BCD, составляют в сумме уо (ограничение начинает работать). Тогда для кривой BD можно записать уравнение
(26) ^-1(ci + xi) + ^-1(c2 + Ж2) = уо.
Для модельных функций (2) это уравнение задает гиперболу.
(27) ci + xi ^ С2 + Х2 yi/q2
51^1 \ 52^2 )
Обратимся к условиям (22). Граница областей 1 и 3, в которых максимум достигается в точках (0,Уо) или (уо, 0), соответствует случаю Л1 = 0 или Л2 = 0 соответственно, а Ло > 0. Например,
(28) [ Ло = £2(Уо) - (с2 + Ж2) > 0,
I Л1 = Ло - £1(0) + (С1 + Ж1) = 0.
Таким образом, границами этих областей являются прямые
(29) АВ : Ж2 = Ж1 + £2(0) - £ч(Уо) + С1 - с2,
: Ж2 = Ж1 + £2(Уо) - £1(0)+ С1 - С2.
Скажем еще пару слов о разбиении на рис. 4.
Замечание 1. При ж, > £,(0) - с разработка в г-том регионе не ведется, поэтому можно ограничить множества стратегий игроков первого уровня до квадрата [0, £1(0) - с1] х [0, £2(0) -с2].
Замечание 2. Ограничение Уо активно только под кривой В^. Над этой кривой оптимальные отклики имеют такой же вид, как и в игре 1 х 1 (т. е. интенсивность разработки в каждом регионе зависит только от налога, установленного в данном регионе). Поэтому игроки первого уровня оказывают влияние друг на друга только в области, лежащей ниже кривой В^.
3.2. РАВНОВЕСИЕ ПО НЭШУ МЕЖДУ ИГРОКАМИ
ПЕРВОГО УРОВНЯ
Теперь, когда найден оптимальный отклик игрока второго уровня, можно построить функции выигрыша игроков первого уровня и1(ж1, Ж2) = Ж1У1(Ж1, Ж2) и и2(ж1, Ж2) = Ж2У2(ж1, Ж2). Они показаны на рис. 11. Исследуем их на выпуклость. Имеет место следующая
Теорема 1. Пусть в игре С с функциями выигрыша (6) и (3) выполнены условия (4) и (5). Тогда функции выигрыша и1(ж1,ж2) = ж1у1(ж1,ж2) и и2(ж1,ж2) = ж2у2(ж1,ж2) выпуклы вверх в области ОАВС^Е по ж1 и ж2 соответственно.
Доказательство. Проведем доказательство для функции
«2(Ж1, Ж2).
Рассмотрим сначала область ОАВ^Е. Запишем выражение для производной внутри ОАВ^Е. В этой области ограничение Уо активно, оптимальный отклик находится из условий (22).
—и
(30) -- = ^(Ж2 - Ж1) + Ж2^'(Ж2 - Ж1),
дЖ2
где ф - решение (23).
д2 и Ox'i
^2(ф) - ^(Уо - ф)
Найдем ^гтг внутри области OABDE.
/чіл d2u2 ,
(31) а? == ^
2 — Х2 ■
(£1(Уо - ф) + ^2(ф))2_ ’
Так как ^;(ж) < 0, требуется проверить выполнение неравенства
(32) 2(^(yo - ф) + ^2(ф))2 - х2(^2/(ф) - ^1/(У0 - ф)) > 0.
Неравенство (32) следует из условий (5) и (22) и уравнений
(23), в этом несложно убедиться, перегруппировав слагаемые в
(32).
Мы показали, что в области OABDE производная < 0 и U2(xi, Ж2) строго выпукла вверх. Строгая выпуклость вверх функции u2(x1,x2) в области BCD доказана в разделе 2 (в этой области она совпадает с функцией выигрыша игры 1 х 1). Далее, непосредственной проверкой можно убедиться в том, что
344
1 »1 0№ПЄГ5 1ах
Рис. 5. Равновесие по Нэшу внутри области влияния, пространство стратегий
Рис. 6. Равновесие по Нэшу внутри области влияния, пространство выигрышей
БД+0
(33) ^ > р.
дж2 ЕВ—0 дж2
Из всего вышесказанного следует, что и2(ж1,ж2) выпукла вверх в области ОАВСОЕ. Теорема доказана.
Приступим к поиску равновесия по Нэшу. Покажем, что точка равновесия не может лежать вне области ОАВСОЕ. То, что она не может лежать вне квадрата [0, ^1(0) — с1] х [0, <^2(0) — с2], следует из замечания 2 на стр. 343. Остается показать, что равновесных точек нет ниже прямой ЕО и выше прямой АВ.
Действительно, пусть ниже прямой ЕО есть равновесие по Нэшу (ж™, ж™). Тогда должно выполняться
(34) Ги^Х,1,^) ^ ^(жьж^) Ужь | М2(жП, ХП) ^ И2(ж™, Х2) Vж2.
Но в этой области оптимальный отклик разработчика равен у2(ж1,ж2) = у0, и производная
дИ2(ж1,Х2)
(35) ---- ------= уо > 0,
дж2
что противоречит условиям (34).
Итак, мы показали, что если равновесие по Нэшу существует, то оно находится в области ОАВСОЕ. Выпуклость этой области
345
Рис. 7. Равновесие по Нэшу на границе области влияния, пространство стратегий
Рис. 8. Равновесие по Нэшу на границе области влияния, пространство выигрышей
очевидна, выпуклость вверх функций u1(x1,x2) и u2(x1,x2) есть утверждение теоремы 1. По теореме Нэша равновесие в игре G существует.
При различных значениях параметров задачи равновесие по Нэшу может лежать как внутри области OABDE, так и на ее границах, либо в области BCD. Первый случай показан на рис.
^opt op ?1 , x2
opt opt
5. Точка (xi ,x<{ ) является решением следующей системы:
^ = Уо - ф(х2 - хг) + хгф'(х2 - хг) = 0,
(36) < 7и\
-— = Ф(Х2 - Хг) + Х2ф'(х2 - хг) = 0.
ОХ2
Переходя к новым переменным £ = хг + Х2, П = Х2 - Хг, после несложных преобразований получаем систему
ф(П) + 2 ф'(П) = уо,
(37) ^ = -Уо
ф'(п)
Решение системы (36) (хгр1 ,х22рг) действительно будет равновесием по Нэшу, если эта точка является внутренней точкой области ОЛИВЕ. Такое расположение равновесия проил-
люстрировано на рис. 5. При помощи преобразования (хг, х2) ^ (иг(хг,х2),и2(хг,х2)) можно перейти в пространство выигрышей, как показано на рис. 6.
Наиболее интересным является случай, когда равновесные по Нэшу точки находятся на кривой ВВ. В этом случае равновесным является целый отрезок кривой ВВ. В пространстве выигрышей он представляет собой участок паретовской границы множества возможных исходов. Это показано на рис. 7 и рис. 8.
Границы этого отрезка можно найти следующим образом. Точка (хг,х2) кривой В В является равновесием тогда и только тогда, когда левые производные функций выигрыша в этой точке положительны, а правые отрицательны.
(38)
+
^і(жі) = р_ (сі + Хі) + Х1 > 0,
Ж2=Ж2(Ж1)
Р^Р- і(с1 + хі)} + Р2(Р_ 1 (с2 + х2)}
с
*з(хі) = Р_(с2 + Х2) +
^2(хі} = Р_ і(сі + х0 + _іХі ---------- < 0,
Рі(Р:і (сі + хш
Рі(Р_ (сі + хі)) + Р2(Р_ (с2 + х2))
^4 (х і) = р_ (С2 + Х2) + Ь
> 0,
Ж2=Ж2(Ж1)
< 0,
Р2(Р2 (с2 + х2)) х2=х2(хх)
р-г (с г + х г) + р-г (С2 + Х2) = Уо.
Обозначим £г,..., ¿4 корни уравнений Ег = 0,..., Е4 = 0 соответственно. Покажем, что каждая из функций ^г,..., ^4 имеет не более одного корня на отрезке [р г(у0) - с г, рг(0) - с г], соответствующем части кривой ВВ, заключенной между точками В и В.
Рассмотрим, например, функцию ^э(хг). С учетом (5) и равенства с г + х г = р г (у г), можно показать, что производная
Рис. 9. Равновесие по Нэшу вне области влияния, пространство стратегий
Рис. 10. Равновесие по Нэшу вне области влияния, пространство выигрышей
(39) dp3 < 0.
dx i
Аналогичный результат может быть получен для остальных функций. Из знакопостоянства производной следует единственность корня каждого из уравнений Fi = 0,..., F4 = 0 (они могут и не лежать между точками \ip1(y0) — c1 и р1(0) — c1]).
Точка t2 всегда расположена левее точки t1, а точка t3 - левее точки t4. Таким образом, отрезок, целиком состоящий из равновесий по Нэшу (мы запишем выражения только для координат Х1), является пересечением следующих трех множеств:
(40) [х 1, x 1 ] = [рч(уо) — сьрч(0) — С1] П [t2,t1 ] П [t3,t4].
Рассмотрим, наконец, область BCD. В ней игроки первого
уровня не оказывают влияния друг на друга, и равновесные стратегии находятся из уравнений типа (17). Если выполнено условие у2 + у2 < Уо, то найденная пара (х1, х2) действительно является равновесием и расположена внутри области BCD. Этот случай показан на рис. 9 и рис. 10.
Проиллюстрируем зависимость равновесия по Нэшу от параметров задачи. В случае, когда точки равновесия по Нэшу заполняют некоторый отрезок, мы будем изображать весь этот от-348
*г
Рис. 11. Функции выигрыша игроков первого уровня
Рис. 12. Зависимость равновесия по Нэшу от количества ресурса
резок. Зависимость равновесия от начального количества ресурса (в симметричном случае) показана на рис. 12.
Замечание 3. В случае, когда множество равновесий по Нэшу - отрезок, игроки должны до начала игры договориться, какое именно равновесие они выберут. Рассматриваемый отрезок является в данном случае « переговорным множеством».
3.3. КООПЕРАЦИЯ ИГРОКОВ ПЕРВОГО УРОВНЯ
В случае сговора игроков первого уровня (в кооперативном случае) мы уже имеем дело не с двумя независимыми игроками первого уровня, а с одним игроком, стратегией которого является пара (х1, Х2). Его выигрыш складывается из выигрышей 1-го и 2-го игроков. Он решает следующую оптимизационную задачу:
(41) u(x1oop,x2oop) = max u(x1,x2) =
Xi,X2 >0
= max (u1(x1,x2) + u2(x1,x2)).
X1,X2 >0
Заметим, что максимум в (41) не может достигаться ниже кривой BD, т.к. игроки могут сместить свои стратегии вдоль линий x1 — x2 = const до линии BD, увеличивая свой выигрыш. При таком согласованном увеличении налогов отклик разработ-
чика изменяться не будет, хотя его доходы будут падать. Значит, максимум достигается в области BCD.
Строгая выпуклость вверх функции и в области BCD следует из условия (5) (см. раздел 2). Покажем, что область BCD также выпукла. На кривой BD зависимость ж2 = y(xi) задается уравнением (26). Покажем, что кривая BD лежит выше касательной к ней.
d2Y
(42) 4 =
92'(9-1(С2 + Ж2» + ÄrVl + Ж1»
> 0.
1(С1 + х1)))2
Ж2=7(жх)
Из всего вышесказанного следует существование и единственность решения задачи (41). Так как и = 0 при Ж1 = Р1(0) — С1, а У>2 =0 при Х2 = Р2(0) — С2, мы можем учитывать только ограничение кривой BD и переформулировать задачу.
(43)
J - Жір- (ci + Xi) - Ж2Р2 (с2 + *2) ^ min,
\ f (Жі,Ж2) = Р21 (ci + Жі) + P-1(C2 + Ж2) ^ yo. Запишем необходимые и достаточные условия минимума:
(44)
р>21(ci + Жі) + P-1(C2 + Ж2) +
Л — ж1
рК^2 1(c1 + Ж1))
Л — Ж2
0,
0,
Р2(Р21(с2 + х2))
Л/(жі ,Ж2) = 0,
Л ^ 0.
При Л = 0 минимум достигается на BD и находится из следующих условий:
' р - 1 (сі + Ж1)р1(р- 1 (сі + Жі)} + Ж1 = = р- 1(С2 + Ж2 ^(Рг 1(С2 + Ж2)) + Ж2,
(45) <
+ Уо < 0,
^ Х2 = 7(^1).
Если же система (45) неразрешима, то решением задачи (41) будет пара решений (17) игры 1 х 1 для первого и второго регионов. В этом случае решение задачи о кооперации совпадает с равновесием по Нэшу. Очевидно, при таких условиях кооперация не играет роли.
4. Игра N х 1
Рассмотрим игру, в которой участвуют N ^ 2 игроков первого уровня и один игрок второго уровня ^ лидеров и один последователь). Будем считать, что игроки первого уровня симметричны, и ограничимся поиском симметричного решения игры. Запишем функцию выигрыша разработчика.
Рассмотрим необходимые условия экстремума (являющиеся и достаточными условиями максимума вследствие сильной выпуклости вверх функции V по у) вблизи симметричного равновесия по Нэшу. Предположим, что все игроки выбрали симметричные стратегии хед, а один отклонился от нее на малую величину.
N
і=1
- р(уі) + с + жєд - Лі + Ао = 0, і = 1,..., N - 1,
— р(yN) + с + ЖN - ЛN + Л0 = 0
ЛіУі = о, і = і,..., N
N
Ло(£ Уі - Уо) = °
і=1
ІЛі ^ 0, і = 0,1,..., N.
(49)
<
Найдем оптимальный отклик yopt в этом случае. Рассмотрим все возможные комбинации нулевых и ненулевых коэффициентов Лагранжа Aj. Если Ао = 0, то игроки не влияют друг на друга, и игра распадается на N игр 1 х 1. Необходимым и достаточным условием такого расположения максимума является выполнение следующего неравенства:
(48) р-1(с + xeq) <N0.
Если же Ао = 0, то все Aj = 0, i = 1,..., N в силу симметрии задачи и малости отклонения N-го игрока. В этом случае получается система уравнений
' Ао = р(Уг) - (с + xeq) > 0, i = 1,..., N - 1,
Ао = p(yw) - (с + Xn) > 0,
N
5^y* = ^
i=1
из которой получается следующее уравнение для yN (учитывая симметрию поведения первых N — 1 игроков):
(50) ^yN -Т) - (С + Xeq) - ^(yN) + (С + XN) = 0.
Если все игроки, кроме N-го, придерживаются равновесных по Нэшу стратегий, то функция выигрыша N-го игрока un (x) = XnyN имеет максимум по Xn в равновесной точке. Найдем оптимальную стратегию N-го игрока при условии, что остальные игроки придерживаются стратегий xeq. Равновесие по Нэшу мы найдем из условия х^Р* = xeq.
Если максимум un (x) достигается в области, где игроки не влияют друг на друга, то ж^Р* и xeq находятся по формулам раздела 2. Если же максимум достигается при активном ограничении, то его можно найти из следующего условия:
dUN . dyN . Xn „
(51) 1--- = yN + XN ^------- = yN + —---- T = °.
dxN dxN N1rl p'( ) + P'(yN)
Учитывая, что yN = N при ж^Р* = xeq, получаем уравнение
opt = xeq = y0^; (N)
N- 1 .
(52) xNP = x'
Если же максимум достигается на изломе, то, как мы видели в разделе 3.2, равновесие по Нэшу неединственно. В симметричном случае эту проблему легко решить, выбрав симметричную точку
хед _( У0 > „ ._( У0
(53) х69 = (^5^^ - С>...,^ - С).
Запишем уравнения (50) и (52) для модельной функции (2).
„У0-УМ
дЯе 9 М-1 — (с + ж69) = дЯе 9УМ — (с + ж^),
(54) ж«* = Г6, = д2Дуое-”0/" жм ж ^ — 1 .
Отметим следующий парадокс. В случае, когда равновесие по Нэшу достигается при активном ограничении, оптимальный отклик разработчика не зависит от количества ресурса Я при симметричных налогах. Можно было бы ожидать, что и равновесие по Нэшу не зависит от Я. Однако мы видим, что это не так. Дело в том, что количество ресурса влияет на устойчивость симметричного набора стратегий х69 = (ж,..., ж) относительно малых отклонений одного игрока, поскольку при несимметричных налогах оптимальный отклик разработчика зависит от Я. Таким неявным образом Я оказывает влияние на равновесие по Нэшу.
Обсудим теперь влияние конкуренции на выигрыши игроков обоих уровней. Рассмотрим некий регион с количеством ресурса Л0 и коэффициентом плотности ресурса до. Разделим его на п частей. При этом на каждую часть будет приходиться = Ло/п ресурса. Чтобы плотность ресурса дпЛга была одинаковой при любых п, нужно формально положить = д0п. Тогда
^(у) = Я (1 — е-9опу),
(55) Ыу) = доЯое-90пу,
рП(у) = —пдо2Яое-9рпу.
Исследуем зависимость от п выигрыша игрока второго уровня, а также суммарного выигрыша игроков первого уровня. Если равновесие по Нэшу достигается при пассивном ограничении, то зависимости от п нет, т.к. игроки в этом случае не оказывают
влияния друг на друга. Поэтому сосредоточимся на случае, когда равновесие по Нэшу достигается при активном ограничении уо. В этом случае
(56) ж'« (п) = пд§До Уое-90У0,
п—1
если выполнено
(57) с + ж6«(п) < р(^) = доЯое-9оУо.
В этом случае суммарный выигрыш разработчиков равен
(58) _ пже*^ЯоуОе-™0^- _
п п — 1
1
_ %2Я0У02е-90У0 (1 +
п— 1
В пределе при п ^ ж выигрыш разработчиков падает до уровня
(59) = д2ЯоУо2е-«0У0.
На рис. 13 показана зависимость суммарного выигрыша игроков первого уровня от налога ж (несложно показать, что она одинаковая для всех п). На графике отмечены выигрыши в точках равновесия по Нэшу, которые выбирают игроки в условиях конкуренции при различных п. На рис. 14 то же показано для игрока второго уровня. Его выигрыш с ростом п увеличивается до предельного значения
(60) ^ = Яо (1 — е-90У0) — (с + д0ЛоУое-«оуо )^.
Замечание 4. Заметим, что ситуация, когда при маленьких п равновесие достигается при пассивном ограничении, а при больших п - при активном, невозможна. Это следует из того, что в условие (48), как легко проверить, не входит п.
5. Заключение
В настоящей работе исследованы двухуровневые конфликтные системы, возникающие в задачах совместной разработки природных ресурсов. В этих системах игроки первого уровня устанавливают правила игры для игроков второго уровня. В одношаговой двухступенчатой игре (игре внутри сезона) между несколь-
Рис. 13. Суммарный выигрыш игроков первого уровня в точке равновесия по Нэшу в зависимости от количества игроков
Рис. 14. Суммарный выигрыш игрока второго уровня в точке равновесия по Нэшу в зависимости от количества игроков
кими владельцами ресурса и разработчиком решена задача распределения усилий разработки по регионам при произвольных налогах, исследованы вопросы существования и единственности точки равновесия по Нэшу. Показано, что при определенных условиях точка равновесия по Нэшу будет неединственна, и получено полное описание множества таких точек. Получено аналитическое решение игры для случая 2-х владельцев и для N симметричных владельцев. Все рассуждения проведены для функций выигрыша из довольно общего класса. Кроме того, исследованы эффекты кооперации владельцев, а также поведение решения при увеличении числа независимых владельцев. Показано, что увеличение числа владельцев приводит к перераспределению доходов между владельцами и разработчиком (в пользу разработчика), однако на объеме разработки это не сказывается.
Рассмотренная здесь задача допускает ряд обобщений. Во-первых, большой интерес представляют задачи с произвольным количеством как владельцев, так и разработчиков. Полное аналитическое исследование таких задач чрезвычайно громоздко и практически невозможно. При численном моделировании следу-
ет считаться с такой особенностью задачи, как неединственность равновесия по Нэшу. Другим важным обобщением задачи является рассмотрение игры в динамике, особенно интересное для возобновляемых природных ресурсов. Для решения таких задач, в которых происходит частичное восстановление ресурса в межсезонье, применяется метод динамического программирования. Отдельный интерес представляют задачи нахождения стационарных решений.
Литература
1. МУЛЕН Э. Теория игр с примерами из математической экономики. - Москва: Мир, 1985.
2. ОУЭН Г. Теория игр. - Москва: Мир, 1971.
3. CLARK C.W. Restricted access to common-property fishery resources: a game-theoretic analysis // Dynamic Optimization and Mathematical Economics (Eds. Liu, P.-T.). - New York: Plenum, 1980. - P. 117-132
4. GOLUBTSOV P.V., MCKELVEY R. The Incomplete-
Information Split-Stream FishWar: Examining the
Implications of Competing Risks // Natural Resource Modeling. - 2007. - Vol. 20, № 2. - P. 263-300.
5. HOMANS F.R., WILEN J.E. A Model of Regulated Open Access Resource Use // Journal of environmental economics and management. - 1997. - Vol. 32. - P. 1-21.
6. LEVHARI D., MIRMAN L.J. The great fish war: an example using a dynamic Cournot-Nash solution // Bell Journal of Economics. - 1980. - Vol. 11. - P. 322-344.
7. LUENBERGER D.G. Linear and Nonlinear Programming. -Addison-Wesley, 1984.
8. MCKELVEY R. Game-theoretic Insights into the international management of fisheries // Natural Resource Modeling. - 1997. - Vol. 10, № 2.
9. MCKELVEY R., GOLUBTSOV P. A Regional Fisheries Strategic Management Game // Natural Resource Modeling. -2010. (submitted)
10. MCKELVEY R., GOLUBTSOV P.V. The Effects of Incomplete Information in Stochastic Common-Stock Harvesting Games // Advances in Dynamic Games, AISDG.
- 2006. - Vol. 8. - P. 253-292.
11. MCKELVEY R., GOLUBTSOV P., MILLER K., CRIPE G. Binational Management of a Transboundary Marine Fishery: Modeling the Destabilizing Impacts of Erratic Climatic Shifts. Climate Change and the Economics of the World’s Fisheries: Examples of Small Pelagic Stocks (Eds. R. Hannesson, M. Barange, S. Herrick Jr.). - Edgar Elgar Press, 2006. - P. 236261.
12. MILLER K., GOLUBTSOV P., MCKELVEY R. Fleets, Sites and Conservation Goals: Game Theoretic Insights on Management Options for Multinational Tuna Fisheries. In World Fisheries: a social-ecological analysis (Eds. R. Ommer, I. Perry, P. Cury, K. Cochrane). - Wiley-Blackwell, 2010.
TWO-LEVEL COMPETITIVE STRUCTURES IN COMMON RESOURCE DEVELOPMENT
Yury Korolev, Moscow State University, Moscow, post-graduate student ([email protected]),
Peter Golubtsov, Moscow State University, Moscow, Doctor of Science, professor ([email protected]).
Abstract: This paper studies the effects of owner-developer interaction in resource development. Resource is supposed to be allocated among several proprietors, and several companies are permitted to develop it. Marine fishery gives one of the most interesting examples. We study this game in the context of multinational management of transboundary marine fishery. It is well known that unconstrained harvesting often leads to resource depletion. This effect is often called "the tragedy of commons". The situation becomes more complex when we take into account competition among resource proprietors. Such interaction can be described as a game with players of two different types: proprietors and developers, called first- and second-level players, respectively. The first-level players establish the rules (taxes on development efforts) for the second-level players, who, in their turn, optimize their strategies reasoning from these rules. Every developer receives profit from resource selling and returns part of it to the owner as a tax. The systems described here appear in management problems for energy resources, mineral resources, biological resources, water resources, etc.
Keywords: optimal resource management, common natural resources, tragedy of commons, two level games, Nash equilibrium, Stackelberg game with multiple leaders, mathematical modeling.
Статья представлена к публикации членом редакционной коллегии В. В. Мазаловым