Научная статья на тему 'Асимметрия в кооперативной задаче управления биоресурсами'

Асимметрия в кооперативной задаче управления биоресурсами Текст научной статьи по специальности «Математика»

CC BY
307
67
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА УПРАВЛЕНИЯ БИОРЕСУРСАМИ / АСИММЕТРИЧНЫЕ ИГРОКИ / АРБИТРАЖНОЕ РЕШЕНИЕ НЭША / BIORESOURCE MANAGEMENT PROBLEM / ASYMMETRIC PLAYERS / NASH BARGAINING SOLUTION

Аннотация научной статьи по математике, автор научной работы — Мазалов Владимир Викторович, Реттиева Анна Николаевна

В работе представлены результаты исследования теоретикоигровых задач управления биоресурсами, учитывающих асимметрию участников процесса эксплуатации. Рассмотрены следующие варианты несимметричности игроков: использование различных коэффициентов дисконтирования и различные (случайные) горизонты планирования. Целью работы является определение кооперативного выигрыша и его распределение между участниками в несимметричных случаях. Для построения кооперативных выигрышей и стратегий игроков предложено использование арбитражной схемы Нэша. Показано, что применение арбитражного решения для определения кооперативного поведения не только выгодно обоим игрокам, но и благотворно влияет на экологическую обстановку.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Asymmetry in a cooperative bioresource management problem

Discrete-time game-theoretic models related to a bioresource management problem (fishery) with asymmetric players are investigated. Players use different discount factors and have different random planning horizons. The main goal here is to construct the value function for the cooperative solution and to distribute the joint payoff among the players in asymmetric cases. We propose using the Nash bargaining solution to obtain cooperative profits and strategies. It is shown that cooperative behavior determined by bargaining schemas is not the only profitable one for players but is better for ecology.

Текст научной работы на тему «Асимметрия в кооперативной задаче управления биоресурсами»

УДК 519.833.2 ББК 22.18

АСИММЕТРИЯ В КООПЕРАТИВНОЙ ЗАДАЧЕ УПРАВЛЕНИЯ БИОРЕСУРСАМИ1

Мазалов В. В.2, Реттиева А. Н.3

(ФГБУН Институт прикладных математических исследований Карельского научного центра РАН, Петрозаводск)

В работе представлены результаты исследования теоретико-игровых задач управления биоресурсами, учитывающих асимметрию участников процесса эксплуатации. Рассмотрены следующие варианты несимметричности игроков: использование различных коэффициентов дисконтирования и различные (случайные) горизонты планирования. Целью работы является определение кооперативного выигрыша и его распределение между участниками в несимметричных случаях. Для построения кооперативных выигрышей и стратегий игроков предложено использование арбитражной схемы Нэша. Показано, что применение арбитражного решения для определения кооперативного поведения не только выгодно обоим игрокам, но и благотворно влияет на экологическую обстановку.

Ключевые слова: задача управления биоресурсами, асимметричные игроки, арбитражное решение Нэша.

Введение

Статья посвящена исследованию рационального поведения в динамической задаче управления биоресурсами с двумя участ-

1 Работа выполнена при финансовой поддержке РФФИ, грант №13-01-00033_а.

2 Владимир Викторович Мазалов, доктор физико-математических наук, профессор ([email protected]).

3 Анна Николаевна Реттиева, кандидат физико-математических наук, доцент ([email protected]).

280

никами. Главной целью рационального природопользования является поддержание стабильного развития популяции. Поэтому изучение разницы между кооперативным и эгоистическим (индивидуальным) поведениями в задачах оптимального управления биоресурсами является важной задачей (см., например, [7,9]).

Известно, что при кооперации устанавливается более щадящий режим эксплуатации. Для поддержания кооперативного поведения участников используется принцип динамической устойчивости [2,6,17]. А для стабильности соглашения и невыгодности его нарушения необходимо выполнение условия «защиты от иррационального поведения» [1,23]. Идея этого подхода также состоит в сравнении выигрышей игроков при некооперативном поведении и при разрушении кооперативного соглашения с последующим эгоистическим поведением.

Удобной для исследования процессов эксплуатации ресурсов в дискретном времени является модель «рыбных войн» [8]. Предполагается степенная функция развития популяции и логарифмические функции «мгновенных» выигрышей игроков. Тогда общий выигрыш участника определяется как конечная или бесконечная сумма дисконтированных «мгновенных» выигрышей. В такой модели равновесные по Нэшу и кооперативные стратегии определяются в аналитическом виде. Исследованию кооперативного поведения и динамической устойчивости кооперативных решений в модели «рыбных войн» посвящено множество работ [4,5,11,15,19]. Еще одним преимуществом данной модели является то, что динамически устойчивые решения и условия, стимулирующие кооперативное поведение, также строятся в аналитическом виде.

Исследование кооперативного и некооперативного поведения в задачах управления биоресурсами со случайным горизонтом планирования является важной теоретической и практической задачей. В работах [20] и [10] построены кооперативные стратегии и динамически устойчивые решения в случае, когда горизонт планирования является случайной величиной с заданным распределением.

Традиционно при исследовании кооперативного поведения в задачах природопользования предполагается использование игроками одинаковых коэффициентов дисконтирования. Если же они различаются (в этом случае игроки являются несимметричными), то нет возможности определить выигрыши игроков при кооперативном поведении стандартными способами. Проблема построения кооперативного поведения в данном случае мало изучена, несмотря на то, что асимметрия распространена в реальных экологических задачах. Например, страны, заключающие кооперативное соглашение, могут иметь различный уровень инфляции, экологические условия и т.д. В работах [13] и [22] было показано, что конфликты при эксплуатации ресурсов могут возникать из-за разницы в уровнях дисконтирования (предпочтениях во времени). Поэтому важной задачей в исследовании кооперативного поведения в задачах управления биоресурсами является поиск оптимального компромисса в случае, когда цели игроков различаются (различные коэффициенты дисконтирования и затраты на вылов).

В работе [4] было предложено построение кооперативного выигрыша как взвешенной суммы индивидуальных выигрышей (в непрерывном случае см. [18]). Данный подход вызывает критику, так как игрок с большим коэффициентом дисконтирования покидает процесс эксплуатации достаточно быстро, но должен получить свою долю от общего выигрыша коалиции. Авторы показали, что при определении весовых коэффициентов с помощью арбитражного решения Нэша вся выгода от кооперативного соглашения достается первому участнику. Заметим, что это ущемляет интересы второго игрока, что не должно быть при подписании кооперативного соглашения. Другой подход был предложен в [21], где решение определяется с помощью арбитражной схемы.

Арбитражная схема Нэша была применена в [3] для определения общего коэффициента дисконтирования, после чего задача сводится к определению динамически устойчивого распределения общего кооперативного выигрыша. В [14] кооперативные стратегии получены из максимизации взвешенной суммы инди-

видуальных выигрышей, и замечено, что данное решение должно удовлетворять решению задачи максимизации произведения Нэ-ша. Получен хорошо известный результат, что при применении побочных платежей кооперативный выигрыш делится поровну.

В данной работе для построения и стимулирования кооперативного поведения предложено использование арбитражной схемы Нэша. Таким образом, при использовании предложенного подхода нет необходимости в суммировании выигрышей несимметричных игроков. Арбитражная схема дает абсолютно другое решение (см. классический пример в [16]). При построении кооперативного поведения с помощью максимизации взвешенной суммы выигрышей игроков существуют области параметров задачи, при которых кооперативные выигрыши игроков меньше, чем некооперативные [4]. Это невозможно в представленной схеме: при кооперативном поведении, определенном с помощью арбитражного решения, выигрыши игроков больше или равны (при некоторых параметрах) выигрышам в равновесии по Нэшу (в разделе 5 представлены результаты моделирования, показывающие этот факт).

Еще одной важной прикладной задачей является определение кооперативных выигрышей в случае различных горизонтов планирования. Когда время участия одного из игроков меньше, чем у другого, то игрок включается в процесс эксплуатации (в данном случае - вылов) на фиксированное время и готов вступить в кооперацию зная, что это более прибыльно для него. Но так как у игрока меньший, чем у партнера, горизонт планирования, то он должен получить выгоду от кооперации больше, чем игрок, который продолжает процесс эксплуатации ресурса дальше.

Модель со случайными временами участия в процессе эксплуатации является наиболее приближенной к реальности, так как внешние случайные процессы могут вызвать расторжение кооперативного договора и участники не могут знать этого заранее. Например, рыболовецкие артели могут обанкротиться, флот может быть поврежден и т.д. В случае участников-стран может

разразиться кризис, резко измениться уровень инфляции, международные или внутреннее экономические и политические ситуации могут измениться и т.д. Все эти процессы могут разрушить кооперативное соглашение, и определение кооперативного поведения участников процесса природопользования в данном случае не было исследовано ранее.

В работе исследуется дискретная теоретико-игровая задача управления биоресурсами. Игроки (страны или рыболовецкие артели) эксплуатируют ресурс, развитие которого описывается степенной функцией. «Мгновенные» выигрыши игроков имеют логарифмический вид.

Игроки используют различные коэффициенты дисконтирования, что можно интерпретировать как их различные предпочтения во времени. Развитием этой модели является ситуация, когда горизонты планирования игроков различаются как следствие расторжения кооперативного договора или по другим причинам. Хотя при заключении контрактов предполагается фиксированное время участия, внешние процессы могут заставить участника выйти из игры, поэтому естественно рассматривать его горизонт планирования как случайную величину.

Из всего выше сказанного следует, что для определения кооперативного поведения в моделях с различными коэффициентами дисконтирования и временами участия в процессе эксплуатации необходима разработка новых методов. Поэтому в данной работе для построения кооперативных стратегий и выигрышей игроков в этих случаях предлагается использовать арбитражную схему Нэша.

Результаты получены в аналитическом виде, что позволит использовать их для конкретных рыбных популяций с соответствующими параметрами.

Статья организована следующим образом. В разделе 1 представлена модель и определено равновесное по Нэшу решение. Модель с различными коэффициентами дисконтирования рассмотрена в разделе 2, где кооперативное поведение строится с использованием арбитражной схемы Нэша. В разделе 3 иссле-

дована модель, в которой игроки различаются не только коэффициентами дисконтирования, но и горизонтами планирования. Результаты численного моделирования представлены в разделе 4. А в разделе 5 приведены основные результаты и их обсуждение.

1. Модель и равновесие по Нэшу

Рассматривается дискретная теоретико-игровая модель управления биоресурсми с одинаковым горизонтом планирования у обоих игроков, но с различными коэффициентами дисконтирования.

Пусть два игрока (страны или рыболовецкие артели) эксплуатируют ресурс на протяжении конечного горизонта планирования [0, п]. Динамика развития популяции имеет вид

(1) xt+1 = (ext - Uit - U2t)a, xo = x,

где xt ^ 0 - размер популяции в момент времени t; e £ (0,1) -коэффициент естественной выживаемости; а £ (0,1) - коэффициент естественного роста; Uit ^ 0 - вылов игрока i, i = 1, 2.

Предполагается логарифмический вид функции выигрышей игроков и наличие различных коэффициентов дисконтирования. Тогда выигрыши игроков имеют следующий вид:

n

(2) Ji = £ ¿t ln(Uit),

t=0

где ¿i £ (0,1) - коэффициент дисконтирования игрока i, i = 1, 2. Теорема 1. Равновесные по Нэшу стратегии в задаче (1),

(2) имеют вид

t-1 . t-1 . ea2 Е ai eaiYl aj2

N _ _j=0_ N _ _j=0_

U1t = t t x, U2t = t t x,

E ai E a2-1 E a1 E a2-1

j=0 j=0 j=0 j=0

где ai = aii, i = 1,2, t = 1,..., n.

Индивидуальные выигрыши игроков -

nn

(3) VN(x, ¿i) = £(ai)j ln x + ^(¿i)n-j Aij - (¿i)n ln k,

j=0 j=1

Основной проблемой в данной ситуации является то, что нет возможности определить выигрыши игроков при кооперативном поведении стандартными способами. В работе [4] было предложено построение кооперативного выигрыша как взвешенной суммы индивидуальных, но данный подход не является традиционным для кооперативной теории игр. Поэтому для построения и стимулирования кооперативного поведения в работе предложено использование арбитражной схемы Нэша.

2. Многошаговая игра и рекурсивная арбитражная схема Нэша

Определим кооперативное поведение в данной модели с помощью рекурсивной арбитражной процедуры. В каждый момент времени кооперативные стратегии находятся из арбитражного решения, где в качестве точки статус-кво выступают некооперативные выигрыши.

Начинаем рассмотрение с одношаговой игры и предполагаем, что в конце игры игроки делят оставшийся ресурс в пропорции к : (1 — к). Этот подход отличается от традиционно используемого в исследовании моделей «рыбных войн» равного деления. Параметр к предполагается здесь заранее заданным, а в дальнейших исследованиях может быть использован для регулирования кооперативного поведения. Заметим, что деление оставшегося ресурса не означает, что ресурс весь исчерпывается. В данном предположении игроки получают компенсацию (выраженную в денежных единицах, если домножить на некоторую константу) за неиспользованный ими ресурс.

Пусть начальный размер популяции равен х. Предположим, что игроки играют индивидуально, тогда выигрыш первого игро-

(4)

к=0 к=0

ка имеет вид

= 1п(«ц) + ¿11п(к(ех — ни — и21)а) = = 1п(н11) + а11п(ех — н11 — н21) — ¿11п(к)

и, аналогично, выигрыш второго -

Н21 = 1п(н21) + а21п(ех — н11 — н21) — ¿2 1п(1 — к).

Максимизируя вогнутые функции выигрышей, получим некооперативные стратегии обоих игроков:

N =_£а2_ N =_£а1_

н11 = (1+0X1+01—1х' Н21 = (1 + а1)(1 + а2) — 1х'

и выигрыши в равновесии по Нэшу:

(5) Я1 = (1 + а1)1п(х)+ Ап — ¿11п(к),

(6) Я27! = (1 + а2) 1п(х) + А21 — ¿21п(1 — к),

где Ац и А21 не зависят от х и имеют вид (еа, )1+* а*

Ац = 1п

1((1 + а1)(1 + а2) — 1)1+*

г,; = 1, 2, г =

Для определения кооперативных стратегий решается задача максимизации произведения Нэша

(7) ЯС = (1п(щ) + а11п(ех — щ — Н2) — ¿11п(к) — ЯЦ) ■ ■(1п(и2) + а21п(ех — н1 — н2) — ¿21п(1 — к) — Я21) =

Гп — Я1Л[)(Я2С1

= (ЯС1 — Я11)(Я2С1 — Я21) ^ тах,

где ЯК заданы в (5)-(6).

В Приложении 1 приведено доказательство того, что решение задачи (7) достигается во внутренней точке допустимого множества и единственно. Этот результат верен и для всех задач максимизации, решаемых далее.

Из условий первого порядка получим следующую связь кооперативных стратегий игроков в одношаговой игре:

еж - «1(1 + 01)

(8) «2 =-—-.

1 + Й2

Как обычно, в моделях «рыбных войн», ищем кооперативные стратегии игроков в линейном виде «1 = 7С1Ж, «2 = 721ж, и из условий первого порядка они могут быть найдены из решения следующего уравнения:

721 ( 1п(721) + 021п(е - 711 - 7^1) - ¿21) =

= 7п ( 1п(7и) + 011п(е - 711 - 7У - Ап)

со связью

с _ е - 711(1 + а1)

721 = Г+0 .

К сожалению, аналитическое решение не может быть найдено. Ниже будут представлены результаты численного моделирования.

Тогда кооперативные выигрыши в одношаговой игре имеют

вид

Ни (711,721; ж) = (1 + 01)1п(ж) +

(9) + 1п(7у + 011п(е - 7^1 - 7221) - ¿11п(к), #21(711,721; ж) = (1 + 02)1п(ж) +

(10) + 1п(7^1) + 021п(е - 7^1 - 7221) - ¿2 1п(1 - к).

Теперь перейдем к двухшаговой игре. Сначала предположим, что участники играют индивидуально до конца игры, тогда игроки максимизируют свои выигрыши вида

я$ = 1п(«12) + ¿1я1Л[ =

= 1п(«12) + 01 (1 + 01) 1п(еж - «12 - «22) + ¿1А11 - (¿1)21п(к), = 1п(«22)+02(1+02) 1п(еЖ-«12-«22)+£2 А21 - (¿2)2 1п(1-к). Максимизируя, получим некооперативные стратегии:

N _ е(02 + 02) N _ е(01 + 02)

«12 = "2 2 ж, «22 = ~2 2 ж,

Е 01 Е -1 Е Е 02-1

3=0 3=0 3=0 3=0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и выигрыши в равновесии по Нэшу:

(11) Я? = (1 + ai + a?) ln(x) + A12 + ¿iAn - ln(k),

(12) Я?? = (1 + a? + a?) ln(x) + A?? + ¿?A?i - ¿2 ln(1 - k),

где Ai2 и A?? не зависят от x.

Кооперативные стратегии определяются из решения задачи максимизации произведения Нэша в двухшаговой игре:

Я? = (ln(ui) + ¿iH?i(7?i, Y??i; x) - Hi?)-

■ (ln(u?) + ¿?Я?1(тиЛ21; x) - Я??) = = ^ln(ui) + (ai + a?) ln(gx - ui - u2) +

+ ¿i(ln(7ii) + ai ln(g - 7ii - Y??i)) - ¿2 ln(k) - Я??) ■

■ (ln(u?) + (a? + a?) ln(gx - ui - u?) +

+ ¿?(ln(7?i) + a? ln(g - Yn - 7??i)) - ¿?? ln(k) - Я??) =

= № - Яй)(Я??? - Я??) ^ max, где ЯЦ (Yii, y?1 ; x) заданы в (9)-(10) и Я? определены в (11)-(12).

Аналогично, из уравнений первого порядка получим уравнение для нахождения yI? и yC? со связью

= g - y1?(1 + ai + ai)

1 + a? + a? '

Тогда, кооперативные выигрыши в двухшаговой игре имеют следующий вид:

Я^Стп^^л??; x) =

= (1 + ai + ai) ln(x) + ln(Yi?) + (ai + a?) ln(g - y?? - Y???) + (ln(Yii) + ai ln(g - Yii - Y??i)) - ¿i ln(k), Я^Ти^^Л??; x) = = (1 + a? + a?) ln(x) + ln(Y2?) + (a? + a?) ln(g - y?? - Y??) +

+£?(ln(Y2i) + a? ln(g - Yii - Y?i)) - ¿2 ln(1 - k).

289

Повторяя процесс для п-шаговой игры, получим следующий результат.

Теорема 2. Кооперативные выигрыши в задаче (1), (2) имеют вид

Щ«^ ..., 71« 7^1,..., 72«;ж) = ^ 011п(ж) - ¿« 1п(к) +

3=0

«— 1

3=0

«—3

(13) + ^ ¿«_3 1п(71«-з) + ^ 011п(е - 71«-з - 722«-з)

г=1

. . . , 71« 721, ... , 722«; ж) = ^ 02 1п(ж) - ¿« 1п(1 - к) +

3=0

«— 1 «—3

(14) + £ ¿«_3 |~1п(72«_3) + £ 02 1п(е - 71«-3 - т^«--)

Кооперативные стратегии могут быть найдено рекурсивно из уравнений

- ¿3 А2«_3 =

722« Е(¿« 3 [1п(72«_3)02 1п(е-71«_3 -72«_3)

3=0 г=1

«_ 1 «_ 3

= 71« £¿«_3 [1п(71«_3Н^М1п(е-72n_j-72«_3^ -¿3¿ш^)

со связью

е - 71« Е 01

72« =

г=0

«

Е 02

г=0

где Ау имеют вид (4).

3. Случайные времена участия в процессе эксплуатации

Теперь исследуем модель, в которой игроки различаются не только коэффициентами дисконтирования, но и горизонтами планирования. Причем предполагается случайная природа моментов выхода игроков из кооперации, что обусловлено тем, что внешние стохастические процессы могут вызвать расторжение кооперативного договора.

Пусть первый игрок эксплуатирует ресурс на протяжении щ моментов времени, а второй - на протяжении щ моментов времени. При этом щ является дискретной случайной величиной с диапазоном значений {1,..., п} и соответствующими вероятностями {^1,..., 0«}; щ - дискретная случайная величина с тем же диапазоном и вероятностями {ш1,..., ш«}. Предполагается, что горизонты планирования независимы. Таким образом, на промежутке времени [0, щ] или [0, П2] игроки вступают в кооперацию, и необходимо определить их стратегии.

Выигрыши игроков определяются как математические ожидания:

«1

Я1 = Е{ Е Н"«)1!«!^} +

4=1

«2 «1 + (Е^ 1п(ии)+ е ^1{«1>«2}}

4=1 4=«2 + 1

« « «1

= Е ^«1 Е ^«2 Е 1п("14) +

п1 = 1 «2 =«1 4=1

«1-1 «2 «1

(15) + Е Е 1п(«и)+ Е Ь«4

«2 = 1 4=1 4=«2 + 1

Н = Е{ Ё ¿2 1п(и24)/{ «2

4=1

«4 «2

+ (Ё ¿2 4^) + Ё ¿2 Ь^)) /{„2 >«1}}

4=1 4=«1 + 1

«2

= Е "«2 [ Е ^«1 £ ¿2 1п(И24) +

«2 = 1 «1=«2 4=1 «2-1 «1 «2 (16) + Ё 0щ(Ё ¿2 4^) + Ё ¿2 1п(иа4)

«1 = 1 4=1 4=«1 + 1

где и"4 - стратегия игрока г, когда его партнер покидает игру, г = 1,2.

3.1. РАВНОВЕСИЕ ПО НЭШУ

Для определения кооперативного поведения используется арбитражная схема Нэша, где в качестве точки статус-кво выступают выигрыши при некооперативном поведении. Поэтому начнем с определения равновесных по Нэшу стратегий. Выигрыши игроков (функции Беллмана) за весь период продолжения игры имеют вид

« «1

(1, х) = тах„ { £ 0«1 Е "«2 Е ¿4 )

11>...> 1п «1 = 1 «2=«1 4=1 «1-1 «2 «1 + Ё Ё ¿1 1п(и*4)+ Ё ¿4 1П(и?4)

«2 = 1 4=1 4=«2 + 1

« « «2 ^. )ё Ё 0« Ё ¿2'^

^(1, х) = тах^ { Е "«2 [ Е 0«^ ¿2 1п(и*4) +

21>...> 2п «2 = 1 «1=«2 4=1 «2-1 «1 «2 + Ё 0щ(Ё ¿21п(и*4)+ Ё ¿21п(«а4)

«2-1 «1 «2

¿244)+ Ё ¿2,-'~°

«1 = 1 4=1 4=«1 + 1

В дальнейшем исследовании необходимы выигрыши игроков при наступлении момента времени т, т = 1, 2,... Заметим, что 292

вероятности того, что первый игрок, например, продолжит участвовать в процессе эксплуатации т, т + 1,..., п моментов времени имеют вид

0т 0т+1 0«

« , « , . . . , « .

Е Е Е 01

1=т 1=т 1=т

Следовательно, при наступлении момента времени т функции Беллмана игроков V*(т,х), г = 1, 2, примут вид

« « « «1 ^(т, X) = шах„ { Е "Н Е ^ Е «11п("*4) +

1т'...' 1п «1=т 01 «2 =«1 Е 4=т 1=т 1 1=т 1

«1-1 «2

(17) + Е Е 1п("*4) + *?(т,П1)] },

«2=т 4=т

1=т

(т, х) = шах I Е [ Е ^ Е «21п("2^) +

«2

(18)

где

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

_ « / J « _

и2т>...>и1п Ч«2=т «1=«2 01 4=т

1=т 1=т

«2-1 0 «1

+ Е ^ Е «2 1п(и*4) + ^Т(т,П2)] },

«1=^ Е 4=т

1=т

«1 - 1

«1

П"(т,П1) = Е Е «41п("?4),

«2=т ^ 4=«2 + 1 1=т

«2 - 1

«2

VI (т, П2) = Е Е «2 1п("14)

«1=т 01 4=«1+1 1=т

- выигрыши игроков, когда игрок г, г = 1, 2, эксплуатирует ресурс индивидуально, и они будут определены позже.

В приложении 2 показано, как получить связь между

Vм (т, х) и Vм (т + 1, х) вида

(т, х) = ¿т 1п«т) + Ртт+1 Vм (т + 1, х) +

П1

(19)

+ С1т £ ¿* 1п«4),

П1=т +1

2=т

УМ (т,х)_ ¿2 1п«) + рт+1 УМ (т + 1,х) +

П2

(20)

где

+ С2т Е ¿2 1п(иУ,

П2=т +1

2=т

Е ^ £ 01

рт +1 _ 1=т +1 1=т+1 т п п '

Е 01

1=т 1=т

С1т _

Шт 1 „ 0т

, с2т _

1

пп

Е ^ Е 01

1=т 1=т

пп

Е 0г Е

1=т 1=т

Теперь необходимо определить стратегию игрока, когда его оппонент покидает игру. Предположим, что горизонт планирования первого игрока меньше, чем второго, и рассмотрим временной промежуток [П1,П2], где второй игрок эксплуатирует ресурс индивидуально. Начнем с одношаговой игры и предположим, что в конечный момент игрок получает весь оставшийся ресурс. Аналогично, заметим, что это означает получение некоторой компенсации за неиспользованный им ресурс, а не полное исчерпывание ресурса.

Пусть начальный размер популяции х. Как и ранее, ищем стратегию второго игрока в линейном виде: _ 721ж. Тогда выигрыш второго игрока в одношаговой игре имеет вид

#21(721) _ 1п(721ж) + ¿21п(еж - 721ж)а _

_ (1 + «2) 1п(х) + 1п(721) + Й2 1п(е - 721).

Так как данная функция является вогнутой, то для нахождения максимума используем условия первого порядка и получим

£

стратегию 721 =-и выигрыш в виде

1 + Й2

£

#21(721) = (1 + °2) 1п X + (1 + Й2) 1п^—-) + Й2 1п Й2.

1 + Й2

Следовательно, выигрыш второго игрока в двухшаговой игре примет вид

#22(721,722) = 1п(722Х) + «2Я21(721) =

= (1 + Й2 + а2) 1п(х) + 1п(722) +

+02(1 + а2) 1п(£ - 722) + «2 ((1 + а2) 1п^—-£—) + а21п аП.

V 1 + а2 /

Аналогично, из условий первого порядка получим 722 =

12 и выигрыш второго игрока в виде

1+«2+«2

#22(721,722) = (1 + а2 + а2)1п х+(1+а2+а2)1п( £ 2) +

1 + а2 + а2

+(а2+а2) 1п(а2+а2)+«^ (1+а2) 1п(—£—)+ а21п аП.

1 + а2

£

1+а2'

Продолжая процесс п2 - т шагов, получим, что стратегия второго игрока, оставшегося в процессе эксплуатации, имеет вид

72«2-т = „2-£т , а выигрыш -

Е «2

3=0

^2а(т, П2) = #2«2-т (721, . . . , 72«2-т) =

«2 т-3 гЕ

1пх + £ ««2-т^1,

а^ 1п х 3=0 3=1

где

^ = ЕТ а2 1п(+ £ а21п(£ аР). 1=0 Е ар 1=1 р=1

Р=0

Аналогично действуя для первого игрока, получим оптимальные стратегии игроков, индивидуально эксплуатирующих ресурс, в виде

= £(1 - ^ х

"»4 — ^ + Х

1 - аг

£

а индивидуальные выигрыши -

П1 П1-Т П1-Т

(21) уа(т, щ) =Ё 1п(<4) = Ё а 1пж+ Ё 5Т-Т—2^, г=1,2, г=т 2=0 2=1

где

2 = Ё а! 1п(-^- ^ + Ё а! 1п(Ё а?), г =

^2 = Ёа-1п(+Еа- а?),г = 1,2. г=° Е а? 1=1 ?=1

г

р=0

Вернемся к построению равновесия по Нэшу. Как обычно, в моделях «рыбных войн» функции выигрыша ищем в виде (т, ж) = АТ 1п ж + ВгТ и предполагаем линейный вид стратегий игроков -ЦТ = 7г^Тж, г = 1, 2.

Тогда, используя связи между функциями выигрыша (19) и (20), запишем уравнения Беллмана в виде

А 1п ж + ВТ =

= ¿Т 1п(7*ж) + РТТ+1(аА11п(ех - ж - т2Тж) + ВТ) +

п п! —Т п! —Т

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(22) +С1Т Ё 0П!( Ё а! 1пж + Ё ¿П!—Т—2^2),

П!=Т+1 2=0 2=1

А21п ж + В2 =

= ¿2 1п(72^ж) + РТ+1(аА21п(еж - 7£ж - 72^ж) + В2Т) +

п П2 —Т П2 —Т

(23) +С2Т Ё ^П2 ( Ё а21пж + Ё ¿П2—Т—Е^).

п2=Т+1 2=0 2=1

Максимизируя, получим равновесные по Нэшу стратегии:

„ = £¿1А2 * = £¿2 А1

71Т ¿1А2+¿2А+аА1 А2РТ+1 ¿гА2+¿2+аА1 А2РТ+1.

Коэффициенты АТ и ВТ получим из (22) и (23):

п П!—Т , п П2 —Т ,

¿1+С1Т Е 0п! Е а1 ¿2+С2т Е ^п2 Е а2

(24) А1=-п!=Т+1+1 2=0 ,А2=-п2=Т+1+1 2=0 ,

V 7 1 1 - аВгТ+1 , 2 1 - аВгТ+1 , 296

В = 1 - рт+1

В = 1- Я+1

1п«) + р;+11п(е - < - 72Т) +

« «1 —т

+С1т Е 0П1 Е Т—' ^

п1=т + 1 3=1

1п(7£) + аА2РТ+11п(е - - 72ЛТ) +

« «2—т

«2—Т —3 п.?

(25) +С2т £ ^^ ¿«2—т—3^2

«2=т+1 3=1

Следовательно, равновесные по Нэшу стратегии и выигрыши определены в виде (т, ж) = Ат 1п ж + Вт, г = 1, 2. Приступим к определению кооперативного поведения игроков.

3.2. КООПЕРАТИВНОЕ РАВНОВЕСИЕ

Для построения кооперативных стратегий и выигрышей игроков применяется арбитражная схема Нэша для всего периода продолжения игры. Таким образом, необходимо решить следующую задачу:

(^Г(1,Ж) - ^(1,Ж))(^С(1,Ж) - ^(1,Ж)) = « « «1

= (Е 0«1 [ Е ^«2 Е ¿11п(«1*) +

«1 = 1 «2 =«1 1=1 «1 — 1 «2 «1

+ Е ^«2 (Ё ¿11п(«и)+ Е ¿11п(«?4)^ - ^(1,ж)) ■ «2 = 1 1=1 1=«2 + 1

« « «2 (26) ■( Е ^ [ Е ^«1 Е ¿2 1п(«21) +

«2 = 1 «1=«2 1=1

«2—1 «1 «2 + Е 0«1 (Е ¿2 1п(иУ + Е ¿2 1п№)] - (1,ж)) ^ тах, «1=1 1=1 1=«1+1

где (1, ж) = АГ 1п ж + , г = 1, 2, - выигрыши в равновесии по Нэшу, определенные в (22)-(25).

Аналогично предыдущему подразделу получим связь между функциями Беллмана (кооперативными выигрышами) при наступлении моментов времени т и т + 1:

VÍc(t, x) = ST ln(u1T) + PTT+1 Vc(t + 1, x) +

n ní

+ CiT E 0ní E St ln«t)

ní=T+1 t=T

V2c(T,x) = S2 ln(uc2T) + Ptt+1V2c(T + 1,x) +

П2

+ C2t E Wn^ S¿ ln(uat).

П2=Т+1 t=T

Теорема 3. Кооперативные выигрыши в задаче (1), (15), (16) со случайными горизонтами планирования имеют вид

V¿c(n — k, x) =

=sn k ln(uC„-fc) + apn_kk+lGn_k+i ln(^x — u1n-fc— u2n-fc) + k_1

+ E pnn--^ [Sn-1 ln(YÍn-i) + «Pnn--/+1 ln(e — YCn_1 — YCn-i)] +

_k) + aPn_kk+1Gn—k+1 ln(^x — u1n-k — u2n_k)

k-1

n_k [Si ln(Yin_1) + aPn_1 /1n_í / 2n_

1=2

+P—1 [Sn_1 ln(YÍn_1)+Pn_1aAi ln(e—YCn_1 — Y2Cn—1)+iBi] +

k

(27) + E k Cin_iV/ (пг),

1=1

где

n ní

v1 (m)= e ^ní E sí ад),

ní=n—1+1 t=n_1 n n2

V21 (П2)= E Wn2 E S2 ln(uat),

n2 =n—1+1 t=n_1

k

\ rn—1 ^ k—1 r>n—1 i „k л nn „• 10 Gk = 2_> S a Pn_k + a AiPn_k, г = 1, 2. 1=1

Кооперативные стратегии связаны как

X«— кг«— к г«—к с /~*1 2 £ ¿2 /1^—к ик

(28) 7с«—к ¿«—к ^2 '

(29) .с = ¿«—к^с«—к1^2

( ) 71«—к ¿«—+ 7с«—1(скс2 - с1ск) •

Стратегия первого игрока на последнем шаге - 71«—1 определяется из решения одного из условий первого порядка.

Доказательство. Доказательство приведено в приложении 3.

Заметим, что все параметры выражены через одну неизвестную стратегию первого игрока на последнем шаге - 71«_ 1, для определения которой необходимо решить одно из уравнений условий первого порядка, например последнего

а^Р«—! м

-(^с(1,ж) - ^ (1,ж)) +

£ 71«—1 72«—1

+ (I"1 - £ ^с )(П'(1,ж> - V-(1,ж)) = 0.

^72«—1 £ - 7с«—1 - 7с«—^

К сожалению, аналитического решения не существует, поэтому ниже будут представлены результаты численного моделирования.

4. Результаты моделирования

4.1. ^-ШАГОВАЯ ИГРА

Моделирование было проведено для 20-шаговой игры со следующими параметрами:

£ = 0,6, а = 0,3, жо = 0,8, ¿1 = 0,85, ¿2 = 0,9.

Сравним кооперативные и некооперативные выигрыши

У1«с(ж, ¿1) = -14,1039 > ^(ж, ¿1) = -14,6439,

^2«с(ж, ¿2) = -20,5108 > (ж, ¿2) = -23,2596. 2 2 299

Заметим, что кооперация выгодна обоим игрокам, и данная схема построения кооперативного поведения дает преимущество игроку с большим коэффициентом дисконтирования.

Рис. 1. Размер популяции: темная линия - кооперативное поведение, светлая - равновесие по Нэшу

На рис. 1 представлен размер популяции, а на рис. 2, 3 - выловы игроков. Заметим, как и ранее, что кооперативное поведение не только выгоднее игрокам, но и лучше для экологической ситуации, так как допускает более щадящий режим эксплуатации.

Рис. 2. Вылов первого игрока: темная линия - кооперативное поведение, светлая - равновесие по Нэшу

Рис. 3. Вылов второго игрока: темная линия - кооперативное поведение, светлая - равновесие по Нэшу

Сравним выигрыши игроков при изменении коэффициентов дисконтирования. На рис. 4 представлены выигрыши У1Щс(х, ¿1) и У2с(х, ¿2) для ¿1 = 0,1,..., 0,9 и ¿2 = 0,1,..., 0,9. Заметим, что игрок с более высоким коэффициентом дисконтирования получает больше выгоды от кооперации. И игроки получают одинаковые выигрыши при совпадении коэффициентов дисконтирования.

При использовании предложенного в работе метода определения кооперативного поведения кооперативный выигрыш игрока всегда больше или равен (при некоторых параметрах) выигрышу в равновесии по Нэшу. На рис. 5 представлены выигрыши второго игрока при кооперативном и эгоистическом поведении. Следовательно, предложенный подход стимулирует кооперативное поведение, что не всегда выполняется при применении других подходов определения кооперативных стратегий и выигрышей игроков [2].

4.2. СЛУЧАЙНЫЕ ГОРИЗОНТЫ ПЛАНИРОВАНИЯ

Для моделирования был использован метод Монте-Карло и п = 10. Использовались те же параметры задачи и следующие вероятности

вг = 0,1, = 0,005г + 0,0725.

Получены ожидаемые выигрыши при кооперации и в равновесии по Нэшу

У1с(1,х) = -6,2151 > У^(1,х) = -10,1958,

У2с(1,х) = -7,3256 > У/(1,х) = -12,8829.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На рис. 6 представлены результаты моделирования при 50 симуляциях при эгоистическом поведении, а на рис. 7 - при кооперации. Точками обозначены результаты моделирования, а кругом - ожидаемые выигрыши, полученные в (22)-(25) и (27).

Рис. 6. Равновесие по Нэшу

Также приведем результаты моделирования для конкретных значений горизонтов планирования, а именно п- = 10, П2 = 20 и

к = з.

Сравним кооперативный и некооперативный выигрыши первого игрока на временном промежутке [0,п-]:

У1с(п1,х) = -10,3870 > У1М(щ,х) = -11,9010.

Рис. 7. Кооперативное равновесие

Для второго игрока сравним его кооперативный выигрыш на промежутке [0,п1 ] плюс выигрыш от индивидуального поведения на промежутке времени [п1,п2] после кооперации с некооперативным выигрышем на промежутке [0, п.] плюс выигрыш от индивидуального поведения на промежутке времени [п1,п2] после эгоистического поведения:

у2е(п2,х) = -19,6375 > У2Н(п2,х) = -23,2596.

Заметим, что кооперативные выигрыши обоих игроков больше, чем выигрыши в равновесии по Нэшу.

На рис. 8 показан размер популяции на всем промежутке планирования [0,п2], откуда еще раз видно, что кооперативное поведение благотворно влияет на экологическую обстановку.

Вылов первого игрока на промежутке [0, п.] показан на рис. 9, а вылов второго игрока на промежутках [0,п1] и [п1,п2] - на рис. 10. Заметим, что при кооперации вылов второго игрока меньше, чем в равновесии по Нэшу, но это компенсируется его дальнейшей индивидуальной эксплуатацией ресурса.

Теперь сравним выигрыши игроков для различных горизонтов планирования в случае, когда первый игрок покидает игру раньше. На рис. 11 представлены функции выигрыша У1е(п1,х)

Рис. 8. Размер популяции: темная линия - кооперативное поведение, светлая - равновесие по Нэшу

Рис. 9. Выигрыш первого игрока: темная линия - кооперативное поведение, светлая - равновесие по Нэшу

Рис. 10. Выигрыш второго игрока: темная линия -кооперативное поведение, светлая - равновесие по Нэшу

и У^П, х) для П2 = 2,..., 10 и пх = 1,..., П2 — 1. Видно, что чем пх ближе к п2, тем меньше разница между выигрышами игроков.

Заметим, что при использовании предложенного метода определения кооперативного поведения кооперативный выигрыш игрока всегда больше или равен (при некоторых параметрах) выигрышу в равновесии по Нэшу. На рис. 12 представлены выигрыши второго игрока при кооперативном и эгоистическом поведении для различных горизонтов планирования. Следовательно, это еще раз показывает, что предложенный подход стимулирует кооперативное поведение.

5. Заключение

Традиционно в задачах оптимального управления биоресурсами предполагается, что игроки используют одинаковые коэффициенты дисконтирования и горизонты планирования. В реальных эколого-экономических системах эти параметры различаются и, более того, могут иметь случайную природу. В таком случае стандартные схемы определения кооперативного поведения

10 1

Рис. 11. Кооперативные выигрыши игроков

Рис. 12. Выигрыш второго игрока: в равновесии по Нэшу и кооперативный

не могут быть применены и необходима разработка новых методов построения кооперативных выигрышей и стратегий игроков.

В работе исследуется теоретико-игровая задача управления биоресурсами в дискретном времени с несимметричными игроками, использующими различные коэффициенты дисконтирования (предпочтения во времени). Для определения кооперативных стратегий и выигрышей участников используется рекурсивная арбитражная схема Нэша. Предложенная схема отличается от стандартного способа определения общего кооперативного выигрыша как взвешенной суммы индивидуальных выигрышей игроков. Арбитражное решение Нэша стимулирует кооперативное поведение в случае, когда коэффициент дисконтирования одного из игроков больше, чем другого. Показано, что кооперативные выигрыши участников при использовании предложенной схемы больше или равны (при некоторых параметрах) выигрышам при эгоистическом поведении.

В работе также исследована дискретная задача управления биоресурсами, в которой игроки различаются не только коэффициентами дисконтирования, но и горизонтами планирования. Причем предполагается, что времена участия в процессе эксплу-

атации ресурса являются случайными величинами с различными распределениями. Таким образом, один из участников покидает игру в случайный момент времени и получает некоторую компенсацию за неиспользованный им ресурс. Оставшийся игрок продолжает процесс эксплуатации индивидуально до окончания его горизонта планирования. Для построения кооперативного поведения в данном случае используется арбитражная схема Нэша для всего периода продолжения игры. Сначала определены равновесные по Нэшу стратегии и выигрыши игроков, используемые как точка статус-кво. Затем кооперативные стратегии и выигрыши игроков построены с помощью арбитражной схемы.

Преимущество использования арбитражной схемы Нэша заключается в возможности рассмотрения игроков как независимых. В традиционном подходе функция общего кооперативного выигрыша представляется суммой индивидуальных выигрышей игроков, что далеко от реальной ситуации. Например, если игроки - это граничащие страны, то это даже невозможно, особенно в случае различных горизонтов планирования. Другие недостатки традиционной схемы описаны во введении. Арбитражное решение Нэша в некотором смысле похоже на равновесие по Нэшу (см. [12]). Игроки действуют индивидуально, как и ранее, но в рамках кооперативного соглашения.

Литература

1. МАЗАЛОВ В.В., РЕТТИЕВА А.Н. Условия, стимулирующие рациональное поведение, в дискретных задачах управления биоресурсами // Доклады РАН. - 2010. - Т. 432, №3.-С. 308-311.

2. ПЕТРОСЯН Л.А. Устойчивость решений дифференциальных игр со многими участниками // Вестник Ленинградского университета. Серия 1: Математика, механика, астрономия. - 1977. - №19. - С. 46-52.

3. РЕТТИЕВА А.Н. Задача управления биоресурсами с асимметричными игроками // Математическая теория игр и ее приложения. - 2013. - Т. 5, вып. 3. - С. 72-87.

4. BRETON M., KEOULA M.Y. A great fish war model with asymmetric players // Ecological Economics. - 2014. -Vol. 97. - P. 209-223.

5. DENISOVA E., GARNAEV A. Fish wars: cooperative and non-cooperative approaches // Czech Economic Review. -2008. - Vol. 2, №1. - P. 28-40.

6. HAURIE A. A note on nonzero-sum differential games with bargaining solution // J. Optim. Theory Appl. - 1976. -Vol. 18. - P. 31-39.

7. KAITALA V.T., LINDROOS M. Game-theoretic applications to fisheries // Handbook of operations research in natural resources. - Springer, 2007. - P. 201-215.

8. LEVHARI D., MIRMAN L.J. The great fish war: an example using a dynamic Cournot-Nash solution // The Bell J. of Economics. - 1980. - Vol.11, №1. - P. 322-334.

9. LINDROOS M., KAITALA V.T., KRONBAK L.G. Coalition games in fishery economics // Advances in Fishery Economics. Blackwell Publishing, 2007. - P. 184-195.

10. MARIN-SOLANO J., SHEVKOPLYAS E.V. Non-constant discounting and differential games with random time horizon // Automatica. - 2011. - Vol. 47. - P. 2626-2638.

11. MAZALOV V.V., RETTIEVA A.N. Fish wars and cooperation maintenance // Ecological Modelling. - 2010. -Vol. 221. - P. 1545-1553.

12. MO J., WALRAND J.Fair end-to-end window-based congestion control // IEE/ACM Transactions on Networking. - 2000. - Vol. 8, №5. - P. 556-567.

13. MUNRO G.R. The optimal management of transboundary renewable resources // Canadian Journal of Economics. -1979. - Vol. 12, №8. - P. 355-376.

14. MUNRO G.R. On the Economics of 'Shared Fishery Resources // International Relations and the Common Fisheries Policy. - Portsmouth, 2000. - P. 149-167.

15. NOWAK A. A note on an equilibrium in the great fish war game // Economics Bulletin. - 2006. - Vol. 17, №2. - P. 1-10.

16. OWEN G. Game theory. - Academic Press, 1968. - 320 p.

17. PETROSJAN L., ZACCOUR G. Time-consistent Shapley value allocation of pollution cost reduction // Journal of Economic Dynamic and Control. - 2003. - Vol. 7. - P. 381398.

18. PLOURDE C.G., YEUNG D. Harvesting of a Transboundary Replenishable Fish Stock: A Noncooperative Game Solution // Marine Resource Economics. - 1989. - Vol. 6. - P. 57-70.

19. RETTIEVA A.N. Stable coalition structure in bioresource management problem // Ecological Modelling. - 2012. -Vol. 235-236. - P. 102-118.

20. SHEVKOPLYAS E.V. The Shapley value in cooperative differential games with random duration // Annals of the Int. Soc. of Dynamic Games. - 2011. - Vol. 11. - P. 359-373.

21. SORGER G. Recursive Nash bargaining over a productive assert // J. of Economic Dynamics & Control. - 2006. -Vol. 30. - P. 2637-2659.

22. VISLIE J. On the optimal management of transboundary renewable resources: a comment on Munro's paper // Canadian Journal of Economics. - 1987. - Vol. 20. - P. 870875.

23. YEUNG D.W.K. An irrational-behavior-proof condition in cooperative differential games // International Game Theory Review. - 2006. - Vol. 8, №4. - P. 739-744.

Приложение 1.

Покажем, что решение задачи (7) существует, единственно и достигается во внутренней точке допустимого множества. Запишем (7) в виде задачи минимизации произведения Нэша

H = (-Hi + HN)№ - ЫЦ) ^ min

на множестве

(30) Hfi - Hh < 0,

(31) H2N - H2C! < 0,

—(еж — «i — u2) ^ 0, ■ui ^ 0, u2 ^ 0.

Используя теорему Куна-Таккера, запишем функцию Лагранжа в виде

L = (—Hii + HNi )(H2i — H2Ni) +

+ Ai(Hi1 — Hii) + A2(H^ — H2i) — Аз (еж — ui — U2).

Заметим сразу, что множитель Лагранжа A3 может быть исключен из условий минимума, так как условия для него имеют вид

еж — ui — u2 ^ 0, А3(еж — ui — u2) = 0,

и, если предположить, что А3 > 0, то еж — ui — u2 = 0 и H[i = H2i = —ж, что противоречит условиям (30), (31).

Следовательно, запишем условия Куна-Таккера только для двух множителей Лагранжа (здесь введено обозначение ж = еж —

—1 - —2):

1

—1

(--1 + Щ № - яЦ + Л!) + "X(Я?1 - ЯД - Л2) > 0,

\ и 1 X / X

-1+^) (Я2х - Я21+Л !)+а2(Я?! - ЯN+Л2)

- Щ" + (Я2 1 - Я2 1 + Л 1) + "(Я11 - Я 1 1

(--1 + -) (Я?1 - Я N + Л2) + ~~ (Я21 - Я21 + Л 1) > 0,

V "—2 X ' X

--1 + "X)(Я1С1 - яЦ + Л2) + ^№ - Я21 + Л1)1 = 0,

—2 X / X

0,

-2

(32) Я^ - яЦ ^ 0,

(33) Л1 (Я1С1 - Я1Л[) = 0,

(34) Я221 - Я21 ^ 0,

(35) Л2(Я221 - Я2^) = 0,

—1 ^ 0, —2 ^ 0, Л1 ^ 0, Л2 ^ 0.

1) Рассмотрим случай Л1 = 0, Л2 > 0, тогда из (35) получим

Я21 - Я21 =

Если хотя бы одна из стратегий щ, г = 1, 2, равняется нулю, то условия (32) или (34) не выполняются. Следовательно, щ > 0, г = 1, 2, и тогда

Я с тгМ \

11 - Я11 = -Л2,

что противоречит условию (32).

2) Аналогично, в случае Л1 > 0, Л2 = 0 получим Я21 - Я21 = -Л1, что противоречит условию (34).

3) Рассмотрим случай Л1 > 0, Л2 > 0, тогда из (33) и (35) получим

Я11 - Я11 = 0, Я21 - Я21 = 0.

Аналогично первому случаю, легко проверить, что щ > 0, г = 1, 2, а целевая функция Я^ равна нулю. Из системы

условий Куна-Таккера получим

(36) Следовательно

1 + а14

—1 х /

1 + а2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-- —

—2 х

+

х а1 х '

Л2 — —2 А1. «1

Из первого уравнения (36) получим

(37) (--! + + —2 )А1 — о.

V —1 х х —1/ Так как в данном случае кооперативное поведение совпадает с некооперативным, то —1 — —^, —2 — — 2 • Подставляя некооперативные стратегии, запишем (37) в следующем виде:

-—Л1 — о.

—1х

Получили, что А1 — 0, что противоречит предположению.

4) Окончательно, рассмотрим случай А1 — Л2 — 0. Аналогично, легко проверить, что — > 0, г — 1, 2. Следовательно, минимум достигается во внутренней точке допустимого множества и может быть найден из условий первого порядка.

Для того чтобы показать, что условия Куна-Таккера являются достаточными условиями в задаче (7), рассмотрим вторую производную Я[ по — 1:

(1

а1

—2

х2

/1 — (^ + )№ - н21) + ^№ - яд) + ^

Й2

2а2

х2

х

1 —1

а1 х J

и по — 2 :

1

Й2

—2

а1

/2 — (Г2 + )№ -яД) + ^(Я21 - я22) + ^

х2

2й1

х

1

—2

Й2 х J 313

о

1

Следовательно, вогнута, если / ^ 0 и /2 ^ 0. Заметим, что для этого выражения в квадратных скобках должны быть положительны. Таким образом, условия принимают вид

еж — и1(1 + а1) — и2 ^ 0, еж — и1 — и2(1 + а2) ^ 0 .

Из условий первого порядка получим решение в виде (8), поэтому в точке максимума выполняется

Следовательно, полученное решение удовлетворяет условиям. Более того, условия выполняются и в некоторой окрестности точки решения, так как

Таким образом, показано, что условия Куна-Таккера являются достаточными условиями существования максимума.

Покажем, что полученное решение единственно. Предположим, что существуют два решения: «1,^2 и й1,й2. Из условий Куна-Таккера получим следующие соотношения:

1п(«2) + а21п(еж — и1 — «2) 1п(«2) + а21п(еж — й1 — «2)

1п(и1) + а11п(еж — и1 — «2) 1п(й1) + а11п(еж — й1 — «2)

еж — и1(1 + а1) — «2(1 + а2) = 0.

а2и2 > 0, а1и1 > 0.

«2

«2

Подставляя выражения (8) для «2 и «2, запишем

+

Исследуем функцию f и покажем, что она равна нулю только при ui = Ui.

Легко видеть, что f возрастает по u1 и убывает по u1. Рассмотрим пределы u1 ^ 0 и u1 ^ Tlß^. Выражение для второго предела получено из условий неотрицательности еж — u1(1 + а1) и ежа2 — u1(a2 — а1).

Сначала рассмотрим f1 = u1u1f.

Так как

lim f1 = u^lnf„ gX ) + a2lnf gx°2 «х-о^1 4 V1 + a^ 2 V1 + a2//

lim f1 = — uA ln(т~Ж ) + a2 ln( ,gXaM ), h^ о V V1 + a2 / V1 + a2 ) )

то

f

lim f = lim —— = —то «i-0 «i-0 u1u1

lim f = lim f\ = то.

«1 -0 «i -о u1u1

Теперь рассмотрим f2 = (еж — u1(1 + a1))(ex — u1(1 + a1))f. Так как

lim f2 = — M-^-) + a1 lnf-^)) V V1 + aj V1 + a2//

lim f2 = lnf—еЖ—^ + a1 lnf exa2 ^, «i-^ f2 V1 + aj 1 V1 + a^,

f2

lim f = lim ----—-—--— = то

-^ «i-^ (еж — U1(1 + a1))(ex — U1(1 + a1))

f2

lim f = lim ----г----г- = —то.

«i-ifar «i-lfar (еж — U1(1 + a1))(ex — U1(1 + a1))

то

и

и

и

и

Следовательно, / равно нулю только при и1 = йь а так как такая точка единственна, то и полученное решение единственно.

Аналогичным образом показывается, что решения всех задач максимизации в данной работе достигаются во внутренних точках, единственны и могут быть получены из условий первого порядка.

Приложение 2. Равновесие по Нэшу

Проведем доказательство для первого игрока (найдем связь между У?(т, х) и У?(т + 1,х)), а для второго процедура аналогична. Из (17) запишем функцию Беллмана первого игрока при наступлении в игре момента времени т:

й п

У?(т, х) = шах 1£ -Щ^- *[ 1п(<) +

1т, , 1п ^ й п2=т ^ Щ 1=т 1=т

п „ п П1

+ £ ^ч £ I: ^ ш«)+

П1=т+1 й\ П2=П1^ Щ Ъ=т 1=т 1=т

П1-1 П2 й

+ £ ^ £ ^ 1п(й?;) + УГ(т, П 1 )] } = -П^-К 1п(й?т) + п2=т Е Щ *=т Е й

1=т 1=т

п ~ п п1

+ £ -йН £ -Щ^- ( £ ^ 1п(й?;)+¿т 1п(й?т)) +

п1=т+1 й\ п2=п^ Щ *=т+ 1 1=т 1=т

п1 - 1 п2

+ £ ( £ ^ 1п(й?;) + ¿т 1п(й?т)) + У"(т,П1) п2=т Щ *=т +1

1=т

и,

«1

' в г '

„1 1п(—1т)+ е -^^[Е —— 7 ^ „1 Ш(—14)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

«2

«1 =т+1 в\ П2=га1 ^2 *=т+1 1=т г=т

П1 — 1

Е „1 1п(—^

+ Е Е „11п(—

«2=т+1 ^ ^ 1=т+1 г=т

«2

Т,П1)

Е вг

= „т 1п(—1т)+ Е

вп1 г=т+1

Щ=т+^ Е вг Е вг

г=т+1 г=т

Е

Е «1

г=т+1 Е „51п(<)+

_ и и _

«2=^1 ^2 Е *=т+1

г=т+1 г=т

«1 — 1 Е «2

+ е е „1 )

«2=т+1 Е Е 4=т+1

г=т+1 г=т

«1 Е

Е „11п(<) + ПЧт +1, П1)

—— Е *=т

г=т

«

Е ^

г=т

(38)

= „т 1п("1т) + Р-Г+ V (т + 1,: « «1 +С1т Е в«1 Е „11п(—и),

«1 =т +1 1=т

где

Е ^ Е 1

рт+1 = г=т+1 г=т+1

Е ^ Е вг

г=т г=т

^ С1т =

Шт 1

Е^^ вг

г=т г=т

Аналогично, получим связь между У? (т, х) и У? (т + 1,х) в виде

У? (т,х) = 511п(и?т) + Ртт+1У? (т + 1,х) +

п2

+ С2 т/ Щп2

п2=т+1 *=т

где

С = _йт__

С 2т п п ■

Е йг Е Щ

1=т 1=т

Приложение 3. Кооперативное равновесие

Определим кооперативные выигрыши игроков УС(т, х) при наступлении момента времени т как

п „ п п1

УС(т, х) = щсшах { £ ^ [ £ -Щ^- £ 5* 1п(<) +

1т1п т=т^ Й1 п2=п^ щ г=т 1=т 1=т

п1 — 1 п2

(39) + £ ^ £ 5* 1п(й1*) + У1а(т,П1)] },

п2=^ Е Щ *=т

1=т

п п ~ п2

У2с(т, х) = щспааах^ £ -Щ^ [ £ ^ £ 5* 1п(йУ +

2т^^ 2п п2=т ^ щ щ=«2 £ йг Ь=т 1=т 1=т

п2 —1 й п1

(40) + £ £ 5* 1п(й2*) + УТ(т, П2)] }■

п1=т £ щ *=т г=т

Начнем с ситуации наступления момента времени п. Так как на следующем шаге п + 1 выигрыши обоих игроков нулевые, то

оптимальные кооперативные стратегии совпадают с равновесными по Нэшу, а выигрыши имеют вид

Vc(n,x)= ¿n ln(<J = (n,x) =

= ¿n ln(7in x) = A ln x + Bi,i = 1,2, гДе e

Ai = ¿n, Bi = ¿nln(7lNj = ¿inln(2), i = 1,2.

Теперь, предположим, что в игре наступил момент времени n — 1. Следовательно, задача (26) принимает вид

(41) (Vc(n-1,x)—(n—1, x))(V2C(n—1, x)—V2N(n—1,x))^max, где

Vf (n — 1, x) = ¿n-1 ln(u1n-1) +

n

+Pn-lVC(n, (ex — uln-1 — u2n-l)a) + Cin-10n E ¿1 ln(Ult),

1=n—1

VC (n — 1,x) = ¿n-1 ln(u2n-1) +

n

+рП-1^2С(п, (ex — u1n-1 — u2n-1 )a) + C2n-1Wn E ¿2 ln(ult).

t=n— 1

Запишем задачу (41) в виде

(¿n—1 ln(u1n—1) + С—1M1 ln(ex — u1n—1 — u2n—1) + B1) +

n

+C1n—10n E ¿1 ln(Ull) — VN (n — 1,x)) ■

1=n—1

•( ¿n—1 ln(u2n—1) + pn— 1M2 ln(ex — u1n—1 — UL— 1) + B2) +

n

+C2n— 1Wn E ¿2 ln(uat) — V2N(n — 1,x)).

1=n—1

Как обычно, ищем стратегии игроков в линейном виде ufn_ 1 = Yin_ 1x, i = 1, 2. Тогда условия первого порядка примут

вид

, xn— 1 рn aA .

7^--g Pr1 1c (V?(n - 1, x) - V2n(n - 1, x)) -

Win—1 6 71n-1 72n- 1

P n aA

(42)--cn—1_2 c (Vc(n - 1,x) - V? (n - 1, x)) = 0,

6 7ln-1 72n- 1

P n aAi

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

n—1" 1 "(V2c(n - 1,x) - V2N(n - 1,x)) +

6 7cn-1 72n-1

+ ¿2- Pnn-1«A2

7cn- 1 6 7cn-1 72n-1

(43) ■(У1с(п - 1, х) - У?(п - 1, х)) = 0.

Вычитая (43) из (42), получим следующее соотношение:

5п— 1

У1С(п-1,х)-У?(п-1,х) = -п-тY22-T■ (УС(п 1, х) У?(п-1,х))

52 71п—1

подставляя которое в (42) получим связь между кооперативными стратегиями игроков:

с _ 5п—15п—- 5п—17?п—1(5п—1 + ^—1^1)

(44) 7L-1

¿n-1(^n-1 + Pn-1^2)

Перейдем к ситуации, когда в игре наступил момент времени n - 2. Тогда, задача (26) примет вид

(45) (V1c(n-2, x)-V1N(n-2, x))(V2c(n-2, x)-V2N(n-2, x)) ^max, где

n ni

Vc(n - 2, x) = ¿n-2 ln(u1n-2) + C1n-2 £ 0ni £ ln(uft) +

ni=n-1 t=n-2

+РП-Х(п-1, (ex -Un-2 u2n-2)°),

n n2

V2c(n - 2, x) = ¿n-2 ln(u2n-2) + C2n-2 £ ^ £ ¿2 ln(uat)

n2=n-1 t=n— 2

+Pn-21V2c(n-1, (ex-u1n-2-u2n-2)°).

Математическая экология: теоретико-игровые модели Перепишем задачу (45) в виде

(„«—2 1пК«—2) + Р«—21(„«—1 + Р«— 1«А1) ■ ■а - —1«—2 - —2«—2) + Р«—21(„«—11п(7?«—1) +

+Р«— 1аА11п(е - 7?«—1 - 72«—1) + Р«— 1В1) + Р«—21Сы—1в« ■ « « «1 ■ Е „11п«4)+С1Г—2 Е в«1 Е „11п(—14)-^(п-2,^) ■ 1=«—1 «1=«—1 1=«—2

■ (¿Г 2 ln(u2n- 2) + P-21(¿T 1 + P- 1 аА2) ■ ■а 1n(ex - uln-2 - u2n-2) + Pn-21(¿n-1 ln(7Cn-1) + +РП-1аА21п(е - 7in-1 - 7L-1) + РП-1В2) + PnT^n-^n ■

n n П2

■ £ ¿2 1n(u2t) + Cn-2 £ Wn2 £ ¿2 1n(«St) -t=n-1 n2=n-1 t=n-2

- V2N(n - 2, x) j ^ max.

Находя стратегии в линейном виде u2n_ 2 = Yin-i = 1, 2, запишем условия первого порядка для задачи (45):

( ¿n-2 «P-1 (¿n-1 + «A1Pnn-1)-

7ln-2 £ 7ln-2 72n-2 '

(46) ■ (V22 (n - 2, x) - V2n(n-2, x)) -

PT2a(¿n-1 +aA2Pn , , Ní

n-2 1 c2-c2 n-1; (V1c(n-2, x) - V^(n-2, x)) = 0,

£ - 7ln-2 - 72n-2

арп—21(5п—1 + оА^-1)

эп—1( хп— 1

п

£ - Т1п-2

(У2с(п-2,х)-У2? (п - 2, х)) +

(47)

_ п 1 5 п ■ _п-2 51

71 п — 1

(48)

(49)

72 п —2

+

5п—2 аРп—21(5п—1+аА2Ргап—1)

711п-2

эп— 1 / £ п—1 п-

£ - 7ы—2

N /

72п -2

■ (У1 (п- 2, х) - У/ (п - 2, х)) = 0,

аА рп—1 рп

аА1_п —2 _п — 1

е - 7Сп—1 - 71п — 1

21(п-2,х)-у2?(п-2,х)) -

_ п—1аА рп

_п —С20 2п—1 (У11(п-2,х)-У1?(п-2,х)) = 0,

£ 71п — 1 72 п — 1

а А _п— 1 _п

аА1 _п—2 _п—1 (у2с(п-2, х) -У2? (п - 2, х)) +

£ 71 п — 1 72 п — 1

+

рп— 1 г п—1 _п-2 52

7Сп -1

а^Г21_п— 1

е - 7Сп — 1 - 72п—1 N /

■(У11(п-2, х) -У^ (п-2, х)) = 0

Вычитая (49) из (48) и (47) из (46), получим следующие ра-

венства:

5п—2

Ус(п-2, х)-У? (п-2, х) = -Г^ Y|2-2 (У1(п-2, х)-У? (п-2, х)),

52 71п—2

5п — 1

^- 1 72п—1 (у2с(п-2,х)-у2?(п-2,х))

У1С(п-2,х)-У1? (п-2, х) =

и

(50)

™ — 1

52 ' 1п — 1

72п —2 51 72п-1

7Сп— 2 52 7ы —1 Подставляя первое соотношение в (46), получим связь между кооперативными стратегиями игроков:

(51)

71п-2 =

5п—2 5п—2е - 5п—271п—2(5п—2 +а5п—^—2+а2^—'¿Р— 1) 5п—2 (5п—2 + а5п—1Ргап——21 + а2А2_гап——21Ргап_1)

Обозначим

С = „«—1 + Р«— 1аА1, С = „«—1 + Р«— 1аА1,

/"<1 X«— 2 I „ X«— 1 пи-1 I „2 л 1в«

С2 = „1 + а„1 Рп—2 + а А1Рп—2Рп—Ъ

2 —2 —1 —1 2 —1 С2 = „2 + а„2 Рп—2 + а А2Рга—2 Рп—1'

Тогда стратегии (44) и (51) запишем в виде

X«— 1 г«—1_ г«— 1- ,с /^1 с = £- 7?«—1С1

72« — 1 „« —1^2 ,

^с = „1 „2 £ „2 71«—2С2 72«—2 = „«—2^2 '

Используя (50), можно выразить стратегию второго игрока 7с«—2 на шаге п - 2 через стратегию первого игрока 7?«—1 на шаге п - 1:

7с = „«—2£_7?« — 1С1_

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

71«—2 1 „«— 1£С2 + 7?«— 1 (ОД - С1С2).

Тогда функции выигрыша примут вид

^1с(п - 2, X) = „«—2 1пК«—2) +

+аРга«—21С1 - —2 - —22« —2) + Р™—21 [„«—11п(7с« —1) +

+Р™— 1«А11п(£ - 7?«—1 - 72?«— 1) + Рп— 1В1] + Р«—21С1«— 1в« ■

« « «1 ■ Е „1 1п(—1*)+ С«—2 Е в« 1 Е „1 1п(—11),

1=«—1 «1=«—1 1=«—2

кс(п - 2, X) = „«—21п(—2«—2) + +аР,«Г21С2- —2 - —22«—2) + Р™—21 [„«—11п(7С«—1) + +Р™— 1аА21п(£ - 7?«—1 - 72?«— 1) + Рп— 1В2] + РГ—21С2«— 1^« ■

■ £ „21п(—а4) + с«—2 £ ^«2 Е „21п(—а4).

1=« — 1 «2=« — 1 1=«—2

Аналогичная процедура для случая, когда в игре наступает момент времени п - 3, дает кооперативные стратегии в виде

5п—35п—з 5п—

= Ч 52 с 52 /1п—3и3 /2п—3 = 5п—3^2 :

где

С3 = 5п—3+а5п—2_пп——32+а25п—1_пп——32_пп——21+а3А1_пп——32_пп——21_пп—1,

С3 = 5п—3+а5п—2_гап——32+а25п—1_гап——32_гап——21+а3А2_гап——32_гап——21_гап—1, и

с = 5п—3е71п—1^2

71п—3 5п—1ес2 + 71п—1(^2 - с1°3) ■

Функции выигрыша примут вид

УДп - 3, х) = 5™—31п(й1п—3)+аР™—32^21п(ех-йщ—3-й2п—3) + +_гап——32[5™—21п(71п—2) +0РГ211п(е-71п—2 - О— 2)] +Р—_!—1 ■ ■[<Т11п(71п -1)+ Рп.1 (аА 1п(е-71п _1 - 7^-1) + Д)] + Уг3(пг),

где

У13 (П1)= 3221С1п— 1Йп £ 5* 1пК*) +

п

эп— 2 _п — 1 с й \ л 3 _ 2 С1 1й

*=п — 1 п п1

+_:—32 С1п— 2 £ йп 1 £ 5* 1п(йТ*) +

п1 =п — 1 *=п — 2 п п1

+С1п—3 £ йп 1 £ 5* 1п(йТ*),

п1=п—2 *=п—3

У23(П2)= 32Р,п——21С2п— 1Щп £ 52 1п(йТ* ) +

*=п— 1

п п2

+_:—32С2п— 2 £ Щп 2 £ 52 1п(йТ*) +

п2 =п — 1 *=п — 2 п п2

+С2п — 3 £ Щп 2 £ 52 1п(йТ*).

п2 =п — 2 *=п — 3

Продолжая процесс до наступления в игре момента времени к, получим кооперативные выигрыши в виде (27) и кооперативные стратегии в виде (28), (29).

ASYMMETRY IN A COOPERATIVE BIORESOURCE MANAGEMENT PROBLEM

Vladimir Mazalov, Institute of Applied Mathematical Research Karelian Research Centre of RAS, Petrozavodsk, Doctor of Science, professor ([email protected]). Anna Rettieva, Institute of Applied Mathematical Research Karelian Research Centre of RAS, Petrozavodsk, Cand.Sc., assistant professor ([email protected]).

Abstract: Discrete-time game-theoretic models related to a bioresource management problem (fishery) with asymmetric players are investigated. Players use different discount factors and have different random planning horizons. The main goal here is to construct the value function for the cooperative solution and to distribute the joint payoff among the players in asymmetric cases. We propose using the Nash bargaining solution to obtain cooperative profits and strategies. It is shown that cooperative behavior determined by bargaining schemas is not the only profitable one for players but is better for ecology.

Keywords: bioresource management problem, asymmetric players, Nash bargaining solution.

Статья представлена к публикации членом редакционной коллегии М.В. Губко

Поступила в редакцию 30.01.2015. Дата опубликования 31.05.2015.

i Надоели баннеры? Вы всегда можете отключить рекламу.