Научная статья на тему 'Многошаговые игры с коалиционной структурой'

Многошаговые игры с коалиционной структурой Текст научной статьи по специальности «Математика»

CC BY
366
53
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Петросян Л. А., Седаков А. А., Сюрин А. Н.

Рассматриваются два подхода к формированию коалиционных разбиений в многошаговых играх с полной информацией. В первом игроки вправе сами выбирать свое поведение (кооперативное либо индивидуальное). Игроки, выбравшие кооперативное поведение, объединяются в одну коалицию. Во втором подходе игроки формируют коалиционное разбиение, выбирая одну из возможных коалиций на первых шагах игры. А далее каждый из игроков действует в интересах коалиции, которой он принадлежит. Предлагается алгоритм построения оптимального пути и оптимального коалиционного разбиения для каждого подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Multistage games with coalitional structure

In the paper two approaches of forming coalitional partitions in multistage games with perfect information are considered. In the first approach players in each vertex of the graph tree have the option to cooperate or not to cooperate. The players who choose the cooperative behavior form a single coalition. In the next approach players form coalitional partition on the first stages of the game. Thereafter, each player acts in the interests of coalition to which he belongs. The methods of constructing the optimal trajectory and the optimal coalitional partition for each of the two approaches are proposed.

Текст научной работы на тему «Многошаговые игры с коалиционной структурой»

УДК 518.9 Вестник СПбГУ. Сер. 10, 2006, вып. 4

Л. А. Петросян, А. А. Седаков, А. Н. Сюрин

МНОГОШАГОВЫЕ ИГРЫ С КОАЛИЦИОННОЙ СТРУКТУРОЙ

Ситуации, такие как слияние участников конфликта (игроков) в одну коалицию или предположение о неспособности игроков к кооперации между собой, в современной жизни не всегда возможны. А значит и использование основных принципов оптимальности (С-ядро, вектор Швпли, КМ-решение и др.) в кооперативных моделях не всегда допустимо. В отличие от подходов, предложенных Ван дер Бринком и Ван дер Ланом [1] (нормализованный вектор Банзафа), Оуэна [2] (вектор Оуэна-Шепли), которые предполагают возможность объединения элементов коалиционного разбиения в большую коалицию, в настоящей работе используется новый подход (РМБ-вектор [3]), основанный на комбинации индивидуального принципа оптимальности (равновесия по Нэшу) и кооперативного (вектора Шепли). Отличительная особенность подходов на основе РМЭ-вектора состоит в том, что в результате формирования коалиционного разбиения элементы этого разбиения - будь то коалиции либо отдельные игроки - не могут образовывать новых коалиций. В работе рассматриваются два подхода к формированию коалиционных разбиений в многошаговых играх с полной информацией. Другие способы формирования коалиционных разбиений представлены в работах [4, 5].

Первый подход заключается в следующем. Игрок в каждой позиции своего множества очередности перед совершением выбора альтернативы принимает решение «кооперироваться» или «не кооперироваться». Если игрок однажды принял решение кооперироваться, то он сохраняет его до конца игры. Данная постановка примыкает к задаче, рассматриваемой в работе [6], с той разницей, что в [6] игроку в каждой позиции заранее предписывалось кооперироваться или нет. В нашем случае этот выбор входит в стратегию игрока. Игроки, принявшие решение кооперироваться, образуют одну коалицию. Таким образом, в каждой позиции возникает так называемое «простое» коалиционное разбиение, состоящее из коалиции 5 и индивидуальных игроков. После окончания игры выигрыш коалиции полагается равным сумме выигрышей участвующих в ней игроков. Однако каждый из игроков коалиционного разбиения получает выигрыш в соответствии с РМБ-вектором [3], вычисленным для данного коалиционного разбиения. Предлагается метод оптимизации простого коалиционного разбиения.

Согласно второму подходу, игроки 1,... ,п на первых п шагах игры выбирают элементы из конечного множества индексов 1,... ,т. Игроки, выбравшие один и тот же индекс 1 ^ к ^ т, объединяются в коалицию (аналогичный подход впервые рассмотрен в [7]). Таким образом, на (п + 1)-м шаге игры в некоторых позициях х возникает коалиционное разбиение Д(ж), которое остается неизменным до окончания игры. Предполагается, что игроки, входящие в одну коалицию, выбирают в позициях своих множеств очередности альтернативы, стремясь максимизировать суммарный выигрыш коалиции, в которой они состоят. Игра заканчивается через конечное число ходов. Выигрыш коалиции вычисляемый в конце игры, равен сумме выигрышей в нее входящих игроков (с учетом платы игроков за вступление в коалицию, размер которой зависит от самой коалиции). Для определения «оптимальных» выигрышей коалиций используется абсолютное равновесие по Нэшу в подыгре Г (ж) (ж - первая позиция, в

© Л. А. Петросян, А. А. Седаков, А. Н. Сюрин, 2006

которой сформировано коалиционное разбиение А (ж)). А выигрыш каждого индивидуального игрока 11 € Б к, I = 1 ,...,п, к = 1 определяется как компоненты РМБ-вектора [3]. Различным коалиционным разбиениям соответствуют разные РМЭ-векторы, а следовательно, и неодинаковые выигрыши игроков. Исследуется вопрос о нахождении в некотором смысле оптимального коалиционного разбиения.

В дальнейшем будем придерживаться следующих обозначений. Пусть ж - некоторая вершина древовидного графа. Будем говорить, что вершина ж имеет ранг к (.к = 0,1,2,...), если ее можно достичь из корня графа ровно за к шагов. Под Рх будем понимать множество вершин дерева, непосредственно следующих за вершиной х. Игрока, принимающего решение в вершине х, обозначим через г (ж). Альтернативами в вершине ж назовем номера дуг {(х,у) : у 6 древовидного графа, при этом нумерация начинается с дуги, которая следует за единственной дугой, входящей в х (при нумерации считаем, что вершина х обходится по часовой стрелке, а в корне дерева нумерация начинается с произвольной дуги).

Пусть N — {1,2,..., п} - множество игроков.

Определение!. Коалиционным разбиением множества игроков называется набор множеств Д = {5/}™^ таких, что П 5д; = 0, ^ ф к, а иSj = N. Коалиционное разбиение в вершине х обозначим через А (ж). Простым коалиционным разбиением множества N назовем разбиение, содержащее не более одной коалиции с числом игроков, превышающем единицу.

1. Игры с простой коалиционной структурой.

1.1. Основная модель. Рассмотрим вариант образования простого коалиционного разбиения в играх с полной информацией. Пусть задана позиционная игра с полной информацией на конечном древовидном графе С со множеством игроков N. Отличие этой игры от обычной позиционной с полной информацией состоит в следующем. Перед тем как игрок делает ход, он объявляет остальным игрокам: либо он будет кооперироваться, либо будет играть индивидуально. Предполагается, что в отличие от [6] принятие решения кооперироваться либо играть индивидуально входит в стратегию игрока. В течение игрового процесса игроки, изъявившие желание кооперироваться, объединяются в одну коалицию с момента объявления ими такого желания. Если в некоторой вершине дерева (7 игрок г принимает решение кооперироваться, то коалицию будут составлять игроки, принявшие такое же решение на предыдущих шагах игры, вместе с г. В данной постановке будем рассматривать случай, когда игрок, раз попавший в коалицию, не может ее покинуть до окончания игры.

Если игрок перед выбором альтернативы объявляет играть кооперативно, но к этому моменту никакая коалиция еще не сформирована, он действует индивидуально до тех пор, пока не появится другой игрок, желающий кооперироваться. Игрок действует исходя из интересов коалиции лишь в том случае, когда он входит в ее состав.

Пусть О - корень некоторого древовидного графа С. Новую игру на дереве (У построим по дереву С следующим образом.

Допустим, что в корне дерева С ходит игрок г. Тогда корень О дерева (5 является личной позицией игрока г. В О на СИ у игрока % имеются две альтернативы: первая -кооперироваться, вторая - играть индивидуально. Каждая вершина множества 7<Ь, соответствующая либо первой, либо второй альтернативе, также личная позиция игрока г. В вершинах множества ^о дерева (5 у игрока г имеется ровно столько альтернатив, сколько их в корне дерева б. Далее рассматриваются вершины первого ранга дерева С и продолжается построение части дерева О для вершин второго и третьего рангов аналогичным образом. Пусть и) - некоторая вершина ранга к, к ^ 1 дерева б1, являющаяся

личной позицией игрока Тогда на дереве О этой вершине соответствует множество вершин Ф('ш) ранга 2к, в каждой из которых игрок ] обладает ровно двумя альтернативами («кооперироваться» или «не кооперироваться»), а в вершинах ж' € у £ Ф('ш) (эти вершины имеют ранг 2к + 1) игрок ] имеет ровно столько альтернатив, сколько их в вершине ю на дереве С. Кроме этого, для дерева (5 справедливо следующее: при фиксированных выборах игроков в вершинах нечетных рангов < 2к и произвольных выборах в вершинах четных и нулевого рангов < 2 к подграфы О (у) для любых вершин у £ Ф(ш) эквивалентны.

Таким образом, дерево О удовлетворяет следующим свойствам: 1) во всех неокончательных вершинах нулевого и четного рангов имеются две альтернативы; 2) любая окончательная вершина имеет четный ранг.

В вершинах четного и нулевого рангов дерева б две альтернативы соответствуют принятию решения игроком, делающим ход в этой вершине, играть либо кооперативно (первая альтернатива), либо индивидуально (вторая альтернатива), в то время как в вершинах нечетного ранга дерева (5 игрок просто выбирает возможную альтернативу, как в С. В каждой вершине дерева <5 коалицию образуют игроки, принявшие решение кооперироваться на предыдущих шагах игры.

Таким образом, в каждой вершине дерева (5 игры указано простое коалиционное разбиение множества игроков.

Выигрыши игроков на О определим следующим образом. Зафиксируем выборы всех игроков в вершинах нечетного ранга. Тогда на множестве окончательных вершин дерева <5 при произвольных выборах в вершинах нулевого и четного рангов выигрыши игроков одинаковы и равны выигрышу в окончательной вершине дерева (7, соответствующей пути, полученному при фиксированных выборах в вершинах нечетного ранга.

Игра на дереве <5 развивается обычным образом, только с учетом специфики дерева игры каждый игрок делает два хода подряд.

Дадим формальное определение игры с полной информацией на дереве (5.

Определение2. Позиционной игрой п лиц с простой коалиционной структурой и с полной информацией называется древовидный граф (7, на котором:

• задано разбиение множества вершин X на п + 1 множество Р\, Р2,..., Рп, Рп+1 > где Р{, { Е N есть множество личных позиций игрока I, причем если х является вершиной либо четного ранга, либо нулевого их € Рг, то Рх С Р{, |.РХ| = 2. Множество Рп+1 = {ж : ^ = 0} есть множество окончательных вершин, каждая из которых имеет четный ранг;

• в каждой вершине х 6 X задано простое коалиционное разбиение Д (ж) — (5(ж), ¿1,..., г|^\5(х)|} множества игроков М, в котором в коалицию 5(ж) входят игроки, выбравшие в своих личных позициях нулевого и четного рангов первую альтернативу вдоль пути, ведущего в эту вершину;

• на множестве окончательных вершин Рп+1 заданы выигрыши игроков - вещественные неотрицательные функции К\{х),Н2(ж),...,/гп(ж), ж € Рп+х- При этом если рассмотреть подмножество Рп+!(•) множества окончательных вершин Рп+1, вершины которого могут реализоваться при выборе игроками произвольных альтернатив в вершинах четного и нулевого рангов и при фиксированных альтернативах в вершинах нечетного ранга, то на множестве Рп+1 (•) выигрыши игроков совпадают. Другими словами, для любого игрока г е N и для любых у е Рп+х(-)> 2 £ Рп+1 (■)> Рп+х(') с Рп+1 имеет место Н^у) = Ы(г).

ОпределениеЗ. Стратегией игрока г 6 IV назовем отображение, которое каждой вершине ж Е Р* ставит в соответствие вершину у Е либо вероятностное распределение рх на множестве (р* = {/>*(?/)}, у Е ^ 0, Р^Ы = !)•

Пусть «г(-) есть стратегия игрока » е а С Р; есть множество всех личных позиций нечетного ранга этого игрока, которые могут реализоваться, если в вершинах четного или нулевого ранга игрок г выбирает вторую альтернативу.

Определение^ Под множеством стратегий индивидуального поведения А1(щ(-)) игрока г, стесненным стратегией иД-) будем понимать подмножество множества стратегий этого игрока, отличающихся от иД-) только выборами в вершинах у Е У»- Если щ(-) предписывает выбрать первую альтернативу в некоторой вершине г Е Р{ четного или нулевого ранга, то полагаем Аг(щ(-)) = 0.

Для каждого набора стратегий «(•) = (йх(-),..., йп(-)) в игре на дереве б определим функции выигрыша игроков следующим образом. Предположим, что в ситуации й(-) реализуется простое коалиционное разбиение Д = 5)}, |5| ^ 2 и путь

{0,жь ... ,ж/}. Тогда

(О; й(-)) = (х{), 1] $ 5, Кгк(0;й(-)) = гк Е 5.

Здесь , и € 5 есть значение вектора Шепли, вычисленного для коалиции 5 в по-дыгре (7(2/4), где - это первая вершина пути {0,х\,... ,ж/}, на котором сформировалось коалиционное разбиение Д.

В рассматриваемой постановке в качестве принципа оптимальности будем использовать так называемое слабое равновесие. Оно включает такие наборы стратегий игроков, в которых выигрыш отклонившегося индивидуального игрока (не принадлежащего коалиции) не увеличивается, при условии, что остальные игроки придерживаются фиксированных стратегий данного набора. Дадим формальное определение слабого равновесия.

Определение 5. Набор стратегий и*(-) = (и*(-), ...,«?(■),... ,«*(•)) называется слабым равновесием в игре 6(0), если

К4(О;и*(.)|М0) <2Ъ(О;и*(0)

для любых г Е N \ 5 и любых щ Е Аг(и*(-)).

Замечание 1. Если % $ 5 (|5| ^ 2), множество Аг(щ(-)) совпадает со множеством всех стратегий игрока г, которые исключают возможность кооперации.

1.2. Построение слабого равновесия. Оптимальную простую коалиционную структуру построим методом обратной индукции, двигаясь от окончательных вершин к начальной. Процедура построения решения напоминает схему построения абсолютного равновесия по Нэшу [8, 9] в обычной позиционной игре с полной информацией, а также алгоритм построения оптимального пути в игре с частичной кооперацией [6].

Предположим, что длина игры равна 21 + 1.

Шаг 0. Рассмотрим окончательную вершину х ранга 21. В х выигрыши игроков определены и равны кг(х), I Е N.

Положим 7°(-) = Ы(-), а вершины жо, жо и жо будем считать окончательными ранга

21.

Шаг £ ^ 1. Пусть вершина Xt имеет ранг 21 — 2£. Если Ж( - окончательная вершина, то выигрыши игроков равны /¿¿(ж^), г Е N. В том случае если ж^ не является окончательной, то = 2, так как жг является вершиной четного ранга. Пусть У4 Е есть вершина, соответствующая первой альтернативе (игрок ¿(ж^ выбирает

кооперативное поведение), а zt £ FXt - вершина, соответствующая второй альтернативе (игрок i(xt) играет индивидуально). Вершины yt и zt имеют ранг 21 - 2t + 1. По свойству множеств очередности справедливо, что i(xt) = i(yt) = i(zt). Предположим, что в вершине xt реализовалось простое коалиционное разбиение, содержащее коалицию S(xt). Возможны два случая.

Случай 1. Коалиции в вершинах xt и yt не совпадают, т. е. S(xt) ф S(yt). Тогда S(yt) = S(xt) U i(xt), а S{zt) = S{xt).

Рассмотрим вершину yt. В yt игрок i(yt) = i(xt) £ S(yt), так как вершина yt соответствует кооперативному поведению игрока i(xt)- Следовательно, i(yt) выбирает вершину xt-i £ Fyt из условия

^max £ 1\-\xt-l)= Y, 1).

Xt 1 yt ies(yt) ies(yt)

Однако максимум может достигаться в нескольких вершинах. Определим множество

Ii(yt)(yt) =arg max

i£S(yt)

Пусть \Ii(yt)(yt)\ — Qt- По аналогии с [3] будем считать, что в yt игрок i(yt) выбирает вершины множества Ii(yt)(yt) с равными вероятностями, поэтому выигрыши игроков в yt равны

qt U

Очевидно, что Eies(yt) = Ei€s(y,) Для любого xt-i £ /¿ыЫ-

Теперь рассмотрим вершину zt- В zt игрок i(zt) = i(xt) действует индивидуально, так как вершина zt соответствует индивидуальному поведению игрока i(xt). Следовательно, игрок i(zt) выбирает вершину Xt-i £ FZt из условия

Определим множество

с**-*)

Ii(zt)(zt) = arg max iLfat-1).

Xt — 1 t "z*

Предположим, что = г£- Будем считать, что игрок г(^) выбирает вершины

множества с равными вероятностями. Выигрыши игроков в Zt определяются

следующим образом:

1 г'

Очевидно, 7г4(2()(^) = 7гí(~(1)(жt_l) для любого х^г € /¿(2,)(^).

Перейдем к вершине х^ В Ж£ для определения выигрыша игрока г (ж¿) необходимо выделить его выигрыш из суммарного выигрыша 7$(У1)(Уь) = 7г-(ш) коалиции

5(2/4). Выплаты игрокам коалиции рассчитаем в соответствии с вектором Шеп-

ли [10], вычисленным для характеристической функции г>(-), которую определим по правилам:

• «(З'Ы) = 7|ыЫ;

• для любой непустой коалиции Я С 5(у() величина г;(Д) есть значение антагонистической игры, происходящей между коалициями Я (максимизирующим игроком) и N \ Я (минимизирующим игроком);

• г>(0) = 0.

Пусть ЭЬг(7з(У1)(Уь)) есть выплата игроку г £ 5(?/(). Тогда компоненты РМБ-век-тора [4] имеют вид

рмзЬ) = "Ж

л¡Ы), > i

В xt игрок г(ж4) выбирает вершину yt G FXt или G FXt из условия

max{PMS<(x()(yt), 7i(x,)(*«)}•

Определим выигрыш любого игрока i Е. N в вершине а^:

ГРМ^(ш), PMSi(e0(yt) > 7¡{xt)(zt), xt $ Pn+l,

t. ,J7fat), PMS^()(yt)<7 ¡{xt)(zt), XttPn+i,

,hi(xt), Xt G Pn+1-

Случай 2. Коалиции в вершинах и yt совпадают, т. е. S(xt) = S(yt). Тогда игрок i(xt) уже входит в состав коалиции S{xt) и выбирает первую альтернативу, согласно правилам игры, т. е. выбирает вершину yt G FXt. Следовательно, для любого игрока i G N

Л(ХА- НЫ> xt ^ -fn+1, \hi(xt), 1,6^+1.

Продолжая движение к корню О, последовательно определяя выборы игроков в каждой вершине, согласно предложенному алгоритму, построим некоторый пучок путей, который реализуется в игре. Назовем таким образом построенный пучок «оптимальным пучком». Оптимальной простой коалиционной структурой назовем правило, которое в каждой вершине оптимального пучка путей указывает полученное, согласно алгоритму, простое коалиционное разбиение множества игроков. Выигрыш игрока i е N в игре определяется как у[(О), а PMS-вектор (7i(C)> • • • ,7h{0)) называется значением многошаговой игры с простой коалиционной структурой.

Получаем следующую теорему:

Теорема 1. Построенная ситуация и*(-) = (uj(•),..., и* (•)), где

fx* = argmax{PMSi(j/t), 7i(2i)b Ранг х четный, г £ S(x), yt, что yt G Fx, ранг x четный, i G S(x),

<(x)

xt-\ = arg max 7- (го), ранг х нечетный, г ^ S(x), (1)

w£Fzt к '

xt-1 = arg max 7;_1('ш)) Рапг х нечетный, г G S(x)

weFy<jes(yt)

для любой вершины х, Ь £ [0, /], образует ситуацию слабого равновесия по Нэшу в игре, заданной на древовидном графе С.

Лемма 1. Пусть стратегия и*(-) игрока г, входящая в ситуацию слабого равновесия и*(•) = ... ,и*(-),... (•)), впервые предписывает в некоторой вершине

х Е Р{ четного или нулевого ранга выбор первой альтернативы. Тогда выбор игроком г второй альтернативы в вершине х не приведет к увеличению его выигрыша.

Доказательство. Поскольку ситуация и*(-) = (и*(-),... ,и*(-),...,и*п (•)) является ситуацией слабого равновесия, стратегии и*(-) игрока 1 6 I, входящие в ситуацию ?/*(•), определяются по правилу (1). Предположим, что х € Р{ - некоторая вершина четного или нулевого ранга, вершина у £ Рх С Р{ соответствует выбору в х первой альтернативы, вершина 2 £ ^ С Р, - второй. Предположим также, что вершины х и у реализуются ситуацией «*(•). Заметим, что у — и*(х), поскольку в вершине х по условию леммы игрок г впервые выбирает первую альтернативу. По свойству множеств очередности игроков имеем г (ж) = г (у) = г (г) = г. Тогда получаем следующую цепочку неравенств:

«*(■)) = К{(х;и*(-)) = Кг(у; и*(-)) = шах{РМ^(у), 7|(*)} £ ^ 7Цг) = К>(г;и*(-)Цщ(-)) = К{{х-и*{-)\\щ{-)) = = К{{0-,и*{-) ||^(0)

для любых стратегий щ(-) игрока г, отличающихся от и'-(-) лишь выбором в вершине х (иг(х) — г). То есть игрок г, отклонившись в вершине х от и*(-), не увеличит свой выигрыш.

Замечание 2. В формулировке леммы 1 акцент делается на то, что если слаборавновесная стратегия игрока впервые диктует в некоторой вершине четного или нулевого ранга выбор кооперативного типа поведения, то переключение игрока в этой вершине на индивидуальное поведение не увеличивает его выигрыша. Случаи такого переключения в последующие разы для игрока не представляются возможными в рамках нашей постановки. Мы изначально предполагаем выполненным некоторое ограничение на стратегии игроков, а именно, игрок, раз попавший в коалицию, не может ее покинуть до окончания игры (см. п. 1.1.), т. е. он снова не может переключиться на индивидуальное поведение.

2. Игры с произвольной коалиционной структурой.

2.1. Основная модель. Теперь рассмотрим другой вариант образования коалиционного разбиения в играх с полной информацией. В данной постановке предполагается, что на первых шагах игры происходит формирование коалиционного разбиения, а далее каждый из игроков действует в интересах коалиции, которой он принадлежит и которая сформировалась на первых шагах.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть на конечном древовидном графе С с корнем О задана игра п лиц с полной информацией Г(0). Пусть далее М = {1,2,..., т} - фиксированное конечное множество, тп ^ п. Ограничимся классом деревьев, для которых число элементов множества Рх равно т для всех вершин х рангов от 1 до п.

Определеннее. Позиционной коалиционной игрой п лиц с полной информацией называется древовидный граф, на котором:

• задано разбиение множества вершин X на п + 1 множество Р\,Р2,..., Рп, Рп+1, где Р{, г € N, есть множество личных позиций игрока г, обладающее свойством: для каждого г 6 N существует число к((), к(г) Е [0,п — 1] такое, что вершины ранга к (г) являются личными позициями игрока i. Множество Рп+1 есть множество окончательных вершин;

• в вершинах хп ранга п однозначно задано коалиционное разбиение А(хп) = {Sj(xn)}1jL1, которое не изменяется в подыгре Г(жп), начинающейся в вершине хп, и строится следующим образом. Пусть х - некоторая вершина ранга к, к — 0, ...,п — 1. Определим Зз(хп) как множество игроков, которые в верши-

нах ранга 0,..., п — 1 вдоль пути, ведущего в хп ранга п, выбирают одну и ту же альтернативу с номером ] (идея подобного способа формирования коалиций была высказана впервые в работе [7]);

• А(х) = {{1}, • • •, {"}} для вершин х рангов 0,..., п — 1;

• структура игр Г(жп) эквивалентна для любых хп ранга п;

• в окончательных позициях ги е Рп+1 задан выигрыш игрока г е N, равный Я*(го) = ^(ъи) - сДД(го)), /¡.¿(го) ^ Сг(Д(ш)),Сг(Д(и;)) ^ 0. Если игры Г(х„) и Г(ж^) эквивашентны для вершин хп и х'п ранга п (хп ф х'п), а Ф - отображение, осуществляющее эту эквивалентность, то /гДго) = /1г(Ф(го)), где го и Ф(го) - окончательные позиции игр Г(жп) и Г(ж^) соответственно. Кроме этого, для любых и),ги' 6 Рп+х в игре Г(жп), где хп - вершина ранга п, выполняется Сг(Д(го)) = Сг(Д(го')), и для любой коалиции Sj(^w) 6 Д(го), если ¿1,12 € Sj(w), выполняется Сгх(Д(ги)) = Сг2(Д(го)).

Стратегии игроков в игре Г(О) определяются так же, как это было сделано в определении 3 п. 1.

Игра развивается следующим образом. На первом шаге в корне О ходит игрок г(0) и выбирает альтернативу к(х 1) € М, соответствующую вершине х\ £ Яо- В вершине ходит игрок г(хх) и выбирает альтернативу к(х-2) £ М, соответствующую вершине Ж2 £ РХ1, и т. д. В хп-х ходит игрок г(жп_1), который выбирает альтернативу к(хп) £ М, соответствующую вершине хп £ Игроки, выбравшие один и тот же

номер на первых п шагах, объединяются в одну коалицию. В результате формируется коалиционное разбиение А(хп) — {51 (жп),... ,5т(жп)}.

В данной постановке предполагаем, что далее игрок в вершинах своего множества очередности играет в интересах коалиции, его содержащей, т. е. стремится максимизировать суммарный выигрыш игроков коалиции. Также считаем, что коалиционное разбиение во всех вершинах поддерева С(жп) не изменяется и совпадает с коалиционным разбиением А(хп) в вершине хп.

В вершине хп ходит игрок г(хп) и выбирает вершину жп+1 £ Яж„, действуя в интересах коалиции, его содержащей, и т. д. Если на шаге п + к вершина хп+к-\ ^ Рп+1, то игрок {(хп+к~1) выбирает вершину хп+к £ -Р1Х„+1Ь_1 исходя из интересов его содержащей коалиции. Игра продолжается конечное число шагов, поскольку дерево игры конечно. В окончательной вершине го £ Рп+\ заданы выигрыши игроков Н\ (го),..., Яп(го), которые состоят из собственных выигрышей /гДго), г £ N, и платы Сг(го), г £ ./V, за участие в коалициях, которая зависит от коалиционного разбиения. При этом из определения игры видно, что собственные выигрыши игроков не зависят от коалиционного разбиения, а плата за участие в коалиции одинакова для всех игроков, входящих в данную коалицию, но может быть разной для различных коалиционных разбиений.

Функции выигрыша игроков в игре Г(0) определим следующим образом. Пусть «(•) = (йх(-),... ,«„(•)) - фиксированный набор стратегий, а Д - соответствующее й(-) коалиционное разбиение. Тогда

кi(0■,й{■)) = ?мsi(0),ieN,

где РМЭ-вектор вычисляется для коалиционного разбиения Д.

Определение 7. Под множеством стратегий Вг(и{(-)) игрока г, слабо стесненным стратегией иД-), будем понимать подмножество множества стратегий этого игрока, которые отличаются от фиксированной стратегии иг(-) только в вершинах у £ Р^ ранга < п (в вершинах ранга ^ п стратегии из Вг(щ(-)) выбирают те же альтернативы,

что и стратегия щ(-)) или только в вершинах у Е Pi ранга ^ п (в вершинах ранга < и стратегии из Вг(щ(-)) выбирают те же альтернативы, что и стратегия щ(-)).

Определеннее. Набор стратегий и*(-) — (uj(-),... .. ,«*(•))

формирует коалиционное равновесие, если

г EN,

для всех щ Е ßl(u*(-)) и, по крайней мере, для одного j Е Sk, при условии, что i Е Sk, а А = (Si,..., Sk, ■ ■ •, Sm) - коалиционное разбиение, порожденное ситуацией и*(-).

2.2. Построение решения. -Решение игр в такой постановке будем строить методом обратной индукции. Процедура построения решения сходна с рассмотренным в п. 1.2. алгоритмом.

Предположим, что длина игры равна п + I + 1. Как было сказано выше, игрок i в вершинах х Е Pi (ранг х больше либо равен п) играет в интересах коалиции Sj, его содержащей. Для определения выигрыша игроков коалиции также будем использовать вектор Шепли, рассчитанный для специальным образом построенной харатеристичес-кой функции.

Шаг 0. Пусть вершина хо окончательная ранга п + I. Тогда выигрыши игроков 7г°(ж0) = hi(x0) - d(A(x0)), г Е N.

Шаг t, t ^ 1.

Случай 1. t Е [1,/ — 1]. В этих вершинах игра происходит согласно коалиционному разбиению А(-)- Следовательно,

1ЛХ1) \hi(xt) - Ci(A(xt)), xtEPn+u

где xt-1 = arg max Yl 71~1(х) (ПРИ этом считаем, что ранг ж0 равен п + l). Здесь

xeFxt ieS(xt):

выражение [г € S(xt) ■ S(xt) Э i(xt)] под знаком суммы означает, что суммирование ведется по игрокам из коалиции S(xt), которая содержит игрока i(xt), совершающего выбор в вершине xt.

Заметим, что вершина Xt-i, вообще говоря, может оказаться не единственной, в которой достигается максимум суммарного выигрыша игроков коалиции S(xt). Это, в свою очередь, приводит к ситуации неединственности решения.

С л у ч а й 2. t — I. В данном случае мы находимся в вершине хп - первой вершине, в которой формируется коалиционное разбиение А(хп). Для определения значения функций 7\{хп) требуется выделить выигрыши игроков из коалиционных выигрышей, т. е. определить дележ суммарного выигрыша )(жп) = х )7i_1(a;n) для каждой коалиции S(xn) Е Д(жп). Определим в вершине хп вектор PMS(xn) = (PMSi(x„),..., PMSn(a;n)) [3], где PMSi(xn) есть выплата игроку г из общего выигрыша коалиции, его содержащей в вершине хп, в соответствии с вектором Шепли, вычисленным для характеристической функции t>s(x„)(')> S(xn) Е А(хп). Функции Vs(Xn){0) S(xn) Е А(хп), определяются так же, как и в п. 1.2. Тогда

yl(xn) = PMSi(®n). (2)

Случай 3. t Е [I + 1,1 + п]. При таких t коалиционное разбиение для каждого xt имеет вид A(xt) = {{1}, {2},..., {п}}. В этом случае

7i(xt) — 7i_1(^i-i))

где xt-i = arg max Вершина xt~\ может оказаться не единственной, в кото-

рой достигается максимум выигрыша игрока i[xt). Это, в свою очередь, приведет к неединственности решения.

При t = п + l получим выигрыши игроков 7f+/(0) в корне дерева О. Пусть при этом на первых п шагах игры игроки выбирают альтернативы {1\,... ,1п}, где lj, lj € [1, т], есть номер альтернативы, которую выбирает игрок ij. Тогда в вершине хп формируется коалиционное разбиение {Si(xn),..., Sm(xn)}, где игроки, входящие в Sj(xn), j 6 [1,m], выбирают один и тот же номер lj. Указанное разбиение будем называть оптимальным, а соответствующую вектор-функцию 7™+г(0) назовем значением игры, которое в данном случае совпадает с PMS-вектором оптимального коалиционного разбиения.

Получим следующую теорему.

Теорема 2. Построенная ситуация и*(-) = («*(•)>... , и* (■)), где

arg max £ 7*~1(ж)> te[l,l],

хв fxt ¡es(xt): S(xt)3i(®t)

arg max 7¡Гх\{х), t e [1 + 1,1+ n],

x£Fxt

образует ситуацию коалиционного равновесия по Нэшу в игре Г(О).

Введем понятие усеченной игры Г(О). Рассмотрим вершины рангов ^ п дерева игры Г(О), т. е. те позиции, в которых игроки играют индивидуально (происходит формирование коалиционного разбиения).

Под усеченной игрой п лиц Г(О) игры Г(О) будем понимать такую n-шаговую игру на древовидном графе G с начальной позицией О, на которой:

• в вершинах ранга < п множество личных позиций игроков совпадает с множеством личных позиций в игре Г(О);

• множество окончательных вершин есть множество позиций хп ранга п в игре Г(О), в каждой из которых для любого игрока i € N задан выигрыш, равный значению функции 71(хп) (см. (2)) в позициях хп, получаемой при построении решения игры Г(О) методом обратной индукции.

Стратегии игроков в игре Г(О) определяются так же, как это было сделано в определении 3 п. 1.

Следующие свойства коалиционного равновесия следуют из построения решения игры, предложенного в начале п. 2.2.

Лемма 2. След коалиционного равновесия, рассмотренный на позициях усеченной игры п лиц Г(0), является ситуацией абсолютного равновесия по Нэшу.

Лемма 3. След коалиционного равновесия, рассмотренный на позициях ранга ^ п, есть ситуация абсолютного равновесия по Нэшу в игре т лиц при условии, что игроками являются коалиции, и выигрыш коалиции определяется как сумма выигрышей игроков, входящих в коалицию.

Иными словами, в вершинах ранга ^ п задано коалиционное разбиение А — (5i,..., Sk, ■ ■ ■, Sm), и игрок действует в интересах коалиции, которой он принадлежит. Совместные действия игроков одной коалиции означают, что она действует от имени своих членов как один игрок. Потому можем рассматривать ситуацию и*(-) = (и* (•),..., и*(-),..., «*(•)) как ситуацию равновесия по Нэшу в игре т лиц (число коалиций в соответствующем коалиционном разбиении). Это означает, что отклонение какого-либо игрока i Е Sk в вершинах ранга ^ п от стратегии и*(-) либо

уменьшит выигрыш коалиции (равный сумме выигрышей игроков, входящих в коалицию), либо не приведет к его изменению, при условии, что остальные игроки придерживаются своих фиксированных стратегий, образующих ситуацию коалиционного равновесия «*(•). Следовательно, хотя бы один игрок 3 из коалиции получит выигрыш, равный либо меньше К^{0\и*(•)).

3. Численные примеры.

Пример 1. Рассмотрим игру в развернутой форме с полной информацией на древовидном графе (3, изображенном на рис. 1. N — {1, 2,3}. Личная позиция игрока 1-0, игрока 2 - и)\, игрока 3 - Юз. Выигрыши игроков определены в окончательных вершинах.

О м'1 м'з 11'5

(5 3

и'2 11'4 М'6

(1 4 1) (2 2 4) (1 1 3)

Рис. 1. Древовидный граф С.

Используя дерево С, перейдем к игре на древовидном графе (5, изображенном на рис. 2. Эта игра отражает кооперативное поведение каждого игрока, т. е. в вершинах четного и нулевого рангов, в которых игрок принимает решение кооперироваться или нет, имеются две альтернативы. На дереве (5 множество Р\ — {О, уо, ¿о), Р2 = {жь 2/1, 21, Жз, 2/3, 2з}, Рз = {я5, У5,2ь,Х7, У7, ¿7, ^9, 2/9, 29, Жц, 2/11, ¿11 }• Выигрыши игроков заданы в окончательных позициях, где г-я компонента вектора выигрышей представляет собой выигрыш игрока г.

Рис. 2. Древовидный граф (5.

Имеют место следующие коалиционные разбиения: А (2/1) = Д(жб) = А (2:5) = {1,2}, {3}, ДЫ = {1, 2,3}, ДЫ = {1,3}, {2}, ДЫ = {1}, {2,3}. В других неокончательных вершинах игроки действуют индивидуально.

Построим «оптимальный» путь в игре на дереве б.

Рассмотрим подыгру Г(у5). В вершине 2/5 коалиционное разбиение А(2/5) = {1,2,3}. Следовательно,

742/5) = (5,3,2),

т. е. игрок 3 выбирает вершину Ж13 в интересах коалиции {1,2,3}, так как /11(2:13) + + = Ю > /11(х14) + /г2(ж14) + /гз(ж14) = 5. Аналогичным способом получим

71(^5). Рассмотрим подыгру Г^). Поскольку в вершине коалиционное разбиение Д(г5) = {1,2},{3},то

У(г5) ='(1,1,3);

игрок 3 играет индивидуально и выбирает вершину Ж16, так как к3(х\б) = 3 >

/13(^15) = 2-

Рассмотрим вершину Х5. Коалиционное разбиение А(жб) = {1,2}, {3}. Для определения выигрышей игроков 7/(^5), г = 1-, 2,3, в вершине необходимо выделить выигрыш игрока 3 из коалиционного выигрыша:

7(1,2,3} Ы = 1\{уь) + 72 Ы + 7зЫ = 5 + 3 + 2 = 10.

С этой целью определим характеристическую функцию у(уъ, •) следующим образом: «(1,2,3) = 10,17(1,2) = 2,«(1,3) = 7, «(2,3) = 5,и(1) = 1,и(2) = 1,и(3) = 3. Вычислим вектор Шепли: БЦу5) = (17/6,11/6,16/3) и РМБ-вектор: РМЭ1^) = (17/6,11/6,16/3). Теперь определим 71(х5). В вершине игрок 3 играет индивидуально, т. е. выбирает вершину г/5, поскольку РМБ^з/б) = 16/3 > 73(25) = 3. Следовательно,

У(х5) = (17/6,11/6,16/3).

Используя те же самые рассуждения, можно получить выигрыши игроков в каждой вершине дерева игры (5:

У(у7) = (5/2,3,9/2), 71(гг) - (1,1,3), УЫ = (5/2,3,9/2);

УЫ = (5,3/2,7/2), У0г9) = (1,1,3), УЫ = (5,3/2,7/2);

У (У11) = (1,1,3), У(^и) = (1,1,3), У(*п) = (1,1,3);

12{у\) = (И/6,17/6,16/3), 72(г1) = (5/2,3,9/2), 72(Ж1) = (5/2,3,9/2);

У(2/з) = (2,2,4), 72Сг3) = (2,2,4), УЫ = (2,2,4);

73(2/о) = (5/2,3,9/2), У(г0) = (2,2,4), • 73(0) = (5/2,3, 9/2).

Таким образом, значением многошаговой игры с простым коалиционным разбиением является РМБ-вектор 73(0) = (5/2,3,9/2). Оптимальный путь в игре на древовидном графе (7, изображенном на рис. 2, есть {0,2/0, £1,21,2:7,2/7, ж17}; он выделен жирной линией. Этот путь порождает оптимальное простое коалиционное разбиение {1,3}, {2} в окончательной вершине Ж17.

Пример 2. Рассмотрим игру в развернутой форме с полной информацией на древовидном графе С, изображенном на рис. 3. N = {1,2,3}. Множество личных позиций игрока 1 есть множество Р\ = {О, х7, хв, х9, хю, 1ц, хг2, Хгз, хы}, Р2 = {х1,х2,хх6,х18, Х20,Х22,Х24,Х26,Х28,Х30}, Р3 = {х3, х4, ж5, ж6, х32, х34, х36, х38, х40, х42, х44, ж46}. В окончательных позициях заданы п наборов вещественных чисел ..., Нп(ю).

В вершинах О,... ,хв формируется коалиционное разбиение. Выбор вершин {#1,х3, х5,х7,х9,хц, Ш13} отождествим с выбором числа 1, а выбор вершин {х2, х4, х6, х8,

Рис. 3. Древовидный граф G.

zi0,zi2,zi4} - с выбором числа 2. Таким образом, в игре могут сформироваться две коалиции: S\ и £2. Плата за участие в коалициях следующая:

Ci(|Si| = 1) = 0, CiflSil = 2) = 1/4, Ci(|Si\ = 3) = 1/2, i e Si;

Ci(|S2| = 1) = 0, cí(|52| = 2) = 1/2, Cidral = 3) = 1/4, i e S2.

Имеют место следующие коалиционные разбиения: А (х-?) = {1,2,3}i; A(xs) = {1,2}!,{ЗЬ; A(xq) = {1,3}i,{2}2; Д(Х10) = {1}ь{2,3}2; A(xu) = {2,3}I,{1}2; A(xia) - {2}i, {1,3}2; A(x13) = {3}i,{1,2}2; Д(®14) = {1,2,3}2.

Построим «оптимальный» путь в игре на дереве G.

Рассмотрим подыгру К(хз2). В вершине жз2 ходит игрок 3 (3 G {l,2,3}i). Так как 7?(^47) + 72(Z47) + 7з(ж47) = 8,5 > 7?(ж48) + 72(^48) + 73(^43) = 3,5, следовательно, в вершине жз2 игрок 3 выберет альтернативу, соответствующую вершине Ж47. Тогда 71(ж32) = (9/2,5/2,3/2). Продолжим движение в направлении корня дерева игры.

Рассмотрим подыгру K(xí6). В вершине xw ходит игрок 2 (2 G {1,2,3}i). Поскольку 7х (2:31) +72 (£31)4-73(2:31) < 7i (^зг) 4-72(жз2) + 7з (жз2), то в ж16 игрок 2 выберет альтернативу, соответствующую вершине а;з2, а вектор 72(£з2) = (9/2,5/2,3/2).

Рассмотрим подыгру К(х7). В вершине x-¡ делает ход игрок 1. Так как 71(3:15) + 72(215) + 7з(ж1б) < 71(ж1б) + 72(ж1б) + 7з(ж1б)> то в вершине х7 игрок 1 выберет альтернативу, соответствующую вершине Xie- Следовательно, 73(ж7) = PMS(:r7).

Вычислим характеристическую функцию и(ж7,-): у(1,2,3) = 17/2,^(1,2) = 9/2, г»(1,3) = 11/2,^(2,3) = 9/2,v(l) = 1/2, v(2) = 3/2, v(3) = 1/2. Тогда вектор Шепли имеет вид Sh(x7) = (17/6,17/6,17/6), а PMS-вектор PMS(z7) = (17/6,17/6,17/6).

Аналогичным образом получаем j3(xs) = (7/4,11/4,1), 73(жд) = (13/4,3,13/4), 73(хю) = (2,3,2), 73(хц) = (2,13/4,9/4), 73(a;i2) = (3,3,3), 73(*1з) = (3/2,5/2,1), 73(Ж14) = (37/12,37/12,37/12).

Рассмотрим подыгру К(х4). В вершине ж4 ходит игрок 3. Так как 73(жд) = 13/4 > 73(жю) = 2, то игрок 3 выбирает альтернативу, соответствующую вершине хд, и вектор 74(ж4) = 73(жд). Опустим изложение остальных шагов. Двигаясь далее от окончательных вершин к корню дерева игры, достигнем вершины О. Значение игры есть 76(0) = (13/4,3,13/4). Оптимальный путь на рис. 3 отмечен жирной линией.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Summary

Petrosyan L. A., Sedakov A. A., Syurin A. N. Multistage games with coalitional structure.

In the paper two approaches of forming coalitional partitions in multistage games with perfect information are considered. In the first approach players in each vertex of the graph tree have the option to cooperate or not to cooperate. The players who choose the cooperative behavior form a single coalition. In the next approach players form coalitional partition on the first stages of the game. Thereafter, each player acts in the interests of coalition to which he belongs. The methods of constructing the optimal trajectory and the optimal coalitional partition for each of the two approaches are proposed.

Литература

1. Van den Brink R., van der Laan G. Axiomatization of the normalized banzhaf value and the shapley value // Social Choice and Welfare, 15. Springer-Verlag, 1998. P. 567-582.

2. Owen G. Political games // Naval Research Logistics Quarterly. 1989. Vol. 18. P. 345-355.

3. Петросян JI. А., Мамкина С. И. Игры с переменным коалиционным разбиением // Вестн. С.-Петерб. ун-та. Сер. 1: Математика, механика, астрономия. 2003. Вып. 3. С. 60-69.

4. Engwerda J., Michalak Т., Plasmans J. Institutional design of fiscal and monetary stabilization policies and the enlargement of a monetary union // 12th Intern, symposium dynamic games and applications. Sophia Antipolis. 2006. P. 77-80.

5. Michalak Т., Engwerda J., Plasmans J. Models of endogenous coalition formation between fiscal and monetary authorities in the presence of a monetary union // Ibid. P. 81-84.

6. Петросян JI. А., Аешин Д. А. Значение динамических игр с частичной кооперацией // Труды Ин-та математики и механики УрО РАН. 2000. Т. 6, № 1. С. 160-172.

7. Arnold Т., Wooders М. Dynamic club formation with coordination //II Congress of Game Theory Society. Marceille, 2004. 18 p.

8. Nash J. Non-cooperative Games // Ann. of Math. 1951. Vol. 54. P. 286-295.

9. Петросян JI. А., Кузютин Д. В. Игры в развернутой форме: оптимальность и устойчивость. СПб.: Изд-во С.-Петерб. ун-та, 2000. 290 с.

10. Shapley L. S. A Value for n-Person Games // Contributions to the Theory of Games II. Princeton: Princeton University Press, 1953. P. 307-317.

Статья поступила в редакцию 7 сентября 2006 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.