Игры с переменным коалиционным разбиением

Петросян Л. А.; Мамкина С. И.

УДК 518.9

Вестник СПбГУ. Сер. 1, 2004, вып. 3

Л. А. Петросян, С. И. Мамкина

ИГРЫ С ПЕРЕМЕННЫМ КОАЛИЦИОННЫМ РАЗБИЕНИЕМ*

Исследуемые в современной теории игр модели можно разделить на два класса: стратегические и кооперативные. Под стратегическими моделями понимаются игры стратегий, т.е. игры, в которых участники конфликта выбором стратегий стремятся максимизировать свою функцию выигрыша. При этом игроки действуют независимо друг от друга, и возможность кооперации в таких моделях не рассматривается. В кооперативных моделях изначально предполагается, что игроки объединяются в максимальную («большую») коалицию с целью максимизации общего суммарного выигрыша. И задача заключается в способе определения дележа этого выигрыша между игроками после того, как он получен.

Имеется серия работ (см. [1-4]) в которых исследуется промежуточный случай, когда кооперация не является полной или когда игроки, разбившись на подгруппы (коалиции), выбирают свои стратегии в интересах той коалиции, в которую входят. В настоящей работе впервые сделана попытка исследовать динамические игры с коалиционным разбиением, при этом предусмотрена возможность случайного изменения этих разбиений в некоторых позициях дерева игры. Предлагается алгоритм построения оптимального пучка путей, основанный на предположении, что игроки, находясь в составе той или иной коалиции, стремятся своими действиями максимизировать суммарный выигрыш игроков, входящих в коалицию.

1. Определение динамической игры с переменным коалиционным разбиением

Ниже мы будем рассматривать в качестве базовой модели многошаговую игру п лиц с полной информацией, которая включает в себя возможность случайного возникновения или изменения коалиционных разбиений в некоторых вершинах дерева игры.

Определение 1. Деревом игры называется конечный древовидный ориентированный граф К с корнем хо.

В дальнейшем будем придерживаться следующих обозначений. Пусть х — некоторая вершина (позиция). Обозначим через К(х) поддерево дерева К с началом в вершине х. Обозначим через Z(х) множество вершин (позиций), непосредственно следующих за х. Альтернативами в вершине х называются вершины у, следующие за х (у € Z(х)). Игрока, принимающего решение в позиции х (выбирающего следующую альтернативную позицию в вершине х), будем обозначать через г(х). Будем обозначать выбор игрока г(х) в позиции х через х € Z{x).

Пусть N = {1, ...,п} — множество игроков. Под разбиением множества игроков N будем понимать набор множеств Д^ = {Sj^=1', таких что Sj П Б^ = 0; ] = г; и Sj = N. Множество всех допустимых разбиений множества N обозначим через Д.

Дадим точное определение позиционной игры п лиц с переменным коалиционным разбиением.

* Работа выполнена при финансовой поддержке Совета по грантам при Президенте РФ по поддержке молодых ученых и ведущих научных школ (грант НШ-2174.20031) и РФФИ (грант №02-01-01256).

Определение 2. Позиционной игрой п лиц с переменным коалиционным разбиением Г(жо) называется дерево игры К, на котором заданы:

(I) разбиение позиций на п + 2 множества Р\, Р2,..., Рп, Рп+1, Рп+2, называемое разбиением на множества очередности. Позиции х € Рг называются позициями г-го игрока, для г = 1, ..., п; позиции х € Рп+1 — позициями случая; позиции х € Рп+2 — окончательными позициями;

(II) для каждой из вершин х разбиение Д(х) € А множества игроков N таким образом, что

Д(х) = Д(у), уу € Z(х), если х € Рп+1; зу € Z(х) : Д(х) ф Д(у), если х € Рп+1]

(III) для каждого у € Z(х) = {у1,...,уг}, х € Рп+1 вероятностное распределение

р(У1),...,р(Уг^ Е р(у) = 1 г = \Z(х)1;

У^(х)

(IV) на множестве окончательных позиций Рп+2 набор вещественных чисел Ь(л) = (Н1(ш),..., Нп(ад)), V € Рп+2, Ы(и)) > 0, г = 1,..., п называются выигрышами игрока г.

Определение 3. Стратегией игрока г называется однозначное отображение иг(), которое каждой позиции х € Рг ставит в соответствие некоторую альтернативу у € Z (х).

Множество всевозможных стратегий игрока г будем обозначать через иг.

В данной постановке мы предполагаем, что игрок г € N в позициях у € Рг (в своем множестве очередности) играет в интересах коалиции Б^, его содержащей (г € Б^, Б^ € Д(х2)), т.е. стремится максимизировать суммарный выигрыш игроков из коалиции Б^.

Пусть игроки выбрали свои стратегии и^-), ...,ип(-). Тогда игра развивается следующим образом. Игра начинается в позиции хо € Рп+1, в которой задано некоторое коалиционное разбиение Д(хо) € Д. В начальной позиции хо ходит случай и, в соответствие с вероятностями, определенными условием (III) определения 2 для позиции хо, выбирает альтернативу ~х\ € 2[хо), которой соответствует некоторое коалиционное разбиение Д(ж1) € А. Предположим, что х\ € Тогда в позиции х\ ходит игрок «(жх) и выбирает альтернативу Х2 = Щ^^х^) € Z(x 1), действуя в интересах коалиции, его содержащей, в соответствии с коалиционным разбиением, реализовавшимся в результате случайного выбора в позиции хо € Рп+1- Пусть позиции Х2 соответствует коалиционное разбиение Д(ж2), совпадающее с Д(ж1) (Д(ж2) = Д(ж1)). Если Х2 ф Рп+1 и Рп+2, то в позиции Х2 ходит игрок Их2) и выбирает альтернативу хз = € действуя в интересах коалиции, его содержащей. Если же Х2 € Рп+1, т.е. в позиции Х2 ходит случай, то в позиции Х2 альтернатива жз выбирается в соответствии с вероятностями, определенными условием (III) определения 2 для позиции Х2- Выбранной таким образом позиции жз € Z(x2) соответствует коалиционное разбиение Д(жз) € А, которое может совпадать с коалиционным разбиением в Ж2, а может и нет, и т. д. Если на шаге к, хь ф Рп+1 и Рп+2, то в позиции хь ходит игрок и выбирает альтернативу Хк+1 = иг(хк)(%к) £ действуя в интересах коалиции, его содержащей. Если на к-ом шаге игра попадает в позицию случайного хода, т. е. хь £ Рп+1, то в позиции хь альтернатива хи+1 выбирается в соответствии с вероятностями, определенными условием (III) определения 2 для позиции Выбранной таким образом позиции Хк+1 € 2(хк) соответствует коалиционное разбиение Д(ж^_|_1) € А, которое может совпадать с коалиционным разбиением в^, а может и нет. Игра продолжается до достижения некоторой позиции ш € Рп+2. Это происходит за конечное число шагов, т. к.

дерево К конечно. В позиции ш согласно условию (IV) определения 2 заданы выигрыши Н\(ш), ...,кп(ш) игроков. Поэтому каждый набор стратегий и(■) = (^1 (■), ...,ип() или ситуация определяют некоторое вероятностное распределение на окончательных позициях игры (из-за случайных выборов в позициях х € Рп+1), а следовательно выигрыш г-го игрока Нг(ш) оказывается случайной величиной. Поэтому каждой ситуации и(■) = (и^), ...,ип()) однозначно соответствует математическое ожидание выигрышей игроков Е^и^), ...,ип()) = Е[Нг(ш)], г € N. Таким образом, формально мы можем записать нашу игру как игру в нормальной форме N; и1, ...,ип; Е1,..., Еп). Однако такая запись мало пригодна для исследования и носит лишь иллюстративный характер, поскольку никак не учитывает принадлежность игроков к различным коалициям на различных этапах игры. Последнее делает невозможным использование классических принципов оптимальности (равновесие по Нэшу, оптимальность по Парето и др.) для построения оптимального поведения. Ниже мы приведем новый подход к построению оптимального решения, которое учитывает наличие определенной коалиционной структуры в игре и динамику ее изменения.

Как было сказано выше, в данной постановке мы предполагаем, что игрок г € N в позициях у € Рг (в своем множестве очередности) играет в интересах коалиции Sj, его содержащей (г € Sj, Sj € Д(х^)), т.е. стремится максимизировать суммарный выигрыш игроков из коалиции Sj. При этом внутри коалиции Sj выигрыши игроков считаются трансферабельными, а для определения выигрыша каждого игрока к € Sj используется вектор Шепли, рассчитанный для специальным образом построенной характеристической функции V(К,х) , К с Sj. Исходя из такого подхода в этом разделе мы предложим способ построения решения игры Г(хо), который приводит также к построению соответствующего пучка путей. Решение игры Г(хо) будем строить методом обратной индукции, двигаясь от окончательных позиций к начальной. Процедура построения решения напоминает схему построения абсолютного равновесия по Нэшу (см. [5, 6, 8]) в обычной позиционной игре с полной информацией, а также алгоритм построения оптимального пути в игре с частичной кооперацией (см. [7]).

Прежде, чем перейти к построению решения игры Г(хо), введем понятие длины игры Г(хо). Под длиной игры Г(хо) будем понимать длину наибольшего пути на дереве К(хо) (число вершин входящих в максимальный путь). Предположим, что длина игры Г(хо) равна Т +1. Рассмотрим разбиение множества всех позиций дерева игры К (хо) на Т +1 множество Хо, Х1,..., Хт Хт = {хо}, где множество XI состоит из позиций, достигаемых из начальной позиции в точности за Т — £ ходов. Элементы множества Х4, обозначим через через х4, £ = 0,1, ...,Т. Рассмотрим множество позиций Хо. Так как длина игры равна Т +1, то Хо С Рп+2 и выигрыши игроков уже определены и равны соответственно Нг(чл), ад € Хо, г = 1,..., п.

Шаг 1. Перейдем от позиций Хо к позициям х1 € Х1. Если х1 € Рп+1 и Рп+2, тогда в позиции х1 ходит игрок г(х1). Пусть для определенности г(х1) принадлежит коалиции Sj(х1); Sj(х1) € Д(х1). Здесь (х1)} — набор коалиций, составляющих коалиционное разбиение Д(х1). Алгоритм предписывает игроку г(х1) выбирать любую из позиций (альтернатив) «7 € Z{x 1) из условия

2. Алгоритм построения решения

Формула (1), вообще говоря, определяет вершину «7 неоднозначно, что в свою очередь порождает неединственность решения.

Если х1 € Рп+1 (т.е. в позиции х1 ходит случай), и игра переходит в позиции х € Z(х1) с вероятностями р(х), определенными правилами игры, то ожидаемые выигрыши игроков в х1 при этом равны ^ р(х)Нг(х), где р(х) — вероятность реализации

хег(хх)

альтернативы (позиции) х € Z(х1). Если х1 € Рп+2, то выигрыши игроков в х1 определяются как Нг(х1), г = 1, ...,п.

Заметим, что так как из-за возможного наличия случайного хода предлагаемая схема выбора не определяет путь (дугу) однозначно, мы получаем некоторый «пучок» (поддерево). В случае х1 € Рп+1, «пучок» будет состоять из единственной дуги (или одной вершины, если х1 € Рп+2).

Применяя аналогичные рассуждения, можно построить «пучок» с началом (корнем) в х1 € Х1 для каждой позиции х1 множества Х1. Таким образом, на каждом поддереве К(х1), х1 € Х1 (это поддерево может состоять и из единственной вершины, если х\ € Рп+2) фиксируется позиция «7, являющаяся предполагаемой окончательной позицией строящегося пучка игры Г(хо), или вероятностное распределение на Z(х1), если х1 € Рп+1. Поэтому, зная поведение игроков на поддеревьях К(х1), х1 € Х1, мы можем ввести аналог функций Беллмана г1 : Х1 ^ Д+, г = 1, ...,п, задаваемых на множестве Х1; г1 —ожидаемый (прогнозируемый) выигрыш игрока г в позиции х1 € Х1 в предположении, что на поддереве К(х1) игроки действуют согласно построенному алгоритму.

{К(гй), если х\ £ Рп+2 и Рп+ ь

Нг(х1), если х1 € Рп+2, (2)

р(т)Нг(л), если х1 € Рп+1.

wez(x1)

Шаг 2. Продолжим движение по направлению к корню дерева игры. Поскольку в позициях х2 € Х2 алгоритм может включать новые элементы, подробно остановимся и на этом случае. Определим выборы игроков в позиции х2 € Х2. Если х2 € Рп+2 и Рп+1, то в позиции х2 ходит игрок г(х2) € Sj(х2). Предписываем игроку г(х2) выбрать любую из позиций XI из условия

тах ^ г\{х) = ^ (^1), (3)

гЕБ^ (х2) гЕБ^ (Х2)

х£^(х2) ^

где г1 определяется по формуле (2).

Если х2 € Рп+1 (т.е. в позиции х2 ходит случай), то в силу того, что Д(х2) может и не совпадать с Д(х1), где х1 € Z(х2), в позиции х2 возникает неопределенность с выигрышами игроков. Чтобы определить значения функций г2(х2) в позиции х2 (корне «пучка» игры на поддереве К(х2)), необходимо выделить выигрыши игроков из коалиционных выигрышей, т. е. определить некоторый дележ суммарного выигрыша для каждой коалиции {Sj(х1 }=1_Х1)'. Подобный дележ может быть произведен с использованием характеристических функций (х. ф.), построенных для каждого элемента коалиционного разбиения Д(х), х € Х1. Сам способ построения характеристических функций будет приведен в следующем разделе. Сейчас же мы предположим, что х.ф. у^К^ь(х))), К с Sk(x), Sk(х) € Д(х), к = 1,..., |Д(х)| известна. Выберем произвольно коалицию Sk(х1) € Д(х1). Рассмотрим кооперативную игру |Sk(х1 )| лиц

0(хг,Бк(х1)) с х.ф. у(х,Я(Бк(х1))), Я с Бк(х1). Выигрыш наибольшей (Бь(хг)) коалиции в кооперативной игре 0(х1 ,Бь (х1)) равен

ь(х1,Бк(х1)) = г1 (х1). (4)

г€Зк(х-1)

Вычислим в 0(х1, Бь(х1)) вектор Шепли [9] с компонентами БНг(Бь(хг)), г € Бь(хг),

где

У^ БЪг(Бк(х 1)) = ь(х1 ,Бк (х1)).

гезк(х!)

Будем рассматривать его как оптимальный дележ коалиционного выигрыша У1(х1, Бь(х1)). Рассуждая аналогично, находим оптимальный дележ и для других коалиций из {Д(х1)\Б&(х1)}. Построим вектор

РМБ(х1) = (РМБ1(х1),..., РМБп(х1)), (5)

где РМБг(х\) = БНг(Бк(х1)), г € Бь(хг), с помощью которого определяются выигрыши игроков 1, ...,п в случае, если х2 € Рп+1.

Если х2 € Рп+2, то выигрыши игроков в х2 равны просто Нг(х2), г = 1, ...,п. Поэтому мы можем определить на множестве Х2 функции г2 : Х2 ^ Я+, г € N,

{гЦхх), если х2 ф Р„+2 иР„+ь

Нг(х2), если х2 € Рп+2, (6)

Е р(х1) ■ РМБг(х{), если х2 € Рп+1,

где р{х 1)—вероятность реализации альтернативы г^жх) определяются из (3), а РМБг(х\) из (5). Таким образом «пучок» путей на каждом поддереве К(х2) построен.

Дальнейшие шаги процедуры аналогичны шагам 1 и 2. Рассмотрим шаг Ь. Предположим, что продолжая двигаться к корню игры хо дерева игры мы достигли позиции хг € Хг. Пусть функции гг-1 : Хг-1 ^ Я+, г € N определяют, какие выигрыши получают игроки г € N после выбора ими в позициях х; € X;, I < Ь, предписанных нами решений.

Шаг 1. Рассмотрим некоторую позицию хг € Xt. Если хг € Рп+1 и Рп+2, то в позиции хходит игрок г(хг) € Б к (хг) € Д(хг). Предписываем игроку г(хг) выбрать любую позицию Ж(_1 из условия

Г1 1(Ж)= Г1 Н^-!)- (7)

геБк(хь) гевк(хь)

Формула (7), вообще говоря, определяет вершину неоднозначно, что в свою очередь порождает неединственность решения.

Если хг € Рп+1, то необходимо выделить выигрыши игроков из коалиционных выигрышей, т. е. определить некоторый дележ суммарного выигрыша для каждой коалиции {Б2(хг-г)}^^**-1^. Выберем произвольно коалицию Бк(хг-г) € Д(хг-г). Рассмотрим кооперативную игру \Бк(хг-г)\ лиц 0(хг-1,Бк(хг-г)) с х.ф. у(хг-1,Я(Бк(хг-1))),

К с Sk(xt-l). Выигрыш наибольшей (xt-l)) коалиции в кооперативной игре С(хН-1 (х—)) равен

v(xt-l,Sk (х—)) = г1-1(х—1). (8)

гЕБк(хь-1)

Мы будем рассматривать вектор Шепли с компонентами Shi(Sk(xt—l)), г € Sk(х—1), где

У^ Shi(Sk(xt— 1)) = у(х—1, Sk(х—1)), геБк(хь-1)

в качестве оптимального дележа коалиционного выигрыша у(х1-—1, Sk(х—1)). При этом для определения компонент вектора Шепли Shi(Sk(х—1)), г € Sk(х^1) пользуемся х. ф. v(xt—l,К(Sk(xt—l))), К с Sk(х^1), Sk(xt—l) € Д(х—1). Рассуждая аналогично, находим оптимальный дележ и для других коалиций из {Д^^^^ь^^^}. Построим вектор

PMS(xl) = (PMSl(xt-l), ...,PMSn(xt-l)), (9)

где PMSi(xt—l) = Shi(Sk(х^1)), г € Sk(xt—l), с помощью которого определяются выигрыши игроков 1,..., п в случае, если х^ € Рп+1. Если х^ € Рп+2, то выигрыши игроков в х^ определяются как хг = 1, ...,п.

Функции г\ : Хг ^ К+, г € N, зададим следующим образом:

{ггГ1(хг-\), если хг ф Рп+2 и Рп+ ь Ьн(х^), если xt € Рп+2,

2 р(х—1) • PMSi(xt-l), если xt € Рп+1,

Хt-lЕZ(xt)

где £>(ж(-1)—вероятность реализации альтернативы Ж(-1, 1) определяются из

(7), а PMSi(xt-l) —из (9). Таким образом «пучок» путей и соответствующие выигрыши на каждом поддереве К(х^), х^ € построены.

Функции г^х) имеют смысл ожидаемого (прогнозируемого) выигрыша игрока г в позиции х^ € Xt, в предположении, что на поддереве К(х^) игроки действуют согласно построенному алгоритму.

Продолжая спускаться по дереву игры Г(хо) к начальной позиции хо и последовательно определяя выборы игроков в оставшихся множествах Хт, т = Ь + 1, ...,Т, мы построим «пучок» путей и соответствующие выигрыши, которые реализуются в игре Г(хо). Будем называть этот «пучок» путей оптимальным пучком в игре с переменным коалиционным разбиением, полученным на основе использования PMS-векторов.

3. Построение характеристических функций вспомогательных кооперативных игр

В настоящем разделе мы укажем способ построения х. ф. у(х,К), К с Sk(х) игры 0(х^ь(х)). Обозначим через Г(х) подыгру игры Г(хо) с началом в вершине х. При построении оптимального «пучка» развития игры Г(хо) в разделе 2 было определено поведение игроков г € N в каждой позиции множества очередности Рг, г € N. Обозначим через и*(•) = (и*(•),..., и*(•)) набор стратегий игроков, определенных в

разделе 2, приводящих к реализации оптимального пучка в игре Г(хо). Кооперативная игра 0(х,Бк(х)) строится с использованием этих стратегий. Введем понятие усечения ситуации игры. Усечение ситуации в подыгре есть сужение этой ситуации на множество позиций данной подыгры. Рассмотрим усечение и*(■) = (и*х() ...,и*х(■)) набора И*. И пусть Г(ж)— сужение подыгры Г(ж), в котором выборы игроков г ф Бк(х) в их личных позициях зафиксированы в соответствии со стратегиями и*х. Так же как и оптимальный пучок мы будем строить х. ф. у(х, Я), Я с Б к (х) методом математической индукции для х € Рп+1 (т.к. для х € Рп+1 наш алгоритм не требует построения вектора Шепли). Рассмотрим множество позиций Хо. Так как длина игры равна Т + 1,

Хо С Рп+2 и у(х, Я), Я с Бь(х), в этом случае просто у(х, Я) = Е (х).

гек

Шаг 1. Перейдем от позиций х € Хо к позициям х1 € Х1 (х1 € Рп+1), и рассмотрим усечение Щ^-) = (ЩХ1 (•),..., и*Х1 (•)) набора Щ^-) в подыгре Г^). И пусть Г^)-сужение подыгры Г(ж1), в которой выборы игроков г ф Би{х\) в их личных позициях зафиксированы в соотвествии со стратегиями и*Х1 (•). Таким образом, игра Г(ж1) оказывается игрой между игроками, входящими в коалицию Б к (х1). Для каждой подкоалиции

Я С Бк(жх) рассмотрим ассоциированную с Г(ж1) игру с нулевой суммой Г(жх, ^(жх)) между двумя игроками: коалицией Я, являющейся максимизирующим игроком (выигрыш коалиции Я равен сумме выигрышей игроков из Я), и коалицией Бь(х1)\Я, являющейся минимизирующим игроком (выигрыш коалиции Бк(х1)\Я равен выигрышу коалиции Я с обратным знаком). Можно показать, что выигрыш каждой коалиции Я, определенный таким образом, не может превысить величины у(х1,Бк(х1)) = Е г1(х1)

геяк(х1)

(см (4)), поскольку по построению коалиция Бк(х1) получает выигрыш у(х1,Бк(х1)), используя наилучший ответ против стратегий и*х1 (■) игроков г € Б и (х1). Пусть у(х1,Я)

будет значением игры Г(жх, ^(жх)). С помощью х. ф. -у(ж1, Д), Я С ^(жх) вектор Шепли строится в игре Г(х1) обычным способом.

Шаг 1. Рассмотрим некоторую позицию хг € Хг, хг € Рп+1, и усечение V* (■) = {и* {■),..., и*х^(-)) набора £/*(•) в подыгре Г(ж4), и сужение Г(ж4) подыгры Г(жо), в которой выборы игроков г € Б к (хг) в их личных позициях определены в соответствии со стратегиями и* {■). Таким образом игра Г(ж4) оказывается игрой между игроками, входящими в коалицию Бк(хг). Для каждой подкоалиции Я с Б к (хг) рассмотрим ассоциированную с Г(ж4) игру с нулевой суммой Г(ж4, ¿>й(ж()) между двумя игроками: коалицией Я, являющейся максимизирующим игроком (выигрыш коалиции Я равен сумме выигрышей игроков Я), и коалицией Б^(хг)\Я, являющейся минимизирующим игроком (выигрыш коалиции Б к (хг )\Я равен выигрышу коалиции Я с обратным знаком). Можно показать, что выигрыш каждой коалиции Я, определенный таким образом, не может превысить величины у(хг,Бк(хг)) = Е г^(хг) (см. (8)), поскольку

по построению коалиция Б к (хг) получает выигрыш у(хг, Бк(хг)), используя наилучший ответ против стратегий и*х (■) игроков г € Бк(хг). Пусть у(хг, Я) будет значением игры

Г(ж(, Ж()). С помощью х. ф. ги{х1-, Я), Я С ж4) вектор Шепли строится в игре Г(ж4) обычным способом.

Продолжая далее, можем построить у(х, Я), Я с Б^(х) для всех х € Рп+1, а также соответствующий вектор Шепли. Заметим, что построенная х. ф. у(х,Я), Я с Бк(х), х € Хг требует знания набора V* (■), однако последний также использует знание о у(х, Я), но уже при х € Х;, I < Ь. Поэтому наше построение корректно.

4. Пример

Рассмотрим позиционную игру Г(хо) с переменным коалиционным разбиением и деревом игры К(хо), изображенном на рис. 1. Здесь N = {1, 2, 3}, множество очередности игрока 1— Р1 = {х1,х2 ,хз, х2з ,х24 ,х2в}, игрока 2 — Р2 = {х7,х8,хц,х2г ,х29 ,хз1}, игрока 3 — Рз = {х5,х1з,хзз,хз5,хз7}, множество позиций случая Р4 = {хо,х14,хз9}. Выигрыши записаны в окончательных позициях, причем в каждом столбце верхнее число есть выигрыш игрока 1 и т. д. Предположим, что множество допустимых разбиений игроков N = {1, 2, 3} на коалиции имеет вид Д = {Д1, Д2, Дз}, Д1 = {1}, {3, 2}; Д2 = {1, 2, 3}; Дз = {1, 3}, {2}. Пусть в вершинах х € Z(хо) заданы переходные вероятности р(х1),р(х2),р(х3), р(х 1) + р(х2) +р(х3) = 1, р(х 1) = р{х3) = р{х2) = §. Пусть Д(хл) = {1}, {3, 2}; Д(х2) = {1, 2, 3}; Д(хз) = {1, 3}, {2}. Аналогично, в вершинах х € Z{x 14) заданы переходные вероятности р(х2о) = р(х22) = р(х2\) = Д(х2о) = {1}, {3, 2}; Д(х21) = {1, 2, 3}; Д(х22) = {1, 3}, {2}. В вершинах х € Z(х19) заданы переходные вероятности р(х23) = р{х25) = р{х24) = А(х23) = {1},{3, 2}; Д(х24) = {1, 2, 3}; Д(х25) = {1, 3}, {2}. Построим оптимальный «пучок» в игре Г(хо). Процедура построения оптимального «пучка» начинается в окончательных позициях хз8, хз9, х4о, х41, х42, х4з. Рассмотрим подыгры на деревьях К(хзз), К(хз5), К(хз7). Д(хзз) = Д(хз8) = Д(хз9). В позиции хзз ходит игрок 3. 3 € {3,2} € Д(хзз). h2(хз8) + hз(xз8) = 5 > h2(хз9) + hз(xз9) = 4. Следовательно, в позиции хзз игрок 3 выберет альтернативу, ведущую в хз8. Тогда г1 (хзз) = (2, 3, 2)*; г1 (хз1) = (1,1,1)*. Д(хз5) = Д(х4о) = Д(х41). В позиции хз5 ходит игрок 3. 3 € {1,2,3} € Д(хз5). hl(x4о) + h2(х4о) + hз(x4о) = 6 < ^(х41) + h2(x4l) + hз(x4l) = 8. Следовательно в позиции хз5 для игрока 3 оптимальным является выбор альтернативы х41. Тогда г1 (хз5) = (3,4,1)*; г1 (хз4) = (1, 3,1)*. Д(хзг) = Д(х42) = Д(х4з). В позиции хзг ходит игрок 3. 3 € {1, 3} € Д(хзз). Л-1(х42) + hз(x42) = 2 > Л-1(х4з) + hз(x4з) = 1. Таким образом г1 (хз7) = (1,1,1)*, г1 (хзб) = (0, 0,1)* и в хз7 игрок 3 выберет альтернативу х42.

Рассмотрим подыгры на деревьях К(х27), К(х29), К(хз1). Имеем Д(х27) = Д(хз1) = Д(хзз). В позиции х27 ходит игрок 2. 2 € {3, 2} € Д(хз1). Так как г^(хз2) + г3(хз2) < г2 (хзз) + гз(хзз) = 5, то в х27 игрок 2 выберет альтернативу хзз и г2(х27) = (2, 3, 2)*, г2(х2б) = (0, 2, 2)*. Действуя аналогично, получим, что г2(х29) = (3, 4,1)*, г2(х28) = (0, 5,0)*; г2(хз1) = (1,1,1)*, г2(хзо) = (0,1,1)*.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рассмотрим подыгры на деревьях К(х27), К(х29), К(хз1). Имеем Д(х27) = Д(хз1) = Д(хзз). В позиции х24 ходит игрок 1. 1 € {1} € Д(х2з). Так как г2(х2в) = 0 < г2(х27) = 2, в позиции х2з игрок 1 выберет альтернативу х27. Тогда гз(х2з) = (2, 3, 2)*. Рассуждая аналогично, получим гз(х24) = (3,4,1)*; гз(х25) = (1,1,1)*.

Рассмотрим подыгру на поддереве К(х19). В позиции х19 ходит случай. Д(х2з) = {3, 2}, {1}. Выберем коалицию {3, 2} € Д(х2з) и рассмотрим кооперативную игру С(х2з, {3, 2}) 2-х лиц с х. ф. у(х2з, К), К с {3, 2}. Построим х. ф. у(х2з, К), К с {3, 2}. у(х2з, {3, 2}) = 5, у(х2з, {3}) = 1, у(х2з, {2}) = 2. Тогда в позиции х2з Sh2({3, 2}, х2з) = 3; Shз({3, 2},х2з) = 2; {Д(х2з) \ {3, 2}} = {1}. Тогда Shl({1},x2з) = 2. Построим вектор PMS(x2з). PMSl(x2з) = Shl({1},x2з) = 2, PMS2(x2з) = Sh2({3,2},х2з) = 3, PMS3(x23) = Sh3({3, 2}, х2з) = 2. Таким образом, PMS(x23) = (2, 3,2). Д(х24) = {1, 2, 3}. Рассмотрим кооперативную игру 0(х24, {1, 2, 3}) 3-х лиц с х. ф. у(х2з, К), К с {1, 2, 3}. Построим х. ф. у(х23,К), К с {1, 2, 3}. у(х24, {1, 2, 3}) = 8, у(х24, {1, 2}) = 6, у(х24, {2, 3}) = 5, у(х24, {1, 3}) = 2, у(х24, {1}) = 1, у(х24, {2}) = 4, у(х24, {3}) = 0. Тогда в позиции х24 Shl({1, 2, 3},х24) = 2; Sh2({1, 2, 3},х24) = 5; Shз({1, 2, 3},х24) = 1; PMSl(x24) = Shl({1, 2, 3},х24) = 2, PMS2(X24) = Sh2({1, 2, 3},х24) = 5, PMSз(x24) =

Sh3({1, 2, 3},х24) = 1. Тогда PMS(x24) = (2, 5,1). Действуя аналогично, получим что, РМБ(х25) = а, 1, |). Тогда гЦх 19) = р(х23) • РМ^(х23) +р(х24) • РМ^(х24) +р(х25) •

Ц;г|(ж19) =р(х2з)-М%(^2з)+р(^24)-™^з(^24)+р(х25)-™^з(з:25) = . Таким образом г4(х19) = ±§)* и г4(х16) = (0,1,1)*, г4(х17) = (0, 0, 0)*, г4(х18) = (1, 4,1)*, г4(х2о) = (0, 3, 0)*, г4(х21) = (3, 0, 0)*, г4(х22) = (0, 0, 0)*. Опустим детальное изложение последующих шагов. Продолжая двигаться к корню игры хо и рассуждая аналогично, мы достигнем позиции хо. Поскольку в позиции хо ходит случай (хо € Р4), г§ = И> М)*' т* е* ВЫИГРЫШИ ПРИ движении вдоль оптимального пучка совпадают с PMS-вектором для всей игры. Оптимальный «пучок» на рисунке отмечен жирной линией.

Summary

L. A. Petrosjan, S. I. Mamkina. Dynamic games with changing coalitional structure.

Dynamic multistage games with perfect information are considered. The definition of the game differs from the classical H. Kuhn definition by the presence of vertices in which the chance moves and randomly selects the coalitional partition in the game. This partition remains unchanged until the game finds itself in the next vertex where, the chance move is making the decision to choose the next coalitional partition. The new value for such a game is proposed (the so called PMS-value). This value is computed by using the backward induction procedure for the vertices with a given coalitional partition and more complicated transition procedures in the vertices of the chance. The result is illustrated by an example.

Литература

1. Owen G. A characterization of the Banzof-Coleman Index // SIAM Journal of Applied Mathematics. Vol. 2. 1978. P. 315-327.

2. Owen G. Values of Games with a Priori Unions // Mathematical Economy and Game Theory / Ed. by R. Henn and O. Moeschlin. Berlin, 1977. P. 78-88.

3. Bloch F. Sequental Formation of Coalitions with Fixed Payoff Division // Games and Economic Behavior. 14(1966). P. 90-123.

4. Ono R., Muto S. Stability of Japan's Coalitions Cabinet // Power and Fairness / Ed. by M. J. Holer at al. Mohr Siebech, Germany, 2002. P. 17-25.

5. Nash J. Non-coperative Games. Ann. of Math. 54(1951). P. 286-295.

6. Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. Москва, 1998. 300 с.

7. Петросян Л. А., Аешин Д. А. Значение динамических игр с частичной кооперацией // Труды института математики и механики. Том 6, №1, 2. Екатеринбург, 2000. С. 160-172.

8. Петросян Л. А., Кузютин Д. В. Игры в развернутой форме: оптимальность и устойчивость. СПбГУ, С.-Петербург, 2000.

9. Shapley L. S. A Value for те-Person Games // Contributes to the Theory of Games / Ed. by H. W. Kuhn and A. W. Tucker. Princeton: Princeton University Press, 1953. P. 307-317.

Статья поступила в редакцию 23 декабря 2003 г.

Игры с переменным коалиционным разбиением Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Петросян Л. А., Мамкина С. И.

Похожие темы научных работ по математике , автор научной работы — Петросян Л. А., Мамкина С. И.

Dynamic games with changing coalitional structure

Текст научной работы на тему «Игры с переменным коалиционным разбиением»