УДК 519.83
В. А. Фахретдинова
существование равновесия НЭША-ПАРЕТО в конечных позиционных играх в условиях неопределенности
В работе рассматривается многошаговая позиционная игра N лиц в условиях неопределённости. Используется предложенная Г. У. Куном графовая формализация, где, в соответствии с подходом В. И. Жуковского, неизвестными считаются вероятностные характеристики реализации неопределённости. Установлено, что в игре, являющейся аналогом игры с полной информацией, существует равновесие Нэша-Парето в чистых стратегиях, а в игре с произвольной информационной структурой —равновесие Нэша-Парето в смешанных стратегиях.
Ключевые слова: многошаговая игра, позиционная стратегия, информационное множество, равновесие Нэша-Парето.
Многошаговые процессы принятия решения при наличии неопределённых факторов рассматриваются при моделировании таких явлений, в которых стороны в момент принятия решения располагают различной информацией. Математической моделью, учитывающей особенности таких процессов, является многошаговая позиционная игра в условиях неопределенности.
Воспользуемся графовой формализацией, предложенной Г У. Куном [1, с. 14].
Рассмотрим многошаговую игру N лиц Г, определенную на конечном древовидном графе G=(X,V) с выделенным корнем, расположенном в ориентированной плоскости; здесь X — множество вершин и V — множество дуг. Граф О называется деревом игры.
Альтернативами V в вершине х е X называются дуги, исходящие из этой вершины. Если х имеет j альтернатив, то их нумерация осуществляется в положительном, в смысле ориентации плоскости, направлении. Множество альтернатив в вершине х обозначим через V(х).
Вершины, имеющие альтернативы, называются промежуточными позициями, остальные — окончательными позициями. Окончательные позиции будем обозначать о.
Путь из выделенного корня в окончательную позицию о называется партией. Указанный путь, очевидно, единственный.
Пусть А с X — множество промежуточных позиций. Альтернативным разбиением называется разбиение множества А на множества Аj■, j = 1, 2,. , где Аj■ содержит все позиции с j альтернативами.
Зададим на дереве игры О = (X, V):
10. Разбиение Р множества промежуточных позиций А с X на N +1 множество Р, г = 0, 1,..., N . Разбиение Р называется разбиением по игрокам или разбиением на множества очередности. Позиции из Р0 называются позициями неопределённости (случая), позиции из Р, г = 1,...,N — личными позициями г -го игрока.
20. Разбиение U множества промежуточных позиций A с X на множества
U с Pi п Aj такие, что никакое U не содержит двух позиций одной и той же партии. Разбиение U называется информационным разбиением, а его элементы U с U — информационными множествами.
З0. Информационные множества U с P0 п Aj предполагаются одноэлементными, причём, в отличие о схемы Куна, вероятностные характеристики реализации неопределенности полагаются неизвестными1.
40. Вещественнозначную векторную функцию F(о) = (F1 (о),..., Fn(о)) каждой окончательной позиции о . Функция F(о) называется функцией выигрыша.
Ее і -ая компонента F(о) является значением выигрыша і -го игрока, і = 1,...,N , в окончательной позиции о.
Согласно концепции позиционной стратегии [1, с. 21], понятие чистой позиционной стратегии определяется следующим образом. Пусть Ui = {ji U — семейство информационных множеств і -го игрока, V^i — множество соответствующих каждому информационному множеству U1 є Ui альтернатив. Чистой позиционной
стратегией і -го игрока называется отображение вида si : U' ^ V^i .
Обозначим множество всех отображений si через St, і = 1,.,N . Смешанной стратегией і -го игрока называется вероятностное распределение на множестве его
чистых стратегий Si.
Ситуацией позиционной игры называется набор s = (s1,..., sN ) с S1 х . х SN = S,
si є Si, i = I-.N .
Будем полагать чистой реализацией неопределённости правило, которое каждой
позиции неопределённости x є P0 ставит в соответствие допустимую альтернативу
v єV(x); y: P0 ^ V(x). Естественным образом определяется смешанная реализация неопределённости. Множество всех правил у обозначим через Y . Ясно, что формально реализация неопределённости совпадает с понятием позиционной стратегии.
Цель і -го игрока, і = 1,...,N , состоит в выборе такой чистой (смешанной) стратегии, что в результате реализации партий игры она доставляет игроку наибольшее значение компоненты Fi (о) функции выигрыша (математического ожидания реализаций выигрышей, соответствующих смешанным стратегиям) с учётом действий остальных игроков и реализаций неопределённостей из Y .
В игре Г ситуация s = (s1,..., sN ) є S и реализация неопределённости у є Y однозначно определяют окончательную позицию о и, значит, выигрыши игроков F(о) = f (s, у).
Описанная задача называется позиционной игрой N лиц в условия неопределён-ности.
1 Такой взгляд на неопределённость соответствует подходу В. И. Жуковского и В. С. Молостова, изложенному в [2], где известной предполагается лишь граница множества изменений неопределённых факторов.
В предложенной задаче каждый игрок, как обычно, ориентируется на возможность реализации «наименее благоприятных для всех игроков одновременно» значений неконтролируемых факторов — неопределённостей. Кроме того считаем, что относительно реализации неопределенности все игроки равноправны. Гарантированный смысл решению, таким образом, придаётся использованием оптимизации по
Парето. Разыскивается такая реализация неопределённости у' е У , что если какая-
либо другая реализация неопределённости у е У уменьшает выигрыш какого-либо из игроков, то найдется другой игрок, который при этом увеличит свой выигрыш. В бескоалиционных играх N лиц в условиях неопределённости данный подход разрабатывался в [3, 4, 5].
Положим, что решением позиционной игры в условиях неопределённости Г является равновесие Нэша-Парето.
Определение 1. Набор (э* у *)е Я х У называется равновесием Нэша-Парето игры Г если
1. у5г е Я,, 1 = N, /(5? у *)> /,(5 *1$,.,у *), (*)
2. У у е У / (** у *)> / (** у). (**)
Здесь ($ *5, )=(5*, 5* ^ $ , sг*,..., 4 ) и /(э* у *)> /(э* у) означает, что
система неравенств /($* у *)> /($* у), 1 = 1,...,N, несовместна, причем по крайней мере одно из неравенств строгое.
Рассматриваемое определение «достаточно» полное. В случае отсутствия неопределенности, то есть если У = {у0}, мы имеем дело с позиционной игрой, и предложенное определение есть равновесие в ней. В случае приведения позиционной игры к нормальной форме, предложенное решение есть равновесие Нэша-Парето в бескоалиционной игре N лиц в условиях неопределенности [4, с. 259].
Выделим класс позиционных игр в условиях неопределенности 30 = {Г0}, в которых все информационные множества одноэлементны. Это аналог игры с полной информацией [1, с. 32].
Теорема 1. В позиционной игре N лиц Г0 существует равновесие в чистых позиционных стратегиях и чистой реализации неопределенности.
Доказательство. Игре Г0 поставим в соответствие позиционную игру N +1 лица с полной информацией. Рассматриваемая игра отличается от Г0 тем, что в ней отсутствует неопределенность, но имеется N +1 -й игрок с множеством стратегий У.
N
Цель этого игрока — максимизировать функцию /N+1(э,у) = -^/(э,у). Согласно
,=1
теореме Цермело-фон Неймана [1, с. 32] в игре N +1 лица с полной информацией существует ситуация равновесия в чистых стратегиях. Обозначим это равновесие
(э? у *)е ЯхУ . Тогда /(э* у *)> /(э *||э,,у *) Уэ, е Я,, ,= 1,...,N, что есть условие
N N
(*) определения 1. Далее, ./N+1 у *) = -2/ у *)>/N+l у)=-2/ у) или
,=1 ,=1
N N
Е/5 у*)^ Е /(5* у) 5 полученного неравенства следует несовместность си-
г=1 г=1
стемы неравенств /(э* у *)> /(у* у), ,= 1,...,N, т. е. условие (**) определения 1.
Учитывая, что 5* е Я и у* е У — чистые стратегии игроков и чистая реализация не-определённости, получаем утверждение теоремы.
Рассмотрим игру Г с произвольной информационной структурой, на дереве которой реализованы пп. 10-40. Для такой игры имеет место
Теорема 2. В позиционной игре N лиц Г существует равновесие Нэша-Парето, возможно в смешанных стратегиях и смешанной реализации неопределённости.
Доказательство. Позиционную игру N лиц Г в условиях неопределённости можно представить в нормальной форме. Обозначим множество стратегий ,
-го игрока Я,, , = 1,...,N , и У — множество реализаций неопределённости. В силу конечности рассматриваемой позиционной игры эти множества конечны и, следовательно, компактны. Функция выигрыша /(э, у) является непрерывной. Тогда, согласно [4, с. 261], существует равновесие Нэша-Парето в смешанных стратегиях. Поскольку смешанные стратегии в нормальной форме игры соответствуют смешанным стратегиям в позиционной форме, то утверждение теоремы доказано.
Приведем модельные примеры, иллюстрирующие теоремы 1 и 2.
Пример 1. Рассмотрим двухуровневую игру двух лиц в условиях неопределённости. Игра протекает следующим образом. Первый игрок выбирает одну из двух
альтернатив V,, г = 1, 2, и сообщает свой выбор второму игроку. Второй, зная выбор
первого, также выбирает одну из двух альтернатив V,, г = 1, 2 . Независимо от действий игроков в игре реализуется некоторая неопределенность, которая также имеет две альтернативы. Дерево такой игры изображено на Рис. 1.
В этой игре каждой окончательной позиции отвечают два числа, которые соответствуют числовым значениям выигрыша первого (второго) игрока, соответственно.
Игроки имеют позиционные стратегии: Я1 .и0}^!^, v2}, Я2 : °, и2 }^ V, v2},
У .и о, и2, и0, ио, }^ V, v2}. Здесь и/ , , = 0, 1, 2; ] = 1, 2, 3, 4 - информационные множества, v1, v2 — альтернативы.
Согласно определению 1 в рассматриваемой игре равновесием Нэша-Парето является набор (5*, 5*, у*)е Я х Я, х У, где Э*(и0)= (^), 5*(и°, и22) = (уо, V2),
у * (и0, и2, и0, и44 ) = V, v1, v2, v1 ). В этом примере реализуется равновесие в чистых стратегиях и чистой реализации неопределённости. Игроки гарантируют себе
выигрыши /1* = 9, /2* = 2.
Пример 2. Рассмотрим игру, которая отличается от игры примера 1 информационной структурой. А именно, второй игрок имеет одно информационное множество
и0 (Рис. 2). В данном примере второму игроку уже неизвестны выборы первого.
Можно считать, что игроки делают свои выборы одновременно и независимо друг от друга, после чего реализуется некоторая неопределённость.
138
Изменение информационной структуры приводит к изменению стратегических
возможностей второго игрока. Именно: Я2 : и2} ^ {VI, v2}
Согласно определению 1 в этой игре равновесием Нэша-Парето является набор ($0, $2, у0 )е Я, х Я2 х У, где 5° (и/) = (v2), ^ (и2) = (у2),
у у (и0, и2, и0, и0 )=^2, V,, V2, V,).
В этом примере игроки гарантируют себе выигрыши /,0 = 5, /20 = 3
Сравним результаты игр в примерах 1 и 2. Первый игрок, передав информацию о своих действиях сопернику (пример 1), увеличивает свой гарантированный выигрыш с 5 до 9 единиц и ухудшает гарантированный выигрыш второго игрока с 3 до 2 единиц. Таким образом, в данной игре первому игроку выгодно информировать о своих действиях противника.
Литература
1. Кун Г. У Позиционные игры и проблема информации // Позиционные игры. М.: Наука, 1967. С. 13-40.
2. Жуковский В. И., Молоствов В. С. Многокритериальное принятие решений в условиях неопределённое™. М.: МНИИПУ, 1988. 130с.
3. Сложные управляемые системы [Межвуз. сб. науч. тр.]. М.: РосЗИТЛ, 1996. 179 с.
4. Жуковский В. И., Чикрий А. А. Линейно-квадратичные дифференциальные игры. Киев: Наукова думка, 1994. 320 с.
5. Zhukovskii V. I., Salukvadze M. E. The Vector-Valued Maximin. Boston, San Diego, New-York, London: Academic Press, 1994. 404 p.
V. Fahretdinova
existence of nash-pareto equilibrium in ultimate positional games under conditions of uncertainty
This paper considers the multi-stage positional game of N participants under uncertainty. A task graph formalization proposed by Kuhn is used. We consider the probability characteristics of the unknown uncertainties. This approach was proposed by V. I. Zhukovskii. It is shown that in a game with perfect information - Nash-Pareto equilibrium in pure strategies, where as in a game with arbitrary information structure, Nash-Pareto equilibrium in mixed strategies.
Keywords: multistage game, positional strategy, information set, Nash-Pareto equilibrium.