Ю.В.Нечитайлов
ПАРАЛЛЕЛЬНАЯ КОМПОЗИЦИЯ В ДИНАМИЧЕСКОЙ ЛОГИКЕ ИГР С ОГРАНИЧЕННОЙ РАЦИОНАЛЬНОСТЬЮ1
Abstract. Linear game form is introduced to represent the games with bounded rationality for Dynamic Game Logic. Special attention is paid for the operation of consequential composition. Similarly to the parallel operations it describes interconnected games. The properties of the consequential composition significantly deviate in case of the game model with bounded rationality. E.g. the reduction (a;fî)p = (а)ф)р is impossible in both directions. Finally, the representation of information streams and information update in Dynamic Game Logic is discussed.
Введение
Динамическая логика игр была представлена Париком [4]. С тех пор она претерпела множество модификаций (см., например, [1, 2, 3, 5, 6]). Каждая из модификаций имела собственную мотивацию. Причиной разработки модели, предложенной в данной работе, является поиск средства представления параллельных операторов в Динамической логике игр.
Главной особенностью параллельных игр является то, что они должны быть взаимосвязаны. Эта особенность присуща и для игр, связанных оператором последовательной композиции, свойства которого для модели игр с ограниченной рациональностью подробно рассматриваются в данной работе.
Можно предложить множество способов для выражения взаимосвязанности игр: опосредованное взаимодействие (использование играми общих ресурсов, решение проблем с помощью распределенных систем), непосредственная коммуникация между играми (взаимодействия внутри сети как вариант перестройки готовых игр, достраивание решения в процессе игры). Рассматриваемая модель описывает игры с непосредственной коммуникацией. Ограниченная рациональность была введена для обоснования недостатка знаний у игроков. Их знания восполняются благодаря коммуникации.
1 Работа выполнена при поддержке РГНФ, грант № 03-03-00455а
1. Представление ограниченной рациональности в Динамической логике игр
1.1. Линейная форма игры
То, что называется игрой в логике игр и теории игр, является абстрактным математическим объектом. Причиной создания таких объектов стала потребность моделирования процессов, ход выполнения которых не однозначен и зависит от внешнего, алгоритмически не заданного вмешательства. Подобное вмешательство не требует участия человека, хотя оно и не исключается.
В теории игр известно несколько форм представления игр. Наиболее распространенными являются экстенсивная форма и стратегическая. В первом случае в игре выделяются все промежуточные позиции, описывается структура действий и указываются результаты различных вариантов развития игры. Экстенсивная форма обычно представляется в виде размеченного дерева. Во втором случае в игре явно не прописывается внутренняя структура действий и не выделяются промежуточные позиции. Вместо этого в ней перечисляются стратегии игроков (наборы действий), содержащие по одному действию из каждого состояния, в котором рассматриваемый игрок делает выбор. В результате стратегия предписывает конкретное поведение игрока в игре. В зависимости от выбора соперника одна и та же стратегия может давать различные результаты, которые также указываются в стратегической форме игры. Для данной формы соотношение стратегий игроков и результатов их применения обычно представляется в виде таблицы.
Экстенсивная форма игры дает возможность провести полную трассировку игры, т.е. выявить ее внутреннюю структуру. Стратегическая форма, не предоставляя внутренней структуры, позволяет оперировать лишь стратегиями, т. е. взглянуть на игру снаружи. Для целей данной работы первое описание является избыточным, подходящим скорее для семантики Логики действий. Второе описание, наоборот, является недостаточным, хотя и отвечает требованиям семантики традиционной Динамической логики игр. В моей предыдущей работе (см. [3]) было показано, что при добавлении в язык Динамической логики игр параллельных операторов мы вынуждены апеллировать к более тонкой, чем стратегия, структуре. При этом в процессе переопределения семантики все же удается удержаться от перехода к использованию действий. Оказалось, что достаточно добавить в описание только нити игры. Назовем полученную в результате этого форму линейной формой игры.
Определение 1.1. Линейная форма игры G это кортеж (Ы, А, Н, Р, 5), в котором
• N = (1, 2... к] непустое конечное множество игроков
• А = (а7 , а2 ... ат] непустое конечное множество действий
• Н = (Н7 , Н2 ...} множество нитей игры, где Н, = {а17, а12 ... а1п), для 1 е(1, 2.], упорядоченные конечные последовательности действий
• Р = (Р7 , Р2 ...} множество диспетчера действий, в котором каждый Р, = {ри, р,2 ... р,„), где р,г е{1, 2. к] номер игрока (е е(1, 2. п]) ставится в соответствие с Н, для одного и того же 1 е (1, 2.]
• 5 = (50 , 57 , 52 ...] непустое множество, содержащее начальное состояние игры 50 и финальные состояния, в котором каждый
ставится в соответствие с Н, для одного и того же 1 е (1, 2.]
Экстенсивная форма игры может иметь внешне похожее представление. Однако, в отличие от нее, в линейной форме нити игры (истории) не упорядочены в виде дерева. Для относительно сложных игр при условии ограниченной рациональности данный факт является существенным. Ограничение рациональности может означать, например, незнание игроком алгоритма Цермело, или ограниченность вычислительных ресурсов. Важным следствием оказывается то, что даже если число финальных состояний и нитей игры будет конечным, вхождений нитей в стратегии может остаться непроверяемым.
Как и в случае с экстенсивной формой игры, в линейной форме стратегии не задаются отдельно. При условии неограниченной рациональности считается, что их можно немедленно вывести. Однако даже в этом случае определить стратегии для линейной формы можно, только опираясь на соответствующие промежуточные состояния экстенсивной формы и ее древовидную структуру.
Определение 1.2. Набор нитей игры а, очерчивающий поддерево этой игры, будем называть стратегией игрока в игре а тогда и только тогда, когда состояния этого поддерева, в которых оппоненты принимают решения, содержат точно такие же, как и в дереве игры а, наборы выходящих непосредственно из них действий.
Если мы введем ограничение на рациональность, то вывод стратегий станет также ограничен. Для экстенсивной формы игры будет неизвестно, каким образом действия образуют стратегии, в то время как для линейной формы - как это делают нити.
В результате получается, что при представлении игры в линейной форме игрок может определить для любой нити ее финальное состояние. Однако при этом данный игрок не способен заранее определить, сможет ли он форсировать отмеченное состояние, т.е.
достичь его вне зависимости от действий соперника. Такое положение дел можно проиллюстрировать на примере шахмат, к слову, являющихся хорошим экземпляром конечной игры, для которой у человечества пока не нашлось ресурсов определения выигрышной стратегии. Переставляя фигуры самостоятельно за обе стороны, мы можем определить результат для любой цепочки ходов. В принципе, кажется весьма правдоподобным, что можно построить алгоритм, порождающий все такие цепочки. При этом знание всех цепочек ходов не поможет нам без привлечения дополнительных ресурсов определить ни одной стратегии, а значит, и предопределить поведение в реальной игре. Действительно, для этого сначала нам нужно будет упорядочить имеющиеся цепочки ходов в виде дерева. Иначе мы не можем приступить к использованию алгоритма Цермело, так как нам дано не дерево игры, а лишь ее нити.
Заметим, что линейная форма игры может служить адекватным средством представления игр, в которых игрок произвольным образом использует цепочки ходов с успешными финальными состояниями, не зная того, принадлежат ли эти цепочки успешным стратегиям. Похожей схемы придерживаются шахматисты при розыгрыше дебютных композиций.
1.2. Модель Динамической логики игр
Динамическая логика игр позволяет проводить рассуждения о ходе выполнения не изолированных игр, а их комбинаций. В результате в используемой семантике Крипке теоретико-игровые состояния различных игр сводятся воедино при переходе к мирам логической модели. Для каждого из миров модели может выполняться свой набор высказываний, описывающий ситуацию рассматриваемого игрового пространства.
Предметом рассуждений Динамической логики игр является наличие у игроков стратегий или их аналогов отношений вынуж-дения, приводящих к интересующему результату. Отношение вынуждения традиционной Динамической логики игр может быть монотонно расширено. Это связано с тем, что в ней подразумевается неограниченная рациональность. Как результат, при добавлении нити или соответствующего ей в линейной форме финального состояния игрок может выделить данную нить и не использовать, если она не принадлежит успешной стратегии, даже если при этом и имеет успешное финальное состояние. В условиях ограниченной рациональности и линейной формы представления игры игрок сможет отличить добавляемую нить, если только она оканчивается неуспешным состоянием. Если же добавляемая нить оканчивается успешным состоянием, то игрок с ограниченной рациональностью
может воспользоваться этой цепочкой во время игры, даже если она не принадлежит к его успешным стратегиям. Естественно, это может привести к его поражению. А значит, для игр с ограниченной рациональностью нельзя монотонно расширять отношение вынуждения. Данный факт отражен в следующем определении.
Определение 1.3. Ограниченное отношение вынуждения р;(а)(^, F) выражает то, что игрок i в игре а, начавшейся в мире w, имеет стратегию, нити которой заканчиваются финальными мирами, формирующими множество ^ Обозначение F) е р;(а) используется как равносильное.
В соответствии с определением то, что ограниченное отношение вынуждения не является монотонно расширяемым, записывается в виде: из X) е р';(а) иXcY не следует, что Y) е р';(а).
Переходя к представлению языка Динамической логики игр с ограниченными ресурсами, для данного множества атомарных высказываний Ф0 и атомарных игр Г0 определим множество формул Ф и игр Г по индукции. Для того чтобы представить ограниченность ресурсов в Динамической логике игр, будем подразделять множество формул Ф на подмножества: явных формул ©, и неявных формул Н. Эти подмножества различаются своей алгоритмической сложностью. Предположим, что g е Г0; а, в е Г; p е Ф0; ф, у е ©; и Я, ц е Н. Тогда у е Г, 9 е ©, и сеН, если они имеют одну из следующих синтаксических форм у ::= g | ф? | а;в | аир | аd 9 ::= 1 | p | —ф | фvу с ::= ф | —Я | Я^ | (а)Я | [а]Я
Определение 1.4. Модель Динамической логики игр I для игр с ограниченной рациональностью, в которых принимают участие два игрока, это кортеж р;(а), V), где
1. W = w2... wk} непустое конечное множество возможных миров
2. р;^): W^ 2W отношения вынуждения для игроков i е {1, 2}, и атомарных игр g е Г0
3. V : Ф0 ^ 2W функция означивания, присваивающая одно из значений истинности 0 или 1 всем атомарным высказываниям, для каждого мира wеW, такая что
a) I, w 1
b) I, w |= p ттт pеФ0 и wеV(p)
c) I, w |= —ф ттт I, w ф
d) I, w |= фvу ттт I, w |= ф или I, w |= у
e) I, w |= (а)ф ттт ЗXcW ((w,X)ер1(а) л
Vw'еX Vw"<tX(I, w'|= ф л I, w"|=—ф)) /) I, w |= [а]ф ттт ЗХсЖХ)ер2(а) л
Vw'еX Vw"gX (I, w'|= ф л
I, w"|=-ф))
и wеW, операции с играми понимаются следующим
4. Для ХсЖ образом
a) X )€
b) X)€
c) X)е Ф (W, X)€
:р;(ф?) Р2(ф?) р;(аиР) :р2(аиР)
е) (w,X)еp^(а;P)
X )ер2(а;Р)
Я) (w,X), к) X)
Ер;(ай) Ф2(ай)
ттт w =X л I, w |= ф ттт w =X л I, w |= —ф ттт (w,X)еp^(а) V (w,X)еp^(P) ттт 3 У , ZcW((w, У )ер2(а) л л (w, Z)еp2(P) л Х= У uZ) ттт 3УсЯ^, У)ер7(а) л
3уе© Vw*еУ Vw"eУ 3 Zc X 3хе© (I, w |=у л I, w |= —у л л X)ер7(Р) л Vw+е Z Vw++g Z (I, w+|=x л I, w++ |= —х)))
ттт 3УсЯ^, У )ер2(а) л
3уе© Vw*еУ**Vw**gУ 3 Zc X 3хе© (I, w |=у л I, w |= —у л л X)ер2(Р) л Vw+е Z Vw++g Z (I, w+|=х л I, w++ |= —х))) ттт (w, X )ер2(а) ттт (w,X)еp^(а)
Теорема 1.5. Данная модель Динамической логики игр с ограниченной рациональностью исключает возможность использования редукции (а;Р)ф = (а)(Р)ф в обе стороны.
Доказательство очевидно.
С точки зрения семантики это означает, что мы не можем определить цели игры {а) через неявную формулу (Р)ф, соответствующую несыгранной игре. Это важно, так как, к примеру, в шахматной партии совершенно бесполезно описывать целевые формулы промежуточного этапа а (скажем, дебюта) через целевые формулы последующего этапа Р (скажем, миттельшпиля).
Из данной модели видно, что для построения последовательной композиции требуется обязательное задание среднего терма. Этим подчеркивается то, что для достижения успеха в первой игре а нужно явное целевое указание именно для первой игры. Комбинация двух игр посредством последовательной композиции приводит не к сложению алгоритмической сложности, как это имеет место в случае с объединением и пересечением. Последовательная композиция несет в себе дополнительные сложности вдобавок к
тому, что дает разбиение на явные и неявные формулы. Во-первых, можно заметить, что формула ф)ф требует многократного вычисления для определения множества Y. Во-вторых, для того чтобы эта формула стала определением множества Y в (а$)ф, необходимо еще, чтобы Vwg Y: I, w ф)ф.
2. Информационные потоки в параллельных и последовательных играх
2.1. Коммуникация в играх с ограниченной рациональностью
Ограниченная рациональность в играх, как правило, приводит к тому, что игрокам не хватает информации, знаний для успешного завершения игры. В результате становится актуальной проблема коммуникации между играми для восполнения недостающей информации.
О передаче информации можно говорить только для последовательно или параллельно связанных игр. Иначе, если игры не зависят друг от друга, как это, например, описывается операциями объединения и пересечения, передача информации невозможна. В таких случаях игры полны, т. е. их выполнение не зависит от внешних факторов.
Передача информации, как правило, переводит игру в новое состояние. То есть если изолированное выполнение игры не позволяет достигнуть некоторого множества миров, то совместное с другой игрой выполнение, возможно, это позволит. Но для Логики игр важно то, чтобы эта информация позволяла получать новые стратегии. Выше, при описании линейной формы игры, была задана связь финальных состояний со стратегиями. В результате, воздействуя на финальные состояния игры, можно влиять на стратегии. Воздействовать же на них можно посредством параллельно или последовательно связанных игр.
2.2. Динамическое изменение информации
Процесс изменения информации должен быть отражен в модели. То, что мы используем Динамическую логику игр, а не, скажем, Эпистемическую, влияет на то, как мы можем описать данный процесс. Мы не можем переопределять функцию означивания или отношение достижимости (вынуждения) для миров, так как это не даст консервативного расширения Динамической логики.
В качестве выхода можно предложить сдвигать (направлять) результат исходной игры относительно ее состояний, либо относи-
тельно ее действий, используя параллельную или последовательную ей игру. Для приведенной выше модели можно сказать, что последовательная композиция сдвигает состояния последующей игры относительно состояний предшествующей. Сдвиг относительно действий формирует новые стратегии, возможно совместные для двух игр. Подобный сдвиг был использован для определения параллельных операторов (см. [3]).
Заключение
Предложенная линейная форма игры может использоваться для представления игр с ограниченной рациональностью. На ее основе построена модель Динамической логики игр с ограниченной рациональностью. Рассмотрены варианты представления информационных потоков в Динамической логике игр. В качестве дальнейшей работы интересно попытаться расширить данную модель Динамической логики игр на параллельную композицию.
ЛИТЕРАТУРА
1. van Benthem, ./.Games and Strategies inside Elementary Logic // Proceedings of 7th Asian Logic Conference, Taiwan, June 1999; http://www.turing.wins.uva.nl/~johan/
2. van Benthem, /. Intensional Logic // Electronic course notes for Philosophy 169, 2000; http://www.turing.wins.uva.nl/~johan/Teaching/
3. Netchitailov, Yu.V. An Extension of Game Logic with Parallel Operators // ILLC Scientific Publications, MoL-2001-02, University of Amsterdam, The Netherlands, 2001.
4. Parikh, R. The Logic of Games and its Applications // Annals of Discrete Mathematics, 24, Elsevier, 1985, 111-139.
5. Pauly, M. Some Game Theory for Logicians // Notes for the course Logic and Games, University of Amsterdam, The Netherlands, 2001.
6. Pauly, M. Logic for Social Software // ILLC Dissertation Series 2001-10, University of Amsterdam, The Netherlands, 2001.