УДК 021.8 + 025.1 ББК 78.34
О СПОСОБАХ АНАЛИЗА ИГР РАЗБИЕНИЙ1
Бочаров П. С.2
(ООО «Уили», Москва) Горяшко А. П.3
(Московский технологический институт, Москва)
Предлагается рассматривать известные в теории игры, такие, например, как игра полковника Блотто и полковника Лотто, в виде общего класса комбинаторных игр разбиений, анализируя при этом относительную «силу» всего класса разбиений с заданными параметрами. Предложенные методы анализа опираются как на результаты компьютерного моделирования, выполненные с помощью разработанного комплекса программ, так и на результаты методов комбинаторного поиска в теории алгоритмов. Результаты моделирования показывают, в частности, что с помощью полиномиально доступных алгоритмов можно генерировать «эффективные», с точки зрения способности выигрывать, стратегии разбиений.
Ключевые слова: теория игр, теория разбиений, игры полковника Блотто, игры полковника Лотто, вычисление платежных функций, турниры.
1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект №15-08-08935А).
Авторы признательны рецензентам за те крайне полезные замечания, которые были сделаны в процессе рецензирования.
2 Павел Сергеевич Бочаров, руководитель группы мобильной разработки ([email protected]).
3Александр Петрович Горяшко, доктор технических наук, профессор ([email protected]).
1. Введение
В математической теории игр особое место занимает специальный класс игр, который принято называть играми Блотто и играми Лотто (с добавлением воинского чина в различных постановках задач: генерал, полковник, капитан). Это класс игр с нулевой суммой и неполной информацией: каждый игрок должен распределить заданный ресурс по заданному числу полей (выбрать стратегию игры), не имея представления о выборе противника, после чего по определенным правилам происходит сравнение выбранных размещений. Выигрыш определяется, например, знаками величин разности ресурсов в каждом изолированном поле. Основное отличие игры Лотто от игры Блотто состоит в том, что игра Лотто не предполагает фиксацию сравниваемых полей.
В подобных играх число возможных чистых стратегий у игрока экспоненциально растет с размерностью задачи, т.е. с числом полей и суммарной величиной распределяемого ресурса. Это обстоятельство не является препятствием при поиске ответа на традиционный вопрос теории игр - какова цена игры и структура множества стратегий, обеспечивающих получение цены игры. Почти все исчерпывающие ответы на этот вопрос содержатся во множестве работ последних десятилетий, из которых мы в дальнейшем будем ссылаться лишь на некоторые работы последних лет.
В 1921 году Э. Борель [6] предложил решение задачи размещения объектов как игры двух лиц с постоянной суммой и неполной информацией. Рассмотренная им математическая модель получила впоследствии (во время второй мировой войны) название «игра полковника Блотто». В первоначальной формулировке игрок А и игрок В должны разместить имеющиеся у них целочисленные ресурсы Ха и Хв (Ха ^ Хв) между несколькими участками. Каждый из игроков не знает размещения, которое выбрал противника. Игру выигрывает тот, кто побеждает на большем числе участков (полей боя), а выигрыш игрока определяется знаком величины 1аО — 1в(¿), где 1а(¿) (¿в(¿)) - величина ре-
сурса, размещенного на поле i первым (вторым) игроком (такое определение выигрыша принято называть «winner takes all»). Таким образом, в основе подобных игровых моделей лежат способы размещения некоторого целого числа (ресурса) по целому числу игровых полей. В играх этого класса, как правило, нет чистых оптимальных стратегий, а возможности получения равновесных по Нэшу смешанных стратегий изучены досконально: при различных предположениях относительно принципов размещения ресурсов, произвольном соотношении количества ресурсов у игроков и различных классов платежных функций (см., например, [12, 18, 11]). Например, уже в одной из первых работ этого направления [12] было показано, что в задаче полковника Блотто достигается смешанное равновесие по Нэшу при условии, что игра симметрическая, т.е. распределяемый ресурс противников одинаков, и распределение ресурса в каждом поле может быть описано одномерной равномерной функцией распределения в интервале [0, 2n/m] (предполагается, что n/m делится нацело).
Наиболее общие результаты были получены уже в последние десятилетия. Так, в работе [11], в которой было введено понятие игры генерала Блотто (General Blotto), полученные ранее результаты обобщены прежде всего в плане вида платежных функций. В частности, вместо выигрыша изолированных полей, как в первоначальных работах, изучались случаи, когда игроки стремятся выиграть все заданные подмножества этих полей.
В [18] приведены окончательные результаты решения проблемы равновесия по Нэшу для смешанных стратегий в случае несимметрической игры полковника Блотто, т.е. когда ресурсы противников могут быть различны.
В [13] и [14] рассмотрена так называемая игра Лотто, обладающая тем, казалось бы, существенным отличием от игры Блотто, что не предполагается задания фиксированной нумерации полей, в которых размещается ресурс. Иными словами, в этой игре разбиение заданного ресурса n на m частей задано с точностью до определенного множества допустимых перестановок элементов разбиения. Как может сказаться подобная постановка на поведе-
нии игроков? В игре появляется новый источник неопределенности, и игрокам приходится находить способы поиска такого размещения своих ресурсов, которые могут обеспечить победу хотя бы для большинства возможных перестановок полей. Естественно предположить, что решение этой задачи окажется сложнее, нежели в моделях игры Блотто, по крайней мере, с позиций алгоритмической сложности. Оказалось, однако, что возможно такое определение дискретной игры полковника Лотто [13], при котором условия получения равновесия в играх Блотто и Лотто полностью совпадают, т.е. при равных значениях размещаемых ресурсов и числе полей, а также некоторых предположениях о виде распределения для играемых стратегий эти игры имеют одну и ту же цену.
Следуя [13], сформулируем один из подобных результатов точнее. Пусть игроки распределяют по одинаковому числу полей ресурсы a и b (a ^ b > 0). В случае игры Лотто L(a, b), в которой первый игрок выбирает распределение неотрицательных целочисленных случайных переменных X, для которого математическое ожидание E(X) = a, а второй - распределение с математическим ожиданием E(X) = b, цена игры Val L(a, b) = (a — b)/a, и единственная оптимальная стратегия для более сильного игрока (a > b) состоит в том, чтобы равномерно на интервале [0, 2a] с математическим ожиданием распределить имеющийся ресурс по всем полям, а для игрока с ресурсом b - с вероятностью 1 — b/a размещать на своих полях 0 и с дополнительной вероятностью играть такое же распределение на интервале [0,2a], как и более сильный игрок (в этом случае его распределение будет иметь математическое ожидание равное b). В случае равенства ресурсов (a = b) оба игрока играют одинаковые равномерные распределения на интервале [0, 2a] и получают нулевую цену.
Таким образом, основное свойство игры Лотто, в которой результат каждой отдельной встречи зависит не от фиксированной нумерации полей, известной всем участникам, а определяется суммарным значением платежной функции при всех перестановках полей, с точки зрения обеспечения равновесия в смешанных
стратегиях практически не вносит в модель ничего существенного. Всегда ли это так в реальных ситуациях?
Пусть на командный чемпионат мира по шахматам можно выставить по 5 шахматистов. Шахматисты строго упорядочены по силе коэффициентом Эло. Потому для всех команд естественно ровно также упорядочить номера досок: за первой доской играет самый сильный, за второй - следующий за ним по силе и т.д. Часто так и происходит. Но ведь есть еще и «игровая несовместимость» (когда игрок с более высоким рангом, как правило, плохо играет с некоторым игроком, имеющим ранг гораздо ниже), есть конкретное самочувствие игроков, есть ситуации, когда игроку необходим отдых и т.п. Таким образом, тренеру команды на протяжении турнира приходится решать задачу, более соответствующую модели Лотто, и часто от правильного ее решения, зависит исход командной борьбы. Подобного рода обстоятельства возникают фактически в любых командных соревнованиях.
Спортивные игры не единственный пример важности моделей типа игры Лотто. Например, в экономике при проведении таких тендеров и аукционов, в которых предполагается обязательный выбор участником некоторого набора торгуемых предметов (bundle goods). В этом случае перед участниками возникает задача распределения имеющихся у них денежных ресурсов по различным наборам товаров типа Лотто. Аналогичная ситуация возникает перед инвесторами на финансовых рынках, когда необходимо вкладывать средства в некоторое множество ценных бумаг (securities). Следует заметить также, что в реальных ситуациях наибольший интерес вызывают не модели one shot game игр разбиений ресурсов, а модель повторяющейся игры, такая, например, как турниры.
Примеры можно продолжать, но уже ясно, что в играх разбиений (особенно типа Лотто) нахождение support-стратегий4, которые обеспечивают равновесие по Нэшу, далеко не единствен-
4 В теории игр support-множествами принято называть множество стратегий с ненулевой вероятностью в случае равновесия в смешанных стратегиях.
ная проблема. Не менее важными следует считать задачи исследования структуры множества всех допустимых стратегий в игре с позиций их взаимной «силы», а также поиск слабо доминантных support-стратегий, которые могут «успешно» играть против равновесных смешанных стратегий. Однако полиномиально доступное решение подобных задач в модели игры Лотто требует решения проблемы перебора всех m! допустимых перестановок. Здесь, к сожалению, недостаточно предположения о равномерном распределении всех допустимых перестановок, как это было сделано в [13].
В теории игр интерес к решению «сложностных» проблем, иначе говоря, алгоритмическая теория игр, возник относительно недавно [3]. Этот интерес в значительной мере обусловлен тем, что на практике чаще всего игроки играют в так называемую «воображаемую» {fictitious) игру, т.е. ищут выигрышную стратегию, наблюдая в процессе игры за противником, и строя модель его поведения. Хотя и существуют классические работы [8], показывающие, что определенные классы fictitious игр могут сходиться к равновесию, численные эксперименты последних лет показывают, что нередки такие исходные наборы стратегий (даже в столь простых играх как «Камень, ножницы, бумага»), которые приводят к появлению циклов далеких от ситуаций равновесия. Было также показано [7], что и в тех случаях, при которых fictitious игры сходятся к равновесию, достижение равновесия может потребовать экспоненциально растущего с ростом параметров стратегии числа шагов. Таким образом, исследования последних лет говорят о важности, особенно с прикладной точки зрения, поиска полиномиально доступных приближенных методов вычисления различных показателей качества в теории игр [21].
Особенно хотелось бы указать на полезность (а, возможно, и необходимость) проведения численных экспериментов для выяснения часто достаточно неожиданных эффектов, связанных с динамикой поведения для таких дискретных моделей игр, как игры Блотто и Лотто. Проведение таких экспериментов, особенно в случае игры Лотто, практически недоступно при отсутствии эф-
фективных методов приближенного вычисления показателей качества игры.
Необходимость детального рассмотрения поведения моделей игры Лотто поставила перед авторами задачу создания набора программ [1] компьютерного моделирования класса задач, возникающих в теории разбиений. Эти программы позволяют проводить численные эксперименты с разбиениями достаточно большой размерности и полученные результаты позволяют полнее понять структуру стратегий дискретных моделей игры Лотто. Первым результатам в этом направлении как раз и посвящена настоящая работа, в основе которой обоснование применения полиномиальных алгоритмов аппроксимации результатов взаимодействия игроков в игре Лотто и синтез «успешных» зиррой-стратегий.
Дальнейшее изложение построено следующим образом.
Раздел 2 «Разбиения и игры разбиений» посвящен изложению результатов комбинаторики разбиений, которые могут быть полезны для лучшего понимания особенностей игровых задач типа «игр Блотто» и «игр Лотто».
В разделе 3 «Приближенное вычисления результатов игры Лотто для пары разбиений» приводится формулировка способа приближенного вычисления значения платежной функции в симметричной игре Лотто с нулевой суммой.
В разделе 4 «Результаты вычислительных экспериментов с «эффективными» зиррой-стратегиями» содержатся результаты численных экспериментов, на основании которых можно осуществлять выбор зиррой-стратегий.
В разделе «Обсуждение» приведен ряд соображений о перспективах использования методов компьютерного моделирования для анализа игр разбиений.
2. Разбиения и игры разбиений
Традиционно при рассмотрении игровых задач Блотто и Лот-то исследователи не прибегают к аппарату комбинаторики размещений, т.е. тому разделу теории алгоритмов, в котором изучают-12
ся сложностные аспекты методов генерации разбиений и алгоритмические свойства разбиений. Возможная причина состоит в том, что получение общих закономерностей установления равновесия (доказательство теорем существования) не требует анализа скорости сходимости алгоритмов поиска равновесия или комбинаторной структуры различных подмножеств множества разбиений. В этом разделе методология игр, объединенных наименованиями «игры Блотто» и «игры Лотто», будет изложена на языке комбинаторных алгоритмов [4].
В [4] все типы размещений заданного числа n в заданном количество мест m распадается на двенадцать классов задач. Для наших целей интерес представляют классы, которые в [4] называются разбиением (partition) n непомеченных шаров по m помеченным урнам и разбиением n непомеченных шаров по m непомеченным урнам.
Разбиение целого числа n определяется как последовательность (ai, а2,... } неотрицательных целых чисел а1 ^ а2 ^ ■ ■ ■ такая, что n = а1 + а2 + ■ ■ ■. Например, одним из разбиений числа 8 может быть последовательность 5 422, другим - последовательность 530. Количество ненулевых членов называется количеством частей. В комбинаторике нулевые члены (если они присутствуют) обычно для простоты опускаются, поэтому все способы разбиений числа 8 в обратном лексикографическом порядке будут выглядеть как
(1) 8, 71, 62, 611, 53, 521, ..., 2111111, 11111111.
Нас будут интересовать только разбиения числа n на фиксированное число урн (или полей), не превышающее m (обозначим их как (n, m)-разбиения), и при записи нулевые члены не будут опускаться. Например, все разбиение числа 8 по трем полям в обратном лексикографическом порядке будет выглядеть как
(2) 800, 710, 620, 611, 530, 521, 440, 431, 422, 332.
5 Здесь и далее числовые примеры разбиений для простоты приведены в записи вида а\а2 ...
Для оценки количества разбиений существует ряд приближенных формул, в частности
_к^2и/3
(3) Р(П) = ____ (1 + 0(п-1/2)).
Формула (3) дает приближенную оценку, например, р(100) « 1,993 ■ 108 при точном значении р(100) = 190569292 [4].
Многие численные эксперименты, которые описаны в работе, проводились для разбиений при п = 100 и т = 10. Точное значение количества всех разбиений 100 на 10 полях
(4) р(100,10) = 6292069.
Модель игры Блотто (точнее, игры полковника Блотто) можно представить, как вычисление функции платежа Б(р1,р2), где Р1 и р2 - это некоторые разбиения заданного числа п по заданному числу полей (урн) т, причем эти урны помечены, т.е. любая перестановка разбиений может изменить значение функции Б(Р1,Р2).
Функция Б (а, в) обычно задается следующим образом:
т
(5) Б(а, в) = ^ 81ёп(хг - у»),
г=1
где а = (Ж1,... ,Жт}, в = {У1,..., Ут}, = 1, если г > 0,
sign(z) = -1, если г < 0 и sign(0) = 0.
Победитель в игре полковника Блотто имеет положительный платеж, т.е. победитель должен выиграть по крайней мере на одно поле больше, чем его противник.
Как уже было отмечено, принципиальное отличие модели игры полковника Лотто состоит в том, что функция платежа для игры Лотто Ь(а, в) вычисляется при условии, что поля не помечены. Пусть при сравнении пары наборов а и в платеж определяется в соответствии с (5), т.е. как в игре полковника Блотто. В общем случае перестановки значений в фиксированных наборах а и в могут приводить к изменению знака платежа. Для определения функции платежа в игре Лотто достаточно задать множество всех перестановок ва набора а. Тогда
т
(6) Ь(а, в) = ^ ^п^ - у).
а€©а г=1
Рассмотрим простой пример. Выберем из множества всех (8, 3)-разбиений разбиения а = {5, 3, 0} и в = {4, 2, 2}. Для получения значения (6) необходимо вычислить 3! значений функции (5), переставляя всеми возможными способами значения а (таблица 1).
Таблица 1. Пример вычисления функций В (а, в) и Ь(а, в)
а 530 503 035 053 305 350
в 422 422 422 422 422 422
В(а, в) 1 1 1 1 -1 -1
L(a, в) 2
Таким образом, в четырех случаях игру Блотто выигрывает а, но в двух случаях выигрыш остается за в- В общем случае результат игры полковника Лотто является случайной величиной, значение которой определяется как видом разбиений а и в, так и распределением вероятностей перестановок значений в этих наборах. В работе [13], в которой и были предложены игры полковника и генерала Лотто, исследовались в основном вопросы равновесия в смешанных стратегиях в игре Лотто и сравнение между игрой Блотто и Лотто сводилось к указанию факта «эквивалентности» этих игр. Точнее говоря, утверждалось, что в случае, когда все выбираемые в игре смешанные стратегии предполагают равномерное (с вероятностью 1/m!) распределения перестановок разбиений, значение игр Блотто и Лотто совпадает, и те support-множества стратегий, которые доставляют равновесие в игре Блотто, будут доставлять равновесие и в игре Лотто.
Нас будет интересовать изучение произвольных стратегий в играх разбиений по правилам Лотто, что требует детального анализа поведения функции L(a, в). Очевидно, прямое вычисление (6) для пары произвольных (n, m)-разбиений требует O (m! ■ (m ■ log n)) битовых операций, что делает такое вычисление практически недоступным при сколько-нибудь заметных значениях m и числах пар изучаемых разбиений.
2.1. МАТРИЦЫ ВЗАИМОДЕЙСТВИЙ РАЗБИЕНИЙ
Пусть заданы N-мерные наборы целых положительных чисел а = |й1, а2,..., am} и в = {bi, b2,..., bm}, причем
Em=i a = E m
= i bi = Построим квадратную матрицу вида аТ ■ в, которую назовем матрицей взаимодействий или I-матрицей (interaction matrix). В этой матрице операция алгебраического умножения любых a £ аТ и bj £ в заменяется операцией sign(a — bj). В общем случае I-матрица есть тернарная матрица m х m, главная диагональ которой является результирующим вектором игры Блотто между разбиениями а и в при заданном матрицей порядке столбцов и строк. След такой матрицы есть численный результат игры полковника Блотто, а сумма значений всех столбцов (всех строк) S(a, в) определяет «кто сильнее в среднем» в игре полковника Лотто. Точный смысл этого утверждения будет дан ниже.
В таблице 2 показан пример I-матрицы для пары строго упорядоченных по возрастанию (63,7)-разбиений а = {27,11, 9, 7, 5, 3,1} и в = {21,12,10, 8, 6, 4, 2}. След этой матрицы Tr = 5, а сумма значений всех столбцов (всех строк) S(a, в) равна 5. Таким образом, разбиение а выигрывает у разбиения в в игре полковника Блотто, определяемой заданным порядком столбцов.
Таблица 2. Пример I-матрицы для (63, 7)-разбиений
а \в 27 11 9 7 5 3 1
21 —1 1 1 1 1 1 1
12 —1 1 1 1 1 1 1
10 —1 —1 1 1 1 1 1
8 —1 —1 —1 1 1 1 1
6 —1 —1 —1 —1 1 1 1
4 —1 —1 —1 —1 —1 1 1
2 —1 —1 —1 —1 —1 —1 1 Tr = 5
Е —7 —3 —1 1 3 5 7 S^, в) = 5
Однако несложно убедиться, что при перестановке столбцов этой матрицы, например, в порядке в' = {27,11, 7, 9, 5, 3,1}, след становится равным -1, т.е. разбиение а уже проигрывает разбиению в' в игру полковника Блотто, при этом значение S(a, в') остается неизменным.
Приведем еще один способ описания взаимодействия разбиений а = {ai, a2,..., ат} и в = {bi, 62,..., bm}, где £rm=1 a = SXi bi = n. Этот способ позволяет получать другой вид векторов, характеризующих взаимную «силу» разбиений а и в. Введем вначале формальные определения (7), (8) и (9).
m m
(7) Я*(а, в) = { £ sign*(ai - bi),..., £ sign*(am - bi)},
ii { m m }
Я*(в, а) = { £sign*(bi - ai),..., £ sign*(bm - ai)},
ii mm
(8) S>, в) = ££ sign*(ai - bj),
i j mm
5*(в, а) = ££ sign*(bi - aj), i j
• */ л I 1 при X > 0,
(9) sign*(x) = { F '
10 при x ^ 0.
Каждая компонента i вектора Я*(а, в) - это то суммарное количество компонент разбиения в, которое строго меньше а^ потому сумма S*(а, в) всех компонент этого вектора характеризует «возможности» разбиения а, в игре с разбиением в.
Разбиения а, в и вектора Я*(а, в) и Я*(в, а) можно представить в виде матрицы m х 4, которую будем называть I*-матрицей. В таблице 3 показана 1*-матрица для разбиений из предыдущего примера.
Определение 1. Назовем относительной силой разбиения а по отношению к в величину
mm
(10) SK в) = ££ sign(ai - bj).
i=1j=1
Управление большими системами. Выпуск 61 Таблица 3. Пример I*-матрицы для (63, 7)-разбиений
а 21 12 10 8 6 4 2
Я*(а, в) 6 6 5 4 3 2 1 5 *(а, в) = 27
в 27 11 9 7 5 3 1
Я* (в, а) 7 5 4 3 2 1 0 5 *(в, а) = 22
Назовем потенциальным ресурсом разбиения а по отношению к в величину
т т
(11) Б*(а, в) = Е^>§п*(а* - Ь>)•
¿=1 3=1
Определение 2. Назовем собственным ресурсом разбиения а величину
тт
(12) Б*(а) = Б*(а, а) = ^^ sign*(аг - ц).
¿=1 3=1
Укажем некоторые свойства разбиений, которые легко установить по виду матриц I и I*.
1. Б*(а, в) + В*(в, а) = т2 — д, где д - число нулей в 1-матрице. Нули в 1-матрице появляются в том и только в том случае, когда для какой-то пары индексов (г, _?') выполняется равенство ссг = Ь3.
2. При любом изменении порядка столбцов (строк) I-матрицы значения величин относительной силы Б (а, в) и Б(в, а) (также потенциальных ресурсов Б*(а, в) и Б*(в, а)) остаются неизменны. Таким образом, эти величины оказываются инвариантом для игры полковника Лотто с разбиениями а и в-
3. —(т2 — т) ^ Б(а, в) ^ т2 — т. Здесь верхняя и нижняя границы справедливы, например, для разбиений вида а = {п, 0, • • •, 0} и в = {Ь1, Ь2,..., Ьт}, где Ьг > 0 для всех г е [1,т] и Ет=1 Ьг = п.
2.2. СВОЙСТВА (п,т)--РАЗБИЕНИЙ
Многочисленные результаты теории разбиений относятся, в первую очередь, к различным комбинаторным свойствам как отдельных разбиений, так и множеств разбиений с одинаковыми 18
параметрами. Хотя выяснение вопроса о взаимной «силе» всего множества попарных разбиений явно не привлекало внимания, установленные закономерности, как выясняется, могут представлять непосредственный интерес при изучении игр разбиений.
Здесь мы остановимся на следующих свойствах:
1) свойство, связанное с разнообразием числа частей разбиений;
2) свойство, связанное с уравновешенностью (балансом) разбиения.
Первое свойство исследовалось в теории разбиений как свойство множества всех строго упорядоченных разбиений, т.е. таких разбиений а = (ai, a2,..., am}, для которых а1 > а2 >
• • • > am.
В нашей работе разнообразие элементов характеризуется введенным выше понятием собственного ресурса (12). Заметим, что
(13) 0 < S*(a) < m(m - 1)/2,
где нижняя граница достигается на разбиениях из m одинаковых значений (если n/m целое), а верхняя - на вполне упорядоченных последовательностях а. (Если разбиение а = (a1, а2,..., am} упорядочено по возрастанию, то I-матрица будет кососимметрической: элементы, расположенные симметрично относительно главной диагонали, имеют противоположные знаки, а все диагональные элементы равны нулю.) Экспериментально можно установить, как распределены значения собственного ресурса для всего множества (n, т)-разбиений.
На рис. 1 показано распределение значений собственного ресурса (100,10)-разбиений.
Второе свойство - уравновешенность, или баланс последовательности - издавна привлекал внимание исследователей, занимающихся комбинаторными проблемами, в частности проблемами точного покрытия (см. задача Лэнгфорда [4]). В теории разбиений оптимально сбалансированным (n, m)-разбиением называется такое, для которого — aj | ^ 1 для всех 1 ^ ^ m. В [4] показано, что имеется ровно одно оптимально сбаланси-
I II . III ШИШИ!
« 1.5 • 106 о к
<? 5 1 • 106 ...............
ц к _
& 5 • 105
& 10 ...............
1
0 5 10 15 20 25 30 35 40 45 Величина собственного ресурса
Рис. 1. Распределение значений собственного ресурса для (100, 10)-разбиений (масштаб части оси ординат от 1 до 10 для наглядности увеличен)
рованное (п, т)-разбиение, все части а^ которого задаются как
|_(п + т — ])/т] = [(п + 1) — ^/т] для всех 1 ^ ] ^ т. Для наших целей оказалось полезным следующее Определение 3. Пусть задано произвольное (п, т)-разбиение а = (а^ а2,..., ат}. В этом случае уравновешенностью Е(а) разбиения а будем называть величину
Е а*(г — т9
(14) Е(а) = — тах 1
{(т + 1)/2 при нечетном т, т/2 + 1 при четном т и г ^ т/2, т/2 при четном т и г > т/2,
где максимум берется по всем перестановкам а.
В приведенном определении используется понятие положения центра масс системы из т материальных точек, если под массой г-й точки понимать величину ресурса а^, размещенного в г-м поле, а под радиус-вектором - номер этого поля г, считая от «середины» т^. Таким образом, уравновешенность Е(а) характеризует максимальное (по всем возможным перестановкам) абсолютное смещение положения «центра масс» разбиения а от его «середины»: чем больше значение уравновешенности Е(а), тем меньше «центр масс» разбиения а смещен от «середины».
На рис. 2 показано распределение значений уравновешенности для (100, 10)-разбиений. 20
«
о Я
m Я
т ш
ч я
о ю
а
40,000
20,000
-5
4
-3
2
-1
Величина уравновешенности E
Рис. 2. Распределение значений уравновешенности для (100, 10)-разбиений
m) множество всех (n, m)-разбиений.
Обозначим через Справедлива оценка
(15) - m' < E(a) < 0, Va е R(n, m)
m =
(m — 1)/2 при нечетном m, Im/2 при четном m,
где оценка снизу достигается на разбиении вида {n, 0,..., 0}, а оценка сверху - на равномерном разбиении {n/m,..., n/m}, когда n/m - целое.
Сложность алгоритма вычисления E(a) не превосходит O(m2), поскольку максимум в (14) достигается на разбиениях, упорядоченных по возрастанию или по убыванию, а такое упорядочение любой последовательности размерности m возможно за O(m2) операций сравнения.
Очевидно, значение функции L(a, в) вычисляется с полиномиальной трудоемкостью, когда разбиение a является в точности равномерным (n/m - целая величина). Например, рассмотрим пару (63, 7)-разбиений, где a - равномерное разбиение, а в = {2, 4, 6, 8,10,12, 21} (таблица 4).
В этом случае, очевидно, B(a, в) = 1 (разбиение a выигрывает 4 поля при любой перестановке полей) и нормированное значение L(a, в)/m! также в точности равно 1. Вычисление точного значения платежа в игре Лотто в данном случае требует не более O(m2 log n) операций.
Несложно найти разбиение, которое выигрывает в игру Лот-то у равномерного разбиения. Пусть m - нечетное и n/m - целое. Достаточно на (m — 1)/2 + 1 полях «максимально равномерно»
21
0
Таблица 4. I*-матрица для (63, 7)-разбиений, одно из которых
равномерное
а 9 9 9 9 9 9 9
Д*(а, в) 4 4 4 4 4 4 4 S *(а, в) = 28
в 21 12 10 8 6 4 2
Д*(в, а) 7 7 7 0 0 0 0 S*(в, а) = 21
разместить весь ресурс - например, в нашем случае таким будет разбиение в = {16,16,16,15,0,0,0} - чтобы это разбиение всегда выигрывало у равномерного.
3. Приближенное вычисления результатов игры Лотто для пары разбиений
В предыдущем разделе показаны два (в принципе совершенно аналогичных) способа описания игры полковника Лотто пары разбиений: I-матрица и 1*-матрица. Результат этой игры - платежные функции S(a, в) и S*(a, в) - вычисляются за полиномиальное по m время и везде в дальнейшем приняты в качестве приближенного значения функции L(a, в).
Рассмотрим основания для такого подхода.
Пусть задана пара (n, m)-разбиений а = {ai, a2,..., am}, в = {b1, b2,..., bm} и 0m - множество всех m! перестановок а. Обозначим через Aw(a, в) и Д1(а, в), соответственно, долю ожидаемых выигрышей и проигрышей разбиения а при реализации всех m! перестановок а. Заметим, что Aw(a, в) = Д1(в, а), а Д1(а, в) = Д^(в, а).
Утверждение 1. Пусть рассматривается симметричная
игра полковника Лотто для пары (n, ю)-разбиений (а, в) и функция платежа Да, в) задана в соответствии с (6). Тогда
1) Если S* (а, в) = S*^, а), то sign (ДЦа, в) -Д1(а, в)) = sign ^*(а, в) - S*^, а)).
2) Если S*^, в) = S*^, а), то могут существовать та-
кие пары разбиений (а, в), для которых Д-ш(а, в) = Д1(а, в).
Доказательство. Прежде всего воспользуемся замечанием
в [13] о том, что в случае, когда смешанные стратегии в игре Лотто реализуются с вероятностью 1/т! для каждой из т! перестановок, не только цены игры Лотто и игры Блотто совпадают, но и множество оптимальных стратегий игры Лотто отображаются в оптимальные стратегии игры Блотто. Это замечание дает нам основание использовать результаты, полученные в [18], для несимметричных игр Блотто.
Основным приемом, который позволяет это сделать, станет следующее. При построении 1*-матрицы любой симметричной игры пары разбиений а и в, такой игре с одинаковым ресурсом п однозначно соответствует несимметричная игра векторов «потенциальных ресурсов» Л*(а, в) и Я*(в, а). При этом значения самих потенциальных ресурсов Б* (а, в) и Б* (в, а) не зависят от перестановок значений в полях исходных разбиений а и в.
Для несимметричных игр разбиений известны оценки, полученные в [18], которые позволяют связать долю выигранных и проигранных полей как функцию величин ресурсов игроков при условии, что ресурс в каждом поле равномерно выбирается из целочисленного интервала [0, 2 ■ (ресурс игрока)/т]. При условии, что отношение ресурсов слабого (Яад) и сильного (Я5) игрока удовлетворяют неравенству 2/т ^ /Я, ^ 1, единственный равновесный по Нэшу платеж, т.е. математическое ожидание доли выигранных полей, будет задаваться для слабого игрока = /2Я, и для сильного = 1 — .
Условие по максимальной величине ресурса в нашем случае выполняется всегда, поскольку максимальный потенциальный ресурс не превосходит (т — 1)2, а максимальный ресурс каждого поля не больше т.
Теперь рассмотрим два случая из [18]: а) когда 2/т ^ /Яз ^ 1 и б) когда 1/(т — 1) ^ /Я, ^ 2/т. Пусть для величины потенциальных ресурсов Б*(а, в) > й*(в, а). Тогда Б*(а,в) соответствуют тому, что в [18] обозначено как Я5, а Б* (в, а) - как Я.ш. Для потенциальных ресурсов справедливо
Б*(а, в) + Б* (в, а) ^ т2. Таким образом, случай а) не будет
выполняться только когда Б*(а, в) = т, Б*(в, а) = (т — 1)2,
т. е. когда одно разбиение максимально неуравновешенно. Но для
такой пары разбиений будет выполняться случай б).
В случае а) ожидаемая доля выигранных полей для
г 8*(в,а)
противника с меньшим ресурсом будет 28* (а в), и для противника с большим ресурсом Д-ш5 = 1 — Дш^.
В случае б) ожидаемая доля выигранных полей для
г 2 28 *(в,а)
противника с меньшим ресурсом будет ^ — т28*(а в) и для противника с большим ресурсом = 1 — .
В обоих случаях, если Б*(а, в) > Б*(в, а), то Д-ш(а, в) > Д-ш(в, а). Иными словами, математическое ожидание доли выигранных полей в игре полковника Лотто будет строго больше (строго меньше) у того разбиения, чья величина потенциального ресурса относительно противника строго больше (строго меньше).
Для иллюстрации второго пункта из утверждения 1 приведем пример для (8,4)-разбиений. Пусть разбиение а = {4, 2, 2, 0}, а в = {5, 3, 0, 0}. В таблице 5 представлена I*-матрица для этой пары разбиений.
Таблица 5. I*-матрица для пары (8, 4)-разбиений
а 4 2 2 0
Я*(а, в) 3 2 2 0 5* (а, в) = 7
в 5 3 0 0
Я* (в, а) 4 3 0 0 5* (в, а) = 7
Значения Б*(а, в) и Б*(в, а) для этих разбиений совпадают, однако, как видно из таблицы 6, доля выигрышей Д-ш(а, в) = 3/12 не равна доле проигрышей Д1(а, в) = 4/12.
В таблице 7 приведены экспериментально полученные [1, ехр-соп"ЬгагуРа1гз.Ьз] для некоторых значений п и т количественные оценки таких пар разбиений (а, в), для которых по-
Таблица 6. Результаты игр Блотто всех перестановок разбиения 4220 с разбиением 5300
в = 5300
а
Выигрыш Ничья Проигрыш
4220 0 0 1
4202 0 0 1
4022 0 1 0
2420 1 0 0
2240 0 0 1
0224 0 1 0
2024 0 1 0
2204 0 0 1
0422 1 0 0
0242 0 1 0
2042 0 1 0
2402 1 0 0
£ 3 5 4
тенциальные ресурсы Б*(а, в) и Б*(в, а) оказываеются равными, однако доля выигрышей не совпадает с долей проигрышей: ДЦа, в) = Д1(а, в).
4. Результаты вычислительных экспериментов с «эффективными» support-стратегиями
В предыдущих разделах были предложены некоторые возможности изучения известных классов игр вида игр Блотто и игр Лотто в рамках общих подходов комбинаторного поиска теории алгоритмов. Достоинством такого подхода следует считать возможность получения полиномиально доступных численных результатов и, как следствие, экспериментальное исследование различных моделей соревновательных процессов в самых разнообразных прикладных проблемах: экономических, социальных и
Таблица 7. Количество всех возможных пар разбиений (а, в) из множества (п, т)-разбиений, для которых Б*(а, в) = Б*(в, а) и Д-ш(а, в) = Д1(а, в) либо Д-ш(а, в) = Д1(а, в). Порядок разбиений в паре не учитывается, т.е. (а, в) и (в, а) - одна и та же пара
n m Aw = Al Aw = Al Общее количество всех пар
4 2 0 3 3
6 3 0 7 21
9 3 0 21 66
8 4 1 27 105
12 4 12 118 561
16 4 50 386 2 016
10 5 3 52 435
15 5 70 308 3 486
25 5 2 209 4 672 70 876
12 6 25 179 1 653
18 6 360 1 535 19 701
24 6 2 789 9 687 141 246
30 6 14 483 47 648 726 615
36 6 59 393 191 735 2 956 096
биологических. В последние годы в математической теории игр заметно усилился и интерес к алгоритмическим методам изучения игр и к проведению разного рода экспериментальных исследований [9].
По существу, наша работа примыкает именно к направлению экспериментального изучения эффективного поведения игроков в соревнованиях (contests) самого разного вида. В данном разделе будут показаны результаты компьютерного моделирования, которые (по крайней мере, частично) отвечают на следующий общий вопрос: как предложенные в работе характеристики конкретных числовых стратегий в играх разбиений могут помочь выбору подмножества «эффективных» (обладающих высокой способно-
стью побеждать) стратегий.
Приведены результаты следующих классов:
— круговые турниры на множестве всех (n, m)-разбиений;
— командные турниры двух заранее выбранных подмножеств (n, m)-разбиений.
4.1. КРУГОВЫЕ ТУРНИРЫ
Пусть заданы числа n, m и все N (n, m)-разбиений. Круговым турниром будем называть турнир из N2 поединков, где каждое разбиение встречается с каждым по одному разу, а победитель выявляется по суммарному значению платежной функции в игре полковника Лотто L(a, в) - круговой турнир первого рода, и по суммарному числу набранных очков sign L(a, в) (победа = 1, поражение = -1, ничья = 0) - круговой турнир второго рода.
В таблицах 8 и 9 приведены результаты круговых турниров первого и второго рода для (7, 3)-разбиений.
Таблица 8. Результаты кругового турнира первого рода для (7, 3) -разбиений
700 610 520 511 430 421 331 322 £
700 0 -1 -1 -3 -1 -3 -3 -3 -15
610 1 0 0 -1 0 -2 -2 -3 -7
520 1 0 0 0 0 0 -1 -1 -1
511 3 1 0 0 1 -1 -1 -3 0
430 1 0 0 -1 0 0 1 2 3
421 3 2 0 1 0 0 0 -1 5
331 3 2 1 1 -1 0 0 1 7
322 3 3 1 3 -2 1 -1 0 8
Заметим, что сумма элементов правых столбцов таблиц 8 и 9 равны нулю, что является следствием «полноты» рассматриваемого кругового турнира всего множества разбиений при заданных п и т.
Таблица 9. Результаты кругового турнира второго рода для (7,3)-разбиений
700 610 520 511 430 421 331 322 £
700 0 -1 -1 -1 -1 -1 -7
610 1 0 0 -1 0 -1 -3
520 1 0 0 0 0 0 -1
511 1 1 0 0 1 -1 0
430 1 0 0 -1 0 0 1 1 2
421 1 1 0 1 0 0 0 2
331 1 1 1 1 -1 0 0 1 4
322 1 1 1 1 -1 1 -1 0 3
Таблицы 8 и 9 не дают полного представления о выигрывающих способностях разбиений при больших значениях п и т. Потому на рис. 3, 4 показаны результаты моделирования в графическом виде турниров первого и второго рода для (36, 6)-разбиений. Эти графики показывают, как меняются результаты турнира в зависимости от способа оценки платежных функций. В круговом турнире первого рода локальные максимумы «выигрывающей способности» разбиений «монотонно» возрастают с местом в лексикографическом порядке. Наиболее «сильным» оказывается разбиение, наиболее близкое к оптимально сбалансированному. Но в турнирах второго рода подобная «монотонность» нарушается. Как следует из множества проделанных экспериментов, глобальный максимум силы, как правило, сдвигается влево.
и к I
и
ЕЙ К
1 0 -1 -2 ! -
и о к
& -з £ -4
О -5
0
............/// ///V ■УУ-'
500
1,000
1,500
2,000
Порядковый номер разбиения (в обратном лексикографическом порядке)
Рис. 3. Результаты кругового турнира первого рода для (36,6)-разбиений
ок
ч
о 1,000
о
я
Ц о 0
к
е
о н -1,000
р
а
м -2,000 у
£
и 0
500
1,000
1,500
2,000
Порядковый номер разбиения (в обратном лексикографическом порядке)
Рис. 4. Результаты кругового турнира второго рода для (36, 6) -разбиений
4.2. КОМАНДНЫЕ ТУРНИРЫ
Определение 4. Назовем классом разбиений такое подмножество C = R(I) = («1,..., ai} множества всех возможных (n, т)-разбиений R для каждого разбиения ai (i е [1,l]) из которого выполняется некоторое условие I. Положительное число I будем называть размером класса C.
Результаты компьютерного моделирования, приведенные в этом разделе, получены при следующих условиях:
a) Моделируется четрые командных турнира, в каждом из которых учавствуют две команды: первая команда - Ci - является подмножеством одного из четырех классов Ci (i е [1, 4]), а ее противником выступает команда R С R, i е [1, 4], сформированная из игроков множества всех (100,10)-разбиений. Каждый из четырех классов Ci характеризуется определенными диапазонами значений собственного ресурса S*(a) и уравновешенности E(a):
1) команда C1 = R0 - подмножество класса C1 = R (множество всех (100,10)-разбиений, S*(a) е [0, 45], E(a) е [-5, 0]);
2) команда C2 = S - подмножество класса C2 = S (множество «сильных» разбиений, S*(a) е [43, 45], E(a) е [-5, 0]);
3) команда C3 = E - подмножество класса C3 = E (множество «уравновешенных» разбиений, S*(a) е [0,45], E(a) е [-1,0]);
4) команда C4 = SE - подмножество класса C4 = SE (множество «сильных и уравновешенных» разбиений, S*(a) е [43, 45], E(a) е [-1, 0]).
b) В каждом командном турнире определяется размер участвующих команд (допускаются несимметричные размеры), игроки этих команд выбираются случайно и равномерно из соответсву-ющих классов.
c) В каждом i-м командном турнире каждое разбиение из команды Ci разыгрывает игру полковника Лотто с каждым разбиением из команды Ri. Строится распределение доли «непроигрышей» для команды Ci против Ri - отношение суммарного числа побед и ничей, определяемых значением sign L(a, в) (победа
= 1, поражение = — 1, ничья = 0), к общему количеству партий.
На графиках 5, 6, 7 и 8 изображены гистограммы распределения долей «непроигрышей» для проведенных экспериментов, а в таблице ?? подробные численные результаты: количество разбиений в командах, их характеристики (диапазоны уравновешенности и собственного ресурса), а также первые четыре момента численных распределений полученных результатов.
0.3 0.4 0.5 0.6 0.7 Доля «непроигрышей» Рис. 5. Гистограмма распределения доли суммарного количества выигрышей и ничьих среди общего числа всех партий в турнире команды С = С М против ^ С М
Рис. 6. Гистограмма распределения доли «непроигрышей» в командном турнире С2 = S С § против С М
Основной вывод, который можно сделать по результатам экспериментов этого раздела состоит в следующем.
0.3 0.4 0.5 0.6 0.7 Доля «непроигрышей» Рис. 7. Гистограмма распределения доли «непроигрышей» в командном турнире С3 = Е = Е против /К3 С М
0.3 0.4 0.5 0.6 0.7 Доля «непроигрышей» Рис. 8. Гистограмма распределения доли «непроигрышей» в командном турнире С4 = БЕ = §Е против С М
Таблица 10. Результаты командных турниров Сг против
Класс команды Диапазон Численность Числовые характеристики доли «непроигрышей»1 в команды Сг в турнире с командой % С К
Сг Собств. ресурса Уравновешен. Класса Команды С; Команды противника МЩ т М 3 /М
К § Е §Е [0,45] [43,45] [0,45] [43,45] [-5,0] [-5,0] [-1,0] [-1,0] 6 292 069 2 290 362 9 165 229 60 000 60 000 9 165 229 60 000 60 000 1 000 000 1 000 000 0.51444 0.58334 0.92685 0.93716 0.07428 0.05588 0.00016 0.00002 -0.14220 -0.28689 -1.90790 -1.20289 1.83737 2.02625 9.06557 4.87540
1 Отношение суммарного количества выигрышей и ничьих к общему числу партий для каждого игрока в команде Сг.
Характеристики «игроков», предложенные в работе - уравновешенность и собственный ресурс - безусловно влияют на «выигрывающие способности» игроков (стратегий). Выбрав «игроков» с параметрами из определенного диапазона можно гарантировать, что команда, составленная из них, выиграет у любой случайно взятой из всего множества разбиений команды с вероятностью не менее 0,93 и стандартным отклонением 0,04%.
5. Обсуждение
Основное отличие игр разбиений от большинства других моделей теории игр, с нашей точки зрения, состоит в возможности компьютерного моделирования для детального численного анализа структуры игровых стратегий. Это справедливо даже в случаях, когда множество игровых стратегий состоит из многих миллионов стратегий. Это уникальная возможность - до сих пор анализ игр с большим числом стратегий ограничивался установлением условий, при которых существует равновесия в смешанных стратегиях (антагонистические игры с постоянной суммой) или, в редких случаях, установлением наличия чистых выигрышных стратегий. Между тем, анализ множества игровых стратегий в целом ряде приложений теории игр оказывается не просто полезным, а абсолютно необходимым, ибо в противном случае не представляется возможным изучение динамики игры вообще и наличия эволюционно стабильных стратегий.
Какие проблемы позволяет решить (или как минимум прояснить) численный анализ структуры множества стратегий? Начнем с самого простого - возможно, даже тривиального обстоятельства - наличия оптимально сбалансированных разбиений. Само понятие баланса (уравновешенности) не нуждается в рекомендациях в связи с чрезвычайно частым применением как в теории оптимизации, так и в комбинаторике. В теории игр разбиений уже было показано (см., например, [11]), что именно оптимально сбалансированные стратегии для игр генерала Блотто являются уникальными стратегиями чистого равновесия. Подобное обстоятельство было отмечено [10] для класса стохастиче-34
ских игр, когда платежная функция для каждого поля j игроков A и B (success function) является непрерывной вероятностной функцией P(x(Aj+'X(Bj)), где x(A, j) (x(B, j)) - величина ресурса в j-м поле для игрока A (B) и, кроме того, полезности (цены) всех полей для обоих игроков одинаковы. Однако в турнире, в котором около 6000 участников играли в игру полковника Блотто [5], те кто выбрал равномерное распределение ресурса по полям (таких было около 11%) показали результат значительно хуже равновесного и почти вдвое меньше результатов Top-10.
Правдоподобное объяснение (которое приводят авторы [5], ссылаясь на психологические теории «глубины рассуждений») состоит в том, что большая часть участников отвергла этот вариант, заметив, как легко у него выиграть. Не менее важно то, что результат, показанный участником турнира, в первую очередь зависит от состава участников этого турнира. Говоря на языке теории игр - от того, какие support-стратегии они предпочитают. И здесь не обойтись без анализа класса «равновесных» разбиений, выяснению параметров которых посвящена большая часть работ в теории игр распределения ресурсов.
Наши численные эксперименты показывают, что, например, во множестве всех (100,10)-разбиений доля равновесных разбиений составляет 517 917/6 292 069 = 0,082. Асимптотические оценки доли тех n разбиений на не более чем m частей, где каждая часть не превосходит 1, можно найти в [2] и [4].
Правомерно поинтересоваться:
1) Можно ли полагать, что одни лишь равновесные стратегии представляют интерес?
2) Каковы возможные принципы уточнения представлений о рациональности игроков?
На первый вопрос ответ однозначно отрицательный, и на то есть несколько причин.
Причина первая связана с «жесткостью» стандартного определения равновесия в игре. Стоит рассмотреть возможность е-
равновесия6 (см., например, [20]), как многие результаты теории существенно меняются. Так в широко известной игре «дилеммы узника» (в варианте игры, повторяющейся конечное число раз T, где платежи усредняются за T раундов) Нэш-равновесие достижимо лишь при стратегии «обманывать» в каждом раунде, а стратегия tit-for-tat (наиболее близкий по смыслу перевод - «око за око») не является равновесной. Однако стоит допустить возможность е-равновесия (при некотором е, зависящем, в частности, от числа периодов) - и tit-for-tat будет е-равновесной стратегией.
Кроме того, анализ всего множества равновесных стратегий показывает, что они далеко не одинаковы с точки зрения «способности побеждать». Конечно, в идеализированной постановке равновесия по Нэшу, когда противники в одинаковой мере «рациональны» (в предположении, что подобное возможно в реальной жизни), достаточно ограничиться многократно установленными ограничениями на равновесность стратегий. В более правдоподобных обстоятельствах (fictitious play, турниры) выясняется, что «All animals are equal, but some animals are more equal than others»7. Первостепенными становятся вопросы: «как устроена игра», «кто твой противник». От ответа на эти вопросы в первую очередь зависит выбор «успешных» support-множеств. Показательный пример, явно демонстрирующий необходимость анализа стратегий даже максимально далеких от равновесия, дает «игра гладиаторов», впервые предложенная в [17]. В этой игре две команды гладиаторов встречаются в попарных поединках, в которых вероятность победы зависит от силы противников. Стратегия - выбор силы гладиаторов, входящих в команду. Оказывается - и это довольно ожидаемо - что когда суммарные силы команд не очень отличаются, то существует Нэш-равновесие, при котором силы гладиаторов должны распределяться равномерно.
6 Множество стратегий называется е-аппроксимацией равновесия по Нэшу (е > 0), если изменением стратегии игрок может увеличить свою платежную функцию не более чем на е.
7 «Все животные равны. Но некоторые животные равны более, чем другие» Дж. Оруэлл
Однако чем более неравны силы команд, тем более «неравновесным» должно быть распределение сил гладиаторов. В конце концов команда, которая суммарно много слабее, должна весь свой ресурс силы «передать» одному гладиатору (в наших обозначениях это разбиение номер один в обратном лексикографическом упорядочивании)8.
Хотя доля равновесных стратегий во всем множестве (п, т)-разбиений не велика, в абсолютном выражении она может быть весьма заметна. Насколько оправдан на практике предлагаемый в теории способ генерации всех таких стратегий, если попытаться оценивать трудоемкость подобного процесса. Пусть генерация одного разбиения требует одной единицы трудоемкости. Доля равновесных разбиений, например, во множестве всех (100,10)-разбиений, равна 0,082. Значит, при случайной генерации получение одного равновесного разбиения в среднем обойдется в 12 единиц трудоемкости. Кроме того, практически крайне трудно гарантировать действительную равномерность получаемых разбиений, а значит и получение гарантированных оценок дисперсии платежей в игре.
Не исключено, что более эффективным — особенно в модели игр с обучением - сгенерировать (например, с помощью алгоритма Н в [4]) все разбиения в обратном лексикографическом порядке, начиная с 2п/т (трудоемкость не превосходит утроенного числа всех таких разбиений). Имея все множество таких разбиений, можно заранее упорядочить их по «взаимной силе» и попытаться выяснить стратегию противника на основе его прошлых выборов. Решение подобной задачи уже будет зависеть от вычислительных ресурсов игроков (объема памяти, быстродействия), а также от представлений противников о величине допустимого стандартного отклонения значения накопленных платежей. Подобная постановка, по сути дела, означает возможность введения
8 Авторы статьи замечают, что это как раз случай Давида и Голиафа - войско филистимлян, будучи много сильнее, войска израильтян, но не обученное теории игр, приняло заведомо невыгодное для себя предложение единичного поединка.
материального коррелята понятия «рациональность».
Таким образом, первоначальные результаты компьютерного моделирования множества стратегий игр, как нам представляется, могут быть свидетельством важности этого подхода в алгоритмической теории игр.
Литература
1. БОЧАРОВ П.С. Набор программ для компьютерного моделирования и анализа игр разбиений. - [Электронный ресурс] - URL: https://github.com/pbo/partition-games.
2. ВЕРШИК А.М., ЯКУБОВИЧ Ю.В. Предельная форма и флуктуации случайных разбиений натуральных чисел на фиксированное число слагаемых // Moscow Mathematical Journal. - 2001. - Vol. 1, №3. - С. 457-485.
3. ГОРЯШКО А.П. Теория игр: от анализа к синтезу. Обзор результатов проектирования рынков // Cloud of Science. - 2014. - T. 1, №1. - С. 112-154. - URL: http://cloudofscience.ru/sites/default/files/pdf/ CloudOfScience01010112.pdf.
4. КНУТ Д.Э. Искусство программирования. Том 4а. - М.: Вильямс, 2013. - 960 c.
5. ARAD A., RUBINSTEIN A. Multi-dimensional iterative reasoning in action: The case of the Colonel Blotto game // Journal of Economic Behavior & Organization. - 2012. -No. 84. - P. 571-585.
6. BOREL E. La theorie du jeu et les equations integrales a noyau symetrique // Comptes Rendus de l'Academie. -1921. - No. 173. - P. 1304-1308. English: Translated by Savage L.J. The theory of play and integral equations with skew symmetric kernels // Econometrica. - 1953. - No. 21. -P. 97-100.
7. BRANDT F., FISCHER F., HARRENSTEIN P. On the Rate of Convergence of Fictitious Play // Theory of Computing Systems. - 2013. - No. 53(1). - P. 41-52.
8. BROWN G.W. Iterative Solutions of Games by Fictitious Play // Activity analysis of production and allocation. -1951. - No. 13(1). - P. 374-376.
9. DECHENAUX E., KOVENOCK D., SHEREMETA R.M. A survey of experimental research on contests, all-pay auctions and tournaments // Experimental Economics. - 2014. -
P. 1-61.
10. FRIEDMAN L. Game-theory models in the allocation of advertising expenditures // Operations Research. - 1958. -No. 6. - P. 699-709.
11. GOLMAN R., PAGE S.E. General Blotto: Games of Strategic Allocative Mismatch // Public Choice. - 2009. - No. 138. -P. 279-299.
12. GROSS A., WAGNER R.A. A continuous colonel Blotto game // RAND Corporation RM-408, 1950. - 14 p.
13. HART S. Discrete Colonel Blotto and General Lotto Games // International Journal of Game Theory. - 2008 - No. 36. -P. 441-460.
14. HART S. Allocation Games with Caps: From Captain Lotto to All-Pay Auctions // International Journal of Game Theory. -2016. - Vol. 45, Issue 1. - P. 37-61.
15. MOLDOVANU B., SELA A. Contest Architecture // Journal of Economic Theory. - 2006. - No. 126. - P. 70-96.
16. PAPADIMITRIOU C.H. The complexity of finding Nash equilibria. - Chapter 2. Algorithmic Game Theory. - 2007. -P. 29-51.
17. RINOTT Y., SCARSINI M., YU Y. Probability Inequalities for a Gladiator Game. - Jerusalem, 2011. - 571 p.
18. ROBERSON B. The Colonel Blotto Game // Econ. Theory. -2006 - No. 29. - P. 1-24.
19. STAHL D.O., WILSON P.W. On players models of other players: theory and experimental evidence // Games and Economic Behavior. - 1995. - No. 10. - P. 218-254.
20. TSAKNAKIS H., SPIRAKIS P.G. An optimization approach for approximate Nash equilibria // In Internet and Network
Economics. - 2007. - Vol. 4858. - P. 42-56. 21. VAZIRANI V.V. Combinatorial algorithms for market equilibria. - Chapter 5. Algorithmic Game Theory, 2007. -P. 103-134.
ON ANALYSIS OF PARTITION GAMES
Pavel Bocharov, Wheely, Moscow, Head of Mobile Development ([email protected]).
Alexander Goryashko, Moscow Technological Institute, Doctor of Science, professor ([email protected]).
Abstract: The paper examines disjoint subsets of strategies for the Lotto games in order to provide a criteria of their "relative strength", i.e. to define which strategies are more likely to win. The proposed methods are based both on the results of simulation and analytical techniques from combinatorial search theory. We showed that analysis of disjoint subsets of the set of (n, m)-partitions allows one to choose strategies with high "winning ability". Our focus is on the simulation of tournaments performed to check these assumptions. Actors in these elimination tournaments are the partitions and the payoffs are identical to that for the Lotto game. The simulation demonstrated that a contestant using the strategies from specially designed disjoint subsets wins with frequency near 0.9 in the elimination tournament if other contestants play the Nash equilibrium for the given (n,m)-partitions.
Keywords: game theory, colonel Blotto game, colonel Lotto game, partition, payoff function computing, tournament.
Статья представлена к публикации членом редакционной коллегии Н.И. Базенковым.
Поступила в редакцию 06.06.2015. Дата опубликования 31.05.2016.