К выбору равновесного поведения в бесконечной повторяющейся игре размерности 2x2: случай игроков-консерваторов и игроков-инноваторов

Райгородская А.В.

УДК 517.83

А.В. Райгородская1

К ВЫБОРУ РАВНОВЕСНОГО ПОВЕДЕНИЯ В БЕСКОНЕЧНОЙ ПОВТОРЯЮЩЕЙСЯ ИГРЕ РАЗМЕРНОСТИ 2 х 2: СЛУЧАЙ ИГРОКОВ-КОНСЕРВАТОРОВ И ИГРОКОВ-ИННОВАТОРОВ

Изучается бесконечная повторяющаяся 2x2 игра, в которой каждый игрок в каждом последующем раунде назначает свою чистую стратегию, основываясь на результате случайного эксперимента; последний генерируется произвольной смешанной стратегией игрока, которая с большой, но, вообще говоря, отличной от 1 вероятностью предписывает этому игроку выбор стратегии, соответствующей его типу поведения: консервативному или инновационному. Игра анализируется для всевозможных случаев взаимодействия игроков-консерваторов и игроков-инноваторов.

Ключевые слова: биматричные игры, равновесие, бесконечные повторяющиеся игры.

1. Введение. В теории повторяющихся (эволюционных) игр, изучающей модели принятия рациональных решений в процессах многократного взаимодействия игроков (см., например, [1-7]), сравнение различных режимов взаимодействия производится, как правило, с позиции динамических систем: оценивается, каким образом столкновение различных поведенческих стратегий влияет на последовательность принимаемых решений. Основы теоретико-игрового подхода к анализу альтернативных способов принятия решений были заложены в [8], где введены в рассмотрение игры на классах ограниченно рациональных поведенческих стратегий игроков и определено понятие равновесных наборов поведенческих стратегий. Подход к оптимизации траекторий повторяющихся игр на классах поведенческих стратегий игроков, основанный на методах математической теории управления, был предложен в [9].

Данная работа следует в русле подхода [8]. Происходит расширение стандартных поведений игроков и выбор наилучшего (равновесного) в расширенных классах поведений. Рассматривается повторяющаяся биматричная игра размерности 2 х 2, в которой выбор стратегии каждым игроком в каждом последующем раунде диктуется типом поведения игрока: консервативным или инновационным. Отправной моделью служит, таким образом, повторяющаяся игра, в которой данное правило принятия решений применяется без каких-либо отклонений. Затем классы поведенческих стратегий игроков расширяются: каждому игроку разрешается принимать решение о выборе своей чистой стратегии на следующем раунде, основываясь на результате случайного эксперимента. Последний генерируется произвольной смешанной стратегией игрока, которая предписывает большую, но, вообще говоря, отличную от 1 вероятность чистым стратегиям, соответствующим типам поведения игроков. Такие поведенческие стратегии игроков названы в работе функциями е-релаксированного выбора.

В п. 2 вводится в рассмотрение стохастическая игра на классах функций е-релаксированного выбора (е-релаксированная бесконечная повторяющаяся игра), выигрышами игроков выступают математические ожидания их средних выигрышей, получаемых на протяжении всех раундов. В п. 3 рассматривается и находится выигрыш в бесконечной е-релаксированной игре для различных поведений игроков. В п. 4 игра исследуется для случая двух консерваторов. Также приводятся результаты игры двух инноваторов и игры консерватора и инноватора.

2. Бесконечная е-релаксированная повторяющаяся игра с двумя типами поведения.

Рассмотрим биматричную игру размерности 2 х 2 с матрицами выигрышей А = (0^)1^=1,2 и В = = (bij)i,j=1,2 соответственно первого и второго игроков. Строки матриц выигрыша соответствуют номерам чистых стратегий первого игрока, столбцы — номерам стратегий второго игрока. Под смешанной стратегией первого игрока понимаем, как обычно, произвольное вероятностное распределение (а, 1 — а) на множестве стратегий этого игрока; здесь а — вероятность выбора игроком своей чистой стратегии 1, а 1 — а — вероятность выбора игроком своей чистой стратегии 2. Смешанную стратегию

1 Факультет ВМК МГУ, асп., e-mail: asik.vmkQgmail.com

(а, 1 — а) отождествляем с ее первой компонентой а € [0,1]. Аналогично смешанную стратегию второго игрока отождествляем с числом ¡3 € [0,1]. Всякая пара (а, (3) естественным образом превращает множество всех пар чистых стратегий игроков в вероятностное пространство, а выигрыши игроков — в случайные величины на этом вероятностном пространстве; их математические ожидания трактуются как выигрыши игроков, отвечающие паре (а,/3).

Будем для определенности предполагать, что в рассматриваемой биматричной игре не существует точек равновесия по Нэшу с компонентами в чистых стратегиях. Тогда, в соответствии с известной классификацией 2 х 2-игр (см. [10]), в данной игре существует единственная точка равновесия по Нэшу в смешанных стратегиях; при этом, согласно [10], не нарушая общности (при необходимости изменяя нумерацию игроков), можно считать, что

¿>12 > ¿>11, ¿>21 > ¿>22, Й11 > Й21, Й22 > 012- (1)

Таким образом, предполагаем, что неравенства (1) имеют место.

Зафиксируем какую-либо пару (¿о,^'о) чистых стратегий игроков.

Под бесконечной повторяющейся игрой будем понимать процесс повторения биматричной игры в бесконечной последовательности раундов 0,1, 2,... . Предполагаем, что в раунде 0 реализуется априорно заданная пара (¿о, ,?о) чистых стратегий, а в каждом последующем (к + 1)-м раунде каждый игрок применяет свою чистую стратегию в зависимости от своей чистой стратегии, реализованной в раунде к, и в соответствии со своим типом поведения. Здесь мы рассматриваем два типа поведения. Первый тип — консервативный: игрок-консерватор не меняет номера своей чистой стратегии на следующем раунде. Второй тип — инновационный: игрок-инноватор в раунде к +1 применяет чистую стратегию, отличную от чистой стратегии, примененной им в раунде к.

Введем также в рассмотрение процесс, аналогичный описанному выше, в котором, однако, игроки в каждом последующем раунде отдают лишь вероятностные предпочтения своим чистым стратегиям, соответствующим их типам поведения. В этом процессе для каждого игрока в качестве инструмента генерирования решений выступает та или иная функция е-релаксированного выбора. Приведем соответствующее определение.

Фиксируем е € (0,1/2). Функцией е-релаксированного выбора первого игрока назовем любую пару (а, 1 — а) смешанных стратегий первого игрока, такую, что: а) 1 ^ а ^ 1 — е, если первый игрок — консерватор; б) 0 ^ а ^ е, если первый игрок — инноватор. Данное определение подразумевает, что первый игрок в раунде (к + 1) выбирает свою смешанную стратегию а при реализации в раунде к своей чистой стратегии 1 и выбирает смешанную стратегию (1 — а) при реализации в раунде к своей смешанной стратегии 2. Из определения следует, что, будучи консерватором, первый игрок в раунде (к + 1) задает большую вероятность своей чистой стратегии, реализованной в раунде к, и, будучи инноватором, задает большую вероятность своей чистой стратегии, отличной от реализованной им в раунде к. Аналогично функцией е-релаксированного выбора второго игрока назовем любую пару (/3,1 — /0) смешанных стратегий второго игрока, такую, что: а) 1 ^ ¡3 ^ 1 — е, если второй игрок — консерватор; б) 0 ^ ¡3 ^ е, если второй игрок — инноватор.

При а = 1 будем называть первого игрока чистым консерватором; при 1 > а ^ (1 — е) — е-кон-серватором; при а = 0 — чистым инноватором; при 0 < а ^ е — е-инноватором. Аналогичные наименования примем для второго игрока.

Каждую пару

= ((«, 1 — а), (/3, 1 — /?)), (2)

где (а, 1 — а) — функция е-релаксированного выбора первого игрока и (/3,1 — /3) — функция е-релаксированного выбора второго игрока, будем называть парой функций е-релаксированного выбора игроков.

Для произвольной пары Б функций е-релаксированного выбора игроков (2) рассмотрим случайный процесс, который назовем е-релаксированной бесконечной повторяющейся игрой, соответствующей Б. Процесс состоит из раундов 0,1,2,..., в каждом из которых игроки разыгрывают описанную в п. 2 биматричную игру. Процесс развивается по следующей схеме. В раунде 0 реализуется начальная пара (¿о, ¿о) чистых стратегий игроков. Если в раунде к реализуется пара чистых стратегий игроков,

то первый игрок для выбора своей чистой стратегии в раунде к + 1 производит статистический эксперимент на множестве своих чистых стратегий, применяя смешанную стратегию а, если г^ = 1, и стратегию (1 — а), если г^ = 2. Аналогично второй игрок для выбора своей чистой стратегии в раунде к + 1 производит статистический эксперимент на множестве своих чистых стратегий,

применяя смешанную стратегию /3, если ^ = 1 и стратегию (1 —/3), если ¿к = 2. По окончании каждого раунда игроки получают очки согласно своим матрицам выигрышей. Данный процесс представляет собой модель поведения взаимодействующих игроков, которая в случае е > 0 допускает большую гибкость в выборе действий по сравнению с детерминированной игрой.

Уточним определение обозначенного выше случайного процесса. Пространством его состояний служит произведение X = {1,2} х {1,2} множеств чистых стратегий первого и второго игроков, его временной шкалой — индексы 0,1,2,... раундов повторяющейся игры. Пространство X понимаем как измеримое пространство, снабженное алгеброй всех его подмножеств. Для каждого к = 0,1,... функция на X х X вида

Рз((гк+1,.1к+1)\(гк,.1к)) = <

'«н/%, если (^+1,^+1) = (1,1),

(1 - а,гк)/%, если (^+1,^+1) = (2,1),

«¿Л1 если {к+ъЗк+г) = 2), 1(1 - «»*)(! - Рзк), если = (2,2),

где

а _ 1«, если ¡к = 1, -</0' если^ = 1,

%к 1 I — п. если = 2, Зк 1 1 — /3, если ^ = 2,

задает переходную вероятность между двумя экземплярами измеримого пространства X, отвечающими моментам времени к и к + 1.

В соответствии со стандартным определением случайного процесса (см., например, теорему Ионоску Тулча [11]) указанные переходные вероятности и начальное состояние (¿о,^о) определяют случайный процесс, траекториями которого выступают последовательности

t=((i1,j1),(i2,32),•••)€X00. (3)

Множество Х°° всех траекторий данного случайного процесса имеет при этом структуру вероятностного пространства с вероятностью рз, определенной на с-алгебре подмножеств порожденной всеми множествами вида х X х X х ..., где

^ = к = 1,2,.... (4)

При этом

РяЦЫ х X х X х ...) =рз{{1к^к)\{1к-ъ^к-1))рз{{гк-ъ^к-1)\{к-2^к-2)) ■ ■ -РэЦгик)\(к,Зо))- (5)

Данное вероятностное пространство будем обозначать через (Х°°,рз). Легко видеть, что указанная выше ст-алгебра подмножеств Х°° содержит все одноэлементные подмножества. Отсюда из счетности Х°° вытекает, что данная ст-алгебра есть совокупность всех подмножеств Х°°. Определенный выше случайный процесс будем рассматривать как формальную модель е-релаксированной бесконечной повторяющейся игры, соответствующей паре Б (2).

Для каждой траектории £ (3) и каждого п= 1,2,... введем значения средних выигрышей, реализуемых на первых п раундах игры вдоль данной траектории:

^ п | п

) = - 2 * '3* ' = ,3* ■ (6)

к=1 к=1

Для каждой пары Б функций е-релаксированного выбора игроков функции ап(-) и Ьп(-), п = 1,2,..., представляют собой случайные величины на вероятностном пространстве (Х°°,рз). Математические ожидания случайных величин (6), задаваемые выражениями

о„[5] = I ап(1)рз(сИ), Ъп[Б) = ^ М*Ы<Й), (7)

Хп X»

назовем ожидаемыми средними выигрышами соответственно первого и второго игроков в п раундах е-релаксированной повторяющейся игры, отвечающей паре Б.

3. Выигрыши игроков в с -рел аксированной бесконечной повторяющейся игре. Зафиксируем произвольную пару в функций е-релаксированного выбора игроков вида (2). Рассмотрим е-релаксированную бесконечную повторяющуюся игру, соответствующую паре в. Найдем выражение для ожидаемого среднего выигрыша первого игрока в п раундах этой повторяющейся игры. Для каждой траектории £ € Х°° вида (3) и каждого натурального к обозначим

= а*[5] = J а*(ф5(<Й). (8)

Последнее значение есть ожидаемый выигрыш первого игрока на раунде к в рассматриваемой повторяющейся игре. Для ожидаемого среднего выигрыша первого игрока в п раундах рассматриваемой повторяющейся игры в соответствии с (6) и (7) имеем

^ п

к=1

Возьмем какое-либо натуральное к. Подсчитаем (8). В силу (4), (5)

^ Рз((гк-1,Зк-1)\(ък-2,Зк-2)) Е агк,зиРз{{гк,Зк)\{гк-ъЗк-\))- (Ю)

Для произвольных т € {0,1,..., к — 1} и {гт-,3т) € X (при т = 0 (¿о,^'о) — начальная пара чистых стратегий, которую для удобства считаем здесь переменной) положим

ат,к^т,3т)= Е Рз((гт+1,3т+1)\(гт,3т)) ■ ■ • ^ "нлР^'Ь Зк) I Зк-1)) • (И)

^т+1,3т+1)ех (1к,3к)ех

Очевидно, (11) есть ожидаемый выигрыш первого игрока в рассматриваемой повторяющейся игре на раунде к при условии, что на раунде т реализована пара {гт-,3т) чистых стратегий игроков. Ясно, что при т = О

= о,^о). (12)

В силу (10) при т > О

= Е РзЦгъЗгШо.Зо)) ■■■ Е

(ч,:Н)ех (гт,3т)ех

Введем матрицы

й _ й ГС1 — (1) ®т,к( 1; 2)\ _ и _ л

ит,к — и"т,к1°\ — I - м 1\ ~ /"о 0'\ / ' — ' ' ' ' ' ' '

\0"т,к (2,1) атоД2, 2)/

а также матрицы а = а[5] = ^ ° а а ^' @ = = (^1 ^ /3 /3 ^'

Лемма 1. Справедливо представление агп^ = ак~т Арк~т, т = 0,1,..., к — 1. Следствие 1. Справедливо представление

аа,к = акАрк. (13)

а

(к) Jk)\ (ft(k) o(fc)N

11 12 I ok _ I Pll Pl2

Рассмотрим матрицы afc = ^ ^ , /3fc = ^ .

\«21 «22 / \P21 P22 /

Лемма 2. Справедливы соотношения ^ 0, /3^ ^ 0, i,j = 1,2,

«12 = «21 = 1 - «1И «22 =«11% /?12 = /?21 = 1 ^ «1 % fj22 =fjll - (14)

Введем упрощенные обозначения «(*) = /3« = ■ Принимая во внимание (14), имеем

«1? = «2? = 1 - а(к)<- а22 = а(к)<, Р12 = Р21 = 1 ^ /3(Ч Р{22] = /3«. Таким образом,

ак =

а« 1 -

1 -

а«

=

р(к) 1-рЮ

1 - /3« /3«

(15)

Следующая лемма позволяет вычислить (13) и, следовательно, значение (8).

Лемма 3. Справедливы представления

(к) _ (2а — 1)к + 1 (к) _ (2/3 - 1)" + 1 2 ' 2

(16)

Согласно (13), (15), (16), матрица средних выигрышей первого игрока на шаге к равна

а0и = акА/Зк =

Перемножая матрицы, получаем

4а0)^(1,1) = оц + «12 + а,21 + а22 + (2а - 1)к[ац + а^ - а,2\ - а22]+

+ (2/3 - 1)к[ац - а12 + а21 - а22] + (2а - 1^(2/3 - 1)*[ац - а12 - а21 4а0)^(1, 2) = йц + а,\2 + а,2\ + а22 + (2а - 1)к[ац + а,12 - а,2\ - а22] +

а22\

+ (2/3 - 1)к[~ац + «12 - а21 + а22] + (2а - 1^(2/3 - 1)*[-ац + а12 + а21 - а22], 4а0)^(2,1) = йц + аг2 + а2г + а22 + (2а - 1)/г[^ац - аг2 + а2г + а22]+

+ (2/3 - 1 )к[ап - а12 + а21 - а22] + (2а - 1^(2/3 - 1 )*[-ац + а12 + а21 - а22], 4а0)^(2, 2) = йц + аг2 + а2г + а22 + (2а - 1)/г[^ац - аг2 + а2г + а22]+

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ (2/3 - 1)'г[—ац + а12 - а21 + а22] + (2а - 1^(2/3 - 1)*[ац - а12 - а21 + а22].

(17)

(18)

(19)

(20)

Аналогичные представления справедливы и для выигрышей второго игрока на шаге к.

Устремим к к бесконечности. Из леммы 2 с учетом неравенств из определения е-релаксированного выбора игроков выражений (17)-(20) и (9) вытекает следующая

Теорема 1. 1. Для е-релаксир о ванной бесконечной повторяющейся игры, соответствующей паре Б функций е-релаксированного выбора игроков (2), существует предел

а[<5] = Нт ап[<5].

(21)

2. При заданной начальной паре (га,,]а) чистых стратегий а[<5] принимает 5 значений в зависимости от того, какая из комбинаций условий, приведенных ниже в табл. 1, имеет место.

Предел а[<5] (21) назовем ожидаемым выигрышем первого игрока в е-релаксированной бесконечной повторяющейся игре, соответствующей паре Б (2).

Замечание 1. Как видно из табл. 1, при стремлении первого игрока от е-консерватизма к чистому консерватизму, т.е. при стремлении а к 1 снизу (без вариаций вторым игроком значения /3), его ожидаемый средний выигрыш а[<5], вообще говоря, не стремится к значению, соответствующему случаю а = 1. Аналогичного рода разрывы имеют место при стремлении а к 0 сверху.

Замечание2. При использовании игроками только строго рандомизированных стратегий е-консерватизма и е-инноваторства мы избегаем разрывов в ожидаемых средних выигрышах и имеем частный случай теоремы о предельных переходных вероятностях [12, XIII, § 7].

4. Равновесные поведения двух консерваторов. Для каждого игрока-консерватора выбор им чистого консерватизма (т. е. выбор а = 1 в случае первого игрока и /3 = 1 в случае второго игрока) принимаем за его стратегию поведения 1, а выбор им е-консерватизма (т.е. выбор произвольного а € [1 — е, 1) в случае первого игрока и произвольного /3 € [1 — е, 1) в случае второго игрока) — за его стратегию поведения 2.

Таблица 1

Условия Поведение первого игрока Поведение второго игрока о[5]

а,/3 Е (0,1) е-консерватор либо е-инноватор е-консерватор либо е-инноватор «11 + «12 + «21 + «22 4

а = 1, /3 е (0,1) Чистый консерватор е-консерватор либо е-инноватор а11+а12 ((го,л>)е{(1,1),(1,2)}), а21+а22 ((го,^о)е{(2,1),(2,2)}).

а = о, ¡3 е (0,1) Чистый инноватор е-консерватор либо е-инноватор ац + «12 + а21 + «22 4

а е (0,1), /3 = 1 е-консерватор либо е-инноватор Чистый консерватор а"+а21 ((го,л>)е{(1,1),(2,1)}), а12+а22 ((го,^о)е{(1,2),(2,2)}).

а е (0,1), /3 = 0 е-консерватор либо е-инноватор Чистый инноватор ац + «12 + а21 + «22 4

а = 1, /3 = 1 Чистый консерватор Чистый консерватор а»о ,30

а = 0, /3 = 1 Чистый инноватор Чистый консерватор а"+а21 ((го,^о)е{(1,1),(2,1)}), а12^22 ((»о,Л)б {(1,2), (2, 2)})

а = 1, /3 = 0 Чистый консерватор Чистый инноватор а"+а12 ((го,^о)е{(1,1),(1,2)}), а21^22 ((»о,Л)б {(2,1), (2, 2)})

а = 0, /3 = 0 Чистый инноватор Чистый инноватор а"+а22 ((го,^о)е{(1,1),(2,2)}), ^ з"21 ((»о,Л)б {(1,2), (2,1)})

Основываясь на табл. 1, задающей значения ожидаемого выигрыша а[<5] первого игрока и аналогичной таблице для второго игрока, расположим эти значения в матрицах А* и В* соответственно. Именно на пересечении строки 1 и столбца ] матриц А* и В* поместим соответственно значения а[Б) и Ь[Б], отвечающие стратегии поведения г первого игрока и стратегии поведения ] второго игрока. Получаем:

1) при (¿о,*,) = (1,1) /

А*(1,1) =

ац

Оц + 012

Оц + О 21 ОЦ + 012 + О 21 + в'22

V

2) при (г0,Зо) = (1,2) /

А* (1,2) =

а 12

V

3) при (г0,Зо) = (2,1) /

А* (2,1) =

Й21

V

ац + а 12

012 + О22 ац + а 12 + Й21 + (¿22

Й21 + а22

ац + 0,21 Оц + 0,12 + 021 + 0,22

В* (1,1) =

т 1- «12

т

^11 -I- 021 Ои -I- 012 -I- 021 -I- 022

\ 2

В*( 1,2) =

П2

\ 2

В* (2,1) =

->21

\ 2

->11 1- 012

->21 1- 022

>12 -I- 022 Оц -+- 012 -I- 021 + »22

>11 -I- 021 Оц -I- 012 -I- 021 -I- 022

4) при (¿о^'о) = (2,2) /

А* (2,2) =

Й22

О 21 + О 22

V

012 + 022 ЙЦ + Й12 + О 21 + ^22

В* (2,2) =

7

1 -I- 022

'22

'12 -I- 022 "1 1 -I- 012 -I- 021 -I- 022

V

7

Введем в рассмотрение поведенческую игру двух консерваторов, в которой чистыми стратегиями первого и второго игроков-консерваторов выступают их стратегии поведения 1 и 2, а матрицами выигрыша — А* и В* соответственно. Рассмотрим вопрос о наличии в поведенческой игре двух консерваторов ситуации равновесия по Нэшу в классах чистых стратегий (поведения). Учитывая вид

П* ^ а,ц + а, 21 Й12 + «22 „ Оц + «21 ^ «12 + «22 матриц А и В и соотношения ац > ---, «12 < ---, «21 < -^-, «22 > -^-

, ¿>11 + Ъ\2 , ¿>11 + Ъ\2 , ¿>21 + ¿>22 , ¿>21 + ¿>22

и ¿>и < -^-' 12 :> -2-' '> -2-' -2-' получаем слеДУюЩии результат.

Для поведенческой игры двух консерваторов информация о существовании и виде ситуации равновесия по Нэшу в классах чистых стратегий (поведения) дается в следующей табл. 2.

Таблица 2

(го,¿о) Условия для А Условия для В Равновесие по Нэшу

(1Д) «11 + «12 < «21 + «22 ац + «12 < а21 + «22 ац + а12 > 021 + агг ац + 012 > а21 + агг Ьц + &21 > Ь12 + Ь22 Ьц + Ьг1 < Ь\2 + Ьгг Ьц + Ьг1 > Ь\2 + Ьгг Ьц + Ьг1 < Ь\2 + Ьгг Не существует (2,2) (1,2) (1,2)

(1.2) ац + 012 < аг1 + агг ац + 012 < аг1 + агг ац + 012 > аг1 + агг ац + 012 > аг1 + агг Ь\2 + Ьгг > Ьц + Ьг1 Ь\2 + Ьгг < Ьц + Ьг1 Ь\2 + Ьгг > Ьц + Ьг1 Ь\2 + Ьгг < Ьц + Ьг1 (2Д) (2,2) (2Д) Не существует

(2Д) ац + 012 > аг1 + агг ац + 012 > аг1 + агг ац + 012 < аг1 + агг ац + 012 < аг1 + агг Ьц + Ьг1 > Ь\2 + Ьгг Ьц + Ьг 1 < Ь\2 + Ьгг Ьц + Ьг1 > Ь\2 + Ьгг Ьц + Ьг1 < Ь\2 + Ьгг (2Д) (2,2) (2Д) Не существует

(2,2) ац + 012 > аг1 + агг ац + 012 > аг1 + агг ац + 012 < аг1 + агг ац + 012 < аг1 + агг Ьц + Ьг1 < Ь\2 + Ьгг Ьц + Ьг 1 > Ь\2 + Ьгг Ьц + Ьг1 < Ь\2 + Ьгг Ьц + Ьг1 > Ь\2 + Ьгг Не существует (2,2) (1,2) (1,2)

Обращаем внимание на то, что, в соответствии с табл. 2, ситуация равновесия по Нэшу в поведенческой игре двух консерваторов в тех случаях, когда она существует, всегда имеет поведенческую стратегию 2 (е-консерватизм) в качестве, по крайней мере, одной из компонент. Таким образом, взаимный чистый консерватизм (пара (1,1)) не является устойчивым взаимоприемлемым выбором игроков-консерваторов при допущении сколь угодно малых вероятностных отклонений от чистого консерватизма.

При аналогичном рассмотрении поведенческой игры двух инноваторов и поведенческой игры консерватора с инноватором информацию о существовании и виде ситуации равновесия по Нэшу в классах чистых стратегий (поведения) получаем в виде следующей табл. 3 для поведенческой игры двух инноваторов и табл. 4 для поведенческой игры консерватора и инноватора.

Табл и ца 3

(го,Зо) Равновесие по Нэшу

(1.1) (1,2) и (2,2)

(1,2) (2,1) и (2,2)

(2Д) (2,1) и (2,2)

(2,2) (1,2) и (2,2)

Таблица 4

(го, jo) Условия на А Равновесие по Нэшу

(1,1) «11 + Я12 > «21 + «22 an + ai2 < a2i + «22 (1,1) и (1,2) (2,1) и (2,2)

(1,2) «11 + «12 > «21 + «22 «11 + «12 < «21 + «22 (1,1) и (1,2) (2,1) и (2,2)

(2,1) «11 + «12 > «21 + «22 «11 + «12 < «21 + «22 (2,1) и (2,2) (1,1) и (1,2)

(2,2) «11 + «12 > «21 + «22 «11 + «12 < «21 + «22 (2,1) и (2,2) (1,1) и (1,2)

В соответствии с табл. 3 взаимное чистое инноваторство (пара (1,1)) не является устойчивым взаимоприемлемым выбором игроков-инноваторов при допущении сколь угодно малых вероятностных отклонений от чистого инноваторства. Кроме того, взаимное е-инноваторство является ситуацией равновесия при любых начальных условаиях в игре двух инноваторов.

Автор выражает признательность своему научному руководителю акад. А.В. Кряжимскому за постановку задачи и руководство в процессе ее решения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

СПИСОК ЛИТЕРАТУРЫ

1. Axelrod R. The Evolution of Cooperation. N.Y.: Basic Books, 1984.

2. Hofbauer J., Sigmund K. The Theory of Evolution and Dynamical Systems. Cambridge: Cambridge University Press, 1988.

3. Weibull J. Evolutionary Game Theory. Cambridge: The M.I.T. Press, 1995.

4. Fudenberg D., Kreps D.M. Learning mixed equilibria // Games and Economic Behavior. 1993. 5. P. 320367.

5. No wan M., Sigmund K. The alternating prisoner's dilemma //J. Theor. Biol. 1994. 168. P. 219-226.

6. Van der Laan G., Tieman X. Evolutionary game theory and the modeling of economic behavior //De Economist. 1998. 146. N 1. P. 59-89.

7. Kaniovski Yu.M., Kryazhimskiy A.V., Young H. P. Learning equilibria in games played by heterogeneous populations // Games and Economic Behavior. 2000. 31. P. 50-96.

8. Кряжимский А. В., Осипов Ю. С. О дифференциально-эволюционных играх // Тр. МИАН. 211. 1995. С. 257-287.

9. Kleimenov A. F., Kryazhimskiy A.V. Minimum-noncooperative trajectories in repeated games//Complex Dynamical Systems with Incomplete Information. Aachen: Shaker Verlag, 1999. P. 94-107.

10. Воробьев H. H. Теория игр для экономистов-кибернетиков. М.: Наука, 1985.

11. Неве Ж. Математические основы теории вероятностей. М.: Мир, 1969.

12. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1966.

Поступила в редакцию 24.06.11

ON THE CHOICE OF THE EQUILIBRIUM BEHAVIOR IN THE 2x2 INFINITELY REPEATED GAME: CASE OF PLAYERS-CONSERVATORS AND PLAYERS-INNOVATORS

Raygorodskaya A. V.

A 2 x 2 infinitely repeated game, in which each player in each subsequent round chooses a pure strategy based on the result of a random test, is analyzed; the random test is generated by the player's arbitrary mixed strategy prescribing the player to choose his/her pure strategy corresponding to his type of behavior: conservative or innovative, with a high probability. The game is analyzed for various cases of interaction between players-conservators and players-innovators.

Keywords: infinitely repeated games, bimatrix games, equilibria.

Аннотация научной статьи по математике, автор научной работы — Райгородская А. В.

Похожие темы научных работ по математике , автор научной работы — Райгородская А. В.

On the choice of the equilibrium behavior in the 2x2 infinitely repeated game: case of players-conservators and players-innovators