МЕТОДИКА РЕШЕНИЯ БИМАТРИЧНЫХ ИГР С ПОМОЩЬЮ
РАВНОВЕСИЯ ДЖ.НЭША
A METHOD FOR SOLVING BIMATRIX GAMES WITH EQUILIBRIUM
JOHN.NASH'S
УДК 004.421
Масленникова Екатерина Александровна, Студент, 2 курс, Департамент магистратуры ФГБОУ ВО Уральский государственный экономический университет. Россия, г. Екатеринбург
Maslennikova Ekaterina Aleksandrovna, Student, 2nd year, master's degree Department Ural state University of Economics. Russia, Yekaterinburg
Аннотация: в статье раскрыто определение «Теория игр». Приведены основные группы игр. Кроме этого рассмотрен пример решения биматричной игры с помощью равновесия Нэша.
Abstract: the article reveals the definition of "game Theory". The main groups of games are shown. Besides the example of solving bimatrix games with Nash equilibrium.
Ключевые слова: теория игр, стратегии игроков, выигрыш, равновесие
Нэша.
Keywords: game theory, player strategies, winning, Nash equilibrium.
ВВЕДЕНИЕ
В текущий момент многие решения в производственной, экономической или коммерческой деятельности зависят от субъективных качеств лица, принимающего решение. При таком способе выбора решений в условиях неопределенности всегда возникают риски, которые сложно или вовсе невозможно избежать.
Чтобы рассчитать и сократить возможные риски в условиях частичной или полной неопределенности при принятии решения необходимо воспользоваться моделями теории игр, наиболее подходящими для каждой конкретной задачи, которые позволяют рассмотреть все возможные варианты поведения обеих сторон и рассчитать наиболее выгодные исходы для каждой из сторон.
Для выбора наиболее подходящей модели для каждой определенной ситуации рассмотрим существующие модели теории игр.
ОПИСАНИЕ МЕТОДОВ ТЕОРИИ ИГР
Теория игр - это математическая теория конфликтных ситуаций. Основными ограничениями этой теории являются предположение о полной или «идеальной» разумности противника и принятие при разрешении конфликта наиболее осторожного «перестраховочного» решения.
В теории игр игрой называют возможные варианты поведения обеих сторон и их исходов для каждого сочетания альтернатив и состояний можно представить в виде математической модели. Обе стороны конфликта не могут точно предсказать взаимные действия. Несмотря на такую неопределенность, принимать решения приходится каждой стороне конфликта.
В зависимости от причин, вызывающих неопределенность исходов, игры можно разделить на следующие основные группы:
1. Комбинаторные игры. Игры, в которых правила в принципе дают возможность каждому игроку проанализировать все разнообразные варианты поведения и, сравнив эти варианты выбрать из них наилучший. Неопределенность здесь состоит в слишком большом количестве вариантов, которые надо проанализировать.
2. Азартные игры. Игры, в которых исход оказывается неопределенным в силу влияния случайных факторов.
3. Стратегические игры. Игры, в которых неопределенность исхода вызвана тем, что каждый из игроков, принимая решение, не знает, какой стратегии будут придерживаться другие участники игры, так как отсутствует информация о последующих действиях противника (партнера).
4. Парные игры. Игра называется парной, если в игре участвуют два игрока.
5. Множественные игры. Игра называется множественной, если в игре участвуют больше двух игроков.
6. Игра с нулевой суммой. Игра называется с нулевой суммой, если каждый игрок выигрывает за счет других, а сумма выигрыша и проигрыша одной стороны равны другой.
7. Антагонистическая игра. Парная игра с нулевой суммой называется антагонистической игрой.
8. Конечная игра. Игра называется конечной, если у каждого игрока имеется только конечное число стратегий. В противном случае - игра бесконечная.
9. Одношаговая игра. Игра, когда игрок выбирает одну из стратегий и делает один ход.
10. Многошаговая игра. В многошаговых играх игроки для достижения своих целей делают ряд ходов, которые могут ограничиваться правилами игры
или могут продолжаться до тех пор, пока у одного из игроков не останется ресурсов для продолжения игры.
Проведение классификации и группировки игр позволяет для конфликтных ситуаций найти общие методы поиска альтернатив в принятии решения, выработать рекомендации по наиболее рациональному образу действий в ходе развития конфликтных ситуаций в различных сферах деятельности.
Как правило, во время конфликта стороны стараются придерживаться наиболее выигрышной для себя стратегии, но это не гарантирует получение наибольшего выигрыша.
ПОСТАНОВКА ЗАДАЧИ
Приведем пример задачи и решим ее с помощью равновесия по Нэшу: «В отрасли имеются две фирмы №2 1 и №2 2. Каждая из фирм может установить два уровня цен: «высокие» и «низкие». Если обе фирмы выберут высокие цены, то каждая будет иметь прибыль по 3 млн. Если обе выберут низкие, то каждая получит по 2 млн. Однако, если одна выберет высокие, а другая низкие, то вторая получит 4 млн, а первая только 1.»
Равновесие по Нэшу - концепция решения, одно из ключевых понятий теории игр. Так называется набор стратегий в игре для двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив свою стратегию, если другие участники своих стратегий не меняют.
РЕШЕНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ
Так как в данной биматричной игре интересы игроков не совпадают, необходимо построить такое решение, которое могло бы в том или ином, но в одинаковом смысле удовлетворяло бы обоих игроков.
Рассмотрим случай, когда у игроков имеется ровно две стратегии, то есть установить высокую или низкую цену на товар (т=п=2).
В 2x2 биматричной игре платёжные матрицы игроков имеют следующий
вид:
A=(); B=()
Вероятности р1=р, р2=1-р, q1=q, q2=1-q, а средние выигрыши вычисляются по формулам:
Инф, q) = a11p q + a12 p(1-q) + a21(1-p)q + a22(1-p)(1-q),
(1)
ИЬф, q) = Ы^ + Ь12 p(1-q) + b21(1-p)q + b22(1-p)(1-q),
(2)
где 0 < р < 1, 0 < q < 1,
Пара чисел (p*,q*), 0 < p* < 1, 0 < q* < 1, p и q, подчиненных условиям 0 < p* <1, 0 <q* <1, одновременно выполнены следующие неравенства HA(p,q*) < HA(p*, q*).
Выдвинем гипотезу, что всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.
Задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его первоначальные стратегии.
Если некоторая пара чисел (p*,q*) претендуют на то, чтобы определить ситуацию равновесия, то необходимо проверить справедливость неравенств. Для этого воспользуемся теоремой:
Выполнение неравенств 1, 2 равносильно выполнению неравенств: HA(0,q*) < HA(p*,q*), HB(p*,0) < HB(p*,q*) (3), HA(1,q*) < HA(p*,q*), HB(p*,1) < HB(p*,q*) (4). Запишем средние выигрыши игроков А и В в более удобной форме. Имеем:
HA(p, q) = (all - a12 - a21 + a22)*pq + (a12 - a22)*p + (a21 - a22)*q + a22
(5),
HB(p, q) = (b11 - b12 - b21 + b22)*pq + (b12 - b22)*p + (b21 - b22)*q + b222 (6).
Обратимся к первой формуле. Пологая p = 1, а потом p = 0, получаем,
что
HA(1, q) = (a11 - a12 - a21 + a22)*q + a12 + (a21 - a22)*q
(7),
HA(0, q) = (a21 - a22)*q + a22 (8)
Рассмотрим разности
HA(p, q) - HA(1, q) = (a11 - a12 - a21 + a22)*pq + (a12 - a22)p - (a11 - a12 - a21 + a22)*q + a22 - a12 (9),
ИЛ(р, q) - HA(0, q) = (a11 - a12 - a21 + a22)*pq + (a12 - a22)p
(10)
Пологая C = a11 - a12 - a21 + a22, a = a22-a12, получим HA(p, q) - HA(1, q) = Cpq - ap - Cq + a = (p-1)*(Cq-a)
(11),
HA(p, q) - HA(0, q) = Cpq - ap = p*(Cq-a) (12)
В случае, если пара (p,q) определяет точку равновесия, эти разности неотрицательны, поэтому: (p-1)*(Cq-a) > 0, p*(Cq-a) > 0
Из формул для функции HB(p,q) при q=1, q=0 соответственно имеем:
НВ(р, 1) = (Ъ11 - Ъ12 - Ь21 + b22)*p + (Ь12 - b22)*p + Ъ21
(12),
НВ(р, 0) = (Ъ12 - Ъ22)*р + Ъ22 (13)
Разности НВ(р, д) - НВ(р, 1) и НВ(р, д) - НВ(р, 0) С учётом обозначений D = Ь11-Ъ12-Ь21+Ь22, в = Ь22-Ъ21 Приводятся к виду НЬ(р, q) = НЬ(р, 1) = ^-1)фр-Р), НЪ(М) = НЪ(р,0) = дфр-Р). И (^1)фр-Р) > 0, q(Dp-P) > 0
В каждом столбце матрицы найдем максимальный элемент. Их положение соответствует приемлемым ситуациям 1-го игрока, когда второй игрок выбрал стратегию j соответственно.
Затем в каждой строке матрицы В выберем наибольший элемент. Эти элементы подчеркнуты в матрице В. Их положение будет определять приемлемые ситуации 2-го игрока, когда первый игрок выбрал стратегию i соответственно.
Составим платежную матрицу для двух игроков:
Таблица 1
Платежная матрица игрока А
Низкая цена Высокая цена
Низкая цена 2 4
Высокая цена 1 3
Таблица 2
Платежная матрица игрока В
Низкая цена Высокая цена
Низкая цена 2 1
Высокая цена 4 3
Позиции максимумов в строках матрицы В: (1,1), (2,1) Пересечение этих двух множеств: (1;1),
Таким образом, найдены 1 равновесные ситуации по Нэшу (1;1). Эти ситуации оказались оптимальные по Парето для обоих игроков.
В равновесной ситуации (1,1) игрок 1 выигрывает 2 единиц, а игрок 2 -2 единицы.
Если биматричная игра не имеет равновесных ситуаций в чистых стратегиях, то она неразрешима в чистых стратегиях. И тогда можно искать решение в смешанных стратегиях.
Итак, чтобы в биматричной игре: А=(а), В = (Ь) пара (р^);
Определяемая равновесная ситуация, необходимо и достаточно одновременное выполнение следующих неравенств: (р-1)(Сд-а) > 0, р^-а) > 0; 0 < р < 1 (д-1)(Ор-Р) > 0, q(Dp-P) > 0; 0 < q < 1 где
С = а11 - а12 - а21 + а22 а = а22- а12 В = Ь11-Ь12-Ь21+Ь22 в = Ь22-Ь21
Проводя необходимые вычисления: С = 2 - 4 - 1 + 3 = 0 а = 3 - 4 = -1 В = 2 - 1 - 4 + 3 = 0 в = 3 - 4 = -1 и рассуждения (р-1)*^+1) > 0 р*^+1) > 0 (д-1)*(0р+1) > 0 q*(0p+1) > 0
Откуда q=-1. Поскольку 0 < q < 1, то принимаем q=0. Откуда р=-1. Поскольку 0 < р < 1, то принимаем р=0. получаем, что:
1) р=1д > 0 р=0, q < 0
0 < р < 1, q=0
2) q=1,p > 0 q=0, р < 0
0 < q < 1, р=0
Игра имеет три равновесных ситуации с соответствующими выигрышами:
1) р=1, д=0, Н1(1,0)=2, Н2(0,1)=2
2) р=0, д=1, Н1(0,1)=3, Н2(1,0)=3
3) р=0, д=0, Н1(0,0)=3, Н2(0,0)=3
Из этих трех смешанных стратегий лучшей является р=3, q=3. Наиболее выигрышный в сумме вариант — одновременный выбор высоких цен (сумма = 6 млн). Однако это состояние нестабильно из-за возможности относительного выигрыша, которая открывается перед фирмой, отступившей от этой стратегии. Поэтому обе компании с наибольшей
вероятностью выберут низкие цены. Хотя этот вариант и не дает максимального суммарного выигрыша (сумма=4 млн.), он исключает относительный выигрыш конкурента, который тот мог бы получить за счет отступления от взаимно-оптимальной стратегии. Такая ситуация и называется «равновесием по Нэшу».
ВЫВОДЫ
Таким образом, наиболее выигрышный в сумме вариант — одновременный выбор высоких цен (сумма = 6 млн). Однако это состояние нестабильно из-за возможности относительного выигрыша, которая открывается перед фирмой, отступившей от этой стратегии. Поэтому обе компании с наибольшей вероятностью выберут низкие цены. Хотя этот вариант и не дает максимального суммарного выигрыша (сумма=4 млн.), он исключает относительный выигрыш конкурента, который тот мог бы получить за счет отступления от взаимно-оптимальной стратегии. Такая ситуация и называется «равновесием по Нэшу».
СПИСОК ЛИТЕРАТУРЫ
1. [1] Кремлев А.Г. Основные понятия теории игр, метрология: учеб. пособие. [Текст] - Екатеринбург : Изд-во Урал. ун-та, 2016.— 144 с.
2. [2] Захаров А.В. Теория игр в общественных науках. [Текст] - Изд. Дом Высшей школы экономики, 2015. - (Учебник Высшей школы экономики). - 304 с. - 1500 экз. - ISBN 978-5-7598-1180-0 (в пер.).
3. [3] Костромин А.В, Мухаметгалеев Д.М. Теория игр. [Текст] - Казань, 2013. -87 с.
4. [4] Статья «Основные понятия теории игр» [Электронный ресурс]. -Режим доступа: https://studopedia.org/9-135392.html;
5. [5] Статья «Применение метода теории игр для решения экономических задач» [Электронный ресурс]. - Режим доступа: https: //cyberleninka.ru/article/v/primenenie-metoda-teorii-igr-dlya-resheniya-ekonomicheskih-zadach;
6. [6] Статья «Модели, применяемые для реализации технологий виртуального прототипирования» [Электронный ресурс]. - Режим доступа:
http://referatwork.ru/category/tehnologii/view/484969_modeli_teorii_igr;
7. [7] Статья «Равновесие по Нэшу. Теория игр для экономистов (Джон Нэш) - Читайте подробнее на FB.ru: http://fb.ru/article/199282/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov-djon-nesh» [Электронный ресурс]. -
Режим доступа: http://fb.ru/article/199282/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov-djon-nesh;
8. [8] Статья «Равновесие Нэша. Теория Джона Нэша» [Электронный ресурс]. - Режим доступа: https://academypoker.ru/mathematics/1222-nashequilibrium.html.
BIBLIOGRAPHY
1. [1] Kremlin A.G. The basic concepts of game theory, metrology: textbook. allowance. [Text] - Yekaterinburg: Publishing House Ural. University, 2016 .-- 144 p.
2. [2] Zakharov A.V. Game theory in the social sciences. [Text] - Ed. House of the Higher School of Economics, 2015. - (Textbook of the Higher School of Economics). - 304 p. - 1,500 copies - ISBN 978-5-7598-1180-0 (trans.).
3. [3] Kostromin A.V., Mukhametgaleev D.M. Game theory. [Text] - Kazan, 2013. -87 p.
4. [4] Article "Basic concepts of game theory" [Electronic resource]. - Access mode: https://studopedia. org/9-135392.html;
5. [5] Article "Application of the game theory method for solving economic problems" [Electronic resource]. - Access mode: https://cyberleninka.ru/article/v/primenenie-metoda-teorii-igr-dlya-resheniya-ekonomicheskih-zadach;
6. [6] Article "Models used for the implementation of virtual prototyping technologies" [Electronic resource]. - Access mode: http://referatwork.ru/category/tehnologii/view/484969_modeli_teorii_igr;
7. [7] Article "Nash Equilibrium. Game Theory for Economists (John Nash) -Read more on FB.ru: http://fb.ru/article/199282/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov-djon-nesh "[Electronic resource] . - Access mode: http://fb.ru/article/199282/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov-djon-nesh;
8. [8] Article "Nash Equilibrium. Theory of John Nash "[Electronic resource]. -Access mode: https://academypoker.ru/mathematics/1222-nashequilibrium.html.