УДК 681.3
ПОИСК ОПТИМАЛЬНЫХ СТРАТЕГИЙ В МАТРИЧНЫХ И БИМАТРИЧНЫХ ИГРАХ В УСЛОВИЯХ ЭФФЕКТИВНОЙ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ РЕШЕНИЯ О.Г. Яскевич, Д.В. Иванов
В статье рассматривается вопрос эффективности принятия решения экспертом в матричных и биматричных играх. Проводится структуризация методов поиска оптимальных стратегий в матричных играх. Рассматривается вопрос эффективного интерпретирования результатов решения игр. Приводятся рекомендации формирования экспертом целей игрока в условиях эффективного интерпретирования результатов
Ключевые слова: теория игр, матричные игры, биматричные игры, оптимальное управление
К настоящему времени сформировалась достаточно серьезная теоретическая база в области теории игр, включающая в себя не только аспекты разрешимости поставленных задач, но описание основных типов игр и методов их решения. Однако существует потребность в упорядочивании игр и методов их решения, которая позволяла бы находить наиболее эффективное решение поставленной задачи в заданных условиях. Кроме того, в некоторых практических приложениях существует необходимость наиболее точной интерпретации полученных результатов решения игры. Задача интерпретации результатов отпадает в случае использования различных критериев для решения игр, например, критерии Сэвиджа или Гурвица. В этом случае игрок применяет одну из своих чистых стратегий. Подобная задача может возникать в матричных играх, решаемых в смешанных стратегиях, когда игрок не может единовременно применить свою смешанную стратегию, а знает лишь вероятности её использования.
Одним из вариантов решения матричной игры может быть применение различных оценочных критериев определения оптимальных стратегий. Критерий Лапласа основывается на принципе «недостаточного основания», полагающий, что второй игрок (природа) с равной долей вероятности может применить одну из своих стратегий. В критерии Вальда выбор игрока зависит от принципа минимакса, где игрок выбирает наилучший для себя вариант из минимально гарантированных выигрышей по каждой стратегии. Критерий Гурвица основывается на использовании коэффициента доверия, который задается экспертным путем на основе знаний и представлений о втором игроке. Дан-
Яскевич Ольга Георгиевна - ВГТУ, канд. техн. наук, доцент, тел. (4732) 43-77-04, е-шаіі; [email protected] Иванов Денис Вячеславович - ВГТУ, студент, тел. (4732) 43-77-04, е-шаіі: [email protected]
ный критерий ориентирован на выявление некого среднего значения между случаем крайнего пессимизма и случаем крайнего оптимизма. В случае если коэффициент доверия равен нулю, то поиск оптимальных стратегий сводится к решению с помощью принципа максимина. Данный критерий особенно важен в игре с природой, где она зачастую не обязательно стремится к максимизации своего выигрыша. Критерий Сэвиджа основывается на понятии матрицы рисков. Данный критерий стоит применять в условиях неопределенности, минимизируя потери от самых неблагоприятных исходов. Для решения матричной игры рекомендуется использовать все перечисленные выше критерии, на основе результатов которых ЛПР сможет выбрать наилучшую стратегию. Преимущество данного метода заключается в простоте интерпретации результатов: игрок выбирает свою чистую стратегию в первозданном виде. Недостатком может служить неточность в определении оптимальной стратегии, то есть игрок, следуя своей чистой стратегии, выбирает решение максимально приближенное к оптимальному, но которое не обязательно будет равновесным.
Другим вариантом поиска оптимальных стратегий в матричных играх является решение в смешанных стратегиях на основе равновесия Нэша. Согласно теореме фон Неймана любая матричная игра может быть решена в смешанных стратегиях. Таким образом, может быть получена равновесная ситуация, отклонение от которой согласно теореме Нэша ведет к проигрышу. Отыскание равновесия в матричной игре может быть получено с помощью различных методов. Фиктивный алгоритм Брауна-
Робинсона является одним из самых популярных среди специалистов в силу своей простоты, однако при работе с матрицами высокого порядка (более 20) его размерность существенно возрастает, что негативно сказывается на времени и производительности. Матричную игру
можно свести к задаче линейного программирования и решить её с помощью симплекс-метода, однако пересчет матриц большой размерности негативно сказывается на времени. Для поиска оптимальных стратегий в матричных играх 2 X 2, а также 2 х л и т х 2 эффективным будет графический метод. Кроме того, матричные игры можно решать на основе алгоритма, вытекающего из алгебраического доказательства теоремы минимакса, приведенного в [1]. Результатом применения приведенных методов поиска равновесия будут являться оптимальные стратегии поведения, следуя которым игроки получат гарантированные выигрыши [3]. Приведенная схема решения матричных игр изображена на рис. 1.
В некоторых практических задачах существует необходимость более точного интерпретирования результатов. Можно выявить задачи, где каждый из игроков имеет возможность единовременно применить свои смешанные стратегии и задачи, где это невозможно. Отсутствует возможность единовременного применения
смешанной стратегии в играх, в которых стратегии игрока являются цельными в силу особенностей предметной области. В подобных играх необходимо применение методов, приводящих решение к определению оптимальной чистой стратегии, например, критерии Гурвица, Сэвиджа и др. В задачах, где игрок может единовременно применить смешанную стратегию, важно понимать одношаговый или многошаговый характер игры. В случае одношаговой игры в зависимости от целей и предметной области следует выбирать методы, направленные на определение чистых или смешанных стратегий. Однако в многошаговых играх целесообразно использовать только смешанные стратегии в связи с тем, что чистые стратегии, если нет седловой точки, только приближены к равновесию, но не являются им, поэтому существует некая погрешность в решении, приводящая впоследствии розыгрыша многошаговой игры к уменьшению прибыли. Приведенная схема формирования цели изображена на рис. 2.
В теории игр под природой принято пони-
Характер
выигрыша
Характер игры
Характер цели
Группа методов
Рис. 1. Схема принятия решения экспертом в матричной игре
Рис. 2. Формирование цели экспертом в матричной игре
мать внешнюю окружающую игрока среду. Сформировалось два основных подхода решения игр с природой: первый основан на представлении природы в качестве полноценного игрока-конкурента, а второй - на нецелесообразности представления первого подхода. Оба подхода имеют смысл и право на реализацию в зависимости от целей игрока. В случае необходимости определения гарантированного выигрыша, следует применять первый подход и соответствующие методы согласно общей схеме решения матричных игр. В случае если природа подчиняется стохастическим закономерностям, целесообразно использовать вероятностную оценку природных стратегий. В этом случае эффективным инструментом решения подобных задач будут являться критерии Гурвица и Лапласа.
Поиск равновесия в биматричной игре является достаточно трудоемким процессом, сложность которого существенно возрастает с увеличением размерности платежных матриц, поэтому подобные задачи стремятся алгоритмизировать для решения на ЭВМ. Одним из таких решений являются численные методы, ориентированные на задачи большой размерности. Для задач малой и средней размерности удобно использовать метод Лемке-Хаусона по своей природе схожий с симплекс-методом. Графический метод используют для решения игр размерности 2x2
Биматричную игру можно рассмотреть как две антагонистические игры. В каждой из этих игр, на основе методов решения игр с нулевой суммой, игроки могут получить свои гарантированные выигрыши, информация о которых является важной при решении биматричных игр, так как, следуя данной стратегии, игрок, несмотря на поведение другого игрока, сможет получить свой минимальный выигрыш. На втором этапе решения биматричной игры осуществляется поиск возможных оптимальных ситуаций и равновесия в игре. Важной особенностью является
возможность игроков обмениваться между собой информацией о своих стратегиях с целью максимизации своих выигрышей. Такая возможность позволяет игрокам получить более высокие выигрыши, так как цена игры при ситуации равновесия может быть меньше договорной. При отсутствии возможности обмена информацией, следует осуществлять поиск оптимальной равновесной ситуации известными методами. На завершающем этапе решения би-матричной игры обязательно должна выполняться проверка того, что цена игры полученного решения должна быть не ниже гарантированного выигрыша, в противном случае имеет смысл применение стратегии гарантированного выигрыша [2].
На начальной стадии проектирования игры эксперту требуется тщательное изучение предметной области с целью определения типа игры и постановки целей игроков. Далее на основе параметров игры формируются критерии, определяющие элементы платежной матрицы. На этапе поиска оптимальных стратегий экспертом выбираются наиболее эффективные методы решения игр согласно представленным схемам. На завершающем этапе решения игры требуется интерпретация полученных результатов, которая будет наиболее эффективной, если следовать приведенным рекомендациям формирования целей.
Статья выполнена в рамках научноисследовательских работ по теме: «Разработка поисковой среды интеллектуальной поддержки проектно-производственного процесса освоения инвестиций в создание жидкостных ракетных двигателей».
Литература
1. Дрешер М. Стратегические игры: теория и приложения. - М.: Советское радио, 1964. - 348 с.
2. Стрекаловский А.С., Орлов А.В. Биматричные игры и билинейное программирование. - М.: ФИЗМАТЛИТ, 2007. - 224 с.
3. Крушевский А.В. Теория игр. - Киев: Издательское объединение «Вища школа», 1977. - 216 с.
Воронежский государственный технический университет
SEARCH OF OPTIMAL STRATEGIES IN MATRIX AND BIMATRIX GAMES IN CONDITIONS OF EFFECTIVE DECISION RESULTS INTERPRETATION O.G. Yaskevich, D.V. Ivanov
The article is devoted to problem of decision-making by expert in matrix and bimatrix games. There are structurization of methods of search of optimal strategies in matrix games. Are examined question of effective decision results interpretation. There are also recommendation to make player purposes by expert in condition of effective results interpretation
Key words: theory of games, matrix games, bimatrix games, optimal management