УДК 519.85
О.В. СЕРАЯ, Т.И. КАТКОВА
ЗАДАЧА ТЕОРИИ ИГР С НЕЧЕТКОЙ ПЛАТЕЖНОЙ МАТРИЦЕЙ
Анотація. Розглянута задача теорії ігор у нетрадиційній постановці, коли елементи платіжної матриці - нечіткі числа з відомими функціями приналежності. Запропонована технологія рішення задачі заснована на формуванні функції приналежності нечіткого значення ціни гри.
Ключові слова: платіжна матриця, нечіткі числа, функція приналежності, стратегія гри, нормоване значення функціонала, метод невизначених множників Лагранжа, оптимізація.
Аннотация. Рассмотрена задача теории игр в нетрадиционной постановке, когда элементы платежной матрицы - нечеткие числа с известными функциями принадлежности. Предложенная технология решения задачи основана на формировании функции принадлежности нечеткого значения цены игры.
Ключевые слова: платежная матрица, нечеткие числа, функция принадлежности, стратегия игры, нормированное значение функционала, метод неопределенных множителей Лагранжа, оптимизация.
Abstract. The task of game theory in the frame of untraditional setting when the elements ofpayoff matrix are fuzzy numbers with the known membership functions is considered. The offered technology of task decision is based on the forming of membership function of unclear value of game cost.
Keywords: payoff matrix, fuzzy numbers, membership function,game strategy, normalized value of the functional, Lagrange's method of undetermined multipliers, optimization.
1. Введение
Как известно, модели теории игр обеспечивают возможность формального описания взаимодействия двух лиц (или двух групп лиц), преследующих частично или полностью противоположные интересы [1, 2]. В терминах теории игр решаются многие задачи принятия решений в условиях конфликтных ситуаций. Типичные примеры возникают при исследовании поведения экономических систем при наличии конкуренции. При этом предполагается, что известна так называемая платежная матрица, элемент которой, лежащий на пересечении выбранных строки и столбца, однозначно задает выигрыш, получаемый при выборе соответствующих (по номерам строки и столбца) стратегий первого и второго игроков. Классическая теория игр базируется на предположении, что игроки имеют полную информацию о платежной матрице. Однако на практике это предположение не реализуется, то есть существует неопределенность относительно выигрыша, получаемого при заданном наборе стратегий игроков. Эта неопределенность может быть описана с использованием математического аппарата теории нечетких множеств [3, 4]. Следуя [5], рассмотрим игру двух лиц с нечеткой платежной матрицей А = (а.), где а. - нечеткие числа с известными функциями принадлежности (ФП) ), 1 = 1,2,...,т,. = 1,2,...,п. Пусть набор
X = (х*), 1 = 1,2,...,т задает смешанную стратегию игрока 1. Тогда задача отыскания мак-
симизирующей стратегии X*, не доминируемой со степенью а, формулируется следующим образом: найти набор X, максимизирующий
Хт+1 (1)
и удовлетворяющий ограничениям
т
Е аПХг - Хт+1 , . = 1,2,..., п, (2)
1=1
© Серая О.В., Каткова Т.И., 2012
188К 1028-9763. Математичні машини і системи, 2012, № 2
Ех1 = 1, хг > 0, г = 1,2,...,т , (3)
г=1
т(аг]. )>а,г = 1,2,...,т , ] = 1,2,...,п . (4)
Предложенный в [5] подход состоит в переходе от нечеткой задачи (1)-(4) к двум
четким задачам линейного программирования (ЛП) с заменой ограничений (2) сначала на
т
Е ] X > Хт+1 , ] = 1,2,..., П (5)
г =1
(для получения решения «пессимиста» - Хь ), а затем на
т
Е аГ) X > Хт+1 , ] = 1,2,..., П (6)
г =1
(для получения решения «оптимиста» - Хи ). Здесь а(£') и а]) - нижние и верхние границы интервалов значений ац, определяемые решением неравенств (4).
При этом все множество стратегий 1-го игрока лежит между стратегиями «пессимиста» Xь и «оптимиста» Хи [1] и может быть получено как выпуклая их линейная комби-
нация:
X(0) =АХЬ + (1 - Х)Хи , 1 е [0,1]. (7)
Аналогично решается задача игрока 2.
Возможность произвольного задания значений параметров а и X инициирует проблему отыскания обоснованного «компромиссного» решения. Некоторые естественные
Например, предположим, что является истинным вектором
подходы к получению такого решения предложены в [6]. только один элемент пространства [а^, а^ ]х... х [а^, аи коэффициентов ограничений (2). Тогда возникает бесконечно много таких ограничений, которые должны удовлетворяться одновременно. Поскольку отыскание полного решения в этом случае - трудоемкая задача, считается целесообразным определить какое-либо компромиссное решение непосредственно. В частности, может быть выбран единственный
вектор А = (аг]) такой, что т(аг] )> 0, г = 1,2,...,т , ] = 1,2,...,п, и при этом решается единственная задача (1)-(3), в которой ограничение (2) имеет вид
т
Е] > Хт+1, ] = 1,2,...,П .
1=1
Ясно, что для получения компромиссного решения естественно выбирать представителя с наибольшими шансами появления. Поскольку необходимая для этого информация на практике отсутствует, то этот представитель получают, например, из условия
А =1 (А(' + А(и)).
Элементарное развитие этой идеи состоит в использовании правила Гурвица:
4 = тА(Ь) + (1 -т)А(и), те [0,1].
Более изощренная технология получения компромиссного решения состоит в следующем. Вводится множество состояний природы (^1 ,^2,...,м;.), относительно которых
известны вероятности р^ ,р^ ,...,р№ их появления, Ёр№ = 1. Далее каждому состоянию
1 2 ‘ к=1 "
природы ~№к ставится в соответствие набор интервалов ], 2 = 1,2,...,т , у = 1,2,...,п,
к = 1,2,...,5 . Внутри каждого интервала выбирается представитель ак ]. Теперь
компромиссное значение ау для каждого из параметров ау отыскивается из соотношения
ач=Ё 4р™, , 2=1,2,...,т, у=1,2,...,п.
к=1
Найденные таким образом коэффициенты используются в ограничениях (2).
В [6] обсуждаются и некоторые другие варианты построения компромиссного решения.
Однако возникающая при этом неоднозначность выбора и отсутствие среди них безусловно лучшего делают актуальной разработку новых вариантов получения компромиссного решения.
2. Основные результаты
Решим порождаемую (1) - (3) четкую задачу ЛП, используя модальные значения аг(0) нечетких чисел ау : найти набор X = (х1,х2,...,хт+1), максимизирующий (1) и удовлетворяющий ограничениям
т
Ё Х - Хт+1 - 0, 7 = 1,2,..., П , (8)
2=1
Ё хг = 1, хг - 0 г = 1,2,...,т . (9)
2=1
Пусть X(0) - решение задачи (1), (8), (9), назовем его модальным. Далее, используя (2) и формальные описания ФП нечетких параметров ац, введем набор функций принад-
лежности ж(г ),...,т(^п) чисел
21 = Ё а1Хг , 1 = 1,2,. . ., П , (10)
2=1
задающих нечеткие значения платежей игроку 1 для соответствующих стратегий игрока 2.
Понятно, что степень неопределенности для каждого нечеткого числа г 7, у = 1,2,...,п , определяемая соответствующей функцией принадлежности, зависит от выбранного набора X.
Тогда четким решением нечеткой задачи (1)-(3) будем называть набор X = (х1, х2,..., хт+1), минимизирующий сумму площадей фигур, ограниченных функциями
принадлежности Ж?! ) нечетких чисел , у = 1,2,...,п , и наименее уклоняющийся от X(0).
Смысл этого критерия понятен: его использование обеспечивает получение набора четких чисел х1,х2,...,хт+1, для которых функции принадлежности чисел г1,г2,...,гп наименее раз-
т
мыты и имеют модальные значения, максимально близкие к г(0) = Ёа\рхг(0), у = 1,2,...,п .
2=1
Получаемое в результате единственное решение имеет ряд достоинств. Во-первых, оно определяется совместным действием всех нечетких параметров задачи, причем в процессе решения нет необходимости как-то задавать их уровень принадлежности. Во-вторых, решение минимизирует суммарную неопределенность в отношении величин нечетких платежей игроку 1. В-третьих, оно реализует компромисс между естественным требованием близости искомого решения к модальному и понятным желанием минимизировать неопределенность результата.
Запишем необходимые соотношения, определяющие решение задачи (1)-(3) в указанном выше смысле. Пусть ФП нечетких чисел а.. являются, например, функциями (Ь - Я) типа [7], то есть
т(аг, )=
Ь
Я
х < а, ),
(11)
х > а
(о)
а, > 0, /3, > 0, і = 1,2,...,т, , = 1,2, ... , п.
Тогда, в соответствии с правилами выполнения операций над нечеткими числами (Ь - Я) типа [7-9], получим
тк2, )=<
Ь
ґ а - г ^
иг> І
Я
ґ 1 \
2І < «І
(12)
і У
т
а
(0 )
і=1
а"'х, , а,1 = 2ачх,, / = 2ДЛ ■ 1 = 1,2 ■ ■ - п
і =1 і =1
Зададим функционал, определяющий суммарную площадь фигур, ограниченных сверху функциями принадлежности т(2, ),
1 = 2) ж, К=2
1 =1 -¥ ,=1
аг. /• а 1 N ¥ І» Г 2, - аг Л
)Ь “І і <І2, + ) Я 1 2І г ^3
а2
_ ^ V г, у а2, V 2І У
(13)
Аналитическое выражение для функционала (13) может быть получено в явном виде, если в частном случае использовать гауссово описание функций (Ь - Я) типа. При этом
т(аг1 )= ехр
(а,- 40) )2
2^1
і = 1,2,..., т, 1 = 1,2,..., п,
(14)
( \ ґ т т(г, )=т 2
а,Хг
V г =1
= ехр
- 2
4“ Ч-
г=1
22 ^х 2
г =1
= ехр< -
л 2^12(х)
2
г
J, = £) = £ |ехр]-(^ = £л/Ж (X).
. =1 -¥
2а (х)
(15)
Заметим, что приведенное выражение для описания тела неопределенности нечеткого параметра задачи, в частном случае гауссовой функции принадлежности, может быть получено с точностью до скалярного множителя с использованием энтропийного подхода. В самом деле, рассчитаем энтропию для нечеткого числа а,. с функцией принадлежности
(14). Имеем (для удобства индексы (/',_/') опущены)
Н = - |т(х)1п т(х)йх = | вхр\
(х - х )21 (х - X )2
2а
х_)2
2 ( о _2
2а2
¥ и 2 йх = а Г е 2 — йи =
X-х Л 2
а
оо Г _ ^ л а ¥ Г ^ л а и2 ¥ 2 ¥ и
Г и - ие 2 йи Г ий е 2 ие 2 - Г е 2 йи
= 2 = 2
-¥ -¥ I У -¥ -¥
а42ж 1
2
• Г е 2 йи -42ж -
Л:
ж
2
а.
Ясно, что отсюда с точностью до коэффициента следует (15). Введем нормированное значение функционала (15):
Запишем, кроме того, выражение для оценки отклонения набора X от набора X(0):
J1 = (х - X(0)) (х - X(0)).
Тогда искомое четкое решение задачи (1)-(3) получим, минимизируя
J=£
.=1
£*&
i=1
£ а (х;”) )2
т+1 .
+£ (х,- х<0))
(16)
с учетом ограничений (3).
Приближенное решение задачи может быть получено путем минимизации функции, мажорирующей (16). Так как
то
а.х,
£ а. (х(0))
Л 2 ,=1
т+1 , т т+1
г+(х, - х<« )2 = £й,х, + 2: (х, - х<0> )2 > J,
,=1 ,=1
а
2
оо и
,=1
,=1
2
d, = У'
s.
i = 1,2,..., m.
j=l
У S2 (x(01)
, i=1
Теперь найдем набор, минимизирующий J и удовлетворяющий (3). Используем метод неопределенных множителей Лагранжа. Введем
m m+1 . m
Ф(х )=У dixi + У (xi— xi(0)) +1 У x-— 1
л
x
і=і у
Далее
dФ( X)
dx
■di — 2(xi — x(0) )+1 = 0,
dФ( X)
dx
= x — x (0) = 0
xm+1 xm+1
dФ( X)
dl
=У x— 1=0.
Подставляя (17) в (19), получим
1 m 1 m m
1У x(0) —1У dt — -1 = 1.
ii
2 i=1 2 i=1 2
(17)
(18) (19)
Отсюда, так как У xi = 1 , то
1 1 1 ^
— =------------------У d. .
2 2m 2m ~1
Тогда
1 (0) 1 . 1 1 1 Г (0) 1 1 1 Г . 1
x. = — x( j-------------------------------------------------------------------d \-\-У d =— I x( j \-I-------
г ~ г n г о™ o.„, г n І г m J 2
2 г 2 г 2m 2m tl г 2
- d, — - У d,
V m ,.=1 у
i =1,2,...,m
x = x(0) . m+1 m+1 •
aa
“ll “12
a21 a22
Va31 a32 у
Пример. Пусть элементы платежной матрицы игры A =
функциями принадлежности
( ) [ («11 - 2)21 ( ) [ (a12 - 4)2
m[au)=exp^-—— \, m(ai2)=ехН
- нечеткие числа с
50
18
m(a2i )=exPi —
(a21 — 5)2 32
m(a22 )=exPi —
(a22 — 1)2
г=1
г=1
г=1
г=1
8
m(a3i )=
exPi
(a3i — 4)2 18
, m(a32 )
exPi
(a32 — 6)2 2
Сначала найдем рациональную стратегию первого игрока, задав нечеткие элементы платежной матрицы равными их модальным значениям. Решим соответствующую задачу ЛП: найти набор X = (х1, х2, х3, х4), максимизирующий х4 и удовлетворяющий ограниче-
ниям
2 x1 + 5 x2 + 4 x3 — x4 > 0,
4 x1 + x2 + 6 x3 — x4 > 0,
x1 + x2 + x3 = 1.
x1 > 0, x2 > 0, x3 > 0 .
(20)
(21)
(22)
(23)
12.1
Решение этой задачи: X{ ’ = I 0,— — ,4— I.
^ 3 3 3)
Теперь решим следующую задачу математического программирования: найти набор X = (х1, х2, х3, х4), минимизирующий
J (X )=
S1(X) + S2 (X) + У (
sX07) sp57! У (
) =
(25xi +16x^ + 9x3 )2 + (9xi + 4x^ + x3 )2
22 + 9 x2
16 9•4]2
9 + 9 j
+_x3
i
'4 +4 ]2 9 9 у
+ x1 + Г x2 — 31 + Г x3 — + f x4 — 431
и удовлетворяющий ограничениям (20)-(23).
Искомый набор имеет вид: X* = (0,064; 0,289; 0,647; 4,161). Значение критерия на
модальном наборе X(0), естественно, равно 2, а на оптимальном наборе X * оно лучше и равно 1,928 .
3. Выводы
Рассмотрены возможные технологии решения задачи теории игр с нечеткой платежной матрицей. С целью устранения недостатков традиционного метода решения предложена альтернативная процедура, основанная на использовании композиционного критерия, учитывающего меру близости получаемого решения к модельному, а также уровень неопределенности в отношении получаемого в результате нечеткого значения цены игры. Указанная процедура сводит исходную задачу к четкой задаче математического программирования, решаемой известными методами. Приведен пример.
СПИСОК ЛИТЕРАТУРЫ
1. Вильямс Дж. Совершенный стратег / Вильямс Дж.; пер. с англ. - М.: Ил, 1960. - 261 с.
2. Мак-Кинси Дж. Введение в теорию игр / Мак-Кинси Дж.; пер. с англ. - М.: ГИФИЛ, 1960. -420 с.
3. Zadeh L. A. Fuzzy sets / L.A. Zadeh // Inf.Conf. - 1965. - N 8. - P. 338 - 353.
4. Орловский С.А. Проблемы принятия решений при нечеткой исходной информации / Орловский С. А. - М.: Наука, 1981. - 206 с.
5. Зайченко Ю.П. Игровые модели принятия решений в условиях неопределенности / Ю.П. Зайченко // Труды V международной школы-семенар «Теория принятия решений». - Ужгород: УжНУ, 2010. - 274 с.
6. Зайченко Ю.П. Исследование операций: нечеткая оптимизация / Зайченко Ю.П. - К.: Вища школа, 1991. - 191 с.
7. Дюбуа Д. Теория возможностей. Приложение к представлению знаний в информатике / Д. Дюбуа, А. Прад; пер. с франц. - М.: Радио и связь, 1990. - 286 с.
8. Леоненков А.В. Нечеткое моделирование в среде МаІІаЬ и і^ЕуТесЬ / Леоненков А.В. - СПб.: БХВ - Петербург, 2003. - 736 с.
9. Раскин Л.Г. Нечеткая математика / Л.Г. Раскин, О.В. Серая. - Х.: Парус, 2008. - 352 с.
Стаття надійшла до редакції 01.07.2011