УДК 519.862.8
А.В. Жариков
Применение принципа сжатых отображений
в задаче управления игры двух лиц
при разной информированности игроков
В данной статье рассматривается применение принципа сжатых отображений при решении задачи управления игры двух лиц при разной информированности игроков.
Рассмотрим оператор управления состояниями субъекта, который функционирует в динамической случайной среде. Управление проводится с использованием принципа осреднения входных переменных [2]. Предположим, что управление выбрано из условий максимизации некоторого критерия.
Пусть x = (x1, x2,...,xn) - случайный вектор с функцией распределения Ф = Ф(x1,...,xn), а множество S = {1,2,.,п} - индексы всех компонент вектора x; множество S. с S - совокупность индексов, определяющих информационную структуру г-й управляющей переменной, г = 1,2,., т. Введём также вектор управления (стратегии
игроков) V = (у1,у2,.,ут), где V. = п.(<1), ^ = (х}-),
{е! = {1,2,.,т}, I - множество игроков. Таким образом, задача примет вид:
J1 = Ы[^. (х, V(йг))] ® тах, ге!, (1)
где символ М[-] означает операцию вычисления математического ожидания, функционал Р.(х,п) -критерий максимизации, J¡ - интегральный выигрыш г-го игрока. Формализация условий разной информированности приводит к равенству нулю частной производной по соответствующей переменной [7]:
дп1 (4 ) 0
— - °' (2)
Рассмотрим задачу (1) при п = т = 2. Тогда задача примет вид:
M[Fj(х, y, u (y), v(х))] ® max,
U
M[F2(х, y, u(y), v(х))] ® max
при условиях
^ = o, ^ = o.
дх dy
(3)
(4)
Возьмём конкретный вид функционалов
Fj = (ä{u, v, х, y\ (u v, х, y)) , F2 = (b(u>vхy)> iU’v’хy)) , где A = AT = (аг] )4x4 , B = bT = (bij )4x4, т.е. Fv F2 -
квадратичные формы с переменными u, v, x, y. Пусть информационный вектор (x, y) распределён на квадрате [а, Ь]х[а, Ь] с плотностью Ф(х, у). Считаем, что Ф(х, у) обладает стандартными свойствами плотности распределения.
Задача (3) при условиях (4) примет вид
b b
J = JJ(auu2 + 2a12uv + 2al3ux +... + a44 y2)
a a
Ф(x, y)dxdy ® max,
UGU
bb
J2 = JJ (b11 u 2 + 2b12uv + 2b13ux +... + b44 y2) (5)
aa
Ф(x,y)dxdy ® max.
veV
Задача (3) при условиях (4), по сути, является игрой двух лиц, где J (u,v), J (u,v) - функции выигрыша, а u, v - стратегии игроков. Множество допустимых стратегий U, V будут произведением пространств С:([а, Ь]х[ а, Ь]) х С:([а, Ь]х[ а, Ь]). Нахождение решения игры зависит от понимания рациональности и оптимальности поведения игроков.
Предположим, что игроки имеют непротивоположные интересы. Одной из распространённых концепций решения некооперативных игр является ситуация равновесия по Нэшу [6, 7, 9], суть которой заключается в невозможности увеличения выигрыша игрока при его отклонении от данного равновесия.
Определение 1. Ситуация x* = (x*, x*,..., x*,) называется ситуацией равновесия по Нэшу, если для всех xi еXi,i е{1,...,п} справедливо неравен-
К1 (х1 , х2,..., х„,) > К1 (х] ,..., х,-_1> х, хг+1,...х„).
Для задачи (5) определение 1 представится в виде неравенств
J1(u,v*)<J1(u*,v*),
J2(u,v*)<J2(u*,v*), где u*, V* - ситуация равновесия по Нэшу.
В [3, 4] был найден конкретный вид решения задачи (5), (4) в концепции равновесии по Нэшу, когда входные переменные х и у являлись независимыми случайными величинами.
Наряду со случаем независимых х и у можно рассматривать и общий случай зависимости
55
v
х и у. Необходимые условия существования решений, согласно [1, 3, 4], при этом не изменятся. Тогда нахождение п и V будет зависеть от разрешимости системы интегральных уравнений
a11u Jf( x, y)dx + a12 J v( x)F( x, y)dx +
a a
b b
+ a13 JxF( x,d)dx + a.uj J F(x,y)dx = 0,
a a
b b
b22vJ®( x,y)dy + bnJu{y)( (x,y)dy +
+ b23 xjF( x, y)dJ + b24 J yF( x, y)dy = 0.
(6)
Вопрос существования решения (6) не является очевидным и требует некоторых пояснений.
Для начала определим тип данной системы. Путём несложных преобразований система (6) сводится к виду
О
u( У) + ¿J v( x) K-( x, y)dx = f-( y),
a
b
v(x) + lJ4 (J) K2( x, J)dJ = f2( x)
a
b
4 (у) + я J v( x) K- (x, y)dx = f- (y),
a
b
v(J) + ^J4 (x)K2 (У, x)dx = f2(УX
(6')
Ь22Ф( x, y) a110(x, y)
где K-(xy) =--------b2-----L----, K2(x,y) =-----11 V ,y}
b21 J Ф( x, y)dx a12 J Ф( x, y)dy
a a
b b -a13 JxF(x,y)dx - a14yJf(x,y)dx
f-( y) =-----:
a11 Jf ( x, y) dx
a
b b -b23 xJF( x, y)dy - b24 J уФ( x, y)dy
■ f2( x) =
b22 Jf( x, y)dy
я = OlL . Al a11 b22
В ведём обозначения: K(x,=) =
K-(x, y) 0
0 *2(y, x)
-() _Гм (у)'1 - () -I у1(у) 1
Ф(у)-1 ^(у) I, Vх(у) I у (у) I, тогда система (6') может быть записана в векторной форме
j(y) - ¿JK(x, y)j(x)dx = y(y).
(7)
Уравнение (7) является уравнением Фред-гольма второго рода, записанное в векторной форме.
Согласно существующей теории, можно выделить несколько путей для доказательства условий существования и единственности решения интегральных уравнений.
Принцип сжатых отображений. Большое достоинство этого принципа состоит в том, что он не только гарантирует при определённых условиях однозначную разрешимость уравнения, но и может служить для получения приближённых решений [5, 6, 10].
Пусть х есть пространство С([а, Ь], R2). Предположим, что ядро K(x, у) непрерывно в замкнутом квадрате D = {(x, y):(x, y) е [a, b] х х [a,b],a,b е R} и, следовательно, ограничено на нём, т.е. ||^(x, y)/|< М||/||_. V/ е X, где M - норма оператора К(х, у). Тогда ||^| = sup ||.Kx||X =
llxlL =1 X
= sup K1x1, K2 x2
, где x - непрерывная на квад-
рате D вектор-функция. Напомним, что
Vx-2(x, y) + x22(x, y)
. Зафиксируем Xj
x = max
X x, y
и х2, в силу непрерывности х на прямоугольнике Б. Тогда условие ||х||х= 1 примет вид х12 +х22 -1. Таким образом,
\\К\ |= sup ((K.x^K^,) _. =
x.2 + x22 =1 X
= sup I max
x.2 + x2 =1V x>y
-v/k-2( x, y) x-2 + K22( y, x) x
= sup I max
x.2 + x2 =lV xy
V K-2 (x, y) x-2 + Kl (y, x)(- - x-2)
Данное преобразование допустимо в силу свойств Ф(х, у).
= max
x. j
{I K-( x, У ^,1K 2 (J, x)|}
О
О
||K|| = max {I K-( x, y)|,| K,( y, x) j}.
(8)
Полученное выражение (8) опирается на следующую лемму.
Лемма 1. Пусть f(x, у) определена на множествах х - (х1,х2) е К1,у - (у1,у2) е К2 , где К1, К2 -
и
56
компакты в R2. Тогда supsup /(x,y) =
xeK1 yeK2
= supsup / (x, y).
yeK2 xeK1
Доказательство. Рассмотрим функцию g (y) = sup / (x, y). Очевидно, что f(x, у)является
xeK,
равномерно непрерывной функцией, т.к. К1, К2 -компакты в R2. Покажем, что д(у) является непрерывной функцией по у. Запишем условие равномерной непрерывности f (x, у):
Ve >0,35 >0:|x'-x"| <5,y'-y’\<8 /(x',y')-/(x\y’)| <e/2
для любых x', x'' , у’, у’' . Пусть, x = x'' = x', тогда неравенство перепишется в виде
\.f(xy') - У(xy " ^ < e / 2 ^ У(xy " ) - e / 2 < У(xy ') <
< /(x, y") + e /2. Возьмем от обеих частей sup, име-
xeK!
ем g(y " ) - e /2 < g(y) < g(y") + e /2 »|g(y ') - g(y ")| <
< e/2< e. Из последнего неравенства следует непрерывность функции д, значит 3supg(y) =
y
= supsup/(x,y) = N. Обозначим через M = sup /(x,y).
yeK2 xeK, x^eK^K
Ясно, что M > /(x,y) ^ M > N. По определению M - e< /(x,y), следовательно, M - e< /(x,y) <
< sup/(x,y) < supsup/(x,y) = N ^M < N. Из пос-
xeK1 yeK2 xeK1
леднего неравенства следует, что M = N. Аналогично показывается, что sup / (x, y) =
x, yeKj хK 2
= sup sup /(x, y). Лемма доказана.
xeKj yeK2
Пусть y(x)e X. Тогда решение (7) будем искать среди элементов пространства X. При этом, как и в одномерном случае, решением интегрального уравнения (7) будем называть произвольную функцию ф0(у)е X , подстановка которой в уравнение (7) обращает его в истинное тождество для любого уе[а,Ь]:
jo(J) = AJ K (x У) jo( x)dx + У(У).
(9)
Ясно, что при 1 = 0 уравнение (9) имеет единственное непрерывное решение ф0(у)= -(у).
Покажем, что уравнение (7) однозначно разрешимо и при всех 1, достаточно малых по абсолютной величине. Введём следующий оператор А ф , определённый в пространстве X ,
Aj ° AJK(x,y)j(x)dx + y(y)
(10)
Оператор (10) переводит функцию j(y)e X в некоторую функцию j(y), определённую на
том же отрезке [а, Ь]. Тогда существование решения ф0(у) уравнения (7) сводится к вопросу
о наличии у оператора А неподвижной точки, т.е. такой функции ф0(у), которая при действии
оператором переходит в саму себя: Аф0 = ф0.
Покажем, что оператор А действует из полного пространства X опять в X, т.е. если g(y) = Аф(у) , где ф(у) єХ , то и g(y) єХ .
Для этого возьмём произвольную точку у є [а, Ь], и пусть Ау - любое, лишь бы выполнялось у + Ау є [а, Ь]. Имеем
g (У + Ау) - g (y) X =
K (x, у + Dy)j( x)dx -
+ У (У + Ay) - A J K (x, у) j (x)dx -
a
b
-y (у)|| X £ AlJll K (x, У + Ay) - K (x, у )|| D || j( x)|| X dx -
+ ||y(y + Ay)-y (j)||x.
(11)
Из условия ц (х) е С ([а, Ь], К2) следует, что для любого е< 0, 351 > 0 такое, что
||ц(у + Ау)-ц(у)||х< - при "Ау :|Ду| < 51. (12)
Ядро К(х, у) непрерывно в замкнутом квадрате Б и, значит, равномерно непрерывно в Б. Следовательно, по выбранному е > 0 найдем 52 > 0 такое, что
||K (x, у + Ау1 - K (x,.
(13)
2|ф(уЦх (Ь -а)\1
при |Ау| < 52 и любом х е [а, Ь].
Возьмём 5 - т1и{51,52} . Тогда при "Ау таких, что |Ду| > 5 , будут одновременно выполняться неравенства (12) и (13) и, учитывая неравенство (11), получим,
||я(у + Ау) -g(у)||х <е"Ау :|Ау| <5 ,
которое и доказывает непрерывность функции д(у) в любой точке у е [а, Ь].
Итак,
С ([а, Ь], К 2) ——® С ([а, Ь], К 2).
Выясним теперь, при каких условиях оператор А будет сжимающим. Для этого определим рассто-
a
a
a
57
яние между двумя элементами х, как норму разности данных элементов, т.е. "х,у е X - С([а,Ь],К2),
р(х,у) -||х - у||х . Данное определение уместно
в силу нормированности пространства С([а, Ь], И2). Имеем
р(jЛщ) = I\Лj - Яj||s =
b b
lj K(x,y)j1(x)dx - lj K(x,y)j2(x)dx =
a a s
b
lj K ( x, y)(j( x) - j2( x))dx <
a s
< I^M (b - a)| ( x) - j2( x)|| s = |Я|М (b - a')p(j1,j2).
Перепишем данное неравенство в следующем виде:
р(Аф, АФ2) < 11м (Ь - а)р(ф1,ф2), (14)
I -1 < 1 _
откуда видно, что при |-| < ^ф - а) оператор А
будет сжимающим.
Из принципа сжатых отображений заключаем, что для любого 1 такого, что
—|М(Ь - а) < 1, (15)
уравнение Фредгольма в векторной форме (7) с непрерывным ядром К(х, у) и непрерывным свободным членом ц(у) имеет единственное решение. С другой стороны, из уравнения (9) следует, что
Il M (b - a) < 1-
û (b - a)max
x, y
a12F ( x, y ) b12F ( x y)
b a11 Jf( x, y )dx è a b b^22 Jf ( x, y)dy a 0
< 1. (15')
Последовательные приближения j0(y),..., jn (y),... к этому решению определяются из соот-
ношении
Фп+1 (у) = 11К (е, у )Фп (е^е + у (у), п = 0,1,...,
а
где в качестве ф0(у) можно взять любую непрерывную вектор-функцию на [а, Ь]. Данный итерационный процесс является сходящимся к некоторой функции, которая и будет являться решением уравнения (9).
Также можно найти решение, используя резольвенту ядра. Для этого приведём вспомогательные сведения.
Теорема 1. Пусть А - линейный ограниченный оператор, отображающий банахово пространство Е в себя, и ||А|| < q < 1. Тогда оператор (I + А),
где I - единичный оператор, имеет обратный линейный ограниченный оператор.
Доказательство теоремы можно найти, например в работе [6]. В результате получим, что (I + А )-1 - линейный ограниченный оператор. При этом
(I + Л)-1 = I - А + А2 - А3 +... + (-1)п Ап +... (16) Применим результат теоремы к интегральному уравнению (9). Положим
Aj ° ljK(x,y)j(x)dx
Тогда уравнение (9) перепишем в виде Ф = ІАф +у ^ (I - ІА)ф =у. (17)
Используя приведённую теорему, получаем,
что если ЦА|| < 1, то уравнение (9) имеет единственное решение, которое определяется равенством
Ф = (I -1А )-1у = У +1 Ау +12 А V + ■
+ Х3Я3У +... + 1пАпу +... (18)
Полученный нами ряд называется рядом Неймана.
Выясним, при каких значениях 1ряд (18) сходится. Для этого рассмотрим неравенство
ИА|| < 1. Учитывая изложенный выше результат (8) оценки нормы ядра К, получим условие (15). Далее, будем считать, что выполняется условие (15) для 1. Выясним, что представляют в рассматриваем случае степени оператора А.
Имеем Л y Л(Яу) jK(t,s)
j K (s,T)y(t)dT
ds =
=j
y(t)ds
j K (t, s)K (s,t)dt
a _
b
Обозначим j K (t, s) K (s,t)hds = K2(t,t)h, где вектор
Ъ является пробным вектором из С([а,Ь], И2). Оператор К2({, т) называется повторным ядром, или второй итерацией ядра К({, s).
Следовательно, ЯУ ° jK2(x,y)y(x)dx.
Ана-
логично проделывая процедуру для произволь-нои степени оператора, имеем
b
ЛПУ ° jKn (x, y)y(x)dx,
(19)
a
a
a
58
где Кп(х, у) - п-я итерация ядра К(х, у), опреде-
Ь
ляемая формулой Кп(х,у)И -|К(х,т)Кп-1(т,у)Мт .
а
Заметим, что все итерированные ядра непрерывного ядра К(х, у) также непрерывны.
Решение уравнения (7) запишем в следующем виде:
Ь
ф(у) - ц(у) + К1 (х, у)ц(х)йх +... +
а
Ь
+ Кп(х,у)Ц(х)йх +... (20)
а
Причём, данный ряд сходится равномерно при выполнении условия
—М (Ь - а) < 1 О
û (b - a)max
x,y
a12F( x, y ) \ b12F( x у )
b a11 j® ( x, y)dx è a b b22 Jf ( x, y)dy a 0
< 1.
Запишем полученное решение в более компактной форме. Рассмотрим ряд
К[( х, у) + 1К2(х, у) +... + ХпЛКп (х, у) +... (21)
Этот ряд также равномерно сходится при условии —|М (Ь - а) < 1.
Действительно, предположим, что ||^||х -1 , получим
Ь
||К2(х у^| < Ц|К(х,т)||||К(т,у'Цйт <м2(Ь - а),
а
Ь
|К'з(х,у)\\ <|||К(х,т)||||К2(т,у)\\йт <М\Ь - а)2, и вообще,
\\Кп(х,у)|| < |||К(х,т)||||Кп-,(т,у)||йт <Мп(Ь - а)п-1.
а
Отсюда |1п-1Кп(х,у)|| < |1п-1|М"(Ь - а)п-1 -Мдп-1,
где д - —М(Ь - а) < 1.
Таким образом, члены ряда (21) по абсолютной величине не превосходят членов сходящегося
числового ряда
,откуда следует сходимость
ряда (21). Введём новый оператор Я(х, у, 1):
К(е, у,1) = К1(е, у) + 1К2(е, у) +... + 1п-1Кп (е, у) +.... (22) Умножим обе части на у и, интегрируя ряд почленно, получим
Ь
ф(е) =у(е) +К(е, у,1)у(у)^у. (23)
а
В результате приведённых выкладок пришли к существованию решения задачи (5), при ус-
ловии (b - a)max
a12F ( x, y ) \ b12F( x y)
b a11 j® ( x, y)dx è a b b22 jF (x>y)dy a 0
<1.
Сформулируем данный результат в виде утверждения.
Утверждение 1. Решение задачи (5) при условиях (4) в концепции равновесия Нэша существует и единственно, если выполняются условия:
1 а1Р Ь22 < 0.
2. (b - a)max
x,y
a12F( x, y ) b12F( x У )
b a11 j® ( x, y)dx è a b ¿22 Jf ( x, y)dy a 0
<1.
n=1
Литература
1. Гельфанд И.М. Вариационное исчисление / И.М. Гельфанд, С.В. Фомин. - М., 1961.
2. Гермейер Ю.Б. Введение в теорию исследования операций. - М., 1973.
3. Жариков А.В. О решении задачи управления в концепции теории игр при разной информированности игроков // Материалы девятой региональной конференции по математике «МАК-2006». - Барнаул, 2006.
4. Жариков А.В. О решении частной задачи управления в случае разной информированности субъектов / А.В. Жариков, А.В. Максимов // Известия Алт-ГУ. - 2006. - №4.
5. Колмогоров А.Н. Элементы теории функций и
функционального анализа / А.Н. Колмогоров, С.В. Фомин. - М., 1968.
6. Краснов М.Л. Интегральные уравнения. (Введение в теорию). - М., 1975.
7. Максимов А.В. Многопользовательские информационные системы: основы теории и методы исследования / А.В. Максимов, Н.М. Оскорбин. - Барнаул, 2005.
8. Оуэн Г. Теория игр. - М., 1971.
9. Петросян Л.А. Теория игр / Л.А. Петросян, Н.А. Зенкович, Е.А. Семина. - М., 1998.
10. Полянин А.Д. Справочник по интегральным уравнениям / А.Д. Полянин, А.В. Манжиров. - М., 2003.