ТЕОРИЯ УПРАВЛЕНИЯ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 517.934 © С. В. Чистяков
ОПЕРАТОРЫ ЗНАЧЕНИЯ В ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ ИГР
При исследования нерегулярных дифференциальных игр [1-4] возникли функциональные уравнения [5-9], которые обобщают основное уравнение Айзекса [10,11] на случай негладкой функции значения игры (функции Беллмана или потенциала игры). На их основе в компактной форме может быть построена теория дифференциальных игр [12-14], охватывающая исследование вопросов существования и структуры решения антагонистических и бескоалиционных дифференциальных игр, обоснования уравнения Айзекса и известных условий регулярности. Элементы этой теории для позиционной дифференциальной игры сближения в заданный момент времени и освещаются ниже.
Рассмотрим следующую позиционную дифференциальную игру [2]:
Предполагается, что в ней 1-ый игрок распоряжается управлением V , а 2-ой — управлением и, при этом в каждый момент времени оба игрока знают текущую позицию (¿, ж(£)) . Относительно правой части системы (1) считаются выполненными условия, включая и условие седловой точки в маленькой игре, сформулированные в [2].
Пусть О(£*,ж*,Т) С Я х Яп — отрезок интегральной воронки системы (1) на сегменте [¿*,Т] , исходящей из позиции (¿*,ж*) , О С (—го,Т] х Яп — произвольное непустое ограниченное множество такое, что ((¿*,ж*) € О) ^ (О(£*,ж*,Т) С О) , а М(О) — пространство ограниченных функций и> : О ^ Я, наделенное равномерной метрикой р : р(ад/(-),ад//(■)) = ^(¿, ж) — эд^(£, ж)| , и отношением частичного порядка ^: ^(-) ^ ад/;(-) , если и>'(¿, ж) ^ эд/;(£, ж), У(£, ж) € О (здесь и>'(•),-ш//(■) € М(О)). Указанное выше множество О будем называть пространством позиций.
Определим операторы Ф_, Ф+ : М(О) ^ М(О) , полагая, что для любой функции -ш(-) € М(О) значения Ф_ о эд(£*, ж*) и Ф+ о эд(£*,ж*), (¿*, ж*) € О , ее образов Ф_ о -ш(-) и Ф+ о -ш(-) при отображениях Ф_ и Ф+ находятся, соответственно по следующим правилам:
где внутренние операции inf и sup берутся, соответственно, по всем допустимым измеримым по Лебегу программным управлениям u(-) и v(-) . Нетрудно убедиться, что операторы Ф- и Ф+ определены корректно, в частности, отображают пространство M(D) в себя.
Лемма 1. Для любой функции w(-) € M(D)
Ж = f (t, ж, u, v)
(t € R, ж € Rn, u € P € CompRk, v € Q € CompR1),
(1)
x(t*) = ж*,
(2)
H(x(T)) ^ maxmin / minmax V 7 (v) (u) (u) (v)
(H € C(Rn), T ^ t*)
(3)
sup
,T] ~'V /
и
inf
i€[i* ,Т]г. —
Ф- o w(-) ^ w(-), а Ф+ о w(-) ^ w(-).
Лемма 2. Операторы Ф_ и Ф+ сохраняют порядок, то есть Ф_ о ь'(-) ^ Ф_ о ь/;(-) и Ф+ о ь'(-) ^ Ф+ о ь/;(-), если ь'(-) ^ ь"(■) (ь'(•),ад//(■) Є М(В)) .
Пусть иС(В) и Ьір(В) — подпространства пространства М(В) , образованные, соответственно, всеми равномерно непрерывными и липшицевыми на множестве В функциями ь(-) Є М(В) .
Теорема 1. Подпространства иС (В) и Ьір(В) инвариантны относительно операторов Ф_ и Ф+ .
Теорема 2. Операторы Ф_ и Ф+ непрервны на пространстве иС (В) . Более того, на нем они удовлетворяют условию Липшица с постоянной Ь = 1 и не являются сжимающими.
Теорема 3. При любом начальном приближении из подпространства иС (В) последовательные приближения решения уравнения
Ф_ о ь(-) = ь(-) (4)
и, аналогично, уравнения
Ф+ о ь(-) = ь(-) (5)
сходятся равномерно на множестве В к решению этого уравнения, причем соответствующее решение принадлежит подпространству VС (В), а если начальное приближение принадлежит подпространству Ьір(В), то это решение также принадлежит подпространству Ьір(В) .
Теорема 4. На пространстве иС (В) система из двух уравнений (4) и (5) равносильна уравнению
Ф_ о ь(-) = Ф+ о ь(-). (6)
Теорема 5. На подпространстве С 1(В) П иС (В) уравнение (6) 'равносильно урав-
нению Айзекса
/ дь, . ,. . \ дь, .
тахтш ( —— (і, х), ти,х,и,у) } + — (і, ж) = 0.
vєQ и&р\дху 7 >7 ^ 7 7 7 1 / т К !
Рассмотрим последовательные приближения
ь(™)(.) = Ф_ о ь(п_1) (■) (7)
Ч")(-)=Ф+ о ь+"_1)(■) (8)
(п=1,2,...), соответственно решений уравнений (4) и (5) с начальными приближениями
ь(0) (¿*,ж*) = шахіМ #Гж(Т,£*,ж* ,«(•), -и)) (9)
ієО «(•) V у 7 У
ь(0) (¿*,ж*) = тіпіпґ Я^ж(Т, ¿*,ж*,и, -и(-)) ^. (10)
«ЄР і(^)
(0) (0)
Л е м м а 3. ь_) (■),ь+) (■) Є иС (В).
и
и
Лемма 4. Для любого n = 0,1, 2,...
Ф+ о w(n)( ■ )= ■ ), а Ф— о w+n)( ■ )= w+n)( ■ ).
Теорема 6. На подпространстве UC (D) уравнение (6) имеет единственное решение, удовлетворяющее краевому условию
w(t,x) |t=T = H(ж). (11)
Следствие. Единственным решением уравнения (6) с краевым условием (11) является функция значения семейства игр (1)—(3), (t*,x*) € D, при этом и последовательные приближения (7), (9), и последовательные приближения (8), (10), сходятся 'равномерно на множестве D к этой функции.
При выполнении известного условия регулярности в линейной игре сближения в заданный момент времени [2] легко проверить, что функция программного максимина, очевидно, удовлетворяющая условию (11), является неподвижной точкой каждого из операторов Ф- и Ф+ . Поэтому в этой игре она является функцией значения.
Опишем возможную структуру решения игры (1)—(3) в классе позиционных стратегий за одного из игроков. Для определенности опишем ее за 1-го игрока. Учитывая определение оператора Ф- , лемму 3 и теорему 1 запишем равенство (7) в явном виде:
w—)(t*,x*)= max maxinfw—'-1)ft,x(t,t*,x*,«(•),v)^ (12)
te[t*,T] veQ о V 4 ’)
((t*, ж*) € D)
Рассмотрим последовательность {Vn}^Lo позиционных стратегий 1-го игрока, считая, что в ней стратегия V0 каждой позиции (t*, ж*) € D ставит в соответствие один из векторов, реализующих максимум по v € Q правой части (9), а каждая из стратегий Vn, n € N , всякой такой позиции ставит в соответствие один из векторов, реализующих максимум по v € Q в правой части (12).
Пусть a > 0, n € N, k € N U {0}, n > k ,
Dnk(a) = {(t,x) € D|w(n)(t,x) ^ wik)(t,x) + a(n — k)},
cDnk(a) D \ Dnk (a),
и далее пусть
Sn(a) = {Bnn(a) Bnn— 1 (a), • • • , Bn0 (a) },
где
n—1
Bnn(a) = Dnl(a)
l=0
Bnk(a) = ^
n
Bno(a) = P| cDio(a). i=i
Лемма 5. При любых a > 0 и n € N система множеств Xn(a) образует разбиение пространства позиций D .
n \ /k—1 \
П cDik(a) п п Dkl(a) 1, 0 ^ k ^ n — 1, =k+1 / \l=0 /
Таким образом, для любых a > 0 и n € N на множестве D можно определить позиционную стратегию 1-го игрока Vna , считая, что если (t*,x*) € Bnk(a) , то
Vna(t,x) = Vk(t, ж).
Будем говорить ниже, что семейство игр (1)—(3), (^,ж* € D) , имеет универсальное решение, если при любом е > 0 каждый из игроков имеет на пространстве позиций D универсальную е -оптимальную стратегию.
Теорема 7. Каково бы ни было ограниченное пространство позиций D семейство игр (1)—(3), (t*, ж*) € D , имеет универсальное решение, при этом,, в частности, если е > 0 , то при любых n € N и a > 0 таких, что р^^ (•),w+l)) < е/2 и a < e/2n, стратегия Vna является универсальной на множестве D е -оптимальной стратегией 1-го игрока.
Аналогично конструируются универсальные е -оптимальные позиционные стратегии 2-го игрока.
Основы теории бескоалиционных дифференциальных игр, опирающейся на описанные выше результаты, кратко изложены в [12].
Список литературы
1. Красовский Н. Н. Игровые задачи о встрече движений. М.: Наука. 1970. 420 с.
2. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.:Наука. 1974. 456 с.
3. Ченцов А. Г. Об одном примере нерегулярной дифференциальной игры // ПММ. 1976. Т. 40. № 6. С. 1113-1116.
4. Чистяков С. В. Одна дифференциальная игра при фазовых ограничениях // Всесоюзная конференция по оптимальному управлению в механических системах. Тезисы докладов. М. 1974. C. 70-71.
5. Ченцов А. Г. О структуре одной игровой задачи сближения // Докл. АН СССР. 1975. Т. 224. № 6. C. 1272-1275.
6. Ченцов А. Г. Об игровой задаче сближения в заданный момент времени // Мат. сб. 1976. Т. 99. № 3. C. 394-420.
7. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука. 1981. 287 с.
8. Чистяков С. В., Петросян Л. А. Об одном подходе к решению игр преследования // Вестник ЛГУ (сер. мат., мех., астр.). 1977. № 1. вып. 1. C. 77-82.
9. Чистяков С. В. К решению игровых задач преследования // ПММ. 1977. Т. 41. № 5. C. 825832.
10. Чистяков С. В. О функциональных уравнениях в играх сближения в заданный момент времени // ПММ. 1982. Т. 46. № 5. C. 874-877.
11. Айзекс Р. Дифференциальные игры. М.: Мир. 1967. 479 с.
12. Чистяков С. В. О бескоалиционных дифференциальных играх // Докл. АН СССР. 1981. T. 259. № 5. C. 1052-1055.
13. Чистяков С. В. Программные итерации и универсальные е -оптимальные стратегии в позиционной дифференциальной игре // Докл. АН СССР. 1991. T. 319. № 6. C. 1333-1336.
14. Чистяков С. В. Операторы значения антагонистических дифференциальных игр. СПб.: НИИ Химии СПбГУ. 1999. 62 с.
Чистяков Сергей Владимирович Санкт-Петербургский государственный ун-т,
Россия, Санкт-Петербург e-mail: [email protected]