УДК 517.977.8 Вестник СПбГУ. Сер. 10, 2008, вып. 1
Ф. Ф. Никитин
ОБ ОБЩЕЙ НЕПОДВИЖНОЙ ТОЧКЕ ОПЕРАТОРОВ ЗНАЧЕНИЯ В ИГРЕ НА ПЕРЕХВАТ
1. Введение. Рассматривается дифференциальная игра на перехват [1]. Опираясь только на свойства операторов значения, которые для частного случая данной игры были описаны ранее в [2], в настоящей работе приводится новое доказательство теоремы о существовании и единственности общей неподвижной точки этих операторов, которая удовлетворяет определенному краевому условию. Доказанная теорема вместе с другими результатами метода программных итераций [1, 3, 4] может быть положена в основу построения теории дифференциальных игр на перехват.
Данная статья примыкает к работе [5], где похожие результаты были получены для иной постановки дифференциальной игры, а именно дифференциальной игры с терминальным функционалом.
2. Постановка задачи. Пусть процесс управления описывается системой
dx
— = f(t,x,u,v) (1)
(t в [to,T], X 6 Rn, u € P G CompR™, v € Q G CompR1) с заданным начальным условием
x(t0) = Х0. (2)
Предположим, что в процессе управления участвуют две стороны, одна из которых распоряжается управлением и и стремится достичь как можно меньшего значения функционала
П(х(-))= min H(t,x(t)),
tS[t.,T}
а другая сторона распоряжается управлением v и стремится достичь как можно большего значения этого функционала. Здесь Я(-) - заданная непрерывная на множестве [to,T] х Rn функция, а х(-) - реализовавшаяся в игре траектория системы (1), удовлетворяющая начальному условию (2).
Будем считать, что функция / в правой части системы (1) непрерывна на [io,^] х RnxPxQ, локальна липшицева по я с константой, не зависящей от и и и, удовлетворяет условию продолжимости решений
||/(i,®,«,«)K А(1 + ||а:||)
и условию седловой точки в маленькой игре
та,хт'т{1, f(t,x,u,v)) = min таx(l, f(t,x,u,v)), (3)
veq UEP иеР VEQ
V(t,x) 6 [t0,T] x Rn, V/ £ Rn.
3. Вспомогательная оценка. Измеримые по Лебегу программные управления и(-) и v(-), при почти всех t принимающие значения соответственно из множеств Р и Q,
© Ф. Ф. Никитин, 2008
будем называть допустимыми. Пусть A(tQ,xo,T) - множество решений задачи Коши (1), (2), соответствующих всевозможным допустимым программным управлениям, а
V = V(t0,x0,T) = {(£,x)\t £ [t0,T],x = x{t),x{-) G A(t0,x0,T)}
- отрезок интегральной воронки системы (1) на сегменте [¿о,?1], исходящий из позиции
Будем говорить, что пара (it*,tu) £ Р х Q является ситуацией равновесия в маленькой игре с параметрами (t»,x„,l) Е [to,T] х Rn х Rn, если
(/,/(£„,z»,и)) ^ {l,f(tt,x,,u,,v*)) ^ (/,/(£»,я*,и,и,)),
Vw е Р, Vv € Q.
При выполнениии условия (3), как известно [6], такая ситуация существует при любом выборе параметров (£*,а;„,/) £ х Rn х R".
В дальнейшем будет использоваться следующая оценка, доказательство которой подобно представленному в [7].
Лемма 1. Пусть (i»,x_),(i»,х+) £ Т>, а (и*,v*) £ Р х Q - ситуация равновесия в маленькой игре с параметрами (t*,X-,l), где I = х+ — Тогда для любых допустимых и(-) и v(-) справедлива оценка
\\x(U +S,U,x+,u',v(-)) +ö,t*,x-,u{-),v*)\\2 ^ (1 + ßS)\\x+ - z_||2 + ф{6)6,
где ß,4>{6) не зависят от позиций (t*,x+),(t*,x-), а также управлений и(-) и v(-), при этом
lim ф{0) = 0.
4. Операторы значения. Пусть (Х>) - пространство равномернонепрерыв-ных на множестве V функций w(-) : V —¥ R, удовлетворяющих условию
w{U,x*) ^ H(U,x„) V(i„,z*) £ V.
Определим на этом пространстве операторы
Ф1 о w(t,,x*) = max maxinfmin{ min Н(т, х(т)), w(t, x(t))\ (4)
te[t.,T] veQ u(-) re[f.,i]
( x(-) = x(-,U,x*,u(-),v) ),
Ф1 о w(t*,x,) = min minsupminj min H(T,x(T)),w(t,x(t))} (5)
i£[i„T]«6P „(.) r€[i.,i]
( x(-) = x(-,t*,xt,u,v{-)) ).
По аналогии с [4] могут быть доказаны следующие утверждения.
Лемма 2. Пространство UCh(D) инвариантно относительно операторов и
Фс+.
Лемма 3. Операторы Ф1 и Ф^ непрерывны на пространстве UC#(£>), в смысле нормы равномерной сходимости.
Лемма 4. При любых начальных приближениях £ ЫСн{Т)) и д+\-) £
ЫСц{р) последовательные приближения
<£п)(-) = фс-°<£п_1)(-), п = 1,2,...,
= П = 1,2,...,
сходятся равномерно на V соответственно к решениям уравнений
<?(•) = <?('), (6)
П°9(-)=9(-), (7)
причем эти решения принадлежат пространству ЫСн{Т>).
Из последней леммы, в частности, следует сходимость последовательных приближений
>>(.) = Ф1о «¿п_1)(0, (8)
w
in)(-) = n°4n_1,(-) (9)
w.
с начальными приближениями соответственно
= maxinf min H(t,x(t,t,,x,,u(-),v)), (10)
t>6í? u(-)í£((.,T]
w+\tt,x*) = minsup min H(t,x(t,tt,x»,u,v(-))). (11)
ueP „(.) te[t.,T]
Более того, справедлива следующая
Лемма 5. Каждое из последовательных приблиоюений (8) ((9)) решения уравнения (6)((7)) с начальным приближением (10)((11)), включая и само это начальное приближение, является решением уравнения (7)((6)), т. е. для любого к
Фс_о w^(-) = (12)
Ф^ О W^'(-) = (13)
Доказательство. Покажем индукцией по к, что для любых (t*,x„) G V, t 6 [í*, Т] и у & Q справедливо неравенство
infmin{ min h{t,x(t)),w^] {t,x(t))} ^ (u,xt) (14)
u(-) 7"G[i«,t]
(x(-) = x(-,t*,x,,u(-),v)).
При /с = 0 имеем
inf min{ min ff(r,i(r)),!i)f(f,i(t))} =
u( ■) re[t.,t]
= infmin{ min Н(т, х(т)), min sup min Н(т, х(т, t, x(t), и', «'(•)))} ^ u(-) re[(.,í] u'ePv.(.) re[t,T]
^ min min{ min Н(т,х'(т)), sup rriin #(т, х(т, t, x (t), u, v'{■)))} = U'EP 1t6[Í,,Í] \'()гф,т] v w ynn
(x'(-) = x(-,t,,x*,u',v))
= minsupmin{ min Н(т,х'(т)), min Я(т, х(т, t, x'(t), u', t/(-)))} ^ те [t.,t] re[í,T]
^ min sup min ff(r,x(T,t*,x,,u', v'(-)))= w+\t*,x*).
Предположим теперь, что неравенство (14) справедливо для к — 1, но тем не менее существуют (t,,x,) G V, t € [t*,T], v € Q такие, что
inf min{ min Я(т, х(т)), ' (£, x(i))} > w+\t*,x*)
u(-) T6[i,,i]
(x(-) = x(-,U,xt,u(-),v)). Воспользавшись определением последовательных приближений (9), заключаем
inf mini min Н(т,х(т)), min minsupmin[ min H(r, x'(r)), (£', x'(t'))] ) >
«(■) lr6[t„,i] t'€[t,T}u'ePv,() rG[i,i'] + JJ
> min min sup min { min H(T,x(T,tt,x,,u',v'(■))), (t' ,x(t' ,t*,x*,u' ,v' (•)))}
t'e[i,,T]u'eiV(.) re[t.,t']
Пусть 6 [£»,T],u'„ G P - значения, при которых реализуются минимумы в правой части последнего неравенства. Тогда имеем
inf min | min Н(т,х(т)), min minsupmini min Н{т, х'(т)), , x'(i'))l I >
«(•) re[t.,t] ce[i,T]«'eP„^ re[t,t'] + J J
> sup min { min H(T,x(T,t*,x,,u't,v' (•))), w+^1\t't,x(t't,tm, x*,u't,v' (•)))} • (15)
Предположим, что t't € [i. T], тогда
inf min { min Я(г, х(т)), sup min [ min #(r, x(r, t, x(t), u'„, «'(•))), u(-) re[t.,t] „<(.) T-e[i,i'.]
sup min { min Я(т, x(r, £», x», и'*, «'(•)))> (t'm, x(i'„, t,, x», «'(•)))} •
„'(.) T6[t,,i'.]
Отсюда получаем
sup min { min Я(т, х(т, i,x(i,£„, x», u't,v),u'„, v'(■))),
-1)>. zfo **>**., </(■)))] } >
> sup min { min Я(т, х(т, t*,xt,u't,v'(■))), (t't, x(t't, i,, x„ г/ (•)))} ■
„'(.) re[t.,ti]
Выше под x(-,t,x(t,tt,x*,u't,v),u't,v'(-)) подразумевается траектория, полученная склейкой двух решений системы (1) на интервалах времени [i»,i] и [£,£*], т. е.
x{-,t,x(t,U,xt,u't,v),u'„v'(-)) =
x(T,U,x»,u't,v), т € [t„t],
Продолжая процесс преобразований, из последнего неравенства имеем supmin{ min Я(г, x(r, i,x(i,t*, ж*, и'„, v'(-)), u't, v'(■))),
„'(.) r6[i.,t'J
W{+ x(t'„ t,x{t,t.,xt,u'„ «'(•)), w',V(-)))]} >
> sup min { min Н(т,х(т,и,х*,и'„у'(■))),w+ «'(•)))}. „-(.) re[t.,ti]
Отсюда же, очевидно, вытекает невозможное неравенство. Пусть теперь t't € [£*,£)> тогда из (15) следует
inf min { min #(т, ж(т)),тт [H(t,x(t)),w+~1'> (t,x(t))] } >
> supmin { min Я(г, x{t,U,x*, u'„,v'(■))), w+~l) {t'„,x(t',, tt,xt, u'„, «'(')))}•
Тогда
infmin{ min Я(т,а;(т)),г<;^'~1)(£,:Е(£))} > il(-) r6[t.,i]
> supmin { min H(T,x(T,tt,,xt,u't,,vl(-))),wi^~l\t'tt,x(t't,t„,x^,u'>t,v'(-)))}. Так как i', G [i,, i), имеем
infminj min Я(г, x(r)), ш!,'-1' (i, a;(i, t», a;(i',), u(-)> v))l >
«(•) T6[i.,t]
> min { min H(T,x(T,t*,x*,u't,v)), (16)
r€[t.,i',]
Если предположить, что минимум в правой части неравенства (16) достигается на первом элементе, то, в силу того, что t't < t, легко получить противоречивое неравенство. Поэтому будем считать, что минимум в правой части (16) достигается на втором элементе, тогда
inf min { min Я(т,аг(т)),ги+~1'(£,ж(г,^>£(0>ы(')>г'))} > w+~1\t'*,x(K>t*,x*,u'*,v))-u(-) r€[t.,t]
Отсюда же
inf min { min H(T,x(T,t't,x(t't,tt,xt,u',,v),u(-),v)), «(•) re[f.,f]
Вводя обозначение
x'„ = x{t't,U,xt, u'„,v), придем к противоречию с индукционным предположением
inf min { min ff(r,a;(r,it,x/»,u(-),u)),w;i|i:_1)(i,a:(i,i»,a;'ï,,u(-),v))} > w(+~l) (t't, x'J. "(■) -i-e [î c, ,Î]
Таким образом, неравенство (14) доказано. Из него же в силу произвольности (i*,a;*) G V, t G [t,,T], v G Q, очевидным образом вытекает, что для любого t ) 0 и любой позиции (i*,x«) G Т> выполняется неравенство
Ф1° w{+](t„x,)^wl+](U,x,). (17)
По аналогии может быть получено неравенство
Из определения оператора (5), очевидно, следует, что для любой позиции (£,, ж») € D и любой функции w(-) € UCh(J)) справедливо неравенство
Ф^ о w{U,xt) ^ w(t*,x*).
Отсюда и из формулы (18) получаем (13). Для доказательства неравенства (12), в силу (17), осталось показать, что для любого к ^ 0 и любой позиции (tt,x,) £ V
Ф1 owf{t„xt) > wf{tt,x,). (19)
Заметим, что из определения оператора Ф1 вытекает, что для произвольной позиции (¿*.ж») S Т> выполнено
° w(t*,x*) ^ min{H(t*,x*),w(t*,x*)}.
Учитывая определение пространства ¿/С#(Г>), получаем требуемое неравенство (19). Лемма доказана.
5. Теорема существования и единственности. Теорема 1. Система уравнений
;\=w{;\ (20) Ф^ о ги(-) = w(-) v '
с краевым условием
w(t,x)\t=T = Н{Т,х) (21)
имеет единственное решение в пространстве UCh{D).
Доказательство. Легко убедиться, что если начальное приближение решения уравнения (6) ((7)) удовлетворяет условию (21), то ему будут удовлетворять и остальные приближения, а значит, и их равномерный предел, т. е. соответствующее решение уравнения (6) ((7)).
Рассмотрим последовательные приближения (8) с начальным приближением (10). Пусть wt(-) = lim w^(-). Тогда имеем
k—> + оо
Ф1 ои>*_ (•) = «;*(■).
Вместе с тем, переходя в равенстве (13) к пределу при к —> +оо, в силу непрерывности оператора Ф+ на пространстве £/С# (Х>), получим
Ф^о «;!(•) ^последовательно, функция w!(•) - решение системы (20). Кроме того, так как начальное приближение (10) удовлетворяет условию (21), то функция к/(•) также удовлетворяет этому условию. Таким образом, существование решения системы уравнений, удовлетворяющего условию (21), доказано. Попутно отметим, что одним из таких решений
является и функция wl(-) = lim - предел последовательных приближений (9)
к—»+оо
с начальным приближением (11). Докажем теперь единственность решения системы уравнений, удовлетворяющего краевому условию (21). Рассмотрим последовательные приближения
(к = 1,2,...)
решений уравнений (6) и (7) с начальными приближениями <?+'(•) € MCh(D),
удовлетворяющими краевому условию (21). Пусть д~{-) = lim д^(-), а <7+(-) =
к—у + оо
lim д+\-)- Как отмечалось выше, функция д-(-) есть решение уравнения (6), а функ-
оо
ция <?+(•) ~ решение уравнения (7), при этом они удовлетворяют условию (21). Поэтому если будет доказано, что
Ы-К <?-(•), (22)
то, в силу произвольности начальных приближений д-\-),д+\-) £ UC{T>), будет доказано также, что любое решение уравнения (7), удовлетворяющее условию (21), не превосходит любого решения уравнения (6), удовлетворяющего тому же условию. Действительно, это следует из того, что в качестве начального приближения решения уравнения (7) ((6)) в принципе можно взять то или иное его решение, удовлетворяющее условию (21). Из этих замечаний вытекает, что если будет доказано неравенство (22), то будет доказано также, что для любых двух решений «/(•),«/'(■) G UCh{D) системы (20) с условием (21) имеет место как неравенство «/(•) ^ w"(-), так и w"(-) ^ w'(-). Иными словами, тем самым будет доказана единственность решения системы уравнений, удовлетворяющего условию (21).
Итак, докажем справедливость неравенства (22). Выберем произвольные (í*, ж*) £ V, е > 0 и натуральное N. Пусть S = (Т - t*)/N и í» = т0 < п < ... < tjv = Т -равномерное разбиение отрезка [£», Г] с шагом S. Возьмем произвольную пару векторов (ul,vl) G PxQ. Тогда, с одной стороны, найдется допустимое программное управление и'(•) такое, что
д["\и,х.) ^ min{ min H(r,xUr)), gíN~1] (п^Цп))} - ~ (23)
7-€[t.,Ti] iV
а с другой - допустимое программное управление i^(-) такое, что
g{+4t.,x.) ^min{ min Я(г,4(г)),9Р(г1,4(г1))} + ^ (24)
r6[t.,Ti] JV
(ж+(0 = x(-,t t,xt,ul,v](-))). С учетом леммы 1 будем иметь
K(n)-sL(Ti)||2í;0(¿)¿ (Ф(6)--» 0). (25)
о—»0+
Пусть теперь (гi2,v2) Е Р Х- Q - ситуация равновесия в маленькой игре с параметрами (ti,®1-(ti),/), где I = 4(ri) — х1_{т\). Тогда по аналогии с (23) и (24) получим
д^-'ЧтихЦп)) 2 min{ min Н(т,х2_(т)),д^~2) {т2,х2_(т2))} - £ (26)
r6[ri,T2] iv
(х2_(-) = х(; п, х1_ (п), u2(-), vi)),
д^ЧтихЦп)) < min{ min Н(т,х2+(т)), д{+М~2) (т2,х2+(т2))} + ^ (27)
rS[ri,r2] iv
(4(0 = а;(-,Г1,ж^(т1 ),u2t,v2(-)))
для некоторых допустимых программных управлений и2(-) и v2(•). При этом, в силу леммы 1 и оценки (25), справедливы неравенства
114Ы -*2-ЫН2 < (1 + /^)Н4Ы -*-ЫН2 + ^ (1 + ßö + 1)Ф(6)6 и, следовательно,
114(72) - х2_(г2)||2 <; [(1 + ßö) + 1]ф{6)6. (28)
Пусть (u3,v3) £ -Р х Q - ситуация равновесия в маленькой игре с параметрами (т2, ж1(т2), I), где I = (т2) — ж1(г2). Подобно тому, как и выше, находим
д{-~2\т2,х2_(т2)) > min{ min Я(т,^(г)),^-3)(тз,®3-(т3))} - ^ (29)
те[т2,т3] iv
(х3_(-)=®(-,г2,4(т2),и3(-),^)), fff"2)(r2,x2+(r2)) iC min{ min Я(т,х3+(т)),5^ ~3)(тз,4Ы)} + ^ (30)
Гб[г2,г3] iV
(4(-) = х(-,т2,х^(т2),ы3,1;3(-))), И4(гз) - Х-Ы\\2 ^ [(1 + ßö)2 + (1 + ßö) + 1]ф(6)6 (31)
для некоторых допустимых программных управлений и^(-) и ?;3(-)- Продолжая аналогичные рассуждения и далее, на последнем шаге описанного процесса получим неравенства
£)(rw_1,xw-1(rJV_1)) ^min{ min Я(т, х^(т)), <£0) (tn, x^(tn))} - ^ (32)
tG[tjv_i,tjv] iv
(xr?(-)=x(;tn-.1,x»-1{tn-i),u?{-),v?)),
b4~Wi)Kmin{ min Я(т, x?(r)), g™ (rN, x»(tn))} + ^ (33)
т6[тлг_1,тл?] iv
(<(■) = X^TN.^-Htn-I),^^ {■))),
\\x%(TN) - x^ (глг)Ц2 < [(1 + ßö)"-1 + ... + (l+ßö) + 1 }ф(0)0. (34)
Обозначим через и ж+(-) траектории системы, исходящие из точки (i*,®*) и со-
впадающие на каждом частичном отрезке разбиения [r^-i, т*] с xt{-) и ж* (•) соответственно. Нетрудно показать, что из оценок, аналогичных (25), (28), (31) и (34), следует
sup ||i_(r)-i+(r)|| ——-Ю. (35)
r6[i,,T] N^ + oo
Из цепочки неравенств, которая начинается с (23), (26), (29) и заканчивается неравенством (32), с учетом того, что тдг = Т и функция д^(-) удовлетворяет условию (21), вытекает неравенство
min Н(т,х-(т)) — е, (36)
а из цепочки неравенств, начинающейся с (24), (27), (30) и заканчивающейся неравенством (33), -
min Н(т,х+(т))+е. (37)
тф.,Т]
Вычитая теперь неравенство (36) из (37), получим
9+\t*,x*) — ^ min Н(т, х+(т)) — min Я(г,ж_(т)) + 2е.
r€[t.,T] r6[t,,T]
Переходя же здесь к пределу по N —> +оо из (35), непрерывности функции Я и компактности V, заключаем
g+(t*,x*) - g-(t*,xt) ^ 2е.
В силу произвольности е > 0 и (t*,x*) € V, отсюда и вытекает неравенство (22). Теорема доказана.
Замечание. Нетрудно видеть, что доказанная теорема фактически утверждает существование и единственность общей неподвижной точки операторов Ф'1 и Ф+, удовлетворяющей краевому условию (21). Следствие. Уравнение
Фс_ощ(.) = Ф;оЦ.) (38)
с краевым условием (21) имеет единственное решение на пространстве ¿/С#(1?).
Доказательство. Для доказательства следствия достаточно показать, что уравнение (38) эквивалентно системе (20).
Из определения оператора Ф^ получаем, что для любой функции w(-) € UCh^P) и позиции (í»,:r») € V справедливо
Ф+ о w(t*
, X*) ^ w(í*, xt).
Вместе с тем из определений оператора Ф1 и пространства UChÍ'D) имеем
Ф1 ° w{U,x„) > mm{H(tt,x*),w(t*,x*)} = w{t,,xt).
Предположим, что функция w(-) € ЫСн^) удовлетворяет системе (20). Тогда из приведенных выше неравенств и самой системы для любой позиции (¿*,ж„) £ V имеем
w(tt,xt) = Ф+ о w(t*,x„) ^ w(U, xt) w(t*,xt) = w(t*,xt),
откуда вытекает, что функция w(-) удовлетворяет уравнению (38). Теперь обратно предположим, что функция w(-) е ЫСн^Р) удовлетворяет уравнению (38). Из тех же неравенств для произвольной позиции (£„,ж») получаем
w(t,,x*) ^ Ф1 о w(t*,xt) = Ф+ о w{t*,x,) ^ w(t*,x,),
откуда и следует справедливость утверждения. Следствие доказано.
Summary
Nikitin F. F. On common fixed point of value operators in interception game.
The value operators for the interception differential game are considered. The new proof of the theorem on existence and uniqueness of a common fixed point of these operators satisfying the boundary condition is presented. This theorem with the other results of programming iteration method allows to construct a new version of the theory of interception differential games.
Литература
1. Субботин А. И., Чепцов А. Г. Оптимизация гарантии в задачах управления. М: Наука, 1981. 288 с.
2. Чистяков С. В. К решению игровых задач преследования // Прикл. математика и механика. 1977. Т. 41, вып. 5. С. 825-832.
3. Ченцов А. Г. Об игровой задаче сближения в заданный момент времени // Матем. сб. 1976. Т. 99, вып. 3. С. 394-420.
4. Чистяков С. В. Операторы значения антагонистических дифференциальных игр. СПб.: С.-Петерб. гос. ун-т, 1999. 62 с.
5. Никитин Ф. Ф., Чистяков С. В. Теорема существования и единственности решения обобщенного уравнения Айзекса-Беллмана // Дифф. уравнения. 2007. Т. 43, вып. 6. С. 743-752.
6. Воробьев Н. Н. Теория игр: Лекции для экономистов-кибернетиков. Л.: Изд-во Ле-нингр. ун-та, 1974. 160 с.
7. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
Статья рекомендована к печати членом редколлегии проф. Л. А. Петросяном.
Статья принята к печати 11 ноября 2007 г.