2005 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА Сер. 10 Вып. 1
ПРОЦЕССЫ УПРАВЛЕНИЯ
УДК 517.978
А. А. Адрианов, С. В. Чистяков ОБ ОДНОМ КЛАССЕ
БЕСКОАЛИЦИОННЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГР С НЕОГРАНИЧЕННОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ
1. Введение. Рассматривается бескоалиционная дифференциальная игра с интегральными выигрышами на бесконечном промежутке времени.
Целью работы является доказательство существования такого процесса (ж(-),и(-)), для которого текущий гарантированный выигрыш*) каждого игрока является неубывающей функцией времени. Значение этого факта, во-первых, состоит в том, что на его основе по аналогии с [1] может быть получено доказательство существования ситуаций £-равновесия в смысле Нэша, а во-вторых - в том, что по аналогии с [2] на нем может быть основан определенный подход к построению кооперативной теории с целью сужения множества равновесных траекторий.
2. Постановка задачи и основньге предположения. Пусть процесс управления описывается системой
бИж
— =/(*, Я, «1,1*2,-..-г"»!») (1)
(£ € х е #п)
с начальным условием
= х0, (2)
а каждый из его участников г = 1,т распоряжается управлением
щ £ Рг € СотрЯк{{)
и оценивает качество этого процесса с помощью функционала
+оо
Я<(«1(-),...,ит(-)1*о,®о) = У^ «!(£),...,ит(£))^, (3)
«о
где ж(£) = ж(£, ¿о^о, их (■),... ,ит(-)) - решение задачи Коши (1), (2) на интервале [:£о,+оо), соответствующее измеримому по Лебегу набору программных управлений = «¿(О € Рг, г = 1,т (такие управления далее будем называть допустимыми).
*) Здесь под текущим гарантированным выигрышем игрока г на момент времени t (в рамках процесса (х(-),и(-))) понимается сумма максиминного выигрыша этого игрока в позиции (4, и выигрыша «накопленного» им к моменту времени £ при реализации процесса (х(-),и(•)). © А. А. Адрианов, С. В. Чистяков, 2005
Сделаем следующие предположения относительно правой части системы (1) и функций Лг(-), г = 1,га:
1°. Функция /(•) непрерывна по совокупности переменных (£, х, щ,..., ит) и локально липшицева по х.
2°. Существует такое А > 0, что
\\?{г,х,и1,и2,... ,ит)\\ ^ А(1 + ||ж||)
для всех £ € Р, х 6 Рп и щ € Р*, г = 1,т. 3°. Для всех í 6 Д и ж € Л™ множество
РЯ (¿, ж) = {(/, /Ц , . . . , кт) € ДП+Ш|/ = /(*, ж, Щ , . . . , ит),
/ц = . .,ит), Щ е Рг, « = 1, т}
является выпуклым.
4°. Каждая из функций г = 1,т непрерывна на декартовом произведении
Я х Рп х Рх х Р2 х ... х Рт.
5°. Для каждого % = 1,т существует интегрируемая на [£о,+оо) функция Сч(-) такая, что выполнено неравенство
для любого t € [¿о? +оо) и всех допустимых программных управлений г^(-), г = 1,т.
Предполагается, что все участники процесса управления в каждый момент времени £, как минимум, располагают точной информацией о текущей позиции (¿,х(£)) системы (1).
В силу того, что участники процесса управления, вообще говоря, по-разному оценивают качество процесса управления, можно говорить о конфликте их интересов и по аналогии с [3] формализовать задачу о его разрешении в виде бескоалиционной дифференциальной игры Г(£о, жо). В связи с этим участников процесса управления будем называть игроками.
3, Вспомогательные факты и формулировка основного утверждения.
Сформулируем необходимые в дальнейшем понятия и факты, относящиеся к антагонистическим дифференциальным играм с интегральными выигрышами на бесконечном промежутке времени [4].
Пусть I = {1,2,..., т} - множество всех игроков; А(Ьо, хо) - множество траекторий (решений) системы (1) на полуинтервале [£о,+оо), которые соответствуют всевозможным, допустимым управлениям и удовлетворяют начальному условию (2);
Б - {(¿,ж)|£ € [£0,+оо), х - х(Ь), х(-) е Л(г0,ж0)}
- интегральная воронка, исходящая из начальной позиции (£о,^о)- Далее наряду с игрой Г(£р,Яо) будем рассматривать семейство игр
Пусть М(Б) - множество всех ограниченных функций и>(-) : Р Р. Выберем произвольное г € / и, следуя [5,6], определим оператор Ф*- : М(И) -»• М{И),
Фг_ оН){и,Х*) =
= вир эир тГ ь^и т£Р1 «ло(-)
ги
г
(4)
((£*, ж*) 6 где точная нижняя грань берется по всевозможным наборам
допустимых программных управлений г/Д-), ] 6 J(i) = I \ {г}, а ж(£) = - решение задачи Коши для системы (1) при постоянном управлении щ и наборе допустимых программных управлений Рассмотрим последовательные приближения
решения уравнения
Фг-ою(-) = ги(-),
выбрав в качестве начального приближения функцию : И —> Л,
+оо
ы\0)(Ь*,хт) = тах т£ / Ъ,1{т,х(т),т,и3и){т))д,т*">
UJ(i){^) У
(5)
(6)
(7)
(здесь х{-) =
Как отмечалось в [4], при сделанных предположениях последовательные приближения (5), как и начальное приближение (7), являются непрерывными функциями на множестве £), при этом имеют место неравенства
Д1)
(п).
(8)
Замечание1. Из определения начального приближения (см. (7)) следует,
что его можно назвать максиминным выигрышем игрока г в классе постоянных стратегий. В свою очередь, из определения оператора следует, что &-тое приближение
г
= вир вир т£
(к-1)
(9)
((£*,ж*) € И) можно назвать максиминным выигрышем игрока г в классе кусочно-постоянных управлений с не более чем к коррекциями управления, осуществляемыми в процессе игры. Точнее, здесь предполагается, что первый момент коррекции управления и постоянное управление на промежутке до этого момента определяются в начальный момент времени, а каждый из следующих моментов коррекции управления и скорректированное, постоянное управление до очередного момента коррекции - в предшествующий момент коррекции на основе доступной игроку информации о «ходе» процесса управления в этот момент времени. Описанный закон управления, следуя
*)При сделанных выше предположениях из теоремы о непрерывной зависимости решения системы дифференциальных уравнений от параметров и теоремы о непрерывной зависимости от параметров интеграла следует, что максимум по щ 6 Р{ в (7) действительно достигается.
[3], назовем рекурсивной стратегией игрока г с не более чем к моментами коррекции управления.
Лемма 1. Операции супремума в правой части равенства (9) можно заменить на операции максимума.
Доказательство. В силу компактности множеств Р», г = 1, т, непрерывности последовательных приближений (5), теоремы о непрерывной зависимости решения системы дифференциальных уравнений от параметров и теоремы о непрерывной зависимости интеграла от параметра нетрудно убедиться, что операцию супремума по щ Е Р* в (9) можно заменить на операцию максимума. Покажем, что операцию супремума по £ ^ £* в (9) также можно заменить на операцию максимума.
Выберем произвольные г е I и к € N. Для доказательства того, что в (9) достигается супремум по £ ^ £», достаточно рассмотреть случай, когда .
т\к)(и,х>) >и)\к~1){и,х*), (10)
поскольку в случае равенства
т(-к)(и,х,)=ю<1к-1){и,х,) (11)
очевидно, что супремум по £ ^ £# в (9) достигается при £ = £*.
Пусть имеет место неравенство (10). Для всех £ е [£*, +оо) положим
<p^(t) = max inf
Ui€Pi UJii)(.)
(fc-i) w) '
f.
(£,z(£)) + j hi{T,x{T),Ui, иj^t))^
(12)
Используя исходные предположения и, в частности, предположение 5° (см. п. 2), нетрудно убедиться, что
lim ip{k\t) = wf)(t*,x+) (13)
t-Я-оо 1 ' 1
и функция <р\к\-) непрерывна на [£*, +оо). Из ее определения следует также, что
w\k)(U,x*) = suv<p\k\t). t^u
Поэтому
1) ^ w\k\t*,x*) для любого £ ^ £»;
2) для любого £ > 0 существует такое te ^ £*, что
. . lp(jk\t£)>w\k)(U,x.)-e.
Положим е = ^ (п € N) и £n = £e|e_j_. Рассмотрим последовательность {£n}^Li- Для нее справедливы неравенства
tp(ik)(tn)>w(ik)(tt,x,)-^, пв N.
Покажем, что эта последовательность ограничена. Действительно, в противном случае найдется такая ее подпоследовательность {£nP}^=i> что tnp -> +оо при р оо. Но
тогда, учитывая непрерывность функции ipf} (£) и переходя в неравенстве
, Ре N,
пр
к пределу при р оо, с учетом равенства (13) получим В свою очередь, отсюда и из (8) вытекает неравенство
которое противоречит (10). Таким образом, последовательность действительно
ограничена. А тогда из нее можно выделить сходящуюся подпоследовательность: £П5 —► при этом ясно, что £* ^ < +оо. Переходя к пределу при в —оо в
в—»оо
неравенстве
I ть8
получим неравенство
Следовательно, функция на полуоси [¿о, +оо) достигает своей точной верхней
грани в точке при этом
^(¿)=и}\к)(и,х*). (14)
Остается заметить, что £'>£*, так как в противном случае из (12) и (14) следует, что имеет место равенство (11), которое противоречит неравенству (10). Лемма доказана.
Как установлено в [4], последовательные приближения (5) с начальным приближением (7) сходятся равномерно на множестве Б к решению уравнения (6). Обозначим это решение через.«¿(-) (его можно назвать функцией максиминного выигрыша или потенциалом игрока г в классе рекурсивных стратегий).
Теорема 1. Для любой позиции (£о> ^о) € В существует такой набор допустимых управлений и(-) — («!(•),... ,ит(-)), что каждая из функций
г
¥>г(*) = ^(¿,ж(£)) + J Н{(т,х(т),и(т))(1т, г е I «о
(х(-) = х(-,Ьо,хо,«(•))), является неубывающей на интервале [£о,+оо).
Следствие. Существует такой набор допустимых управлений и{-) = (щ(•),-• •,%(•))> что
+оо
ы(г,х(г)) ^ J 1ц{т,х(т),и1(т),...,ит{т))(1т
I
(где х(-) = х(-,^,хо,«(•))) для всех г е I и £ € [¿о,+оо).
Для доказательства теоремы 1 сформулируем и докажем несколько вспомогательных утверждений.
Лемма 2. Для любой позиции (£*, ж*) € В существует такой набор допустимых управлений и(-) .= (их(•)?•••>^т(-)), что для всех г е I и т € [£*,+оо) выполнены неравенства
Т
ю\0)(т,х(т)) + У /I<(«,*(«),и(«))А ^ ю\0)(и,х*), (15)
(ж(-) = х(-,и,х*,и(-))).
Доказательство. В качестве искомого набора управлений возьмем набор и(-) = ) постоянных управлений, где каждый из векторов и<0) € (г € I) доставляет максимум в правой части равенства (7). Тогда, полагая х(£) = £*, ж*, г4°\..., «т ), при любом г 6 I и г 6 [£*, +оо) будем иметь
(о)
w) '
(т,х(т)) + J hi(t,x(t),u{°\...,u№)dt =
t.
+оо
+
max inf / hi(t,x{t,T}x(r),Ui,ujU)(-)),Ui,uj{i)(-))dt
Ui€Pi uj(i){ ) J т
T
+ J hi{t,x{t),uf\...MS!)dt^ t♦
+oo r
r
+oo
inf / /lii^x^i^x^ii^^jQjiOJ^^^uj^i-))^ = wl0)(t*,xt). J(i)( ) J t,
Отсюда и вытекает справедливость неравенств (15). Лемма доказана.
Лемма 3. Для любых г £ /, /г € N u (i*,x*) G D существуют управление = u\k\tm,x*) € Pi и момент времени t\k^ = £ (£*,+оо) такие, что независимо
от выбора набора допустимых программных управлений и j(¿) (•) для любого т £ [£*, справедливо неравенство
Т
w\k)(r,x^(r)) + J b(t,xW(t),u\k\uj(i)U)dt ^ «^(t*.®.), (16)
t.
где £<*>(•) = xi-it^x^u^iuj^i-)).
Доказательство. Выберем произвольные г £ I, к £ N и (£*,ж*) £ D. По лемме 1
w\k\tm,x*) = max max inf (t,x(t,u,x^,ui,uju)(-))) +
t^t. иг Git Wj(i)(-)
t
+ J hi(T,x(T,tm,x^,Ui,uj^(-)),Ui,uj(i)(-))dT]. (17)
t.
Пусть t* - та точка, на которой достигаются максимум по t ^ i* в правой части равенства (17). Возможны два случая: 1) t* > t* и 2) t* = t*.
Сначала рассмотрим первый случай. Положив t\k^ = t*, будем иметь
«^(t^ar.) = max inf [w\k~1\t\k\x{t\k) ,U,x*,uhuJ(i){-))) +
Ui£Pi UJ(i)(-)
tf>
+ J hi(T,x(T,t*,x+,Ui,uj(i){-)),Ui,uj(i)(-))dT}. t. ■
Пусть - точка, на которой достигается максимум по щ е Pi в правой части этого равенства. Покажем, что для произвольного набора допустимых программных управлений u'J(i)(') и траектории
xW(-)=x(.,U,x„u\k\u'J{i)(-))
справедливо неравенство (16) при всех г € [¿*,
Допустим противное. Тогда найдется такое т' € что
г' t.
Используя это неравенство и равенство (17), получим
г'
w\k)(t.,x*)>w\k)(T',x(kHT')) + J hi(t,^kHt),u\k\u'J{i)(-))dt =
и
= max max inf ,x^(r'),ui,ujii\(-))) +
i^r' Ui€Pi itj(i)( ) t
r'
t'
+ J b(t,xW(t)Mk)>«m(-)№> t.
^ inf [wt1\tf\x(t^\T\x^kHr'),uf,uJ{i)(-))) + t\k)
+ J ^(i, r', rr(fc> (r')} , (•)), ,«J(i)(0)rfi] +
r'
r'
и
+ I ,«(т',и{*},(•)),,«^(4,(■)),,(-))Л] +
т'
г'
+ У ^ (*, ж(£, и, я», и\к), и'3{{) (•)), , (•)) А] = г.
«<ь> и
Отсюда вытекает невозможное неравенство (£*,£*) > и, следовательно,
справедливость неравенства (16) при всех г €
Рассмотрим теперь случай, когда точкой максимума по £ ^ в правой части равенства (17) является точка В этом случае из (17) следует, что имеет место равенство
•ш\к){и,х*) =и)\к~1\и,х*).
Пусть I - минимальное из тех в = 0,1,..., /г - 1, для которых имеет место равенство = (£♦,£*). Заметим, что в случае / 6 [1 : А: — 1] в правой части равенства
4
и
максимум по £ ^ ¿* достигается разве лишь в точке £ > так как в противном случае имело бы место равенство = (£*,£*), а следовательно, и равенство ю\к\и,х*) = (£*,£*), которое противоречит выбору I. Поэтому, а также с учетом леммы 2 получаем, что при любом значении / € [0 : к — 1] существуют такие ^ € (£*, +оо) и € Р{, для которых независимо от выбора произвольного набора допустимых программных управлений для любого т 6 [¿*,имеет место неравенство
т
яи\1)(т,х<1){т)) + I > ь>\1\и,х.), (18)
и
где ж^(-) = Но так как го\к\и,хт)-= то в силу
неравенств (8) и того, что к > /, из (18) вытекает неравенство
г
и
справедливое для любого г £ [£*,Для завершения доказательства остается положить = и\к = и = ж^(£). Лемма доказана.
Пусть А; € N и - множество всех 0 е (£*,+оо), для каждого из которых
существует такой набор допустимых управлений и^(-), что
т
и
для всех г £ I и всех г € [£*,#] (здесь х^(-) = ж(-,£«,а;*,м^(-))).
Лемма 4. Каждое из множеств 6/;(£»,ж») (/г € 14, (£*,ж*) € I)) непусто.
Доказательство. Выберем произвольные /г е N и (£*,£#)€! £). Пусть и^ = и\к\и,х*) £ Р{ и = ¿к\и,х*) £ (£*,+оо) (г € /) такие, как в лемме 3. Положим =
и покажем, что в№ £ ©&(£*, х*)-
В качестве набора управлений, фигурирующего в определении множества ©&(£*, ж* )> возьмем набор постоянных на полуоси [£*,+оо) управлений (и[к\... По лемме 3 для этого набора и порождаемой им траектории в позиции (£„,,ж»), при любых г € / и г е [£#,0^] справедливо неравенство (16). Следовательно, 0^ £ 0/ь(£*,х*)-Лемма доказана.
Лемма 5. Пусть последовательность траекторий {ж*(-)} системы (1) (хк(•) = х(-,Ьо,хо,ик(-))) сходится равномерно на отрезке [¿о,?1] к некоторой траектории х*(-). Тогда существуют такая подпоследовательность (и*^-)} последовательности {«*(•)} (ик(•) = («*(•),...,и такой набор допустимых управлений и*{-) = (и*(-),..., и!^(-)), х*(-) = х(-,^,хо,и*(-)), что каждая из функциональных последовательностей ® ^ I-
г
= / /1г(т,^(т),^(т))сгг, £ € [£о,Г],
¿0
сходится равномерно на отрезке [¿о,^] к функции у*(-), i £ I:
г
у*(£) = I Иг{т,х*(т),и*(т))(1т, £<=[£„,Т].
«о
Доказательство. Для каждого г = 1,т рассмотрим последовательность {»?(•)}:
г
= IЫ(т,хк(т),ик(т))с1т, £ € [£0,Т].
¿о
Покажем, что каждая из последовательностей {у*(-)}> г = 1, "г, является равномерно ограниченной и равностепенно непрерывной на отрезке [¿о, Г]. Действительно, в силу предположения 5°, для любого £ £ [£о,Г] справедливы неравенства
г
|у?(£)| ^ IСг(т)с1т, г € 7, * 6 N.
¿о
Поскольку каждая из функций G{(-), г = 1 ,т, интегрируема на [¿о,+оо), то из последних неравенств следует, что: а) каждая из последовательностей {yf(-)}> i 1,т, равномерно ограничена на [ío,?1] и б) существует такая постоянная С > 0, что
для любых £', t" € [to,T], и, следовательно, каждая из последовательностей {ук(•)}, г = 1,ш, равностепенно непрерывна на отрезке [ío,^1]-
Таким образом [7], каждая из последовательностей {yf{-)}, i = 1 ,m, содержит равномерно сходящуюся на отрезке [í0> подпоследовательность {укз (•)}, г = 1,ш. Для каждого г = 1,т обозначим через у*(-) равномерный предел последовательности {!/?*(■» на отрезке [t0,T].
Рассмотрим последовательность вектор-функций где
*к'(•) = (®í- (О,...,(•),vi-(•), • • •,y¡r(•)), 5 6 N.
Из определения функций хка(-) и ук"{-), г = 1 , m, s G N, следует, что каждая из функций zk'(-) удовлетворяет векторному дифференциальному уравнению
г = p(í,2,wb...,um) (19)
(г = (x,yi,...,ym), д(-) = (/(•), Лх (■),... ,Лт(0)) с начальными условиями
2(¿o) = Z0, z0 = (хо,0,... ,0).
Поскольку последовательности {хкя (■)}, {2/*а (•)}» • • • > {Ут (')} являются равномерно ограниченными, равностепенно непрерывными и равномерно сходящимися на отрезке [to,T], нетрудно показать, что последовательность zks (•) траекторий системы (19) тоже обладает этими свойствами, причем ее предельная на отрезке [¿о, Т] функция имеет вид
z(-) = (xl(-),...,x*n(-),y*l(-),...,y*rn(-)).
Кроме того, нетрудно показать, что каждая из функций последовательности zk'(-) удовлетворяет условию Липшица на отрезке с одной и той же константой Лип-
шица. Следовательно, этому условию на [¿о, Т] удовлетворяет и функция z(-), а тогда [7] при почти всех t G [to,T] существует производная z(t). При сделанных ранее предположениях следует, что существует набор допустимых управлений и*(-) = (м*(-),..., такой, что
¿(i) =g(t,z(t),u*(t))
при почти всех t € [to,T] (см. леммы 3.3 и 3.4 в [8, с. 93, 94]). В частности, это означает, что каждая из функций у*(•), i = 1 ,m, при почти всех t е [to,T] удовлетворяет уравнению
yi = hi{t,x*(t),u*{t))
с начальным условием ?/¿(¿o) = 0. Следовательно, для каждого г = 1,ш
t
V*i(t) = J Ы(т,х*(т),и*(т))(1т, t € [¿о,Г].
to
Лемма доказана.
Лемма 6. Каждое из множеств (к £ (¿*,ж*) 6 2Э) неограничено
сверху.
Доказательство. Выберем произвольные к £ N и (£*,ж«,) 6 И и покажем, что эир ©Лг(£*, ж*) = +оо.
Допустим противное. Пусть эир ©&(£*, ж») = в < +оо. Это означает, что существует неубывающая последовательность (в8 £ ©£(£*, ж*), в 6 К) такая, что в8 —> в,
з—*оо
при этом для любого ее N существует набор допустимых управлений и8(-) такой, что
г
ю\к)(т,х8{т)) + I Ы{1,х8{1),и8{1))(11 > и
(ж8(-) = ж(-,г*,ж„,ив(-)))
при всех г 6 I и г €
Рассмотрим последовательность на отрезке [£*,Пусть А(и,в8,ж*) -
множество траекторий системы (1) на отрезке [£*,#«], которые удовлетворяют начальному условию ж(£») = ж* и порождаются всевозможными допустимыми программными управлениями. При сделанных предположениях множество А(£*,01,ж*) компактно в топологии равномерной сходимости. Следовательно, из последовательности можно выделить подпоследовательность {ж1р(-)}р^, равномерно сходящуюся на отрезке к некоторой траектории ж1(-) £ х,жФ). По лемме 5 существует набор допустимых управлений й1(-) = (й\(■),... порождающий траекторию ж1(-) такой, что
г
для всех г £ I и т £ [£*,#1].
Рассмотрим теперь подпоследовательность {ж1р(-)}р^ последовательности {жв(-)} на отрезке [£*,0г] Э [£», #1]. Рассуждая как и выше, заключаем, что из нее можно выделить подпоследовательность {ж2р(-)}р^, равномерно сходящуюся на этом отрезке к некоторой траектории ж2(-) £ А(и,в2,ж*), при этом
т
ю\к){т,х2(т)) +1 ы&х2(г),й2(г))М2п\к)(и,хт)
для всех г б / иг 6 Очевидно, функция ж1(-) - сужение функции ж2(-) на
отрезок [£*,#1].
Рассуждая так и далее, в итоге приходим к выводу, что существует последовательность траекторий {ж* ж®(-) € А(и,в3,ж») такая, что
т
т\к){т,х3{т)) + I ^(£,ж*(г),й8(£))<Й ^ т\к){и,х>), Уг € /,Ут € [¿*А],
и ■ .
при этом ж8_1(-) - сужение ж®(-) на отрезок [£»,^-1], в = 2,3,.... _
Определим теперь вектор-функцию ж(-) на полуинтервале [¿#,0), полагая, что
х{1)=х*{1), Щ£[и,ва]{8 = 1, 2,...).
Доопределим ее по непрерывности в точке £ = 9. Тогда, очевидно, будем иметь
г
ю\к)(т,х{т)) + I ЫЦ,х(Ь),й(Ь))<а ^ и)\к)(и,х*), V» € /,Уг 6 [и, 9]. (20)
Следовательно, в € 0*:(£#,ж*)-
По определению множества &к{9, х{9)) (оно по лемме 4 непусто) существуют момент времени 9' > 9 и набор допустимых управлений и'(-) такие, что
т
ю\к){т,х'(т)) + I Ы(г,х'(г),и'(Ь))сИ > ги\к)(9,х(9)) (21)
в
(х'(-) = х(-,9,х(9),и'(-)) € А(в,х(9)))
для всех г € / и г е [9,9'].
Рассмотрим процесс (х(-),й(■)) такой, что
ад-\х'(£), ье[9,п
te[t*,9), чг)-\и'(1), ге[9,9'}.
В силу определения этого процесса и неравенств (20) и (21), имеем
г
• ю[к\т,х(т)) + IЛ*(£, £(£),£(£))<*£ ^ п\к){и,х*) VI € 1,\/т 6 [£*У]. и
Следовательно, е ©*;(£*, я*) и > а это противоречит предположению о том, что £ = вир (£*, ж*). Лемма доказана.
Следствие. Для любого Т > £ о? V/; 6 N существует такой набор допустимых управлений и^ (■), что
ги\к)(г,х^(Ь)) + I Ы(т,хМ(т),иМ(т))с1т > 0,х0) (22)
¿о
<Ьл всеж г € I и £ € [¿о, Г] (здесь ж(А:)(-) = ж(-,£0,ж0,и(А;)(•))).
4. Доказательство теоремы 1. Пусть (£о,жо) £ -О- Выберем произвольное Т > £о. Пусть ~ последовательность тех наборов допустимых управлений
и^(-), для каждого из которых при всех г Е I и £ 6 [£о?Г] выполнены неравенства (22), где = х(-,Ьо,хоТогда, учитывая, что (см. [4])
г>г(£,ж) ^ и}{к){г,х), У(£,х) е Б, Уке К, V® е./,
будем иметь
. «4(*, *<*>(*)) + </?(£) ^ «|{*>(^,хо) (23)
для всех г 6 7, & € N и £ е [£о,Т], где
г
У?(*) = / Мт,*<А>(т),«<*>(т))Ж-.
На отрезке [£о,Т], как и на любом другом конечном отрезке, последовательность является равномерно ограниченной и равностепенно непрерывной. Поэтому, в силу леммы 5, без ущерба общности можно считать, что последовательности и {у£{-)}, г 6 /, сходятся равномерно на [¿о,Т] соответственно к функциям £*(•) и у*{-), г € 7. Поскольку для каждого г € 7 последовательность схо~
дится равномерно на В к функции г^(-) € С{Л) [4], то, переходя в (23) к пределу при к —> оо, получим
0,аг0), *е[£0,Г],ге/. (24)
При этом по лемме 5 найдется такой набор допустимых управлений «*(•) = (г^(-),...,«;(•)), что х*{-) = х(-,£0,ж0,и*(')) и
г
У*(0 = / Мт,ж*(т),и*(т))с*т, £ € [£0,Т],г € I. (25)
*0
Так как позиция (£о,жо) € 7) была выбрана выше произвольно, то из неравенств (24) с учетом (25) следует, что каково бы ни было разбиение
¿0 = £? < < ... < Ц-1 < ц = т, - г;-1 = (г - *,)/«
отрезка [£о,Т], найдется такой набор допустимых управлений £ € [£о,Т], для
которого справедливы неравенства
«о
'Г1
^ «<(*},*}) + I Ы(т,хМ{т),йМ{т))ёт > г € 7,
«о
где = ж(9)(££), г = М, х(9)(0 = х(-,£0,х0,й(9)('))- Для всех « € 7 и д € N положим
«о
Тогда предыдущие неравенства примут вид
^(Ц) > ^(О ^ ^ > г G I. (26)
Поскольку последовательность является равномерно ограниченной и рав-
ностепенно непрерывной на отрезке [£o,î4, то без ущерба общности можно считать [7], что она равномерно сходится на [to,T] к некоторой траектории х(-). А тогда, в силу компактности множества
DT = {{t,x) G D\t G [t0,T]} С D
и равномерной непрерывности на нем функций Vi(-), с учетом леммы 5 можно считать также, что каждая из последовательностей {<£^(-)}> î G /, сходится равномерно на [£0,Т] к функции
t
4>i{t) = Vi{t,x(t)) + j Ы(т,х{т),и(т))(1т, t G [i0,T], to
где û(-) = (ûi (■),..., ûm(-)) - некоторый набор допустимых управлений такой, что х(-) = x(',t0,x0,û(-)).
Покажем теперь, что каждая из функций <fii(-), i G /, является неубывающей на отрезке [£о,Т]. Выберем произвольное г G I и ¿i,Î2 G [to,T], £2 > £i- Покажем, что
(27)
Поскольку функция ipi{-) является равномерно непрерывной на отрезке [to,T], то для произвольно выбранного е > 0 найдется такой номер q' G N, что для всех q ^ q', j = 1,<7, £ G ,%] выполнены неравенства
MtrVwWK*, (28)
Ы*)-пН)\<е- (29)
Далее, в силу равномерной на отрезке [£о,Г] сходимости последовательности к функции 4>i{-), существует номер q" G N такой, что для всех q ^ q"
МЦ)-<р\чЧ4) \<е,3=Ъя- (30)
Заметим также, что для любого q > (Т - £о)/(£г - £1), q G N, найдутся такие натуральные числа что
h e ¿2 € к*1,«;].
Последовательно используя сначала неравенства (28), (30), (26), затем вновь неравенство (30) и, наконец, неравенство (29), для всех q > max{q',q",(T - T0)/(t2 - £1)} будем иметь
4>iih) > ^(¿Г1) "£ > vW1) ~2е >
> <Pi{tg) - 2е > -Зе> <pi(t 1) - 4е.
Отсюда, в частности, следует, что
4>i{h) > <Pi{ti) -4е.
А так как е > 0 ранее было выбрано произвольно, то это доказывает справедливость неравенства (27).
Остается показать, что каждая из функций (fi{-), i е I, не убывает на всем промежутке [to,+oo). С этой целью выберем произвольную возрастающую последовательность Tfc оо (То = £о). Как показано выше, существует такой набор допустимых управлений w1(-) = (ttj(-),..., w^(-)), что каждая из функций
t
vi(t,x1(t))+ J hi{T,x1{T),ul{T))dT, iel,
to
(x1 (■) = x(-,to,xo,wx(-))) является неубывающей на отрезке [to,Ti]. По доказанному выше для позиции (Ti,x1(7i)) е D, рассматриваемой в качестве начальной, существует такой набор допустимых управлений и2(-) = (uf(-),...,u^i')) в ИГРе Г^,®1^)), что каждая из функций
t
Vi{t,x2{t)) + J hi (г, x2 (г), и2 (r))dr, iel,
7i
{x2(•) = x(-, Ti,x1(Ti),u2(-))) является неубывающей на отрезке [Ti,!^]. Рассуждая так и далее, в итоге приходим к выводу - для каждого к е N найдется такой набор допустимых управлений ик(-), что каждая из функций
t
Vi{t,xk{t))+ J hi(т,xk{т),ик(r))dT, iel,
Tfc_j
(где xk(-) = x(-,Tjfc_i,xfc_1(Tfc_i),wfe(-))) - неубывающая на отрезке [T*_i,T*]. А тогда для набора управлений и(-), определенного по правилу
u{t)=uk{t), t е [Tfc_i,Tj.], fc = 1,2,...,
очевидно, что каждая из функций
t
Vi(t,x(t)) + J hi{T,x(r),u(T))dT, iel,
to
(x(-) = x(-,to,xo,u(-))) является неубывающей на [¿о,+оо). Теорема доказана. Summary
Adrianov A. A., Chistyakov S. V. On a class of coalition-free differential games with infinite duration.
A coalition-free m-person differential game with integrated payoffs on infinite time interval is considered. The existence of trajectories along which current guaranteed payoff of each player (that
is amount of maximin payoff of a player in a current position and payoff he accumulates to a current time moment) is not a decreasing function of time is established.
Литература
1. Чистяков С. В. О существовании решения бескоалиционных дифференциальных игр // Управление в динамических системах. - JI., 1979. С. 71-99. - Деп. ВИНИТИ от 24 июля 1979 г., № 2794-79.
2. Чистяков С. В. О построении сильно динамически устойчивых решений кооперативных дифференциальных игр // Вестн. С.-Петерб. ун-та. Сер. 1: Математика, механика, астрономия. 1992. Вып. 1 (№ 1). С. 50-54.
3. Чистяков С. В. О бескоалиционных дифференциальных играх // Докл. АН СССР. 1981. Т. 259, № 5. С. 1052-1055.
4. Никитин Ф. Ф., Чистяков С. В. Об антагонистических дифференциальных играх с неограниченной продолжительностью // Вестн. С.-Петерб. ун-та. Сер. 1: Математика, механика, астрономия. 2004. Вып. 3. С. 38-44.
5. Ченцов А. Г. Об игровой задаче сближения в заданный момент времени // Мат. сб. 1976. Т. 99, вып. 3. С. 394-420.
6. Чистяков С. В. К решению игровых задач преследования // Прикл. математика и механика. 1977. Т. 41, вып. 5. С. 825.
7. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. М., 1972. 496 с.
8. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами / Пер. с англ. М. Г. Бутрим, П. К. Катышева; Под ред. А. Н. Ширяева. М., 1978. 318 с.
Статья поступила в редакцию 21 апреля 2005 г.