УДК 519.857
ОБ ОДНОЙ ИГРЕ ИМПУЛЬСНОЙ ВСТРЕЧИ С ТЕРМИНАЛЬНЫМ МНОЖЕСТВОМ В ФОРМЕ КОЛЬЦА
В.И. Ухоботов1, И.В. Изместьев2
Построены оптимальные управления игроков в линейной дифференциальной игре с импульсным управлением.
Ключевые слова: дифференциальная игра; импульсное управление.
1. Введение
Задачи управления механическими системами переменного состава, в которых допускается мгновенное отделение конечного количества массы топлива с постоянной по величине скоростью, сводятся к задачам с импульсным управлением [1, с. 85-87]. Наличие импульсных управлений может приводить к мгновенному изменению фазового состояния системы, поэтому при исследовании дифференциальных игр с импульсными управлениями возникают специфические особенности [2-6].
В данной статье рассмотрена игровая задача импульсной встречи, которая является модификацией игры «изотропные ракеты» [7, с. 139]. Преследователь управляет движением точки переменного состава, выбирая в каждый момент времени реактивную силу. В отдельные моменты времени конечное количество реактивной массы может отделяться с постоянной по величине скоростью. Убегающий движется с ограниченной по величине скоростью. Цель первого игрока заключается в том, чтобы в фиксированный момент времени сделать расстояние между собой и вторым игроком не больше одного заданного числа, но не меньше другого заданного числа. Это условие выделяет в фазовом пространстве игры терминальное множество, которое не является выпуклым. Цель второго игрока противоположна.
2. Постановка задачи
Первый игрок управляет движением точки переменного состава x в пространстве Кn, выбирая в каждый момент времени реактивную силу [1]:
Х1 = x2, dx2 = dU,
где U - управление первого игрока, которое является функцией с ограниченным изменением. Расход ресурсов, затраченных на формирование этого управления на произвольном отрезке [t,T], задается формулой
Т
JII dU (r )|| = sup £ II U {rl+1) - U (r ^
t
где верхняя грань берется по всем разбиениям r отрезка [t,T]. В начальный момент времени t0 зафиксирован запас ресурсов /l(t0) > 0, который не может быть перерасходован в процессе управления.
Второй игрок управляет движением точки, выбирая в каждый момент времени ее скорость, которая ограничена по величине заданным числом b > 0
y = bv, v е Кn, ||v|| < 1.
Цель первого игрока заключается в том, чтобы в фиксированный момент времени p осуществить неравенство £1 < ||x(p) - y(p)|| < £2 . Здесь е2 > £1 > 0 - заданные числа. Цель второго игрока противоположна.
3. Формализация задачи
В переменных z(t) = y(t) - x1 (t) - (p -1)x2 (t) рассматриваемая задача примет вид
dz = -(p -1 )dU + bv, £1 <| z(p)|| <£2. (1)
1 Ухоботов Виктор Иванович - доктор физико-математических наук, профессор, заведующий кафедрой теории управления и оптимизации, Челябинский государственный университет. E-mail: [email protected]
2 Изместьев Игорь Вячеславович - аспирант кафедры теории управления и оптимизации, Челябинский государственный университет. E-mail: [email protected]
Условие не перерасхода запаса ресурсов запишем в виде неравенства и) = и^0) - 11| dU(г) || > 0 .
Управлением второго игрока является произвольная функция vp]X М" ^ М" , удовлетворяющая ограничению \v(t, z)|| < 1.
Управлением первого игрока является функция вида U (t, z) = p(t )u(t, z), где
u :[t0,p]XМ" ^ М" - произвольная функция, удовлетворяющая равенству || u(t,z) ||= 1. При выборе функции <p(t) в отдельные моменты времени осуществляется её коррекция, которая проводится следующим образом. Первый игрок в начальный момент времени выбирает конечный набор моментов коррекций t0 =т0 <Т1 <... <Tq < p . В момент времени т , зная реализовавшееся
состояние || z(t ) ||, ju(Tt), он выбирает абсолютно-непрерывную, неубывающую и неотрицательную функцию p: [т, т+1 ] ^ М и число Ai > 0 такие, что
li(t) = и(Т) - Аг- - Jp(r)dr > 0, т < t <т
i+1.
(2)
Движение, порожденное выбранными управлениями на отрезке [тг- ,тг+1], определим с помощью ломаных. Для этого зафиксируем разбиение:
(о:т
= t(0) < t(1) <... < t(k+1) -
i +1
с диаметром разбиения d(m) = max (t(j+1) -1(j^ ) и построим ломаную [6, с. 75]
0<j<k\ >
(t) = zm(Ti) - (Ai + J(Р - r)p(r)dr)u(Ti,zm(Ti)) + b(t-T)v(T,zm(Ti)), при Ti < t <
(1)
гю(t) = гю^(7')) - [ (р - г)ф(г)dг м(t^), гю(t(^)) + -1(7') )у^^), гю^(^)), при t^) < t < t(7'+1). (3)
,У)
Можно показать, что все ломаные t) удовлетворяют условию Липшица с одной и той же константой. Следовательно, они удовлетворяют условиям теоремы Арцела [8, с. 236]. Под движением z (7) на отрезке [тг- ,Т+1] будем понимать равномерный предел последовательности ломаных ), у которых диаметр разбиения d ((Ок) ^ 0.
4. Формулировка результатов
Определим для t < р, и > 0 следующие функции:
£1 - (и - Ь)(р -1), при и < ^), ^ < t < р,
g(t,l) =
£ + £2 , ч , , p -1
1 2 - (p -1) i- b ln-
2
0, при l>B,(t), Vt,
p - t1
, при i < <f(t), t < t1,
1 У
G(t,i) =
£2 + (i - b)(p -1), при t1 < t < p,
£ + £2 !■ J 71 p - t
—------ + (p -1) i-bln-
, при t2 < t < t1,
£1 +£2
V p -11
+ (p -1)(l - c) - b(t2 -1), при t3 < t < t2
f
(p -1) i- c - b ln
p-t
p-t
при t < t
3,
3 У
T
z
2
ї(і) =
—— + Ь, при і1 < і < р, Р - і
-ГЬ ш Р - і 2(р -і) р - її
с, при і < іс,
,при іс < і < і1, , М(і) =
0, при і1 < і < р,
, 1 Р - і
Ь Іп--------, при і2 < і < і1,
р - і1 с, при і3 < і < і2, р - і
с + Ь Іп--------, при і < і3
Здесь і1 = р -
£2 -£1
іс = р -
£1 +£2
і2 = р -
£1 +£2
e, із = р -
£1 +£2
р - із (е +1), с = Ь
Ґ \
^ ! £1 + £2 1 +Іп——2
£2 - £1 У
V
2Ь 2Ь 2Ь 2Ь
Обозначим К + = (5е К: 5 > 0} . Покажем, что из любого начального состояния (г(?0), ц.(}0)) первый игрок сможет осуществить неравенства (1) тогда и только тогда, когда (2(^0),1(?0)) е Ж ^ гДе
Ж(I) = ((2,1)е К" хК + : 2(1,1) <|| 2||< 0(1,1), 1 > М(I)}. (4)
5. Задача преследования
Обозначим
^(2) =----------- при || 21|> 0 и ^(г) =Чм! :|| ^ ||= 1 при || 21|= 0.
II 2 У
(5)
Теорема 5.1. Пусть начальное состояние 10,2(?0), 1^0) таково, что ^ < t0 < р,
(2^0),1^0))е Ж(?0), тогда существует управление первого игрока, обеспечивающее выполнение неравенств (1) при любом управлении второго игрока.
Доказательство. Случай 1. Пусть || 20||>£2 - Ь(р - ?0). Первый игрок берет и(t,2) = ^(2),
То = іо и ф(і) = 0 при іо < і < р ; До =
У 20 У -£2 р - і0
+ Ь.
Тогда, согласно (4), 1(р) = 1^0) -А0 > 0 , т.е. верно условие (2). Далее, с помощью (5) и определения 11, можно показать, что для любой ломаной (3) выполнено неравенство
£ <|2т(Р)\ <£2. (6)
Случай 2. Пусть £ + Ь(р - t0) <|| 20||<£2 - Ь(р - t0). Первый игрок берет т0 = ?0, А0 = 0 и ф(1) = 0 при 10 < I < р . Тогда 1(р) = 1^0) > 0 и для любой ломаной (3) выполнено неравенство (6).
Случай 3. Пусть || 20 ||< £1 + Ь(р - t0). Первый игрок берет и(t, 2) = -м>(2), т0 = t0 и ф(?) = 0 при
і0 <і < р; Д0 =
£1- У 20 У + Ь р - і0
Как и в случае 1 число А0 удовлетворяет условию (2). Далее, с помощью (5) и определения 11, можно показать, что это управление обеспечивает неравенства (6).
Из (6) следует, что для любого движения 2(1) выполнено условие (1).
*
Лемма 5.1. Пусть заданы моменты времени и < t < р такие, что || 2(и)Ц=а> 0 и
/и(і*) > Ь 1п
р - і*
*
р - і
+ у, где у> 0, тогда на отрезке [7*,t ] существует управление первого игрока,
которое обеспечивает выполнение условий || 2^ ) ||=а, 1 ) >у при любом управлении второго игрока.
Доказательство. Случай 1. Пусть а = 0. Доказательство следует из [6, с. 82-84].
Случай 2. Пусть а > 0. Тогда первый игрок выбирает управление
\ м>(2), при || 21|> а, -- -1
и(і,2) = \ 11 (р(і) = Ь 1п= Ь Г—^ж-.
-н\2), при || 2 ||<а, р - і :р - г
(7)
— і.
Далее, возьмем разбиение О: и = t< t(1) < ... < t(ж+1) = ? такое, что диаметр разбиения а
d(О) < —, и покажем, что для каждой ломаной (3) выполнены неравенства 2Ь
а-2Ьd(О) <|| гО(!) ||< а + 2Ьd(О) при и < t <
Из (5) и (7) следует, что для ломаной (3) выполнены соотношения
(*(1)) = а,, 2^о)м - Ь((1) -1(0))(Ч^0)) - v(t0,^0))),
а - 2Ь^(1) -1(0)) <| | гО (t(1) )||< а < а + 2Ь^(1) -1(0)).
Поэтому, при у = 1 верны неравенства
а-2Ьшах^(к) -1(к-1)) <|| гО^()) ||< а + 2Ьmax(t(к) -1(к-1)). (8)
1<к < у 1<к < у
Предположим, что они выполнены для некоторого у < I. Покажем, что эти неравенства выполнены и для у +1. Обозначим
Тогда (8) примет вид
8 = 2b max(t(к) -1(к-1)) 1<к < j
а - 8 <| | z(tn( j)) ||< а + 8.
1п
Пусть || zn (t(j)) ||> а. Тогда из (3), (5) и (7) следует оценка
а - max{8,2b(t(j+1) -1(j))} <| | zn (t(j+1) )||< а + 8.
Пусть || zn (t(j)) ||< а. Тогда из (3), (5) и (7) следует оценка
а - 8 <| | zn (t(j+1) )||< а + max{8,2b(t(j+4 -1(j))}.
Выполнен шаг индукции, следовательно, система неравенств (8) верна.
Заметим, что max(t(к+1) -1(к)) < d(П) при j = 0, m. Следовательно, при d(П) ^ 0 получим,
0<к <j
что для любого движения z(t) при t* < t < t* будет выполнено равенство 11 z(t) 11= а.
Неравенство /lit*) >Y следует из определения функции p(t) в (7).
Теорема 5.2. Пусть начальное состояние t0, z(t0), ^(t0) таково, что
t2 < t0 < t1, (z(t0),^(t0) )e W(t0), тогда существует управление первого игрока, обеспечивающее выполнение включения (z(t1), ^(t1)) е W(t1) при любом управлении второго игрока.
£ ~\~ £
Доказательство. Случай 1. Пусть || z(t0) ||> —-2. Первый игрок берет u(t,z) = w(z), т0 = t0
и ^0 =
2 У z0 У -(£1 +е2)
£ +£2
2(Р - t0)
Случай 2. Пусть 11 2^0) 11< — .
Случай 2.1. Пусть tc < t0 . Первый игрок берет и(^ z) = -м>(z), т0 = t0 и
Д = (£1 + £2) - 2\\z(t0) У
0 2( Р- tо) .
Для случаев 1 и 2.1, согласно (3)-(5), имеем
?1 ,
|| z(tо + 0)||=^р, м^0 + 0) = д -Д0 > \------------^ .
2 t0р -г
Ухоботов В.И., Об одной игре импульсной встречи
Изместьев И.В. с терминальным множеством в форме кольца
Из леммы 5.1 получим, что для состояния 2^0 + 0), ju.it0 + 0) существует управление первого игрока такое, что оно обеспечивает выполнение равенства || 2(^) ||=-1+—2 при любом управлении второго игрока.
Случай 2.2. Пусть t0 < tc . Первый игрок берет и(^ 2) = Уw :|| w ||= 1, Т0 = t0 и А0 = 0.
— + —
Если || 2||< 1 2 при всех t е [t0, tc), то, принимая tc за начальный момент времени, перехо-
дим к случаю 2.1.
~ ~ — + — — + — ~
Если существует t е [t0, t1) такой, что || 2(?) ||> х 2 и || 2(t) ||< х 2 при всех t е[t0, ?), то,
принимая t за начальный момент времени, переходим к случаю 1.
В заключение заметим, что выполнена система неравенств
I — + — I —+——+ —
?^1,М)) = тах < 1 2 2 - и<Л)(Р - Ч), 01 < | 2й) 11= 1 2 2 < 1 2 2 + М)(Р - tl) = С^1 )).
Отсюда имеем заявленное включение (2(^),и(^))е Ж(^).
Теорема 5.3. Пусть начальное состояние t0, 2Іt0), uit0) таково, что t3 < t0 < t2,
(2^0),и^0))е Ж^0), тогда существует управление первого игрока, обеспечивающее выполнение включения (2^2),и^2))е Ж(^) при любом управлении второго игрока.
Доказательство проводится по аналогии с доказательством теоремы 10.1 из работы [6, с. 76]
—1 + —2 при — = 1 ^ 2 .
Теорема 5.4. Пусть начальное состояние t0, 2^0), и(^) таково, что
t0 < ^, (2^0),и^0) )е Ж(^), тогда существует управление первого игрока, обеспечивающее выполнение включения (2^3),и^3))е Ж^3) при любом управлении второго игрока.
Доказательство проводится по аналогии с доказательством теоремы 10.5 из работы [6, с. 82].
6. Задача убегания
Лемма 6.1. Управление второго игрока у^, 2) = м>(2) обеспечивает при любом управлении
*
первого игрока для любого движения 2^) и для любых моментов времени и < t < р выполнение неравенства
|| 2(Г) ||>|| 2(и) || -(м(и) -и*))(р -1*) + Ь(Г -1*). (9)
Доказательство следует из [6, с. 78-79].
Лемма 6.2. Пусть и < { < р и || 2(/*) ||< g(t*,u(t*)), тогда управление второго игрока , 2) = -м>(2) обеспечивает при любом управлении первого игрока для любого движения 2^)
выполнение неравенства || 2^*) ||< g(^,и(^)).
* * Доказательство. Случай 1. Пусть и, t е [t1, р]. Рассмотрим разбиение отрезка [и, t ] О с
моментами коррекции первого игрока т. Покажем, что, если в некоторый момент времени т1
выполнено неравенство
|| 2(т )||< g (т ,и(Т)), (10)
то при любом 0 < А < и(Т/) выполнено неравенство
|| 2(Т + 0)||< g (т + 0,и(т) -А). (11)
Из уравнения ломаной (3) следует неравенство
11 2(т1 + 0) 11<| 12(Т) 11 +А(Р -Т). (12)
Из (10) и (12), учитывая (4), имеем неравенство
У 2(т, + 0)||< —1 - и(т1)(Р -т) + Ь( Р -т) + А( Р -т) = —1 - (и(т1)- А)( Р -Т) = g (Т + 0, М(т1)- А).
Затем на (т1 ,Т1+1] зафиксируем произвольную непрерывную функцию ), которая удовле-
творяет условию (2) на данном множестве. Далее, доказательство следует из [9, с. 115].
*
Случай 2. Пусть и,t е (^,t1]. Покажем, что из (10) следует (11). В самом деле, из (10) и (12), учитывая (4), получим неравенство
2(т1 + 0)||< 2 (р-Т1) и-Ь 1п
р-т1
\
+ А(р -т}) = g(т} + 0, и(Т) - А).
Р - tl;
Дальнейшее доказательство проводится по аналогии со случаем 1.
Теорема 6.1. Пусть начальное состояние t0,2^0), и^о) таково, что t1 < t0 < р,
(Ф0),М^0))* Ж(to).
1) Если
11 2(to)||> С (to,u(t0)) = —2 + - Ь)(Р - t0) , (13)
тогда управление второго игрока у(^ 2) = ц>(2) обеспечивает выполнение неравенства || 2(р) ||> —2 при любом управлении первого игрока.
2) Если
112^0 )||< g (^ ) = —1 - (иМ - Ь)( Р - ^, (14)
тогда управление второго игрока у(^ 2) = -ц>( 2) обеспечивает выполнение неравенства
11 2(р) 11< —1 при любом управлении первого игрока.
*
Доказательство. 1) Из (9) при и = ^, t = р следует, что
112( Р) 11>112(to) 11 -(U(to) - и( Р))( Р - ^ + Ь( Р - ^.
Из этого неравенства и неравенства (13) получим || 2(р) ||>—2 + и(р)(р-t0) > —2.
2) Из леммы 6.2 при и = ^, { = р и (14) следует, что || 2(р) ||< —1.
Теорема 6.2. Пусть начальное состояние t0, 2^0), и(^) таково, что ^ < t0 < t1,
(2^0),и(^) )й Ж(t0), тогда существует управление второго игрока, обеспечивающее выполнение включения (2(^),и(^))й Ж(^) при любом управлении первого игрока.
Доказательство. Случай 1. Пусть || 2^0)||> С(t0,u(t0)), тогда второй игрок выбирает управление у^, 2) = м>(2). Доказательство проводится по аналогии с доказательством теоремы 10.3 из работы [6, с. 80].
Случай 2. Пусть || 2^0)||< g^0,и^0)), тогда второй игрок выбирает управление у(^ 2) = -^(2). Отсюда и из леммы 6.2 при и = ^, { = ^ следует, что 11 2(^) 11< g(t1 ,и(^1)).
Теорема 6.3. Пусть начальное состояние t0,2(t0), /и^0) таково, что t3 < t0 < t2,
(2(t0),u(t0) )й Ж(t0), тогда управление второго игрока у(^ 2) = ^(2) обеспечивает выполнение
включения (2^2),и^2) )й Ж(t2) при любом управлении первого игрока. Доказательство прово-
дится по аналогии с доказательством теоремы 10.2 из работы [6, стр. 79] при — = —
— + —2
2
Теорема 6.4. Пусть начальное состояние t0, 2^0), и(^) таково, что t0 < t3, (2^0),и0) )й Ж(t0), тогда управление второго игрока у(^ 2) = ^(2) обеспечивает выполнение включения (2^3), u(t3)) ^ Ж(^) при любом управлении первого игрока.
Доказательство проводится по аналогии с доказательством теоремы 10.3. из работы [6, с. 80].
Литература
1. Красовский, Н.Н. Теория управления движением / Н.Н. Красовский. - М.: Наука, 1970. -420 с.
2. Красовский, Н.Н. Об игровой встрече движений с ограничениями на импульсы /
Н.Н. Красовский // Прикл. матем. и мех. - 1968. - Т. 32. - Вып. 2. - С. 177-184.
3. Пожарицкий, Г.К. Импульсное преследование в случае однотипных объектов второго порядка / Г.К. Пожарицкий // Прикл. матем. и мех. - 1966. - Т. 30. - Вып. 5. - С. 897-907.
4. Субботина, Н.Н. Альтернатива для дифференциальной игры сближения-уклонения при ограничениях на импульсы управлений игроков / Н.Н. Субботина, А.Н. Субботин // Прикл. матем. и мех. - 1975. - Т. 39. - Вып. 3. - С. 397-406.
5. Петров, Н.Н. Задача группового преследования в классе импульсных стратегий преследователей / Н.Н. Петров // Известия РАН. Теория и системы управления. - 2009. - № 2. -С. 38-44.
6. Ухоботов, В.И. Метод одномерного проектирования в линейных дифференциальных играх с интегральными ограничениями: учебное пособие / В.И. Ухоботов. - Челябинск: Челяб. гос. унт. - 2005. - 124 с.
7. Айзекс, Р. Дифференциальные игры / Р. Айзекс. - М.: Мир, 1967. - 479 с.
8. Люстерник, Л.А. Элементы функционального анализа / Л.А. Люстерник, В.И. Соболев. -М.: Наука, 1965. - 520 с.
9. Ухоботов, В.И. Однотипная дифференциальная игра с терминальным множеством в форме кольца/ В.И. Ухоботов // Некоторые задачи динамики и управления: сб. научных трудов. - Челябинск: Челяб. гос. ун-т. - 2005. - С. 108-123.
Поступила в редакцию 25 июня 2014 г.
Bulletin of the South Ural State University Series "Mathematics. Mechanics. Physics” __________________________________________________________________2014, vol. 6, no. 3, pp. 53-59
ON A GAME OF IMPULSE MEETING WITH A TERMINAL SET IN THE FORM OF A RING
V.I. Ukhobotov1, I. V. IzmestyeV
Optimum controls for players in a linear differential game with pulse control have been found.
Keywords: differential game; pulse control.
References
1. Krasovskii N.N. Teoriia upravleniia dvizheniem (The Theory of Motion Control). Moscow, Nau-ka Publ., 1970. 420 p. (in Russ.).
2. Krasovskii N.N. Prikladnaya matematika i mekhanika. 1968. Vol. 32. Issue 2. pp. 177-184. (in Russ.).
3. Pozharitskiy G.K. Prikladnaya matematika i mekhanika. 1966. Vol. 30. Issue 5. pp. 897-907. (in Russ.).
4. Subbotina N.N., Subbotin A.N. Prikladnaya matematika i mekhanika. 1975. Vol. 39. Issue 3. pp. 397-406. (in Russ.).
5. Petrov, N.N. Izvestiya RAN. Teoriya i sistemy upravleniya. 2009. no. 2. pp. 38-44. (in Russ.).
6. Ukhobotov V.I. Metod odnomernogo proektirovaniya v lineynykh differentsial'nykh igrakh s in-tegral’nymi ogranicheniyami: uchebnoe posobie (Method of one-dimensional design in linear differential games with integral constraints: study guide). Chelyabinsk, Chelyabinskiy gosudarstvennyy univer-sitet Publ.. 2005. 124 p. (in Russ.).
7. Ajzeks R. Differencial'nye igry (Differential Games). Moscow, Mir, 1967. 479 p. (in Russ.). [Isaacs R. Differential Games. John Wiley and Sons, 1965.]
8. Ljusternik L.A., Sobolev V.I. Jelementy funkcional'nogo analiza (Elements of functional analysis). Moscow, Nauka Publ., 1965. 520 p. (in Russ.).
9. Ukhobotov V.I. Odnotipnaya differentsial'naya igra s terminal'nym mnozhestvom v forme kol'tsa (One-type differential game with a terminal set in the form a ring). Nekotorye zadachi dinamiki i upravleniya: sb. nauchnykh trudov. (Some dynamic and control problems: collection of research papers) Chelyabinsk, Chelyabinskiy gosudarstvennyy universitet Publ.. 2005. pp. 108-123.
Received 25 June 2014
1 Ukhobotov Viktor Ivanovich is Dr. Sc. (Physics and Mathematics), Professor, Head of Theory of Control and Optimization Department, Chelyabinsk State University. E-mail: [email protected]
2 Izmestyev Igor Vyacheslavovich is Post-graduate Student, Theory of Control and Optimization Department, Chelyabinsk State University. E-mail: [email protected]