УДК 519.857
ОБ ОДНОЙ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ С ФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ И С ИНТЕГРАЛЬНОЙ ПЛАТОЙ
Д.В. Гущин
Найдены оптимальные управления в дифференциальной игре, в которой управляемая точка переменного состава осуществляет встречу в заданный момент времени с точкой, управляемое движение которой происходит с ограниченной по величине скоростью.
Ключевые слова: дифференциальная игра, оптимальное управление.
1. Введение
В монографии [1] рассматривается дифференциальная игра «изотропные ракеты», в которой первый игрок управляет ограниченной по величине силой, приложенной к движущейся материальной точке. Второй игрок управляет ограниченной по величине скоростью другой точки. В данной работе первый игрок, управляя реактивной силой точки переменного состава, стремится осуществить встречу со второй точкой в заданный момент времени, расходуя при этом как можно меньше ресурсов.
2. Постановка задачи
Движение точки переменного состава описывается уравнением Мещерского [2, с. 25]
m (t)
x = — C + w-------------, xe Rn,C = const. Считаем, что норма || w || относительной скорости we Rn от-
m(t)
деляющихся частиц является постоянной, а тяга ограничена заданным числом g> 0, т.е. и и m (t)
—1| w ||-£ g. Второй игрок управляет точкой, которая движется с ограниченной скоростью
m(t)
|| y ||£ b. Цель первого игрока заключается в том, чтобы осуществить в заданный момент времени p встречу || y(p) — x(p) ||£ e, (e > 0) и израсходовать как можно меньше топлива.
^ / ч- ^(p — t)2 wm(t) 1 . тг ,
Обозначим z = y — x — (p — t)x — C---, u =-, v = — y. Получим эквивалентную диф-
2 g m(t) b
ференциальную игру
p
Z = —(p — t)gu + bv,|| u ||£ 1,|| v ||£ 1,|| z(p) ||£ e, [ || u(t) || dt ® min . (1)
" u
3. Построение оптимальных управлений
В работе [3] показано, что для дифференциальной игры вида (1) оптимальные управления
2
игроков имеют вид и0((, 2) = Ф0(^(2), V0(t, 2) = ^(2), где w(z) =-- при 2 Ф 0 и любое || ^ ||= 1
II 2 ||
при 2 = 0.
Достаточные условия для нахождения функции (р0(1) из работы [3] для рассматриваемого примера принимают вид
1 при 1 < (У) + Л)(р -1)/, jo(t) = <0 при 1 > (у(0 + Л)(р - t)g, . (2)
"Ф0 е [0,1] при 1 = (У) + Л)(р -1)у.
Здесь число Л> 0 и неубывающая функция ),у(0) = 0 удовлетворяют условиям:
1 Гущин Денис Васильевич - математик учебно-научной лаборатории методов оптимизации и моделирования игровых ситуаций, кафедра теории управления и оптимизации, Челябинский государственный университет.
E-mail: off [email protected]____________________________________________________________________________________________
150 Вестник ЮУрГУ, № 34, 2012
Гущин Д.В.
Об одной дифференциальной игре с фиксированным моментом окончания и с интегральной платой
Г Г
j(b — (p — r)gp(r))dr £ e при to £ t £ p; j(b — (p — r)gp(r))dr +||
zn ||£e;
(3)
r t1
jy(r)(b — (p — r)gPo(r))dr = y(p)e; l J(b — (p — r)g%(r))dr +11.
V 'o
= 0.
Обозначим g(t) = (p — t)b-(p — t) ,G(t) = max g(r). Условия совместности первых двух
2 t£r£p
связей в (3) принимают вид G(t0) £ e,|| z0 ||£ e — g(t0).
Приведем вид функции p0(t) в зависимости от начальных условий || z0 || и t0 < p. e b
Случай 1. Пусть — >—. Разобьем полу-b g
плоскость с координатами t,|| z || на три области (рис. 1).
Если начальное условие (t0,|| z0 ||)e I, то
p0(t) = 0. Если (t0,|| z0 ||)e II, то p0(t) = 1 при
/ ч b e
t0 £ t £ qx, (p0 (t) =----- при qx £ t £ p----и
g( p — t)
b
p0 (t) = 0 при p----£ t £ p. Здесь
b
q\ = p-
( b2
-----II z0 II — g(t0)
2g
Если
Рис. 1
(t0,11 z0 ||)e III, то
p0(t) =1 при t0£ t £ q2,p0(t) =0 при q2£ t £ p, q2 = p—J - (e—1| z0 У— g (t0)).
g
(4)
Ь £
Случай 2. Пусть — > —. Тогда из ус-27 Ь
ловий совместности следует, что начальное состояние принадлежит либо области I, либо области II из рис. 2.
Если (^,|| 20 ||)е I, то ^>0(0 = 0. Если (^,|| 20 ||)е II, то ^>0(0 задается формулой
(4).
Случай 3. Пусть — >£>—. Полу-у Ь 2у
плоскость (^|| 21|) разделим на четыре области (рис. 3).
Если начальное условие (^,|| 20 ||) е I, то ^о(0 = 0. Если (^,|| 20 ||) е II, то
^,(0 =1 при to£t£qз, jo(t) = ,Ъ ^
у( р -1)
при q3 £ t £ p — b и p0(t) = 0 при p — b £ t £ p. Здесь q3 = p — gg
Рис. 2
b
g v
( b2 >
e — ——1| z0 || —g(t0)
2g
. Если
(t0,|| z0 ||) e III, то p(t) = 1 при t0 £ t £ q4, p(t) =
b
b
при q4 £ t £ p-------------, p(t) = 1 при
g( p — t) g
t
0
b
Серия «Математика. Механика. Физика», выпуск 7
151
Краткие сообщения
p- — < t <t, и j0(t) = 0 при t < t < p. Здесь q4 = p - — -
g g \
2 f b2 ^
- T— II^H-g(to) gl 2g
t = p-
V
2 b2
—(£-) . Если (t0,|| z0 ||)e IV, то j0(t) задается формулой (4).
g 2g
Литература
1. Айзекс, Р. Дифференциальные игры / Р. Айзекс. - М.: Мир, 1967. - 479 с.
2. Красовский, Н.Н. Теория управления движением / Н.Н. Красовский. - М.: Наука, 1968. -175 с.
3. Ухоботов, В.И. Однотипные дифференциальные игры с выпуклой интегральной платой / В.И. Ухоботов, Д.В. Гущин // Труды ин-та математики и механики УрО РАН. - 2011. - Т. 17, № 1.- С. 251-258.
Поступила в редакцию 28 сентября 2012 г.
ABOUT ONE DIFFERENTIAL GAME WITH FIXED TIME OF THE TERMINATION AND WITH THE INTEGRATED PRICE
D.V. Gushchin1
Optimal controls are founded in differential games where the controlled point with variable structure meets another point on a fixed time. The controlled movement of the second point has a limited speed.
Keywords: differential game, optimal control.
References
1. Aizeks R. Differentsial'nye igry (Differential Games). Moscow: Mir, 1967. 479 p. (in Russ.).
2. Krasovskii N.N. Teoriia upravleniia dvizheniem (The Theory of Motion Control). Moscow: Nauka, 1968. 175 pp.
3. Ukhobotov V.I., Gushchin D.V. Trudy instituta matematiki i mekhaniki UrO RAN. 2011. Vol. 17, no. 1. pp. 251-258.
и
1 Gushchin Denis Vasilevich is mathematician on optimization methods and modeling of game situation scientific laboratory, Theory of Control and Optimization Department, Chelyabinsk State University.
E-mail: off [email protected]___________________________________________________________________________________________________
152 Вестник ЮУрГУ, № 34, 2012