ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
С. Р. АЛЕЕВА
ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ В ЗАДАЧЕ МИНИМИЗАЦИИ РАССТОЯНИЯ С ИНТЕГРАЛЬНЫМ ОГРАНИЧЕНИЕМ
Рассматривается однотипная игра, в которой первый игрок имеет интегральное ограничение на управление, а второй — геометрическое. Цель первого игрока состоит в минимизации расстояния между игроками в фиксированный момент времени р при ограниченном запасе ресурса, цель второго противоположна. Строятся управления игроков, гарантирующие выполнение цели.
Ключевые слова: дифференциальные игры, интегральное ограничение, гарантированный результат.
Введение
Из [1] известно, что линейные задачи управления с фиксированным моментом окончания можно с помощью линейной замены переменных свести к задаче с простым движением. При такой замене переменных дифференциальная игра сводится к виду, когда вектограммы игроков в каждый момент времени гомотетичны одному и тому же выпуклому симметрическому компакту. Такой класс игр называется классом однотипных игр. Решение однотипной задачи с интегральными ограничениями сводится к экстремальной задаче. Область достижимости при интегральных ограничениях нелинейно зависит от потраченного запаса ресурсов. Это обстоятельство может приводить к дополнительным трудностям при построении оптимальных стратегий. В теории позиционных игр реализовавшееся движение понимается как пучок функций, каждая из которых является равномерным пределом некоторой последовательности ломаных при диаметре разбиения, стремящемся к нулю. В данной работе используется это определение реализовавшегося движения. Предлагается алгоритм построения гарантирующих стратегий игроков при начальном положении £0, ^0 и ресурсе, ограниченном величиной ^0. Придерживаясь такой стратегии, первый игрок может сделать расстояние между игроками в конечный момент времени не больше чем цена игры, а второй игрок не меньше чем цена игры. Теоретическое обоснование результата приведено в [2; 3], также для разного вида однотипных игр в [4; 5] решалась задача о минимизации запаса ресурса.
1. Постановка задачи
Игра «мальчик и крокодил» может быть сведена к однотипной игре с фиксированным временем окончания р [1]:
г = —(р — *)и + Ьу; Ь > 0, г,и, V € Ега; ||у|| ^ 1,
/л = — ||и(^)|2, ^ ^ 0. (1)
Стратегией первого игрока является функция вида
и = ^(*)и>(*, г),
здесь эд(*, г) любая функция, удовлетворяющая равенству
||эд(£, г) || = 1.
Функция ^ € Ь2[*,р] неотрицательна, строится в зависимости от начального состояния *0, г0, и удовлетворяет неравенству
Г Р
/ ^2(*)^ ^ ^0-Ло
Стратегия второго игрока — любая функция у(*, г), удовлетворяющая неравенству
1Н*,г)|1 ^ 1-
Рассмотрим задачу, когда цель первого игрока заключается в минимизации расстояния между игроками в конечный момент времени р:
|г(р)|| ^ тт, (2)
при условии осуществления неравенства
Г Р
/ ^2(*) № ^ ^0-Л0
То есть первый игрок минимизирует расстояние между игроками, используя для этого ограниченный ресурс.
2. Аналитическое решение задачи
В гл. 1 [3] в общем виде было доказано, что существует решение ^0(*) задачи
Г Р
С(^0,г0,^0) = 1п£ С*(^0,г0,^(-)), <^(*) ^ 0, / ^2(*)^ ^ ^0, (3)
^(•) Ло
где для нашей задачи (1)
С*(*0,20, ^(-)) = шах{^(*0,^(-)); 1Ы| + /(*0,^(-))},
/р
(ь — (р — г)^(г)) ^
^(*0,^(-)) = тек /Сг^О^
при этом С(*о, 2о, ^о) является ценой игры (1) с целью (2), а функция <^о(£) используется в построении управления, гарантирующего результат. Перейдем к непосредственному построению цены в зависимости от начальных условий £о, 2о, ^0 и времени окончания р.
2.1. Построение цены игры
Ценой игры является минимальное значение следующей величины
С*(^о, 20, <£(•)) = шах< тах ( Ь(р — т) — / (р — г)^(г) I;
<р^ ^ у
Г Р
Н^оН + Ь(р — *о) — (р — г)^(г) ^г
Л0
поэтому от ее вида зависит значение цены при фиксированных начальных условиях.
2.1.1. Случай 1
Пусть
112о | + Ь(р — £о) — / (р — г)^(г) ^г ^ шах ( Ь(р — т) — / (р — г)^(г) ^г ) . (4)
Jto ^т<р V Л /
Тогда задача (3) принимает вид
/*Р ГР
112о| + Ь(р — £о) — / (р — г)^(г) ^г ^ шт, <^(£) ^ 0, / ^2(£) ^ ^ ^о.
•^0 <^о
Решением этой задачи является функция
^ ^(р — (). (5)
Теперь выясним, какие начальные условия характеризуют (4). Предположим,
что максимум в правой части достигается в точке т* € [£о,р], тогда условие (4)
примет вид
/> т *
||2о|| + Ь(р — £о) — / (р — г)^(г) ^г ^ 0. (6)
Возможны следующие случаи.
/р
(р — г)^о(г) ^г имеем
ь2 —Ь + (р — £о)<^о(£о) ^ 0 и при любом 2о и 0 < р — £о ^ 3^о
С(^0,20,^0) = Ц20ІІ + Ь(р - Іо) - ^/у(р - ^о)3. (7)
2. т* = р, так как в противном случае — Ь + (р — £)<^0(£) ^ 0 при любом £ € [£0,р], но Ь > 0.
3. Пусть т* € (£0,р), тогда —Ь + (р — т)<^0(т) = 0 и —Ь + (р — £0)<^0(£0) ^ 0, из данных условий и вида (5) получаем ограничение для начальных значений
Ь2
р — £0 ^ ---. Остается предъявить ограничение для г0. Предположим, что
3^0
2Ь3 , . . 3я0
9^0 — Ь(Р — *>) + Ж
1^01| ^ т;-------Ь(р — £0) + “тз0(р — £0)3- (8)
Ь2
Покажем, что при р — £0 ^ -------- выполнено
3^0
9^- — Ь(р — *0) + 3р0(р — £0)3 > (9)
В самом деле, рассмотрим функцию
3^0 3 г, , 2Ь- ^ 9^0 2 ^
"-(ж) = -т^-х — Ьж +-------, п (ж) = —х — Ь
Ь3 9^0 Ь3
, / Ь2 \ 3^0 Ь6 , Ь2 2Ь3
и п — = -Ьт ■ -тт^ — Ь------------+-----= 0.
\3^0/ Ь3 27^0 3^0 9^0
Следовательно, П(р — £0) > 0 и условие (9) выполнено.
Из (6) следует, что
» Ь(р — т-) — Ь(р — *0) — ./ ^3- (р — т*)3 — (р — £0)3. (10)
(р — *0)
Сделаем замену р — т* = £, при £ € (0,р — £0) введем функцию
91(() = Ь* — Ь(р — *0) — ' 3р0 *3 — (р — *0)3
(р — *0)3 3
д1(£) = Ь — а/т ^^3 ■ *2 = 0-
(р — *0)
С учетом рассматриваемого интервала едиственная точка экстремума удовлетворяет соотношению
*
р — т
\
^ ,(р— *0)3 * „
Ь'/ -Э^Т" ■ т =р
,1„
Так как д1(0) > 0, а д1(р — £0) < 0, то при т* из (11) достигается максимум и
( -*\ - и -*\ и Ь (р— т *)3 — (р— *0)3 _
д1(р — т ) = Ь(р — т ) — Ь(р — *0) — (р — т*)2 ■ 3 =
_ 2и -*\ и 4. ^ , Ь(р— *0)3 _
= 3Ь(р — т ) — Ь(р — *0) + (р — т*)2 =
= 2Ь(р - т•) - Ь(Р - ^О^..
Теперь
2Ь3
2
\3
тах д1(£) = д1 (р — т*) ^ ----------Ь(р — *0) + ~пг(р — *0)
(0,р-*0) 9^0 Ь3
Ь2
для р — *0 > -------- и при выполнении условия (8) будет выполнено (10).
3^0
Поэтому окончательно имеем при
и и 2Ь3 3я2 3 Ь2
|ы| й 9^0— Ь(р — *°) + "ъ3"(р — *0) ■ р — *0 > э^0'
как и в (7),
^0,^0) = ||^0| + Ь(р — *0) — ~(р — *0)3•
2.1.2. Случай 2
Пусть теперь
/*р / /*р
||г0|| + Ь(р — *0) — / (р — г)^(г) ^ тах ( Ь(р — т) — / (р — г)^(г)
Ло *0^т^ V Л
или
II ~ II I
^0
£0|| + Ь(т* — і0) — / (р — г)^(г) ^ 0. (12)
Ло
У нас есть следующие ограничения:
Найдем точку 5 Є
Ь2
р — *0 > о—, (13)
3^0
11^01 < 9^ Ь(р — *0) + -Ь3°(р — *0)3. (14)
Ь2 \
*0, р--------из уравнения
3^0/
Ь
ко || = Ь(р — 5) — Ь(р — ^ + з(р — 5)2 ((р — іо)3 — (р — з)3) • (15)
*
Т
Изучим вопрос о существовании решения уравнения (15) при условиях
Ь2 / Ь2 ]
-— < р — 5 ^ р — *0. Обозначим р — ^ = х € -— ,р — *0
3^0 V 3^0
и рассмотрим функцию
д2(х) = Ьх — Ь(р — *0) + ^ ((р — *0)3 — х3) •
Тогда (15) имеет вид
1Ы1 = д2(х), (16)
//\7 2Ь , 3 Ь 2Ь х3 — (р — *0)3
д2(х) =Ь — ^ (р — *0)3 — 3 = -з------------------
поэтому на рассматриваемом промежутке
( ) ^ 2Ь3 Ь( * ) + 3^2(р — *0)3
д2(х) ^ --------Ь(р — *0) +
9^0 Ь3
эи эт
так как д2(х) убывает
Рассматриваем только Ц20Ц, удовлетворяющие (14), при этом ограничении урав-
/ Ь2
нение (16) имеет единственный корень х € ----,р — *0
\3^0
2Ь3 ) , 3^0(р— *0)3 ( , 0 ,, ,,
от-------Ь(р — *0) +----------------—-до д2(р — *0) = 0, а 11г0|1 находится на этом про-
9^0 Ь3
межутке в силу (14). Следовательно, в = р — х удовлетворяет условиям
Ь2
*0 ^ в<р — — • (17)
3^0
Замечание 1. При г0 = 0 значение в = *0.
Будем искать решение ^0(*) в следующем виде:
(Р—^(р — ^ *0 ^ ^ т*;
^0(*) = { (фщ, 5 < * < т*; (18)
(Р—_ (р — *), т* ^ ^ р.
Замечание 2. При таком выборе <£0(*) выполняется условие (12),
||г0|| + Ь(в — *0) — / (р — г)^(г) ^г = 0.
Ло
Осталось проверить условие (3). Подставим (18) в это ограничение:
Ь2 Г Л* г]г Ь2 ГР
^ / (р — г)2 * + Ь21 (р—^ +(р^ /. (р — г)2 * =
Получаем условие для определения т*:
4Ь2 , 4Ь2 Ь2(р — *0)3 (19)
^0 + г------. (19)
3(р — т *) 3(р — в) 3(р — в)4
4Ь2
Так как в ^ т*, то правая часть в (19) должна быть не меньше чем
3(р — в)
Имеем условие существования ^о(^) в виде (18):
3Мр — в)4 — &2(р — ^о)3 ^ 0. (20)
Замечание 3. При в = £0 и выполнении (13) условие (20) выполняется строго,
Ь2
поэтому (20) выполняется и при других значениях в € ^0,р-------------
|_ 3^о
тт и и 2Ь3 3я2 3 Ь2
Цена игры при Ц^оУ < -------Ь(р — £о) + ~гг(р — £о) и р — ^ > -—:
9^0 о3 3^о
С(^о,2о,^о) = 2 Ь(р — т *). (21)
Таким образом, цена игры вычисляется в зависимости от начальных значений £0,
го, ^о, времени окончания р и имеет либо вид (7), либо (21).
2.2. Гарантирующие стратегии игроков
При условии, что есть начальные условия из областей, запишем полученные решения.
о2
I. Пусть 0 < р — £0 ^ ---, любое го. Тогда
3^о
2о,^о) = ||^о| + Ь(р — ^ — у ^3” (р — ^о)3-
Ь2 2Ь3 3^0
II. При р — *о >^—, 1Ы| -------Ь(р — ^о) + ~гг(Р — *о) имеем
3^0 9^0 Ь3
С(^о,2о,^о) = ||го|| + 6(р - іо) - у/у (р - і0)3.
ттт п Ь2 263 3^о, ч3
III. Если р - іо > о—, 1Ы1 < 9--------------6(р - іо) + -гг(р - іо) , то
3^о 9^о 63
(Р-^2 (р - і) , іо ^ ^ ^ т*;
<^о(і) = { (р-) , 5 < ^ < т*;
(р - і) , г * ^ і ^ р;
2
С(^о,^о,^о) = з6(р - т*),
где т* удовлетворяет условию (19).
Стратегией первого игрока, гарантирующей выполнение цели, является и = <£0(£)эд(г), стратегией второго игрока будет V = и>(г), где
эд(г) = г/||г|| при ||г|| = 0;
эд(г) = в,Ув : ||в|| = 1, при ||г| = 0.
Список литературы
1. Красовский, Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский, А. И. Субботин. — М. : Наука, 1974.
2. Алеева, С. Р. Однотипная игра с интегральным ограничением первого игрока / С. Р. Алеева, В. И. Ухоботов // Вестн. Челяб. гос. ун-та. — 1999. — № 1 (4). — Математика. Механика. Информатика. — С. 16-29.
3. Алеева, С. Р. Моделирование гарантированного результата в задачах управления движением с интегральными ограничениями в условиях воздействия помех : дис. ... канд. физ.-мат. наук / С. Р. Алеева. — Челябинск, 2002. — 145 с.
4. Алеева, С. Р. Дифференциальная игра «мальчик и крокодил» с интегральным ограничением преследователя / С. Р. Алеева ; Челяб. гос. ун-т. — Челябинск, 1999. — 10 с. — Деп. в ВИНИТИ 04.10.99, № 2985-В99.
5. Алеева, С. Р. Об одной дифференциальной игре с интегральным ограничением / С. Р. Алеева // Математика. Механика. Информатика : материалы Всерос. науч. конф., Челябинск, 19-22 сент. 2006 г. / отв. ред. С. В. Матвеев. — Челябинск : Челяб. гос. ун-т, 2007. — С. 7-13.