УДК517.997.5: 62-501.52
К ЗАДАЧЕ ОПТИМАЛЬНОГО РАСПРЕДЕЛЕНИЯ РЕСУРСА В СИСТЕМЕ НЕЗАВИСИМЫХ ОБЪЕКТОВ УПРАВЛЕНИЯ. II
© 2017 Ю.Н. Горелов
Самарский национальный исследовательский университет имени академика С.П. Королёва
Статья поступила в редакцию 20.12.2017
Рассматриваются задачи оптимального распределения ресурса для системы независимых объектов управления - пары двойных интеграторов, для которой решена задача оптимального управления с учетом ограничений на скорость расхода материального ресурса типа «топлива». Кроме того, для такой системы решены задачи на быстродействие, когда в качестве ресурсов, необходимых для создания управляющих воздействий и дополнительно ограниченных скоростью их расхода, рассматриваются энергетический и материальный ресурсы управления. По результатам решения указанных задач выявлены основные особенности оптимального распределения ресурса управления в зависимости от его вида. Отмечено, что рассмотренные задачи управления также можно отнести к классу смешанных задач по А.М.Летову.
Ключевые слова: ресурс управления, оптимальное распределение ресурса, система независимых объектов управления, двойной интегратор, энергетический и материальный ресурс, оптимальное управление, быстродействие.
Исследование выполнено при поддержке гранта РФФИ (проект № 16-41-630524) и субсидий в рамках исполнения ГЗН (проект № 8.6675.2017/БЧ)
ВВЕДЕНИЕ
В соответствии с концепцией физической теории управления [1] в первой части статьи [2] была дана общая постановка задачи оптимального распределения ресурса управления для системы независимых объектов управления и приведено полное решение этой задачи для пары двойных интеграторов, когда в качестве распределяемого ресурса управления рассматривался энергетический ресурс (в виде «энергии управления»). Там же приведены и общие решения для задач на быстродействие и на минимум «энергии управления» для двойного интегратора в случае задания произвольных граничных условий, что необходимо для выявления закономерностей распределения ресурса определенного вида. Анализ распределения энергетического ресурса (мгновенной мощности) при различных сочетаниях ограничений на управляющие параметры пары двойных интеграторов показал, что при доминировании ограничения на энергетический ресурс его оптимальное распределение характеризуется согласованным в определенной пропорции и полным его расходованием.
Основной целью статьи является полное решение задачи оптимального распределения
Горелов Юрий Николаевич, доктор технических наук, профессор, директор института проблем моделирования и управления (НИИ-310). E-mail: [email protected]
материального (в виде расходов «топлива» [2]) ресурса управления для системы двойных интеграторов. Кроме того, с учетом ограничений на энергетический и материальный ресурсы управления для этой же системы также рассматривается решение задач на быстродействие.
В настоящей части статьи ссылки на соотношения и формулы из [2] будут отмечаться звездочкой, например, (1.1*).
1. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДВОЙНЫМ ИНТЕГРАТОРОМ ПО МИНИМУМУ РАСХОДА «ТОПЛИВА»
1.1. Предваряя решение задачи оптимального распределения материального ресурса -расхода «топлива» - между парой двойных интеграторов, вначале приведем решение задачи оптимального управления (1.6*), (1.7*), (1.9*). В этой задаче требуется найти оптимальное управление, минимизирующее на заданном интервале управления (при Т > Тт;п) функционал Т
3 = || и | йг, (1.1)
о
для двухточечной граничной задачи управления, а именно:
йх^ йх^
dt
= х
2 '
dt
= u;
| u | < m
(1.2)
(1.3)
Xi(0) - Xi0 ; X2(0) " X20 ; Xi(r) - Xif ; X2(Т) - X2f ,
(1.4)
где т - максимально допустимое значение для управляющего воздействия и, а х10, х20 , Х1 у их 2 у - заданные параметры, определяющие цель совершаемого объектом управления (1.2) «маневра» за фиксированное время Т. Функционал (1.1) здесь определяет суммарные затраты расходуемого «топлива» за время управления, а | и (г) | - мгновенную скорость его расхода, необходимую для создания управляющего воздействия и (г) (Vt е [0,Т]).
1.2. Гамильтониан задачи оптимального управления (1.1) - (1.4) имеет вид [3, 4]:
Н = -|и | х2 + ^и , (1.5)
где , ^2 - сопряженные переменные, удовлетворяющие системе уравнений (2.9*):
dVi - 0 ; d^2 _ V
- 0 , ; — — М7 1 '
dt
dt
(1.6)
ü(t) _
0,
-s0 m
t e[ti, 12); t e[t2, T].
(1.9)
Отметим, что параметрами программы (1.8) являются значения ую и у20 , а программы (1.9) - значения ti, 12 и S0 = ± 1.
Интегрируя систему (1.2) с учетом граничных условий (1.4) и программы (1.9), получим:
1) х1(г1) = хи = хю + х20г1 +1 ^ тг1; х2(г1) = х21 = х20 + 50 тг1; 2) х1(г2) = х12 = х11 + х21(г2 - г1) ; х2(г 2) = х22 = х21 ;
3) х1(Т) = х1 у = х12 + х22(Т - г2) - 2So т(Т - г2)2; х2(Т) = х2/ = х22 - Чт (Т - г2) .
Исключая здесь промежуточные значения переменных состояния хц , х12 , х21 и х22 , получим
х2у - х20
11 +12 _ Т
S0 m
(1.10)
а также
х1у = х10 + х20г1 + 2 s0mt1 + + (х20 + «0 т^ХТ - -1 ^ т (Т - г2)2 =
= хю + х20Т - 2 тг2 + ^ тг{Г -2 т (Т-г 2) .(1.11)
С учетом (1.10) из (1.11) можно получить квадратные уравнения относительно ^ или г2 , которые имеют идентичный вид, а именно: первое уравнение будет иметь вид
(
ч -
Т +
Решение системы (1.6) имеет вид
Vi(t) _vi0; v 2О) _V 20 -Vi01;
(Vt e [0, T ]), (1.7)
где Ую, V20 - начальные значения сопряженных переменных.
Из условия максимума гамильтониана задачи H (1.5) по управляющему параметру u получим следующую структуру оптимального управления:
m, v 2(t) >+i; ü(t) _j 0, i <V2(t) <+i; (1.8) -m, V2(t) <-i
В силу линейности функции V2(t) (1.7) программа управления (1.8) в общем случае тогда будет иметь вид
S0m, t e[0, ti);
X2f X20 ^ S0 m
ti +
Xi f Xi0 X20T
S0 m
(X2 f -X20)
_ 0,
(1.12)
2(s0 m)
а второе получается из (1.12), соответственно, при замене ti на 12 .
X2 f - X2
Если обозначить: ti +12 _ a _ T + -
а 12 - ti _ b > 0, то отсюда получим
20
S0 m
i
ti _-
T +
X2 f - X
20
Л
V i f
S0 m
2 ь;
12 _-2 2
t+
X2 f
-X20 Л
¿0 m
J
+1 b, 2
где b _s[D , а D - дискриминант уравнения (1.12), вычисляемый по формуле
D _ Т2 + 2 X2 f - X20 Т — 4(Xi f - Xi0 - X20T) - (X2 f - X20)2
Если П < 0, то задача (1.1) - (1.4) не имеет решения, а при П = 0 - вырождается в задачу на быстродействие, когда ^ = г2, и, соответ-
ственно,
i
ti,2 _-
f
Т ■ +
-'min 1
X2 f
-X20 Л
^m
.Значение
50'" у
^0 определяется из условия П > 0 . Для модельных наборов граничных условий (2.7*) и (2.8*) получим, соответственно: а) для набора (2.7*):
, ( I-77 Л
ti,2 _-
Т + Т --
4 X,
if
S0 m
, где s0 _ sign Xif ;
m
б) для набора (2.8*):
1
1,2 2
(
Т +1 Т2 + 2x20 Т+4х0-
¿0 т
¿0 т
А20 т2
где 50 =- sign (2тх10 + х
20 | Х20 | ), если точка (Хю, Х20) находится в области достижимости начала фазовой плоскости для данного Т > ТтП.
Отметим, что частные случаи реализации программы (1.9) связаны со следующими возможными вариантами выполнения условий: 0 < ¿1 < г2 < Т, а именно:
1) Ч = 0 ; г2 = Т, когда и (г) = 0, V/ е [0, Т];
2) 0 < г1 < г 2 = Т, когда и (г) = 5 0т, V/ е [0, г1) и и(г) = 0, Vt е[0, Т];
3) г1 = 0 ; 0 < г2 < Т, когда и(г) = 0, Vt е [0,г2) и й(г) = 50т , Vt е[г2, Т],
и, наконец, в общем случае, когда в (1.9) выполняются условия 0 < гх < г2 < Т .
2. ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ МАТЕРИАЛЬНОГО РЕСУРСА УПРАВЛЕНИЯ В СИСТЕМЕ НЕЗАВИСИМЫХ ДВУКРАТНЫХ ИНТЕГРАТОРОВ
2.1. Рассмотрим на заданном интервале [0, Т ] двухточечную граничную задачу для системы из двух независимых объектов управления суть двойных интеграторов (3.1*):
йх1 йх2 йУ1 йу2
= х2; — = и, ; — = у2; —- = и2, (2.1)
(2.2)
с граничными условиями общего вида: х 1(0) = х 10 ; х 2 (0) = х20 ;
х1(Т) = х1 / . х 2 (Т) = х 2/ ; ;
у 1(0) = у 10; у 2(0) = у 20; У1(Т) = у1 /; у 2(Т) = у 2 /,
где х10 , х20 , х1 / , х2/ , у10 , у 20 , у1 / , У 2/ - некоторые заданные параметры, определяющие цели парциальных задач управления для (2.1);в
(2.2) Т > тах-Щ,Т™}, где Т^ и Т™ - соответствующие «сепаратные» быстродействия для (2.1). На управляющие параметры в (2.1) накладываются следующие ограничения:
и2 (г) < т2; и2 (г) < т2, VI е [0, Т], (2.3) где т1 и т 2 - максимально возможные уровни управляющих воздействий. Ограничения (2.3) можно рассматривать в виде множеств допустимых управляющих воздействий [2]: и1 = { и 1 е Я :| и 1 | < т 1};
и 2 = { и 2 е Я :| и 2 | < т 2}
Очевидно, что и12 = и1 П и2 - прямоугольник в плоскости О и1 и 2 с центром в ее начале.
Рассмотрим для (2.1) - (2.3) задачу оптимального управления, в которой требуется минимизировать функционал Т
30 =|(а 1| и1| +а 2 | и2|)йг , (2.4)
0
где а1 > 0, а2 > 0 - весовые коэффициенты, определяющие приоритеты расхода ресурса управления (здесь - «топлива»), при дополнительном ограничении на скорость расходования ресурса, а именно:
Л1 | ^(0 | +л2 | и2(г) | <М0, Vt е [0,Т], (2.5)
Управляющие параметры в (2.1) суть управляющие воздействия, которым в плоскости О и1и2 согласно (2.3) отвечает множество их допустимых значений и^ = и П и2 (см. п.3.1 [2]). В (2.4), (2.5) управляющие параметры характеризуют скорости расходования ресурса, то есть ограничения (2.3) и (2.5) здесь имеют различный физический смысл. Соответственно, в (2.5) М 0 - мгновенная максимальная скорость расхода ресурса, а коэффициенты ^ > 1, ^ 2 > 1 учитывают его непроизводительные затраты при формировании управляющих воздействий в (2.1) [2]. Ограничение (2.5) задает множество
иМ = {(и1>и 2) еЯ 2 : I и1 I +П 2 1 и 2 М О),
то есть и М - ромбовидная область в плоскости О ^и 2 с центром в начале и с полудиагоналями, совмещенными с координатными осями и равными М0 / и М0 / ^ 2.
Если им ^ и^2, то ограничение им эффективное, а и 12 - неэффективное, то есть последнее можно исключить из рассмотрения [2]. Если же и^2 ^ им , то исключается им и решение задачи (2.1) - (2.5) в этом случае распадается на отдельные задачи, решение которых рассмотрено в п. 1.2.
В общем случае, при (и12 ииМ )/(и12 ПиМ) #0 ограничения (2.3) и (2.5) эффективные.
2.2. Рассмотрим теперь задачу оптимального управления (2.1) - (2.5), гамильтониан которой имеет вид [3, 4]
Н = -а! | и„ | -а2 | и2 | +^1х2 +
(2.6)
+ ^2и1 + ^3у 2 + ^4и 2 ,
где сопряженные переменные ук, к = 1 2 3 4, удовлетворяют следующей системе уравнений:
йУ = 0 , = -ш •
; т т 1 ;
d dt
= 0;
d у 4 dt
- = -Уз
(2.7)
Для заданных у10, у20, у30 и у 20 можно получить следующие решения (2.7):
у2(t) = у20 -у10 t ; уДО = у40 -у30 t . (2.8)
Очевидно, что в случае U12 с Uм , когда из рассмотрения исключается ограничение (2.5), в соответствии с (1.8) максимум функции H (2.6) доставляется управляющими параметрами, для которых sign {¡i = sign у2 (при | у2 | > а.1) и sign й2 = sign у4 (при | у4 | > а2), или, что то же самое, когда программа оптимального управления имеет вид:
i^1sign у 2(tX ui(t) Н
0,
й 2(t) =
\rn2sign у4(t),
I 0,
1 у 2(t )| >а; 1 у 2(t )| <ai;
1 у4(t)| >а 1 у4(t)| < а2-
(2.9)
Стало быть, если им неэффективно, то программа (2.9) реализует независимое оптимальное управление для соответствующих подсистем в (2.1).
Рассмотрим решение задачи, когда
U
М ^ и12 , то есть когда исключаются ограничения (2.3). В этом случае максимум гамильтониана Н (2.6) по и~1 и и2 должен отыскиваться с учетом только ограничения (2.5). Итак, пусть 0 <£< 1 - доля использования располагаемого ресурса управления (если £ = 0, то, очевидно, и1 = 0 и и 2 = 0). Тогда, исходя из (2.5), введем следующие обозначения:
Р =
Л1 I й1
1 -Р =
Л 2
й-
(2.10)
£М0 М0
где 0 <р< 1 - доля используемого ресурса для создания управляющего воздействия и; соответственно, оставшаяся доля, то есть 1 -р , предназначается для создания и 2. С учетом (2.10) из (2.6) получим
Н = £М0 Гр(| У2 |Л1 +
+ (1 -Р)(| у4 1 -а2)/Л2
+ 2 +узy2 . (2.11)
Введем функцию
К(Р; У 2' У4) = Р (| У 2 1 -а1)/Л1 +
+ (1 -Р)(| У4 1 2)/Л2 , (2.12) и перепишем (2.11) в следующем виде: Н =£М0К(р; У2, У4) + У1х2 +У3У2 . (2.13)
Из условия максимума гамильтониана Н (2.6) по и и и 2 из (2.13) с учетом (2.10) следует, что при любом значении К < 0 должно быть
^ = 0, то есть располагаемый ресурс управления в этом случае не используется и, стало быть, й1 = 0 и й2 = 0. Очевидно, что в данном случае это является следствием выполнения условий: | у2I <а 1; | у4I <а2, то есть когда (у2, у4) е р \дР и (у2,у4) ер \дР,
где ^2 = I V2I Ь у4 GR1 ,
= {(¥2'¥4>: ¥2 G R1; I 2} - мно-
жества (полосы) в плоскости Оу2у4. Если же, к примеру, у2ед^2, а у4 е Р4 \ дР4, то maxK(р; у2,у4) = 0 при р = 1. При Р
этом максимум функции (2.13) достигается при любом 0 1, то есть с учетом (2.10) при | йй 11 = Л1 и й2 = 0. Напротив, если у2 е Р2\дР2 и у4 едР4, то max K(р; у2, у4) = 0 при р = 0 и, соответ-Р
ственно, максимум функции (2.13) также будет достигаться при любом 0 1, то есть здесь й1 = 0 и | й2I = ^Ц / Л 2. Однако, учитывая линейность функций у2^) и у4(t) (2.8), а также требование минимизации функционала (2.4), далее следует принять, что в том случае, когда (у2, у4) е Р24 = Р2 ПУ4, имеет место:
й1 = 0; й 2 = 0.
Рассмотрим далее условия максимума функции (2.13) для следующих сочетаний (у2, у4) : 1) (у2, у4) е Р4 \ ^24 ; 2) (у2, у4) е Р \ *24 ;
3) (У2,у4) еR 2\ Р UPi) = $24.
В первом случае выполняются условия: | у2 |>а 1; | у4 |<а2. Тогда для функции (2.12)
I у2 I -а1
получим: maxK(р; у2,у4) =- при
Р Л1
р = 1, и, стало быть, максимум функции (2.13) достигается при ^ = 1. Поэтому оптимальные значения для управляющих параметров с учетом (2.10) вычисляются так: | й^ = M0/ Л1 и й 2 = 0. Аналогично и для второго случая, в котором | у2 | < а 1; | у4 | > а 2, получим р = 0 ,
^ = 1, а также й = 0 и | й2I = M0 / Л 2. Таким образом, в этих случаях располагаемый ресурс управления используется полностью одним из объектов управления в системе (2.1).
В третьем из указанных выше случаев выполняются условия: | у2I >а 1; | у4I >а 2, то есть для любых 0 <р< 1 здесь K > 0 и, соответственно, максимум этой функции по р будет определяться так:
Г(| у2 1 -а1)/Ль
maxK(р; у2,у4) Н(| | )7 (2.14)
Р I (| у4 1 -а2)/Л2' (2.14)
где Х = Л2(| У2 |-а1)-Л1(| У4 |-а2).
Если Х = 0, то для любого 0 <р< 1 получим
К = (| У2 |-а1)/Л1 = (| У4 |-а2)/Л2 > 0 ,
то есть в (2.13) должно быть ^ = 1. В связи с этим отметим, что здесь в силу допускаемого произвола в выборе р при Х = 0 возможно существование особого оптимального управления [5], если только х(0 = 0, Vt е (г1, г2) с [0, Т]. Последнее имеет место только для специальных наборов У10 , у20, У30, У 40 в (2.8), что возможно при задании соответствующих граничных условий (2.2), поэтому это требует отдельного рассмотрения.
Возвращаясь к анализу условия (2.14), отметим, что при Х = 0 в плоскости Оу2У4 задается соответствующее разбиение области 4*24, в которой имеет место «конкуренция» за использование ресурса управления между подсистемами (2.1). В каждом квадранте ОУ2У4 уравнением х(| У 2 |,| У4 |) = 0 задаются лучи Ь^ , к = 1,2,3,4, с началами в точках (+а1, +а2) (см. рис. 1; нумерация Ьк ведется с положительного квадранта против часовой стрелки).
Они делят ¥24 на соответствующие подобласти, в которых либо Х> 0, либо Х< 0, и вместе с границей д ¥24 задают соответствующую систему «линий переключения». Например, в положительном квадранте ОУ2У4 : Х> 0 в
подобласти ¥24 этого квадранта, примыкающей к области ¥4 ; Х< 0 в остальной ее части, примыкающей к «р2, а угол между лучом Ь1 х(У2, У4) = 0 и осью Оу2 здесь равен Л 2
агС£— (на рис. 1 принято Л2 > Л1; отметим, Л1
что здесь _Ь 111Ь3 и Ь2 ||Ь4).
То же самое имеет место и в остальных квадрантах плоскости Оу2У4, то есть и другие фрагменты ¥24 также следует разделить аналогичным образом. Объединяя полученные
части фрагментов 4*24 с соответствующими фрагментами области (¥> и ¥4 ) \ ¥24, в которых ненулевые значения управляющих параметров имеют одинаковые знаки, тогда получим, что плоскость ОУ2У4 будет разбита на
пять областей, а именно: ¥24; ¥(+); ¥(-) ;
( ) ( ) 2 2
; ¥4~). Соответственно, для ¥24 оптимальные значения управляющих параметров нулевые и ресурс управления не используется, а в остальных случаях ресурс управления используется полностью и при этом оптимальные значения управляющих параметров определяются так: для ^4+) - ¿<1 = М0 / Л1 и и2 = 0;
для ¥4-) - Щ = -М0 / л1 и и2 = 0; для — г?1 = 0 и и2 = М0 / Л2; для ¥2 )
и 2 =-М0/ Л2 .
(+)
щ = 0 и
Рис. 1
Исключая далее из соотношений (2.8) параметр t , получим уравнение прямой в плоскости
Oy2У4 : У30 -у20) - У10(У4 "у40) = 0 ; ее отрезок AB отвечает процессу управления на интервале [0, Т] (см. рис. 1), где точка A имеет координаты (У 20 , У40 ), точка B - (У 2 f, У4 f ),
где У2f =У2(Т) и y4f = y4(T). На рис. 1 положение AB показано в предположении, что координаты точек A и B были получены при решении соответствующей задачи оптимального управления (2.1), (2.2), (2.4), (2.5). Отрезок AB пересекает соответствующие линии переключения в точках р, P2 и P3 ; при этом ÁPj е ,
Рр е ^, P2P3 е Р24 и P3£ е . Данный пример иллюстрирует основную особенность получаемой с учетом (2.14) оптимальной программы ü\(t) и й2(t), характеризуемую попеременным использованием ресурса объектами управления в системе (2.1) при решении соответствующих парциальных задач управления. То же самое справедливо и для иных вариантов расположения отрезка AB, исключая его совмещения с одним из лучей , k = 1,2,3,4, что отвечает случаю %(t) = 0, отмеченному выше в замечании к (2.14).
2.3. Рассмотрим теперь общий случай решения задачи (2.1) - (2.5), когда для параметров ограничений (2.3), (2.5) выполняются следующие условия:
m 1 < M 0 / и/или m 2 < M 0 / л 2;
Л 1m1 + л 2m2 > M0, (2.15)
то есть множество допустимых значений управляющих параметров - выпуклая область U* = U12 П UM является восьми- или шестиугольником, ориентированным осями симметрии по координатным осям в плоскости O üiü 2 и с центром в ее начале. Граница множества U* задается как объединение ее фрагментов [2]: SU* = SU* U U U dU*M ; с учетом условий (2.15) они задаются так:
ди* = {(й1,й2): \üi\=mi,\ü1\<(M0-iiimi)/л};
SU2= {(й1, й2): \ü2|=m2,|üi|<(M 0 -1l2m2)/Л} ; SU*M = {(й1;й2): \й1 j<m1,ju2 \<m2, | \й \ +г|2 \й2 \ =M0}.
При этом SU* = 0, если m 1 >M0 / , и
SU2 =0, если m 2 > M0/л2.
2 «
Для определенности пусть SU* ^ 0 и SU2 ^ 0, то есть когда в (2.15) выполняются все условия. Как установлено в п. 2.2, в случае неэффективности ограничения (2.5) программа оптимального управления имеет вид (2.9) и при этом возможные значения управляющих
параметров образуют пары для следующих значений: йх = -mj, 0, + mj; ü2 = -m2, 0, + m2. Если в некоторый момент времени т е [0 , T] для
программы (2.9) Л J ^(т) | +Л 2 I ü2(т) | > M0, то третье ограничение в (2.15) нарушается, что может иметь место только при | üj (т) | - m j и | и 2(т)| = m 2 или, что то же самое, при
(у2 (т),у4 (т)) е Р24. Поэтому решение задачи (2.1) - (2.5) с учетом (2.15) связано с проведением соответствующей коррекции программы (2.9) с целью учета ограничения (2.5). В связи с этим напомним, что при значениях
(у2, V4) е Р24 в системе (2.1) между объектами управления возникает «конкуренция» за использование ресурса управления, что приводит
к разбиению Р24 на области, показанные на рис. 1. При этом, как было показано, располагаемый ресурс управления используется в полном объеме, то есть в (2.13) ^ = 1, но только одним из объектов управления.
Итак, возвращаясь к схеме распределения ресурса (2.10), для исследования функций (2.11) и (2.12) на максимум по вспомогательным переменным р и £ , связанным с управляющими параметрами, необходимо рассмотреть следующие случаи для значений пар (у2, У4 ) е R2.
Во-первых, при (у2, у4 ) е Р^А, то есть при | у2 |<aj и | у4 |<а2, для всех р е [0,1] имеет место K < 0 (2.12), то есть в (2.13) должно быть £ = 0 и, стало быть, тогда üj = 0 и и 2 = 0.
Во-вторых, при (у2, у4) е Р4 \Р^, то есть | у 2 | > а J и | у 4 | < а 2 .Из условия максимума гамильтониана H (2.6) по üj и и2 с учетом (2.3) следует: üj = mj sign у2 ; и2 = 0, а с другой стороны, maxK(р; у2, у4) = (| у2 | -aj)/ л1 > 0 р
при p = j. Отсюда с учетом (2.10) и (2.5) определим долю ресурса, необходимого для создания управляющего воздействия üj : = л jmj /M0 < j. Подставив значение в (2.13), получим H = (| у2| - aj)mj +у^2 +у3>"2 и то же самое получим, подставив значения üj и и 2 в (2.6). Стало быть, оптимальные значения управляющих параметров должны быть такими: üj = mj sign у2 ; ü2 = 0. Также и в случае (у2,у4) е Р2 \Р24, то есть когда | у2 | <aj и | у4 |>а2, соответственно получим üj = 0 и и 2 = m2 sign у4. Таким образом, как и в случае неэффективности (2.5), в рассмотренном здесь случае получены аналогичные оптимальные значения управляющих параметров, отличающиеся неполным использованием располагаемого ресурса управления.
И, наконец, рассмотрим случай
(¥2, ¥4) е ^24, то есть когда | ¥2 |>а 1 и | ¥4 |>а2. Здесь максимум функции (2.12) находится в соответствии с (2.14). Например, если для точки A (см. рис. 1, то есть
Для (¥20, ¥40) ) в (2.14) р = 1, то
maxK(р; ¥2,¥4) = (I ¥2 I ~а1)/Л1 > 0. Но с р
учетом (2.10) и (2.15) тогда U1 = ^ sign ¥2 и
^=Л 1m1 / M 0 < 1. Поскольку | ¥ 4I >а 2, постольку остаток располагаемого ресурса управления M0 - ^ 1m1 > 0 с учетом условия максимизации гамильтониана H (2.6) и по и2 может быть использован и для создания управляющего воздействия и2 = ^sign ¥4, где Д 2 = (M 0-Л 1m1)/Л 2.
Итак, если (¥2, ¥4 ) G , то оптимальные значения управляющих параметров тогда определяются так: U1 = m1 sign ¥2 ; U2 =^2 sign ¥4 ; это отвечает точкам на отрезке AP1 ^ AB (см. рис. 1). Переход на отрезок PQ, соответственно, означает, что в
общем случае здесь
(¥2,¥4)G^2(±). Из (2.14) тогда получим р = 0, а также и2 = m2 sign ¥4 и ^ = л 2m 2 / M0 < 1. С учетом | ¥2 I >а1 остаток ресурса управления M0 -Л2m2 > 0 может быть использован для создания управляющего воздействия = ц sign ¥2 , где Д 1= (( 0—Л 2 2)/Л 1. Поэтому, если
(¥2, ¥4) G ), то оптимальные значения управляющих параметров тогда определяются так: и1 = sign ¥2; и 2 = m2 sign ¥4. Таким
образом, в случае (¥2, ¥4) G ^24 оптимальное управление отличается полным использованием располагаемого ресурса управления, а значения управляющих параметров находятся в точках конкатенации фрагментов границы множества U*.
3. ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ РЕСУРСОВ В ЗАДАЧАХ НА БЫСТРОДЕЙСТВИЕ ДЛЯ СИСТЕМЫ ДВОЙНЫХ ИНТЕГРАТОРОВ
3.1. Рассмотрим задачи на быстродействие для двухточечной граничной задачи (2.1) - (2.3) с учетом ограниченности энергетического или материального ресурса управления для системы из двух независимых объектов управления - двойных интеграторов.
Во-первых, это задача оптимального управления для (2.1) - (2.3), в которой требуется минимизировать длительность интервала управления T или, что то же самое, функционал
Т
J = | Ы* (3.1)
0
при наличии ограничения на скорость расходования энергетического ресурса, а именно [2]:
Л1 и2^) + л 2и2(*) < 2Е0, V* е [0,Т], (3.2) где Е0 - мгновенная максимальная мощность источника ресурса управления, а л1 -1, Л2 -1 -коэффициенты, учитывающие непроизводительные затраты при формировании управляющих воздействий.
Во-вторых, это задача оптимального управления для (2.1) - (2.3), в которой требуется минимизировать (3.1) при наличии ограничения на скорость расходования материального ресурса (2.5):
л 1 и 1(0| +л 2| и 2(*)| < М0, V* е [0, Т]. (3.3)
Как в [2] и выше ограничения (2.3) на управляющие параметры здесь представляются следующими множествами допустимых значений: Ц = { и 1 еЯь| и 1 | < тх};
и2 = {и2 еЯЬ|и2 1 <т2},
а также Ц12 = Ц П и2. Соответственно, ограничение (3.2) будет представлено множеством [2]
иЕ = {(и 13и2) еЯ2 : Л1 и\ +л2и2 < 2Е0}, а ограничение (3.3) - множеством (см. (2.5))
им = {(и и2) е Я2 : Л1| и 1| +Л 2| и2 | <М0} .
Кроме того, множества допустимых значений управляющих параметров в (2.1) и с учетом (3.2), (3.3) далее будут также рассматриваться в виде следующих пересечений: и*Е = Ц12 П иЕ и
им = и,2 П им.
В связи с общей постановкой задачи распределения ресурса управления - энергетического или материального («топлива») - в [2] отметим, что сформулированные здесь задачи на быстродействие в определенной степени могут рассматриваться как задачи оптимального управления, в которых дополнительно требуется минимизировать расход ресурса управления еще одного вида, а именно, временного ресурса.
3.2. Решим задачу (2.1) - (2.3), (3.1), (3.2), предполагая вначале, что ограничения (2.3) не эффективны или, что то же самое, иЕ ^ и 12 . Применяя принцип максимума [3, 4], запишем гамильтониан задачи
Н = -1 + ¥ х2 +¥2и +¥3 У 2 +¥4и 2, (3.4)
где сопряженные переменные ¥к, к = 1,2,3,4, удовлетворяющие системе уравнений (2.7).
С помощью метода множителей Лагранжа [6] найдем стационарную точку, в которой достигается максимум Н (3.4) с учетом (3.2), для
чего введем вспомогательную функцию
^ = -1 + ¥! х2 + ¥2и + ¥3 У 2 +
+ ¥4и2 +^(Л1 и2 +Л2и2 -2Е0),
где X - множитель Лагранжа. Исходя из необходимых условий максимума ^ по и1 и и 2:
д ^
ди1 д F
ди 2
то есть получим
= ¥2 +2 Хл1 и1 = 0; = ¥4 +2 ХЛ2 и 2 = 0,
и1 = —
¥ 2
- ¥4
и 2 = -"
2Хл1 2^л2
j
С учетом (3.5) далее получим
¥2
F(X) = -1 + ¥1X2 -2- + ¥3 У 2 -4лЛ
¥4
4Л2^
(3.5)
■- 2XE 0,
и =
2E 0
U 2 =
Л1 Л1 +¥ 4 / Л 2
¥4 ^л/лГ
2E,
Л2 Л1 +¥2/Л2
(3.6)
и,,
Лт ¥2
Л1 ¥4
. Это отношение с учетом (2.8)
а отсюда найдем
2/Л1 +¥2/Л 2 п Х = —--¡=-< 0,
где знак выбран так, чтобы выполнялись и достаточные условия максимума ^ по и1 и и 2 . Тогда из (3.5) получим следующие выражения для оптимальных значений управляющих параметров:
' ¥2/л/Л1
Отметим еще, что для рассматриваемой задачи в силу условий принципа максимума для гамильтониана задачи (3.4) выполняется условие: H(t) = 0, Vt е [0,T] [3, 4], то есть здесь
H=-1+¥X2 +¥3У2 +V 2E0(¥2 /Л1 +¥4 / Л2) =0
- доставляет дополнительные условия (при t = 0 и t = T) при определении ¥10, ¥20, ¥30 , ¥40 и T = Tmin для граничных условий (2.2).
Если же U12 ^ Ue , то не эффективны тогда ограничения (3.2) и, стало быть, реализуется независимое управление для подсистем в (2.1).
При этом Tmin = max-T^ T^l, где Т^ и Т™
- «сепаратные» быстродействия для соответствующих парциальных задач управления (2.1),
(2.2). Пусть Tmin = Tmn > Tm(m . Тогда решение задачи для первой подсистемы в (2.1) сводится к задаче на быстродействие (см. п. 2.1 в [2]), а для второй подсистемы - к двухточечной граничной задаче с T = T^1, в которой дополнительно можно потребовать, например, чтобы минимизировался суммарный расход энергии, то есть функционал (1.8*) (см. п. 2.2 [2]).
Пусть оба ограничения (2.3), (3.2) являются эффективными, тогда множество допустимых значений для управляющих параметров
UE = U12 ПUE и (U12 иUE)\UE Если для текущих значений ¥2 и ¥4 в (3.6) выполняются условия: | й1 | < m1; | и2 | < m2, то значения (3.6) суть оптимальные управляющие параметры, то есть здесь (и1, и2) е dU*E. В том случае, когда в (3.6) имеет место, например: | й1| > m1; | и 2 | < m 2, то с учетом условия максимума H (3.4) по и1 и и 2, а также ограничения (3.2), тогда получим:
й1 = m1 sign ¥2 ;
Отсюда видно, что Л1 й +Л 2 и 2 = 2Е0, то есть располагаемый ресурс управления расходуется в каждый момент времени в полном объеме. Кроме того, энергетический ресурс управления распределяется между подсистемами (2.1) во вполне определенной пропорции, а именно:
и2 =>/(2E0 ^1m2)/Л2 sign ¥4, (3.
6а)
и, соответственно, в том случае, когда в (3.6)
< m1 и | и 2
>m
и
есть дробно-линейная функция от t, которая определяется получаемыми начальными условиями для системы (2.7). В свою очередь, для найденных при решении соответствующих краевых задач [4] функций (2.8) - ¥ 2(*) и ¥ 4(*) из (3.6) получим программы оптимального управления ¿/1(*) и и 2(*) , которые при учете ограничений (2.3) суть опорные программы управления [2].
1 (2E0 -Л2m2)/Л1 sign ¥2 ;
и2 = m2 sign ¥4, (3.6б)
что отвечает полному использованию ресурса управления.
Таким образом, из полученного решения задачи (2.1) - (2.3), (3.1), (3.2) следует: во-первых, располагаемый ресурс управления в виде мгновенной мощности, расходуемой на создание управляющих воздействий в системе двойных интеграторов (2.1), используется в полном объеме; во-вторых, процесс оптимального управления с учетом (3.6) и (2.8) характеризуется со-
тасованным распределением энергетического ресурса между независимыми объектами управления в системе (2.1) при решении соответствующих парциальных задач управления.
3.3. Рассмотрим теперь задачу на быстродействие (2.1) - (2.3), (3.1), (3.3), также вначале предполагая, что ограничения (2.3) не эффективны, а именно: Цм ^ Ц^ . Здесь, как и в п. 3.2, гамильтониан имеет вид (3.4), а сопряженные переменные - ук, к = 1,2,3,4, удовлетворяют системе уравнений (2.7).
Итак, воспользовавшись для решения задачи (2.1), (2.2), (3.1), (3.3) соотношениями (2.10), перепишем (3.4) здесь в следующем виде:
Н =-1 + ^1 х2 +Узу2 0[р| У2 |/Л1 +
+ (1 -р)1 У4|/ л 2], (3.7)
где в квадратных скобках записана функция К = К0 (2.12) при а 1 = а 2 = 0. Таким образом, чтобы максимизировать функцию (3.7) по 0 <£< 1 и 0 <р< 1 требуется: во-первых, принять £ = 1, то есть, чтобы располагаемый ресурс использовался полностью; во-вторых, выбирать р так:
Г1, 1 У 2 1 /Л1 > 1 У4|/Л 2; Р |0, 1 У 2 1 / Л 1 < 1 У4К Л 2-
Для управляющих параметров, доставляющих максимум Н (3.4), с учетом (2.10) получим
__К0/лО^п У2;0) |У2|/Л1 >|У4|/Л2;
(м1;«2)Ч, ч (3.8)
[(0; (М 0/ Л2)^ПУ4), | У 2 | /Л 1 < | У 4 | /Л 2-
При | У2 | /Л 1 = | У4 | /Л 2 выбор значений управляющих параметров (3.8) произволен, что уже отмечалось в п. 2.2 в связи с возможностью возникновения особых оптимальных управлений [5]. В плоскости Оу2у4 проходящие через ее начало прямые | у21 = | у4| Л1/ Л2 суть прямые, пересечение которых отрезком АВ (см. также п. 2.1 и рис. 1) возможно не более двух раз, а их пересечение соответствующим (2.8) отрезком АВ означает перемену в использовании ресурса для объектов управления (2.1), то есть в общем случае ресурс будет расходоваться объектами управления попеременно и в полном объеме.
Если и 12 ^ Цм, то ограничения (3.3) не эффективны. В этом случае, как и в п. 3.2, будет реализовываться независимое управление подсистемами (2.1) и для Гтт = > Т^П решение задачи сводится для первой подсистемы в (2.1) к задаче на быстродействие, а для второй - к двухточечной граничной задаче с Т = Т^П, которую можно решать, например, на минимум суммарного расхода «топлива» для функционала (1.1) (см. п. 1.2).
Если ограничения (2.3), (3.2) эффективны, то есть допустимые значения управляющих параметров принадлежат множеству U*M = Uj2 П UM, для которого выполняется условие (Uj2 U UM) \ U*M Ф 0 . Стало быть, тогда выполняются условия (2.15), в том числе, хотя бы одно из ограничений (2.3) является эффективным, например, пусть далее m j < M0/ л1.
2 2
Очевидно, что при у2 + у4 > 0 для всех 0 <р< j имеет место: K0 > 0, то есть в (3.7) тогда должно быть £ = j или, что то же самое, ресурс управления должен быть использован
полностью. Пусть | у2 | /Л! > I у4 I /Л2, тогда в (3.7) должно быть р = j, но m j < M0 / л1, то есть для формирования üj = mj sign у2 может быть использована только часть ресурса M 0, а его оставшаяся часть - с учетом условия максимума (3.4) по ü2 - для ü2 = Д2 sign у4, где Д2 = (M0 — Л^^/Л2. Таким образом, оптимальные значения управляющих параметров в рассмотренном случае будут равны:
й1 = m1 sign у2 ; ü2 = sign у4 . (3.8а)
Так же находятся и оптимальные значения üj и ü2, если эффективным является второе ограничение в (2.3), а именно:
й1 = sign у2; ü2 = m2 sign у4, (3.8б) где = (M0 -Л2m2)/Л1.
В конечном счете, по результатам решения задачи (2.1) - (2.3), (3.1), (3.3) следует: во-первых, располагаемый ресурс управления в виде скорости расходования «топлива» при создании управляющих воздействий в системе двойных интеграторов (2.1), используется в полном объеме; во-вторых, процесс оптимального управления с учетом (3.8) характеризуется согласованным распределением материального ресурса между независимыми объектами управления в системе (2.1) при решении соответствующих парциальных задач управления.
В целом для полученных решений задач на быстродействие следует отметить, что они характеризуются максимально возможным использованием ресурса управления независимо от его вида, но при этом сохраняется различие в использовании энергетического и материального ресурсов, а именно: в первом случае
- согласованное и в определенной пропорции между объектами управления; во втором случае
- попеременное и максимально возможное для одного из объектов управления (2.1).
ЗАКЛЮЧЕНИЕ
Следуя концепции физической теории управления А. А. Красовского [1], в [2] дана общая постановка задачи оптимального распределения единого физического ресурса управления между независимыми объектами управления. В качестве ресурсов управления, необходимых для создания управляющих воздействий, рассматриваются энергетический и материальный ресурсы управления в виде ограниченных скоростей их расходования, а именно: мгновенной мощности и максимальной скорости расхода «топлива». Рассмотрены задачи оптимального управления двойными интеграторами, для которых одновременно решаются двухточечные граничные задачи (с произвольными граничными условиями) или парциальные задачи управления с учетом имеющихся ограничений как на управляющие воздействия, так и на расходуемый на их создание единый ресурс управления. Последнее приводит к образованию системы из независимых объектов управления в силу необходимости распределения ресурса управления между ними при решении парциальных задач управления. Кроме того, для такой системы также приведено решение задач на быстродействие, которые можно рассматривать как пример оптимального распределения временного ресурса управления.
По результатам решения указанных задач здесь и в [2] выявлены следующие особенности оптимального распределения единого физического ресурса управления между независимыми объектами и соответствующими парциальными задачами управления. Во-первых, в задачах оптимального управления на минимум «энергии управления» в каждый момент времени расходуемый ресурс распределяется в определенной пропорции между парой двойных интеграторов, в том числе при эффективности ограничений на управляющие воздействия. Во-вторых, в задачах оптимального управления на минимум расхода материального ресурса - «топлива», скорость его расхода характекризуется попеременным использованием ресурса объектами управления в системе (2.1) при решении соответствующих парциальных задач управления. Соответственно, задачи управления на быстродействие при ограничениях на ресурсы управления любого вида характеризуются максимально возможным использованием ресурсов в системе для согласованного решения парциальных задач управления. Таким образом, наличие дополнительного ограничения на управляющие параметры неза-
висимых объектов управления в виде ограничений на расходуемый физический ресурс управления существенно влияет на его оптимальное распределение в зависимости от вида ресурса.
В заключение необходимо дополнительно отметить, что рассмотренные в статье задачи относятся не только к соответствующему классу задач физической теории управления как задачи оптимального распределения ресурса между независимыми процессами, но также к классу так называемых смешанных задач управления [7], где прямо отмечено, что при рассмотрении двух независимых задач: задачи программирования оптимальных траекторий и задачи синтеза (аналитического конструирования) законов обратной связи предполагается строгое разделение ресурсов управления на две части для решения этих независимых задач, но это деление носит волевой характер и не отвечает духу обеих вариационных задач оптимального управления (см. С.193-194 [7]). Отказ от такого волевого деления приводит к постановке смешанных задач, содержание и смысл которых, например, демонстрируется задачей о прилунении космического аппарата [7, 8]. Но то же самое в виде оптимизации распределения ресурса управления реализуется в рассмотренных здесь задачах оптимального управления, которые тем самым можно отнести также к классу смешанных задач управления.
СПИСОК ЛИТЕРАТУРЫ
1. Красовский А.А. Проблемы физической теории управления // Автоматика и телемеханика. 1990. № 11. С. 8-28.
2. Горелов Ю.Н. К задаче оптимального распределения ресурса в системе независимых объектов управления. I // Известия СамНЦ РАН. 2017. Т. 19. № 6. С. 156-167.
3. Математическая теория оптимальных процессов / Л. С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелид-зе, Е.Ф. Мищенко. М.: Наука, 1976. 392 с.
4. Моисеев Н.Н. Элементы теории оптимальных систем. М.: Наука,1975. 528 с.
5. Габасов Р., Кириллова Ф.М. Особые оптимальные управления. М.: Наука, 1973. 256 с.
6. Бертсекас Д. Условная оптимизация и методы множителей Лагранжа. М.: Радио и связь, 1987. 400 с.
7. Летов А.М. Математическая теория процессов управления. М.: Наука, 1981. 256 с.
8. Летов А.М. Динамика полета и управление. М.: Наука, 1969. 360 с.
TO THE PROBLEM OF OPTIMAL RESOURCE ALLOCATION IN THE SYSTEM OF INDEPENDENT CONTROL OBJECTS. II
© 2017 Yu. N. Gorelov
Samara National Research University named after Academician S.P. Korolyov
We consider problems of optimal resource allocation for the system of two double integrators. For this system problem of optimal control with constraints on the rate of consumption of a material resource such as fuel was solved. In addition, problems of response time minimization for such system in the case of limiting the energy and material resources of management needed for create control actions was solved. The results of solving these problems identifies the main features of optimal resource allocation control depending on its type. It is noted, that the considered control problem can also be attributed to the class of the A. M. Letov mixed problems. Keywords: control resource, optimal resource allocation, a system of independent control objects, double integrator, energy and material resource control, optimal control, performance
Yury Gorelov, Doctor of Technics, Director of Institute for Modeling and Control Sciences. E-mail: [email protected]