УДК517.997.5: 62-501.52
К ЗАДАЧЕ ОПТИМАЛЬНОГО РАСПРЕДЕЛЕНИЯ РЕСУРСА В СИСТЕМЕ НЕЗАВИСИ МЫХ ОБЪЕКТОВ УПРАВЛЕНИЯ. I
© 2017 Ю.Н. Горелов
Самарский национальный исследовательский университет имени академика С.П. Королёва
Статья поступила в редакцию 20.12.2017
Приведена постановка задачи оптимального распределения ресурса управления для системы независимых объектов управления. В качестве ресурсов, необходимых для создания управляющих воздействий, рассматриваются энергетический и материальный ресурсы управления. С целью выявления особенностей распределения ресурса, ограниченного скоростью его расходования, приведено решение задачи оптимального распределения энергетического ресурса между парой независимых объектов управления, представленных двойными интеграторами. Кроме того, для анализа закономерностей распределения ресурса между парой двойных интеграторов приведены общие решения задач оптимального управления для двойного интегратора на быстродействие и на минимум «энергии управления» в случае задания произвольных граничных условий. Изложены результаты анализа распределения энергетического ресурса (мгновенной мощности) с учетом различного сочетания ограничений на управляющие параметры двойных интеграторов. Решение задачи распределения материального ресурса для системы двойных интеграторов рассматривается во второй части настоящей статьи.
Ключевые слова: ресурс управления, независимые управляемые системы, оптимальное распределение ресурса, система двойных интеграторов с единым ресурсом управления, энергетический ресурс
Исследование выполнено при поддержке гранта РФФИ (проект № 16-41-630524) и субсидий в рамках исполнения ГЗН (проект № 8.6675.2017/БЧ)
ВВЕДЕНИЕ
В одном из важных в прикладном отношении направлений физической теории управления [1] отмечено, что успешное создание систем управления различными объектами и процессами управления возможно с максимальным использованием физических моделей, критериев и переменных и, в особенности, с учетом реальных физических ограничений (энергетических, информационных, материальных и иных), которые недостаточно учитываются в современной теории управления. Физические ограничения играют существенную роль в задачах управления, когда возникает необходимость распределения каких-либо «ресурсов управления». Например, в задаче оптимального распределения ограниченного ресурса между независимыми технологическими процессами [2] или в более сложных случаях в задачах управления, когда исполнительный орган объекта управления используется для создания управляющих воздействий по разным каналам или при управлении одновременно протекающими независимыми процессами [3-5] с использованием единого физического ресурса определенного вида. В связи с
Горелов Юрий Николаевич, доктор технических наук, профессор, директор института проблем моделирования и управления (НИИ-310). E-mail: [email protected]
этим цель настоящей статьи - не только постановка задачи распределения ресурса управления между независимыми управляемыми системами, но и рассмотрение примеров ее решения для модельных объектов управления - пар независимых двойных интеграторов - для выявления закономерностей распределения единого ресурса управления определенного вида, рассматриваемого в виде совместного дополнительного ограничения на управляющие параметры таких объектов управления. Поскольку в качестве распределяемых ресурсов управления в статье будут рассматриваться только энергетические (в виде «энергии управления») и материальные (в виде расходов «топлива» [6]) ресурсы, постольку в первой части настоящей статьи приводится решение общей задачи распределения энергетического ресурса для пары двойных интеграторов при задании граничных условий общего вида. Кроме того, здесь же приведено общие решения задач на быстродействие и на минимум «энергии управления» для двойного интегратора, что необходимо для выявления особенностей реализуемого механизма распределения ресурса между парой независимых объектов управления - двойных интеграторов.
В настоящей - первой части статьи приводится общая постановка задачи оптимального распределения ресурса управления между независимыми объектами управления и решение
этой задачи для системы из пары двойных интеграторов в случае распределения между ними энергетического ресурса в виде ограниченной мгновенной мощности, потребляемой для создания управляющих воздействий. Также здесь приведены общие решения задач оптимального управления для двойного интегратора на быстродействие и на минимум «энергии управления» для произвольных граничных условий. Во второй части статьи будет рассмотрена, также для пары двойных интеграторов задача оптимального распределения материального ресурса управления в случае пропорциональности управляющих воздействий его мгновенным расходам.
1. ПОСТАНОВКА ЗАДАЧИ
1.1. В двухточечной граничной задаче управления для системы й х
— = /(х, и), (1.1)
Ш
где х е Я" - вектор переменных состояния, и е Ят - вектор управляющих параметров, £ Я" х Ят ^ Я", пусть в качестве целевых условий заданы граничные условия общего вида:
х(О = х0; х(*/ ) = ху, (1.2)
где х0, х^ - начальное и конечное состояния системы, а на вектор управляющих параметров (воздействий) накладываются ограничения:
и еи с Ят, (1.3)
где и - компактное множество. Ограничения (1.3) в прикладных задачах, как правило, определяются ограничениями на допустимые значения управляющих воздействий на объект управления, создаваемых с помощью исполнительных органов определенного типа.
Если задача (1.1) - (1.3) имеет неединственное решение, то ее можно переформулировать как задачу оптимального управления, в которой требуется найти такую пару {х(7),и(7)} , Vг е [70,^], что для нее доставляется минимум (или максимум) некоторому функционалу J = J(х, и) . Достижение экстремального значения J также может служить целью управления для задачи (1.1) - (1.3), но более общей в сравнении с выполнением граничных условий (1.2). В частности, значения J могут быть и оценками суммарных затрат какого-либо ресурса управления, необходимого для решения этой задачи с помощью каких-либо допустимых программ
управления и (7) е и, V? е[70,7у ]. Поэтому выбор функционала J определяется зачастую требованием минимизации расходов каких-либо физических ресурсов управления (энергетического, материального или иного вида), затраты которых связаны с созданием управляющих
воздействий, необходимых для решения задачи (1.1) - (1.3). Если в каждый момент времени формирование и (7) е и сопряжено с расходованием соответствующего ресурса со скоростью р(7) > 0, то показатель эффективности решения задачи управления (1.1) - (1.3) в этом случае
р(Г) Ж .
7 0
Следуя концепции физической теории управления [1], в задачах управления необходимо учитывать не только ограничения вида (1.3), но и ограничения на расходуемые ресурсы управления, например, здесь в следующем виде:
Р^Р0 ,
(1.4)
где р0 <
ж
максимально допустимые мгно-
венные скорости расходования ресурса. Если связь между текущими значениями и е и и скоростью расхода ресурса задается так: Я(и) = р, тогда с помощью обратной функции Я1 (р) можно определить ир - множество допустимых ограничением (1.4) значений управляющих параметров и в (1.1). Условия типа (1.4) могут существенно ограничивать множество допустимых значений управляющих параметров для (1.1), если и \и ^0. Кроме того, здесь также следует отметить, что в случае (1.3): и е и, и в случае (1.4): и е ир, допустимые значения управляющих параметров здесь могут иметь различный физический смысл, то есть их значения будут совпадать только с точностью до размерности. В общем случае расходуемых ресурсов управления может быть несколько и для каждого из них также должны выполняться ограничения, аналогичные (1.4).
1.2. В качестве примера рассмотрим объект управления в виде двойного интегратора со скалярным ограниченным управляющим воздействием:
ШХ1 йг
= х.
йх2
= и ;
| и | < т,
(1.5)
(1.6)
где т - максимально допустимое значение управляющего воздействия и . Пусть в задаче управления для (1.5) граничные условия, как соответствующая цель управления, задаются в общем виде так:
Х1 (0) = Х10 ; Х2 (0) = Х20 ; Х1 (Т) = Х1 / ;
Х2(Т) = Х2/ ,
(1.7)
где Х10, Х20, Х1 у. и Х2^ - параметры, определяющие локальную цель совершаемого объектом управления (1.5) «маневра» за заданное время Т, а критерием эффективности управления служит минимизируемый функционал в виде затрат «энергии управления» [6, 7]:
J = -2
1 Т
2 J u 2(t) dt,
(1.8)
где значение и 2{1)/ 2 пропорционально мгновенной потребляемой мощности, необходимой для создания управляющего воздействия и(1).
Вместо (1.8) можно выбрать функционал, который определяет затраты расходуемого материального ресурса - «топлива» [6]:
J = J | u (t)| dt,
(1.9)
провождается расходованием некоторого ресурса управления со скоростями рк = Як (ик ) > 0, к = 1,2,..., N, но при этом имеет место следующее совместное ограничение:
N N
XКк(ик) = ХРк <Р0, (1.13)
к=1
к=1
где | и ^) | определяет мгновенную скорость расхода «топлива», необходимого для создания управляющего воздействия и (^).
Отметим, что параметр и в (1.5), (1.6) отвечает управляющему воздействию на объект управления, а в (1.8) и (1.9) он характеризует скорость расходования ресурса управления, на которую накладывается дополнительное ограничение вида (1.4), а именно: либо в виде и2 < 2р0 для (1.8), либо в виде | и(г) | < р0 для (1.9). Соответственно, в зависимости от значений параметров т и р0 (с учетом их размерностей и различного физического смысла) существенным может быть (1.6), то есть ограничение на величину управляющих воздействий, или ограничение на скорость расходования ресурса управления, что может быть связано с потреблением того же ресурса и другими объектами управления.
1.3. Очевидно, что ограничения вида (1.4) играют существенную роль в том случае, когда некоторый ресурс управления одновременно потребляется несколькими независимыми объектами управления для решения парциальных задач управления с заданными граничными условиями суть локальными целями управления.
Действительно, пусть решаются задачи вида (1.1) - (1.3) для следующей системы:
Щ" = fk(хк,ик), к = 1,2,...,N, (1.10)
Ш
где хк е Я% ик е я^, /: яч х Я^ ^ Я^, а N > 2 - их число, с граничными условиями:
Хк (О = Хк о; хк ) = хк/, (1.11)
где хк0, хку - начальные и конечные состояния для (1.10). Эффективность управления для каждого объекта в системе (1.11) определяется функционалами Jk, к = 1,2,..., N, а на управляющие параметры накладывается система ограничений:
ик е ик с Я^, к = 1,2,...,N, (1.12)
где ик - множества допустимых управляющих воздействий. Кроме того, пусть создание управляющих воздействий
Uk е Uk, к = 1,2,...,N,
со-
где р0 - максимально допустимая скорость расходования ресурса (1.4).
Парциальные цели управления в каждой из задач (1.10) - (1.12) также могут задаваться показателями качества управления Jk, к = 1,2,...,N. Соответственно, общая цель управления системой (1.10) с учетом (1.13) может быть задана так:
N
Ха kjk (uk) ^ min, (1Л4)
к=1
где аk > 0, k = 1,2,...,N, - некоторые весовые коэффициенты. Если с помощью Jк можно оценить суммарный расход ресурса на решение соответствующей парциальной задачи, то коэффициенты ак в (1.14) можно рассматривать в качестве приоритетов в расходовании ресурса управления для решения парциальных задач управления.
Таким образом, задача оптимального управления (1.10) - (1.14) существенно отличается от задач (1.10) - (1.12), образующих в силу наличия ограничения (1.13) систему, в которой должно обеспечиваться текущее оптимальное распределение ресурса в соответствии с (1.14) между объектами управления (1.10) при условии согласованного и одновременного решения для них соответствующих парциальных задач управления с учетом (1.13). Задачи такого типа относятся к классу ресурсных систем [4, 5], которые также можно отнести и к соответствующим классам задач как физической теории управления [1, 7], так и теории оптимального управления [3].
В силу общности постановки для получения содержательных и практически ценных решений задачи (1.10) - (1.14) целесообразно конкретизировать соответствующим образом ее элементы, то есть и модели объектов управления, и решаемые для них задачи управления с учетом особенностей ограничений на множества допустимых управляющих воздействий. То же самое необходимо и для выявления закономерностей в распределении ресурса между независимыми объектами управления. Поэтому далее решение задачи (1.10) - (1.14) будет рассматриваться только для объектов управления простейшего вида, а именно, для двойных интеграторов (1.5), но с произвольными граничными условиями
(1.7). Кроме того, в качестве распределяемых будут рассматриваться ресурсы, суммарные затраты которых определяются показателями
(1.8) и (1.9). В связи с этим следует дополнительно отметить, что в качестве ресурса управле-
ния помимо указанных - энергетического или материального - может также рассматриваться и временной ресурс в виде длительности интервала управления, то есть когда вместо (1.14) требуется, чтобы T - tf -t0 ^ min, что отвечает решению задачи на быстродействие для системы (1.10) с учетом (1.11) и (1.12) [8, 9].
2. ОПТИМАЛЬНОЕ ПО БЫСТРОДЕЙСТВИЮ И НА МИНИМУМ ЭНЕРГИИ УПРАВЛЕНИЕ ДВОЙНЫМ ИНТЕГРАТОРОМ
2.1. Вначале для двухточечной граничной задачи (1.5) - (1.7) приведем общее решение задачи на быстродействие, в которой требуется, чтобы T ^ min, и, соответственно, найти ее
решение в виде T = Tmin = Tmjn(*10> X1 f, X20> X2 f ) [6, 8].
Итак, интегрируя систему уравнений (1.5) при u - s0m (s0 =±1), получим с учетом (1.7)
s0 mx1 - 1 x22 + c,
(2.1)
1
2
где с = £0тХ10 — ^ Х20 - постоянная интегрирования. Значению ¿0 =+1 здесь соответствуют траектории «разгона» для (1.5), а ¿0 =—1 - траектории «торможения» в плоскости О Х1Х2. Очевидно, что из (2.1) следует
1 (Х2 — Х220). (2.2)
Х1 = Х10 +
2s0m
Если соотношение (2.2) выполняется тождественно и для конечной точки (х2 у , х3 у) с одним из значений ¿0 =±1, то точки, заданные граничными условиями (1.7), лежат на траектории соответствующего типа и время, необходимое для перехода между точками, будет равно
Тшт = — (Х2/ — Х20 ) . (2.3)
¿0т
Иначе, оптимальная траектория для (1.5) - (1.7) составная. Ее первый участок описывается уравнением (2.2), а на втором участке с учетом перемены знака ¿0 траектория будет иметь другой тип и, соответственно, она должна проходить через заданную конечную точку (1.7), а именно, ее уравнение будет иметь вид
" (Х2 — Х2 Г ) .
Л^ - Л^ f
2s0 m
(2.4)
x2 > 0, то есть s0(x1 f -x10)
2m
(x
20
x
2 f
) > 0.
Интегрируя систему уравнений (1.5), во-
первых, на подынтервале [0,71 ] при и (7) = ¿0т , и, во-вторых, на подынтервале [ 71 , Тшт ] при и (7) = —¿0т, получим с учетом (1.7) следующие соотношения:
t1 -1 Tmin +
x2f x20 2s0m
1 2
Х1 (Тшш ) = Х1 / = Х10 + Х2071 + 2 S0mt1 +
+ (Х20 + Som ) (Тт[п — 71 ) — 1 Som (Тт1п — .
Отсюда после соответствующих выкладок получим формулу для вычисления значения Ттп :
T ■ - —
m in
-i — j s0m(x1 f -x10) + ^2(x22f +x220) , (2.5)
где знак ¿0 определяется знаком дискриминанта квадратного уравнения относительно Ттп .
Для модельных наборов граничных условий (как целей управления для типовых задач): Х1(0) = 0; Х2(0) = 0; Х1(Т) = х1 г > 0;
Х 2 (Т) = 0; (2.6)
Х1(0) = Хю; Х 2(0) = Х 20; Х1(Т) = 0;
Х 2(Т) = 0, (2.7)
из (2.5) получим: а) для (2.6) Тт=п =,
4s0 x! f
m
, где S0 - sign x1 f ;
б) для (2.7) Tmin = ^ +2fl
2 x20 S0m x10 I,
где
[+1, 2mxw + x201 x201 < 0; [-1, 2mxw + x201 x201 > 0,
если
2mx10 + x20 1 x20
Приравнивая правые части уравнений (2.2) и (2.4), определим условие конкатенации этих
траекторий: х^ = ¿0т(Х1 у — Х10) + 2(х20 + х^); здесь и в(2.2)и(2.4) знак ¿0 выбирается из условия
2 ____________х Ч . 1 (х2 ~
= 0, то начальная точка (х10, х20) лежит на линии переключения: 2тх1 + х2 | х2 | = 0, на ветвях которой
¿0 = Х10 .
2.2. Рассмотрим решение еще одной типовой задачи оптимального управления для (1.5), (1.7), в которой требуется минимизировать функционал (1.8) на заданном интервале управления при Т > Ттп . С помощью принципа максимума получим решение этой задачи вначале без учета ограничений на управляющий параметр.
Итак, гамильтониан задачи (1.5), (1.7), (1.8) имеет вид [8, 9]
1 2
Н = —2 и +у1 х 2 + у2и,
где , V2 - сопряженные переменные, удовлетворяющие системе уравнений
d у dt
- 0;
d у 2 dt
(2.8)
s0 -
решение которой имеет вид
Vi(t) = Vio. V 2(t) = V 20 "Viot, (2.9) j
где Vio, V2o - начальные значения сопряженных переменных. С учетом (2.9) из условия максимума гамильтониана по управляющему параметру получим программу оптимального управления
ü(t) = V2(t) = V2o "Viot. (2.10)
Проинтегрируем систему уравнений (1.5) с учетом (2.10) и при t = T получим
X2(T) = Х20 + ^20T " 2 Vl0T2 = Х
2
X1(T) = X10 + X20T + 2 ^20T2 " j VlüT' = x1f ,
l2f-^3
и определим значения y10, y20 :
l2(Xjf— Xj0 — X20T) 6(X2 f x20) ¥i0 =-
V20 =
T t
6( xif — X10 — X20T) 2( (X2f — X20)
T
T
. (2.11)
12 x
а) для (2.6): =
T
1 f
3—; v 20 =
6 x
if .
T 2
V10 =
б) для (2.7):
6( X20T — 2 X10) _ 2(3 X10 + 2 X20T)
; t 20
T3
T 2
ü(t) =
6(x1 f x10 X20T)
T 2
2(x2f — x20 ) ^
1 — * I —
T
T
(2.12)
Исходя из (2.12), получим граничные значения управляющего параметра:
6( x1 f — x10) 2( x2 f + 2 x20)
ü (0) =
T 2
T
ü(T) = —-
6(x1 f x10) 2(2x2 f + x20)
2 f
ü(t) = sat V2(t) = sat
ra
v^20 — t
m
где sat (•) - функция насыщения, определяемая так: sat (£,) = s I ^ I ' Следует отметить,
H I^I> 1.
что здесь \у10 и х|/20 отличаются от значении, вычисляемых по формулам (2.11). В конечном счете, процедура коррекции программы (2.12) с учетом ограничения (1.6) сводится к формированию следующей программы управления: ^т, t е [0,
ü(t) =
1 —
2(t — Q
12 —11
, t е [t1,12);
t е [t2,T],
Для модельных наборов граничных условий из (2.11) следует:
где =±1, t1 и 12 - ее параметры, которым отвечают соответствующие значения ф10 и У20 в (2.9).
3.ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ЭНЕРГЕТИЧЕСКОГО РЕСУРСА УПРАВЛЕНИЯ В СИСТЕМЕ ИЗ ДВУХ ДВОЙНЫХ ИНТЕГРАТОРОВ
3.1. Рассмотрим задачу оптимального управления на заданном интервале [0,Т ] для системы двух независимых объектов управления суть двойных интеграторов:
dx1
■ = ü1
dy1 dy2
— = У2; 2
(3.1)
C учетом (2.11) из (2.10) получим программу оптимального управления
Ш М Ш ' М
с граничными условиями общего вида:
Х1(0) = хю; х 2(0) = х 20; Х1(Т) = Х1 /;
х2 (Т) = х2/; (3.2)
у 1(0) = у 10; у 2(0) = у 20; у(Т) = у 1 /;
у 2 (т) = у 2 /, (3.3)
где х10, х20, х1 /, х2/, у10, у 20, у1 /, у 2/ - некоторые заданные параметры, определяющие цели для парциальных задач управления.
В задаче (3.1) - (3.3) требуется минимизировать функционал
J0 = 2 J (a 1ü2 +а 2 ü2)dt,
(3.4)
где а1 > 0, а2 > 0 - весовые коэффициенты, а на управляющие параметры накладываются следующие ограничения:
и) < т2; и\(г) < ш\, Vt е [0, Т], (3.5) где т1 и т 2 - максимально возможные уровни управляющих воздействий. Ограничения (3.5) также можно рассматривать в виде множеств допустимых управляющих воздействий:
и1 = {и 1 е Я :| и 1 | < т1} ;
и 2 = { и 2 е Я :1 и 21 ^ т 2) .
Очевидно, что и12 = и1 П и2 - прямоугольник в плоскости О и 1 и 2 с центром в ее начале.
В соответствии с общей постановкой задачи по п. 1.3 и в дополнение к (3.5) введем еще со-
Т 2 т
При выполнении условия: тах{| ¿7(0) | г7(Т)|} < т , ограничения (1.6) не нарушаются. Если же это условие не выполняется, то программа оптимального управления с учетом (2.10) будет иметь следующий вид:
вместное ограничение на скорость расходования ресурса, а именно:
Л1 и2(7) + Л 2и2(7) < 2Е0, VI е [0,Т], (3.6) где Е0 - мгновенная максимальная мощность источника ресурса управления, а л1 >1, Л2 >1 -коэффициенты, учитывающие непроизводительные затраты при формировании управляющих воздействий из-за потерь в исполнительных органах объектов управления. Ограничение (3.6) также можно представить в виде множества
иЕ = (Ои 1» и 2) е К 2 : Л 1+Л 2 и 2 ^ 2Ео) , то есть иЕ - область, ограниченная эллипсом в плоскости О и 1 и 2 с центром в начале и с полуосями, равными д/2Е0 / Л1 и -\/ 2Е0 / Л 2 .
С учетом ограничений (3.5) и (3.6) множество допустимых значений управляющих параметров задается так: и * = и12 П иЕ • Если при этом иЕ с и12, то иЕ существенное, а и12 несущественное ограничение, и, стало быть, последнее можно исключать из рассмотрения. Если и12 с иЕ, то исключается множество VЕ . В общем случае (и12 и иЕ )/(и12 П иЕ) ^0 ограничения (3.5) и (3.6) являются существенными. Ограничения, исключаемые далее из рассмотрения в силу того, что они являются несущественными, будем называть неэффективными и, напротив, существенные ограничения - эффективными.
3.2. Вначале решим задачу (3.1) - (3.4), предполагая, что ограничения (3.5) и (3.6) являются неэффективными. Применяя принцип максимума [8, 9], запишем гамильтониан для этой задачи оптимального управления:
Н = —^2(а1и2+а2и2^)+^1Х2 + V2U1+VзУ2 + ^4М2 , (3.7)
где сопряженные переменные Vк, к = 1,2,3,4, удовлетворяют системе уравнений
й У1 = 0. ¿Щ = —у . Ш Ш 1'
dУз - 0 ; dу4 dt dt
--Уз .
(3.8)
Найдем стационарную точку, в которой достигается максимум Н (3.7), из условий: 5 Н
= —а1 и1 + у2 =0;
3u1
a н
du 2
- -а2u2 + у4 - 0 ,
а именно, отсюда получим
У2 (t) u (t) 4 (t)
где у2(t) и у4(t) - решения системы уравнений (3.8), получаемые с учетом граничных условий (3.2) и (3.3). Программы управления (3.9) удовлетворяют достаточным условиям максимума H (3.7) (Vt е [0, T]), то есть полученные программы управления ü1(t) и u 2(t) являются оптимальными и, кроме того, идентичными программе управления (2.12). Далее (3.9) будут рассматриваться в качестве опорных программ управления для системы (3.1).
В общем случае, при решении задачи (3.1)
- (3.6), оптимальные значения управляющих параметров должны доставлять максимум H
(3.7) с учетом ограничений (3.5) и (3.6). Поэтому при нарушении хотя бы одного из условий (3.5) или (3.6) для программ (3.9), как и в задаче (1.5)
- (1.8) (см. п. 2.2), требуется проведение соответствующей коррекции опорных программ управления. В связи с этим отметим, что ее результат будет существенно зависеть как от значений параметров, которые определяют ограничения
(3.5) и (3.6), или, что то же самое, от структуры
границ множества U* - U12 П UE, так и от значения T > max{r(1), Г(2)}, где Г(1) и Г(2) - «се" 1 min > min > > ^ * min min
паратные» быстродействия для соответствующих подсистем из (3.1).
3.3. Помимо рассмотренного в п. 3.2 варианта решения задачи (3.1) - (3.6), доставляющего для нее опорные программы управления (3.9), есть варианты, в которых ограничения (3.5) и/ или (3.6) являются эффективными: во-первых, когда UE с U12, либо U12 с UE ; во-вторых, когда эффективным является хотя бы одно из ограничений (3.5) вместе с ограничением (3.6). Вначале рассмотрим решение задачи (3.1) -
(3.6) в случае UE с U12, что эквивалентно задаче (3.1) - (3.4), (3.6) (при U12 = R2). Гамильтониан и сопряженная система здесь имеют вид (3.7) и
(3.8). Максимум функции H (3.7) по u1 и u2 без учета (3.6) определяется соотношениями (3.9):
- _ У 2 - _ У 4
u1 -
а 1
u 2 -
а 2
(3.10)
^(t) ; u 2 (t) -
а,
а.
(3.9)
С помощью этих соотношений формируются опорные программы управления для задачи (3.1) - (3.4), (3.6).
Если л1 и1 + Л 2 < 2Е0, когда имеет место
Л1V2 / а? + Л 2 V2 / а22 < 2Е0, то (3.10) суть оптимальные значения управляющих параметров.
Если же л 1 и2 + Л 2 > 2Е0, то максимум функции Н (3.7) по и1 и и2 следует отыскивать с учетом (3.6), которые в этом случае выполняются как равенство:
Л1 и2 + л 2и2 = 2Е0. (3.11)
Итак, с учетом (3.11) найдем максимум
функции Н (3.7) по и1 и и2 с помощью метода множителей Лагранжа [10] и с этой целью в рассмотрение введем вспомогательную функцию:
¥(и1,и2,X) = Н(и1,и2) +1X(л^ +л2и2 -2Е0)
,
где X - множитель Лагранжа. Вычисляя частные производные от ¥ по и1 и и 2, а затем приравнивая их к нулю:
д ¥
= -а1 и 1 +у2 + Х'л1 и 1 =0;
дпх
д F
ди 2
= -а2 и 2 + V4 + Хл2 и 2 = 0,
получим следующие соотношения для оптимальных управляющих параметров:
^ 2 . и П) = V 4
^(Х) =
а1 -хл1
U 2(Х) =
а 2 -Хл:
. (3.12)
носительно
X:
Л^ 2
Л 2 V 4
= 2Eо. (3.13)
Х =
1 -.
|Л( V 2 + V 4) 2 E 0
< 0.
ui(t) =
V20 - V10 t _ .-7 V10 t
а,
= U10
а,
u 2(t) =
V40 -V30 V30 t
а.
= u 20
а
Исключая t из этих соотношений, получим в координатной плоскости O u1 и 2 уравнение прямой, проходящей через начальную точку А (при t = 0) с координатами (U10, U20):
_ _ а 1 v30 _ _ и2 = и20 +-(и1 - U10) . (3.15)
а 2V10
Моменту t = T на этой прямой отвечает точка В с координатами (и1 f, и2f), где u1f = u1(T), u2f = u2(T). Для определенности пусть A £ UE и B е UE ; тогда прямая (3.15) пересекает границу UE только в некоторой точке С (рис. 1). В начальный момент времени линии уровня функции H (3.7) в плоскости O u1 u 2 суть эллипсы с центром в точке А:
а1(и1 - u10)2 + а2(и2 - u20)2 = 2(1-y)H0, (3.16)
Следуя геометрической интерпретации для метода множителей Лагранжа и учитывая достаточные условия максимума ¥ по и1 и и2, можно показать, что здесь (в области иЕ \ диЕ ) должно быть Х< 0. Для значений (3.12) должно выполняться равенство (3.11), которое в этом случае будет представлять собой уравнение от-
где
H (u10>"-20
) = H0 = -0 2
2 2 ^ V 20 + V40
а,
а„
+ V10 *20 +V30 У20
а < у < 1.
Очевидно, что при некотором у* < 1 точка О - точка касания эллипсов (3.11) и (3.16); в соответствии с (3.12) ее координаты суть
V 20 и П Ч = V 40
>(X 0) =
а 1 -X 0 Л1 '
u-
,(X 0) =
а 2 -X 0 Л 2
, где
(а!-ХЛ1> (а 2 -ХЛ 2)2
которое в общем случае является алгебраическим уравнением четвертой степени.
Отметим, что в частном случае, когда Л] = Л 2 = Л — 1 и а 1 = а 2 = 1, вместо (3.13) получим: V 2 + V 4 = 2 Е 0(1 — X )2, а отсюда с учетом Х< 0 следует
. С 1,2.. 2.x Л
В общем же случае необходимо решать уравнение (3.13) относительно X, что допускает соответствующую геометрическую интерпретацию. В связи с этим предположим, что были найдены с учетом граничных условий (3.2) и (3.3) решения системы уравнений (3.8) для рассматриваемой задачи:
V2(t) = V20 - V10t; V4(t) = V40 - V30t. (3.14)
С учетом (3.10) отсюда следуют такие программы управления:
X = X0 отвечает моменту времени I = 0. При изменении значения и1 от м10 до и1 у (или и2 от и 20 до и 2у, если и1 = м10) точка О скользит по дуге эллипса (3.11), а точка (и1, и 2) - по отрезку АВ, до совмещения с точкой С в момент, когда точка (и1, и 2) достигает границы иЕ .
В отмеченном выше частном случае: Л1 = Л 2 = Л — 1 и а 1 = а 2 = 1, эллипсы (3.11) и (3.16) вырождаются в окружности, поэтому при изменении значения и1 от и10 до и1 у значения параметров (3.12) будут изменяться пропорционально в сравнении с (3.10), с точностью до множителя. Действительно, в этом случае
u1 =
V 2
2E 0
V 2
1 -Хл
V 4
1 -Хл
-y/v 2 +V 24
л
2 E 0
V 4
Л Vv 22 +V 24
Представляет интерес еще один частный случай, для которого а 1 = Л1, а 2 = Л 2 и Л1 ^ Л 2. В этом случае эллипсы (3.11) и (3.16) будут подобными и, соответственно, вместо (3.13) получим квадратное уравнение относительно X :
и 2 =
V 2
V 24
= 2Е 0.
Л 1(1 — А.)2 Л 2(1 — А)2
и для найденного значения множителя Лагран-жа оптимальные значения управляющих параметров тогда будут равны:
и1 =
и 2 =
V
В общем случае множитель Лагранжа находится из решения уравнения (3.13), что позволяет определять оптимальные значения параметров (3.12) при проведении коррекции опорной программы управления (3.9), когда иЕ с и12 .
Для получаемых значений А = А < 0 вычисление оптимальных значений управляющих параметров по (3.12) означает коррекцию значений опорных значений из (3.10) следующим образом:
йх = и1 / к1; й2 = и 2 / к2. (3.17)
/ 1 |А|Л1 , Здесь к 1 = 1 +-> 1,
а
к 2 = 1 +
А1 л 2
> 1 -
коэффициенты, которые задают перераспределение энергетического ресурса между объектами управления (3.1) в том случае, когда ограничение (3.6) для корректируемой опорной программы управления (3.9) эффективно и
иЕ с и12.
В том случае, когда и12 с иЕ = Я2, коррекция опорной программы управления (3.9) также допускает геометрическую интерпретацию, показанную на рис. 2.
На плоскости О и1 и 2 программе (3.9) отвечает прямая (3.15), на которой лежит отрезок АВ; точка А с координатами (и10, и20) и точка В с координатами (и1 ^, и 2^ ), а для определенности принято: А £ и12; В е и12, так, чтобы отрезок АВ пересекал границу и12 в некоторой точке С.
тт — — —*
При изменении значения и1 от и10 до и1 эллипс (3.16) касается области и12 в ее угловой точке Б; в этом случае й1 = т1 и и 2 = т 2 (поскольку точка Б находится в положительном
квадранте О и1 и 2) и, соответственно, при дол * —* —*
стижении точки А : и2 = т2 (а и 1 > т1). При дальнейшем изменении и1 точка О' скользит по границе и12 (и1 = т1, и2 =v2 / а2), а точка А' - по отрезку АВ, до их совмещения в точке С
а 2
и после ее прохождения
- А' е и,.
и
Н (и15 и 2) = у * Н0
Рис. 1
1
В общем случае, учитывая неэффективность ограничения (3.6) и результаты п. 2.2, соотношения, необходимые для формирования программ оптимального управления, здесь имеют следующий вид:
[y2(i)/ а15 |y2(i)|<a1/w1;
u,(t) = <!
[m^ign у2(t), 1 V2(t)l >a1m1 r (3.18)
|y4(t)/a2, | y4(t)| <a2«2;
u 2(t) = ^ ,
Sign у4(t), 1 ^4(t)| >a 2m2,
то есть в силу отсутствия совместного ограничения на управляющие параметры в системе (3.1) коррекция программ (3.9) распадается на пару независимых процедур коррекции для каждого объекта управления в (3.1).
В заключение этого подраздела отметим, что процедура коррекции опорной программы управления (3.9) является итерационной и для нее в качестве начального приближения при формировании функций (3.14) можно принимать значения у0, i = 1,2,3,4, вычисляемые по формулам (2.11). В конечном счете, решение рассмотренных задач оптимального управления для системы (3.1) - (3.3) сводится к решению соответствующих краевых задач [6, 8, 9], для которых каждое приближение реализуется по изложенным выше схемам коррекции опорных программ управления (3.9), что приводит, в свою очередь, к изменению положения отрезка AB относительно множества U* (см. рис. 1 и 2)
на каждой коррекции с учетом (3.15). Очевидно также, что на каждой итерации локальные (поточечные) операции коррекции проводятся с учетом соотношений (3.17) или (3.18).
Также отметим, что в том случае, когда иЕ с и12, согласно (3.17) получаемая программа оптимального управления на подынтервалах коррекции будет характеризоваться полным и согласованным использованием энергетического ресурса управления.
3.4. Рассмотрим теперь общий случай решения задачи (3.1) - (3.6), когда для параметров ограничений (3.5), (3.6) выполняются следующие условия:
11 < у! 2Е0 / л1 и/или т 2 < ^ 2Е0 / л2 ;
m,
Л 1m2 +Л 2m2 > 2Eo.
(3.19)
Следуя геометрическим интерпретациям в п. 3.3, отметим, что и в данном случае также можно провести соответствующий анализ процедуры коррекции опорной программы управления (3.9) с учетом (3.19). Для этого необходимо построить отрезок прямой (3.15) в плоскости О и 1 и 2, начало которого - точка А с координатами (и10, и 20), а конец - точка В с координатами ( и1 ^, и 2^). Если отрезок АВ лежит вне выпуклой области и * = и12 П иЕ множества допустимых значений управляющих параметров (исключая точки касания границы ди*), то это означает
отсутствие решения рассматриваемой задачи для заданных Т и параметров ограничений (3.19). Варианты расположения отрезка АВ относительно и определяются следующими условиями: 1) А, В е и *, когда АВ с и *; 2) А £ и * , В е и * или А е и *, В £ и *, то есть АВ пересекает границу области и * только в одной точке; 3) А £ и *, В £ и *, но АВ П (и * \ ди *) Ф 0.
Очевидно, что в первом варианте ограничения (3.5) и (3.6) неэффективны, то есть в этом случае проведение коррекции программы (3.9) не требуется. В остальных вариантах коррекция опорной программы (3.9) требуется на подынтервалах интервала управления, когда значения
(3.10) находятся вне области и *. Для определенности будем рассматривать вариант А £ и *, В е и , в котором точка С - точка пересечения АВ с границей и *: ди* = ди* и ди2 и ди*Е, где фрагменты границы и * задаются так: ди * = {(и1з и 2): | и11 = т1з лИ < 2Е 0 — л 1т21'};
ди 2 = {(и1з и 2): л и2 < 2Е0 — Л2т2, | и 21 = т2};
ди*Е = {(ири2): |и1 |<т1,|и2 |<т2, л и + Л2и2 = 2Е0}.
Рассмотрение остальных вариантов, когда отрезок АВ пересекает границу и *, не требуется, поскольку оно проводится аналогичным образом.
Итак, вначале дадим геометрическую интерпретацию коррекций в каждой точке отрезка АВ при изменении и1 от и10 до его значения в точке С - и1 . Как и в п.3.3, рассмотрим в каждой точке с координатами (и 15 и2) - А' е АС функцию Н(и х, и 2) (3.7), образующую эллиптический параболоид с вершиной в точке
(и1, и2,Н0), где Н0 определено в (3.16). Для любого у< 1 линии уровня Н(и 1зи2) = уН0 в плоскости О и1 и 2 суть эллипсы с центром в точке (и 1, и 2), которые описываются уравнением (3.16). Таким образом, чтобы найти для и1 и и2 скорректированные значения управляющих параметров необходимо, как и ранее, при некотором у* < 1 определить точку касания эллипса (3.16) с границей и *, которая на рис. 1 и 2 обозначалась как точка О. Следует отметить, что при изменении и1 от и10 до и* точка касания О е ди * в зависимости от положения отрезка АВ относительно и может перемещаться по разным фрагментам ди *. Соответственно, если О е ди*, то схема коррекции идентична рассмотренной в п. 3.3 для случая иЕ с и12, если же О е ди* или О е ди*, то соответствующая
схема коррекции только для одного из этих случаев будет рассмотрена далее, так как для другого она идентична.
Переходя к изложению требуемой схемы коррекции, примем, для определенности, что
D еди* ф 0 ( m * 2E0 / л* ). Поскольку | у 2(t)| >а * m *, то скорректированное значение й* будет равно й* = m* sign у2. При этом с учетом третьего неравенства (3.19) тогда также имеет место | у 4(t) | < а 2m 2, то есть тогда здесь должно быть й 2 =у4 / а2. Покажем это, максимизируя гамильтониан H (й й 2) (3.7) по й2 при фиксированном й* = й* = m* sign у2 и при условии (3.6).
В соответствии с методом множителей Ла-гранжа в этом случае требуется найти максимум для вспомогательной функции:
F(û1,u2,w,X) = Н^и^+Цл^ +Л2«2+ w2 - 2E0)
где X - множитель Лагранжа, а w - дополнительная переменная [10]. Итак, вначале получим
д F
= -а2й2 + у4 +2Хл2 й2 = 0 ;
дй 2
а затем найдем
dF
-= 2 Xw = 0,
д w
й 2 =
У 4
а 2 - 2Хл
(3.20)
2
Поскольку
д2 F ^ д2 F
— = -а2 + 2Хл2, ^ = 2X,
дй
2
д w
2
д2 F дй 2 д w
= 0, постольку максимум функции F
по и 2 и и достигается при условии, что X< 0, а при X = 0 из (3.20) получим и2 =V4 / а2. Подставив (3.20) в ¥, получим функцию ¥ (X) и из условия ее максимума по X определим:
л ^ 4
(а2 - 2хл2) =
2E0 -л*m2 -w2
(3.21)
Учитывая, что Xw = 0, получим: во-первых, если и Ф 0, то X = 0, и, стало быть,
из
(3.20)
и
(3.21)
следует
и л 2й 2 = 2E0-л * m2 - w2,
да у24 < а 2(2E0 -Л1 mj2)/ л w = 0, то X < 0
ï 2 =у4 / а2 а отсю-
если
u 2
то
2
и
2 ; во-вторых, поэтому здесь
= (2E0 - л*mj ) / л2, а из (3.21) тогда найдем
X = -
2 л 2
у 4
V(2E 0-л*m2)/л2
< 0
*
или у^ >a22(2Е0 — л 1 mj2)/л2. Для полученного значения X из (3.20) найдем, что
Л 2U2 = 2E0 — л1 mj2, то есть располагаемый ресурс управления в этом случае используется полностью, что возможно только в точках конкатенации фрагментов 3U* и dU*E.
Таким образом, оптимальные значения управляющих параметров будут определяться в рассматриваемом случае соотношениями: u J у 4/ a 2, y24<a22(2E — Л:»!?)/Л2; (3 22)
2 "[signУ4^(2ЕО—Л1»12)/Л2 , У24 >a2(2E0—Л1»)/Л2- ( . )
Аналогичный результат будет получен и в случае, когда D е dU*2, то есть в том случае, когда | у 4(t)| >a 2m 2 и U 2(t) = m 2 sign y4(t) ,а именно:
u =| У2/ai у22 <a2(2E0 — r|2m2)/r2;
Ul "[signУ2^(2Eo — л»»)/|, y22>a2(2E—|2m22)/Л (3.23)
Таким образом, с получением соотношений (3.22) и (3.23) завершается изложение схемы коррекции опорной программы управления (3.9) в общем случае решения задачи (3.1) - (3.6).
ЗАКЛЮЧЕНИЕ
В соответствии с концепцией физической теории управления А. А. Красовского [1] дана общая постановка задачи оптимального распределения единого ресурса управления между независимыми объектами управления. В качестве распределяемых ресурсов, необходимых для создания управляющих воздействий, рассматриваются энергетический и материальный ресурсы управления. В настоящей части статьи приведено решение задачи оптимального распределения между парой независимых объектов управления, представленных двойными интеграторами, ограниченного скоростью расходования энергетического ресурса - мгновенной мощностью, необходимой для создания текущих управляющих воздействий. Кроме того, для выявления и анализа закономерностей распределения ресурса между парой двойных интеграторов приведены общие решения задач оптимального управления для двойного интегратора на быстродействие и на минимум «энергии управления» в случае задания произвольных граничных условий. Изложены результаты анализа распределения энергетического ресурса с учетом различного
сочетания ограничений на управляющие параметры двойных интеграторов. Установлено, что в случаях доминирования ограничения на мгновенную мощность над ограничениями на величину управляющих воздействий ресурс управления расходуется в полном объеме и при сохранении соответствующих пропорций для рассматриваемых объектов управления. Решение задачи распределения материального ресурса для системы двойных интеграторов рассматривается во второй части настоящей статьи.
СПИСОК ЛИТЕРАТУРЫ
1. Красовский А.А. Проблемы физической теории управления // Автоматика и телемеханика. 1990. № 11. С. 8-28.
2. Беллман Р., Дрейфус С. Прикладные задачи динамического программирования. М.: Наука, 1965. 460 с.
3. Летов А.М. Динамика полета и управление. М.: Наука, 1969. 360 с.
4. Задача оптимального распределения ресурсов по множеству независимых операций / А.В. Арутюнов, В.Н. Бурков, А.Ю. Заложнев, Д.Ю. Карамзин // Автоматика и телемеханика. 2002. № 5. С. 108-119.
5. Пиявский С.А Оптимизация ресурсных систем // Проблемы управления. 2005. № 6. С. 28-33.
6. Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968. 764 с.
7. Красовский А.А. Системы автоматического управления полетом и их аналитическое конструирование. М.: Наука, 1973. 558 с.
8. Математическая теория оптимальных процессов / Л. С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелид-зе, Е.Ф. Мищенко. М.: Наука, 1976. 392 с.
9. Моисеев Н.Н. Элементы теории оптимальных систем. М.: Наука,1975. 528 с.
10. Бертсекас Д. Условная оптимизация и методы множителей Лагранжа. М.: Радио и связь, 1987. 400 с.
TO THE PROBLEM OF OPTIMAL RESOURCE ALLOCATION IN THE SYSTEM OF INDEPENDENT CONTROL OBJECTS. I
© 2017 Yu. N. Gorelov
Samara National Research University named after Academician S.P. Korolyov
The formulation of the optimal control resource allocation problem in a system of independent control objects. As resources necessary to create the control actions are considered energy and material resources control. With the purpose of revealing the features of the distribution of the resource, limited by the speed of its expenditure, a solution is given to the problem of the optimal distribution of the energy resource between a pair of independent control objects represented by double integrators. In addition, to analyze the regularities of resource distribution between a pair of double integrators, general solutions of optimal control problems for a double integrator for speed and minimum for «control energy» are given in the case of specifying arbitrary boundary conditions. The results of analysis of distribution energy resource (instantaneous power) based on various combinations of restrictions on the control parameters of the double integrators. The solution of the problem of the distribution of a material resource for a system of double integrators is considered in the second part of this article. Keywords: control resource, optimal resource allocation, a system of independent control objects, double integrator, energy resource control
Yury Gorelov, Doctor of Technics, Director of Institute for Modeling and Control Sciences. E-mail: [email protected]