УДК 62-52
О СУБОПТИМАЛЬНОМ УПРАВЛЕНИИ НЕЛИНЕЙНЫМИ СИСТЕМАМИ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ
© О.В. Ведищева, С.В. Диденко, Т.Б. Заусонина, С.М. Лобанов
Vedisheva O.V., Didenko S.V., Zausonina Т.В., Lobanov S.М. On sub-optimal non-linear system control according to the quadric criterion. The article looks at the problem of controlling one class of non-linear systems on the basis of the quadric criterion, which cannot be reduced to the problem of the state regulator. To estimate the optimal control, a special method is used in this problem of sequential approximations that converges at each quite small interval of time. This allows achieving the desired estimation out of solving a certain two-point edge problem.
Ведение. Рассмотрим нелинейную динамическую систему, характеризуемую уравнением
х = Ах + Ви + }(х, и), (0.1)
в котором х = (х1,.. .,хп) — п-мерный действительный вектор состояния, и = (и1,..., ит) — т-мерный действительный вектор управления, А и В - действительные (п х п)- и (п х т)-матрицы, а / = {}1,..., /") — векторная функция, определенная и непрерывная вместе со своими частными производными
и
дГ . .
г=1 з = 1
в пространстве Е"+т.
Предположим, что начальное состояние
х(г0) = с (0.2)
задано, а задача управления системой (0.1) заключается в минимизации функционала
т
</(«) = \ У[(е(г),<Эе(*))-|-
*0
+(и{г),Яи{ЩсИ+(е(Т),Ре(Т)), (0.3)
в котором Т — фиксированное конечное время, <3 и Р — положительные полуопределенные (п х п)-матрицы, Л — положительно определенная (ш х т)-матрица и е(1) — ошибка системы, т.е.
е(£) = х(Ь) —
для всех значений £0 < £ < Т, где г = (г1,..., гп)
— 7г-мерный действительный вектор, характеризующий заданный режим функционирования системы (0.1).
Во многих практических ситуациях режим г(1) устроен достаточно плохо и задача (0.1)— (0.3) не может быть сведена к задаче о регуляторе состояния (см., например, [1, с. 657]). При этом, если влиянием функции / на систему (0.1) по каким-либо причинам можно пренебречь, то сформулированная выше задача достаточно проста и ее, видимо, можно считать полностью решенной (см., например, [1, 2]). Кроме того, весьма важным представляется то обстоятельство, что здесь решение удается получить в виде закона управления с обратной связью. В общем случае для получения оценок решения (или собственно решения) задачи (0.1)- (0.3) в виде закона управления используют различные методы, которые в той или иной форме используют линеаризацию и, возможно, последовательные приближения (см., например, [2- 4]).
Основной целью настоящей работы является разработка метода, приводящего к конструктивной процедуре получения оценки решения задачи (0.1)—(0.3) в виде закона управления с обратной связью. Данный метод позволяет в некоторых случаях получить искомую оценку из решения двухточечной краевой задачи.
1. Метод последовательных приближений. Следуя [3], рассмотрим задачу о минимизации функционала т
Ли) = у ^ [(е(*),<Эе(г))+
*0
+<«(*), Ди(0)] Л + <е(Т), Ре{Т)) (1.1)
с ограничением
+ KN+](t)BN(t)R - BN(i)Kx+\(t) - Q
x = g(x,u), x(t0) = c,
(1.2)
где д = (д1,..., дп) — нелинейная векторная функция, определенная и непрерывная вместе со своими частными производными
д£_ dxJ ’
i,j = 1, — ,тг
д9
диУ‘
г = 1 j = 1,... ,тп
в пространстве Ж”+га.
Пусть «/у(£), Хл/(£) — некоторое Л'т-е приближение к оптимальному управлению и состоянию в задаче (1.1), (1-2). Тогда (Л7 + 1)-е приближение им+ 1^),Хм+1^) может быть получено как решение задачи о минимизации функционала
т
1лг+1(ы) = \ J[(е(<),<9е(£))+
+ («(*), Яи(1))] сН + <е(Т), Ре(Т)> (1.3)
с ограничением
х = д{хм,ик) + Ак(г)(х - ялг) + Вх(г)(и - ад),
ж(£о) = с, (1.4)
в котором Лдг(£) и Д\г(£) — действительные (п х п)- и (п х т)-матрицы, задаваемые равенствами
Х—Х АГ (£) U=UN(t)
Х—Х N {t) U=UN (t)
(1.5)
(1.6)
соответственно.
Задача (1.3), (1.4) представляет собой вариант задачи слежения для линейной системы и ее решение, как известно, дается законом управления с обратной связью
илг+1(£) = Д_1Б^(£)[Лл'+1(£)-
-Кн+1(£)а;лг+1(£)3, (1.7)
в котором Кк+х(£) — решение матричного дифференциального уравнения Риккати
= -Клг+1(£)^4лг(£) - А^(£)^^+г(£) +
(1.8)
с граничным условием
Км+г(Т)=Р, (1.9)
а /&лг-и (1) — решение линейного дифференци-
ального уравнения
Ьы+гЦ) = — [Лдг(4) —
—Вм{р)Я~1 В^[1,)Км+1(£)]'Л,^+1(£) — -(?г(£) + А'Л^+1(£)[р(а:^(0>«лг(£))--Алг(£)жлг(<) - Ду(£)г*л'(£)] (1-Ю)
с граничным условием
Ллг+1(Т) = дг(Т) (1.11)
(см., например, [1, с. 699]).
Если построенные выше последовательности
(1.12)
(1.13)
равностепенно непрерывны и равномерно ограничены на отрезке [£о,Т], то из (1.12) и (1.13) можно выбрать подпоследовательности
UN! > МЛГ2
(1.14)
(1.15)
равномерно на [£о, Т] сходящиеся к некоторым непрерывным функциям х* и и* соответственно, где
lim Nk = 00.
k—>00
Тогда, если окажется, что последовательность
(1.14) совпадает с последовательностью (1.12), а последовательность (1.15) — с последовательностью (1.13), то, используя соотношения
(1.5)—(1.11), можно рассмотреть и вопрос о том, будет ли и* (t) оптимальным управлением в задаче (1.1), (1.2).
Заметим теперь, что показать эквивалентность последовательностей (1.12), (1-14) и (1.13),
(1.15) в общем случае совсем непросто. Однако, для задачи (0.1)—(0.3) несложно построить метод последовательных приближений, идейно близкий к упомянутому выше, но не имеющий формальных проблем со сходимостью, если время Т достаточно мало.
Именно, для всех значений N = 0,1,2,... рассмотрим задачу о минимизации функционала
Jn+
.(«) = ! t))+
(u(t),Ru(t) )\dt\ (с(Т),Рс(Т) )
(1.16)
принимающих значения в пространстве IRm и
с ограничением
х = Ах + Ви + /(xjv,ujv), x(to) = с. (1-17)
Для заданных функций ждг и оптимальное управление un+ i(£) в задаче (1.16), (1.17) дается законом управления с обратной связью
UN+l(t) =
= R-'&lhfr+^t) - K(t)xN+1(t)], (1.18)
в котором XN+i(t) — решение уравнения (1.17), соответствующее un+i (t) и удовлетворяющее начальному условию
ЯЛГ+і(іо) = с,
K(t) — решение матричного дифференциального уравнения Риккати
k{t) =
= -K(t)A - A'K(t) + K(t)BR-lB'K(t) - Q
(1.19)
с граничным условием
К(Т) = Р,
(1.20)
а /глг+1(^) — решение линейного дифференциального уравнения
кы+!(*) = -[Л - ВЛ-1В'А-(*)],Ллг+1(*)-
-<9г(£) + К(г)Лхк^),ик^)) (1.21)
с граничным условием
Ллг+1 {Т) = <Эг{Т). (1.22)
Таким образом, если начальное приближение хо(£),гю(£) задано, то соотношения
(1.18)—(1.22) определяют схему последовательных приближений, которая, как будет показано ниже, при всех достаточно малых значениях Т позволяет получить достаточно хорошее приближение к решению задачи (0.1)—(0.3). Именно эта схема и будет рассматриваться в дальнейшем. Отметим также, что для простоты начальное приближение здесь будет определено соотношениями
х0 (*)=с (1.23)
и
и0(*) = Я-1В'[(}г(Т) - Кфс]. (1.24)
2. Основная теорема. Пусть — множество функций, определенных на отрезке [£о,Т],
суммируемых с квадратом по Лебегу на [£о -Т]. Далее, пусть Ь\ — часть множества такая, что для каждой функции и £ урав-
нение (0.1) имеет абсолютно непрерывное решение х(Ь), определенное для всех значений Ьо < t < Т и удовлетворяющее начальному условию (0.2). В этих обозначениях имеет место следующая
Теорема. Пусть функция / = (/*,..., /") определена и непрерывна вместе со своими частными производными
др
Ё1
dvJ
дхГ М-1»--."
т, і = 1,... ,n, j = 1,... ,т
в пространстве Кп+,п . Тогда для каждой точки (1(). с) пространства Е1+п найдется такое действительное число То > іо, что для всех значений іо <Т < То справедливы равенства
lim UN{t) = и* (t) N-їсо
lim xn (t)=x*(t),
TV—»oo
(2.1)
(2.2)
где сходимость равном,ерна на отрезке [<о-Т], и*(Ь) — некоторая функция, определенная и непрерывная на [£о, Т], а х*(Ь) — соответствующее решение уравнения (0.1) с начальным условием
х*% )=с. (2.3)
При этом оказывается, что для всех значений Ь0 < г <Т
«*(*) = Д_1В'[Л*(*) - К^)х*^)\, (2.4)
где Л*(£) — решение дифференциального урав-
нения
к*(1) = —[А - ВВГгВ,К{$У[ЪГ#) - д*(*)+ +*(*)/(*’(*), «*(*)) (2.5)
с граничным условием
/г*(Т) = С}г{Т). (2.6)
Более того, для каждой функции и £ Ь\
Нт = ./(«*) < Нт 7лг(м). (2.7)
,Л/—>-оо ЛГ—>оо
Доказательство. Пусть Х(£) и Н{{) решения линейных матричных дифференциальных уравнений
Х = [А- ВЦ-1В'К({)\Х, Х^0) = Е
и, соответственно,
я = -[А-ВВГ'В'КЩ'Н, н{т) = Е,
где Е — единичная (п х тг)-матрица. Тогда при использовании управления (1.18) уравнение (1.17) эквивалентно уравнению
хк+1Ц) =
ь
= х(г)с +1 х(г-т)[шг1в'лм+1(т)+
*0
+/(хм(т),им(т))]йт, (2.8)
а уравнение (1.21) с граничным условием (1.22)
— уравнению
Ллг+1 (0 = Я(*)дг(Г)+ (2.9)
г
+
! Я(/ - т)(К(т)/(хм(т),им(т)) - С)г{т)) (1т.
Принимая во внимание (2.9), перепишем уравнение (2.8) в следующем эквивалентном виде:
жлг-н(г) =
V
= Х(і)с + ! Х(і-т){}{хк{т),им(т))+
їо
+Бд-1я'[я(т)дг(т)+
г
J Н(т-з)(К(з)/(хк(з),ик(з))-(2г(8)) е/я]} йт.
+
Тогда с учетом (1.18) система (2.8), (2.9) может быть представлена в символической форме
ь
жлг-н(*) = Х(Ь)с + ! [/1 (г, т, жлг (т),/глт(т)) + и>
+
1
У /2(т, в, хм (з), Лл-(в)) <ів] с/г, (2.10)
/ідг+і(£) = Н{і)Ь0 + / /з(*,г,жлг(г),/1лг(г))йг,
(2.11)
где
/г0 = <5 -г СО,
а Л = (Л1,--.,/Г), /2 = (/!,...,/2П) и
/з = (/з і • • -1 /з*) — соответствующие векторные
функции, определенные и непрерывные вместе со своими частными производными
9// <9//
•'< 7 7 — 1 77 / — 1 2 4
в пространстве [£о,Т] х [<о,Т] х М2".
Пусть теперь а — некоторое положительное число. Обозначим через 5 — множество точек (£, х,Н) £ Ж1+2,г, для которых выполнены неравенства
£0 < £ < Т, |®-с| < а, \Ь — Ло| < о, (2-12)
где |®| — евклидова длина вектора х. Так как Е — компактное множество, то найдутся такие положительные числа М и Ь, что для всех значений /, х и /г, удовлетворяющих условиям (2.12), при /о <т<Т выполнены неравенства
!/;(£, т, х, И)I < М, I- 1,2,3
д}}(і,т,х,Ь)
дхі
< Ь.
д/і(і,т,х, К)
г, І = 1,, гг, / = 1,2,3.
(2.13)
<Ь,
(2.14)
Обозначим через Г!! множество всех непрерывных пар (х, //) функций, определенных на отрезке [/о,Т], принимающих значения в пространстве К" и при /о < Ъ < Т удовлетворяющих условиям
|х(/) — с| < а, |Л(<) — /701 < а,
(2.15)
т.е. Г2 — множество непрерывных пар (х, К) функций, графики которых лежат в Е. При этом будем рассматривать часть Пт множества П, такую, что наряду с неравенствами (2.15) при (ж, /г) £ Пт выполнялись бы также неравенства
|Х(*)с-с|<|-, |Я(<)Ло — Ло| < | (2.16)
\х{ї)-Х{Щ < —,
|Л(*)-Я(*)/ю|<|-. (2.17)
Тогда в силу неравенств
\х(і) ~ с\ < \х(і) — X(/)с| + |X(£)с — с|
и
|/г(/) - /г0| < |/і(і) - Я(/)/г0| + |Я(/)/і0 - Л,0|
из условий (2.16) и (2.17) следуют неравенства
(2.15) и, таким образом, принадлежность пары (х, И) к множеству Г2.
Для всех значений £о < t < Т положим
Ф) = Ы*), М<))
и будем говорить, ЧТО 1р € Пт, если (х, К) е Пт-Обозначим через Р оператор, задаваемый правыми частями системы (2.10), (2.11). Тогда, как легко видеть, если число Т достаточно мало, то из принадлежности </з к Пт следует принадлежность к Пт и функции
у* =
(2.18)
где у* = {х*,к*).
В самом деле, для того чтобы функция (р*, задаваемая соотношением (2.18), принадлежала к множеству Пт, достаточно, чтобы при выполнении условия (2.16) для всех значений <о < £ < Т были выполнены также и неравенства
|х*(*) - Х(1)с\ < |Л*(*) - Я(*)йо| <
Но в силу (2.10), (2.11) и (2.13) имеем |Л*(*)-Я(*)Ло| =
/з (*,т,х(т),/і(т))гіт
\х*(і)-Х(і)с\
< М(Т - іо)
[/і(і,т,х(т),/і(т))+
1
+ J /2(г,5,х(в),/г(8))гів]сг7
г
<М((Т-іо) + 1)(Т-іо). Отсюда следует, что при
М((Г-*,) + 1)(Г-*„)<£
<
(2.19)
условие, предъявляемое к оператору Р в (2.18), выполнено.
Пусть теперь (/з = (х, /г) и ф — (у, д) — некоторые две функции, принадлежащие к множеству Пт- Тогда при выполнении неравенства
(2.19) функции
Ф* = Рір
ф* = Гф
также принадлежат к Пт, где <-р* = (х*,/г*) и ф* = (у* ,д*). При этом оказывается, что
- ф*\\ = \\Fif - ^11 < *||*> - П, (2-20)
где
ІМІ = тах■ И*)1
ГО
и А: — некоторое положительное число, не зависящее от 1р и ф и при всех достаточно малых значениях Т > удовлетворяющее условию
к < 1.
(2.21)
В самом деле, в силу неравенств (2.14) и формулы Лангража для всех значений ^ < Т и *0 < т < Т
|/г(г,т,х(т),й(т)) - Ш,т,у{т),д{т))\ <
< п2Ь(\х(т) - у(т)| + |/г(т) - д(т)|), (2.22)
I = 1,2,3
(см., например, [5, с. 163]). Поэтому т
![/з(і,т,х(т),Л(т)) - /з(*,т,ї/(т),0(т))]гі
< (2.23)
< П2Ь[ J |х(т) - г/(т)| «гг + J |/г(т) - р(т)| гіг].
Но
J |х(г) - у(т)І гіг < I \<р(т) - ф(т)\<1т (2.24)
і I
И
т т
J \Цт) - д(т)\с1т < ! \<р(т) - ф(т)\<іт. (2.25) £ £
Тогда, если
т
/і*(£) = Н{і)Но 4- У /з(*,т,ж(т),Л(т))(іт £
и
т
2*(г) = Я(*)Ло + J /з(*,т,г/(т),д(т))гіт,
то из неравенств (2.23)—(2.25) следует, что \\h*-g*\\ <2n2L{T-t0)\\y-il>\\. (2.26)
С другой стороны, в силу неравенства (2.22) t
J {fi(t,T,x(T),h(r))-
to
~fi{t,T,y(T),g(T))+
т
+ J[f-2{T,s,x(s),h(s))-
T
■f2(T,s,y(s),g(s))]ds}dT t
JО(т) - у{т)I + Ih(r) - #(т)|
to
T
J (\x(s) - y(s)I + Ih(s) - #(s)|) ds} a
(2.27)
< nzL
+
4o
I I
f \x(t) -y(r)\dT < J \ір(т) - ib(r)\dr (2.28)
to to
И
t t
J \h(r) -g(r)\dT < J \<p(t) -ip(T)\dT. (2.29)
to to
Тогда, если
t
ar(t) = X(:t)c + J[fi {t, T, x(r), h(r)) +
to
+
1
j f2(T,s,x(s),h(s))ds\dr
I
y*(t) = X(t)c+ J [fi(t,T,y(T),g(T))+
to
T
+ J f2(T,s,y(s),g(s))ds]dr,
T
то из неравенств (2.27)—(2.29) и (2.24), (2.25) следует, что
и * *11^-
If -у II <
< 2п2ЩТ - /о) + 1)(Г - 10)Ь - П- (2-30)
При этом, согласно неравенству треугольника, несложно заметить, что
у- Я!<1к*-Л! + 1|Л*-Л1- (2-31)
Поэтому, объединяя неравенства (2.26), (2.30) и (2.31), окончательно получаем, что
||^-П1 = 11*>-^11<
< 4п2Ь((Т — 40) + 1)(Т — Ьо)\\ф — фЦ. Таким образом, если
4п2Ь((Т - /0) + 1)(Т - £о) < 1, (2.32)
то, полагая
к = 4п21/((Т — /о) + 1)(Т — ^о),
видим, что при выполнении условия (2.32) выполнены также и условия (2.20) и (2.21). Сказанное означает, что существует такое действительное число То, что при < Т < Т0 число Т удовлетворяет условиям (2.19) и (2.32) и обеспечивает выполнение требований, предъявляемых к (2.18), (2.20) и (2.21). Поэтому везде в дальнейшем будем считать число Т заданным столь малым, что неравенства (2.19) и (2.32) для него выполнены.
Тля всех значений ^ < ( < Т и N = 0,1,2,... положим
<£лг(*) = (ялг(г), /Ьлг (*))
и построим последовательность функций
(р0, (2.33)
определенных и непрерывных на отрезке [<о, Т], в силу системы (2.10), (2.11) приняв
<£лг+1 =-Рулг, А" = 0,1,2,... (2.34)
V?o(f) = (с, /г0).
(2.35)
Поскольку функция (2.35) принадлежит к множеству Пт, то согласно равенству (2.34) все функции последовательности (2.33) также принадлежат к Пт- Рассмотрим функциональное уравнение
ср = Рф, (2.36)
в котором в силу условий (2.20), (2.21) Р является сжимающим оператором, отображающим множество Пт в себя. Поэтому уравнение (2.36)
имеет на множестве 1! решение <р*, которое может быть получено по формуле
<£>*(*) = Нт (2.37)
N->00
где сходимость равномерна на отрезке [£о,Т] (см., например, [5, с. 165]). Но, так как по построению
К = С)г(Т),
то согласно (2.35) последовательность (2.34) удовлетворяет начальным приближениям (1.23) и (1.24). Поэтому из равенств (1.18) и (2.37) следует существование функций и*(£) и х* (£), построенных по формулам (2.1) и (2.2), причем функция ж*(4) является соответствующим и*(1) решением уравнения (0.1) с начальным условием (2.3). При этом уравнение (1.21) с граничным условием (1.22) переходит в уравнение (2.5) с граничным условием (2.6), а закон управления (1.18) — в (2.4). Более того, по построению
Нт 7лг(млг) = J(u*)
N—>00
И
<7лг(^лг) <
для всех и € , откуда и следует цепочка (2.7).
Таким образом, теорема доказана.
Замечание. Необходимо отметить, что если задача (0.1) (0.3) имеет решение класса то цепочка (2.7) не гарантирует того, что функция и* будет именно этим решением. Другими словами, в общем случае функция и* является только лишь приближением к решению исходной задачи, качество которого оценивается цепочкой (2.7). При этом автономность системы (0.1) и постоянство матриц (?ийв настоящей работе фактически нигде не используется и приняты исключительно для простоты обозначений.
ЛИТЕРАТУРА
1. Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968.
2. Ли Э.Б., Маркус Л. Введение в теорию оптимального управления. М.: Наука, 1972.
3. Веллман Р. Процессы регулирования с адаптацией. М.: Наука, 1964.
4. Красовский А.А. Аналитическое конструирование контуров управления летательными аппаратами. М.: Машиностроение, 1969.
5. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1970.
Поступила в редакцию 25 октября 2002 г.