Научная статья на тему 'О субоптимальном управлении нелинейными системами по квадратичному критерию'

О субоптимальном управлении нелинейными системами по квадратичному критерию Текст научной статьи по специальности «Математика»

CC BY
82
24
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Ведищева О. В., Диденко С. В., Заусонина Т. Б., Лобанов С. М.

The article looks at the problem of controlling one class of non-linear systems on the basis of the quadric criterion, which cannot be reduced to the problem of the state regulator. To estimate the optimal control, a special method is used in this problem of sequential approximations that converges at each quite small interval of time. This allows achieving the desired estimation out of solving a certain two-point edge problem.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON SUB-OPTIMAL NON-LINEAR SYSTEM CONTROL ACCORDING TO THE QUADRIC CRITETION

The article looks at the problem of controlling one class of non-linear systems on the basis of the quadric criterion, which cannot be reduced to the problem of the state regulator. To estimate the optimal control, a special method is used in this problem of sequential approximations that converges at each quite small interval of time. This allows achieving the desired estimation out of solving a certain two-point edge problem.

Текст научной работы на тему «О субоптимальном управлении нелинейными системами по квадратичному критерию»

УДК 62-52

О СУБОПТИМАЛЬНОМ УПРАВЛЕНИИ НЕЛИНЕЙНЫМИ СИСТЕМАМИ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ

© О.В. Ведищева, С.В. Диденко, Т.Б. Заусонина, С.М. Лобанов

Vedisheva O.V., Didenko S.V., Zausonina Т.В., Lobanov S.М. On sub-optimal non-linear system control according to the quadric criterion. The article looks at the problem of controlling one class of non-linear systems on the basis of the quadric criterion, which cannot be reduced to the problem of the state regulator. To estimate the optimal control, a special method is used in this problem of sequential approximations that converges at each quite small interval of time. This allows achieving the desired estimation out of solving a certain two-point edge problem.

Ведение. Рассмотрим нелинейную динамическую систему, характеризуемую уравнением

х = Ах + Ви + }(х, и), (0.1)

в котором х = (х1,.. .,хп) — п-мерный действительный вектор состояния, и = (и1,..., ит) — т-мерный действительный вектор управления, А и В - действительные (п х п)- и (п х т)-матрицы, а / = {}1,..., /") — векторная функция, определенная и непрерывная вместе со своими частными производными

и

дГ . .

г=1 з = 1

в пространстве Е"+т.

Предположим, что начальное состояние

х(г0) = с (0.2)

задано, а задача управления системой (0.1) заключается в минимизации функционала

т

</(«) = \ У[(е(г),<Эе(*))-|-

*0

+(и{г),Яи{ЩсИ+(е(Т),Ре(Т)), (0.3)

в котором Т — фиксированное конечное время, <3 и Р — положительные полуопределенные (п х п)-матрицы, Л — положительно определенная (ш х т)-матрица и е(1) — ошибка системы, т.е.

е(£) = х(Ь) —

для всех значений £0 < £ < Т, где г = (г1,..., гп)

— 7г-мерный действительный вектор, характеризующий заданный режим функционирования системы (0.1).

Во многих практических ситуациях режим г(1) устроен достаточно плохо и задача (0.1)— (0.3) не может быть сведена к задаче о регуляторе состояния (см., например, [1, с. 657]). При этом, если влиянием функции / на систему (0.1) по каким-либо причинам можно пренебречь, то сформулированная выше задача достаточно проста и ее, видимо, можно считать полностью решенной (см., например, [1, 2]). Кроме того, весьма важным представляется то обстоятельство, что здесь решение удается получить в виде закона управления с обратной связью. В общем случае для получения оценок решения (или собственно решения) задачи (0.1)- (0.3) в виде закона управления используют различные методы, которые в той или иной форме используют линеаризацию и, возможно, последовательные приближения (см., например, [2- 4]).

Основной целью настоящей работы является разработка метода, приводящего к конструктивной процедуре получения оценки решения задачи (0.1)—(0.3) в виде закона управления с обратной связью. Данный метод позволяет в некоторых случаях получить искомую оценку из решения двухточечной краевой задачи.

1. Метод последовательных приближений. Следуя [3], рассмотрим задачу о минимизации функционала т

Ли) = у ^ [(е(*),<Эе(г))+

*0

+<«(*), Ди(0)] Л + <е(Т), Ре{Т)) (1.1)

с ограничением

+ KN+](t)BN(t)R - BN(i)Kx+\(t) - Q

x = g(x,u), x(t0) = c,

(1.2)

где д = (д1,..., дп) — нелинейная векторная функция, определенная и непрерывная вместе со своими частными производными

д£_ dxJ ’

i,j = 1, — ,тг

д9

диУ‘

г = 1 j = 1,... ,тп

в пространстве Ж”+га.

Пусть «/у(£), Хл/(£) — некоторое Л'т-е приближение к оптимальному управлению и состоянию в задаче (1.1), (1-2). Тогда (Л7 + 1)-е приближение им+ 1^),Хм+1^) может быть получено как решение задачи о минимизации функционала

т

1лг+1(ы) = \ J[(е(<),<9е(£))+

+ («(*), Яи(1))] сН + <е(Т), Ре(Т)> (1.3)

с ограничением

х = д{хм,ик) + Ак(г)(х - ялг) + Вх(г)(и - ад),

ж(£о) = с, (1.4)

в котором Лдг(£) и Д\г(£) — действительные (п х п)- и (п х т)-матрицы, задаваемые равенствами

Х—Х АГ (£) U=UN(t)

Х—Х N {t) U=UN (t)

(1.5)

(1.6)

соответственно.

Задача (1.3), (1.4) представляет собой вариант задачи слежения для линейной системы и ее решение, как известно, дается законом управления с обратной связью

илг+1(£) = Д_1Б^(£)[Лл'+1(£)-

-Кн+1(£)а;лг+1(£)3, (1.7)

в котором Кк+х(£) — решение матричного дифференциального уравнения Риккати

= -Клг+1(£)^4лг(£) - А^(£)^^+г(£) +

(1.8)

с граничным условием

Км+г(Т)=Р, (1.9)

а /&лг-и (1) — решение линейного дифференци-

ального уравнения

Ьы+гЦ) = — [Лдг(4) —

—Вм{р)Я~1 В^[1,)Км+1(£)]'Л,^+1(£) — -(?г(£) + А'Л^+1(£)[р(а:^(0>«лг(£))--Алг(£)жлг(<) - Ду(£)г*л'(£)] (1-Ю)

с граничным условием

Ллг+1(Т) = дг(Т) (1.11)

(см., например, [1, с. 699]).

Если построенные выше последовательности

(1.12)

(1.13)

равностепенно непрерывны и равномерно ограничены на отрезке [£о,Т], то из (1.12) и (1.13) можно выбрать подпоследовательности

UN! > МЛГ2

(1.14)

(1.15)

равномерно на [£о, Т] сходящиеся к некоторым непрерывным функциям х* и и* соответственно, где

lim Nk = 00.

k—>00

Тогда, если окажется, что последовательность

(1.14) совпадает с последовательностью (1.12), а последовательность (1.15) — с последовательностью (1.13), то, используя соотношения

(1.5)—(1.11), можно рассмотреть и вопрос о том, будет ли и* (t) оптимальным управлением в задаче (1.1), (1.2).

Заметим теперь, что показать эквивалентность последовательностей (1.12), (1-14) и (1.13),

(1.15) в общем случае совсем непросто. Однако, для задачи (0.1)—(0.3) несложно построить метод последовательных приближений, идейно близкий к упомянутому выше, но не имеющий формальных проблем со сходимостью, если время Т достаточно мало.

Именно, для всех значений N = 0,1,2,... рассмотрим задачу о минимизации функционала

Jn+

.(«) = ! t))+

(u(t),Ru(t) )\dt\ (с(Т),Рс(Т) )

(1.16)

принимающих значения в пространстве IRm и

с ограничением

х = Ах + Ви + /(xjv,ujv), x(to) = с. (1-17)

Для заданных функций ждг и оптимальное управление un+ i(£) в задаче (1.16), (1.17) дается законом управления с обратной связью

UN+l(t) =

= R-'&lhfr+^t) - K(t)xN+1(t)], (1.18)

в котором XN+i(t) — решение уравнения (1.17), соответствующее un+i (t) и удовлетворяющее начальному условию

ЯЛГ+і(іо) = с,

K(t) — решение матричного дифференциального уравнения Риккати

k{t) =

= -K(t)A - A'K(t) + K(t)BR-lB'K(t) - Q

(1.19)

с граничным условием

К(Т) = Р,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(1.20)

а /глг+1(^) — решение линейного дифференциального уравнения

кы+!(*) = -[Л - ВЛ-1В'А-(*)],Ллг+1(*)-

-<9г(£) + К(г)Лхк^),ик^)) (1.21)

с граничным условием

Ллг+1 {Т) = <Эг{Т). (1.22)

Таким образом, если начальное приближение хо(£),гю(£) задано, то соотношения

(1.18)—(1.22) определяют схему последовательных приближений, которая, как будет показано ниже, при всех достаточно малых значениях Т позволяет получить достаточно хорошее приближение к решению задачи (0.1)—(0.3). Именно эта схема и будет рассматриваться в дальнейшем. Отметим также, что для простоты начальное приближение здесь будет определено соотношениями

х0 (*)=с (1.23)

и

и0(*) = Я-1В'[(}г(Т) - Кфс]. (1.24)

2. Основная теорема. Пусть — множество функций, определенных на отрезке [£о,Т],

суммируемых с квадратом по Лебегу на [£о -Т]. Далее, пусть Ь\ — часть множества такая, что для каждой функции и £ урав-

нение (0.1) имеет абсолютно непрерывное решение х(Ь), определенное для всех значений Ьо < t < Т и удовлетворяющее начальному условию (0.2). В этих обозначениях имеет место следующая

Теорема. Пусть функция / = (/*,..., /") определена и непрерывна вместе со своими частными производными

др

Ё1

dvJ

дхГ М-1»--."

т, і = 1,... ,n, j = 1,... ,т

в пространстве Кп+,п . Тогда для каждой точки (1(). с) пространства Е1+п найдется такое действительное число То > іо, что для всех значений іо <Т < То справедливы равенства

lim UN{t) = и* (t) N-їсо

lim xn (t)=x*(t),

TV—»oo

(2.1)

(2.2)

где сходимость равном,ерна на отрезке [<о-Т], и*(Ь) — некоторая функция, определенная и непрерывная на [£о, Т], а х*(Ь) — соответствующее решение уравнения (0.1) с начальным условием

х*% )=с. (2.3)

При этом оказывается, что для всех значений Ь0 < г <Т

«*(*) = Д_1В'[Л*(*) - К^)х*^)\, (2.4)

где Л*(£) — решение дифференциального урав-

нения

к*(1) = —[А - ВВГгВ,К{$У[ЪГ#) - д*(*)+ +*(*)/(*’(*), «*(*)) (2.5)

с граничным условием

/г*(Т) = С}г{Т). (2.6)

Более того, для каждой функции и £ Ь\

Нт = ./(«*) < Нт 7лг(м). (2.7)

,Л/—>-оо ЛГ—>оо

Доказательство. Пусть Х(£) и Н{{) решения линейных матричных дифференциальных уравнений

Х = [А- ВЦ-1В'К({)\Х, Х^0) = Е

и, соответственно,

я = -[А-ВВГ'В'КЩ'Н, н{т) = Е,

где Е — единичная (п х тг)-матрица. Тогда при использовании управления (1.18) уравнение (1.17) эквивалентно уравнению

хк+1Ц) =

ь

= х(г)с +1 х(г-т)[шг1в'лм+1(т)+

*0

+/(хм(т),им(т))]йт, (2.8)

а уравнение (1.21) с граничным условием (1.22)

— уравнению

Ллг+1 (0 = Я(*)дг(Г)+ (2.9)

г

+

! Я(/ - т)(К(т)/(хм(т),им(т)) - С)г{т)) (1т.

Принимая во внимание (2.9), перепишем уравнение (2.8) в следующем эквивалентном виде:

жлг-н(г) =

V

= Х(і)с + ! Х(і-т){}{хк{т),им(т))+

їо

+Бд-1я'[я(т)дг(т)+

г

J Н(т-з)(К(з)/(хк(з),ик(з))-(2г(8)) е/я]} йт.

+

Тогда с учетом (1.18) система (2.8), (2.9) может быть представлена в символической форме

ь

жлг-н(*) = Х(Ь)с + ! [/1 (г, т, жлг (т),/глт(т)) + и>

+

1

У /2(т, в, хм (з), Лл-(в)) <ів] с/г, (2.10)

/ідг+і(£) = Н{і)Ь0 + / /з(*,г,жлг(г),/1лг(г))йг,

(2.11)

где

/г0 = <5 -г СО,

а Л = (Л1,--.,/Г), /2 = (/!,...,/2П) и

/з = (/з і • • -1 /з*) — соответствующие векторные

функции, определенные и непрерывные вместе со своими частными производными

9// <9//

•'< 7 7 — 1 77 / — 1 2 4

в пространстве [£о,Т] х [<о,Т] х М2".

Пусть теперь а — некоторое положительное число. Обозначим через 5 — множество точек (£, х,Н) £ Ж1+2,г, для которых выполнены неравенства

£0 < £ < Т, |®-с| < а, \Ь — Ло| < о, (2-12)

где |®| — евклидова длина вектора х. Так как Е — компактное множество, то найдутся такие положительные числа М и Ь, что для всех значений /, х и /г, удовлетворяющих условиям (2.12), при /о <т<Т выполнены неравенства

!/;(£, т, х, И)I < М, I- 1,2,3

д}}(і,т,х,Ь)

дхі

< Ь.

д/і(і,т,х, К)

г, І = 1,, гг, / = 1,2,3.

(2.13)

<Ь,

(2.14)

Обозначим через Г!! множество всех непрерывных пар (х, //) функций, определенных на отрезке [/о,Т], принимающих значения в пространстве К" и при /о < Ъ < Т удовлетворяющих условиям

|х(/) — с| < а, |Л(<) — /701 < а,

(2.15)

т.е. Г2 — множество непрерывных пар (х, К) функций, графики которых лежат в Е. При этом будем рассматривать часть Пт множества П, такую, что наряду с неравенствами (2.15) при (ж, /г) £ Пт выполнялись бы также неравенства

|Х(*)с-с|<|-, |Я(<)Ло — Ло| < | (2.16)

\х{ї)-Х{Щ < —,

|Л(*)-Я(*)/ю|<|-. (2.17)

Тогда в силу неравенств

\х(і) ~ с\ < \х(і) — X(/)с| + |X(£)с — с|

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и

|/г(/) - /г0| < |/і(і) - Я(/)/г0| + |Я(/)/і0 - Л,0|

из условий (2.16) и (2.17) следуют неравенства

(2.15) и, таким образом, принадлежность пары (х, И) к множеству Г2.

Для всех значений £о < t < Т положим

Ф) = Ы*), М<))

и будем говорить, ЧТО 1р € Пт, если (х, К) е Пт-Обозначим через Р оператор, задаваемый правыми частями системы (2.10), (2.11). Тогда, как легко видеть, если число Т достаточно мало, то из принадлежности </з к Пт следует принадлежность к Пт и функции

у* =

(2.18)

где у* = {х*,к*).

В самом деле, для того чтобы функция (р*, задаваемая соотношением (2.18), принадлежала к множеству Пт, достаточно, чтобы при выполнении условия (2.16) для всех значений <о < £ < Т были выполнены также и неравенства

|х*(*) - Х(1)с\ < |Л*(*) - Я(*)йо| <

Но в силу (2.10), (2.11) и (2.13) имеем |Л*(*)-Я(*)Ло| =

/з (*,т,х(т),/і(т))гіт

\х*(і)-Х(і)с\

< М(Т - іо)

[/і(і,т,х(т),/і(т))+

1

+ J /2(г,5,х(в),/г(8))гів]сг7

г

<М((Т-іо) + 1)(Т-іо). Отсюда следует, что при

М((Г-*,) + 1)(Г-*„)<£

<

(2.19)

условие, предъявляемое к оператору Р в (2.18), выполнено.

Пусть теперь (/з = (х, /г) и ф — (у, д) — некоторые две функции, принадлежащие к множеству Пт- Тогда при выполнении неравенства

(2.19) функции

Ф* = Рір

ф* = Гф

также принадлежат к Пт, где <-р* = (х*,/г*) и ф* = (у* ,д*). При этом оказывается, что

- ф*\\ = \\Fif - ^11 < *||*> - П, (2-20)

где

ІМІ = тах■ И*)1

ГО

и А: — некоторое положительное число, не зависящее от 1р и ф и при всех достаточно малых значениях Т > удовлетворяющее условию

к < 1.

(2.21)

В самом деле, в силу неравенств (2.14) и формулы Лангража для всех значений ^ < Т и *0 < т < Т

|/г(г,т,х(т),й(т)) - Ш,т,у{т),д{т))\ <

< п2Ь(\х(т) - у(т)| + |/г(т) - д(т)|), (2.22)

I = 1,2,3

(см., например, [5, с. 163]). Поэтому т

![/з(і,т,х(т),Л(т)) - /з(*,т,ї/(т),0(т))]гі

< (2.23)

< П2Ь[ J |х(т) - г/(т)| «гг + J |/г(т) - р(т)| гіг].

Но

J |х(г) - у(т)І гіг < I \<р(т) - ф(т)\<1т (2.24)

і I

И

т т

J \Цт) - д(т)\с1т < ! \<р(т) - ф(т)\<іт. (2.25) £ £

Тогда, если

т

/і*(£) = Н{і)Но 4- У /з(*,т,ж(т),Л(т))(іт £

и

т

2*(г) = Я(*)Ло + J /з(*,т,г/(т),д(т))гіт,

то из неравенств (2.23)—(2.25) следует, что \\h*-g*\\ <2n2L{T-t0)\\y-il>\\. (2.26)

С другой стороны, в силу неравенства (2.22) t

J {fi(t,T,x(T),h(r))-

to

~fi{t,T,y(T),g(T))+

т

+ J[f-2{T,s,x(s),h(s))-

T

■f2(T,s,y(s),g(s))]ds}dT t

JО(т) - у{т)I + Ih(r) - #(т)|

to

T

J (\x(s) - y(s)I + Ih(s) - #(s)|) ds} a

(2.27)

< nzL

+

4o

I I

f \x(t) -y(r)\dT < J \ір(т) - ib(r)\dr (2.28)

to to

И

t t

J \h(r) -g(r)\dT < J \<p(t) -ip(T)\dT. (2.29)

to to

Тогда, если

t

ar(t) = X(:t)c + J[fi {t, T, x(r), h(r)) +

to

+

1

j f2(T,s,x(s),h(s))ds\dr

I

y*(t) = X(t)c+ J [fi(t,T,y(T),g(T))+

to

T

+ J f2(T,s,y(s),g(s))ds]dr,

T

то из неравенств (2.27)—(2.29) и (2.24), (2.25) следует, что

и * *11^-

If -у II <

< 2п2ЩТ - /о) + 1)(Г - 10)Ь - П- (2-30)

При этом, согласно неравенству треугольника, несложно заметить, что

у- Я!<1к*-Л! + 1|Л*-Л1- (2-31)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поэтому, объединяя неравенства (2.26), (2.30) и (2.31), окончательно получаем, что

||^-П1 = 11*>-^11<

< 4п2Ь((Т — 40) + 1)(Т — Ьо)\\ф — фЦ. Таким образом, если

4п2Ь((Т - /0) + 1)(Т - £о) < 1, (2.32)

то, полагая

к = 4п21/((Т — /о) + 1)(Т — ^о),

видим, что при выполнении условия (2.32) выполнены также и условия (2.20) и (2.21). Сказанное означает, что существует такое действительное число То, что при < Т < Т0 число Т удовлетворяет условиям (2.19) и (2.32) и обеспечивает выполнение требований, предъявляемых к (2.18), (2.20) и (2.21). Поэтому везде в дальнейшем будем считать число Т заданным столь малым, что неравенства (2.19) и (2.32) для него выполнены.

Тля всех значений ^ < ( < Т и N = 0,1,2,... положим

<£лг(*) = (ялг(г), /Ьлг (*))

и построим последовательность функций

(р0, (2.33)

определенных и непрерывных на отрезке [<о, Т], в силу системы (2.10), (2.11) приняв

<£лг+1 =-Рулг, А" = 0,1,2,... (2.34)

V?o(f) = (с, /г0).

(2.35)

Поскольку функция (2.35) принадлежит к множеству Пт, то согласно равенству (2.34) все функции последовательности (2.33) также принадлежат к Пт- Рассмотрим функциональное уравнение

ср = Рф, (2.36)

в котором в силу условий (2.20), (2.21) Р является сжимающим оператором, отображающим множество Пт в себя. Поэтому уравнение (2.36)

имеет на множестве 1! решение <р*, которое может быть получено по формуле

<£>*(*) = Нт (2.37)

N->00

где сходимость равномерна на отрезке [£о,Т] (см., например, [5, с. 165]). Но, так как по построению

К = С)г(Т),

то согласно (2.35) последовательность (2.34) удовлетворяет начальным приближениям (1.23) и (1.24). Поэтому из равенств (1.18) и (2.37) следует существование функций и*(£) и х* (£), построенных по формулам (2.1) и (2.2), причем функция ж*(4) является соответствующим и*(1) решением уравнения (0.1) с начальным условием (2.3). При этом уравнение (1.21) с граничным условием (1.22) переходит в уравнение (2.5) с граничным условием (2.6), а закон управления (1.18) — в (2.4). Более того, по построению

Нт 7лг(млг) = J(u*)

N—>00

И

<7лг(^лг) <

для всех и € , откуда и следует цепочка (2.7).

Таким образом, теорема доказана.

Замечание. Необходимо отметить, что если задача (0.1) (0.3) имеет решение класса то цепочка (2.7) не гарантирует того, что функция и* будет именно этим решением. Другими словами, в общем случае функция и* является только лишь приближением к решению исходной задачи, качество которого оценивается цепочкой (2.7). При этом автономность системы (0.1) и постоянство матриц (?ийв настоящей работе фактически нигде не используется и приняты исключительно для простоты обозначений.

ЛИТЕРАТУРА

1. Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968.

2. Ли Э.Б., Маркус Л. Введение в теорию оптимального управления. М.: Наука, 1972.

3. Веллман Р. Процессы регулирования с адаптацией. М.: Наука, 1964.

4. Красовский А.А. Аналитическое конструирование контуров управления летательными аппаратами. М.: Машиностроение, 1969.

5. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1970.

Поступила в редакцию 25 октября 2002 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.