Научная статья на тему 'Некоторые вопросы субоптимального уравнения нелинейными системами по квадратичному критерию'

Некоторые вопросы субоптимального уравнения нелинейными системами по квадратичному критерию Текст научной статьи по специальности «Математика»

CC BY
58
32
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Ведищева О. В., Диденко С. В., Заусонина Т. Б., Лобанов С. М.

The article looks at the problem of controlling a common non-linear system on the basis of the quadric criterion, which cannot be redused to the problem of the state regulator. To estimate the optimal control, a method is used in this problem of sequential approximations that converges at each quite small interval of time. On the strength of the obtained results, problems are considered of sub-optimal non-linear system control based on the quadric criterion with mixed and control limitations.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOME ISSUES OF SUB-OPTIMAL NON-LINEAR SYSTEM CONTROL ACCORDING TO THE QUADRIC CRITETION

The article looks at the problem of controlling a common non-linear system on the basis of the quadric criterion, which cannot be redused to the problem of the state regulator. To estimate the optimal control, a method is used in this problem of sequential approximations that converges at each quite small interval of time. On the strength of the obtained results, problems are considered of sub-optimal non-linear system control based on the quadric criterion with mixed and control limitations.

Текст научной работы на тему «Некоторые вопросы субоптимального уравнения нелинейными системами по квадратичному критерию»

УДК 62-52

НЕКОТОРЫЕ ВОПРОСЫ СУБОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ СИСТЕМАМИ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ

© О.В. Ведищева, С.В. Диденко, Т.Б. Заусонина, С.М. Лобанов

Vedisheva O.V., Didenko S.V., Zausonina Т.В., Lobanov S.M. Some issues of sub-optimal non-linear system control according to the quadric criterion. The article looks at the problem of controling a common non-linear system on the basis of the quadric criterion, which cannot be redused to the problem of the state regulator. To estimate the optimal control, a method is used in this problem of sequential approximations that converges at each quite small interval of time. On the strength of the obtained results, problems are considered of sub-optimal non-linear system control based on the quadric criterion with mixed and control limitations.

Введение. Рассмотрим нелинейную динамическую систему, характеризуемую дифференциальным уравнением

х = /Ц,х,и), (0.1)

в котором х = (ж1,..., хп) — п-мерный действительный вектор состояния, и = (и1,..., ит)

— ш-мерный действительный вектор управления и / = (/*,...,/”) — векторная функция, определенная и непрерывная вместе со своими частными производными

и

др

Q — , 1 = 1 ,...,71, j = 1,... ,771

в пространстве Ж1 +п+т.

Предположим, что начальное состояние

ж (io) = с (0.2)

задано, а задача управления системой (0.1) заключается в минимизации функционала

т

J(u) = ~ J[{e(t),Q(t)e(t)) +

¿0

+(u(t), R(t)u(t))] dt + у <е(Г), Pe(T)), (0.3)

где Т — фиксированное конечное время, Q(t) и Р — положительно полуопределенные (п х п) -матрицы, R(t) — положительно определенная (то х то)-матрица и e{t) — ошибка системы, т.е.

e{t) = x(t) — z{t)

для всех значений ¿о < Ь < Т, где г = (г1,..., гп)

— тг-мерный действительный вектор, характеризующий заданный режим функционирования системы (0.1).

Во многих практических ситуациях режим г(1) устроен достаточно плохо и задача (0.1)—(0.3) не может быть сведена к задаче о регуляторе состояния (см., например, [1, с. 657]). При этом, если система (0.1) линейна, то сформулированная выше задача достаточно проста и ее, видимо, можно считать полностью решенной (см., например, [1, 2]). Кроме того, весьма важным представляется то обстоятельство, что здесь решение удается получить в виде закона управления с обратной связью. В общем случае для получения оценок решения (или собственно решения) задачи (0.1)—(0.3) в виде закона управления используют различные методы, которые в той или иной форме используют линеаризацию и (или) последовательные приближения (см., например, [2—4]).

Основной целью настоящей работы является разработка метода, приводящего к конструктивной процедуре получения оценки решения задачи (0.1)—(0.3) в виде закона управления с обратной связью. Данный метод базируется на методе последовательных приближений, сходящийся на всех достаточно малых отрезках времени. В качестве приложения полученных результатов рассматриваются задачи об управлении системой (0.1) по критерию (0.3) со смешанными ограниченими и ограничениями на управление.

1. Метод последовательных приближений. Следуя [3], обозначим через мл'(^), ждг(£)

— некоторое Лг-е приближение к оптимальному управлению и состоянию в задаче (0.1)—(0.3). Тогда (Ы + 1)-е приближение ин+1^),Хк+1^)

может быть получено как решение задачи о минимизации функционала

т

1м+х{и) = у У[<е(*),<Э(*)е(*))+

+ (u(t),R(t)u(t))\dt+~(e(T),Pe(T)) (1.1)

с ограничением

X = fit, XN, Mjv) + - Хлг) +

+Biv(i)(w ~ Mjv), x(t0)=c, (1.2)

в котором A]\r(t) и £?лг(£) — (п х п)- и (п х ш) -матрицы, задаваемые равенствами

-МО = I Ц,

X=X]w(t) U=UN(t)

И—идг (i)

(1.3)

(1.4)

соответственно.

Задача (1.1), (1.2) представляет собой вариант задачи слежения для линейной системы, и ее решение, как известно, дается законом управления с обратной связью

им+1(£) =

= 1(0 — ^Слг-иМ^лг-и^)],

(1.5)

в котором 2^+1 (£) ~ положительно определенное при < £ < Т решение матричного дифференциального уравнения Риккати

■К/у-нИ = —-^^у-ы(£Мл(£) — Ан(1)Км+1^)+

(1.6)

+^+1(*)в№(г)Д-1(*)^(^)^+1(г) - д(*)

с граничным условием

^дг+1(Г) = Л

а /г.лг+1 (¿) — решение линейного дифференциального уравнения

^N+1 (£) =

= -[Ллг(0-Влг(<)Л_1(<)Влг(*)^аг+1(0]'Лаг+1(*)--<2(ф(г) + Л"л-+1(<)[/(*,а:лг(*),«л-(*))-

-Ам(1;)х]\г(<) - Влг(^)м^(<)] (1-8)

с граничным условием

Ллг+1(Т) = д(Т)г(Г)

(1.9)

(см., например, [1, с. 699]).

Если построенные выше последовательно-

сти

(1.10)

(1.11)

равностепенно непрерывны и равномерно орга-ничены на отрезке [¿о,Т], то из (1.10) и (1.11) можно выбрать подпоследовательности

(1.12)

(1.13)

равномерно на [<о, У] сходящиеся к некоторым непрерывным функциям £*(£) и м*(£), где

lim TV* = схэ.

k-^oo

Тогда, если окажется, что последовательность

(1.12) совпадает с последовательностью (1.10), а последовательность (1.13) — с последовательностью (1.11), то, используя соотношения (1.3)—(1.9), можно перейти к рассмотрению вопроса о том, будет ли и* (¿) оптимальным управлением в задаче (0.1)—(0.3).

Заметим теперь, что показать эквивалентность последовательностей (1.10), (1-12) и (1.11),

(1.13) в общем случае совсем непросто. Однако для задачи (0.1)—(0.3) несложно построить метод последовательных приближений, идейно близкий к упомянутому выше, но не имеющий формальных проблем со сходимостью.

Именно, следуя идее знаменитой модификации метода Ньютона (см., например, [6, с. 470]), для всех значений N = 0,1,2,... рассмотрим задачу о минимизации функционала

1

(1.7) JN+1 (и) = у f[(e(t),Q(t)e(t))+

to

+(t), R(t)u(t))] dt + -<e(T), Pe(T)> (1.14) с ограничением

x = f(t,xN,uN) + A(t)(x - xN) + B(t)(u - un), x(to)=c, (1-15)

в котором A(t) и B(t) — (п х п)- и (п х то) -матрицы, задаваемые равенствами

x=z(t) и=0

(1.16)

точно хорошее приближение к решению задачи (0.1)—(0.3). Именно эта схема и будет рассматриваться в дальнейшем. Отметим также, что для простоты начальное приближение здесь будет определено соотношениями

x0(t) = с

(1.23)

x=z(t) и=0

(1.17)

соответственно.

Для фиксированных функций Xn и иn оптимальное управление itjv+i(<) в задаче (1.14),

(1.15) по аналогии с (1.5) дается законом управления с обратной связью

UN+l(t) =

= R^1 (t)B'(t)[hN+i(t) - K(t)xN+1(t)], (1.18)

в котором xn+i(t) — решение уравнения (1.15), соответствующее UN+i(t) и удовлетворяющее начальному условию

%N+l(to) = С,

К (t) — положительно определенное при

to < t < Т решение матричного дифференциального уравнения Риккати

K(t) = —K{t)A(t) - A'(t)K(t)+ +K(t)B(t)R~1(t)B'(t)K{t) - Q(t) (1.19)

с граничным условием

К(Т) = Р, (1.20)

a hN+i(t) — решение линейного дифференциального уравнения

îiN+i(t) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= ~[A(t) -B{t)R^{t)B'{t)K{t)}'hN+l{t)-—Q(t)z(t) + K(t)[f{t,xN(t),uN{t))~ —AN(t)XN(t) - BN(t)UN(t)] (1-21)

с граничным условием

hN+1(T) = Q(T)z(T). (1.22)

Таким образом, если начальное приближение xo{t),uo{t) каким-либо образом задано, то соотношения (1.18)—(1.22) определяют схему последовательных приближений, которая, как будет показано ниже, при всех достаточно малых значениях Т позволяет получить доста-

ио0) = Д-ЧОВ'Ш(Т)г(Т) - К(1)с]. (1.24)

Замечание. 1. Переход от задачи (1.1), (1.2) к задаче (1.14), (1.15), очевидно, влечет за собой снижение скорости сходимости последовательных приближений, если, конечно, таковая имеется. Однако, в последнем случае схема приближений существенно упрощается и исследование ее сходимости не вызывает больших затруднений.

2. Основная теорема. Пусть ¿2 — множество функций, определенных на отрезке [¿о, Г], принимающих значения в пространстве и суммируемых с квадратом по Лебегу на [¿о,Т]. Далее, пусть — часть множества Ьг, такая, что для каждой функции и € Ь!2 уравнение (0.1) имеет абсолютно непрерывное решение х(1). определенное для всех значений 10 < I < Т и удовлетворяющее начальному условию (0.2). Тогда имеет место следующая

Теорема. Пусть функция / = (/х,...,/п) определена и непрерывна вместе со своими частными производными

др . . Л

—-—, 1,1 = 1,..., п

дх>

и

дР • ,

, г = 1,... ,п, з = \ ,...,т

в пространстве К1+п+т. Тогда для каждой точки (¿о, с) пространства М1+п найдется такое действительное число То > ¿о, что для всех значений ¿о < Т < То справедливы равенства

lim ujv(î) = u*{t)

N—ï OG

lim XN(t) — x*(t),

N-ï OG

(2.1)

(2.2)

где сходимость равномерна на отрезке [¿о ,Т], и*(£) — некоторая функция, определенная и непрерывная на [Ьо-Т], ах*(<) — соответствующее решение уравнения. (0.1) с начальным условием

X*{t о) = с.

(2.3)

При этом оказывается, что для всех значений t0<t<T

u*{t) = R-\t)B'(t)[h*(t) - K(t)x*(t)\, (2.4)

где h*(t) — решение дифференциального уравнения

h*(t) = ~[A(t) -

-Q{t)z(t) + K(t)[f{t,x*{t),u*{t))~

-A(t)x*(t) -B(t)u*(t)] (2.5)

с граничным условием

h*(T) = Q(T)z(T). (2.6)

Более того, для каждой функции и G L.J

lim Jn{un) = J(w*) < lim Jn(u)- (2-7)

TV—>-oo JV—)• oo

Доказательство. Пусть X(i) n H(t) — решения линейных матричных дифференциальных уравнений

X(i) = [A(f) -

X(i0) = £

и, соответственно,

H(t) = ~[A(t) - В(*)Д-1(*)Я'(t)K(t)]'H{t), H(T) = E,

где E — единичная (n x п)-матрица. Тогда при использовании закона (1-18) уравнение (1-15) эквивалентно уравнению

XN+l{t) = X{t)c+

t

J X(t - t)[B(t)R~1 [t)B'{r)hN+\ (т)+ (2.8)

+

to

+ f {т, XN(т), U]y (т)) — A(t)xn (т) — В(t)uN {т)\ dr,

а уравнение (1.21) с граничным условием (1-22)

— уравнению

hN+1(t) = H(t)Q(T)z(T)+

t

+ J H(t - T)[K(r)(f(T,xN(T),uN(T))- (2.9)

T

-A(t)xn(t) - B{t)un(t)) - Q{t)z(t)\ dr.

Принимая во внимание (2.9), перепишем уравнение (2.8) в следующем эквивалентном виде:

xN+i(t) = X(t)c+

+ ! X(t-т){f(XN{т),ЧN{т)) - А(т)хМ(т)~

¿0

-В(т)им{т) + В{т) Д-1 (т)В(т)[Я (т)<Э(Т)г(Т)+

Т

+ I Н(т - s)(K(s)(f(s,xN(s),uN(s))-т

—А(в)а;]у(в) — -В(5)«лг(в)) — <3(й).г(з)) ds]} dт.

Тогда с учетом (1.18), система (2.8), (2.9) может быть представлена в символической форме

xN+1(t) =ХЦ)с+ У [/1(1,т,хк(т),}1к(т))+

+

1

J f‘2(т, s, xN(s), hN(s)) ds\ dr, (2.10)

hN+l(t) = H(t)h0 + / f3{t,T,xN{T),hN(r))dT,

(2.11)

где

h0 = Q(T)z(T),

а Л = (Л1, - - -,/Г), /2 = Ш.-.-./з") и

/з = (/з, •■•,/") ~ соответствующие векторные функции, определенные и непрерывные вместе со своими частными производными

М М г „ г-123

сЫ’ дЫ' —................

в пространстве [¿о, Г] х [¿о,Р] х ®2п-

Пусть теперь а —некоторое положительное число. Обозначим через Е — множество точек (£, ж, /г) € Ж1+2п, для которых выполнены неравенства

¿о < Ъ < Т, \х — с| < о, |/г — /го| < я, (2-12)

где |ж| — евклидова длина вектора х. Так как Е — компактное множество, то найдутся такие положительные числа М и Ь, что для всех значений (,1 и к, удовлетворяющих условиям

(2.12), выполнены неравенства

\№,Т,Х,Н)\<М, 1 = 1,2,3 (2.13)

<L, (2.14)

df[(t,r,x,h) < L, dfi(t,T,x,h)

дх] dhJ

Обозначим через (I множество всех непрерывных пар (х, К) функций, определенных на отрезке [<о,Г], принимающих значения в пространстве К" и при ^ < I < Т удовлетворяющих условиям

\x(t) — с\ < а> Ih{t) — h0\ < а,

(2.15)

т.е. О — множество непрерывных пар (х, К) функций, графики которых лежат в £. При этом будем рассматривать часть Пг множества П, такую, что наряду с неравенствами (2.15) при (х. К) £ Пт выполнялись бы также и неравенства

\Х(1)с-с\<~, |Я(*)Ло - йо| < (2-16)

Ix(t) — X(t)c\ <

2 ’

\h(t)-H(t)h0\<~.

Тогда в силу неравенств

\x{t) — cl < \x(t) — X(t)cІ + IX{t)c — с\

(2.17)

Іx*(t) - X(t)c\ =

+

<

<M((T-to) + l)(T-to). Отсюда следует, что при

М((Т — <о) + 1)(Т — i0) < £

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(2.19)

условие, предъявляемое к оператору Р в (2.18), выполнено.

Пусть теперь ¡р — [х, К) и ір = (у,д) — некоторые две функции, принадлежащие к множеству От- Тогда при выполнении неравенства (2.19) функции

(р* =

IHt) - /10| < |h(t) - H(t)ho| + \H(t)h0 - h0\

из условий (2.16) и (2.17) следуют неравенства

(2.15) и, таким образом, принадлежность пары (ж, h) к множеству О.

Для всех значений to < t < Т положим ¥>(*) =

и будем говорить, что ip 6 $7т, если

(х, К) е П-г- Обозначим через F оператор, задаваемый правыми частями системы (2.10), (2.11). Тогда, как легко видеть, число Т может быть выбрано столь малым, что если ip € Г1т, то функция

ip* = Fip (2.18)

также принадлежит к От, где <р* = (x*,h*).

В самом деле, для того чтобы функция <р*, задаваемая соотношением (2.18), принадлежала к Пт, достаточно, чтобы при t.о < t < Т были выполнены неравенства

|ar*(i) — X(t)c\ <

2 ’

Но в силу (2.10), (2.11) и (2.13) имеем \h*(t)-H(t)h0\ =

f3(t,r,x(r),h(T))dT

< М(Т - io)

гр* — р1р

также принадлежат к где у* = (х*, /¡*) и 'Ф* = (У*■ Я*)- При этом оказывается, что

\\<р* - ^*|| = \\Fip - Рф\\ < к\\<р - VII, (2.20)

где

= 4тахтИ*)|

и к — некоторое положительное число, не зависящее от 1р и ф и при всех достаточно малых значениях Т > £о удовлетворяющее условию

к < 1.

(2.21)

В самом деле, в силу неравенств (2.14) и формулы Лангража для всех значений *о < < < Т

Ш*,т,х({),Ь(г)) - МЬ,т,у^),д^))\ <

< п2Ь{|х(*) - у{г)I + \ЬЦ) - д(г)I),

/ = 1,2,3 (2.22)

(см., например, [7, с. 163]). Поэтому т

![/з(т,ж(т),Л(т)) - /з(т,у(т),д(т))]<1т <

(2.23)

т T Тогда, если

<п L[J Iх(т) - у(т)I dr + J Ih(r) - g(r)| dr}. t

t Но t x*(t) = X(t)c + J to

т /* T

/ \Ф) - y(r)\dr < , í \<р(т) — Ф(т)\dr (2.24) T r

J J t t + / /2(r, S, X

и T

т : Г И

[ \Цт) -g(r)\dT < I ' |</>(т) — Ф(т)\(1т. (2.25) t r

J J t t y*(t) = x{t)c + 1

Тогда, если

т

h*(t) = H(t)h0 + I f3(t,T,x(r),h(r))

dr

<?*(» = Я(*)Л0 + I , т./у(т),д(т))(1т, г

то из неравенств (2.23)—(2.25) следует, что НЛ* - 5*11 < 2П2Ь(Т - ъ>)\\ц> - Ф\\. (2.26)

С другой стороны, в силу неравенства (2.22)

ь

!\М*уТ.,х(т),Н(т)) - М^т,у(т),д(т))+

¿0

Т

+ ! №2(7,3,х(в),1г(8))-

Т

(т,з,у(з),д(з))} ds}dт г

< п2Ь ![\х{т) - у(т)I + IН(т) - д(т)\

¿0

Г

+ J(И*) - 3/(в)| + |Л(в) - з(«)1) <&] (¿г.

< (2.27)

+

Но

г ъ

J \Ф) ~У{т)\Ат < J \(р(т) - ф(т)\dr (2.28)

to to

I

t t

J \HT) -g(r)\dT < j \(р(т) -ip(r)\dT. (2.29)

to to

t o

1

+ J Í2ÍT,s, y(s),g{s))ds]dT,

T

то из неравенств (2.27)—(2.29) и (2.24), (2.25) следует, что

< 2n2L((T - t0) + 1)(T - ío)||y> - ф\\. (2.30)

При этом, согласно неравенству треугольника, несложно заметить, что

№*-1Л1<||**-у*|| + ||л*-Л. (2-31)

Поэтому, объединяя неравенства (2.26), (2.30) и (2.31), окончательно получаем, что

\\V>* ~Í>*\\ = \\F<P-F*I>\\ <

< 4п2 L((T - to) + 1)(Т — t0)\\ip - ф\\.

Таким образом,если

4n2L((T-ío) + l)(T-to) < 1, (2.32)

то, полагая

к = 4п2Ь((Т - t0) + 1 )(Т - t0),

видим, что при выполнении условия (2.32) выполнены также и условия (2.20) и (2.21). Сказанное означает, что существует такое действительное число Т0, что при tQ < Т < Т0 число Т удовлетворяет условиям (2.19) и (2.32) и обеспечивает выполнение требований, предъявляемых к (2.18), (2.20) и (2.21). Поэтому везде в дальнейшем будем полагать число Т выбранным так, что неравенства (2.19) и (2.32) для него выполнены.

Для всех значений to < t < Т и N = 0,1,2,... положим

ipN{t) = (xN(t),hN(t))

и построим последовательность функций

'-рх , • • •, ^Pn 1 • • •, (2.33)

определенных и непрерывных на отрезке [io, Т], в силу системы (2.11), (2.12) приняв

VN+i=FipN, N = 0,1,2,... (2-34)

и

<Po{t) = (с, ho). (2.35)

Поскольку функция (2.35) принадлежит к множеству Пт, то в силу равенства (2.34) все функции последовательности (2.33) также принадлежат к Пт- Рассмотрим функциональное уравнение

ip = Fip, (2.36)

в котором в силу условий (2.20), (2.21) F является сжимающим оператором, отображающим множество f1т в себя. Поэтому уравнение (2.36) имеет на множестве Г! решение ip*, которое может быть получено по формуле

= Jim <Pw(t), (2.37)

JV->oо

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где сходимость равномерна на отрезке [¿о,?1]

(см., например, [7, с. 165]). Но, так как по по-

строению

h0 = Q(T)z(T),

то согласно (2.35) последовательность (2.34) удовлетворяет начальным приближениям (1.23) и

(1.24). Поэтому из равенств (1.18) и (2.37) следует существование функций u*(t) и x*(t), построенных по формулам (2.1) и (2.2), причем функция x*(t) является соответствующим u*(t) решением уравнения (0.1) с начальным условием (2.3). При этом уравнение (1.21) с граничным условием (1.22) переходит в уравнение (2.5) с граничным условием (2.6), а закон управления (1.18) — в (2.4). Более того, по построению

lim J;v('Ujv) = J{u*)

N—У ОО

И

Jn(un) < Jn(u)

для всех и Е Li , откуда и следует цепочка (2.7).

Таким образом, теорема доказана.

Замечание 2. По аналогии с модифицированным методом Ньютона матрицы A(t) и B(t) следовало бы задавать по формулам

u=u0(t)

И

и=ио(Ь)

где Хо({) и мо(£) некоторое начальное приближение к решению задачи (0.1)—(0.3) (см., например, [6, с. 470]). Однако, как видно из доказательства теоремы, выбор матриц АЦ) и В{{) по формулам (1.16) и (1.17) принципиально здесь влияет только на оценку величины Т0 и скорость сходимости. Гораздо более важным представляется то обстоятельство, что в последнем случае выбор имеет более чем прозрачное физическое обоснование.

Вообще говоря, матрицы А({) и В{{) можно задавать достаточно произвольно, исходя, например, из допустимости значения Т0. Плата же за произвольность выбора этих матриц очевидна — снижение скорости сходимости метода.

Замечание 3. Необходимо отметить, что если задача (0.1)—(0.3) имеет решение класса то (2.7) не гарантирует, что функция и* будет именно этим решением. Другими словами, в общем случае функция и* является только лишь приближением к решению исходной задачи, качество которого оценивается цепочкой

(2.7).

3. Приближенная задача о регуляторе состояния. Непосредственно использование закона управления (33) в реальном времени может быть осложнено тем обстоятельством, что для нахождения функции Ь* требуется, вообще говоря, знание оптимального управления и*(1) и состояния ж*(£) на всем отрезке \Ьо,Т]. Однако, если окажется что функция х* будет достаточно близка к режиму г, то это обстоятельство может быть обойдено с помощью приближенной к (0.1)—(0.3) задачи о регуляторе состояния.

В самом деле, исключительно для простоты обозначений рассмотрим задачу о минимизации функционала

Ф) =

т

= — У[(&г(£), (¿^)6х(1)) + (5и^).: Д(£)<5г*(£))] (Й+ ¿0

(3.1)

+ ^(6х(Т),Р6х(Т))

при ограничениях (0.1) и (0.2), где для всех значений ¿о < t < Т

5х(£) = х(£) — х*(Ь)

= «(£) — и*(Ь).

Тогда, поскольку при /о < I < Т

х* =

а решение ж*(£) удовлетворяет начальному условию (32), то, как известно, хорошим приближением к задаче (3.1), (0.1), (0.2) является задача о минимизации функционала (3.1) при ограничении

5х = А*(€)5х + В*(1)5и, 5х{1 о) = 0, (3.2)

где у1(£) иВ(() — (п х п)- и (п х ш)-матрицы, задаваемые равенствами

B*{t) =

диі )

Х=Х* (t)

и=и* (t)

х=х* (¿) и=и* (t)

соответственно. Решение же задачи (3.1), (3.2) дается законом управления с обратной связью

5u(t) = —R~1(t)B*'(t)K(t)8x(t),

в котором К (t) — положительно определенное

при to < t < Т решение матричного дифференциального уравнения Риккати

K(t) = -K(t)A*(t)— -A*\t)K{t) + K(t)B*{t)RTl{t)B*\t)K{t)-Q{t)

с граничным условием

К(Т) = Р

и который без труда может быть реализован в реальном времени.

ЛИТЕРАТУРА

1. Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968.

2. Ли Э.В., Маркус Л. Введение в теорию оптимального управления. М.: Наука, 1972.

3. Веллман Р. Процессы регулирования с адаптацией. М.: Наука, 1964.

4. Красовский A.A. Аналитическое конструирование контуров управления летательными аппаратами. М.: Машиностроение, 1969.

5. Колмогоров A.H., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1972.

6. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. М.: Наука, 1970.

Поступила в редакцию 25 октября 2002 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.