Автоматика. Информатика. Управление. Приборы
УДК 62-52
ОБ ОБЩЕЙ ЗАДАЧЕ УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ СИСТЕМАМИ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ*
А.П. Афанасьев1, С.М. Дзюба2, С.М. Лобанов2
Институт системного анализа РАН, г. Москва (1); Тамбовский государственный университет им. Г.Р. Державина (2)
Представлена членом редколлегии профессором р. И. Бодровым
Ключевые слова и фразы: нелокальное продолжение оценок; оценка решения; последовательные приближения; управление нелинейными системами по квадратичному критерию.
Аннотация: Предложен метод получения оценки решения общей задачи управления нелинейными системами по квадратичному критерию в виде нелинейного закона управления с обратной связью. Рассмотрен вопрос о нелокальном продолжении таких оценок.
1 Введение
Рассмотрим нелинейную динамическую систему, характеризуемую дифференциальным уравнением
х = / (Г, х, и), (1.1)
в котором х = (х1,...,х") - п-мерный действительный вектор состояния,
и = (и1,...,ит) - т-мерный действительный вектор управления и / = (У1,...,/") -векторная функция, определенная и непрерывная вместе со своими частными производными
У ■ ■ 1 ——, ',1 = 1,...,"
дх]
и
У ■ , ■ ,
-, ' = 1,...,", ] = 1,..., т
ди1
в пространстве в}-+"+т.
Предположим, что начальное состояние системы
х(/о) = с (1.2)
* Работа выполнена при поддержке РФФИ, проекты №№ 01-01-00543, 03-01-00329.
задано, а задача управления системой (1.1) заключается в минимизации функционала
т
О (и) = 11 [( е(г), Q(t )е(г )) + (и (г), Щ )и (г)) ] Л + е(Т), Ре(Т)), (1.3)
го
где Т - фиксированное конечное время; Q(t) и Р - симметрические положительно полуопределенные (п х п) - матрицы; Я(г) - симметрическая положительно определенная (т х т) - матрица и е(г) - ошибка системы, т.е.
е(г) = х(г) - г (г)
для всех значений г0 < г < Т, где г = (г1,...,г") - п-мерный действительный вектор, характеризующий заданный режим функционирования системы (1.1).
Во многих практических ситуациях режим г(г) устроен достаточно плохо и задача (1.1) - (1.3) не может быть сведена к задаче о регуляторе состояния [1, с. 657]. При этом, если система (1.1) линейна, то задача (1.1) - (1.3) достаточно проста и ее, видимо, можно считать полностью решенной [1, 2]. Кроме того, весьма важным представляется то обстоятельство, что здесь решение удается получить в виде закона управления с обратной связью. В общем случае для получения оценок решения (или собственно решения) задачи (1.1) - (1.3) применяют различные методы, которые в той или иной форме используют линеаризацию и (или) последовательные приближения [2 - 4].
Основной целью настоящей работы является разработка метода, приводящего к конструктивной процедуре получения оценки решения задач типа (1.1) - (1.3) в виде закона управления с обратной связью. Данный метод базируется на методе последовательных приближений, который сходится на всех достаточно малых отрезках времени.
2 Метод последовательных приближений
Следуя [3], обозначим через им (г), хы (г) - некоторое Ы-е приближение к оптимальному управлению и состоянию соответственно в задаче (1.1) - (1.3). Тогда (Ы+1)-е приближение иы+1(г), хы+1(г) может быть получено как решение задачи о минимизации функционала
т
1ы+1 (и) = 11 [(е(г), д(г )е(г))+(и (г), Я(г )и(г)) ] лг + е(Т), Ре(Т)), (2.1) го
с ограничением
х = /(г, хы, иы) + Аы (г)(х - хы) + Вы (г)(и - иы), х(г0) = с, (2.2)
в котором Аы (г) и Вы (г) — (пхп)- и (пхт)-матрицы, задаваемые равенствами
An (t) =
Kdxjy
x=xN (t) u =Un (t)
(2.3)
Bn (t) =
1L
KduJ ,
x=xN (t) u =Un (t)
(2.4)
соответственно.
и
Задача (2.1), (2.2) представляет собой вариант задачи слежения для линейной системы и ее решение, как известно, дается законом управления с обратной связью
и^+1(/) = Л_1(0 Б'м (О [[(О - Км+1«) х^+1(0], (2.5)
в котором Км+1 у) - симметрическое положительно определенное при ^ < t < Т решение матричного дифференциального уравнения Риккати
км+1 ^) = - км+1 ^) Ам (t) - Ам (t) км+1 ^) + (2
(26)
+кы+1 (t)бы (t)к~ (t)Б'м (tк+1 (t) - д^)
с граничным условием
Км+1(Т) = Р, (2.7)
а км+1 (t) - решение линейного дифференциального уравнения
г
¿N+1(0 = -[Ам(0-Бм(ОКм-цСО] %+1(0- (2.8)
д)) + Км+l(t) [/а, хм ), им (t)) - Ам а)хм а) - Бм а)им а)] с граничным условием [1, с. 699]
км+1(Т) = Р2(Т). (2.9)
Если построенные выше последовательности
х1, х2,..., хм,... (2.10)
и
и1,и2,...,им ,... (2.11)
равностепенно непрерывны и равномерно ограничены на отрезке [^, Т], то согласно теореме Арцела из (2.10) и (2.11) можно выбрать подпоследовательности
xм1, хм2 ,..., хмк ,... (2.12)
и
uм1, uм2,..., имк,... (2.13)
равномерно на Щ, Т] сходящиеся к некоторым непрерывным функциям х *(0 и и *(), где
Иш мк = м.
к
Тогда, если окажется, что последовательность (2.12) совпадает с последовательностью (2.10), а последовательность (2.13) - с последовательностью (2.11), то, используя соотношения (2.3)-(2.9), можно перейти к рассмотрению вопроса о том, будет ли и *() оптимальным управлением в задаче (1.1) - (1.3).
Заметим теперь, что показать эквивалентность последовательностей (2.10), (2.12) и (2.11), (2.13) в общем случае непросто. Однако, для задачи (1.1) - (1.3) можно построить метод последовательных приближений, близкий к упомянутому выше, но не имеющий формальных проблем со сходимостью.
Именно, следуя знаменитой идее модифицированного метода Ньютона [5, с. 470] для всех значений м = 0,1,2, ... рассмотрим задачу о минимизации функционала
Т
^И+1(и ) = т
| [( еЦ), )еЦ)) + (и ($), Щ )и^)) ] Л + е(Т), Ре(Т)) (2.14)
tо
с ограничением
х = /(г,хы,иы) + А(г)(х-хы) + В(г)(и-иы), х(го) = с, (2.15)
в котором А (г) и В(г) - (п х п) - и (п х т) -матрицы, задаваемые равенствами
V
A(t) =
B(t) =
x=z(t) u=0
x=z(t) u=0
(2.16)
(2.17)
соответственно.
Для фиксированных функций хы и иы оптимальное управление иы+1(г) в задаче (2.14), (2.15) по аналогии с (2.5) дается законом управления с обратной связью
UN+1 (t) = R~l (t)B'(t) [+1 (t) - K(t)Xn+1 (t)],
(2.18)
в котором хы+1(г) - решение уравнения (2.15), соответствующее иы+1(г) и удовлетворяющее начальному условию
хы+1(г0) = с ,
К (г) - симметрическое положительно определенное при го < г < Т решение матричного дифференциального уравнения Риккати
К (г) = - К (г) А(г) - А' (г) К (г) + К (г) В(г) я~1 (г) В ' (г) К (г) - 0>{г)
с граничным условием
К (Т) = Р,
а Аы+1 (г) - решение линейного дифференциального уравнения
Иы+1(г) = -[ А (г) - В(г) ) В' (г) К (г) ] ' Иы+1(г) - б(г) г(г) + +К (г) [[ (г, хы (г), иы (г)) - Аы (г) хы (г) - Вы (г) иы (г)] с граничным условием
Иы+1(Т) = Рг(Т).
(2.19)
(2.20)
(2.21)
(2.22)
Таким образом, если начальное приближение хо(г), ио(г) каким-либо образом задано, то соотношения (2.18) - (2.22) определяют схему последовательных приближений, которая, как будет показано ниже, при всех достаточно малых значениях Т позволяет получить достаточно хорошее приближение к решению задачи (1.1) - (1.3). Именно эта схема и будет рассматриваться в дальнейшем. Отметим также, что для простоты начальное приближение здесь будет определено соотношениями
хо(г) = с (2.23)
U0(t) - R_1(t)B'(t) [Pz(T) - K(t)c].
(2.24)
Отметим, что переход от задачи (2.1), (2.2) к задаче (2.14), (2.15), очевидно, влечет за собой снижение скорости сходимости последовательных приближений, если, конечно, таковая имеется. Однако, в последнем случае схема приближений существенно упрощается и исследование ее сходимости не вызывает больших затруднений.
и
и
3 Сходимость метода последовательных приближений
Пусть L2 - множество функций, определенных на отрезке [/q, T ], принимающих значения в пространстве Rm и суммируемых с квадратом по Лебегу на [/q, T ]. Далее, пусть L2 - часть множества L2, такая, что для каждой функций
u e L2 уравнение (1.1) имеет абсолютно непрерывное решение x(t), определенное для всех значений /q < t < T и удовлетворяющее начальному условию (1.2). Тогда имеет место следующая теорема.
Т е о р е м а 1. Пусть функция f = (f1,..., fn) определена и непрерывна вместе со своими частными производными
f ■ ■ 1
--, 1, 1 = 1,...,n
dxj
и
f ■ 1 ■ 1
-, 1 = 1,..., n, j = 1,..., m
du1
в пространстве R1+n+m . Тогда для каждой точки (/q , c) пространства R1+n найдется такое действительное число Tq > /q , что для всех значений /q < T < Tq справедливы равенства
lim uN(t) = u *(t) (3.1)
N ^ro
и
lim xN(t) = x*(t), (3.2)
N ^ro
где сходимость равномерна на отрезке [/q, T ], u *(t) - некоторая функция, определенная и непрерывная на [/q, T], а x *(t) - соответствующее решение уравнения (1.1) с начальным условием
x*(/q) = c . (3.3)
При этом оказывается, что для всех значений /q < t < T
u *(t) = R"1 (t)B'(t) [h * (t) - K(t)x *(/)], (3.4)
где h *(t) - решение дифференциального уравнения
h *(t) = -
h *(t) - ß(t) z (t) +
(3.5)
A(t) - B(t) R _1(t) B'(t) K (t) +K(t) [f (t, x * (t), u * (t)) - A(t)x * (t) - B(t)u * (t)] с граничным условием
h *(T) = Pz(T). (3.6)
Более того, для каждой функции u e L2
lim Jn(un) = J(u*) < lim Jn(u). (3.7)
N^ro N ^ro
Д о к а з а т е л ь с т в о. Пусть X (г) и Н (г) - решения линейных матричных дифференциальных уравнений
х (г) = [ А (г) - В(г) я~\г) В'(г) К (г) ] X (г), X (го) = Е
и, соответственно,
I
н (г) = -[а(0 - В(г)Я~\г) В' (г) К (г) ] н (г), н (Т) = Е,
где Е - единичная (пхда)-матрица. Тогда при использовании закона (2.18) уравнение (2.15) эквивалентно уравнению
хы+1 (г) = X (г )с + | X (г - т) [ В(т) я-1(т) В ' (т)Иы+1 (т) +
го
+ / (т, хы (т), иы (т)) - А(т) хы (т) - В(т)иы (т)] ё т, а уравнение (2.21) с граничным условием (2.22) - уравнению
г
Иы+1 (г) = н (г) Р2(Т) + | н (г - т) [ К (т)( / (т, хы (т), иы (т)) -
Т
- А(т) хы (т) - В(т)иы (т)) - б(т) 2(т)] ё т.
(3.8)
(3.9)
Принимая во внимание (3.9), перепишем уравнение (3.8) в следующем эквивалентном виде:
г
хы+1 (г) = X (г )с +| X (г - т){ / (хы (т), иы (т)) - А(т) хы (т) - В(т)иы (т) +
го
+В(т) R_1(x) В(т)
H(Т)Pz(T) + j H(т- 5)(K(5)(/(5, Xn (5), UN (5)) -
- А^) хы (5) - В^)и ы (5)) - 6(5) ¿(¿ОЭёфё т. Тогда с учетом (2.18), система (3.8), (3.9) может быть представлена в форме
xn+1(t) = X (t )c + j
/1 (t, т, xn (т), An (т)) + j /2 (т, 5, xn (5), Hn (s))ds
dт, (3.10)
Иы+1(г) = н (г )Ао +1 /3(г, т, хы (т), Аы (т))ё т, (3.11)
т
где
Ио = Рг(Т),
а /1 = (//,...,/1п), /2 = (/г,...,/Т) и /3 = (/31,...,/3) - соответствующие векторные функции, определенные и непрерывные вместе со своими частными производными
/ / ■ ■ , , , 2 3
--, --, 1, ] = 1,..., п, 1 = 1,2,3
дх] дИ] в пространстве [го, Т] х [го, Т] х Я2п .
Пусть теперь а - некоторое положительное число. Обозначим через Е -множество точек (^ х, к) е К1+2", для которых выполнены неравенства
^ < t < Т, |х- с| < а, |к -к0| < а, (3.12)
где |х| - евклидова длина вектора х. Так как Е - компактное множество, то найдутся такие положительные числа М и Ь , что для всех значений t, х и к, удовлетворяющих условиям (3.12), выполнены неравенства
У т,х,к) < М, I = 1,2,3 (3.13)
д/ (t, т, х, h)
dxJ
< L,
df} (t, т, х, h)
dhJ
< L, i, J = 1,...,n, l = 1,2,3. (3.14)
Обозначим через О множество всех непрерывных пар (х, к) функций, определенных на отрезке Т], принимающих значения в пространстве К" и при ^ < t < Т удовлетворяющих условиям
|х(0 -с| < а, |к(0 -к0|< а, (3.15)
т.е. О - множество непрерывных пар (х, к) функций, графики которых лежат в Е . При этом будем рассматривать часть От множества О , такую, что наряду с неравенствами (3.15) при (х, к) е От выполнялись бы также и неравенства
\X(t)c - c| < \H(t)h0 - h0\ < 2
(3.16)
|x(t) -X(t)c| <|h(t) - H(t)h^ < 2.
(3.17)
Тогда в силу неравенств
|x(t) - с| < |x(t) -X(t)с| + |X(/)с - с|
и
\к(1) - к, | < |k(t) - Н (I)Й01 +1Н(I)к - к01
из условий (3.16) и (3.17) следуют неравенства (3.15) и, таким образом, принадлежность пары (х, к) к множеству О .
Для всех значений ^ < t < Т положим
Ф^) = (хЦ), k(t))
и будем говорить, что ф е От , если (х, к) е От . Обозначим через Р оператор, задаваемый правыми частями системы (3.10), (3.11). Тогда, как легко видеть, число Т может быть выбрано столь малым, что если ф е От , то функция
Ф* = Рф (3.18)
также принадлежит к От , где ф* = (х*,к*).
В самом деле, для того, чтобы функция ф *, задаваемая соотношением (3.18), принадлежала к От , достаточно, чтобы при ^ < t < Т были выполнены неравенства
|х *() -X()с| < 2, |к *(t) - Н()к01 < 2.
и
и
Но в силу (3.10), (3.11), (3.13) имеем
H *(t) - H (t )H0\ =
j /3(t ,т, x(т),H(т))d т
< M (T -10)
|x *(t) - X (t )c| =
T
/1 (t, т, х(т), Н(т)) + j /2 (т, 5, x(5), H(5))d5
d т
< M((T -10) + 1)(T -10).
Отсюда следует, что при
M ((T -10) + 1)(T -10) <-
(3.19)
условие, предъявляемое к оператору Е в (3.18), выполнено.
Пусть теперь ф = (х, И) и у = (у, g) - некоторые две функции, принадлежащие к множеству От . Тогда при выполнении неравенства (3.19) функции
ф* = Е ф
и
у* = Е у
также принадлежат к От , где ф* = (х*, И*) и у* = (у*, g*). При этом оказывается, что
||ф * -у * = ||Еф - Еу| < к\|ф - у|, (3.2о)
где
Ф = max |ф(/'
t0 <t <T
и к - некоторое положительное число, не зависящее от ф и ф и при всех достаточно малых значениях T > t0 удовлетворяющее условию
к < 1. (3.21)
В самом деле, в силу неравенств (3.14) и формулы Лангража для всех значений t0 < t < T [6, c. 163]
I/ (t, т, x(t), H(t)) - / (t, т, y(t),g(t))| < n2L (Ix(t) - y(t)| + |H(t) - g(t)|),
l = 1,2,3.
(3.22)
Поэтому
j [[ (т, х(т), Н(т)) - /3 (т, y (т), g (т))] d т
T T
j| х(т) - у(т)| d т + jl Н(т) - g (т)| d т
< n2L
(3.23)
Но
j|х(т) -у(т)| dт< j^x) -ф(т)| dт
(3.24)
и
jlН(т) - g(т)| dт^|ф(т) -ф(т) dт .
(3.25)
Тогда, если
H *(t) = H(t)H0 + j /3 (t, т, х(т), H(т))dт
g *(t) = H (t)A0 + j /3 (t, т, у(т), g (т))d т,
то из неравенств (3.23) - (3.25) следует, что
||И * -g *|| < 2п2Ь(Т -го)||ф-у. (3.26)
С другой стороны, в силу неравенства (3.22)
j { /1 (t, т, х(т), Н(т)) - /1 (t, т, у(т), g (т)) +
t0
T
+ j[[ (т, 5, х(5), H(5)) - /2 (т, 5,у(5), g(5))] d5}dт < (3.27)
т
T
j Iх(т) - у(т) + |Н(т) - g(т)| + j (|х(5) - у(5) + |H(5) - g(5)J) d5
т
t t
j| х(т) - у(т)| d т<Лф(т) -ф(т) d т (3.28)
< n2 L
d т.
Но
j |Н(т) - g(т)| dт< ||ф(т) -ф(т) dт .
Тогда, если
х *(t) = X (t )c + j [ /1 (t, т, х(т), Н(т)) + j /2 (т, 5, х( 5), H( 5))d5]d т
(3.29)
У *(г) = X (г )с +1 [ /1 (г, т, у(т), g (т)) +1 /2 (т, 5, у( 5), g (з))ёз\а т,
то из неравенств (3.27) - (3.29) и (3.24), (3.25) следует, что
||х * - У * < 2п2 щт - го)+1)(Т - го) I |ф - у I. При этом согласно неравенству треугольника несложно заметить, что
||ф * -у * < | |х * - у * +1 |И * - g * .
(3.30)
(3.31)
и
и
и
т
и
Поэтому, объединяя неравенства (3.26), (3.30) и (3.31), окончательно получаем ||Ф * -у * = |\Fф - Fу || < 4n2L((T - /q) + 1)(T - /q ) ||ф - Ц. Таким образом, если
4n2L((T -/q) + 1)(T -/q) < 1, (3.32)
то, полагая
к = 4n2L((T -/q) + 1)(T - /q),
видим, что при выполнении условия (3.32) выполнены также и условия (3.20) и (3.21). Сказанное означает, что существует такое действительное число Tq, что при /q < t < T число T удовлетворяет условиям (3.19) и (3.32) и обеспечивает выполнение требований, предъявляемых к (3.18), (3.20) и (3.21). Поэтому везде в дальнейшем будем полагать число T выбранным так, что неравенства (3.19) и (3.32) для него выполнены.
Для всех значений /q < t < T и N = 0,1,2,... положим
ФN (t) = (xn (t), hN (t))
и построим последовательность функций
Фо,Ф1,...,Фn ,..., (3.33)
определенных и непрерывных на отрезке [/q, T], в силу системы (3.11), (3.12) приняв
ФN+1 = FфN, N = 0,1,2,... (3.34)
и
Фо(/) - (c, ho). (3.35)
Поскольку функция (3.35) принадлежит к множеству Qt , то в силу равенства (3.34) все функции последовательности (3.33) также принадлежат к Qt . Рассмотрим функциональное уравнение
ф = F ф, (3.36)
в котором в силу условий (3.20), (3.21) F является сжимающим оператором, отображающим множество Qt в себя. Поэтому уравнение (3.36) имеет на множестве Q решение ф *, которое может быть получено по формуле
Ф*(t) = lim фN(t), (3.37)
N ^ro
где сходимость равномерна на отрезке [/q , T ] [6, c. 166]. Но, так как по построению
ho = Pz(T),
то согласно (3.35) последовательность (3.34) удовлетворяет начальным приближениям (2.23) и (2.24). Поэтому из равенств (2.18) и (3.37) следует существование функций u *(t) и x*(t), построенных по формулам (3.1) и (3.2), причем функция x *(t) является соответствующим u *(t) решением уравнения (1.1) с начальным условием (3.3). При этом уравнение (2.21) с граничным условием (2.22) переходит
в уравнение (3.5) с граничным условием (3.6), а закон управления (2.18) - в (3.4). Более того, по построению
lim Jn (un ) = J(u*)
N ^ro
и
Jn (un ) < Jn (u)
для всех u e L2 , откуда и следует цепочка (3.7). Таким образом, теорема 1 доказана.
З а м е ч а н и е 1. По аналогии с модифицированным методом Ньютона матрицы A(t) и B(t) следовало бы задавать по формулам
A(t) =
dxJ
х= x0(t) и=u0(t)
B(t) =
х= x0(t) и=u0(t)
ч5иу
где х0^) и Uо(t) - некоторое начальное приближение к решению задачи (1.1) -(1.3) [5, с. 470]. Однако, как видно из доказательства теоремы, выбор матриц А^) и Б^) по формулам (2.16) и (2.17) принципиально влияет только на оценку величины Т) и скорость сходимости. Гораздо более важным представляется то обстоятельство, что в последнем случае выбор имеет более чем прозрачное физическое обоснование.
Вообще говоря, матрицы А^) и Б(0 можно задавать достаточно произвольно, исходя, например, из допустимости значения Т0. Платой за произвольность выбора этих матриц будет снижение скорости сходимости метода.
З а м е ч а н и е 2. Если задача (1.1) - (1.3) имеет решение класса Ь^ , то (3.7) не гарантирует, что функция и * будет именно решением. Другими словами, в общем случае функция и * является только лишь приближением к решению исходной задачи, качество которого оценивается цепочкой (3.7).
З а м е ч а н и е 3. Весьма существенным представляется то обстоятельство, что соотношение (3.4) представляет собой нелинейный закон управления с обратной связью, получаемый в предельном переходе из линейных законов (2.18).
4 Системы с выделенной линейной частью
Для полноты картины рассмотрим часто встречающуюся на практике динамическую систему
х = Ах + Би + / (х, и), (4.1)
в которой х = (х1,...,х") - " -мерный действительный вектор состояния, и = (и1,...,ит) - т -мерный действительный вектор управления, А и Б - действительные (" х ") - и (" х т) - матрицы, а / = (У1,..., /") - векторная функция, определенная и непрерывная вместе со своими частными производными
У . . ,
——, I,} = 1,...,"
йх3
и
——, I = 1,..., п, ] = 1,..., т
йи}
в пространстве Яп+т .
Предположим, что начальное состояние
х(^) = с (4.2)
задано, а задача управления системой (4.1) заключается в минимизации функционала
т
■(и) = 1 |[(е (/),0е(О) + («(/),Яи(0)] йг + |(е(Т),Ре(Т)), (4.3) 'о
в котором Т - фиксированное конечное время, 2 и Р - симметрические положительно полуопределенные (пхп)-матрицы; Я - симметрическая положительно определенная (тхт)-матрица и, как и ранее; е(') - ошибка системы, т.е.
е(г) = х(г) - г (г)
для всех значений г0 < г < Т, где г = (г1, ..., гп) - п-мерный действительный вектор.
В отличие от п. 2 для задачи (4.1) - (4.3) несложно построить метод последовательных приближений, идейно близкий к упомянутому выше, но не имеющий формальных проблем с выбором матриц. Именно, для построения оценки решения задачи (4.1) - (4.3) для всех значений N = 0,1,2,... рассмотрим задачу о минимизации функционала Т
■^+1(и) = 1 Д(е('), бе(0) + {и ('),Я и(г))] йг + |(е (Т),Ре(Т)), (4.4)
го
с ограничением
х = Ах + Ви + / (xN, UN), х('о) = с. (4.5)
Для заданных функций XN и UN оптимальное управление UN+1(г) в задаче (4.4), (4.5) дается законом управления с обратной связью
UN+1 (г) = Я"1В' [+1 (г) - к (г) xN+1 (г)], (4.6)
в котором XN+1(г) - решение уравнения (4.5), соответствующее UN+1(г) и удовлетворяющее начальному условию
XN+1 (г0 ) = с,
К (г) - решение матричного дифференциального уравнения Риккати
К (г) = -к (г) А -А'к (г) + к (г) ВЯ~1В'к (г) - 0 (4.7)
с граничным условием
к (Т) = Р, (4.8)
а hN+1(г) - решение линейного дифференциального уравнения
hN+1(t) = -
Л X (t)
hN+i (t) - Qz (t) + К (t) / ( Xn (t), Mn (t)) (4.9)
с граничным условием
hN+1(Т) = Рг(Т). (4.10)
и
Таким образом, если начальное приближение х0(/), и0^) каким-либо образом задано, то соотношения (4.6) - (4.10) определяют схему последовательных приближений, которая, вообще говоря, при всех достаточно малых значениях Т позволяет получить достаточно хорошее приближение к решению задачи (4.1) -(4.3). Отметим только, что здесь, как и в п. 2, начальное приближение определяется соотношениями
х0^) = с
и
и0 ^) = Я_1Б' [Р 2{Т) - К^)с]. Пусть Ь2 - множество функций, определенных на отрезке [^,Т], принимающих значения в пространстве Ят и суммируемых с квадратом на [/0, Т]. ДаТ Т
лее, пусть Ь2 - часть множества Ь2, такая, что для каждой функции и е Ь2 уравнение (4.1) имеет абсолютно непрерывное решение х(/), определенное для всех значений 0 < t < Т и удовлетворяющее начальному условию (4.2). Тогда имеет место следующая теорема.
Т е о р е м а 2. Пусть функция / = (/1,...,/") определена и непрерывна вместе со своими частными производными
jT
öxJ
i, J = 1,..., n
f ■ 1 ■ 1 -, i = 1,..., и, j = 1,..., да
duJ
в пространстве Я"+. Тогда для каждой точки (t0, c) пространства Я"+1 найдется такое действительное число Г0 > t0, что для всех значений t0 < T < T0 справедливы равенства
lim un (t) = u * (t),
N ^ro
lim xn (t) = x * (t),
N ^ro
где сходимость равномерна на отрезке [/0, T ], u *(t) — некоторая функция, определенная и непрерывная на [t0, T], а х *(/) — соответствующее решение уравнения (4.1) с начальным условием
х *(to) = c.
При этом оказывается, что для всех значений to < t < T
u *(t) = Я"1 B'[h *(t) -K(t)х*(t)], (4.11)
где h *(t) - решение дифференциального уравнения
h * (t) = - [A - BR~lB'K(t)] ' h * (t) - Q z(t) + K(t)f (х * (t),u * (t))
с граничным условием
h * (T) = P z(T).
и
Более того, для каждой функции u е ¿2
lim JN (uN) = J(u*) < lim JN (u). (4.12)
Доказательство теоремы 2 почти дословно повторяет доказательство теоремы 1 и, потому, здесь опускается. Заметим только, что в условиях теоремы 2 в отличие от теоремы 1 вопрос о выборе матриц A и B снимается.
З а м е ч а н и е 4. Необходимо отметить, что если задача (4.1) - (4.3) имеет
т
решение класса ¿2 , то как и в случае теоремы 1 цепочка (4.12) не гарантирует того, что функция u * будет именно этим решением. Другими словами, в общем случае функция u * является только лишь приближением к решению исходной задачи, качество которого оценивается цепочкой (4.12). В любом случае здесь, как и ранее, закон управления (4.11) остается нелинейным.
5 Нелокальное продолжение оценки (4.11)
Автономность системы (4.1) и постоянство матриц Q и R в п.4 фактически нигде не используются и приняты исключительно для простоты обозначений. По этой же причине без какой-либо потери общности ниже рассматривается именно задача (4.1)-(4.3), а не задача с переменными матрицами или задача (1.1) - (1.3).
Изучим возможность продолжения оценки (4.11) решения задачи (4.1) - (4.3) влево от точки t0. Это, очевидно, даст возможность отказаться от предположения о малости величины T -10 .
Начнем с рассмотрения случая, когда величина T - to достаточно мала. Оказавшись, таким образом, в условиях применимости тоеремы 2, положим
ho = h *(to)
и рассмотрим систему
X = [A - BR"1BК(t)] x + BR~lB' h + /(x,R~lB'(h - К(t)x)), h = - A - BR_1B' К(t)] ' h - Qz(t) + К(t)/(x,R_1B'(h - К(t)x)).
(5.1)
Дл каждой точки (¿0, с, пространства Я1+2п каждое решение х(г), ) системы (5.1) с начальным условием
| х(г()) = с,
^0) = Ь0
определено на отрезке [^, Т ] и может быть продолжено до непродолжаемого решения, определенного на некотором максимальном промежутке (Тш;п,Тшах) (см., например, [6, с. 174]).
Рассмотрим сужение описанного выше непродолжаемого решения на промежуток (Тш;п, Т], причем будем считать, что
Тшш = .
Тогда любая задача (4.1) - (4.3) может трактоваться как задача о минимизации функционала
Т
■ (и) = 21[( е($), 0е(О) + (и (г), Яи(г)) ] йг + 1(г(Т), Ре(Т)), (5.2)
0
при ограничении
х = Ах + Би + / (х, и), х(0) = с.
(5.3)
Предположим, что найдется такой вектор ^ е Яп, что решение системы (5.1) с начальным условием
Г х(0) = с,
1 (5.4)
А(0) = ^
удовлетворяет также и условию
й(Т) = Рг(Т).
Тогда, согласно теореме 2 и теореме о непрерывной зависимости решений от начальных условий, оценка решения задачи (5.2), (5.3) дается равенством
и(0 = Я _1Б ' [) - К(/)Х(/) ], (5.5)
где х(/), к({) - решение системы (5.1) с начальным условием (5.4).
Одним из простейших путей отыскания вектора ^, обладающего указанными выше свойствами, представляется путь, связанный с минимизацией функции
I (Й0) = (И(Т) - Р2(Т), 5 (Й(Т) - Р2(Т ))) (5.6)
с ограничениями (5.1), (5.4), где 5 - некоторая симметрическая положительно определенная матрица. Если решение к0) задачи (5.6), (5.1), (5.4) существует, оно дает наилучшую в смысле квадратичного уклонения (5.6) от оценки (5.5) оценку решения задачи (5.2), (5.3). При этом необходимо отметить, что данный путь, конечно, не является ни единственным, ни лучшим (см., например, [7]). З а м е ч а н и е 5. Если система
х = Ах + Би
управляема, то, как известно, решение К ^) уравнения Риккати (4.7) с граничным условием (4.8) может быть продолжено на всю полуось (-<»,Т], оставаясь при этом продолжении ограниченным (см., например, [1, с. 673]). Тогда, как легко видеть, если функция / равномерно ограничена в пространстве Я2п , решения системы (5.1) нелокально продолжаемы влево, что обеспечивает возможность применения описанной выше процедуры получения оценки решения задачи (5.2), (5.3) при любом значении Т . В общем случае для проверки нелокальной продолжаемости решений можно использовать более сильные критерии, обычно используемые в качественной теории дифференциальных уравнений (см., например, [8]).
Список литературы
1. Атанс М. П. Оптимальное управление / М. Атанс, М. Фалб. - М.: Машиностроение, 1968.
2. Ли Э.Б. Введение в теорию оптимального управления / Э.Б. Ли, Л. Маркус. -М.: Наука, 1972.
3. Беллман Р. Процессы регулирования с адаптацией / Р. Беллман. - М.: Наука,
1964.
4. Красовский А.А. Системы автоматического управления полетом и их аналитическое конструирование / А. А. Красовский. - М.: Наука, 1973.
5. Колмогоров А.Н. Элементы теории функции и функционального анализа / А.Н. Колмогоров, С.В. Фомин. - М.: Наука, 1972.
6. Понтрягин Л.С. Обыкновенные дифференциальные уравнения / Л.С. Понтрягин. - М.: Наука, 1970.
7. Федоренко Р.П. Приближенное решение задач оптимального управления / Р.П. Федоренко. - М.: Наука, 1978.
8. Красносельский М.А. Оператор сдвига по траекториям дифференциальных уравнений / М.А. Красносельский. - М.: Наука, 1966.
On General Task of Control over Non-Linear Systems Using Quadric Criterion
A.P. Afanasyev1, S.M. Dzyuba2, S.M Lobanov3
The Institute of System Analysis RAS, Moscow (1); TSU after G.R. Derzhavin (2)
Key words and phrases: control over non-linear systems using quadric criterion; non-local continuation of estimation; solution estimation; successive approximation.
Abstract: The method for obtaining solution estimation of control over nonlinear systems using quadric criterion is suggested. It is given in the form of non-linear law of feedback control. The matter of non-local continuation of such estimation is considered.
Über die Gesamtaufgabe der Steuerung von nichtlinearen Systemen nach dem Quadratischkriterium
Zusammenfassung: Es ist die Methode des Erhaltens der Einschätzung der Lösung der Gesamtaufgabe der Steuerung von nichtlinearen Systemen nach dem Quadratischkriterium als nichtlineares Steuerungsgesetz mit der Rückkopplung angeboten. Es ist die Frage über die nichtlokale Fortsetzung solcher Einschätzungen untersucht.
Sur le problème général de la commande des systèmes non-linéaires d'après le critère quadratique
Résumé: Est proposée la méthode de l'obtention d'évaluation du problème général de la commande des systèmes non-linéaires d'après le critère quadratique en forme de la loi non-linéaire de la commande avec la liaison indirecte. Est examiné le problème de la suite non-locale de telles évaluations.