УДК 517.977
© Д. О. Трунин, А. С. Булдаев
ОБ ОДНОМ ПОДХОДЕ К ОПТИМИЗАЦИИ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ1
В статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с терминальными ограничениями.
Ключевые слова: задача оптимального управления, нелокальное улучшение, терминальные ограничения.
©D.O. Trunin, AS. Buldaev
ON ONE APPROACH TO OPTIMIZE NONLINEAR CONTROLLED SYSTEMS WITH TERMINAL CONSTRAINTS
In the article a nonlocal improvement procedure of admissible control for nonlinear optimal control problems with terminal constraints is proposed.
Keywords: nonlinear optimal control problem, nonlocal improving, terminal constraints.
Введение
В работе [1] в классе полиномиальных по состоянию задач оптимального управления со свободным правым концом построены методы нелокального улучшения управлений, основанные на нестандартных формулах приращения функционала без остаточных членов разложений. Отсутствие операции варьирования управлений и возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливают повышенную эффективность построенных методов. В работе [2] эти методы обобщены на класс нелинейных задач оптимального управления со свободным правым концом. В данной статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с терминальными ограничениями.
1. Постановка задачи
Рассматривается задача оптимального управления с частично закрепленным правым концом
x = f(x,u,t), teT^,^], (1)
x(t0) = x°, u(t) e U, (2)
1 Работа выполнена при финансовой поддержке РФФИ (проекты 12-01-00914-а, 12-01-98011-р_сибирь_а, 13-01-92200-Монг_а)
Ф(и) = <p(x(Yj)) + [ F(x,u,t)dt^> min, (3)
J т
xi (ij ) = х/, i = \, m, m <n, (4)
в которой x = (xl(t),x2(t),...,xn(t)) - вектор состояния, и = {ul(t),u2(t),...,ur(t)} - вектор управления, интервал Т фиксирован,
х° е R" - заданный вектор, х. , i = 1. m - заданные числа, функция (р(х) не зависит от первых m компонент вектора х. Функции f(x,u,t), <р(х). F(x,u,t) непрерывно дифференцируемы по своим аргументам в областях определения.
В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в компактном множестве
V = {uePCr(T):u(t)eU, tel). Для каждого доступного управления ueV обозначим x(t,u), teT -решение задачи Коши (1), (2) при и = u(t).
Определим множество допустимых управлений
W = eV : хД tx,u) = х/,7 = 1,/wj . В задаче (1)-(4) составим нормальный функционал Лагранжа
m
z(M) = Ф(«)+£ A-)-*/)•
1=1
Функция Понтрягина с сопряженной переменной ре R" имеет вид
H(p,x,u,t) = (р, /(х,м,0) - F(x,u,t) . Приращение функционала Лагранжа на паре доступных управлений (ï/'.v'j в соответствии с [2] имеет вид
L(v,À)-L(u°,À) =
где р(/л" .v. А) - решение модифицированной дифферециально-алгебраической сопряженной системы
P = -Hx(p,x(ty\u\t\t)-r(t\ (6)
(Нх(р,х((,и°)У(0Л X(t,v) - x(t,u0)) + (r(t),x(t,v) - X(t,u0)) = = H(p,x(t,v),u°(t), t) -H(p,x(t,u°),u°(t), t),
Pl(tl) = -Ai, i = ÏJn, (8)
pj(h) = -(px](x{hy))-qj, j = m+i,n, (9)
п
X [<PXj Wi , )) (*,- («i, v) - Xj (f,, u° )) J +
j=m+1 n
Z (xj (^m<)))J=- (p(x(t,y)).
j=m+\
Введем отображение
u(p,x,t) = arg max H(p, x,v,t), ре R", хе R", teT.
veil
2. Метод нелокального улучшения
Поставим задачу улучшения управления и0 е W : найти управление veW со свойством Ф(у) < Ф{и").
1. Найдем решение (х(0,/>(0), t<ET дифференциально-алгебраической краевой задачи
х = f(x,u(p,x,t),t), teT, р = -Нх (р, x(t,u°),u°(t), t) - r(t), (Hx(p,x(t,u°),u°(0,0, x-x(t,u°)) + (r(t),x-x(t,u°)) = = H(p,x,u0(t),t)-H(p,x(t,u0),u°(t),t), x(t0) = x°, Xj (tx ) = Xj , 7 = 1, m, Ci ) = -4>x, (XC У))-9у, j = m + l,n,
n
X (xc ' )) [xj (o - с ' )) J+
j=m+1
и r n
y=m+l
2. Сформируем управление v(t) = u (p(t),x(t),t), teT. Предположим, что решение (x(t),p(t)), teT краевой задачи (11) (возможно, не единственное) существует на Т. Тогда x{t) = x{t,v) и veW .
Покажем свойство улучшения для выходных управлений. Действительно, решение pit), t g / является решением системы (6), (7) и удовлетворяет условиям (9), (10). Обозначим
Тогда условия (8) выполняются и p(t) = р(1л" .v. À). teT . Следовательно, в соответствии с формулой приращения (5) выходное управление v обеспечивает невозрастание функционала Лагранжа
Z(v,I)<Z(M°,I) .
Отсюда, в силу допустимости управлений и0, v получаем
Ф(у)<Ф(м°).
Алгебраические соотношения краевой задачи (11) всегда можно разрешить по аналогии с [2] относительно величин r{t), qj и тем самым
свести дифференциально-алгебраическую краевую задачу (11) к обычной дифференциальной задаче. Определяя различные однозначные способы разрешения алгебраических уравнений, можно получать модификации метода улучшения с различными дифференциальными краевыми задачами.
3. Примеры
Пример 1.
Рассмотрим задачу оптимального управления
Xj =и, X2=^-Xj2, ¿еГ = [0,4],
Xj (0) = 1, х2(0) = 0, |м(0|<1, Ф(м) = х2 (4) min, Xj (4) = 1.
В данном случае
1 2
Н = р1и+-р2х1 .
Поставим задачу улучшения допустимого управления u°(t) = 0, которому соответствуют фазовые траектории *,(,,„<>) ,1, x2(^) = f t еТ и
значение целевого функционала Ф(м°) = 2 . В данной задаче
и* (р, x,t) = sign рх. Таким образом, краевая задача улучшения принимает вид
1
xl=signpl, x2=-xj, Xj(0) = 1, х2(0) = 0, Xj(4) = 1,
А = -Pi ~ Г1 (0, Р2 = ~Г2 (0, Р2( 4) = -1 ,
(0(х, -1) + r2(0^х2 -= - 1)-p2(x, -1) .
Полагая r2(t) = 0 (тогда p2(t) = -1), получим краевую задачу
Xj = Sign Px , Xj (0) = 1, Xj (4) = 1,
1 1
P, = - Xj + — .
1 2 1 2
Эта краевая задача имеет решение
\-t +1, te 0,2 , [f-3, te 2,4 .
~- + t-1, te[ 0,2],
Г-l, fe[0,2),
Соответствующее выходное управление v(t) = .
[1, te[ 2,4].
Нетрудно видеть, что управление v(t) является улучшающим: 0(v) = |< Ф(м°) = 2 .
Пример 2.
Рассмотрим задачу оптимального управления
Xj =м, X2=-Xj2, ^еГ = [0, 2],
Xj(0) = 0, х2(0) = 0, \u(t)\<l, Ф(и) = х2 (2) min, Xj (2) = 0 .
В данном случае
H = рги - р2хj2.
Поставим задачу улучшения допустимого управления u°(t) = 0, которому соответствуют фазовые траектории х, (1л") = 0. x2(t,u°) = 0, i е Т и значение целевого функционала Ф(м°) = 0 . В данной задаче
и (р, x,t) = sign рг. Таким образом, краевая задача улучшения принимает вид
Xj = Sign Рх, Х2= -Xj2 , Xj (0) = 0, Х2 (0) = 0, Xj (2) = 0 ,
А = (0, Р2 = ~г2(0, Р2(2) = -1,
rx(i)Xj + r2(t)x2 = - p2Xj2. Полагая r2(t) = 0 (тогда p2(t) = -1 ), получим краевую задачу Xj = sign рг, Xj (0) = 0, Xj (2) = 0,
А =-*!•
Нетрудно видеть, что пара Xj (t) = 0 , рх (t) = 0, t еТ является решением краевой задачи, т.е. управление и0 удовлетворяет регулярному принципу максимума с \ = 0 (особое управление). Кроме того, краевая задача имеет решение
\t, fe[0,l],
t2 1
Соответствующее выходное управление
Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без процедуры варьирования в малой окрестности улучшаемого управления с выполнением всех терминальных ограничений. Это свойство является существенным фактором повышения эффективности решения нелинейных задач оптимального управления с терминальными ограничениями.
Литература
1. Булдаев A.C. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят, гос. ун-та, 2008. -
2. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. - Сер. Математика. - 2009. - Т. 2. - № 1. - С. 94-106.
Трунин Дмитрий Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, тел.: (301-2) 217733, e-mail: [email protected] Булдаев Александр Сергеевич, доктор физико-математических наук, профессор кафедры прикладной математики Бурятского государственного университета, тел.: (301-2) 217733, e-mail: [email protected]
Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior lecturer, applied mathematics department, Buryat State University, e-mail: [email protected]
Buldaev Alexander Sergeevich, doctor of physical and mathematical sciences, professor, applied mathematics department, Buryat State University, e-mail: [email protected]
Нетрудно видеть, что управление v(t) является улучшающим:
O(v) = -— < Ф(м°) = 0 .
Заключение
260 с.