УДК 517.977
© Д.О. Трунин, Б. Очирбат, Д. Ганхуяг
ПРОЕКЦИОННАЯ ПРОЦЕДУРА НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ С ФУНКЦИОНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ 1
В статье предлагается процедура нелокального улучшения допустимых управлений в нелинейных по состоянию задачах оптимального управления с функциональными ограничениями на основе операции проектирования.
Ключевые слова: задача оптимального управления, нелокальное улучшение, функциональные ограничения, проекционная процедура.
© D.O. Trunin, B.Ochirbat, D. Gankhuyag
PROJECTING PROCEDURE OF NONLOCAL IMPROVING CONTROLLED SYSTEMS WITH FUNCTIONAL CONSTRAINTS
In the article a nonlocal improvement procedure of admissible control for nonlinear on a state optimal control problems with functional constraints based on projecting operation is proposed.
Keywords: optimal control problem, nonlocal improving, functional constraints, projecting procedure.
Введение
В [1] для полиномиальных по состоянию задач оптимального управления со свободным правым концом построены методы нелокального улучшения управлений, основанные на нестандартных формулах приращения функционала без остаточных членов разложений. Отсутствие операции варьирования управлений и возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливают повышенную эффективность построенных методов. В работе [2] эти методы обобщены на класс нелинейных задач оптимального управления со свободным правым концом, а в [5] - на класс нелинейных по состоянию задач оптимального управления с функциональными ограничениями. В данной статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с дополнительными функциональными ограничениями на основе операции проектирования.
1. Постановка задачи
Рассматривается задача оптимального управления [3, 4] с функциональными ограничениями типа равенства
x = f (x,u,t), t e T = [t0,ti ], (1)
x(t0) = x0, u (t) e U, (2)
Ф0(и) ^ min, (3)
Ф, (u) = 0, i = 1S. (4)
Функционалы (3), (4) имеют вид
ф,(и) = <pt(x(ti)) + \tF,(x,и,t)dt, i = 0,s.
Функция f (x,u, t) ифункции Fi(x,u, t), i = 0,s линейны по управлению.
Задачу (1)-(4) сведем к задаче оптимального управления с частично закрепленным правым концом [5]. Для этого преобразуем функциональные ограничения (4)
Ф,(u) = <pt(x0) + JT[(pa(x), f(x,u,t)) + Ft(x,u,t)]dt, i = 1,s.
Вводя в рассмотрение дополнительные фазовые переменные
t
Уг(t) = (x(r)), f(x(t),u(т),т)) + F(x(r),u(t),t)]dr, i =
1 Работа выполнена при финансовой поддержке РФФИ (проекты 12-01-00914-а, 12-01-98011-р_сибирь_а, 13-01-92200-Монг_а)
дополним систему (1) уравнениями вида
У, = {<P« (x),f (x,u ,t) + Ft (x,u,t), i = 1,s, (5)
начальные условия (2) - условиями
y,(to) = 0, i = Ц. (6)
Тогда ограничения (4) перепишутся в виде
y,(ti) = -Vi(x0), i = й (7)
Нетрудно видеть, что задача (1)-(3), (5)-(7) является задачей оптимального управления с частично закрепленным правым концом.
Таким образом, далее будем рассматривать задачу оптимального управления с частично закрепленным правым концом
X = f (x,u,t), t e T = [to,ti ], (8)
x(t0) = x0, u (t) e U, (9)
ф(и) = cp(x(t1)) +[ F(x,u, t)dt ^ min, (10)
J T
xi (t1) = x,1, i = 1, m, m < n, (11)
в которой x = (x1(t),x2(t),...,xn(t)) - векторсостояния, u = (u1(t),u2(t),...,ur(t)) - векторуправления, интервал T фиксирован, x0 e Rn - заданный вектор, x1, i = 1, m - заданные числа, функция (p(x) не
зависит от первых m компонент вектора x; U - выпуклое компактное множество в Rr . Функции f (x,u, t), (p(x), F(x,u, t) непрерывно дифференцируемы по своим аргументам в областях определения, функции f (x, u, t) и F(x, u, t) линейны по u .
В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в множестве U с Rr
V = {u е PCr(T ):u (t)eU, t e T } .
Для каждого доступного управления u е V обозначим x(t,u), t e T - решение задачи Коши (8), (9) при u = u(t).
Определим множество допустимых управлений
W = |u е V: xt (t1,u) = x1,i = 1, m|.
В задаче (8)-( 11) составим нормальный функционал Лагранжа
m
L(u,Ä) = 0(u) + ( x, (t1) - x,1).
¿=1
Функция Понтрягина с сопряженной переменной p е Rn имеет вид
H(p, x,u, t) = (p, f (x,u, t)) - F(x,u, t) .
В силу линейности по u функций f (x, u, t) и F(x, u, t) функция Понтрягина также линейна по управлению
H(p,x,u,t) = H0(p,x,t) + (H1(p,x,t), u).
Приращение функционала Лагранжа на паре доступных управлений (u0,v) в соответствии с [2] имеет вид
L(v,A) -L(u0,1) = -J^H1(p(t,u0,v,A),x(t,v),t),v(t)-u0(t^dt, (12)
где p(t,u0,v,Ä) - решение модифицированной дифференциально-алгебраической сопряженной системы
p = -Hx (p, x(t, u0), u 0(t), t) - r (t), (13)
(их(p,x(t,u0),u0(t),t), x(t,v) - x(t,u0)) + (r(t),x(t,v) -x(t,u0)) = (14) = H (p, x(t, v), u 0(t), t) - H (p, x(t, u0), u 0(t), t),
pt (tx) = -Л,, i = 1m, (15)
]=т+\
,0
Р,}(1) = -фХ](х&,и0)) - ] = т + 1,п, (16)
п
X (х^,и0))(X] V) -X] и0))] +
]-т+1 ' (17)
п
X |_ Ч] ( X] V) - X] и0)= (р( Х(^, V)) - (р( х(^, и0)).
Для управления и е V образуем аналогично [1, 4] вектор-функцию
иа(р,х,0 = Ри [и°(0 + аЯ1(р,х,Г)), р е Яп, х е Дп, а> 0, где Ри - оператор проектирования на множество и в евклидовой норме.
Функция иа(р, х, t) непрерывна по совокупности (р, х) на Яп х Яп и кусочно-непрерывна по t <еТ , причем имеет место оценка [1, 4]
(Я\(р, х, 0, иа( р, х, t) - и0(0) >-||иа(р, х, t) - и °(0|2. (18)
\ ' а" 11
2. Процедура нелокального улучшения
Поставим задачу улучшения управления и0 <еЖ : найти управление V еЖ со свойством Ф^) <Ф(и0).
1. Для заданного а> 0 найдем решение (х^), р(})), t е Т дифференциально-алгебраической краевой задачи
х = / (х, иа( р, х, t), t), 1 еТ, р = -Ях (р, х^, и0), и 0(t), t) - г (t),
(Их(р,x(t,и0),и°(0,t), х-x(t,и0)) + (г(t),х-х^,и0)) = (19) = Я(р, х,и V),I) - Я(р, х^,и0),и0(t), t), х(^) = х0, xi (t\) = х\, , = 1, т,
р] (t\) = -Фх, (x(t\,и0)) - Ч], ] = т +1,п,
п
X (x(t\,и0)) (х] (t\) - х] (t\,и0)) ] +
]'=т+\ п
+ X |_Ч] [х] (t\)" х] 01,и0)= x(t\))-р(х(^,и0)).
]=т+\
2. Сформируемуправление v(t) = и"(р (t), х (t), t), t еТ.
Предположим, что решение (х(t), р^)), t е Т краевой задачи (\9) (возможно, не единственное) существует на Т. Тогда х^) = x(t,V) и VеЖ .
Покажем свойство улучшения для выходных управлений.
Действительно, решение р (0, t <еТ являетсярешением системы (\3), (\4) и удовлетворяет условиям (\6), (\7). Обозначим
^ =- р, (t\), , = \, т. Тогда условия (\5) выполняются и р(^ = р(^и0,v,Л), t е Т .
Следовательно, в соответствии с формулой приращения (\2) и оценкой (\8) выходное управление V обеспечивает невозрастание функционала Лагранжа
Ь(у,~Х) < Ь(и0,1) . Отсюда, в силу допустимости управлений и0, V получаем
Ф^) <Ф(и0).
Отметим, что в силу оценки (18) выходное управление обеспечивает строгое улучшение целевого функционала, если управления u0 и v не совпадают.
Алгебраические соотношения краевой задачи (19) всегда можно разрешить по аналогии с [2] относительно величин r(t), qj и свести дифференциально-алгебраическую краевую задачу (19) к
обычной дифференциальной задаче. Определяя различные однозначные способы разрешения алгебраических уравнений, можно получать модификации метода улучшения с различными дифференциальными краевыми задачами.
3. Пример
Рассмотрим задачу оптимального управления
х1 = u, x2 =-x1 2, te T = [0, я],
x1(0) = 0, x2(0) = 0, |u(t)| < 1, Ф(и) = х2(л) ^ min, x1(n) = 0.
В данном случае
H = p1u - p2 x12.
Поставим задачу улучшения допустимого управления u 0(t) = 0, которому соответствуют фазовые траектории x1 (t,u0) = 0, x2(t,u0) = 0, t eT и значение целевого функционала O(u0) = 0 . В данной задаче
1, ap1 > 1, ua(p,х,t) = <j-1, ap1 <-1,
a p1, -1 < a p1 < 1. Таким образом, краевая задача улучшения принимает вид
X1 =ua (p, х, t), X2 =-Xj 2, e1(0) = 0, х2 (0) = 0, x1(e ) = 0, Ä =-^(t), p2 = ~r2(t), p2(n) = -1, Г (t) x1 + r2(t)x2 =-p2x12. Полагая r2(t) = 0 (тогда p2(t) = -1), получим краевую задачу
Xx1 = ua(p, x,t), x1(0) = 0, x1(^) = 0, p1 ="x1.
Положим значение параметра а = 1 и подберем решение, соответствующее условию |А(0| < 1, t eT .
Краевая задача улучшения примет вид
X = p1, X[(0) = 0, X = 0, p1 ="х1.
Очевидно, краевая задача имеет решения вида
x1 (t) = C sin t, p1 (t) = C cos t, t eT,
где C - произвольная постоянная, |C| < 1.
Таким образом, например, допустимое управление
v(t) = cos t, t e T с соответствующими фазовыми траекториями
1
X
\(t,v) = sint, x2(t,v) = — (sin2t-2t) , t eT
строго улучшает исходное управление и0:
ф(у) = ~ < Ф(и0) = 0.
Заключение
Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без
процедуры варьирования в окрестности улучшаемого управления с выполнением всех функциональных ограничений. Это свойство является существенным фактором повышения эффективности решения нелинейных задач оптимального управления с функциональными ограничениями.
Литература
1. Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. - 260 с.
2. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. - Сер. Математика. - 2009. -Т. 2. - № 1. - С. 94-106.
3. Васильев О.В. Лекции по методам оптимизации. - Иркутск: Изд-во Иркут. гос. ун-та, 1994. -340 с.
4. Срочко В.А. Итерационные методы решения задач оптимального управления. - М.: Физмат-лит, 2000. - 160 с.
5. Трунин Д О., Ганхуяг Д. Метод нелокального улучшения управляемых систем с функциональными ограничениями // Вестник Бурятского государственного университета. - Вып. 9(2). -Математика, информатика. - 2014. - С. 33-37.
Трунин Дмитрии Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, тел.: (301-2) 217733, email: [email protected]
Очирбат Батор, Ph.D., профессор, Монгольский университет науки и технологий, Монголия, Улан-Батор.
Ганхуяг Данзан, Ph.D., профессор, Монгольский университет науки и технологий, Монголия, Улан-Батор, e-mail: [email protected]
Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior lecturer, applied mathematics department, Buryat State University, e-mail: [email protected]
Ochirbat Baatar, Ph.D., professor, Mongolian University of Science and Technology, Mongolia, Ulanbaatar.
Gankhuyag Danzan, Ph.D., professor, Mongolian University of Science and Technology, Mongolia, Ulanbaatar, e-mail: [email protected]