Научная статья на тему 'Проекционная процедура нелокального улучшения управляемых систем с функциональными ограничениями'

Проекционная процедура нелокального улучшения управляемых систем с функциональными ограничениями Текст научной статьи по специальности «Математика»

CC BY
70
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ / НЕЛОКАЛЬНОЕ УЛУЧШЕНИЕ / ФУНКЦИОНАЛЬНЫЕ ОГРАНИЧЕНИЯ / ПРОЕКЦИОННАЯ ПРОЦЕДУРА / OPTIMAL CONTROL PROBLEM / NONLOCAL IMPROVING / FUNCTIONAL CONSTRAINTS / PROJECTING PROCEDURE

Аннотация научной статьи по математике, автор научной работы — Трунин Дмитрий Олегович, Очирбат Батор, Ганхуяг Данзан

В статье предлагается процедура нелокального улучшения допустимых управлений в нелинейных по состоянию задачах оптимального управления с функциональными ограничениями на основе операции проектирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Трунин Дмитрий Олегович, Очирбат Батор, Ганхуяг Данзан

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Projecting procedure of nonlocal improving controlled systems with functional constraints

In the article a nonlocal improvement procedure of admissible control for nonlinear on a state optimal control problems with functional constraints based on projecting operation is proposed.

Текст научной работы на тему «Проекционная процедура нелокального улучшения управляемых систем с функциональными ограничениями»

УДК 517.977

© Д.О. Трунин, Б. Очирбат, Д. Ганхуяг

ПРОЕКЦИОННАЯ ПРОЦЕДУРА НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ С ФУНКЦИОНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ 1

В статье предлагается процедура нелокального улучшения допустимых управлений в нелинейных по состоянию задачах оптимального управления с функциональными ограничениями на основе операции проектирования.

Ключевые слова: задача оптимального управления, нелокальное улучшение, функциональные ограничения, проекционная процедура.

© D.O. Trunin, B.Ochirbat, D. Gankhuyag

PROJECTING PROCEDURE OF NONLOCAL IMPROVING CONTROLLED SYSTEMS WITH FUNCTIONAL CONSTRAINTS

In the article a nonlocal improvement procedure of admissible control for nonlinear on a state optimal control problems with functional constraints based on projecting operation is proposed.

Keywords: optimal control problem, nonlocal improving, functional constraints, projecting procedure.

Введение

В [1] для полиномиальных по состоянию задач оптимального управления со свободным правым концом построены методы нелокального улучшения управлений, основанные на нестандартных формулах приращения функционала без остаточных членов разложений. Отсутствие операции варьирования управлений и возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливают повышенную эффективность построенных методов. В работе [2] эти методы обобщены на класс нелинейных задач оптимального управления со свободным правым концом, а в [5] - на класс нелинейных по состоянию задач оптимального управления с функциональными ограничениями. В данной статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с дополнительными функциональными ограничениями на основе операции проектирования.

1. Постановка задачи

Рассматривается задача оптимального управления [3, 4] с функциональными ограничениями типа равенства

x = f (x,u,t), t e T = [t0,ti ], (1)

x(t0) = x0, u (t) e U, (2)

Ф0(и) ^ min, (3)

Ф, (u) = 0, i = 1S. (4)

Функционалы (3), (4) имеют вид

ф,(и) = <pt(x(ti)) + \tF,(x,и,t)dt, i = 0,s.

Функция f (x,u, t) ифункции Fi(x,u, t), i = 0,s линейны по управлению.

Задачу (1)-(4) сведем к задаче оптимального управления с частично закрепленным правым концом [5]. Для этого преобразуем функциональные ограничения (4)

Ф,(u) = <pt(x0) + JT[(pa(x), f(x,u,t)) + Ft(x,u,t)]dt, i = 1,s.

Вводя в рассмотрение дополнительные фазовые переменные

t

Уг(t) = (x(r)), f(x(t),u(т),т)) + F(x(r),u(t),t)]dr, i =

1 Работа выполнена при финансовой поддержке РФФИ (проекты 12-01-00914-а, 12-01-98011-р_сибирь_а, 13-01-92200-Монг_а)

дополним систему (1) уравнениями вида

У, = {<P« (x),f (x,u ,t) + Ft (x,u,t), i = 1,s, (5)

начальные условия (2) - условиями

y,(to) = 0, i = Ц. (6)

Тогда ограничения (4) перепишутся в виде

y,(ti) = -Vi(x0), i = й (7)

Нетрудно видеть, что задача (1)-(3), (5)-(7) является задачей оптимального управления с частично закрепленным правым концом.

Таким образом, далее будем рассматривать задачу оптимального управления с частично закрепленным правым концом

X = f (x,u,t), t e T = [to,ti ], (8)

x(t0) = x0, u (t) e U, (9)

ф(и) = cp(x(t1)) +[ F(x,u, t)dt ^ min, (10)

J T

xi (t1) = x,1, i = 1, m, m < n, (11)

в которой x = (x1(t),x2(t),...,xn(t)) - векторсостояния, u = (u1(t),u2(t),...,ur(t)) - векторуправления, интервал T фиксирован, x0 e Rn - заданный вектор, x1, i = 1, m - заданные числа, функция (p(x) не

зависит от первых m компонент вектора x; U - выпуклое компактное множество в Rr . Функции f (x,u, t), (p(x), F(x,u, t) непрерывно дифференцируемы по своим аргументам в областях определения, функции f (x, u, t) и F(x, u, t) линейны по u .

В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в множестве U с Rr

V = {u е PCr(T ):u (t)eU, t e T } .

Для каждого доступного управления u е V обозначим x(t,u), t e T - решение задачи Коши (8), (9) при u = u(t).

Определим множество допустимых управлений

W = |u е V: xt (t1,u) = x1,i = 1, m|.

В задаче (8)-( 11) составим нормальный функционал Лагранжа

m

L(u,Ä) = 0(u) + ( x, (t1) - x,1).

¿=1

Функция Понтрягина с сопряженной переменной p е Rn имеет вид

H(p, x,u, t) = (p, f (x,u, t)) - F(x,u, t) .

В силу линейности по u функций f (x, u, t) и F(x, u, t) функция Понтрягина также линейна по управлению

H(p,x,u,t) = H0(p,x,t) + (H1(p,x,t), u).

Приращение функционала Лагранжа на паре доступных управлений (u0,v) в соответствии с [2] имеет вид

L(v,A) -L(u0,1) = -J^H1(p(t,u0,v,A),x(t,v),t),v(t)-u0(t^dt, (12)

где p(t,u0,v,Ä) - решение модифицированной дифференциально-алгебраической сопряженной системы

p = -Hx (p, x(t, u0), u 0(t), t) - r (t), (13)

(их(p,x(t,u0),u0(t),t), x(t,v) - x(t,u0)) + (r(t),x(t,v) -x(t,u0)) = (14) = H (p, x(t, v), u 0(t), t) - H (p, x(t, u0), u 0(t), t),

pt (tx) = -Л,, i = 1m, (15)

]=т+\

,0

Р,}(1) = -фХ](х&,и0)) - ] = т + 1,п, (16)

п

X (х^,и0))(X] V) -X] и0))] +

]-т+1 ' (17)

п

X |_ Ч] ( X] V) - X] и0)= (р( Х(^, V)) - (р( х(^, и0)).

Для управления и е V образуем аналогично [1, 4] вектор-функцию

иа(р,х,0 = Ри [и°(0 + аЯ1(р,х,Г)), р е Яп, х е Дп, а> 0, где Ри - оператор проектирования на множество и в евклидовой норме.

Функция иа(р, х, t) непрерывна по совокупности (р, х) на Яп х Яп и кусочно-непрерывна по t <еТ , причем имеет место оценка [1, 4]

(Я\(р, х, 0, иа( р, х, t) - и0(0) >-||иа(р, х, t) - и °(0|2. (18)

\ ' а" 11

2. Процедура нелокального улучшения

Поставим задачу улучшения управления и0 <еЖ : найти управление V еЖ со свойством Ф^) <Ф(и0).

1. Для заданного а> 0 найдем решение (х^), р(})), t е Т дифференциально-алгебраической краевой задачи

х = / (х, иа( р, х, t), t), 1 еТ, р = -Ях (р, х^, и0), и 0(t), t) - г (t),

(Их(р,x(t,и0),и°(0,t), х-x(t,и0)) + (г(t),х-х^,и0)) = (19) = Я(р, х,и V),I) - Я(р, х^,и0),и0(t), t), х(^) = х0, xi (t\) = х\, , = 1, т,

р] (t\) = -Фх, (x(t\,и0)) - Ч], ] = т +1,п,

п

X (x(t\,и0)) (х] (t\) - х] (t\,и0)) ] +

]'=т+\ п

+ X |_Ч] [х] (t\)" х] 01,и0)= x(t\))-р(х(^,и0)).

]=т+\

2. Сформируемуправление v(t) = и"(р (t), х (t), t), t еТ.

Предположим, что решение (х(t), р^)), t е Т краевой задачи (\9) (возможно, не единственное) существует на Т. Тогда х^) = x(t,V) и VеЖ .

Покажем свойство улучшения для выходных управлений.

Действительно, решение р (0, t <еТ являетсярешением системы (\3), (\4) и удовлетворяет условиям (\6), (\7). Обозначим

^ =- р, (t\), , = \, т. Тогда условия (\5) выполняются и р(^ = р(^и0,v,Л), t е Т .

Следовательно, в соответствии с формулой приращения (\2) и оценкой (\8) выходное управление V обеспечивает невозрастание функционала Лагранжа

Ь(у,~Х) < Ь(и0,1) . Отсюда, в силу допустимости управлений и0, V получаем

Ф^) <Ф(и0).

Отметим, что в силу оценки (18) выходное управление обеспечивает строгое улучшение целевого функционала, если управления u0 и v не совпадают.

Алгебраические соотношения краевой задачи (19) всегда можно разрешить по аналогии с [2] относительно величин r(t), qj и свести дифференциально-алгебраическую краевую задачу (19) к

обычной дифференциальной задаче. Определяя различные однозначные способы разрешения алгебраических уравнений, можно получать модификации метода улучшения с различными дифференциальными краевыми задачами.

3. Пример

Рассмотрим задачу оптимального управления

х1 = u, x2 =-x1 2, te T = [0, я],

x1(0) = 0, x2(0) = 0, |u(t)| < 1, Ф(и) = х2(л) ^ min, x1(n) = 0.

В данном случае

H = p1u - p2 x12.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поставим задачу улучшения допустимого управления u 0(t) = 0, которому соответствуют фазовые траектории x1 (t,u0) = 0, x2(t,u0) = 0, t eT и значение целевого функционала O(u0) = 0 . В данной задаче

1, ap1 > 1, ua(p,х,t) = <j-1, ap1 <-1,

a p1, -1 < a p1 < 1. Таким образом, краевая задача улучшения принимает вид

X1 =ua (p, х, t), X2 =-Xj 2, e1(0) = 0, х2 (0) = 0, x1(e ) = 0, Ä =-^(t), p2 = ~r2(t), p2(n) = -1, Г (t) x1 + r2(t)x2 =-p2x12. Полагая r2(t) = 0 (тогда p2(t) = -1), получим краевую задачу

Xx1 = ua(p, x,t), x1(0) = 0, x1(^) = 0, p1 ="x1.

Положим значение параметра а = 1 и подберем решение, соответствующее условию |А(0| < 1, t eT .

Краевая задача улучшения примет вид

X = p1, X[(0) = 0, X = 0, p1 ="х1.

Очевидно, краевая задача имеет решения вида

x1 (t) = C sin t, p1 (t) = C cos t, t eT,

где C - произвольная постоянная, |C| < 1.

Таким образом, например, допустимое управление

v(t) = cos t, t e T с соответствующими фазовыми траекториями

1

X

\(t,v) = sint, x2(t,v) = — (sin2t-2t) , t eT

строго улучшает исходное управление и0:

ф(у) = ~ < Ф(и0) = 0.

Заключение

Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без

процедуры варьирования в окрестности улучшаемого управления с выполнением всех функциональных ограничений. Это свойство является существенным фактором повышения эффективности решения нелинейных задач оптимального управления с функциональными ограничениями.

Литература

1. Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. - 260 с.

2. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. - Сер. Математика. - 2009. -Т. 2. - № 1. - С. 94-106.

3. Васильев О.В. Лекции по методам оптимизации. - Иркутск: Изд-во Иркут. гос. ун-та, 1994. -340 с.

4. Срочко В.А. Итерационные методы решения задач оптимального управления. - М.: Физмат-лит, 2000. - 160 с.

5. Трунин Д О., Ганхуяг Д. Метод нелокального улучшения управляемых систем с функциональными ограничениями // Вестник Бурятского государственного университета. - Вып. 9(2). -Математика, информатика. - 2014. - С. 33-37.

Трунин Дмитрии Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, тел.: (301-2) 217733, email: [email protected]

Очирбат Батор, Ph.D., профессор, Монгольский университет науки и технологий, Монголия, Улан-Батор.

Ганхуяг Данзан, Ph.D., профессор, Монгольский университет науки и технологий, Монголия, Улан-Батор, e-mail: [email protected]

Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior lecturer, applied mathematics department, Buryat State University, e-mail: [email protected]

Ochirbat Baatar, Ph.D., professor, Mongolian University of Science and Technology, Mongolia, Ulanbaatar.

Gankhuyag Danzan, Ph.D., professor, Mongolian University of Science and Technology, Mongolia, Ulanbaatar, e-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.