Об одном подходе к оптимизации нелинейных управляемых систем с терминальными ограничениями

Трунин Дмитрий Олегович; Булдаев Александр Сергеевич

УДК 517.977

ОБ ОДНОМ ПОДХОДЕ К ОПТИМИЗАЦИИ НЕЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ1

В статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с терминальными ограничениями.

Ключевые слова: задача оптимального управления, нелокальное улучшение, терминальные ограничения.

©D.O. Trunin, AS. Buldaev

ON ONE APPROACH TO OPTIMIZE NONLINEAR CONTROLLED SYSTEMS WITH TERMINAL CONSTRAINTS

In the article a nonlocal improvement procedure of admissible control for nonlinear optimal control problems with terminal constraints is proposed.

Keywords: nonlinear optimal control problem, nonlocal improving, terminal constraints.

Введение

В работе [1] в классе полиномиальных по состоянию задач оптимального управления со свободным правым концом построены методы нелокального улучшения управлений, основанные на нестандартных формулах приращения функционала без остаточных членов разложений. Отсутствие операции варьирования управлений и возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливают повышенную эффективность построенных методов. В работе [2] эти методы обобщены на класс нелинейных задач оптимального управления со свободным правым концом. В данной статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с терминальными ограничениями.

1. Постановка задачи

Рассматривается задача оптимального управления с частично закрепленным правым концом

x = f(x,u,t), teT^,^], (1)

x(t0) = x°, u(t) e U, (2)

1 Работа выполнена при финансовой поддержке РФФИ (проекты 12-01-00914-а, 12-01-98011-р_сибирь_а, 13-01-92200-Монг_а)

Ф(и) = <p(x(Yj)) + [ F(x,u,t)dt^> min, (3)

J т

xi (ij ) = х/, i = \, m, m <n, (4)

в которой x = (xl(t),x2(t),...,xn(t)) - вектор состояния, и = {ul(t),u2(t),...,ur(t)} - вектор управления, интервал Т фиксирован,

х° е R" - заданный вектор, х. , i = 1. m - заданные числа, функция (р(х) не зависит от первых m компонент вектора х. Функции f(x,u,t), <р(х). F(x,u,t) непрерывно дифференцируемы по своим аргументам в областях определения.

В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в компактном множестве

V = {uePCr(T):u(t)eU, tel). Для каждого доступного управления ueV обозначим x(t,u), teT -решение задачи Коши (1), (2) при и = u(t).

Определим множество допустимых управлений

W = eV : хД tx,u) = х/,7 = 1,/wj . В задаче (1)-(4) составим нормальный функционал Лагранжа

m

z(M) = Ф(«)+£ A-)-*/)•

1=1

Функция Понтрягина с сопряженной переменной ре R" имеет вид

H(p,x,u,t) = (р, /(х,м,0) - F(x,u,t) . Приращение функционала Лагранжа на паре доступных управлений (ï/'.v'j в соответствии с [2] имеет вид

L(v,À)-L(u°,À) =

где р(/л" .v. А) - решение модифицированной дифферециально-алгебраической сопряженной системы

P = -Hx(p,x(ty\u\t\t)-r(t\ (6)

(Нх(р,х((,и°)У(0Л X(t,v) - x(t,u0)) + (r(t),x(t,v) - X(t,u0)) = = H(p,x(t,v),u°(t), t) -H(p,x(t,u°),u°(t), t),

Pl(tl) = -Ai, i = ÏJn, (8)

pj(h) = -(px](x{hy))-qj, j = m+i,n, (9)

п

X [<PXj Wi , )) (*,- («i, v) - Xj (f,, u° )) J +

j=m+1 n

Z (xj (^m<)))J=- (p(x(t,y)).

j=m+\

Введем отображение

u(p,x,t) = arg max H(p, x,v,t), ре R", хе R", teT.

veil

2. Метод нелокального улучшения

Поставим задачу улучшения управления и0 е W : найти управление veW со свойством Ф(у) < Ф{и").

1. Найдем решение (х(0,/>(0), t<ET дифференциально-алгебраической краевой задачи

х = f(x,u(p,x,t),t), teT, р = -Нх (р, x(t,u°),u°(t), t) - r(t), (Hx(p,x(t,u°),u°(0,0, x-x(t,u°)) + (r(t),x-x(t,u°)) = = H(p,x,u0(t),t)-H(p,x(t,u0),u°(t),t), x(t0) = x°, Xj (tx ) = Xj , 7 = 1, m, Ci ) = -4>x, (XC У))-9у, j = m + l,n,

n

X (xc ' )) [xj (o - с ' )) J+

j=m+1

и r n

y=m+l

2. Сформируем управление v(t) = u (p(t),x(t),t), teT. Предположим, что решение (x(t),p(t)), teT краевой задачи (11) (возможно, не единственное) существует на Т. Тогда x{t) = x{t,v) и veW .

Покажем свойство улучшения для выходных управлений. Действительно, решение pit), t g / является решением системы (6), (7) и удовлетворяет условиям (9), (10). Обозначим

Тогда условия (8) выполняются и p(t) = р(1л" .v. À). teT . Следовательно, в соответствии с формулой приращения (5) выходное управление v обеспечивает невозрастание функционала Лагранжа

Z(v,I)<Z(M°,I) .

Отсюда, в силу допустимости управлений и0, v получаем

Ф(у)<Ф(м°).

Алгебраические соотношения краевой задачи (11) всегда можно разрешить по аналогии с [2] относительно величин r{t), qj и тем самым

свести дифференциально-алгебраическую краевую задачу (11) к обычной дифференциальной задаче. Определяя различные однозначные способы разрешения алгебраических уравнений, можно получать модификации метода улучшения с различными дифференциальными краевыми задачами.

3. Примеры

Пример 1.

Рассмотрим задачу оптимального управления

Xj =и, X2=^-Xj2, ¿еГ = [0,4],

Xj (0) = 1, х2(0) = 0, |м(0|<1, Ф(м) = х2 (4) min, Xj (4) = 1.

В данном случае

1 2

Н = р1и+-р2х1 .

Поставим задачу улучшения допустимого управления u°(t) = 0, которому соответствуют фазовые траектории *,(,,„<>) ,1, x2(^) = f t еТ и

значение целевого функционала Ф(м°) = 2 . В данной задаче

и* (р, x,t) = sign рх. Таким образом, краевая задача улучшения принимает вид

1

xl=signpl, x2=-xj, Xj(0) = 1, х2(0) = 0, Xj(4) = 1,

А = -Pi ~ Г1 (0, Р2 = ~Г2 (0, Р2( 4) = -1 ,

(0(х, -1) + r2(0^х2 -= - 1)-p2(x, -1) .

Полагая r2(t) = 0 (тогда p2(t) = -1), получим краевую задачу

Xj = Sign Px , Xj (0) = 1, Xj (4) = 1,

1 1

P, = - Xj + — .

1 2 1 2

Эта краевая задача имеет решение

\-t +1, te 0,2 , [f-3, te 2,4 .

~- + t-1, te[ 0,2],

Г-l, fe[0,2),

Соответствующее выходное управление v(t) = .

[1, te[ 2,4].

Нетрудно видеть, что управление v(t) является улучшающим: 0(v) = |< Ф(м°) = 2 .

Пример 2.

Рассмотрим задачу оптимального управления

Xj =м, X2=-Xj2, ^еГ = [0, 2],

Xj(0) = 0, х2(0) = 0, \u(t)\<l, Ф(и) = х2 (2) min, Xj (2) = 0 .

В данном случае

H = рги - р2хj2.

Поставим задачу улучшения допустимого управления u°(t) = 0, которому соответствуют фазовые траектории х, (1л") = 0. x2(t,u°) = 0, i е Т и значение целевого функционала Ф(м°) = 0 . В данной задаче

и (р, x,t) = sign рг. Таким образом, краевая задача улучшения принимает вид

Xj = Sign Рх, Х2= -Xj2 , Xj (0) = 0, Х2 (0) = 0, Xj (2) = 0 ,

А = (0, Р2 = ~г2(0, Р2(2) = -1,

rx(i)Xj + r2(t)x2 = - p2Xj2. Полагая r2(t) = 0 (тогда p2(t) = -1 ), получим краевую задачу Xj = sign рг, Xj (0) = 0, Xj (2) = 0,

А =-*!•

Нетрудно видеть, что пара Xj (t) = 0 , рх (t) = 0, t еТ является решением краевой задачи, т.е. управление и0 удовлетворяет регулярному принципу максимума с \ = 0 (особое управление). Кроме того, краевая задача имеет решение

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

\t, fe[0,l],

t2 1

Соответствующее выходное управление

Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без процедуры варьирования в малой окрестности улучшаемого управления с выполнением всех терминальных ограничений. Это свойство является существенным фактором повышения эффективности решения нелинейных задач оптимального управления с терминальными ограничениями.

Литература

1. Булдаев A.C. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят, гос. ун-та, 2008. -

2. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского государственного университета. - Сер. Математика. - 2009. - Т. 2. - № 1. - С. 94-106.

Трунин Дмитрий Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, тел.: (301-2) 217733, e-mail: [email protected] Булдаев Александр Сергеевич, доктор физико-математических наук, профессор кафедры прикладной математики Бурятского государственного университета, тел.: (301-2) 217733, e-mail: [email protected]

Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior lecturer, applied mathematics department, Buryat State University, e-mail: [email protected]

Buldaev Alexander Sergeevich, doctor of physical and mathematical sciences, professor, applied mathematics department, Buryat State University, e-mail: [email protected]

Нетрудно видеть, что управление v(t) является улучшающим:

O(v) = -— < Ф(м°) = 0 .

Заключение

260 с.

Об одном подходе к оптимизации нелинейных управляемых систем с терминальными ограничениями Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Трунин Дмитрий Олегович, Булдаев Александр Сергеевич

Похожие темы научных работ по математике , автор научной работы — Трунин Дмитрий Олегович, Булдаев Александр Сергеевич

ON ONE APPROACH TO OPTIMIZE NONLINEAR CONTROLLED SYSTEMS WITH TERMINAL CONSTRAINTS

Текст научной работы на тему «Об одном подходе к оптимизации нелинейных управляемых систем с терминальными ограничениями»