УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ
УДК 517.977
doi: 10.18101/2304-5728-2017-2-40-45
ОБ ОДНОМ ПОДХОДЕ К НЕЛОКАЛЬНОМУ УЛУЧШЕНИЮ УПРАВЛЕНИЙ В КВАДРАТИЧНЫХ ПО СОСТОЯНИЮ СИСТЕМАХ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ1
© Трунин Дмитрий Олегович
кандидат физико-математических наук, старший преподаватель, Бурятский государственный университет Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а E-mail: [email protected]
В статье предлагается подход к нелокальному улучшению допустимых управлений в квадратичных по состоянию задачах оптимального управления с частично закрепленным правым концом на основе решения системы функциональных уравнений, которая определяет условия нелокального улучшения. К решению рассматриваемой системы в статье применяется метод возмущений, основанный на выделении линейной по состоянию части и параметризации нелинейной части с помощью параметра возмущения. Решение невозмущенной задачи сводится к решению алгебраического уравнения. Для решения возмущенной задачи строится итерационный процесс, на каждой итерации которого решается задача, аналогичная невозмущенной.
Ключевые слова: задача оптимального управления; терминальные ограничения; нелокальное улучшение; метод возмущений.
Введение
В монографии [1] рассмотрены вопросы построения процедур нелокального улучшения допустимых управлений в классе полиномиальных по состоянию задач оптимального управления со свободным правым концом. Отсутствие трудоемкой операции параметрического варьирования и возможность строгого улучшения управлений, удовлетворяющих принципу максимума, обеспечивают повышенную эффективность таких процедур. Одним из подходов к нелокальному улучшению управлений в рассматриваемом классе задач является подход возмущений, основанный на введении в задачу параметра возмущения таким образом, чтобы при некотором (нулевом) значении параметра возмущения задача (невозмущенная задача) допускала простое решение. Для решения возмущенной задачи при ненулевом значении параметра возмущения строится итерационный процесс, на каждой итерации которого решается задача, аналогичная невозмущенной. В данной статье подход возмущений обобщается на задачи оптимального управления с терминальными ограничениями.
1 Работа выполнена при финансовой поддержке РФФИ (проект 15-01-03680-а)
40
1. Постановка задачи
В качестве характерной рассмотрим квадратичную по состоянию и линейную по управлению задачу оптимального управления с одним терминальным ограничением
х = A(x,t)u + b(x,t), teT = [t0, tx], (1)
x(t0) = x°, u(t) e U, (2)
Ф(и) = (с, x(Yj )) —» min, (3)
х1(0 = х11. (4)
Матричная функция A{x,t) и вектор-функция b{x,t) являются квадратичными по х и непрерывными по t на R" хТ , с е R" — заданный вектор, Cj = 0, х/ — заданное число.
В качестве доступных управлений рассматривается множество кусочно-непрерывных функций со значениями в компактном множестве
V = {uePCr(T):u(t)eU, tel). Для управления ueV обозначим x(t,u), teT —решение задачи Ко-ши (1), (2) при и = u(t).
Определим множество допустимых управлений
W = {и е V : Xj (tx ,и) = х/ } . Для задачи (1)-(4) функция Понтрягина с сопряженной переменной ре R" имеет вид
Н(р, x,u,t) = H0(р,х,0 + (#! (р,х,0,и), где H0(p,x,t) = (p, b(x,t)), Hl(p,x,t) = A(x,t)Tp. Рассмотрим нормальный функционал Лагранжа
L(u,À) = (c,x(i1)) + /l(x1(i1)-x11), ÀeR. Приращение функционала Лагранжа на паре доступных управлений (ï/'.v'j в соответствии с [1] имеет вид
где р(1л".v. А) —решение модифицированной сопряженной системы
Р = (Р,х-и-<) ~\Н™(Р>х-и-0У> p1(t1) = -À,
при и = U°(t), X = x(t,u°), у = x(t,v) - x(t,u°) .
Для управления и0 е V образуем аналогично [1] вектор-функцию
ua(p,x,t) = Pu{u°(t) + aH1(p,x,t)), peR", xeR", а> 0, где Ри — оператор проектирования на множество U в евклидовой норме.
В [3] показано, что для нелокального улучшения управления и0 е W следует решить краевую задачу
x = A(x,t)ua(p,x,t) + b(x,t), te.T,
р = -Нх(р, x(t,u\u\t), t) - (р,x(t,u°),u°(t), t)(x - x(t,u0)),
L (pj
1(^o )— ' ^ (A )— ^"î '
Pi(0 = ~ci, i = 2,n.
Нетрудно показать, что краевая задача улучшения (5) эквивалентна следующей системе функциональных уравнений в пространстве управлений
v(i) = ua(p(t,u°,v,À),x(t,v),t), «>0,
(6)
xl(tl,v) = x\.
Для решения краевой задачи (5) (эквивалентной системы функциональных уравнений (6)) предлагается процедура, основанная на известном [1] подходе возмущений.
2. Метод возмущений
К решению задачи нелокального улучшения допустимого управления и0 применим подход возмущений, основанный на параметризации исходной задачи оптимального управления с помощью параметра возмущения s е [0, 1].
Выделим в задаче (1)-(4) линейную по состоянию часть и представим ее в форме
х = \(u,t)x + b0(u,t) + f^uj), teT = [t0, tx], x(t0) = x°, u(t)eU,
Ф(и) = —»min, xl(tl) = x\.
Рассмотрим возмущенную задачу оптимального управления с параметром возмущения s е [0, 1]
X = \(u,t)x + b0(u,t) + sfl(x,u,t), teT = [t0, tx], x(t0) = x°, u(t)eU,
Ф(и) = —»min, xl(tl) = x\.
Соответствующую функцию Понтрягина
Hs(p,x,u,t) = {p,\(u,t)x + b0(u,t)) + s{p,fl(x,u,t))
назовем возмущенной.
В силу линейности по и возмущенная функция Понтрягина имеет следующую структуру
Hs(p,x,u,t) = Hs0(p,x,t) + {Hsl(p,x,t),u).
Введем возмущенное отображение и" с помощью следующего соотношения
uae(p,x,t) = Pv(u\t) + aHel(p,x,t)), peR",xeR", teT.
Краевую задачу улучшения в возмущенной задаче оптимального управления определим как возмущенную краевую задачу
х = Д , 0и" (p,x,t),t)x + b0(uas (р, х,0,0 + (х,< х, 0,0, t еТ, x(t0) = x°, xl(tl) = x\, (7)
P = -Hsx(p,x(t,u°),u°(t),t)-
{p, X(t,u°),u°(t), t)(x - x(t,u0)),
P,(0 = -c„ i = 2,n.
Значение s = 0 соответствует невозмущенному случаю. При этом невозмущенная краевая задача улучшения сводится к решению уравнения с одним неизвестным параметром.
Действительно, рассмотрим невозмущенную задачу (s = 0) x = A()(u,t)x + b0(u,t), teT = [t0, tx],
x(t0) = x\ u(t) e U, (8)
Ф(и) = (c,x(ij)) —>min, xl(tl) = x\.
Функция Понтрягина для задачи (8) принимает вид
H0(p,x,u,t) = {p,\(u,t)x + b0(u,t)),
Я0 (р, x,u,t) = Я00 (р, х, 0 + (Я01 (р, х, 0, и).
Невозмущенное отображение и"
и"(р,х,0 = Ри(и°(0 + ссН01 (р,х,0), peRn,xeRn, teT.
Невозмущенная краевая задача принимает вид
х = Л «(р,х,0,t)x + b0«(р,х,0,0, t е Т,
x(t0) = x°, Xl(tl) = x\, (9)
p = -H0x(p,x(t,u°),u\t),t),
Р,(0 = -с„ i = 2,n.
Отметим, что в краевой задаче (9) уравнения для сопряженных переменных не зависят от х. Данное обстоятельство позволяет применить к решению задачи (9) следующий подход на основе известного [2] метода стрельбы.
Будем полагать
pl{tl) = a,
где а е R — пока неизвестный параметр, подлежащий определению.
Обозначим через p(t,à), teT решение задачи Коши p = -H0x(p,x(t,u0),u°(t),t), pl{tl) = a, Pi{tl) = -ci, 7 = 2,«.
Обозначим через x(t,a), i е Т решение задачи Коши
* = А « (p(t,а\х>0, t)x + b0« (p(t,а), х, 0, о, t е Т, x(t0) = x°.
Тогда решение невозмущенной задачи сводится к нахождению корня уравнения
Xj (t,a) = Xj1.
Для решения возмущенной краевой задачи (7) при s > 0 предлагается итерационный процесс с индексом к > 0
=д, (и: (pk+i, xt+i, t), t)xk+i + ь0 (и: (Pk+i, xt+i, t), t)+
+ sf1(xk+\u«(pk+\xk+\t),t), teT = [t0, t,}, xk+\t0) = x°, xk+\tl) = x\, (10)
pk+l=-Hsx(pk+\x(t,u°),u\t),t)-
-\Hsxx(pk+\x(ty\u\t),t)(xk(t)-x(ty)\
pk+\t1) = -ci, i = ~2ji.
В качестве начального приближения (х°,р°) при к = 0 выбирается решение невозмущенной задачи. На каждой итерации процесса (10) решается задача, по трудоемкости аналогичная невозмущенной задаче.
Расчет краевых задач проводится до первого улучшения управления. Далее строится новая краевая задача и алгоритм возмущений. Таким образом, метод возмущений для решения краевых задач порождает в целом метод возмущений для решения задач оптимального управления.
Заключение
Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без процедуры варьирования в малой окрестности улучшаемого управления с выполнением всех терминальных ограничений. Это свойство является существенным фактором повышения эффективности решения нелинейных задач оптимального управления с терминальными ограничениями.
Литература
1. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во БГУ, 2008. 260 с.
2. Самарский А. А., Гулин А. В. Численные методы. М.: Наука, 1989. 432 с.
3. Трунин Д. О. Проекционная процедура нелокального улучшения в полиномиальных по состоянию задачах оптимального управления с терминальными ограничениями // Вестник Бурятского государственного университета. 2009. Вып. 9. С. 52-57.
ABOUT ONE APPROACH TO NONLOCAL CONTROL IMPROVEMENT IN QUADRATIC-IN-THE-STATE SYSTEMS WITH TERMINAL CONSTRAINTS
Dmitriy O. Trunin
Cand. Sci. (Phys. and Math.), Senior Lecturer,
Buryat State University
24a Smolina St., Ulan-Ude 670000, Russia
In the article we propose an approach to nonlocal improvement of admissible controls in quadratic-in-the-state optimal control problems with a partially fixed right end based on solution of a system of functional equations, that determine the conditions for nonlocal improvement. For solving the system under consideration, the perturbation method have been used, grounded in separation of nonlinear part that is linear in the state and parametrization of nonlinear part by the perturbation parameter. The solution of the unperturbed problem reduces to solution of an algebraic equation. To solve the perturbed problem, an iterative process is constructed, at each iteration a problem similar to the unperturbed one is solved. Keywords: optimal control problem; terminal constraints; nonlocal improvement; perturbation method.