Д.О. Трунин, Г. Анхбаяр. Нелокальное улучшение управлений в квадратичных по состоянию системах с терминальными ограничениями
УДК 517.977 © Д.О. Трунин, Г. Анхбаяр
НЕЛОКАЛЬНОЕ УЛУЧШЕНИЕ УПРАВЛЕНИЙ В КВАДРАТИЧНЫХ ПО СОСТОЯНИЮ СИСТЕМАХ С ТЕРМИНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ
Работа выполнена при финансовой поддержке РФФИ в рамках научных проектов №№ 12-01-00914-а, 12-01-98011-р_сибирь_а
В статье рассматривается процедура нелокального улучшения допустимых управлений в классе квадратичных по состоянию задач оптимального управления с терминальными ограничениями.
Ключевые слова: задача оптимального управления, нелокальное улучшение, терминальные ограничения.
D.O. Trunin, G. Ankhbayar
NONLOCAL IMPROVING CONTROL IN QUADRATIC ON A STATE SYSTEMS WITH TERMINAL CONSTRAINTS
In the article a procedure for nonlocal control improvement of admissible controls in the class of quadratic on а state of optimal control problems with terminal constraints is proposed.
Keywords: optimal control problem, nonlocal improvement, terminal constraints.
Введение
В работах [1; 2] в классе линейных и полиномиальных по состоянию задач оптимального управления со свободным правым концом построены новые методы нелокального улучшения допустимых управлений. Отсутствие операции варьирования управлений и возможность их улучшения, удовлетворяющих принципу максимума, обусловливают повышенную эффективность этих методов. В данной статье предлагается процедура нелокального улучшения допустимых управлений в классе квадратичных по состоянию задач оптимального управления с терминальными ограничениями на основе операции проектирования. Нелокальность улучшения с сохранением всех терминальных ограничений обеспечивается за счет решения специальной краевой задачи, которая существенно проще краевой задачи принципа максимума.
1. Постановка задачи
Рассматривается квадратичная по состоянию и линейная по управлению задача оптимального управления с терминальными ограничениями
x = A(x,t)u + b(x,t), t eT = [t0, t1 ], x(t0) = x0, (1)
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
u(t) e U с Rr, t eT, ^
Ф(м) = (с, x(^)) ^ min, (3)
X(ti) = i = 1,m m < и (4)
в которой x = ( x1(t), x2(t),..., xn (t)) - вектор состояния, u = (u1(t),u2(t),...,ur(t)) - вектор управления, интервал T фиксирован, x° e R", с = (c1,c2,...,cn) - заданные векторы, ci = 0, i = 1,m , матричная функция A(x, t) и вектор-функция b(x, t) являются квадратичными по x с
коэффициентами, непрерывно зависящими от t на R" х T .
В качестве доступных управлений рассматривается множество
V = ju е PC (T): u(t) eU, t e T} .
Для доступного управления u eV обозначим x(t,u), t eT - решение задачи Коши (1) при u = u(t), t eT .
Определим множество допустимых управлений
W = ju e V: xt (t1,u) = x1,i = 1, mj .
Для задачи (1)-(4) функция Понтрягина с сопряженной переменной p e R" имеет вид
H (p, x, u, t) = H0( p, x, t) + (H1( p, x, t), u), где H0(p,x,t) = (p, b(x,t)), H1(p, x,t) = A(x,t)Tp .
Рассмотрим нормальный функционал Лагранжа
m
L(u,X) = {с,x(t1)) + ^Л, (x,(t1) - x'), 1 e Rm .
i=1
Приращение функционала Лагранжа на паре доступных управлений (u0, v) в соответствии с [2] имеет вид
AvL(u0, Л) = -J (Я1 (p(t,u0,v, Л), x(t,v), t),v(t) - u0 (t)) Jt, (5) где p(t,u0,v,X) - решение модифицированной сопряженной системы
p = - Hx (p, x(t, u0), u 0(t), t) -
- Hxx (p, x(t, u0), u 0(t), t) ( x(t, v) - x(t, u0)),
(6)
2
p,(t\) = -л,, i = 1,m , (7)
pj (0 = -Cj, j = m +1, n . (8)
Для управления u0 e V образуем аналогично [1; 2] вектор-функцию
ua(p,x,t) = PU (u0(t) + aH1(p,x,t)), p e R", x e R", а > 0,
Д.О. Трунин, Г. Анхбаяр. Нелокальное улучшение управлений в квадратичных по состоянию системах с терминальными ограничениями
где Ри - оператор проектирования на множество и в евклидовой норме. Функция иа( р, х, t) непрерывна по совокупности аргументов (р, х) на
Rn х Rn и кусочно-непрерывна по t е Т, причем имеет место оценка [1; 2]
1 2
Ы1(р, х, 0, иа(р, х, 0 - и0(0) >— \\иа(р, х, t) - и 0(0|| . (9) \ 'а" 11
Регулярный принцип максимума для допустимого управления и0 = и0^) записывается в виде
и °(0 = иа (p(t, и0, и 0,Л), х^, и0), ^, t еТ, а > 0. (10)
2. Процедура улучшения
Поставим задачу улучшения управления и0 еW: найти управление у еW со свойством Ф(у) <Ф(и0). Процедура нелокального улучшения.
1. Для заданного а > 0 найдем решение (х^), р^)), t е Т краевой задачи
х = А(х,t)uа(р,х,t) + Ь(х,t), t еТ,, х(^) = х0, xi(t1) = х,1, i = 1,т , (11)
р = - Нх (р, х^, и0), и 0(t), t) -
-1 Нхх (р, х^, и0), u0(t), t) ( х - х^, и0)),
р] (tl) = -°], j = т +1, п .
2. Сформируем управление
у(0 = иа(p(t), x(t), 0, t е Т . Предположим, что решение (х^), р^)), t е Т краевой задачи (11) (возможно, не единственное) существует на Т. Понятно, что х^) = х^, V) и V еW .
Покажем свойство улучшения для выходных управлений. Действительно, решение р^), t е Т является решением системы дифференциальных уравнений (6) и удовлетворяет краевым условиям (8). Сформируем вектор множителей
Л = (Л1, Л2,...,Лт ) ,
где
Лi = -pi (^), , = 1, т . Тогда р(0 = р(^и0,v,Л), t е Т .
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
Согласно формуле приращения (5), выходное управление V обеспечивает невозрастание функционала Лагранжа
L(vД) < L(u0Д) .
Следовательно, в силу допустимости управлений и0, V получаем
Ф(у) <Ф(и0).
Рассмотрим множество управлений на выходе процедуры улучшения Ж1(и0) = {V eW: v(0 = иа( р(г, и0, V,!), х(г, V), г), г е Т } .
Множество Ж1(и0) характеризуется поточечным соотношением у(г) = иа(р(г,и0,V,!),х(г,V),г), геТ .
Очевидным следствием этого соотношения является следующее утверждение.
Лемма. и0 еЖ1(и0) тогда и только тогда, когда управление и0 еЖ удовлетворяет регулярному принципу максимума (10).
Из леммы следует, что краевая задача улучшения (11) для управления и0 еЖ, удовлетворяющего регулярному принципу максимума, имеет хотя бы одно решение.
Отметим, что в силу оценки (9) выходное управление обеспечивает строгое улучшение целевого функционала, если управления и0 и V не совпадают.
Неединственность решения краевой задачи улучшения (11) дает возможность строгого улучшения управления и0 еЖ, удовлетворяющего принципу максимума в регулярном случае.
Выделим свойства краевой задачи (11), упрощающие ее по сравнению с краевой задачей принципа максимума.
1. В краевой задаче (11) уравнения для сопряженных переменных являются линейными по х и р.
2. В краевой задаче (11) правые части для фазовых переменных являются непрерывными по совокупности аргументов (р, х) на Rn х Rn.
Предложенная процедура дает принципиальную возможность осуществления нелокального улучшения на множестве допустимых управлений в рассматриваемом классе задач. Трудоемкость построения улучшающего управления с выполнением всех терминальных ограничений определяется трудоемкостью решения непрерывной краевой задачи.
Подчеркнем нелокальность улучшения: отсутствует малый параметр, характеризующий близость улучшаемого и улучшающего управлений. Процедура имеет возможность улучшения управлений, удовлетворяющих принципу максимума за счет неединственности решения краевой задачи улучшения. В случае, когда краевая задача улучшения не имеет решения, рассматриваемая процедура не действует, и следует перейти к другим процедурам улучшения.
Д.О. Трунин, Г. Анхбаяр. Нелокальное улучшение управлений в квадратичных по состоянию системах с терминальными ограничениями
Заключение
Предлагаемая процедура обеспечивает нелокальное улучшение допустимых управлений без процедуры варьирования по малому параметру с выполнением всех терминальных ограничений. Это свойство является существенным фактором повышения эффективности решения задач оптимального управления с терминальными ограничениями.
Литература
1. Срочко В.А. Итерационные методы решения задач оптимального управления. М.: Физматлит, 2000. 160 с.
2. Булдаев А.С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с.
Трунин Дмитрий Олегович, кандидат физико-математических наук, старший преподаватель кафедры прикладной математики Бурятского государственного университета, e-mail: [email protected], тел.: +7(3012)217733
Анхбаяр Гелегбадам, декан факультета математики и программного обеспечения Улан-Баторского университета.
Trunin Dmitry Olegovich, candidate of physical and mathematical sciences, senior teacher, applied mathematics department, Buryat State University.
Ankhbayar Gelegbadam, Head of Department of Mathematics and Software Ulaan-baatar University.