2. Управляемые системы и методы оптимизации
УДК 517.977
МЕТОДЫ ПАРАМЕТРИЧЕСКОЙ ОПТИМИЗАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ С ОГРАНИЧЕНИЯМИ ТИПА РАВЕНСТВА НА ОСНОВЕ ЗАДАЧ О НЕПОДВИЖНОЙ ТОЧКЕ*
© А. С. Булдаев
Предлагается новый подход к поиску оптимальных параметров динамических систем с ограничениями типа равенства на основе построения и решения специальных задач о неподвижной точке определяемых операторов на допустимом множестве параметров.
Ключевые слова: параметрическая оптимизация системы, условия оптимальности, задача о неподвижной точке.
METHODS OF PARAMETRIC OPTIMIZATION OF DYNAMIC SYSTEMS WITH EQUALITY TYPE CONSTRAINTS ON THE BASIS OF FIXED POINT PROBLEMS
© A. S. Buldaev
A new approach to a search of the optimal parameters of dynamical systems with equality constraints is proposed on the basis of construction and solution of special fixed point problems for operators constructed on the admissible set of parameters.
Keywords: parametric optimization of the system, conditions of optimality, fixed point problem.
Введение
Распространенным подходом к решению задач параметрической оптимизации динамических систем с ограничениями является использование методов решения конечномерных задач математического программирования с неявно заданными функциями от параметров [1]. Другой подход основывается на применении теории и методов оптимального управления, в частности, необходимых условий оптимальности в форме принципа максимума [2, 3]. Предлагаемый в данной работе подход основывается на построении и реализации специальных необходимых условий оптималь-
Работа выполнена при финансовой поддержке РФФИ, гранты 12-01-00914-а, 12-01-98011-р_сибирь_а, 13-01-92200-Монг_а
ности, интерпретируемых как задачи о неподвижной точке конструируемых операторов управления. Такие методы неподвижных точек ранее были построены и обоснованы в классах нелинейных задач параметрической оптимизации динамических систем без ограничений [4, 5]. В данной работе этот подход развивается для задач с ограничениями типа равенства.
Задача параметрической оптимизации
Рассматривается задача оптимизации управляющих параметров с терминальными ограничениями типа равенства:
x(t) = f (x(t), u ,t), x(t0) = x0, u eü с Rm, t e T = [t0, tj, (1)
Ф,(u) = q>t(x(ti)) + JF(x(t),u,t)dt = 0, i = \~r , (2)
T
$o(u) = %( x(ti)) + f F>( x(t), u, t)dt ^ min, (3)
•> ueü
T
в которой x(t) = (x1(t),...,xn(t)) - вектор состояния, u = (u1,...,um) - вектор управляющих параметров. В качестве доступных управлений рассматриваются векторы параметров со значениями в компактном выпуклом множестве ü с Rm. Начальное состояние x° и интервал T заданы. Функции q>t(x), F(x,u,t), i = 1,r , векторная функция f (x,u,t) и их производные по x и u непрерывны по совокупности аргументов (x, u, t) на соответствующих множествах Rn и Rn х ü х T . Функция f (x,u, t) удовлетворяет условию Липшица по x в Rn х ü х T с константой L > 0 \\f (x,u,t) - f (y,u,t)|| <L||x -y||.
Рассматриваемые условия гарантируют существование и единственность решения x(t, v), t <eT системы (1) для любого доступного управления veü. Доступное управление u eü называется допустимым, если выполняются функциональные ограничения (2).
Определим функцию Понтрягина с вектором X = (Л0,\,...,Xr) е Rr+1
r
H(Я,x,u,t) = (y, f (x,u,t))(x,u,t) .
i=0
Для управления v eV обозначим y/(t, v,X), t e T - решение сопряженной системы
r
у (t) = -Hx (Ä,¥(t), x(t), u, t), = (x(t1))
i=0
при x(t) = x(t, u), u(t) = v(t), t eT .
Известное необходимое условие оптимальности допустимого управления u eü [2, 3] в форме дифференциального принципа максимума (ДПМ) в задаче (1)-(3) при некотором векторе Л = (Л0,А1,...,ЯГ) Ф 0, Л0 = 0 v 1 можно представить в форме:
u = arg max
J Hu (A,^(t, u,A), x(t, u), u, t)dt, w\, (4)
где Hu - производная по u функции Понтрягина.
Допустимое управление u е U, удовлетворяющее условию (4) при некотором Л = (Л0,Äi,...,Är), Л0 = 1, называется регулярным управлением. Если все допустимые управления, удовлетворяющие условию (4), являются регулярными, то задача (1)-(3) называется регулярной. В противном случае задача (1)-(3) называется вырожденной.
Условие (4) с помощью оператора проектирования PU на множество U в евклидовой норме можно также представить в эквивалентной проекционной форме:
u = PU(u Hu(Ä,y(t,u,Ä),x(t,u),u,t)dt), a> 0. (5)
T
Отметим, что в силу линейности сопряженной системы ее решение можно записать в следующей форме:
¥(t, v,A) = ]Г Xtf (t, v),
i=0
в которой у' (t,v) является решением сопряженной системы:
W(t) = -HX (w(t), x(t),u, t), y/ft) = -(Px (x(ti)) с соответствующей функцией Понтрягина:
Hl x, u, t) = (y, f (x, u, t)) - Ft (x, u, t) в соответствующей задаче с целевой функцией Ф' (u):
Ф,(u) = ф.(x(t1)) + i" F(x(t),u, t)dt ^ min .
J ueU
ueU T
Понятно, что выполняется соотношение:
r
H(Я,^,x,u,t) = ^ЛД'(у,x,u,t).
i=0
Следовательно, функция H соответствует функции Понтрягина в задаче с целевой функцией Лагранжа
L(A, u) = ]Г Я. Ф' (u),
i=0
и условия (4), (5) являются необходимыми условиями оптимальности (ДПМ) в задаче Лагранжа:
r
L(A,u) = (u) ^ min .
U-EU
j=0
Таким образом, условие (4) можно записать в эквивалентном виде:
u = argmaxi ^^ jH'u(у'(t,u),x(t,u),u,t)dt,w \. (6)
w^U \ '=0 T /
В приведенной классической форме условия (4) - (6) являются неконструктивными, так как остается открытым вопрос о выборе множителей Лагранжа.
Задачи о неподвижной точке с множителями Лагранжа
Задача на основе операции на максимум.
Условие (4) вместе с условием допустимости управления
Ф, (и) = 0, 7 = й ,
и условием нормировки
Л0 = 0 V1
представляют собой систему (т + г +1) уравнений с неявно заданными (т + г +1) неизвестными (и,Л) . Решив эту систему, можно определить точки и е и, подозрительные на оптимальность и соответствующие им множители Лагранжа Л = (Л0,Я1,...,Лг) Ф 0.
Предположим, что задача (1)-(3) является регулярной (Л0 =1). Тогда условие (4) с требованием допустимости управления (2) можно представить в форме следующей системы уравнений, имеющей форму задачи о неподвижной точке на множестве и х Яг:
и = а^шах/ ГН (Л,у((,и,Л),х(7,и),и,()Ж,■ ),
^и / (7)
=Л, +т,Ф, (и), т, Ф 0,7 = й, в которой функция Понтрягина Н является регулярной (Л0 = 1) и коэффициенты т{ Ф 0, 7 = 1, г заданы.
Для решения задачи (7) можно применить известный в вычислительной математике метод последовательных приближений и его модификации [6]. В частности метод простой итерации при к > 0 , имеющий форму:
ик+1 = а^шах/ [Ни(Лк,^(7,ик,Лк),х^,ик),ик,7)^7,■ ),
^и \т / (8)
Лк+1 =Лк +г1ФДик), тг Ф 0, 7 = й При к = 0 задается начальное доступное приближение и0 е и , А0 е Яг.
Для улучшения сходимости итерационного процесса задачу о непод -вижной точке (7) можно преобразовать к эквивалентной задаче:
и = и + 8(и -а^шах( I Ни(Л,^((,и,Л),х^,и),и,^&,■ >),
■мШ \Т
8Ф 0,
(и ), ЬФ 0, 7 = 1~г. Применяя метод простой итерации к эквивалентной задаче, получаем мо-
дификацию итерационного процесса (8):
uk+1 = uk +S(uk - arg max/j Hu (Xk ,y(t, uk ,Xk), x(t, uk), uk, t) dt, w\),
Лк+1 =Лк +т,Ф,(ик), г, Ф 0, , = 1,г.
Основным условием сходимости метода простой итерации является выполнение свойства «сжимания» [6] для оператора правой части задачи о неподвижной точке. Поэтому, выбирая достаточно малые коэффициенты 8 Ф 0 , т{Ф 0, ,= 1, г , можно регулировать сходимость рассматриваемой модификации метода простой итерации.
Задача на основе операции проектирования.
Необходимое условие оптимальности в проекционной форме (5) с условием допустимости управления (2) в регулярной задаче (1)-(3) можно также рассматривать в виде задачи о неподвижной точке на множестве и х Яг:
и = Ри (и +а\ Ии и,Х), х^, и), и, ^ й(), а > 0,
г _ (9)
= Л , (и), ^ 0, , = 1, г.
Для решения задачи (9) можно использовать соответствующий итерационный метод последовательных приближений при к > 0 :
ик+1 = Ри (ик +а| Ии (Хк ик ,Хк), х(1, ик), ик ,1
т
а> 0, (10)
Хк+1 =Хк +Т1Ф1 (ик), т,Ф 0, 1 = 1Г.
Оператор задачи (9) в отличие от задачи (7) является однозначным и непрерывным ввиду свойств операции проектирования Ри. Это свойство существенно упрощает анализ решения задачи о неподвижной точке. При этом в качестве регулирующего параметра для анализа сходимости итерационного процесса (10) можно использовать непосредственно сам параметр проектирования а> 0.
Проиллюстрируем в рамках задачи (9) еще один подход к решению, состоящий в последовательном решении двух вспомогательных задач о неподвижной точке.
Для заданного а> 0 проведем декомпозицию поставленной задачи (9) в регулярном случае на две подзадачи.
П 1. Для заданного X е Я.г+1, Л0 = 1 поиск решения задачи:
и = Ри (и Ни (1,^(7, и,Х), х(7, и), и, 7 ), а>0. (11)
т
Обозначим решение задачи (11) через ияе и и соответствующую фазовую траекторию х"(7,А) = х(7,иА), 7 еТ . Определим векторную функцию Ф"(Я) = (Ф1 (!),...,Ф"(Я)) с компонентами
Ф? (X) = срг(х^Д)) +1^(ха(7,Х),uA(í),Х)йХ, { = й .
т
П 2. Поиск решения системы уравнений с заданными т{ Ф 0, { = 1, г
Я, =Л, + т, Ф» (Я), г = ЦГ. (12)
Понятно, что для решения Яе Лг+1, Х0 = 1 системы (12) соответствующее допустимое управление и^ удовлетворяет регулярному ДПМ в проекционной форме (5).
Для реализации соотношения (11) при фиксированном X е Лг+1, Х0 = 1 можно применить явный итерационный процесс с индексом к > 0 и начальным приближением и0 е и
ик+1 = Ри (ик +аИи (Х,^((,икД),х(7,ик),ик, 7).
Для решения системы (12) можно использовать метод простых итераций при к > 0 и начальным приближением X0 е Лг+1, = 1
Л*+1 =1к + тiФ« (1к), { = Гг ,
регулируя сходимость процесса выбором параметров т{. Ф 0, { = 1, г .
Указанный подход можно рассматривать как неявный аналог известного подхода для решения систем уравнений, заключающегося в явном выражении части переменных системы уравнений через остальные переменные и переходе к эквивалентной системе меньшей размерности.
Аналогичный прием декомпозиции исходной задачи на две вспомогательные задачи можно использовать также для рассмотренных выше задач о неподвижной точке на основе операции на максимум.
Задача о неподвижной точке без множителей Лагранжа
Обосновывается новый подход к поиску управлений, удовлетворяющих необходимым условиям оптимальности в рассматриваемом классе задач параметрической параметризации с равенствами.
Приведем задачу (1)-(3) к эквивалентной форме с ограничениями типа неравенства:
х(Г) = / (х(Г), и ,1), х(0 = х0, и еи с Ят, 7 е Т = [Г0, (13)
Ф, (и) = ъ (х(О) + | ^ (х(0, и < 0, { = \г, (14)
т
Ф, (и) = -ф{ (х(^)) ^ (х(Г),и, 7)Ж < 0, { = г + 1,2г , (15)
т
Ф0(и) = g>0(x(t1)) + i"F0(x(t),u,t)dt ^min . (16)
J ueU
T
Понятно, что в задаче (13)-(16) все ограничения типа неравенства являются активными:
ф.(u) = 0, i = 1,2 . Определим множество I индексов активных ограничений вместе с индексом целевого функционала:
I = {0}u {i = 1,...,2r : Ф i (u ) = 0} . Рассмотрим множество
Л = {Я = (Л.,i е I): > 0,= 1}.
ш
Известное необходимое условие оптимальности допустимого управления u eU [2, 3] (ДПМ) для задачи (13)-(16) при некотором ЯеЛ можно представить в виде неравенства:
^ЯЛ jH'u (t, u ), x (t, u ), u, t )dt, w - u) < 0, w eU . (17)
iEl \t /
Из неравенства (17) следует, что
min j Hl (t, u ), x(t, u ), u, t )dt, w - u\ < 0, w eU . (18) e ^ \T /
Неравенство (18), согласно известному результату (Лемма 3.1 на стр. 108 в [7]), эквивалентно неравенству
min^ j H'u ty (t, u ), x(t, u ), u, t )dt, w - u^J < 0, w eU . (19)
Таким образом, получаем следствие необходимого условия оптимальности (17) в форме соотношения (19) без множителей Лагранжа.
Условие (19) можно представить в форме следующей задачи о неподвижной точке на множестве и :
и = а^тахтт/ I И'и (у' (^, и), х (¿, и), и, w-и)). (20) \т I
Для численного решения задачи (20) можно применить итерационный процесс простой итерации при к > 0 и начальным приближением и0 е и :
ик+1 = а^тахтт/ ГИ'и(у'^,ик),х(Г,ик),ик,^Ж,w-ик\
weU 'е1 \ 3 /
т
и его модификации для улучшения сходимости.
Отметим, что решения задачи (20) являются лишь доступными управлениями, т. е. ограничения типа равенства (2) не обязательно выполняются для решений задачи (20). Обозначим и * множество решений задачи (20).
В итоге решение задачи о неподвижной точке (20) позволяет сузить множество U доступных управлений до множества U * «приближенно-оптимальных» управлений, для которых выполняются необходимые условия оптимальности, но которые могут быть недопустимыми управлениями.
Дальнейший анализ полученных решений задачи о неподвижной точке (20) сводится к выбору среди них допустимых управлений, т. е. решению системы уравнений:
ф. (и) = 0, i = й , и eU *. (21)
Предлагаемый подход позволяет сделать важные выводы о существовании и структуре множества оптимальных управлений уже на первом этапе поиска приближенно-оптимальных управлений. Полученные приближенно-оптимальные управления могут быть использованы в качестве обоснованных начальных приближений для итерационных процессов решения задач о неподвижной точке с множителями Лагранжа, которые были рассмотрены в предыдущем разделе.
В целом разработанный подход можно рассматривать как последовательную декомпозицию задачи поиска управлений, удовлетворяющих необходимому условию оптимальности (19), на задачу поиска неподвижной точки на множестве доступных управлений (20) и задачу решения системы уравнений на полученном множестве неподвижных точек предыдущего этапа (21).
Примеры
Проиллюстрируем предлагаемые методы неподвижных точек на простом примере:
x(t) = u, x(0) = 0, и eU = [-1,1], t е T = [0,1],
Ф1 (и) = x(1) - a = 0,
1
ф0(и) = J (x 2(t) - и 2)dt ^ min.
0
В данной задаче тривиально определяется единственное допустимое управление и = a при |a| < 1, которое в силу единственности является оптимальным. При |a| > 1 в задаче нет допустимых управлений, т. е. задача не имеет решения.
Проведем анализ этой простой задачи предлагаемыми в работе методами.
Метод с множителями Лагранжа.
Имеем H = ц/и - A0l(x2 - и2) и сопряженную систему: ц/(t) = 2^0x(t), у/(1) = . Условие оптимальности (4) принимает вид:
u = argmax^j(^(t,u) + 2A0u)dt,wj .
В данном примере легко выписываются общие решения фазовой и сопряженной систем: x(t, u) = ut, y/(t, u) = A0ut2 - X0u — t еГ, u eU, с помощью которых можно провести следующий анализ регулярности и вырожденности рассматриваемой задачи.
Предположим, что Л0 = 0 (вырожденная задача). В этом случае \Ф 0, y/(t, u) = -\, и из условия оптимальности следует управление
[-1, Л> 0,
u =<
[1, Л< 0.
Отсюда получаем для t е T
x(t) ={-t,
[t, 0.
Следовательно, если a Ф±1, то получаем противоречие условию допус-тимости управления, т. е. x(1) Ф a.
Таким образом, в случае |a| Ф1 задача является регулярной. В случае |a| = 1 существуют допустимые управления и множители Ла-гранжа 0 с Л^ = 0, удовлетворяющие необходимому условию. В данном случае задача является вырожденной.
Далее проведем анализ существования неподвижных точек задачи вида (7) для регулярного случая |a| Ф1.
Положим Aq = 1. Отсюда следует общее решение сопряженной системы y/(t, u) = ut2 - u - t eT и задача о неподвижной точке с заданным т1 Ф 0:
/4 3 \ ■ (4 а
u = argmax( — u - w) = sign I — u - Al ?1= X[+z1(u - a).
Решениями первого уравнения являются граничные неподвижные точ-
4 4
ки: u = 1 при Х[ < — ; u = —1 при \ >-—; а также внутренние неподвиж-
3 I I 4
ные точки u = — AieU при Щ ^ —, удовлетворяющие условию:
4
—u - \ = 0 (так называемые «особые» точки [4]).
Из этих неподвижных точек условию допустимости управления (вто-
3 4
рое уравнение) удовлетворяют лишь особые точки и = — \ при a .
4
При этом условие доступности управления |\ | < — выполняется для |a| < 1
и не выполняется при |a| > 1.
В итоге проведенного анализа получаем, что задача о неподвижной точке в регулярном случае при |a| < 1 имеет единственное решение и = a,
4
которому соответствует множитель Лагранжа \ =— a . В силу указанной
единственности, а также существования оптимального решения исходной задачи, управление и = a является оптимальным. При |a| > 1 допустимых
управлений нет, и задача оптимизации не имеет решения.
Таким образом, метод неподвижных точек с множителями Лагранжа в рассматриваемой регулярной задаче позволяет определить ее решение. Метод без множителей Лагранжа.
Проведем анализ существования неподвижных точек задачи вида (20). Задачу оптимизации приведем к требуемому эквивалентному виду с ограничениями типа неравенства:
x(t) = и, x(0) = 0, и eU = [-1,1], t е T = [0,1],
Ф1(и) = x(1) - a < 0,
Ф2(и) = -x(1) + a < 0,
1
ф0(и) = J (x 2(t) - и 2)dt ^ min.
0
В полученной задаче:
1) функции Понтрягина H1 = уи соответствует сопряженная система: ц/(t) = 0, i//(1) = -1, которая имеет общее решение y/\t,и) = -1, t eT,
и eU;
2) функции Понтрягина H2 = ц/и соответствует сопряженная система: ц/ (t) = 0, i//(1) = 1, которая имеет общее решение y/2(t, и) = 1, t eT, и eU;
3) функции Понтрягина H0 =уи - (x2 - и2) соответствует сопряженная система: ц/ (t) = 2 x, ^(1) = 0, которая имеет общее решение ^0(t, и) = и2 - и , t eT, и eU .
С учетом полученных выражений задача о неподвижной точке (20) в рассматриваемом примере принимает вид:
Г 4
и = argm^xmin<j -(w - и),(w - и),—и(w - и)
Рассматривая несложную графическую интерпретацию этой задачи для различных случаев доступных значений |и| ^ 1, можно легко получить
следующий вывод: любое доступное управление |и| < 1 удовлетворяет
этой задаче о неподвижной точке.
Дальнейший анализ условия допустимости х(1) = а для доступных
управлений |и| ^ 1 с помощью общего решения фазовой системы х(^,и) = и, t <еТ , и еи приводит к единственному допустимому управлению и = а при а < 1. В силу единственности этого допустимого управ -ления и существования оптимального решения исходной задачи данное управление является оптимальным. При |а| > 1 допустимых управлений
не существует, поэтому задача оптимизации не имеет решения.
Таким образом, в данном простом примере метод неподвижной точки без множителей Лагранжа позволяет получить полное решение оптимизационной задачи.
Рассмотренные примеры практического применения методов наглядно демонстрируют их основные конструкции и в определенной степени иллюстрируют работоспособность предлагаемых методов.
Заключение
Предложены новые конструктивные подходы к поиску экстремальных управлений в рассматриваемом классе задач параметрической оптимизации с ограничениями типа равенства с помощью решения специальных задач о неподвижной точке определяемых операторов управления. Разработанные подходы выгодно отличаются от известных градиентных методов отсутствием трудоемкой операции варьирования допустимого управ -ления на текущей итерации для обеспечения последовательного улучшения и допустимости итерационных приближений управления. Рассматриваемые итерационные процессы последовательных приближений для решения рассматриваемых задач о неподвижной точке сводят решение оптимизационной задачи к последовательному решению чередующихся фазовых и сопряженных задач Коши без операции варьирования управления на каждой итерации. При этом построены модификации процессов без использования множителей Лагранжа и обоснован выбор доступных начальных приближений для процессов. Указанные особенности являются важными факторами повышения вычислительной эффективности решения рассматриваемого класса нелинейных задач параметрической оптимизации с ограничениями типа равенства.
Литература
1. Васильев О. В. Лекции по методам оптимизации. - Иркутск: Изд-во Иркут. гос. ун-та, 1994. - 344 с.
2. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. - М.: Наука, 1976. -392 с.
3. Методы решения задач математического программирования и оптимального управления. - Новосибирск: Наука, 1984. - 232 с.
4. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. - Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. -260 с.
5. Булдаев А. С., Хишектуева И.-Х. Д. Методы неподвижных точек в задачах параметрической оптимизации систем // Автоматика и телемеханика. - 2013. - №12. - С. 5-14.
6. Самарский А. А., Гулин А. В. Численные методы. - М.: Наука, 1989. - 432 с.
7. Срочко В. А. Итерационные методы решения задач оптимального управления. - М.: Физматлит, 2000. - 160 с.
Булдаев Александр Сергеевич, доктор физико-математических наук, профессор кафедры прикладной математики Бурятского государственного университета, директор Научно-образовательного инновационного центра системных исследований и автоматизации Бурятского государственного университета, e-mail: [email protected], тел. +7(3012)217-733.
Buldaev Alexander Sergeevich, Doctor of Physical and Mathematical Sciences, Professor, applied mathematics department, Buryat State University, Director of the Scientific and Educational Innovation Centre for System Studies and Automation, Buryat State University.