Онлайн-доступ к журналу: http://isu.ru/izvest.ia.
Серия «Математика»
2017. Т. 19. С. 89-104
УДК 517.977 MSG 49М20
DOI https://doi.org/10.26516/1997-7670.2017.19.89 Метод неподвижных точек в задачах оптимизации нелинейных систем по управляющим функциям и параметрам*
А. С. Булдаев, И.-Х. Д. Хишектуева
Бурятский государственный университет
Аннотация. Предлагается новый подход в классе нелинейных задач оптимального управления, содержащих одновременно управляющие функции и параметры, основывающийся на. решении специальных задач о неподвижной точке конструируемых операторов в пространстве управлений. Формируемые задачи о неподвижной точке дают возможность строить улучшающие управления и получать новые условия оптимальности управления в рассматриваемом классе оптимизационных задач. Задача, улучшения управления в виде задачи о неподвижной точке формируется на. основе специальной формулы приращения функционала, управления без остаточных членов разложений. Указанная формула, строится с помощью дифференциально-алгебраической модификации стандартной сопряженной системы. Метод последовательного решения задач улучшения в форме задач о неподвижной точке характеризуется нелокальностью улучшения управления, отсутствием процедуры поиска, улучшающего управления в достаточно малой окрестности улучшаемого управления и возможностью улучшения неоптимальных управлений, удовлетворяющих принципу максимума.. Для поиска, управлений, удовлетворяющих принципу максимума., вместо краевой задачи в пространстве состояний предлагается рассматривать задачу о неподвижной точке в пространстве управлений. Приводятся примеры, иллюстрирующие основные свойства, метода..
Ключевые слова: управляемая система., задача, о неподвижной точке, условия оптимальности.
* Работа, выполнена, при финансовой поддержке РФФИ, проект 15-01-03680-а.; МОИ РФ, проект 3808
1. Введение
Многие задачи теории управления в актуальных приложениях могут быть представлены как задачи оптимального управления, в которых кроме управляющих функций требуется дополнительно определить и управляющие параметры. Например, к таким задачам сводятся заменой переменной времени задачи с нефиксированным временем управления. Распространенным подходом к решению рассматриваемых задач является поиск управлений, удовлетворяющих необходимым [5; 6; 9] или достаточным [1; 7; 8] условиям оптимальности. При этом классический подход заключается в построении краевой задачи принципа максимума, трудности решения которой общеизвестны [6; 9]. Другой подход состоит в последовательном решении задач локального улучшения, в результате которого строится релаксационная последовательность управлений, сходящаяся при определенных условиях к экстремальному управлению. К этому типу относятся, например, известные градиентные методы [5; 6]. В работах [1; 7; 8; 11] предложены перспективные нелокальные методы улучшения управления, основанные на нестандартных аппроксимациях функционалов задач. Более высокое качество аппроксимаций функционала по сравнению со стандартными обусловливает повышенную эффективность нелокальных методов.
В работе [11] в классах линейных и квадратичных по состоянию задач оптимального управления построены формулы приращения функционалов задач, не содержащие остаточных членов разложений. Трудоемкость одного улучшения управления определяется решением специальной задачи Коши для фазовых или сопряженных переменных. Построенные нелокальные методы характеризуются тем, что улучшение управления гарантируется не только в достаточно малой окрестности улучшаемого управления, в отличие от локальных методов типа градиентных. Методы не содержат процедуру поиска улучшающего управления в достаточно малой окрестности улучшаемого управления и имеют возможность улучшать неоптимальные управления, удовлетворяющие принципу максимума. На основе методов получены новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемых классах задач.
В работах [2]—[4] нелокальный подход [11], основанный на конструировании формул приращения функционалов без остаточных членов разложений, разработан и обобщен на классы полиномиальных по состоянию и общих нелинейных задач оптимального управления. При этом построение формул приращения функционалов задач без остаточных членов разложений достигается с помощью дифференциально-алгебраических модификаций стандартной сопряженной системы. Трудоемкость одного улучшения управления определяется уже решением специальной краевой задачи в пространстве состояний или опера-
торного уравнения в пространстве управлений, интерпретируемого как задача о неподвижной точке специального оператора управления.
В данной работе указанный нелокальный подход развивается в классе задач оптимизации нелинейных систем по управляющим функциям и параметрам. Метод иллюстрируется в рамках следующего класса задач оптимального управления:
в котором х(Ь) = (х\{Ь),... ,хп(1)) — вектор состояния, и(Ь) = (и\{Ь),... ,ит{Ь)) — вектор управляющих функций, со = (со\,..., ш{) и а = (а\,..., ап) — векторы управляющих параметров. Множества 17 С Кт, Ш С К1, А С Кп компактны и выпуклы. Интервал Т фиксирован. В качестве допустимых управляющих функций рассматривается множество V кусочно-непрерывных на Т функций со значениями в множестве II. и = (и, со, а) — допустимое управление со значениями в множестве О = V х \¥ х А. Функция <р{рс, со) непрерывно-дифференцируема на Кп х \У, функции Р(х,и,со,1), /(ж,-и, ш, ¿) и их частные производные по х, и, со непрерывны по совокупности аргументов на множестве Кп х!1 х\¥хТ. Функция /(х,и,со,Ь) удовлетворяет условию Липшица по ж в В!1 х II х Ш х Т с константой Ь > 0: У(х,и,и},г) - ¡{у,и,ш,Щ < Ь\\х-у\\.
Условия гарантируют существование и единственность решения х(Ь,а), £ € Т системы (1.2) для любого допустимого управления а € П.
Рассмотрим функцию Понтрягина и стандартную сопряженную систему:
ф(1) = -Нх(гР(1),х(1),и(1),со,1), I € Т, ф(Ь) = ~4>х{х(и),ш). (1.3)
Для допустимого управления а € П обозначим 0(£, а), £ € Т, — решение стандартной сопряженной системы (1.3) при ж(£) = ж(£, а) и аргументах и, со, соответствующих компонентам управления а.
Задача улучшения управления рассматривается в следующей общей постановке: для заданного управления а1 € П требуется найти управление а11 еОс условием Ф (а11) - Ф(сг/) < 0.
(1.1) (1.2)
= /(ж(^)>со, ¿), ж (¿о) = а, и(г) € II, Ш61У, а £ А, £ € Т = [¿0, ¿1]
#00) ж, и, со, ¿) = (0, /(ж, и, со, ¿)) — ^(ж, и, со, ¿), ф £ К'
I п
А. С. БУЛДАЕВ, И.-Х. Д. ХИШЕКТУЕВА 2. Формула приращения функционала
Далее для удобства частное приращение произвольной вектор-функции д(у\, ■ ■ ■ ,yi) по переменным ysi, yS2, будем обозначать
Ауа1+&Уз1,Уз2+ЬУз29(У1> ■■■iVi) =
= g(yi,---,ysi + Aysi,...,ys2 +АyS2,...,yi) -g{yi,...,yi).
Приращение функционала (1.1) на допустимых управлениях а, а1, в соответствии с введенным обозначением выписывается в виде:
A^(<tj) = Ах[^шф{Ь, а1), шт)+ (2.1)
+ / ^xU^Mt),^^^1)^1 (t)^1 ,t)dt.
Jt
Дополнительно обозначим Ax(t) = x(t,a) — x(t,ar), Au(t) = u(t) — ■u7(t), Aw = oj — w1, A a = a — a1.
Приращение терминальной части функционала в выражении (2.1) можно записать в виде:
Ах(.ь,<т),ш<р(х(*1, v1), и1) = Дш<£>(ж(£ь а), (У) + Ax{tua)p(x(ti, а1), ш1).
Введем непрерывную кусочно-дифференцируемую вектор-функцию p(t) = (pi(t), ■ ■ ■ ,pn(t)), t € T с условиями:
p(t1) = -<px(x(t1,<TI),u)I)-q, (2.2)
где величина q удовлетворяет алгебраическому уравнению
(/), (У) + q, Ax(ti)^ = Ax{tua)(p(x(ti, a1), w1). (2.3)
При этом по определению полагаем q = 0 в случае линейности функции <р по ж, а также в случае x(t\, а) = x(t\, а1).
Тогда приращение терминальной части функционала в выражении (2.1) можно записать в виде:
Ax(t1,a),uJv(%(h,crI),uI) = A^(s(ibff),wJ) - (p(ti),Ax(ti)) = = Дшр(ж(*1,<7),а/) - (рЫ, Аа) - f ^{p(t),Ax(t))dt = = Awy(j:(ii,ff),wJ) - (p(t0),Aa)~
На основе полученного соотношения с помощью функции Понтряги-на приращение функционала (2.1) можно представить в виде:
A^(<7J) = Ашф(Ь, а), со1) - (p(ío), Аа)-
- J {{p(t),Ax(t)) - Ax(t¡<T)Mt)¡uH(p(t),x(t, a1), uT(t), и1, t) }dt =
= Ашф(Ь ,a),iüI) - (p(í0), A a}- (2.4)
- J {(p(t), Ax(t)) + AuH(p(t), x(t, a), u(t), ш1, t) +
+Au(t)H{p(t),x{t, <7), uJ(í), а/, t) + Ax{t,„)H(p(j;),x(t, a1), uJ(í), u1, t) }dí.
Введем дифференциально-алгебраическую систему для функции p(t) с условиями (2.2), (2.3) в форме:
p(t) = -Hx(p(t),x(ty)y(tW,t)-r(t), (2.5)
где кусочно-непрерывная величина r(t) = (r\(t),..., rn(t)), t € T, определяется в каждый момент времени t € Т из алгебраического уравнения
^œ(p(i),a;(i,</),uJ,a;J,i) + r(i),Aa;(i)) = (2.6)
= Ax{tta)H(p(t),x(t, а1), и1®, ш1, t).
При этом по определению полагаем r(t) = 0 в случае линейности функций F, / по х, а также в случае равенства x(t, а) = x(t, а1).
Тогда в силу дифференциально-алгебраической системы (2.5), (2.6) для p(t) с начальными условиями (2.2), (2.3) формула приращения (2.4) принимает вид:
АаФ(ат) = -А^-ф^иа),^1) + í #(p(í),z(í,<7),u(í),a/,í)dí}-
Jt
-(p(t0),Aa)- f AU^H{p{t), x{t, о), и1 {t), и1 ,t)dt. (2.7) Jt
Для удобства записи явной зависимости p(t) от управления введем новую конструкцию: модифицированную дифференциально-алгебраическую сопряженную систему в форме
p(t) = -Hx(p(t),x(t),u(t),uj,t)-r(t), (2.8)
(Hx(p(t),x(t),u(t),uj,t)+r(t),y(t)-x(t)) =
= A y{t)H(p(t),x(t),u(t),uj,t) (2.9)
с краевыми условиями
р(Ь) = -<рх(х(и),ш)-д, (2.10)
{<Px(x(ti),w)+q,y(ti) -x(ti)) = Ay{tl)if(x(ti),uj), (241)
в которой по определению полагаем q = О, r(t) = 0 в случае линейности функций (р, F, / по х (линейная по состоянию задача (1.1), (1-2)), а также в случае y(t) = x(t) при соответствующих t € Т.
В линейной по состоянию задаче (1.1), (1-2) модифицированная сопряженная система (2.8)-(2.11) по определению совпадает со стандартной сопряженной системой (1.3).
Для допустимых управлений а € П, а1 € П обозначим p(t, <т7,<т), t € Т — решение модифицированной сопряженной системы (2.8)-(2.11) при x(t) = x(t,ar), y(t) = x(t,a), u(t) = i/(i), w = w1. Из определения следует очевидное равенство p(t, а, а) = ip(t, a), t € Т.
Формула приращения (2.7) в новых обозначениях, в которых указывается явная зависимость фазовых и сопряженных переменных от управления, принимает вид
А аФ(ат) = -Аш{-ф(Ь,а),ш1) + + / H(p(t, a1, a), x(t, a), u(t), со1, t)dt} — (p(to, сг1, а), Да} —
jt
- [ A^Hip^a1 ,a),x(t,a),uI(t)^1 ,t)dt. (2.12)
jt
Отметим, что, применяя аналогичную технику преобразования приращений с использованием стандартной сопряженной системы (1.3), можно получить формулу приращения функционала в стандартной форме, содержащей остаточные члены разложений
АаФ(ат) = -Аш{-ф(Ь,а1),ш1) +
+ / #(^(i,<7J),z(i,<7J),uJ(i),ii/,i)di} - {i){t0,al), Аа)-
Jt
- [ Au(t)H(ip(t, aJ),x(t, a1), и1 (t), to1, t)dt+
jt
+o(J ||Д«(*)И) + o(||Aw||). (2.13)
3. Задача о неподвижной точке на основе операций на
максимум
При заданном а1 € О, определим оператор С : а —>■ а = (й, ¿о, а) на множестве допустимых управлений О следующими выражениями:
и —> й, й(Ь) = &rgm&xH(p(t, а1, а), а), й, и1, ¿), £ € Т,
й&и
МЕТОД НЕПОДВИЖНЫХ ТОЧЕК В ЗАДАЧАХ ОПТИМИЗАЦИИ ... 95 со^-со, со = а^тах{—а), а))+
+ / Н(р(Ь, а1, а), х(Ь, а), и(Ь), со, ¿)(И}, ]т
а —>• а, а = argmax(p(ío, а1, а), а). аеА
Задача о неподвижной точке а = С (а) для рассматриваемого оператора О определяется следующей системой уравнений:
и(Ь) = а^тахЯ(р(£, а1, а), х(Ь, а), й, со1, ¿), í € Т, (3.1)
й&и
со = argmax{—ip(x(t\, a), ù) + / H{p{t,aI,a),x(t,a),u(t),ù,t)dt}, (3.2) ûo&V JT
a = aigmax(p(to, (t1 , a), à). (3.3)
âeA
Предположим, что задача (3.1)-(3.3) имеет решение а11 = (и11, со11, а11) (возможно, не единственное) и управление и11 является кусочно-непрерывным. Тогда, в силу определения отображения G, получаем
^u^Hipit,^,aII),x{t,aII),uI{t),uI,t)>0, teT, Ашп{-ф(и,aII),coI) + I H(p(t,aI,aII),x(t,aII),uII(t),coI,t)dt} > О,
JT
¡(Pito,^,ап),ап - a1) > 0.
Отсюда и из формулы (2.12) следует АанФ{а1) < 0. Введем отображение
v*(p,x,t) = argmaxiï(p, х, й, со1, t), р € Rn, х € Rn, t G Т.
й&и
Обозначим x\t) = x(t, a1), t € T.
Краевая задача улучшения в пространстве фазовых и сопряженных переменных, эквивалентная задаче о неподвижной точке (3.1)-(3.3), имеет вид
x{t) = f(x(t),u*(p(t),x(t),t),co*,t), x(to) = а*, (3.4)
p(t) = —Hx{p{t),xI{t),uI{t),LOI, t) — r(t), (3.5)
(Hx(p(t), x\t), uT(t), со1, t) + r(t),x(t) - x\t)) = = Ax{t)H(p(t),xI(t),uI(t),coI,t),
(3.6)
p(t 1) = -Lp^iti),^1) - q, (3.7)
(ifixtfiti), to1) + q, x(h) - xJ(ii)) = А^ф1^)^1), (3.8) в которой
ш* = argmax{—ip(x(t{), w)+
ub&V
+ / H{p{t),x{t),v*{p{t),x{t),t),w,t)dt}, (3.9) Jt
a* = argmax(p(io), a)- (3.10)
Предположим, что решение (x(t),p(t)), t £ T, интегро-дифферен-циально-алгебраической краевой задачи (3.4)-(3.10) существует (возможно, не единственное), а управляющая функция, формируемая по правилу
un(t) = u*(p(t),x(t),t), t £ Т, является кусочно-непрерывной. Сформируем
со11 = argmax{—ip(x(t\), oj) + / H(p(t), x(t), un(t), oj, t)dt}, cb&v Jt
a11 = argmax(p(to), a),
aea
тогда x(t) = x(t,an), p(t) = p(t,aJ ,ап) и, в силу определения а11, получаем
A.n^Hip^a1 ,aII),x(t,aII),uI(t),ujI,t) > 0, Awjj{-^(a;(ii,<7JJ),wJ) + hHipit^1 ,(TII),x{t,(TII),uII{t),wI,t)dt] > 0,
^{to,^ ,an),an - a1) > 0. Отсюда и из формулы (2.12) следует, что Aaii
Ф(а1) < 0.
Эквивалентность краевой задачи (3.4)—(3.10) и задачи о неподвижной точке (3.1)—(3.3) понимается в следующем смысле. Пусть пара (x(t), p(t)), t £ Т является решением краевой задачи (3.4)-(3.10). Тогда управление а11 формируемое по указанному выше правилу, является решением задачи о неподвижной точке (3.1)-(3.3). Наоборот, пусть допустимое управление а11 является решением задачи (3.1)-(3.3). Тогда пара (x(t, an),p(t, a1, (J11)), t £ Т является решением задачи (3.4)-(3.10).
Таким образом, для улучшения управления а1 £ Q достаточно решить задачу о неподвижной точке (3.1)-(3.3) или эквивалентную ей краевую задачу (3.4)-(3.10).
МЕТОД НЕПОДВИЖНЫХ ТОЧЕК В ЗАДАЧАХ ОПТИМИЗАЦИИ 4. Условия оптимальности управления
Установим связь необходимых условий оптимальности управления с задачей о неподвижной точке.
Необходимые условия оптимальности управления а1 € П в задаче (1.1),(1.2) в форме принципа максимума можно получить на основе формулы приращения (2.13) в следующем виде:
и1 (Ь) = а^тахЯ(0(£, сг1),^^, сг7), -й, ш1, ¿), £ € Т, (4.1)
й&и
и1 = а^тах/— срш(х(1\,а1),и)1)+
ш&¥ \
+ ! Нш{ф{г,а1),а1),и1 {г),ш1 (4.2)
а1 = aтgmax(ф(to, с7), а). (4.3)
аеА
Обозначим а7) С О — множество допустимых неподвижных точек задачи (3.1)-(3.3). Пусть а1 € а7), т. е. выполняются равенства:
и1 (Ь) = а^тахЯ^^а7),®^,^7),«,^7^), (4.4)
й&и
со1 = а.щт&к{—1£>{х{1\, о1)+ + / Я(0(£, <г7), <г7), ■;/(£), ш, ¿)(Й}, (4.5)
а7 = а^тах(0(£о, с7), а) • (4.6)
аеА
В линейной по а; задаче (1.1), (1.2) условия (4.4)-(4.6) совпадают с необходимыми условиями оптимальности (4.1)-(4.3) для управления а1 е
О. Следовательно, справедливо следующее утверждение.
Лемма 1. В линейной по переменной ш задаче (1.1), (1.2) управление а1 € О, удовлетворяет условиям принципа максимума (4-1)-(4-3) тогда и только тогда, когда
а1 € П(аТ).
Следствие 1. (принцип максимума в терминах задачи о неподвижной точке) Пусть управление а1 € П является оптимальным в линейной по ш задаче (1.1), (1-2). Тогда а1 € 0(<т7).
Другие следствия (в линейной по ш задаче (1.1), (1-2)).
1) Задача о неподвижной точке (3.1)-(3.3), и, следовательно, краевая задача (3.4)-(3.10), всегда разрешимы для управления, удовлетворяющего принципу максимума.
2) В случае неединственности решения задачи о неподвижной точке (3.1)-(3.3) появляется принципиальная возможность строгого улучшения управления, удовлетворяющего принципу максимума. Такая возможность иллюстрируется в работах [7]-[10] для частных случаев задачи (1.1), (1-2).
3) Отсутствие неподвижных точек в процедуре улучшения управления свидетельствует о неоптимальности управления.
Отметим, что условия принципа максимума (4.1)-(4.3) для управления а € П можно рассматривать как отдельную задачу о неподвижной точке а = С{а) в пространстве управлений для определяемого правыми частями этих условий соответствующего оператора С : а —> а = (й, й), а):
и —> й, й(£) = ащтахН{ф{1, а), ж(£, а), й, ш, ¿), £ € Т,
й&и
Ш —»■ й),
й = ащтах(—1£>ш{х{1\,о),и) + / ст), ж(£, ст), ш, ¿> ),
ш&¥ \ }т '
а —>• а, а = argmax('0(ío, сг),а). аеА
5. Примеры
Пример 1 (улучшение в задаче идентификации). Пусть на заданном отрезке времени Т = [¿0,^1] известны выходные характеристики ж(£) = (х\(¿),... ,хп(\"->)) динамического объекта, описываемого системой дифференциальных уравнений
ж(£) = /(ж(£), ш, ¿), ж(£о) = а, а = (ш, а), ш € \¥, а £ А.
Рассматривается задача поиска управляющих параметров а = (ш, а) € П = \¥ х А:
^ 1 _
Ло ^ СТ€П
Предполагаются выполненными условия непрерывности функции /(ж, ш, ¿) вместе с ее производными по переменным х,ш. Ш С Ят, А С Кп — компактные и выпуклые множества.
Функция Понтрягина и дифференциально-алгебраическая сопряженная система имеют вид:
п
H(p,x,u),t) = (P,f(x,u),t)) -^2Xi(xi(t) -Xi(t))2,
г=1
p(t) = -Hx(p(t),x(t),uj,t)-r(t), p(h) = 0, (Hx(p(t),x(t),uj, t) + r(t),y(t) - x(t)) = Ay{t)H(p(t),x(t),uj, t).
Задача о неподвижной точке для улучшения управления а1 G Q принимает вид:
и = argmax / H^^jO1 ,o),x{t,o),ù,t)dt, tGT,
ûb&V JT
a = argmax(p(to, cr1, a), à).
âeA
Продемонстрируем работу метода улучшения на примере:
x(t) = со, х(0) =а, teT = [0,1], ш & W = [-1,1], а € А = [0,2].
Зафиксируем решение x(t) = t, t G Т при ш = 1, а = 0, и рассмотрим задачу идентификации этого решения:
Ф(<7) =[ (х- tfdt ->■ inf .
Jo а=(ш,а)
Функция Понтрягина и дифференциально-алгебраическая сопряженная система принимают вид:
Н(р, х, и, t) = pu — (х — t)2,
■p{t) = 2 x{t) -21- r(t), p{ 1) = 0,
(y(t) - x(t) + r(t))(y(t) - x(t)) = 0.
Если x(t) = y(t), то по определению r(t) = 0. Если y(t) ф x(t), то r(t) = x(t) — y (t). В итоге получаем общую формулу r(t) = x(t) — y(t), t G T. Таким образом, сопряженная система принимает вид:
p(t)=x(t)+y(t)-2t, р( 1) = 0.
Задача о неподвижной точке для улучшения управления а1 = {ш1, а1) имеет вид:
г1 (1, ¿>0,
ш = sign / p(t, a1, a)dt, sign(z) = < -1, z < 0,
Jo { ¿G [-1,1], z = 0,
0, p(í0,<7J,<7) <0,
а = { 2, р^о,^1 ,а) > О,
а€ [0,2], p(t0,aI,a) = 0.
1. Рассмотрим управление а1 = (—1,2), которому соответствуют x(t, а1) = 2 - t, t € Т, Ф(<77) =
Сопряженная система при x(t) = x(t, а1) =2 — t, y(t) = ж(£, a) = u)t + а принимает вид: p(t) = (из — 3)t + (а + 2), р{ 1) = 0. Отсюда получаем p(t, а1, а) = ^(t2 - 1) + (а + 2)(í - 1), te Т.
Задача о неподвижной точке принимает вид:
из = sign
из — 3 а + 2
а = argmax йе[о,2]
из — 3
- (а + 2)
а.
Методом подстановки возможных значений управления легко определяется единственное решение а = (0, 0) с траекторией ж(£, а) = 0. На
полученном
управлении
достигается
строгое
улучшение
Ф(<т) = | < Ф(а1).
2. Рассмотрим управление а1 = (—1,1), которому соответствуют ж(£, а1) = 1 - г € Т, Ф(<77) =
Сопряженная система при ж(£) = ж(£, и7) = 1 — у(£) = ж(£, а) = иЛ + а принимает вид: = (из — 3)£ + (а + 1), р(1) = 0.
Отсюда имеем а1, а) = — 1) + (а + 1)(£ — 1), 4бТи задачу
о неподвижной точке
а; — 3 а + 1
w = sign
а = argmax й€[0,2]
из — 3
- (а + 1)
а.
Эта задача имеет единственное решение а = (1,0), х(Ь, <т) = Ф(<т) = 0 < Ф(<т7), которое является оптимальным в рассматриваемой задаче идентификации.
Пример 2 (улучшение экстремального управления).
1 Í1
Ф(<т) = - / U3x2(t)dt ->■ inf , 2 J0
¿(í) = из, ж(0) = 0, welf = [-1,1], t € Т = [0,1]. Функция Понтрягина и дифференциально-алгебраическая сопряже-
нная система имеют вид:
1
Н(р, х, из, t) = риз — p(t) = U3x(t) - r(t), p( 1) = 0, (y(t) - x(t))(r(t) + \u3y{t) - \u3x{t)) = 0.
Если y(t) = x(t), то по определению получаем r(t) = 0. Если y(t) ф x(t), то r(t) = \co(x(t) — у(t)). Отсюда имеем общую формулу r(t) = 7jUj(x(t) — y(t)). Следовательно, модифицированная сопряженная система принимает вид
p(t) = ^co(x(t)+y(t)), р( 1) = 0.
Поставим задачу улучшения управления а1 = со1 = 0 с соответствующей фазовой траекторией x(t, а1) = 0, t € Т и значением целевой функции Ф(<77) = 0.
Задача о неподвижной точке имеет вид:
и = sign J (p(t, а1, а) — ^x2(t, a)^dt.
Стандартная сопряженная система имеет вид ip(t) = ooxit), 0(1) = 0.
Отсюда получаем 0(£,<77) = 0, iiw(0(t, a1), x(t, а1), со1, t) = 0, t € Т. Таким образом, а1 является особым управлением, т. е. удовлетворяет принципу максимума с вырождением.
При x(t) = x(t, а1) = 0, y(t) = x(t, a) = cot, со = со1 из модифицированной сопряженной системы получаем p(t, сг7, <т) = 0. Следовательно, задача о неподвижной точке для улучшения особого управления а1 = со1 = 0 принимает вид
со = sign^J (—^co2t2)dtSj=sign(^—^co2^j.
Эта задача допускает решение а = со = — 1 с соответствующим значением целевой функции Ф(с) = —^ < Ф(<т/). Отметим, что экстремальное управление а1 = со1 = 0 также является решением задачи о неподвижной точке в полном соответствии с вышеприведенной леммой.
Таким образом, пример демонстрирует характерные свойства предлагаемого метода неподвижных точек: экстремальное управление удовлетворяет задаче о неподвижной точке; возможность неединственного решения задачи о неподвижной точке; возможность строгого улучшения экстремального управления.
6. Заключение
Предложен новый подход последовательного решения задач улучшения управления на основе поиска неподвижных точек определяемого оператора управления в рассматриваемом классе оптимизационных задач. Выделим следующие основные свойства предлагаемого подхода.
1) Нелокальность улучшения управления и отсутствие процедуры варьирования улучшающего управления в достаточно малой окрестности улучшаемого управления, характерной для стандартных градиентных методов.
2) Возможность строгого улучшения неоптимальных экстремальных управлений (удовлетворяющих принципу максимума). Такая возможность появляется в случае неединственности решения задачи о неподвижной точке. Градиентные методы такой возможностью не обладают.
3) Получение условий улучшения и необходимых условий оптимальности управления в новой конструктивной форме задач о неподвижной точке определяемых операторов управления в рассматриваемом классе задач. Такая форма позволяет эффективно применить известный аппарат теории и методов неподвижных точек для поиска экстремальных управлений.
В целом, оптимизация управлений на основе расчета конструируемых задач о неподвижной точке предлагаемыми методами последовательных приближений сводится к последовательному решению задач Коши для фазовых и сопряженных переменных.
Указанные свойства являются важными факторами повышения вычислительной и качественной эффективности решения задач оптимального управления и определяют перспективное направление развития методов оптимизации нелинейных динамических систем.
Список литературы
1. Батурин В. А. Приближенные методы оптимального управления, основанные на принципе расширения / В. А. Батурин, Д. Е. Урбанович. - Новосибирск : Наука, 1997. - 175 с.
2. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем / А. С. Булдаев. - Улан-Удэ : Изд-во Бурят, гос. ун-та, 2008. -260 с.
3. Булдаев А. С. Методы неподвижных точек в задачах параметрической оптимизации систем / А. С. Булдаев, И.-Х. Д. Хишектуева // Автоматика и телемеханика. - 2013. — № 12. - С. 5-14.
4. Булдаев А. С. Улучшение управлений в нелинейных системах на основе краевых задач / А. С. Булдаев, О. В. Моржин // Изв. Иркут. гос. ун-та. Сер. Математика. - 2009. - Т. 2, № 1. - С. 94-106.
5. Васильев О. В. Лекции по методам оптимизации / О. В. Васильев. - Иркутск : Изд-во Иркут. ун-та, 1994. - 344 с.
6. Методы решения задач математического программирования и оптимального управления / Л. Т. Ащепков [и др.]. - Новосибирск : Наука, 1984. - 232 с.
7. Методы улучшения в вычислительном эксперименте / В. И. Гурман [и др.]. -Новосибирск : Наука, 1988. - 184 с.
8. Новые методы улучшения управляемых процессов / В. И. Гурман [и др.]. -Новосибирск : Наука, 1987. - 184 с.
9. Математическая теория оптимальных процессов / Л. С. Понтрягин [и др.] -М. : Наука, 1976. - 392 с.
10. Самарский А. А. Численные методы / А. А. Самарский, А. В. Гулин. - М. : Наука, 1989. - 432 с.
11. Срочко В. А. Итерационные методы решения задач оптимального управления / В. А. Срочко. - М. : Физматлит, 2000. - 160 с.
Булдаев Александр Сергеевич, доктор физико-математических наук, профессор, Бурятский государственный университет, 670000, г. Улан-Удэ, ул. Смолина, 24а, (e-mail: [email protected])
Хишектуева Ишин-Хорло Дамбадоржиевна, Бурятский государственный университет, 670000, г. Улан-Удэ, ул. Смолина, 24а, (e-mail: [email protected])
A. S. Buldaev, I.-Kh. D. Khishektueva
The Fixed Point Method for the Problems of Nonlinear Systems Optimization on the Managing Functions and Parameters
Abstract. A new approach to the class of nonlinear optimal control problems containing both managing functions and parameters, is proposed on basis of the solution of special fixed point problems for operators constructed in the space of controls. The fixed point problems make it possible to build improving controls and obtain new conditions for optimal control in the class of optimization problems. The problem of control improvment as a problem of a fixed point is formed on the basis of a control increment formula without the residual terms of expansions. This formula is constructed using the differential-algebraic modification of the standard adjoint system. The method of sequential solving of improvement problems in the form of fixed point problems is characterized by nonlocal improvement of management, lack of search procedure improving control in a sufficiently small neighborhood of current control and the ability to improve suboptimal controls, satisfying the maximum principle. To search for controls, satisfying the maximum principle, instead of the boundary value problem in the space of states are invited to consider the fixed point problem in space of controls. Examples illustrating the basic properties of the method are given.
Keywords: controlled system, fixed point problem, conditions of optimality.
References
1. Baturin V.A., Urbanovich D.E. Priblizhenniye metody upravlenya, osnovannie na printsipe rashireniya. [Approximate methods of optimal management, based on the principle of expansion]. Novosibirsk, Nauka Fubl., 1997. 175 p.(in Russian)
2. Buldaev A.S. Metody vozmusheniy v zadachah uluchsheniya i optimizatsii upravlyaemih system [Furtubation methods in problem of the improvement and optimization of the controlled systems]. Ulan-Ude, Buryat State University Fublishing Department, 2008. 260 p.(in Russian)
3. Buldaev A.S., Khishektueva I.-Kh.D. The Fixed Point Method in Parametric Optimization Problems for Systems. Automation and Remote Control, 2013, vol. 74, no 12, pp. 1927-1934. https://doi.org/10.1134/S0005117913120011
4. Buldaev A.S., Morzhin O.V. Improvement of controls in nonlinear systems on basis of boundary value problems. Izvestiya Irkutskogo Gosudarstvennogo Universiteta. Series «Mathematics», 2009, vol. 2, no 1, pp. 94-106 (in Russian).
5. Vasilev O.V. Lektsii po metodam optimisatsii. [The optimization methods lectures] Irkutsk, ISU Press, 1994. 344 p.(in Russian)
6. Ashepkov L.T. et al. Metody reshenija zadach matematicheskogo programmirovanija i optimal'nogo upravlenija. [Methods for solving mathematical programming and optimal control problems] Novosibirsk, Nauka Publ., 1984. 232 p. (in Russian)
7. Gurman V.I. et al. Metody uluchsheniya v vichislitelnom eksperimente. [Methods to improve the computing experiment] Novosibirsk, Nauka Publ., 1988. 184 p. (in Russian)
8. Gurman V.I. et al. Novie metody uluchsheniya upravlyaemih protsessov. [New methods for improvement of controlled processes] Novosibirsk, Nauka Publ., 1987. 184 p. (in Russian)
9. Pontrjagin L.S. et al. Matematicheskaja teorija optimal'nyh processov. [Mathematical theory of optimal processes] Moscow, Nauka Publ., 1976. 392 p.(in Russian)
10. Samarskiy A.A., Gulin A.V. Chislennie metody. [Numerical methods] Moscow, Nauka Publ., 1989. 432 p.(in Russian)
11. Srochko V.A. Iteratsionniye metody resheniya zadach optimalnogo upravleniya. [Iterative methods for solving optimal control problems] Moscow, Fizmatlit, 2000. 160 p. (in Russian)
Buldaev Aleksandr Sergeevich, Doctor of Sciences (Physics and Mathematics), Professor, Buryat State University, 24a, Smolin st., Ulan-Ude, 670000, (e-mail: buldaev@mail. ru)
Khishektueva Ishin-Khorlo Dambadorzhievna, Buryat State University, 24a, Smolin st., Ulan-Ude, 670000, (e-mail: [email protected])