Онлайн-доступ к журналу: http://isu.ru/izvest.ia.
Серия «Математика»
2017. Т. 19. С. 178-183
УДК 517.977.5 MSG 49L99
DOI https://doi.org/10.26516/1997-7670.2017.19.178 Оценки множеств достижимости и достаточное условие оптимальности в задачах управления дискретными динамическими системами*
С. П. Сорокин
Институт динамики систем и теории управления им. В. М. Матросова СО РАН
Аннотация. Работа, посвящена, развитию канонической теории оптимальности для задач дискретного оптимального управления. Особенность этого подхода, для вывода, условий оптимальности состоит в оперировании множествами сильно монотонных функций - решений соответствующего неравенства, типа. Гамильтона. - Якоби. За. счет этого достигается повышение эффективности условий оптимальности и расширение области их применимости, а. также устойчивость к некоторым особенностям задач (например, неединственность нормированного набора, множителей Ла.гра.нжа. исследуемой экстремали).
В статье рассматривается задача, оптимального управления дискретной нелинейной динамической системой с нелинейной целевой функцией при поточечных фазовых и общем концевом ограничениях на. траектории. Для указанной системы получены внешние оценки множеств достижимости при учете фазовых ограничений. На. базе оценок доказано достаточное условие оптимальности в соответствующих задачах управления, не требующее выпуклости входных данных. Результаты используют новый класс позиционно-па.ра.метрических сильно монотонных функций, которые зависят от начального, конечного или промежуточного состояния управляемой системы. Применение таких функций добавляет большей гибкости достаточному условию оптимальности по сравнению с условиями, использующими традиционные сильно монотонные функции. Полученные условия допускают естественную модификацию для исследования опорного управляемого процесса, на. (сильный) локальный минимум. Ожидается, что результаты будут использованы при дальнейшем усилении дискретного принципа, максимума, до достаточного условия для рассмотренной задачи, которое не потребует выпуклости вектогра.ммы динамической системы.
* Работа, выполнена, при финансовой поддержке РФФИ, грант 16-31-60068, при частичной финансовой поддержке Совета, по грантам Президента. Российской Федерации для государственной поддержки ведущих научных школ Российской Федерации (НШ-8081.2016.9).
Ключевые слова: сильно монотонные функции, оценки множеств достижимости, достаточное условие оптимальности, оптимальное управление, дискретные системы.
1. Постановка задачи
Рассмотрим следующую задачу дискретного оптимального управления (Р) с поточечными и общим концевым ограничениями на траекторию:
х(к + 1) = f(k,x(k),u(k)), u(k)eUk, k = 0,N-l, (1.1) х(к)еХк, k = ÖJJ, (1.2)
q:=(x(0),x(N))eQ, (1.3)
J[a] = l(q) —> min .
Здесь N — заданное натуральное число, множества Uk С Rm, Хк с Кп, Q С Rn х Rn замкнуты, функция / конечна на {0,..., N — 1} х Rn х Rm, I : Rn х Rn —> R непрерывна.
Обозначим через v = {u(k)}kSQ и к = {x(k)}^=0 управление и соответствующую траекторию динамической системы, т. е. конечные последовательности, удовлетворяющие соотношениям (1.1) и интерпретируемые как составные векторы. Пару таких последовательностей а = (я, и) назовем процессом системы. Через обозначим множество всех процессов системы (1.1), удовлетворяющих поточечным фазоограниче-ниям (1.2), а через Т*р С TiX — множество допустимых процессов в задаче (Р) (т.е. удовлетворяющих также концевому ограничению (1.3)).
Здесь и далее верхний индекс х обозначает «при наличии поточечных фазоограничений (1.2)». Если заведенные ниже объекты не снабжены таким индексом, следует считать, что Xk = Rn, к = О,N, — поточечные ограничения отсутствуют (или не учитываются).
2. Множества достижимости и соединимых точек управляемой системы
Введем множество соединимых точек системы (1.1) (при учете поточечных ограничений (1.2)):
Кх = {(x0,xN) € Rn х Rn | За = (x,v) € Xх : ж(0) = х0, x(N) = зд}-
Иными словами, это множество состоит из пар точек (xq,xn) фазового пространства, соединимых траекториями системы, удовлетворяющими поточечным фазоограничениям.
Задача (Р) эквивалентна следующей концевой задаче (ЕР(КХ)):
l(q) —> min q = (xq,xn) € TZX П Q]
эквивалентность понимается в смысле совпадения значений задач, и более того, если процесс а € оптимален в задаче (Р), то соответствующий концевой вектор q = q(a) = (ж(0),x(N)) оптимален в задаче (EP(1ZX)), и наоборот, если для некоторого процесса а € Хр соответствующий концевой вектор q доставляет минимум в (EP(1ZX)), то процесс а оптимален в исходной задаче.
Точное описание множества соединимых точек нелинейной системы, даже при Xk = Rn, k = 0,N, является довольно сложной проблемой, однако, для получения необходимых или достаточных условий оптимальности в задаче (Р) можно ограничиться «достаточно точными» оценками этого множества как снизу, так и сверху. Дополнительные сложности доставляют фазовые ограничения, для дальнейшего учета которых введем множество достижимости системы (1.1) в момент времени к из точки Хо € Хо (при учете поточечных фазоограничений):
Лх(х0) = |хк € Хк | ]ff = (x,ti)eSx: ж(0) = Xq, х(к) = хку
Отметим, что множество Лх(хо) представляет собой сечение 1ZX |жо множества соединимых точек.
3. Сильно монотонные функции
Обозначим через Ts(£), s € {0,..., N — 1}, множество всех отрезков (подпоследовательностей) = {x(k)}^=s траекторий к системы (1.1), удовлетворяющих начальному условию x(s) =
Определение 1. Функцию ip(k,x) : {0,...,N} х Rn —> R назовем сильно возрастающей (относительно системы (1.1)), если
(v (S, О е {о,..., N - 1} X д») (vе Tsio)
(p(k + 1, x{k + 1)) > (p(k, x(k)), k = s,N - 1.
Множество всех функций Lp, удовлетворяющих этому условию, обозначим через Ф_|_.
Лемма 1. Lp € Ф+ тогда и только тогда, когда выполнено неравенство inf <p(k + l,f(k,x,u)) -<p(k,x) > 0 \JxeRn, к = 0,N - 1.
Сильно монотонные функции находят множество приложений в теории управления [1; 4; 3; 5], однако, для дальнейшего изложения мы введем новый класс сильно монотонных функций (для классических задач см. [2]).
Определение 2. Функцию У(к, х,у) : {0,..., Ж} х Ка х Ка —>• К назовем позиционно-параметрической сильно возрастающей (относительно системы (1.1)), если
а) Уу € Кп функция У(-, -,у) € Ф+;
б) У(0,х,х) = 0 Ух € Кп. Множество таких функций обозначим через
Указанные определения относятся исключительно к управляемой системе и не учитывают поточечных фазоограничений. С помощью введенных позиционно-параметрических функций можно получить следующую оценку [1; 2].
Лемма 2. К с 8{У) := {(ж0,зд) € К2п \ У(М,хм,х0) >0}УУеУ+.
Лемма дает внешнюю оценку множества соединимых точек системы (1.1) в отсутствии поточечных фазоограничений. В следующем пункте будут приведены оценки, и основанные на них достаточные условия оптимальности, при учете ограничений (1.2).
4. Оценки множества Их и достаточные условия оптимальности в задаче (Р)
Обозначим через Е := Ех{хо) внешнюю (или точную) оценку множества достижимости Лх(хо). В крайнем случае может использоваться тривиальная оценка (Е = Кп).
Введем множество ]Л|-(Е) С функций У(к,х,у) таких, что
а) выполнено неравенство
М VI к + 1, ¡(к,х,и),хо ) — У(к,х,хо) > О и&и^ V /
Ух € Ех(х0) ПХк, Ухо^Хо, к = О,ЛГ — 1;
б) У(0,хо,хо) = 0 Ухо € Х0.
Лемма 3. Любое подмножество V С У+(Е) дает оценку
Пх С 8{V) := {(х0,хм) еХ0хХм\ У(М,хм,х0) > О, V € V}.
Доказательство. Допустим, что для некоторой функции V € У+(Е) точка д = (хо,хм) € 71х не принадлежит множеству 8{{У}). Это означает, что существует процесс а € Xх с траекторий {х{к) € Хк}: ж(0) = ж0, ж(-/У) = хм и У(Ж,ж(А0,ж(0)) < 0. Очевидно, что х(к) € Е£(х(0)) П Хк, ж(0) € Хо, поскольку траектория я = {х(к)} допустима по фазовым
ограничениям. Значит выполняется условие V(0, ж(0), ж(0)) = 0, и из условия а) вытекает, что
О < inf v(k + l,f(k,x(k),u),x(0)) - V(k,x(k),x(0)) <
uGUfr \ J
< V(k + l,x(k + 1), ж(0)) -V(k,x(k),x(0)) У к = 0,N - 1.
С учетом упомянутого начального условия получаем неравенство V(N, x(N), ж(0)) > 0, что приводит к противоречию с исходным предположением. Таким образом, любая функция V € V-\-(E) задает внешнюю оценку множества 1ZX, а значит и их пересечение, тоже оценивает множество соединимых точек сверху. □
Из леммы очевидно следует
Теорема. Если для процесса а = (ж, v~) € найдется такое множество V С V-\-(E), что концевой вектор q = (ж(0),ж(N)) глобально оптимален в задаче l(q) —> min; q € S(V) П Q, то процесс а оптимален в задаче (Р).
5. Заключение
Полученное условие оптимальности обобщает известные родственные подходы за счет: а) использования множеств монотонных функций; б) оперирования новым классом позиционно-параметрических функций. Полученные результаты следуют школе В. И. Гурмана по построению оценок множеств достижимости в неклассических задачах оптимального управления.
Список литературы
1. Гурман В. И. Принцип расширения в задачах управления / В. И. Гурман. -2-е изд., перераб. и доп. - М. : Наука, Физматлит, 1997. - 288 с.
2. Дыхта В. А. Неравенства Гамильтона - Якоби и условия оптимальности в задачах управления с общими концевыми ограничениями / В. А. Дыхта, С. П. Сорокин // Автоматика и телемеханика. - 2011. - № 9. - С. 13-27.
3. Krasovskii N. N. Game-theoretical control problems / N. N. Krasovskii, A. I. Subbotin. - N. Y. : Springer, 1988.
4. Krotov V. F. Global Methods in Optimal Control Theory / V. F. Krotov. - N. Y. : Marcel Dekker, 1996. - 384 p.
5. Nonsmooth Analysis and Control Theory / F. H. Clarke, Yu. S. Ledyaev, R. J. Stern, P. R. Wolenski. - N. Y. : Springer-Verlag, 1998. - 276 p. - (Grad. Texts in Math. ; vol. 178).
Сорокин Степан Павлович, кандидат физико-математических наук, Институт динамики систем и теории управления им. В.М. Матросо-ва СО РАН, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952)453052 (e-mail: [email protected])
S. P. Sorokin
Estimates of Reachable Set and Sufficient Optimality Condition for Discrete Control Problems
Abstract. The paper follows the "canonical optimality theory" (in the terminology due to A. A. Milyutin) for discrete-time optimal control problems. In respect of optimality conditions, the feature of this approach is to employ sets of strongly monotone functions being solutions of the respective Hamilton-Jacobi inequality. This idea serves to improve the efficiency of the derived optimality conditions, extends the area of their application, and increases their "stability" with respect to certain peculiarities of a problem (e.g., the lack of the uniqueness of the normed collection of Lagrange multipliers etc.)
In the paper, we consider an optimal control problem for a nonlinear discrete-time dynamic system with a nonlinear cost function under pointwise state and mixed-endpoint constraints. For this system, we obtain external estimates of the reachable set. Based on these estimates, we derive a sufficient optimality condition for the respective optimal control problems under no convexity assumptions on the input data. The results operate with a new class of feedback-parametric strongly monotone functions depending on initial, intermediate or terminal positions. The use of such functions brings an extra flexibility to the formulated sufficient optimality condition compared to the standard approach. The derived conditions admit a natural modification for problems of local (strong) minimum. One can expect that these results can be used for further strengthening of the discrete-time minimum principle up to a sufficient optimality condition, that would not require the convexity of the systems' godograph.
The work essentially relies on related results of Professor V.I. Gurman.
Keywords: strongly monotone functions, estimates of reachable sets, sufficient optimality conditions, optimal control, discrete dynamical systems.
References
1. Gurman V.l. Printsip rasshireniya v zadachakh upravleniya [The Extension Principle in Control Problems]. Moscow, Nauka, 1997. (in Russian)
2. Dykhta V.A., Sorokin S.P. Hamilton-Jacobi inequalities and the optimality conditions in the problems of control with common end constraints. Automation and Remote Control, 2011, vol. 72, no 9, p. 1808-1821. https://doi.org/10.1134/S0005117911090037
3. Krasovskii N.N.,Subbotin A.I. Game-theoretical control problems. New York, Springer, 1988. https://doi.org/10.1007/978-l-4612-3716-7
4. Krotov V.F. Global Methods in Optimal Control Theory. New York, Marcel Dekker, 1996.
5. Clarke F.H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Nonsmooth Analysis and Control Theory. Grad. Texts in Math., New York, Springer-Verlag, vol. 178, 1998.
Sorokin Stepan Pavlovich, Candidate of Sciences (Physics and Mathematics), Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov St., Irkutsk, 664033, tel.: (3952)453052 (e-mail: [email protected])