% 1И..1..й1 г?
2022. Т. 41. С. 19—39
Онлайн-доступ к журналу: http://mathizv.isu.ru
Серия «Математика»
Научная статья
УДК 517.977.5
МЯО 49К15, 49Ь99, 49Ш5
Б01 https://doi.org/10.26516/1997-7670.2022.41.19
Позиционный принцип минимума: вариационное усиление понятий экстремальности в оптимальном управлении
В. А. Дыхташ
1 Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, Российская Федерация И [email protected]
Аннотация. Известные принципы максимума типа Понтрягина и соответствующие им условия экстремальности (Кларка, Кашкоч - Лоясиевича, Суссмана и др.) усиливаются до необходимых условий глобальной оптимальности в форме позиционного принципа минимума для классических и негладких задач оптимального управления без терминальных ограничений. Формулировки позиционного принципа минимума (или соответствующего ему условия экстремальности) не выходят за рамки конструкций принципов максимума (функция Понтрягина или гамильтониан, сопряженная система или включение, их решения, т. е. котраектории), но собственно условие максимума функции Понтрягина или гамильтониана усиливается до вариационного: оптимальная траектория рассматриваемой задачи необходимо является минималью в некоторой присоединенной задаче динамической оптимизации. Эта задача ставится на множестве всех пучков конструктивных движений Красовского - Субботина, порожденных экстремальными стратегиями относительно суперрешения уравнения Гамильтона - Якоби, определенного явно через котраекторию исследуемого процесса и целевую функцию, задающую терминальный функционал. В более общем варианте позиционный принцип минимума использует обобщенные решения проксимального неравенства Гамильтона - Якоби для слабо убывающих (■и-стабильных) функций.
Ключевые слова: экстремали, позиционное управление, слабо убывающие функции
Ссылка для цитирования: ДыхтаВ.А. Позиционный принцип минимума: вариационное усиление понятий экстремальности в оптимальном управлении // Известия Иркутского государственного университета. Серия Математика. 2022. Т. 41.
О. 19-39.
https://doi.org/10.26516/1997-7670. 2022.41.19
Research article
Feedback Minimum Principle: Variational Strengthening of the Concept of Extremality in Optimal Control
Vladimir A. DykhtalK
1 V.M. Matrosov Institute of System Dynamics and Control Theory SB RAS, Irkutsk, Russian Federation K [email protected]
Abstract. Existing maximum principles of Pontryagin's type and related optimality conditions, such as, e.g., the ones derived by F. Clarke, B. Kaskosz and S. Lojasiewicz Jr., and H.J. Sussmann, can be strengthened up to global necessary optimality conditions in the form of so-called feedback minimum principle. This is possible for both classical and non-smooth optimal control problems without terminal constraints. The formulation of the feedback minimum principle (or related extremality conditions) remains within basic constructions of the mentioned maximum principles (the Hamiltonian or Pontryagin function, the adjoint differential equation or inclusion, and its solutions — co-trajectories). At the same time, the actual maximum condition — maximization of the Hamiltonian — takes a variational form: any optimal trajectory of the addressed problem should be optimal for a specific "accessory" problem of dynamic optimization. The latter is stated over all tubes of Krasovskii-Subbotin constructive motions generated by feedback strategies, which are extremal with respect to a certain supersolution of the Hamilton-Jacobi equation. Such a supersolution can be represented explicitely in terms of the co-trajectory of a reference control process and the terminal cost function. In a general version, the feedback minimum principle operates with generalized solutions of the proximal Hamilton-Jacobi inequality for weakly decreasing (w-stable) functions.
Keywords: extremals, feedback, weakly decreasing functions
For citation: DykhtaV. A. Feedback Minimum Principle: Variational Strengthening of the Concept of Extremality in Optimal Control. The Bulletin of Irkutsk State University. Series Mathematics, 2022, vol. 41, pp. 19-39. (in Russian) https://doi.org/10.26516/1997-7670.2022.41.19
1. Введение
Необходимые условия локальной оптимальности первого порядка в управляемых дифференциальных системах и включениях имеют безусловным эталоном фундаментальный принцип максимума Понтряги-на [13]. Не случайно подавляющее большинство известных принципов максимума (и соответствующих им условий экстремальности) являются распространением и обобщением оригинального принципа на более сложные и негладкие задачи, и применительно к классической, гладкой задаче сводятся к нему. Наиболее известен в этом плане принцип
максимума Кларка [9], но и последующие его обобщения не усиливают принцип максимума Понтрягина для гладких задач.
Исключение составляет принцип максимума Кашкоч - Лоясиеви-ча [19] с дальнейшим развитием в [14; 17; 18;20;21]. Он эффективен как для гладких задач (усиливая принцип Понтрягина), так и для негладких (см. в этом направлении обзорную статью В. Мордуховича [12] и монографию Р. Винтера [22]). Поэтому для вариационного усиления условий экстремальности, заявленного в аннотации, естественно принять за ориентир именно принцип максимума Кашкоч - Лоясиевича.
Однако для ясности изложение результатов начнем с независимого от этого принципа вариационного усиления принципа максимума Понт-рягина (ПМП) для гладких задач, и лишь затем обратимся к негладким. Заметим, что в формулировку принципа максимума Кашкоч - Лоясиевича входит негладкое сопряженное включение типа Кларка (даже в гладкой задаче), а это стимулирует вести изложение для негладкой задачи — никаких даже технических трудностей это не доставляет.
Начиная с первых работ периода появления позиционного принципа минимума [3-6] стало ясно, что он является конструктивным и эффективным методом решения нелинейных, невыпуклых задач оптимального управления итерациями последовательного позиционного спуска. Это важнейшее свойство иллюстрировалось на разнообразных примерах с особенностями, а также на обращении принципа максимума в достаточное условие оптимальности при более мягких предположениях, нежели обычно [7; 8]. Возникающая в позиционном принципе минимума (кратко — Р-ПМ) присоединенная задача на множестве стратегий, экстремальных относительно квазилинейной слабо убывающей функции [15] (мажоранты), оставалась в тени. Обращение к ней и анализ оказались разбросаны по источникам и фрагментарны. Между тем эта задача представляет безусловный теоретический интерес с точки зрения необходимых условий оптимальности. Исследованию Р-ПМ под этим углом зрения и посвящена данная статья. Ее первая часть (основная по объему) напрямую соответствует названию статьи (и применению в доказательствах квазилинейной мажоранты), а вторая часть — общему позиционному принципу минимума (СР-ПМ) с нелинейными мажорантами (идея анонсирована в [16]).
В статье систематически используются свойства слабо убывающих (■и-стабильных) функций и концепция Красовского - Субботина конструктивных движений управляемой системы с позиционным управлением [10] (в типичных случаях разрывным).
Будем рассматривать следующую задачу (Р):
х = / (£, х,и), ж(£о )= х0,
(1.1)
и(г) е и, г е т = [¿0,^],
(1.2)
■][х, и] = 1(х^\)) ^ М .
Здесь допустимые пары функций (х, и) € АС(Т, Кп) хЬ^(Т, и), где и — компакт в Кт. Вектор-функция /(Ь,х,и) предполагается непрерывной, локально липшицевой по х и удовлетворяющей условию сублинейного роста на Т х Кп х и; целевую функцию 1(х) считаем непрерывно дифференцируемой на Кп.
Ясно, что задача (Р) является негладкой из-за предположений на /. При дополнительном предположении непрерывной дифференцируемо-сти / по х мы получим гладкую задачу (Р3).
Через £ будет обозначаться множество всех допустимых пар а = (х,и), а через а = (х, и) € £ — пара, исследуемая на оптимальность.
2. Е-ПМ для гладкой задачи (Р3)
Определение 1. Программное управление и(-) €Ы := Ь^ (Т,и) назовем совместимым с траекторией х, если оно генерирует х, т.е. система (1.1) при и = и(-) имеет решение х.
Через и(х) обозначим множество всех управлений программно совместимых с ж, а через £(х) — множество допустимых пар а = (х, и), и € и (х).
Введем функцию Понтрягина
Н(I, х, ф, и) = {ф, /(I, х, и))
и сопряженную систему
ф = -Нх(1,х(1),ф,и(1)), ф(и)= 1х(х(Ъ)) (2.1)
при произвольном и(-) € и(х). Тем самым определяется множество котраекторий Ф(ж) — решений системы (2.1).
Все введенные объекты почти стандартны, лишь условие трансверсальности в (2.1) отличается знаком от обычного, так что в ПМП будет подразумеваться минимум Н по и € и, а не максимум.
Под позиционным управлением будем понимать любую функцию ь(Ь,х), определенную на Т х Кп со значениями в и. Решением системы (1.1) с таким управлением (т.е. при и = ь(Ь,х)) назовем пучок конструктивных движений Красовского-Субботина (кривых Эйлера), дополненный решениями типа Каратеодори в случае борелевости ь(Ь,х). Напомним [10], что каждое движение из пучка — это равномерный предел некоторой последовательности ломаных Эйлера, который является решением овыпукленной системы (1.1), (1.2).
Следующие обозначения необходимы для формулировки Р-ПМ:
• инх, ф) = А^шт Н(Ь,х,ф,и) (2.2)
иеи
— множество Д-минимизирующих управлений;
• для любой ф £ Ф(ж) положим
/(t, х) = ф(1) + lx(x) - lx(x(t)) (2.3)
и назовем эту вектор-функцию I-возмущением котраектории ф;
• полунепрерывное сверху, компактозначное отображение
Щ(t,x) = UH(t,x,p*(t,x)) = Argminрф(t,x) ■ f(t,x,u), (2.4)
ueu
которое назовем ^-экстремальным;
• V^ — множество произвольных селекторов v(t,x) отображения
Щ (t,x);
• X(v) — пучок конструктивных движений (кривых Эйлера), соответствующий v £ V-ф, дополненный решениями Каратеодори.
Справедлива следующая теорема — F—ПМ с программно совместимыми управлениями.
Теорема 1. Для оптимальности пары а = (х,и), как и любой а £ Т(х), необходимо, чтобы при любом выборе ф £ Ф(ж) траектория х была оптимальной в следующей ф-присоединенной задаче:
l(x(t 1)) ^ min, х(^) £ X(v), v £ Уф. (2.5)
Доказательство. Поскольку все пары а £ Т(х) равнозначны по функционалу с а, то они могут быть оптимальны только одновременно.
Выберем произвольно ф £ Ф(ж) и пару а = (х,и) £ Т(х), для которой выбранная котраектория является решением сопряженной системы (2.1). Определим функцию
(t, х) = 1(х) + (ф(г) - lx(x(t))) ■ (х - x(t)) + r(t). (2.6)
Здесь последнее слагаемое — это абсолютно непрерывная «поправка», которая позволяет гарантировать слабое убывание функции (2.6) в соответствии с приемом нормировки [3], [8, лемма 1.2.1]. При этом r(t 1) = 0, так что
(t 1,х)=1(х) (2.7)
в силу граничного условия в (2.1). Поэтому ^ — квазилинейная мажоранта функционала J[а] на множестве Т (о ней упоминалось выше), причем очевидно, что
ф* (t ,х)= / (t ,х).
Селекторы V € Уф отображения (2.4) генерируют движения (решения овыпукленной системы (1.1), (1.2)), вдоль которых мажоранта (2.6) не возрастает. В силу граничного условия (2.7) и оптимальности а отсюда следует оценка
Для завершения доказательства теоремы необходимо установить, что траектория х допустима в задаче (2.5), т.е. Зу € Уф : х € X(у). Это свойство нетрудно вывести из ПМП для оптимальной пары а. (Конструкция V аналогична используемой ниже в доказательстве теоремы 3 и здесь опускается.) В силу оценки (2.8) из существования селектора V следует утверждение теоремы. □
Уточним известную терминологию, связанную с экстремалями Понт-рягина задачи (Р3).
Пара (х, и) называется экстремалью Понтрягина, если она удовлетворяет ПМП вместе с соответствующей котраекторией ф — решением системы (2.1) при и = и(Ь). Тройку (х,и,ф) назовем понтрягинской биэкстремалью, а ее компоненту ф-коэкстремалью (наряду с котраекторией).
Определение 2. Пару (х,и) (или любую пару (х,и) € £(х)) назовем позиционной экстремалью задачи (Р3), если траектория х оптимальна в присоединенной задаче (2.5) хотя бы при одной ф € Ф(ж).
Отметим важную роль использования совместимых управлений: пара (х, и) может быть экстремалью Понтрягина, но другая пара (х, и) из £(х) — нет. Этот факт бракует пару (х,и) — она не оптимальна. Свойство экстремальности не является общим для всех пар из £(х), в отличие от свойства оптимальности.
В следующей теореме доказывается, что Р-ПМ действительно является вариационным усилением ПМП.
Теорема 2 (о связи позиционных экстремалей с понтрягинскими). Пусть пара (х, и) — позиционная экстремаль задачи (Р3) с котраекторией ф € ^(х). Тогда:
а) если х — 'решение типа Каратеодори, соответствующее борелев-скому селектору V €Уф, то пара функций
принадлежит £(х) и является экстремалью Понтрягина задачи (Р3) с котраекторией ф;
б) более общо, если х — кривая Эйлера (конструктивное движение), то траектория х экстремальна в смысле Понтрягина в овыпукленной задаче (со Р3) (т.е. является траекторией понтрягинской биэкстремали (х,Цг,ф) в (со Р3) с обобщенным управлением Цг).
1(х(Ь)) < 1(х(Ь)) Ух(-) € *(V), V € Уф.
(2.8)
(х, ис), ис(г) = у(г, х(г)), г € т
(2.9)
Доказательство. а) Поскольку v £ V^, то выполняется следующее условие позиционного минимума функции Н :
Н(t, x, рф(t,x),v(t,x)) = minH(t,x, p(t,x),u) на T x Rn. (2.10)
ueU
Полагая здесь x = x(t) и учитывая равенства (2.3), (2.9), получим Н(t,x(t),ip(t),uc(t)) = minH(t,x(t),ip(t),u), t £ T.
ueU
Поскольку v — борелевская функция со значениями в U, то uc(t) — допустимое управление, совместимое с x. Поэтому последнее равенство завершает доказательство.
б) Пусть xv является равномерным пределом последовательности ломаных Эйлера, соответствующих селектору v £ Уф, разбиению А = {t0 = т0 < ... < Ti < ... < tn+i = ti} отрезка T и кусочно постоянному управлению
N
Ua(t) = , Ui = v(Ti,xA(Ti)), Ui = [n, Ti+i), (2.11)
i=0
где xa — обозначение характеристической функции множества А. Здесь и далее рассматривается сходимость последовательностей при условии, что диаметр разбиения |А| ^ 0.
В силу слабой* секвенциальной компактности обобщенных управлений [1; 10] можно считать, что последовательность мер Дирака {^u^(t)} слабо* сходится к некоторому обобщенному управлению ßt. Введем нижний гамильтониан задачи
h(t, x, ф) = min Н(t, x,^,u)
ueU
и с его помощью запишем позиционное условие минимума (2.10) в узлах дискретизации
Н(Ti,xa(n),р(4,xa(п)),щ) = h(Ti, xa(п),p(4,xa(п))).
Умножая эти равенства на di = Ti+i — Ti и суммируя, после элементарных преобразований получим
N N
У] Н (Ti,x( п),ф( Ti),ui)di + {р (Ti,xa( Ti)) • f( Ti, xa (Ti),ui) —
i=0 i=0N (2.12)
—ф(n) • f(n,x(n),ui)}di = ^2 h(Ti, xa(n),p(n,xa(n)))di.
i=0
Рассмотрим это равенство при |А| ^ 0.
Сумма справа имеет пределом
У h(t, x(t),i>(t)) dt (2.13)
т
в силу непрерывности гамильтониана и равномерной сходимости х&(-) к х.
Рассмотрим среднюю сумму в (2.12). В каждой фигурной скобке первое слагаемое удовлетворяет условию Липшица по х в силу предположений введения; кроме того, оно равномерно непрерывно в силу условия сублинейного роста на f и, как следствие, равномерной ограниченности всех траекторий системы (1.1), (1.2). Поэтому, если обозначить через L константу Липшица, то модуль фигурной скобки не превосходит L sup ||жд (t) — ж(£)|| < Le, если рассматривать разбиения
Ui
А с достаточно малым диаметром. Описанная оценка верна для каждой фигурной скобки, так что их сумма будет не превосходить ТLe и сходится к нулю.
Первую сумму в (2.12) можно представить в интегральной форме как
У Н(t,x(t),^(t),uA(t)) dt = j dt J H(t,x(t),$(t),u) SUA(t)d(u). (2.14) т т и
Напомним, что по определению для любого й(-) ЕU и любой непрерывной на Т х U функции g(t,u) мера Дирака 5й действует следующим образом:
У g(t, и) 5йd(u) = g(t,u(t)).
и
Поскольку функция g(t,u) = Н(t,x(t),^(t),u) непрерывна на Т х U, а меры слабо* сходятся к fit, то интеграл в (2.14) сходится при
о к
J dt J Н(t,x(t),^(t),u) fit(du). т и
Вспоминая, что сумма справа в (2.12) сходится к интегралу (2.13), получаем равенство
J dt J H (t,x(t),$(t),u) fit (du) = j h(t,x(t),$(t)) dt. (2.15)
т и T
Отсюда легко вывести, что для почти всех t Е Т мера fit должна быть сосредоточена в точках минимума по и Е U функции
и ^ Н(t,x(t),$(t),u).
Но этот минимум совпадает с интегрантом в (2.15), что приводит к равенству: почти всюду на Т
У н (г, х(г), Ф(г),и) щ(<1и) = , х(г),гр(г)). (2.16)
и
Поскольку х — траектория овыпукленной системы (1.1), (1.2) с управлением Д^, то последнее равенство есть условие ПМП в задаче (со Р3). Теорема доказана. □
3. Обсуждение, дополнение, пример
Понятие позиционной экстремали введено впервые, причем оно легко распространяется и на негладкие задачи. Теорема 1 существенно усиливает Р-ПМ из работ [3;5;8], в которых предполагалось, что 1(х) € С2, а совместимые управления вводились в [7; 8] как позиционные. Но оперирование ими сразу выводило за рамки конструкций принципа максимума и гладкой задачи ( Р3).
Между тем использование множества программно совместимых управлений и(х) ведет к "размножению" котраекторий — появлению множества Ф(х) — и, как следствие, к серии ^-присоединенных задач (серии Р-ПМ). Исследуемая траектория должна быть глобально оптимальна в каждой из задач этой серии. Выделенное курсивом свойство — это следствие нелокального варьирования управления и траекторий в доказательстве Р-ПМ. (В ПМП вариации управления малы в Ь\, а траектории — в пространстве С.)
В доказательстве теоремы 1 использовалась функция фф (см. (2.6)), которая является решением неравенства Гамильтона-Якоби
,х)+ттшх(1 ,х) ■ ¡и,х,и) < 0 на Т х Кп,
иеи (3.1)
\,х) = 1(х)
для слабо убывающих функций относительно овыпукленной системы (1.1), (1.2). Нетрудно усмотреть, что равенства (2.3), (2.4) для ^-экст-ремального отображения определены по образцу динамического программирования с функцией фф. Важно отметить универсальность этой конструкции — она остается неизменной для всех необходимых условий оптимальности (экстремальности), формулировка которых использует котраектории и условие максимума (или минимума) функции Понт-рягина. Неизменными остаются и определения множеств Уф, X(и) и ^-присоединенной задачи (2.5).
Роль котраекторий в вариационном усилении условий экстремальности уместно акцентировать следующей цитатой из статьи Р. В. Гамкре-лидзе [2] о процессе открытия Понтрягиным ПМ: "Как только уравнения слабой экстремальности были получены, Л. С. сразу распознал в ковекторе ф(Ь) ключ к решению проблемы."
Теорема 2 значительно усиливает лемму 1.3.1 из [8], которая относится только к утверждению а) в предположении, что у(Ь,х(Ь)) = и(Ь), £ € Т. Оно, конечно, более жесткое, нежели (2.9).
Утверждение б) теоремы 2 не имеет аналогов. Строго говоря, доказанное равенство (2.16) является не полным ПМП для скользящего режима ) в задаче (со Р). Дело в том, что в (2.16) котраекто-рия ф соответствует х в исходной задаче, а не в овыпукленной, как стандартно [1]. Такая возможность не исключается общим ПМП; она реализуется в задачах с раздельной зависимостью фаз и управлений, а также в некоторых других случаях. Однако в нашем случае причина неполноты ответа ясна: траектория х исследуется на оптимальность именно в исходной задаче (Р3), хотя и с привлечением к сравнению с некоторыми траекториями задачи (со Р3) — они могут входить в пучки X(у). Но этого мало: необходимо рассматривать обобщенную задачу (со Р3) на множестве Б допустимых пар в = (х, ^) с функционалом 3[5] = 1(х(Ь\)), исследуемой парой ^ = (х,р) и непосредственно в этой задаче применять к в Р-ПМ.
Такая постановка выходит за рамки данной статьи, но мы приведем одно полезное утверждение, связанное с нею, и позволяющее парировать эффект "застревания" итераций позиционного спуска в Р-ПМ.
Предложение 1. Предположим, что в задаче (Р3) градиент 1х(х) удовлетворяет условию Липшица на Кп. Пусть допустимые пары (х1, и1),..., (хк, ик) удовлетворяют равенствам
3 [х1,и1] = ... = 3 [хк,ик ] = 3 [х,и] (3.2)
и не являются экстремалями Понтрягина в задаче (Р3).
Рассмотрим частично овыпукленную по Гамкрелидзе управляемую систему
х = (Ь, х, и1(1)) + ... + а,к/(Ь, х, ик(Ь)), (3.3)
а\ + ... + ак = 1, % > 0, г = 1,...,к,
с весовыми управлениями щ(-) € Ь^ и начальным условием х(Ь0) = х0.
Если существуют такие а*(-), что набор функций в* = (х*(-), а*(-), иг(-), г = 1,к) является экстремалью Понтрягина в задаче (со Р3), то справедливо неравенство 3[8*] < 3[ст] (т.е. возможен спуск из а по функционалу).
Мы лишь прокомментируем это утверждение и доказательство, детали которого опустим.
Наиболее практически важное здесь — это формирование скользящего режима спуска (3.3) из управлений иг(-) со свойством (3.2), которые получаются непосредственно в процессе применения F-ПМ. Но предположение их не экстремальности требует отдельной проверки. Доказательство предложения 1 базируется на точной формуле приращения функционала [7; 8] (именно для нее потребовалась липшицевая диффе-ренцируемость функции I): ее минимизация для поиска процесса спуска приводит к условию экстремальности.
Пример 1. х = и, у = и2, z = 1х2, х(0) = у(0) = z(0) = 0, |и| < 1,
Для управления и = +1
J = z(1) - 1 у2(1) ^ min .
г3 1
х№ = т = ^ -(ъ = т, з[и] = -о.
6 3
(1 - 12) -
Поскольку фх(Ъ) = -, фу = у(1) = -1, то легко убедиться, что
и не удовлетворяет ПМП, а ^-экстремальное отображение и.. = { —1}, т.е. состоит из единственной точки и = —1. Для нее
3 1 х(1) = —, у(1) = I, ¿(1) = -, 3 [и] = — - = 3 [и].
6 3
Получили, во-первых, что пара - си = +1 не удовлетворяет Р-ПМ, ибо соответствующая траектория д(Ь) не допустима в ^-присоединенной задаче (в и.ф нет селекторов, генерирующих -), а, во-вторых, столкнулись с «зацикливанием» с не экстремальной парой — с управлением и.
Следовательно, можно воспользоваться предложением 1, которое при к = 2 сводится к такому выбору (фх,фу), что функция Н(и) = фхи + фуи2 имела минимум в точках и = ±1. Очевидно, что это дает фх = 0, фу = 1. Из овыпукленной системы х = а\ — а.2, у = а\ + а.2 =
1
1, г = —х заключаем, что
х* = 0, а\ =а* = 1, у* = I, z* = 0, 3*] = — 2 < — \ = 3[-].
Как и ожидалось, мы получили спуск из — на скользящем режиме *, причем почти очевидно, что он глобально оптимален в расширенной задаче.
Этот пример (предложенный М. В. Старицыным) с анализом управления и = 1 довольно показателен: при раздельной зависимости функции / от управлений и фазовых координат эффективность Р-ПМ падает, что и наблюдается в данном примере. Решить задачу, стартуя с
и, не позволяет даже позиционный принцип минимума 2-го порядка с квадратичной мажорантой, зависящей от ф и матричной функции Га-басова (хотя, как правило, ее использование приводит к "смешиванию" переменных [3;4;6]). В данном случае улучшение и можно достигнуть с помощью квазиэкстремального селектора V = — 1 + е, е > 0, но оно локально и связано с малым параметром. Очевидно, что предложение 1 предпочтительнее, если не рассматривать произвольные нелинейные мажоранты функционала.
4. Е-ПМ с позиционно совместимыми управлениями
Как отмечалось во введении, принцип минимума Кашкоч - Лоясие-вича равным образом применим как к гладким, так и негладким задачам. Поэтому, чтобы не сужать ареал возможных приложений дальнейших результатов, начнем с его формулировки для негладкой задачи (Р) (см., например, [6; 10]).
Определение 3. Позиционное управление ад : Т х Кп ^ и назовем Ь-совместимым с траекторией х, если:
а) /(г,х(г),ад(г,х(г))) = /(г,х(г),й(г)) на т;
б) функция /(Ъ,х) = f {Ь,х,ад{Ь,х)) измерима по Ь, липшицева по х и ограничена на ограниченных множествах.
Отметим, что существование измеримо-липшицевой функции /(Ь, х), совместимой с любой траекторией включения х € со /(Ь, х, и), гарантируется важной теоремой о селекторе Лоясиевича [17; 18]. Поэтому задачу (Р) можно переформулировать как задачу оптимизации траекторий указанного включения.
Используя свойства функции /, можно ввести дифференциальное включение Кларка [12]
т € —тд/№1) = ит)). (4.1)
Тогда принцип минимума Кашкоч - Лоясиевича (кратко, ПМКЛ) можно сформулировать следующим образом.
Условие М(ад, ф). Если пара (х, и) оптимальна в задаче (Р), то для любого Ь-совместимого с х позиционного управления ад(Ь, х) существует 'решение ф дифференциального включения (4.1) такое, что почти всюду на Т
н (г,х(г),ф(г),й(г)) = шт н (г,х(г),ф(г),и). (4.2)
иеи
Этим условием определяются экстремали Кашкоч - Лоясиевича задачи (Р).
Из свойства универсальности конструкции ^>ф (см. п.3) следует, что мы находимся в условиях вариационного усиления ПМКЛ. Для этого вводим:
• множество №(х) ¿-совместимых позиционных управлений;
• множество Фад(х) всех решений сопряженного включения (4.1) при фиксированном ■ € (х);
• для ф € Фад(х) определяем отображения рф(1 ,х),иф(1 ,х), Vф, А'(у) вполне аналогично разделу 2 (они порождаются мажорантой (2.6)).
Теорема 3. Если пара (х,и) оптимальна в задаче (Р), то для любого ■ € №(х) существует ф € (х) такая, что х является минималью в ф-присоединенной задаче (2.5).
Доказательство. Оно ничем не отличается от доказательства теоремы 1 вплоть до недоказанной завершающей ее части, в которой требовалось установить допустимость траектории х- в присоединенной задаче (2.5).
Фиксируем произвольное ■ € №(-) и из необходимого условия М(ш,ф) найдем ф € (х) : выполнено условие минимума (4.2). Из него следует, что вдоль кривой (Ъ,х(Ь)), £ €Т, т.е. на графике х(), выполняется включение и(Ь) € !1ф(Ь, х(Ь)). Можно считать и(-) борелевской функцией, изменив при необходимости ее значения на множестве нулевой линейной меры Лебега. В силу полунепрерывности сверху и ком-пактозначности отображения 11ф (Ь,х) оно имеет борелевский селектор ,х). Положим теперь
гг^), (1 ,х) € grX(■), ,х) вне grX(■).
Нетрудно убедиться, что - — борелевский селектор 11ф(Ь,х), генерирующий траекторию □
Отметим, что в ПМКЛ программные управления (включая и) почти не играют роли. Действительно, в определение 3 и- входит только в правую часть равенства в условии а), но она может быть записана как х(Ь). Условие минимума (4.2) можно представить в виде
ф(ь) ■х(г) = ,х(г),ф(г)), Ь€Т, (4.3)
где к — нижний гамильтониан задачи. Фактически управлением в задаче оказываются функции ( , х), на которые и налагаются аналитические свойства, в отличие от ¿-совместимых управлений
Учитывая эти замечания, теорему 3 можно переформулировать в терминах траекторий, начав "Если траектория х оптимальна в задаче
у(1 ,х) =
(Р),..." (далее по тексту). В подобной форме формулировался ПМКЛ в ряде работ (см., например, [18;21]).
Обратимся к иллюстрирующим примерам.
В примере 1 управление и = 1 удовлетворяет ПМКЛ, так как для его траектории q W(q) = {й} и только. Но, как мы видели, F-ПМ бракует пару (q, и) и приводит к глобально оптимальному решению.
Пример 2. х i = х2(ui + и2), х2 = и2 — х\, #i(0) = х2(0) = 0, щ £ [0,1], U2 £ [—1,1],
J = х1(1) ^ min .
Этот пример Дж. Варги разобран с позиций F-ПМ в [7, с. 39], но частично — с использованием только программно совместимых управлений.
Пара а = (х,и) = 0 является особой экстремалью Понтрягина с котраекторией ф = (1, 0). Легко убедиться, что для х
W(х) = {w(x) | Wi(x) £ [0, 1], W2 = xi £ [ — 1,1]},
где w^^(x) — произвольная липшицевая функция. Для w £ W(х)
f (х) = ( X2(wi(^+ Х1) ) ^ df (х) = ( 0 wi(0) ) . Различным Wi(0) = Wi(x) соответствуют котраектории
4>(t) = (4>i(t) = 1, Mt) = wi(0)(1 — t)),
образующие множество (x), причем коэкстремали ф соответствует выбор Wi(0) = 0. А это означает, что ПМКЛ выполняется для ä : условие М(w, ф) выполнено при любом w £ W(х) с w-\_(0) = 0 и ф = ф. Значит ПМКЛ не бракует а, как и ПМП. Обратимся к F-ПМ. Из условия
Ф ' f(x)=x2(wi(x) + xi) ^ min, wi £ [0,1], (4.4)
реализующего (4.3), получаем ^-экстремальное отображение U^(x) = —Sign^2 при многозначной трактовке функции знака. (После решения задачи (4.4) w по традиции меняем на и.)
Нетрудно убедиться, что все ^-экстремальные селекторы генерируют исходную траекторию, т. е. имеет место «застревание». Мы не можем воспользоваться предложением 1, ибо й — экстремальное управление. Но в общем определении конструктивных движений с разрывным позиционным управлением [22] требуется возмущать начальную точку для ломаных Эйлера, если она оказалась на множестве многозначности игф(х). В данном примере это множество Х2 = 0 — начальное условие для второго уравнения системы. Поэтому будем рассматривать его с условием х2(0) = ß, где ß — малый параметр. Тогда x2(t) = ß
(ибо и2 = Х\) и первое уравнение системы примет вид X1 = ß(х1 — (signß)), Xi(0) = 0 с решением X1(t) = (signß)(1 — exp ßt). Ясно, что х1(1) < 0 при всех достаточно малых Ißl. Это означает, что получена траектория с меньшим значением функционала, чем х(1). Значит, F-ПМ забраковал пару а, но спуск оказался неглубоким. По-видимому, экстремаль а реализует почти сильный минимум функционала — по крайней мере численные эксперименты, проведенные Т. С. Зароднюк в пакете Optcon, свидетельствуют об этом.
Пример 3 (с дифференциальным включением А. А. Милютина [11]). IX I< 1, IуI < 1х1, х(0)=у(0) = 0, J[х(-),у(-)]=у(1) ^ min.
От включения можно перейти к негладкой управляемой системе и получить следующую задачу:
X = и, у = vIxI, х(0) = у(0) = 0,
IU < 1, М< 1, J[а] = У(1) ^ min, а = (х,у,и, v)(-).
Траектория q := (х, у) = 0 экстремальна по Кларку как в исходной, так и в преобразованной задачах с котраекторией ф = (фх,фу) = (0,1). Множество L-совместимых управлений
W (q) = {w(q) = (0,ш(х))1 1ш(х)1 < 1},
где q = (х, у), ш(-) — липшицевая функция. Легко убедиться, что iw E W (q)
^и,(q) = {ф(1) = (фх(1),фу(t)) I фх(1) = su(X)(1 — t), И < 1, фу = 1}.
Условие (4.2) минимума Н по и EU, или равносильное ему (4.3) принимает вид
ф(г) ■ q(t) = 0 < [sw(X)(1 — t)]u ilul< 1
при некотором |s| < 1 и почти всюду на [0,1]. Но это условие может выполняться только при вш(х) = 0, что соответствует одновременно экстремалям Кларка и Кашкоч - Лоясиевича (а также необходимому условию приближаемости Милютина [11]). Следовательно, они не бракуют ( , и, ).
Но при любом выборе ф E Фи(q) с sw(X) = 0 F-ПМ генерирует селектор спуска U(x) = —signsw(X), v(x) = —IxI с траекторией
t2 1 X(t) = ±t, y(t) = —, J[X,y] = — — < 0 = J[а].
Здесь по х-компоненте возможны два варианта с одним значением функционала, которое выписано через траекторию.
Таким образом, F-ПМ бракует а, причем обеспечивает спуск на глобально оптимальную траекторию (х,у), что почти очевидно.
Отметим, что А. А. Милютин рассматривал для исходного включения лишь условие экстремальности (без какой-либо минимизации) и обратил внимание на неожиданное обстоятельство. Оказывается, в негладких задачах оптимизации траектория, не экстремальная для некоторого включения, становится (вдруг!) экстремальной при его расширении. Факт, который не имеет места для ПМП, а причиной парадокса Алексей Алексеевич считал отсутствие каких-либо классов вариаций в доказательствах негладких ПМ. Но в доказательствах F-ПМ вариации используются — это экстремальные селекторы по управлению и пучки конструктивных движений по траекториям.
5. Общий позиционный принцип минимума
F-ПМ в предыдущих пунктах базировался на использовании квазилинейной мажоранты р^ вида (2.6). Здесь мы кратко остановимся на общем позиционном принципе минимума (сокращенно, GF—ПМ), который использует мажоранты функционала произвольной структуры, вообще говоря, негладкие. Но в данной статье ограничимся липшицевы-ми по (t ,х), гладкими по х решениями неравенства Гамильтона-Якоби (3.1) применительно к задаче (Р). Общий случай, анонсированный в [16], будет изложен в отдельной статье.
Итак, пусть p(t,х) — решение неравенства (3.1) с указанными свойствами. Определим ^-экстремальное отображение
U^(t, х) = Argminp^i ,х) • f(t ,х,и), иеи
множество Vv = {v(t,х)} его селекторов и пучки конструктивных движений X(v), дополненные решениями Каратеодори.
Поставим ^-присоединенную задачу
1(х(ti)) ^ min, х() е X(v), v е Vv. (5.1)
Введем следующее
Условие М(х,р). Будем говорить, что пара (х,и) удовлетворяет позиционному принципу минимума с мажорантой р, если траектория х оптимальна в р-присоединенной задаче (5.1).
Возникает вопрос: в каких случаях это условие выполнено?
Теорема 4. Пусть пара (х, и) оптимальна и является экстремалью Кашкоч-Лоясиевича при некоторых w е W (х) и ф е Ф^ (х). Если выполняется равенство
px(t ,x(t))= ф(1) VteT, (5.2)
то траектория х — минималь в <р-присоединенной .задаче.
Эта теорема по существу не требует доказательства — оно следует из доказательств теорем 1,3 с заменой отображения U-ф(t,х) на Uv(t,х) и условия u(t) G Ur^(t,X(t)) на u(t) G Uv(t,X(t)) вдоль графика х(-). После этого селектор V, гарантирующий допустимость X в задаче (5.1), определяется как в конце доказательства теоремы 3.
Теорема 4 (т. е. GF-ПМ) имеет гораздо более широкую область приложений, нежели F-ПМ или его обобщение на квадратичные мажоранты. Но сколь-нибудь общего метода построения нелинейных мажорант пока не существует — имеющиеся относятся к конкретным классам задач, например, обобщенно линейных по состоянию или квадратичных [4;8], а также развитыми в методе В. Ф. Кротова — поиск в классе линейно-квадратичных функций, метод кратных максимумов Гурмана.
Следующее замечание необходимо иметь ввиду при практическом использовании теоремы 4. Если на некоторой экстремали условие (5.2) выполнилось, то отсюда еще не следует оптимальность экстремальной траектории в ^-присоединенной задаче (что, казалось бы, странно). Но дело в том, что в формулировку теоремы 4 входит естественное предположение оптимальности данной траектории. Однако в приложениях этот факт неизвестен и должен быть заменен проверкой неравенства
l(x(t i)) < l(x(t i)) Ух(-) G * (v), v G Vv, (5.3)
без которого бессмысленно говорить об оптимальности х в задаче (5.1).
Обращаясь к примерам, отметим, что в примере 1 использование квадратичной мажоранты
Ср(х, у, z) = 1(х, у, z) = z 1 у2 + х2
позволяет легко найти глобально оптимальное решение s*, применив отображение Uv. Пару ä с управлением u = 1 тестировать теоремой 4 бессмысленно, так как она не удовлетворяет ПМКЛ. Если взять экстремальную пару ä = (q,u) = 0 с ф = (0, 0,1), то условие (5.2) выполняется, но х не оптимальна в ^-присоединенной задаче, так как для нее неравенство (5.3) нарушено. Поэтому ä не оптимальна.
Пример 4. х = u, у = -tх2т, х(-1) = у(-1) = 0, \u\ < 1,
J = у(1) ^ min,
где m — любое натуральное число.
Будем искать решение неравенства Гамильтона - Якоби (3.1) в виде
V(t,х, у) = 2тр(*)х2т + У, (5.4)
где Р(t) — некоторая дифференцируемая функция. При этом мы имеем ввиду возможность подходящей нормировки функции (5.4) для преобразования ее в слабо убывающую.
Распорядимся выбором функции Р (t) так, чтобы полная производная ф в силу системы не зависела от х2т. Тогда с учетом граничного условия Р(t 1) = 0, вытекающего из (3.1), (5.4), получим Р(t) = т(t2 — 1) и ф-экстремальное отображение
U<p(t, х) = sign (1 — t2)х. Его элементарные селекторы
v1(x) = i +1, Х - 0, 1)2 (х) — { +1, Х> 0, v (х) = \ —1, х< 0, V (Х) = \ —1, х < 0,
( +1, х > 0,
ь3(х) = I 0, х = 0,
[ —1, х < 0 генерируют решения Каратеодори
х1(г) = г + 1, х2(ъ) = —t — 1,
соответствующие управлениям и1 = 1, и2 = —1, и конструктивное движение х3(1) =: хс^) = 0 — траекторию скользящего режима с базовыми управлениями и1, и2 и весами ац = а2 = 1/2.
Найденная нелинейная мажоранта ф позволила получить решение задачи, ибо пары (х1,и1), (х2,и2) не только удовлетворяет GF-ПМ, но и глобально оптимальны. Это легко установить, используя достаточные условия Кротова с той же ф, но усматривается и непосредственно. А вот х = 0 паре си = 0 является особой экстремалью задачи, удовлетворяет условию (5.2) и допустима в ф-присоединенной задаче (ее генерирует селектор v3), но не является ее решением — условие (5.3) не выполняется.
Данный пример показывает, что нелинейные мажоранты функционала позволяют решать задачи без априорного знания какого-либо процесса.
Автор признателен анонимным рецензентам за сделанные замечания, способствовавшие улучшению статьи.
Список источников
1. Гамкрелидзе Р. В. Основы оптимального управления.Тбилиси : Изд-во Тби-лис. ун-та, 1977.
2. Гамкрелидзе Р. В. Математические работы Л. С. Понтрягина // Труды международной конференции, посвященной 90-летию со дня рождения Л. С. Понтрягина. Москва, 31 авг. - 6 сент. 1998 г. Т. 1. Оптимальное управление, Итоги науки и техн. Сер. Соврем. математика и ее приложения. Темат. обз. M.: ВИНИТИ, 1998. Т. 60. P. 5-23.
3. Дыхта В. А. Слабо монотонные решения неравенства Гамильтона - Якоби и условия оптимальности с позиционными управлениями // Автоматика и телемеханика. 2014. № 5. С. 31-49.
4. Дыхта В. А. Нестандартная двойственность и нелокальные необходимые условия оптимальности в невыпуклых задачах оптимального управления // Автоматика и телемеханика. 2014. № 11. С. 19-37.
5. Дыхта В. А. Вариационные необходимые условия оптимальности с позиционными управлениями спуска в задачах оптимального управления // Доклады Академии наук. 2015. Т. 462, № 6. С. 653-656.
6. Дыхта В. А. Вариационные условия оптимальности с позиционными управлениями спуска, усиливающие принцип максимума // Известия Иркутского государственного университета. Серия Математика. 2014. Т. 8. С. 86-103.
7. Дыхта В. А. Позиционные усиления принципа максимума и достаточные условия оптимальности // Труды Института математики и механики УрО РАН. 2015. Т. 21, № 2. С. 73-86.
8. Дыхта В. А., Самсонюк О. Н. Неравенства Гамильтона - Якоби и вариационные условия оптимальности. Иркутск : Изд-во ИГУ, 2015. 150 с.
9. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988. 280 с.
10. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М. : Физматлит, 1974. 456 с.
11. Милютин А. А. Выпуклозначные липшицевы дифференциальные включения и принцип максимума Понтрягина // Итоги науки и техники. Серия: Современная математика и ее приложения. 1999. Т. 65. С. 175-187.
12. Мордухович Б. Ш. Оптимальное управление разностными, дифференциальными и дифференциально-разностными включениями // Итоги науки и техники. Сер. Современная математика и ее приложения. Темат. обз. 1999. Т. 61. С. 33-65.
13. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Физматлит, 1961. 391 с.
14. Artstein Z. Pontryagin maximum principle revisited with feedbacks // Eur. J. Control. 2011. Vol. 17, N 1. P. 46-54. https://doi.org/10.3166/ejc.17.46-54
15. Clarke F. H., Ledyaev Yu. S., Stern R. J., Wolenski P. R. Qualitative properties of trajectories of control systems: A survey //J. Dynamical and Control Syst. 1995. Vol. 1, N 1. P. 1-48. https://doi.org/10.1007/BF02254655
16. Dykhta V. A. On variational necessary optimality conditions with descent feedback controls strengthening Maximum principle // Differential Equations and Optimal Control. Materials of the International Conference dedicated to the centenary of the birth of Academician Evgenii Frolovich Mishchenko. Moscow, June 7-9, 2022. Steklov Mathematical Institute RAS, 2022. P. 38-42.
17. Frankowska H., Kaskosz B. Linearization and boundary trajectories of nonsmooth control systems // Can. J. Math. 1988. Vol. 11, N 3. P. 589-609. https://doi.org/10.4153/CJM-1988-025-7
18. Kaskosz B. Extremality, controllability, and abundant subsets of generalized control systems // J. Optim. Theory Appl. 1999. Vol. 101, N 1. P. 73-108. https://doi.org/10.1023/A:1021719027140
38
19
20
21
22
1
2
3
4.
5.
6
7
8
9
10
11
12
Kaskosz B., Lojasiewicz S. A maximum principle for generalized
control // Nonlinear Analysis: Theory, Methods and Appl. 1985. Vol. 9,
N 2. P. 109-130. https://doi.org/10.1016/0362-546X(85)90067-7
Loewen P. D., Vinter R. B. Pontryagin-type necessary conditions for differential
inclusion problems // Systems & Control Lett. 1997. Vol. 9, N 9. P. 263-265.
https://doi.org/10.1016/0167-6911(87)90049-1
Sussmann H. A strong version of the Lojasiewicz maximum principle // Optimal Control of Differential Equations / ed. N. H. Pavel. N. Y. : M. Dekker Ink., 1994. P. 1-17 (Lecture Notes in Pure and Applied Mathematics). https://doi.org/10.1201/9781003072225
Vinter R. B. Optimal Control. Boston : Birkhauser, 2010. 500 p. https://doi.org/10.1007/978-0-8176-8086-2
References
Gamkrelidze R.V. Principles of optimal control theory. Mathematical Concepts and Methods in Science and Engineering, vol. 7. NY, Springer, 1978, 175 p. https://doi.org/10.1007/978-1-4684-7398-8
Gamkrelidze R.V. The mathematical work of L.S. Pontryagin. J. Math. Sci. (N.Y.), 2000, vol. 100, no. 5, pp. 2447-2457.
Dykhta V.A. Weakly monotone solutions of the Hamilton-Jacobi inequality and optimality conditions with positional controls. Autom. Remote Control, 2014, vol. 75, no. 5, pp. 829-844. https://doi.org/10.1134/S0005117914050038 Dykhta V.A. Nonstandard duality and nonlocal necessary optimality conditions in nonconvex optimal control problems. Autom. Remote Control, 2014, vol. 75, no. 11, pp. 1906-1921. https://doi.org/10.1134/S0005117914110022 Dykhta V.A. Variational necessary optimality conditions with feedback descent controls for optimal control problems. Dokl. Math., 2015, vol. 91, no. 3, pp. 394-396. https://doi.org/10.1134/S106456241503031X
Dykhta V.A. Variatsionnyye usloviya optimal'nosti s pozitsionnymi upravleniyami spuska, usilivayushchiye printsip maksimuma [Variational optimality conditions with feedback descent controls that strengthen the Maximum principle]. The Bulletin of Irkutsk State University. Series Mathematics, 2014, vol. 8, pp. 86-103. (in Russian)
Dykhta V.A. Positional strengthenings of the maximum principle and sufficient optimality conditions. Proc. Steklov Inst. Math., 2016, vol. 293, suppl. 1, pp. 43-57. https://doi.org/10.1134/S0081543816050059
Dykhta V.A., Samsonyuk O.N. Neravenstva Gamil'tona-Yakobi i variatsionnye usloviya optimal'nosti [Hamilton-Jacobi inequalities and variational optimality conditions]. Irkutsk, Irkutsk St. Univ. Publ., 2015, 150 p. (in Russian) Clarke H. Optimization and nonsmooth analysis. Philadelphia, SIAM, 1987, 320 p. Krasovskii N.N., Subbotin A.I. Pozitsionnye differentsial'nye igry [Positional differential games]. Moscow, Nauka Publ., 1974, 458 p. (in Russian) Milutin A.A. Convex-valued Lipschitzian differential inclusions and the Pontryagin Maximum Principle. J. Math. Sci. (N.Y.), 2001, vol. 104, no. 1, pp. 881-888. https://doi.org/10.1023/A:1009566921025
Mordukhovich B.Sh. Optimal control of difference, differential, and differential-difference inclusions. J. Math. Sci. (N.Y.), 2000, vol. 100, no. 6, pp. 2613-2632. https://doi.org/10.1007/BF02672708
13. Pontryagin L.S., Boltyanskii V.G., Gamkrelidze R.V., Mishchenko E.F. Matematicheskaya teoriya optimal'nykh protsessov [The mathematical theory of optimal processes]. Moscow, St. Publ. house of Phys. and Math. Lit., 1961, 391 p. (in Russian)
14. Artstein Z. Pontryagin maximum principle revisited with feedbacks. Eur. J. Control, 2011, vol. 17, no. 1, pp. 46-54. https://doi.org/10.3166/ejc.17.46-54
15. Clarke P.H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Qualitative properties of trajectories of control systems: A survey. J. Dyn. Control Syst., 1995, vol. 1, no. 1, pp. 1-48. https://doi.org/10.1007/BF02254655
16. Dykhta V.A. On variational necessary optimality conditions with descent feedback controls strengthening Maximum principle. Differential Equations and Optimal Control. Materials of the International Conference dedicated to the centenary of the birth of Academician Evgenii Frolovich Mishchenko. Moscow, June 7-9, 2022. Steklov Mathematical Institute RAS, 2022, pp. 38-42.
17. Frankowska H., Kaskosz B. Linearization and boundary trajectories of nonsmooth control systems. Can. J. Math., 1988, vol. 11, no. 3, pp. 589—609. https://doi.org/10.4153/CJM-1988-025-7
18. Kaskosz B. Extremality, controllability, and abundant subsets of generalized control systems. J. Optim. Theory Appl., 1999, vol. 101, no. 1, pp. 73-108. https://doi.org/10.1023/A:1021719027140
19. Kaskosz B., Lojasiewicz S. A maximum principle for generalized control. Nonlinear Analysis: Theory, Methods and Appl., 1985, vol. 9, no. 2, pp. 109-130. https://doi.org/10.1016/0362-546X(85)90067-7
20. Loewen P.D., Vinter R.B. Pontryagin-type necessary conditions for differential inclusion problems. Systems & Control Lett., 1997, vol. 9, no. 9, pp. 263-265. https://doi.org/10.1016/0167-6911(87)90049-1
21. Sussmann H. A strong version of the Lojasiewicz maximum principle. In: Optimal Control of Differential Equations, ed. N.H. Pavel, Ser. Lecture Notes in Pure and Applied Mathematics, N.Y., M. Dekker Publ., 1994, pp. 1-17.
22. Vinter R.B. Optimal Control. Birkhauser, Boston, 2010, 500 p. https://doi.org/10.1007/978-0-8176-8086-2
Об авторах
Дыхта Владимир Александрович, д-р физ.-мат. наук, проф., Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Российская Федерация, 664046, г. Иркутск, [email protected]
About the authors
Vladimir A. Dykhta, Dr. Sci.
(Phys.-Math.), Prof., V.M. Matrosov Institute of System Dynamics and Control Theory SB RAS, Irkutsk, 664046, Russian Federation, [email protected]
Поступила в 'редакцию / Received 20.07.2022 Поступила после рецензирования / Revised 18.08.2022 Принята к публикации / Accepted 22.08.2022