ДИНАМИЧЕСКИЕ СИСТЕМЫ И ОПТИМАЛЬНОЕ
УПРАВЛЕНИЕ
DYNAMIC SYSTEMS AND OPTIMAL CONTROL
Онлайн-доступ к журналу: http: / / mathizv.isu.ru
Серия «Математика»
2025. Т. 51. С. 3-20
Научная статья
УДК 517.977 МБС 49Л20
Б01 https://doi.Org/10.26516/1997-7670.2025.51.3
Точные формулы приращения целевого функционала в задаче оптимального управления линейным уравнением баланса
Е. В. Гончарова1, Н. И. Погодаев1, М. В. Сгарицынш
1 Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, Российская Федерация И [email protected]
Аннотация. Изучается линейная по состоянию задача оптимального управления транспортным уравнением с источником на пространстве конечных знакопеременных борелевских мер. Для этой задачи впервые получен вариант классического принципа Понтрягина (в форме принципа минимума) и предложен подход к его усилению на основе нестандартной процедуры вариационного анализа — точных формул приращения, представляющих разность значений целевого функционала на любой паре допустимых управлений, без пренебрежения остаточными членами каких-либо разложений. Подход опирается на стандартную двойственность и приводит к серии необходимых условий оптимальности неклассического, «позиционного» типа. Конструктивным следствием позиционных условий оказывается метод последовательных приближений, свободный от параметров «глубины спуска».
Ключевые слова: уравнение баланса, оптимальное управление, позиционные управления, необходимые условия оптимальности, методы спуска
Благодарности: Исследование выполнено за счет гранта Российского научного фонда № 23-21-00161, https://rscf.ru/project/23-21-00161/.
Ссылка для цитирования: ГончароваЕ. В., ПогодаевН. И., СтарицынМ. В. Точные формулы приращения целевого функционала в задаче оптимального управления линейным уравнением баланса // Известия Иркутского государственного университета. Серия Математика. 2025. Т. 51. С. 3-20.
https://doi.org/10.26516/1997-7670.2025.51.3 Research article
Exact Formulas for the Increment of the Cost Functional in Optimal Control of Linear Balance Equation
Elena V. Goncharova1, Nikolay I. Pogodaev1, Maksim V. Staritsyn1S
1 Matrosov Institute for System Dynamics and Control Theory of SB RAS, Irkutsk, Russian Federation IS] [email protected]
Abstract. We study a state-linear optimal control problem for a transport equation with a source term in the space of finite signed Borel measures. For this problem, a version of the classical Pontryagin principle (in the form of the minimum principle) is obtained for the first time. In addition, we propose an approach to enhance the latter based on a certain unconventional procedure of variational analysis, namely, on exact increment formulas, representing the difference in values of the objective functional for any pair of admissible controls, without neglecting residual terms of any expansion. The approach relies on the standard duality and results in a series of necessary optimality conditions of a non-classical, "feedback" type. A constructive consequence of the feedback optimality conditions is a method of successive approximations, devoid of any parameters of "descent depth".
Keywords: nonlocal balance law, optimal control, feedback control, necessary optimal-ity conditions, numerical algorithms
Acknowledgements: The study was financially supported by the Russian Science Foundation, grant no. 23-21-00161, https://rscf.ru/project/23-21-00161/.
For citation: GoncharovaE. V., Pogodaev N. I., StaritsynM. V. Exact Formulas for the Increment of the Cost Functional in Optimal Control of Linear Balance Equation. The Bulletin of Irkutsk State University. Series Mathematics, 2025, vol. 51, pp. 3-20. (in Russian)
https: //doi.org/10.26516/1997-7670.2025.51.3
1. Введение
Исследуется задача оптимального управления линейным уравнением баланса (транспортным уравнением с источником) в пространстве конечных знакопеременных мер на Кга. Подобные уравнения представляют удобный математический аппарат для моделирования и анализа поведения больших популяций взаимодействующих «точечных» объектов в терминах их статистического приближения — «среднего поля».
Хорошо изучен случай, когда источниковый член тривиален. При этом совокупная мера («масса» моделируемой популяции) сохраняется в процессе движения, а само уравнение баланса превращается в урав-
нение неразрывности, которое удобно рассматривать на пространстве вероятностных (или неотрицательных) мер. Имеющиеся здесь результаты теории (оптимального) управления находят широкий круг приложений в ряде смежных областей — от статистической механики до математической биологии, см., например, [15-17; 22] и цитируемую там литературу.
В классе неотрицательных мер удается остаться и при моделировании некоторых процессов с нетривиальным источником/стоком, см. обзор в [24] и недавнюю работу [8]. Однако в общем случае популяция характеризуется уже не массой, а некоторым «зарядом», т. е. мера-состояние становится знакопеременной. Подобные постановки рассмотрены, например, в [2; 21; 24].
Хотя область приложения моделей последнего типа, очевидно, намного шире, результаты в этом направлении носят фрагментарный характер: нам известны лишь только что упомянутые (и цитируемые в них) публикации, причем вопросы теории управления такими системами затрагиваются, по-видимому, исключительно в [24]. Особо отметим, что соответствующий аппарат оптимального управления не развит уже в части базовых результатов. Так, например, адекватный принцип максимума Понтрягина (ПМП) — вариант классического необходимого условия оптимальности [26] — не сформулирован даже в линейной по состоянию задаче управления уравнением баланса с линейным источником.
В п. 2.2 настоящей статьи мы рассмотрим именно такую обобщенно-линейную постановку упомянутой экстремальной задачи, получим в ней вариант принципа Понтрягина (п. 3.2) и изложим неклассический подход к ее анализу на основе точных представлений приращения целевого функционала (п. 4.1). Основными результатами являются серия необходимых условий глобального минимума в форме так называемого позиционного принципа оптимальности (п. 4.2) и основанный на этом принципе концептуальный метод спуска по функционалу (п. 4.3). Пример применения полученных результатов представлен в п. 4.4.
2. Задача оптимального управления
2.1. Основные обозначения
В статье встречаются следующие объекты: Кга есть п-мерное евклидово пространство с нормой | ■ | и скалярным произведением х ■ у.
Пусть X — топологическое пространство. Его топологически сопряженное обозначаем через X*. Как правило, последнее будет оснащено слабой* топологией а(Х*, X).
C(X; Y) есть пространство непрерывных отображений X — Y; если Y = R, пишем C(X); Cc(Rn), Cl (Rn) и Cc°°(Rn) - пространства непрерывных, непрерывно дифференцируемых и гладких функций с компактным носителем в Rn соответственно.
M(Rn) есть пространство конечных знакопеременных борелевских мер на Rn. Действие меры у на интегрируемую функцию р обозначаем
как (у, р) = ЕДр) = J р^у, где J = J ; Mi(Rn) есть подпространство мер у с конечным первым моментом mi (у) = J |x| ^|у| < то. На
пространстве M(Rn) определяем две нормы: норму полной вариации 1|у|| = У+ (Rn) + У-(Rn), где у± — компоненты разложения Жордана, и норму Канторовича-Рубинштейна
||у||к = sup {(у,р) : р € Cb(Rn), max{|p|, Lip(p)} < 1} ,
где Lip — наименьшая константа Липшица соответствующей функции. Для борелевского отображения F: Rn — Rn через F^y записываем образ F^y = у о F-1 € M(Rn) меры у € M(Rn) под действием F.
Символом Ln обозначаем меру Лебега на Rn, а через Sx — атомическую меру Дирака, сконцентрированную в точке x. Сокращение «п. в.» означает «почти всюду (почти всех) с точки зрения Ln».
L1 (I; Rn) и L^(I; Rn) есть пространства Лебега классов эквивалентности измеримых суммируемых (относительно Ln) и существенно ограниченных функций с соответствующими нормами.
Имея дело с функциями многих переменных, будем опускать зависимость от «свободных» аргументов. Например, функцию f = f (x, y, z) при фиксированном y запишем как f (y). Особую роль играет переменная времени t; зависимость от нее будем обозначать нижним индексом.
2.2. Постановка задачи
Обозначим для краткости X = (M1 (Rn), || ■ ||K). Пусть заданы отображения £: Rn — R, f: IxRnxU — Rn, g: IxRnxU — R и h: IxU — X, число T > 0, мера $ € X и множество 0 = U С Rm. На фиксированном отрезке времени I = [0, T] рассмотрим задачу оптимального управления в стандартной форме:
(LP) I[u] = (ут[u], £) = E№£ — inf, dtу + Vx ■ (ft (ut) у) = gt(%)у + ht(ut) при п. в. t € I; уо = (2.1)
u € U. (2.2)
Пространство X играет роль множества фазовых состояний, которыми выступают знакопеременные борелевские меры у^ траекториями являются непрерывные кривые у: t — у^ I — X.
Класс и = Ьж(1; и) допустимых управляющих воздействий составлен из измеримых функций и: Ь — и4, I — Кт, принимающих значения в множестве и. Заострим внимание на том, что функции и не зависят от позиции х. В теории управления мультиагентными системами подобные постановки принято относить к так называемым задачам управления ансамблями траекторий (или же задачам «широкополосного» управления системами с неопределенным начальным условием): если интерпретировать меру ^ как закон распределения ансамбля однотипных точечных объектов (или соответствующего случайного состояния), то управления класса и действуют на все такие объекты одинаково. Очевидно, что на практике подобные широкополосные воздействия реализовать гораздо легче, чем «управления средним полем» вида и = и4(х) (см. дальнейшее в [23; 28;29]).
Сделаем следующие стандартные предположения:
(А1) £ €Р = С1(Еп).
(А2) Функция /: I х К" х и — К" измерима по Ь, непрерывна по (х,и), непрерывно дифференцируема по х и удовлетворяет условию сублинейного роста по х.
(А3) д: I х К" х и — К измерима по Ь, непрерывна по (х,и), непрерывно дифференцируема по х и имеет компактный носитель.
(А4) Для всякого борелевского подмножества А С К" функция (Ь, и) — Н4(и, А) измерима по Борелю, и J ||Н;(и4)|| йЬ < Vи € и.
Заметим, что условие на носитель функции £ в (А1) может быть заменено требованием компактности носителя меры
Решение ^ = ^[и] формальной задачи Коши (2.1) понимается в смысле распределений: для любой пробной функции ^ € С£°(Кга) и п. в. Ь € I выполнено равенство
й
= = ■ ЛЫ +9г(щ)<р) + {Ы(щ),(р} , (2.3)
и справедлив предельный переход Иш =
По аналогии с [1, замечание 2.3] класс тест-функций может быть расширен до множества С,} (К").
Предположения (А1)-(А4) гарантируют [24, теорема 1] существование единственного непрерывного решения задачи Коши (2.1). Там же показано, что в случае аффинной зависимости функций /, д и Н от переменной управления оператор и — ^[и] непрерывен как и — С^; X), где и снабжено топологией а(Ь^, ¿1), а С(I; X) — равномерной нормой.
Для краткости удобно записать условие (2.3) в терминах семейства (t, и) ^ Lt(u) неограниченных линейных операторов
Lt(u) р = Vp ■ vt(u) + gt(u) р,
определенных при каждом и € U ип.в. t € I на общем множестве D(Lt(u)) = C:(Rn) DD:
d
{дф, p) = V) = ißt, £{щ) V) + (Hut), p) п. в. на I.
Заметим, что формально сопряженным к Lt(u) выступает оператор
L*(и) ß = -Vx ■ (ft(u) ß) + gt(u) у,
и уравнение (2.1) может быть (опять же формально) записано в виде
dtß = L*(ut) ß + h(u). (2.4)
Последнее имеет вполне строгий смысл, если под переменной ß понимать не меру, а ее достаточно гладкую плотность относительно Ln (при условии, что начальная мера $ такой плотностью обладает, а операторы в правой части достаточно регулярны); в таком случае, и если G = 0 и h = 0, приведенное выражение представляет собой уравнение Лиувилля, знакомое из классической гидродинамики.
3. Вспомогательные факты. Принцип Понтрягина 3.1. Представление решения. Сопряженная траектория
Обозначим через Ф: ж) ^ Ф«Дж) поток (оператор Коши) неавтономного векторного поля / = /¿(ж), I х ^ . Иными словами, Ь ^ Ф8Дж) есть решение обыкновенного дифференциального уравнения
у = Л(у); У(«) = ж- (3.1)
Напомним, что (при стандартных предположениях регулярности) поток Ф обладает групповым свойством
Фз,г ◦ Фг,5 = Фг,4, Ф^ = id Vт,в,Ь € /, (3.2)
в частности, отображение ж ^ Ф«Дж) обратимо, и Ф-1 = Ф4,8.
Предложение 1. Пусть выполнены условия (А)-(А4), Н = 0, и € и, /¿(ж) = /¿(ж,и^), и ^¿(ж) = д^(ж,и^). Тогда 'решение у уравнения баланса допускает представление
ßt = exp
где Ф — поток векторного поля f.
I gs о Фм ds
(3.3)
Доказательство. Мера, определенная равенством (3.3), действует на пробную функцию € С,} (К") следующим образом:
<№,V> = J V(x)exp
gs о ds
= J V о $o,i(x)exp J gs о $o,s(x) ds
d$(x) .
В силу гипотез (А1)-(А4) правая часть этого выражения дифференцируема по времени при п. в. Ь, и
й
d
^i, У) = Щ (Фо,*(ж)) • ft (Фо,*(ж)) ехр
^У v ($o,t(x))exp J gs (Фо,*(ж)) ds = J Vv (x) ■ ft (x) exp Jgs (Фм(ж))
+ J V (x) exp J gs (Фt,s(x)) ds
gs (ФоДх)) ds
d$(x)
gt (Фo>t(x)) dtf(x)
ds
dФo,tв^(x)
gt (x) dФo,tв^(x)
= <^t, Vv ■ ft + gt V> п. в. на I, что и требовалось доказать.
□
Рассуждая аналогично, приходим к следующему представлению решения задачи Коши (2.1) в общем неоднородном случае (Н = 0):
^t = exp
gs о Фм ds
Фo,tfl $ + J exp
gr о Ф^г dr
^s,tflhs) ds.
Более того, пусть п € С(I х К"), причем п* € С,1 (К") для всех Ь € I, и функция Ь — п*(х) абсолютно непрерывна при каждом х € К". Тогда справедлива формула дифференцирования:
d_ dt
<^t,nt> = <^t,dtn + Vxn ■ ft + gt П> + <ht,V> при п. в. t € I. (3.4)
Из последнего выражения очевидно, что если p = p[u] — достаточно регулярное решение уравнения
{dt + Lt(ut)}p = dtp + VxP ■ ft + gt p = 0, (3.5)
отвечающее тому же управлению u € U, что и ^ = ^[u], то
d
— {¡j,t,Pt) = (ht(ut),pt) при п. в. i € /.
(3.6)
Это наблюдение позволяет трактовать функцию р как траекторию, сопряженную к
Предложение 2. Пусть выполнены условия предложения 1. Тогда функция р: I х — К, определенная равенством
Pt(x) = exp
rT
(gs ◦ Фм)(ж) ds
(C ◦ $i,T)(x),
(3.7)
является решением сопряженного уравнения (3.5) с терминальным условием рт =
Доказательство. Из дифференцируемости функций /, £ и д по х следует соответствующая дифференцируемость функции р, а из измеримости / и д по £ вытекает, что р абсолютно непрерывна по Следовательно, композиция р* о Ф0,4 дифференцируема по £ п. в. на I. Пользуясь групповой структурой потока Ф, представим эту композицию в виде
Pt ◦ $0,t = exp
T
gs о Фо,5 ds
C о Фо,т.
Тогда дифференцирование по t дает
d
{dtp + Vxp ■ ft} о $0,t = = - (gtPt) о Фо,4-
Поскольку Фо^ гомеоморфно отображает в себя, заключаем, что p есть решение уравнения (3.5). Остается заметить, что Рт = П
t
t
3.2. Первая вариация функционала. Принцип ПонтрягинА
В данном пункте мы ограничимся случаем Н = 0 и предположим, что от управления зависит лишь векторное поле /. Заметим, что даже при таком сужении формулировка принципа Понтрягина (ПМП) в задаче (£Р) не представлена в известной нам литературе.
Зафиксируем произвольное управление и € и и будем, как и выше, сокращать: /¿(х) = /¿(х,и). Рассмотрим неавтономное векторное поле ш = : I х — удовлетворяющее тем же условиям регулярности и роста, что и / = /¿, и определим /л = / + Лш, Л € К. Пусть — решение соответствующего полю /л уравнения баланса
<9^ + ■ (/¿V) = д^, ^о =
Справедливо
Предложение 3. Целевая функция дифференцируема по Л вдоль возмущенной траектории в точке Л = 0, и
dA
= J (yt, Vpt ■ wt) dt. (3.8)
Доказательство. 1) Обозначим через Ф^* поток векторного поля /Л. Такой поток дифференцируем [23] по Л в точке Л = 0, причем й г
7Т фоДж) = / ОФ8^{Ф0,8(х))и>8{Ф0>8(х))<18 (3.9)
ЙЛ Л=0 ]I
при всех х € К" и Ь € I.
2) Пользуясь представлением (3.3), продифференцируем целевой функционал вдоль возмущенной траектории:
Ж
где
I с^т = 4-
л=о / йл
Л=0
Е^ £(Фо,т) ехр
£ д5 (Фо>в) Йв
= 7 + ^2,
71 = | ехр
72 = Е^ ехр
д5 (Фо,з) Йв
(Фо,т) ■
ЙЛ
Л=0
ФЛ^ и
д5 (Фо,^) Йв
£(Ф0,т) ]
Л=0
ФЛ,
Отсюда и из представления (3.9) находим 71 = < ехр
= у Е^ ехр
= JI Еми ехр
/ д5 (Фо>в) Йв £ д5 (Фо>в) Йв £ д5 (Фм) Йв
V£ (Фо,т) ■ J (Фо,*) ад* (Фо,*) ЙЬ V£ (Фо,т)* (Фо,*) ад* (Фо,*П ЙЬ
V£ (Ф*,т)* ■ адЛ ЙЬ,
где звезда обозначает матричное транспонирование. С учетом выражения для производной потока второе слагаемое принимает вид
72 = Е^ ехр
£ (Фо,т) 7з ^ , где
д5 (Фо,^) Йв
7з = £ ^ Vgs (Фо,)* ЯФм(Фо,*) ад*(Фо,*) ЙЬ Йв.
Поскольку 7з суть двойной интеграл функции переменных (Ь, 8) по треугольнику А = {(Ь, в) : Ь < 0 < 8 < Т, 0 < Ь < Т}, он может быть переписан в виде
7з = Ц Vgs (Фо,)* ^Ф*,5(Фо,*) ад*(Фо,*) Йв ЙЬ.
Далее, как и в случае с 71, поменяем порядок интегрирования по $ и ЙЬ, и вернемся в термины меры воспользовавшись формулой представления (3.3):
72 = J Е^ |ехр £ д5 (Фм) Йв £ (Ф*>г) £ Vgs (Фм) £ФМЙвад4| ЙЬ.
й
3) Для получения искомой формулы (3.8) остается продифференцировать функцию (3.7) по пространственной переменной:
Vpt(x) = exp
rT
rT
gs ($м(ж)) ds
+ exp
gs ($t,s(x)) ds
D$t,T (x)*V£ (Ф4,т (x))
T
С (Ф*,т(x)) J D$M(x)*Vgs (Фм(х)) ds,
и сравнить результат с итоговыми выражениями для 71 и 72. Следствием предложения 3 является
□
Теорема 1 (ПМП). Пусть (Д, U) - оптимальный процесс задачи (LP), p — соответствующая сопряженная траектория, и выполнены условия предложения 3. Тогда справедливо равенство
min (д4, {Lt(u) - Lt(Ut)} p»t) = 0 при п. в. t € I.
Теорема 1 содержит необходимое условие оптимальности в классе игольчатых вариаций управления — вариант ПМП для задачи (LP) (в форме принципа минимума). Ее доказательство опирается на предложение 3 и проводится по аналогии с [23, теорема 2].
В следующем пункте мы получим еще одно необходимое условие оптимальности, независимое от теоремы 1 и в определенных случаях усиливающее последнюю.
t
t
4. Точные формулы приращения. Позиционный принцип оптимальности
4.1. Формулы приращения
Зафиксируем два произвольных управления и, и € U и примем следующую систему сокращений: зависимость от управления U будем передавать с помощью черты, а зависимость от и — опускать, к примеру, v = v|ü и д = д[и].
Рассмотрим приращение АХ = I — Х целевого функционала задачи (LP) на паре (и, U). Пользуясь свойством (3.6) (при и = U), представим это приращение в следующем виде:
A J = (дт - Дт, £) = (дт - Дт, Рт) - (До ~ fio, Ро\
= о
= {¡1т,Рт} - {fio,Po} - J (ht,pt) dt = j^{iit,Pt)dt - J (ht,pt) dt,
где производная под знаком интеграла вычисляется по правилу (3.4): й
¿¿(^Р*) = + СУр) + ЦЪ'Ш) ■
Применив простое преобразование (где мы имеем в виду линейность всех операторов) {д; + £}ро = {£ —£}ро + {д; + ро = {£ — £}ро и
4 =о '
обозначив
Я;(д,р,и) = (д, £4(и) р) + (й;(и),р), (4.1)
приходим к искомому представлению
А! = ^ [Я4(д*,рр4,%) - Я4(д4,&,£*)] (4.2)
Заметим, что определенный выше функционал Я выступает аналогом классической функции Гамильтона - Понтрягина. Другое важное замечание состоит в следующем: формула (4.2) — точная (не имеет остаточных членов) и нелокальная (справедлива для любой пары допустимых управлений). Наконец, поменяв ролями управления и и и, получим симметричное выражение:
А! = - J [Я;(Д;,р4,и4) - Я;(Д;,р4,и4)]
Дальнейший анализ будет опираться на представление (4.2). Обсудим, как извлечь из этого представления необходимое условие глобального минимума и как применить последнее для (приближенного) решения задачи (£Р).
4.2. Позиционное необходимое условие оптимальности
Пусть управление и задано и подлежит проверке на оптимальность. Попробуем установить обратный факт — не оптимальность и, т. е. предъявить управление и € и со свойством А! < 0. Если этого не удается сделать в некотором конструктивно определенном классе 5 [и] С и вариаций управления и, то последнее помечается как экстремальное. При такой интерпретации класс 5 [и] определяет не только необходимое условие минимума, но и метод спуска по функционалу задачи (£Р).
Введем сокращение Я; = Я| __ . Предположим, нам удалось подобрать процесс (д = д[и],и) со свойством:
Я;(д;, и;) = шт Я;(д;,и) при п. в. £ € I. (4.3)
Ясно, что в этом случае А! < 0, и если и оптимально, то с необходимостью А! = 0. Более того, поскольку при условии (4.3) подынтегральное
выражение в (4.2) неположительно, справедливо
Нг(ц.г,щ) = тт И^,щ) = ,щ) при п. в. г € I. (4.4)
Управление и назовем опорным, а и — управлением сравнения (с и). В качестве фигурирующего выше класса 5 [и] выберем множество всех управлений сравнения. Теперь очевиден следующий результат.
Теорема 2 (Позиционное условие оптимальности). Пусть выполнены предположения (Л1)-(Л4), и управление и оптимально в (ЬР). Пусть при этом и € 5[и]. Тогда и удовлетворяет условию (4.4), и АI = 0.
Первая часть этого утверждения отдаленно напоминает классический принцип Понтрягина (ПМП). Однако в ней, наряду с (заданным) тестируемым управлением, задействованы (неизвестные) управления сравнения, которые нужно предварительно найти из условия (4.3). Поскольку в последнем фигурирует кривая у = у[и], его следует воспринимать как некоторое операторное уравнение на функцию и. Разумеется, чтобы наше условие имело смысл, необходимо располагать хотя бы одним решением этого уравнения. Убедимся, что класс 5[и] не пуст по крайней мере в частной билинейной постановке.
Теорема 3. Предположим, выполнены условия (Л1)-(Л5). Тогда операторное уравнение (4.3) имеет хотя бы одно 'решение в классе и.
Доказательство. Сначала отметим, что множество и выпукло и компактно в топологии ¿1) по теореме Банаха - Алаоглу [6, теорема 3, с. 13]. Определим функционал Ш: и х и 4 К и многозначное отображение М: и ^ и выражениями
Ш [и,у] = / (И и М [и] = \у €и: Ш [и,у] = М Ш [и,ы]
.]I I
Напомним, что в предположениях теоремы функционал Ш непрерывен в топологии произведения и линеен по второму аргументу. Отсюда следует, что М полунепрерывно сверху [6, теорема 6, с. 53] и его значения суть выпуклые подмножества и. Применяя классическую теорему о неподвижной точке Какутани - Фана [6, следствие 1, с. 85], заключаем, что существует и € и со свойством: и € М[и].
Обозначим щ(и) = ¿/¿(^[й], и), а = тти приведем очевидную оценку
/ Й^рг[и],щ) (г = и / щ(щ) (г > тт Щ (рг[и],ь) = / а (г. Л }1 }1 у&и }1
Поскольку функция п непрерывна на I х и, и а € щ(и) при п. в. г € I, то согласно лемме Филиппова [7, теорема 8.2.10] найдется такая функция и € и, что а = п ◦ и. Таким образом, в приведенной оценке имеет место точное равенство, и й — искомое решение (4.3). □
Как применять теорему 2 на практике? В самой структуре уравнения (4.3) заложен определенный механизм обратной связи, ведь для его решения нужно «одновременно» определить управление u и соответствующую траекторию д[и]. Это наблюдение можно использовать для (приближенного) вычисления управления сравнения: фиксируя (t, v) € I х X, найдем w = wt[v] как решение задачи
Hit(v, wt[v]) = min Hit(v, и). (4.5)
ueU
Функция w может служить позиционным управлением системой (2.1). Если после ее подстановки в (2.1) удается корректно определить решение д = д^], то композиция и = w о д, очевидно, будет искомым элементом S[и]. Однако уже в простейших случаях обратная связь w оказывается разрывной по v, и ее формальная подстановка в закон баланса дает некорректное уравнение, решение которого в смысле (2.3) не определено или не единственно. Эту проблему можно преодолеть по аналогии с [28], приняв неклассическое понятие решения — по типу конструктивного движения Красовского - Субботина. Мы опустим дальнейшие детали этого подхода, который не содержит принципиальных отличий от его оригинальной версии [20].
Сказанное выше проясняет использование эпитета «позиционное» применительно к сформулированному принципу оптимальности. Хотя, будучи записанным в форме теоремы 2, этот принцип не вполне удобен для аналитического исследования опорного процесса, его многократное (итеративное) применение приводит к концептуальному алгоритму последовательных приближений, свободному (в отличие от методов «градиентного» типа на основе принципа Понтрягина [27]) от каких-либо параметров «глубины» или «шага».
4.3. ЧИСЛЕННЫЙ МЕТОД
Ниже предполагаем, что задача (4.5) решена предварительно (аналитически), и проведена селекция одного из ее решений w.
Алгоритм спуска (k-я итерация).
Дано: uk € U.
Найти: ufc+1 € U такое, что I[ufc+1] < I[uk]. Итерация:
1. Решение сопряженного уравнения (3.5) в обратном времени:
:= p[uk].
2. Решение уравнения (2.1) с обратной связью w^ [д] € argmin (v, и)
ueu
в прямом времени: дй+1 := ].
3. Синтез нового приближения: uk+1 := w^[ßk+1]-
Алгоритм порождает монотонную по функционалу последовательность допустимых управлений, а значит, сходится (по меньшей мере) по невязке 0 < E[ufc+1,ufc] = I[uk] — I[ufc+1] ^ 0 (в частности, условие E [uk+1,uk] < e с заданной точностью е > 0 служит разумным критерием остановки метода). По аналогии с [28], в случае аффинной зависимости от управления, можно предполагать слабую* сходимость подпоследовательности соседних значений (uk+1,uk) к «позиционной экстремали» — паре (u, u), удовлетворяющей теореме 2. Анализ этого и других свойств алгоритма, а также его апробация в серии вычислительных экспериментов станут предметом отдельного исследования.
Отметим, что точные формулы приращения функционала и нелокальные алгоритмы спуска, подобные представленному, получены ранее для задач управления классическими и некоторыми частными (отличными от исследуемого) классами распределенных систем (см., например [3-5; 13; 25; 27]).
4.4. ПРИМЕР
Проиллюстрируем modus operandi изложенного подхода (шаг алгоритма спуска) на примере следующей одномерной постановки:
I [u] = (ßb£) ^ min, £ (ж) = ж2/2; |u| < 1;
dtß + ut dxß = —utß, t € [0,1]; ß0 = $ >- 0. В силу (3.3) решение t ^ ßt уравнения баланса определяется действием
(ßi,p) = exp ^ — Jus ^^^У p ^ж + Jus ds^ d$(x), p € C^R).
Поскольку начальная мера $ положительна, абсолютный минимум I = 0 достигается на мерах вида ß1 = c£0, c > 0. Ясно, что для решения задачи следует: а) организовать максимально интенсивный отток массы на протяжение всего периода управления; б) сконцентрировать терминальную массу в минимально возможной окрестности нуля.
Чтобы связь позиционного принципа и ПМП была более наглядной, изучим случай $ = ¿y, y € R, при котором поставленная задача эквивалентна классической нелинейной постановке
У2(1)z(1)
2 N - ^ У = и> 2/(0) = у; z = -uz, 2(0) =1.
ПМП дает здесь следующее условие оптимальности процесса (y,z, u): и = sgnj^-j^- — у(1)} (sgna = а/\а\ для а ф 0, и sgnO € [—1,1]), которое
после несложного анализа позволяет найти структуру решения:
Л иг (г = тт{—у, 1}, у < 1, и = ~ 1, У € (1) §~[]>
и = 1,
Заметим при этом, что управление и = 1 экстремально при всех у > 1 (хотя и не оптимально при у € (1, Кроме того, при у = 2 имеется
еще одна, особая неоптимальная экстремаль: и = 0.
Рассмотрим последний случай и применим к управлению и позиционный принцип оптимальности. Вычисляя
Д = р = £; Щ(д,и)=и (д, Чхр — р) = и [х — х2/2] (д(х),
находим позиционное управление: -г[д] = sgn [х2/2 — х] (д(х). При
8§п 0 = —1 построенный синтез порождает оптимальное управление и = —1. Таким образом, позиционный принцип отбраковывает неоптимальную экстремаль, причем при удачной инициализации обратной связи решение находится за один шаг алгоритма спуска.
На самом деле, отбраковка управления и имеет место при любом значении у = 0 и всяком выборе sgn 0 = 0. Например, при у = 2 и sgn 0 = 1 единственным управлением сравнения оказывается другая неоптимальная экстремаль, которая, однако же, лучше опорной по функционалу: Х[и = 1] = ^ < 2 = 1[й]. При выборе последней в качестве опорного управления улучшение отсутствует в диапазоне значений параметра |у| > 1 (позиционный принцип не бракует неоптимальную экстремаль), а при | у| < 1 соответствующий синтез порождает одно из решений: и(г) = —1 для у + 1 — 2г> 0, и и(г) = 1 иначе.
Аналогичные рассуждения справедливы и для общего случая
€ М1(К), >- 0. При этом роль точки у будет играть барицентр меры
Видим, что в приведенном примере теорема 2 существенно усиливает ПМП (хотя и не при всех начальных данных).
5. Заключение
Настоящая статья является, по-видимому, первой работой по необходимым условиям оптимальности для задач управления неконсервативными транспортными уравнениями в пространстве знакопеременных мер. Как мы предполагаем, изложенный здесь подход на основе точных формул приращения может быть распространен на общую задачу (с нелокальным векторным полем и нелинейным источником) посредством погружения последней в абстрактную линейную постановку.
18
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11
12
13
14
15
Е. В. ГОНЧАРОВА, Н. И. ПОГОДАЕВ, М. В. СТАРИЦЫН References
Ambrosio L., Gigli N., Savare G. Gradient Flows: In Metric Spaces and in the Space of Probability Measures. Lectures in Mathematics ETH Zurich. Birkhauser, Boston, 2005.
Ambrosio L., Mainini E., Serfaty S. Gradient flow of the Chapman-Rubinstein-Schatzman model for signed vortices. Ann. Inst. H. Poincaré Anal. Non Linéaire, 2011, vol. 28, no. 2, pp. 217-246. https://doi.org/10.1016/j.anihpc.2010.11.006
Antonik V.G., Srochko V.A. The projection method in linear-quadratic problems of optimal control. Comput. Math. Math. Phys. 1998, vol. 38, no. 4, pp. 543-551. [Transl. from Russian (Zh. Vychisl. Mat. Mat. Fiz., 1998, vol. 38, no. 4, pp. 564572)]
Arguchintsev A.V., Dykhta V.A., Srochko V.A. Optimal control: nonlocal conditions, computational methods, and the variational principle of maximum. Russian Math.. 2009, vol. 53, no. 1, pp. 1-35. https://doi.org/10.3103/S1066369X09010010
[Transl. from Russian (Izv. Vyssh. Uchebn. Zaved. Mat., 2009, no. 1, pp. 3-43)] Arguchintsev A.V., Poplevko V.P. Optimal control of initial conditions in canonical hyperbolic system of the first order based on nonstandard increment formulas. Russian Math., 2008, vol. 52, no. 1, pp. 1-7. https://doi.org/10.3103/S1066369X08010015
[Transl. from Russian (Izv. Vyssh. Uchebn. Zaved. Mat., 2008, no. 1, pp. 3-10)] Aubin J. P., Cellina, A. Differential Inclusions. Set-Valued Maps and Viability Theory. Springer-Verlag, Berlin-Heidelberg-New York-Tokyo, 1984. Aubin J. P., Frankowska H. Set-valued Analysis. Set-Valued Analysis. Birkhauser, Boston, 1990.
Averboukh Y. Nonlocal Balance Equation: Representation and Approximation of
Solution. J. Dyn. Diff. Equat., 2024.
https://doi.org/10.1007/s10884-024-10373-8
Averboukh Y., Khlopin D. Pontryagin maximum principle for the deterministic mean-field type optimal control problem via the Lagrangian approach, 2022. https://doi.org/10.48550/arXiv.2207.01892
Bongini M., Fornasier M., Rossi F., Solombrino F. Mean-field Pontryagin maximum principle. J. Optim. Theory Appl., 2017, vol. 175, pp. 1-38. https://doi.org/10.1007/s10957-017-1149-5
Bonnet B. A Pontryagin maximum principle in Wasserstein spaces for constrained optimal control problems. ESAIM Control Optim. Calc. Var., 2019, vol. 25, no. 52. https://doi.org/10.1051/cocv/2019044
Bonnet B., and Frankowska H. Necessary optimality conditions for optimal control problems in Wasserstein spaces. Appl. Math. Optim., 2021, vol. 84, pp. 1281-1330. https://doi.org/10.1007/s00245-021-09772-w
Buldaev A.S. Projection procedures for the nonlocal improvement of linearly controlled processes. Russian Math.. 2004, vol. 48, no. 1, pp. 16-22. [Transl. from Russian (Izv. Vyssh. Uchebn. Zaved. Mat., 2004, no. 1, pp. 18-24)] Cardaliaguet P., Delarue F., Lasry J.-M., Lions P.-L. The master equation and the convergence problem in mean field games. Ann. Math. Stud., 2019, vol. 201, Princeton University Press, Princeton, NJ.
Carrillo J. A., Fornasier M., Toscani G., Vecil F. Particle, kinetic, and hydrodynamic models of swarming. In Mathematical modeling of collective behavior in socio-economic and life sciences. Birkhauser, Boston, MA, 2010, pp. 297-336. https://doi.org/10.1007/978-0-8176-4946-3_12
16. Colombo R.M., Herty M., Mercier M. Control of the continuity equation with a non local flow. ESAIM Control Optim. Calc. Var., 2011, vol. 17, no. 2, pp. 353-379. https://doi.org/10.1051/cocv/2010007
17. Cristiani E., Frasca P., Piccoli B. Effects of anisotropic interactions on the structure of animal groups. Journal of mathematical biology, 2011, vol. 62, pp. 569-88. https://doi.org/10.1007/s00285-010-0347-7
18. Cucker F., Smale S. Emergent behavior in flocks. IEEE Trans. Autom. Control, 2007, vol. 52, no. 5, 852-862. https://doi.org/10.1109/TAC.2007.895842
19. Dykhta V.A. Feedback Minimum Principle: Variational Strengthening of the Concept of Extremality in Optimal Control. The Bulletin of Irkutsk State University. Series Mathematics, 2022, vol. 41, pp. 19-39. (in Russian)
https://doi.org/10.26516/1997-7670.2022.41.19
20. Krasovskii N.N., Subbotin A.I. Game-Theoretical Control Problems, Springer Verlag, Berlin, 1988.
21. Mainini E. On the signed porous medium flow, Netw. Heterog. Media, 2012, vol. 7, no. 3, pp. 525-541. http://cvgmt.sns.it/paper/1902/
22. Piccoli B., Rossi F. Measure-theoretic models for crowd dynamics. In Modeling and Simulation in Science, Engineering and Technology. Springer, Basel, 2018, pp. 137-165. https://doi.org/10.1007/978-3-030-05129-7_6
23. Pogodaev N. Program strategies for a dynamic game in the space of measures. Optim. Lett., 2019, vol. 13, pp. 1913-1925.
https://doi.org/10.1007/s11590-018-1318-y
24. Pogodaev N., Staritsyn M. Nonlocal balance equations with parameters in the space of signed measures. Sbornik: Mathematics, 2022, vol. 213, no. 1, pp. 69-94. https://doi.org/10.1070/sm9516
25. Pogodaev N.I., Staritsyn M.V. Exact formulas for the increment of the objective functional and necessary optimality conditions, alternative to Pontryagin's maximum principle. Matematicheskii Sbornik, 2024, vol. 215, iss. 6, pp. 77110. https://doi.org/10.4213/sm9967 (in Russian, to appear in Sbornik Mathematics)
26. Pontryagin L.S., Boltyanskii V.G., Gamkrelidze R.V., Mishchenko E.F. The Mathematical Theory of Optimal Processes. New York, John Wiley and Sons, Inc., 1962. [Transl. from Russian (Fizmatgiz, Moscow, 1961)]
27. Srochko V.A. Iterative methods for solving optimal control problems. Fizmatlit, Moscow, 2000 (in Russian).
28. Staritsyn M., Pogodaev N., and Lobo Pereira. F. Linear-quadratic problems of optimal control in the space of probabilities. IEEE Control Systems Letters, 2022, vol. 6, pp. 3271-3276. https://doi.org/10.1109/LCSYS.2022.3184257
29. Staritsyn M.V., Pogodaev N.I., Goncharova E.V. Pontryagin's Maximum Principle and Indirect Descent Method for Optimal Impulsive Control of Nonlocal Transport Equation. The Bulletin of Irkutsk State University. Series Mathematics, 2023, vol. 46, pp. 66-84. (in Russian) https://doi.org/10.26516/1997-7670.2023.46.66
Об авторах Гончарова Елена Владимировна, канд. физ.-мат. наук, доц., вед. науч. сотр., Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, 664033, Российская Федерация, [email protected], https://orcid.org/0000-0002-2371-655X
Погодаев Николай Ильич, канд. физ.-мат. наук, вед. науч. сотр., Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, 664033, Российская Федерация, [email protected], https://orcid.org/0000-0002-7062-1764
Старицын Максим Владимирович, канд. физ.-мат. наук, вед. науч. сотр., Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, 664033, Российская Федерация, [email protected], https://orcid.org/0009-0008-4935-579X
About the authors Elena V. Goncharova, Cand. Sci. (Phys.-Math.), Leading Researcher, Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, 664033, Russian Federation, [email protected], https://orcid.org/0000-0002-2371-655X
Nikolay N. Pogodaev, Cand. Sci. (Phys.-Math.), Leading Researcher, Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, 664033, Russian Federation, [email protected], https://orcid.org/0000-0002-7062-1764
Maksim V. Staritsyn, Cand. Sci. (Phys.-Math.), Leading Researcher, Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, 664033, Russian Federation, [email protected], https://orcid.org/0009-0008-4935-579X
Поступила в 'редакцию / Received 13.05.2024 Поступила после рецензирования / Revised 17.09.2024 Принята к публикации / Accepted 23.09.2024