Онлайн-доступ к журналу: http: / / mathizv.isu.ru
Серия «Математика»
2018. Т. 25. С. 46-62
УДК 517.977.5 МЭС 93С10, 93С23
Б01 https://doi.org/10.26516/1997-7670.2018.25.46
Позиционный принцип минимума для импульсных процессов *
В. А. Дыхта
Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, Российская Федерация
О. Н. Самсонюк
Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Иркутск, Российская Федерация
Аннотация. Рассматривается задача минимизации терминального функционала на траекториях ограниченной вариации импульсной билинейной системы, управляемой неотрицательной векторной борелевской мерой при ограничениях на ее полную вариацию. Эта задача является релаксационным (импульсно-траекторным) расширением соответствующей классической задачи оптимального управления, в которой оптимальное измеримое управление, как правило, не существует. Никаких предположений корректности импульсного расширения не делается, так что каждой допустимой управляющей мере может соответствовать пучок возможных траекторий; индивидуальная траектория этого пучка выделяется с помощью метода разрывной замены времени; этим же методом задача импульсного управления редуцируется к обычной.
Цель статьи состоит в доказательстве нового нелокального необходимого условия оптимальности для импульсных процессов, которое базируется на использовании позиционных управлений спуска по функционалу. Это необходимое условие названо позиционным принципом минимума, оно обобщает соответствующий одноименный критерий для классических задач оптимального управления Позиционный принцип минимума формулируется в рамках конструкций обобщенного принципа максимума для импульсных процессов и является его усилением. Эффективность нового условия иллюстрируется примером.
Ключевые слова: импульсное управление, траектории ограниченной вариации, позиционное управление, условия оптимальности.
* Работа выполнена при финансовой поддержке РФФИ, грант №17-01-00733
1. Введение
В статье рассматривается задача оптимального импульсного управления (задача (Р)) с траекториями ограниченной вариации и векторной неотрицательной мерой в роли управления; динамика в этой задаче описывается автономной билинейной системой при ее специальной формализации.
Задача (Р) естественно возникает как релаксационное расширение (см., например, [1;5;7;8;12]) следующей классической задачи оптимального управления (задачи (Ро)):
= 1(х(Ь)) —> М, х{Ь) = /(ж(*)) +С(х(г))у(г), х{а)=х о, ¿€Т. (1.1)
€ п. ВС. на Т, (1.2)
[ |К*)||£Й < М. (1.3)
■) а
Здесь отрезок Т = [а, Ь] фиксирован, М — заданное число, х(-) €
т
АС(Т, Г1), <) € Ь°°(Т, Кт), |М| = ^\vj\-Предполагаем, что функция
1
I : Кга ->■ К непрерывна, а / : Р 4 К™ и С : Р К(пхт) локально липшицевы и удовлетворяют условию не более чем линейного роста. В разделе 4 мы будем рассматривать частный случай системы (1.1)—(1.3) с билинейной структурой, добавив предположение на I, /, О.
Для релаксационного (импульсно-траекторного) расширения задачи (Ро), строгого определения импульсных процессов и вариационного анализа задачи (Р) традиционно используется метод разрывной замены времени [7; 11-13; 17; 18; 24; 25]; мы тоже будем использовать его в несколько модифицированном варианте. Достоинство метода разрывной замены времени состоит в возможности редуцировать сложную задачу импульсного управления (Р) к некоторой классической задаче оптимального управления (АР).
Основным необходимым условием оптимальности для импульсных процессов является так называемый обобщенный принцип максимума (см., например, [5; 9-12; 23; 26; 28]). Этот критерий эквивалентен классическому принципу максимума Понтрягина для редуцированной задачи (АР). Целью данной статьи является доказательство необходимого условия оптимальности, которое называется позиционным принципом минимума для импульсных процессов. Позиционный принцип минимума для классических задач оптимального управления (как гладких, так и негладких) без ограничений на траекторию был доказан сравнительно недавно [2-4] и оказался весьма конструктивным и эффективным
критерием и методом итерационного решения задач. В частности, он включает в себя классический принцип максимума Понтрягина, хотя формализуется в рамках этого критерия. Для рассматриваемой в статье задачи импульсного управления (Р) позиционный принцип минимума получается путем применения результатов из [2-4; 6] к редуцированной задаче (АР). Отметим, что этот путь нетривиален, поскольку в задаче (АР) конечное время не фиксировано и есть терминальное ограничение на траекторию (эти особенности отсутствуют в [2-4; 6]); кроме того, понятие позиционного импульсного управления, подходящее для наших целей, в литературе отсутствует, и мы предлагаем одну из возможных формализации. Отметим также работу [27], в которой предлагается другая формализация позиционного импульсного управления для случая скалярной управляющей меры.
Представленное в работе условие оптимальности идейно близко к условиям, относящимся к методу динамического программирования или оцениванию множества достижимости монотонными функциями типа Ляпунова (см., например, [6; 16; 20-22], это список не претендует на охват основных работ по указанным направлениям).
2. Постановка задачи
Пусть /л — ограниченная борелевская мера на Т. Обозначим через /лс, \/л\ и Sd(/JL) непрерывную составляющую в разложении Лебега меры /л, полную вариацию меры ц, и множество, на котором сосредоточена дискретная составляющая /х, т. е. <Sd(/-0 = {s € Т | n({s}) ф 0}, соответственно. Обозначим К\ = {v € R™ | ||f|| = 1}.
Импульсным управлением будем называть пару (/х, =: 7г(/х),
компоненты которой удовлетворяют условиям
1) /л — неотрицательная ограниченная борелевская мера на Т,
2) 7(¡л) — набор {ds,Lüs(-)}s&s, в котором
(а) S = Sd(ii),
(б) для каждого s € S определены ds = ||//({s})|| и измеримая по Лебегу функция ш3 : [0, ds] —> Кудовлетворяющие равенству
rds
/ u)s(r)dT = ß({s}).
Jo
Каждому управлению ir(pi) поставим в соответствие функцию V(°)> за" данную правилом
V(t) = \ß\([a,t}), te(a,b], V(a)= 0. (2.1)
Ограничение на управление 7г(/х) зададим в виде:
V(t) < М. (2.2)
Обозначим через УУ(Т) множество импульсных управлений ir(pi), удовлетворяющих условиям 1), 2) и ограничению (2.2). Рассмотрим импульсную управляемую систему
x(t)=x 0+ Г/И£Ж+ f G(x(i))ßc(di)
Ja Ja
+ {zs(ds) - x(s-)), t£(a,b], x(a)=x0, (2.3)
ses,s<t
-±-L = G{z8(t))u8(t), zs(0)=x(s-), r£[0,ds], ses (2.4)
с управлениями ir(pi) £ УУ(Т). Решения x(-) системы (2.3), (2.4) являются непрерывными справа на промежутке (a, b] функциями ограниченной вариации. Примем для импульсной управляемой системы (2.3), (2.4) формальную запись
dx = f(x)dt + G(x)ir{p), х{а)=х 0, 7г (fi)eW(T). (2.5)
Задача оптимального импульсного управления (Р) имеет вид: требуется минимизировать функционал J = l(x{b)) на множестве импульсных процессов а = (ж(-),7г(/х)), удовлетворяющих (2.5).
Охарактеризуем кратко связь между решениями систем (1.1)—(1.3) и (2.5), а также соответствующими задачами (Ро) и (Р). В начале заметим, что под решением системы (2.5) удобно понимать многозначную функцию Ху : Т —>■ comp (Rra х R+), где через comp (Rra х R+) обозначено множество всех непустых компактных подмножеств из Rra х [R+. Функция Ху задается правилом:
1) для каждого t £ T/S положим Xy(t) = {(x(t), V(t))},
2) для каждого s € S положим Xy(s) = { (zs(t), zys(r)) \ т £ [0,(4]}. Здесь ж(-), Zs(-), s £ S, удовлетворяют (2.3) и (2.4) соответственно, а функция V(-) определена соотношением (2.1).
Далее, дополним систему (1.1)—(1.3) функцией V( ), задающей полную вариацию на отрезке [a,t] для функции w(t) = / v(()d(, т. е.
Ja
m .t
vit) = Y,rAiM-) = / \шш. (2.6)
M Ja
Через Ху = (ж(-),У(-)) обозначим решения системы (1.1)—(1.3), (2.6). Пусть d(A, В) — расстояние Хаусдорфа между множествами А и
В. Обозначим через graph Ху график многозначной функции Ху на
т
отрезке Т, т. е. graphXy = {(t,x,V) \ t £ Т, (х, V) £ Xv(t)}. Тогда т
связь между системой (2.5) и ее прототипом (1.1)—(1.3) устанавливает Лемма 1, непосредственно следующая из результатов [15].
Лемма 1. Многозначная функция Ху : Т comp (Rra х R+) является решением (2.5) тогда и только тогда, когда существует равномерно ограниченная последовательность {-Худ.} решений системы (1.1)—(1.3), (2.6), для которой выполняется
d( graph Ху, graphХуЛ —> 0, к —> оо.
\ J1 71 /
3. Вспомогательная задача
Следуя [6; 13; 25], выпишем для задачи (Р) эквивалентную вспомогательную задачу оптимального управления (АР) с нефиксированным конечным моментом времени:
J = ¿(х(п)) ->■ min, (3.1)
t'(r) = Wo (г), t(0) = а, t(ri) = b, (3.2)
х'(т) = /(x(t))w0(t) + G(x(t))w(t), x(0) = x0, (3.3)
wo(r) > o, üü(t) € R™, (3.4)
Wo(r) + ||w(r)|| = 1 п. ВС. r € [0,n], Ti€[0,g]. (3.5)
Здесь (t(-),x(-)) eAC(T,Rn+l), (uj0(-),uj(-)) € L°°(T,Rm+1), q = b - а + M, штрих означает дифференцирование по переменной т.
Допустимый процесс задачи (АР) обозначим символом р, т. е. р = (т\, t(-), х(-), Wo(-)j w(-)), где компоненты удовлетворяют соотношениям (3.2)-(3.5).
Преобразуем задачу (АР) к задаче на фиксированном промежутке времени. Рассмотрим задачу (ВР):
J = l(y( l))^min, (3.6)
г1'(в) = а(в)щ(в), г](0) = а, г?(1) = Ь, (3.7)
у'(в) = а(в) [¡(у(в))и0(в) + С(у(в))и(в)), 2/(0) = ж0, (3.8)
а(в)е{0;q}, щ(в)>0, v(0) € К™, (3.9)
щ(в) + \\и(в)\\ = 1 п. вс. 6» € [0,1]. (3.10)
Обозначим через g = (г](-),у(-),а(-),иo(-)>K')) допустимый процесс задачи (ВР). Множества всех допустимых процессов в задачах (АР), (ВР) обозначим символами V, Q соответственно. Справедлива следующая лемма.
Лемма 2. Справедливо равенство min J(p) = min J(g).
P&V g&g
Доказательство. Установим связь между множествами допустимых процессов задач (АР) и (ВР) и покажем, что на соответствующих процессах значения функционалов задач равны.
1) Допустимые процессы задачи (АР) очевидным образом вкладываются в (ВР). А именно, пусть р = (n, t(-), х(-), Шо(-), w(-)) € V. В системе (3.7)-(3.10) зададим управление:
Г q, ее [0,ri/i],
щб) = S , ,
I о, ве(п/д,1],
\ 1, ее(п/д,1], \
ш(дв), ве^п/д], О, 0G(ri/i,l]. Тогда соответствующее решение (3.7)—(3.10) удовлетворяет равенствам:
= Г Щв), в € [0,Т1/д], = Г х(^), в € [0,Г1/д],
\Ь, ве(т1/д,1], у[) \х(п), ^(п/дД].
Положим д = (г](-), у(-), ск(-), щ(-), К')) • Тогда д € и выполняется равенство У(р) = 3(д).
2) Пусть д = (г](-),у(-),а(-),ио(-),и(-)) € <?. Зададим функцию
т(0)= [ва(Ж, ^€[0,1], J о
и положим п = т(1). Очевидно, что т(-) — неубывающая липшицевая функция. Рассмотрим псевдообратную функцию т —> в(т) на отрезке [0,т\], заданную правилом
0(0)= 0, в(п) = 1, в(т)=Ы {в е [0,1] \т(в)>т}, Т€(0,п).
Функция в(-) является возрастающей, непрерывной справа на (0, тх] функцией, удовлетворяющей соотношению т(в(т)) = т.
Покажем, что функция т —> а(в(т)) не равна нулю п. вс. на отрезке [0, т\]. Действительно, пусть С [0, т\] — множество всех точек недифференцируемости в(-), а Аг С [0, Т1 ]/А1 — множество всех точек т, таких что функция т(-) недифференцируема в соответствующей точке 9(т). Из возрастания в(-) и липшицевости т(-) следует, что множество А1 У А2 имеет меру ноль. Продифференцируем равенство т(в(т)) = т на множестве [0, т\]/(/^.\ У Д2). Получим
сШ(т) с1т(в)
(1т d0
= 1 => в'(т) • а(в(т)) = 1 п. вс. на [0,п1.
в=в(т) 4 '
Из последнего равенства следует, что
п. вс. на [0,т\].
Определим функции
t(r) = r?(0(r)), х(т)=г/(0(т)),
Wo (т) =щ(в(т)), и(т) =и(в(т)), т€[0,п].
(3.11)
(3.12)
Покажем, что функции, заданные (3.12), удовлетворяют соотношениям (3.2)-(3.5). Условия (3.4), (3.5) выполняются по определению функций cuo('), Покажем, что функции t(-), х(-) липшицевы и удовлетворяют дифференциальным уравнениям (3.2), (3.3).
Пусть ti,72 € [0, ti]. Обозначим 9\ = 9(т\), = 0(т2)- Имеем
|х(т2) - х(п) | = |у(в2) ~ у{вi) |
Гв2
/б?1
m[¡{у(в))мв) + о{у(е))и(в) м
(3.13)
Выберем константу С > 0, обеспечивающую оценку \1{у(в))щ(в) + а{у(в))и(в)\<с. Тогда из (3.13) следует
2
>01
гв2
= С
¡■в 2
|х(г2) -х(п)| < С / a{0)d0
■>вл
гв2 гв1
/ а(в)сШ- / а(в)йв lo Jo
(3.14)
= С 72 - 71 .
Аналогично, для t(-) имеем
|t(r2) -t(n)| = |r?(02) = Г а(д)щ(д)сЮ
<
/01
f& 2
/01 |т2 - 71 I.
(3.15)
Теперь липшицевость функций х(-) следует из (3.14), (3.15) в силу произвольности выбора точек 7"1, т2.
Рассмотрим функцию в —> х(т(0)), положив х(т(0)) = у(0), 0 € [0,1] и доопределив соответствующим образом значения в точках разрыва в(-). Функция в х(т(0)) липшицева как композиция двух лип-шицевых функций. Обозначим Р(т) = бх.{т)/йт. Тогда п. вс. на [0,1] справедливо
<*х(т(0)) йу{в)
(W
(W
Следовательно,
a(0)F(r(0)) = а(в) (f (у(в))щ(в) + С(у(в))и(в)). (3.16)
Подставим в последнее равенство в = 9(т), получим
a(9(r))F(r) = а(в(т))^(у(в(т)))щ(в(т)) + С(у(в(т)))и(в(т))).
Откуда, учитывая (3.12), получим
a(9(r))F(r) = а(в(т))^(ъ(т))щ(в(т)) + G(x(t))í/(0(t))). (3.17)
С учетом (3.11) из (3.17) следует
F(t) = /(x(t))w0(t) + G(x(t))w(t) п. вс. на [0,п].
Отсюда следует, что х(-) удовлетворяет дифференциальному уравнению (3.3). Выполнение (3.2) доказывается аналогично.
Следовательно, процесс р = (т\, t(-), х(-), Wo(-), , состоящий из функций (3.12), принадлежит V, и мы имеем J(p) = J(g)-
Таким образом, каждому д € Q соответствует р € V и наоборот. При этом на соответствующих процессах выполняется равенство J(p) = J(g). Так как в задаче (Р) (и, следовательно, (АР)) минимум достигается, то min J = min J. Лемма доказана. per g£G
4. Позиционный принцип минимума
В этом разделе мы получим необходимое условие оптимальности в форме позиционного принципа минимума для задачи (Р) при дополнительном предположении, что 1(х) = (с, ж), где с € Rra задано, а функции f(x) и G(x) аффинны, т. е.
f(x) = а + Ах, G(x) = схА (hi + Bix)
где a, A, bi, Bi, i = 1 ,m, — постоянные матрицы соответствующей размерностей, а col (G¿) означает описание (п х ш) матрицы G через
m
столбцы Gi = bi + BiX, г = l,m. (Тогда G(x)v = + Bíx)). Обо-
i= 1
значим через (Pi) и (ВPi) задачи (Р) и (BP) с указанной билинейной структурой.
4.1. Позиционное управление
Обозначим через Т(М) множество всех липшицевых функций г](9) : [0,1] —> [а,Ъ], удовлетворяющих условиям:
г]'(в) € [0, q] п.вс. на [0,1], г?(0) = a, r?( 1) = Ъ. (4.1)
Функцию г](•) € Г(М) назовем допустимой реиараметризацией времени для задачи (Pi).
Позиционным управлением назовем набор
и(в,Х]Г](-)) = (r/(-);a(0,x),J/(0,x)),
компоненты которого удовлетворяют соотношениям:
r?(.) е Т(М),
а(в, х) € А(в; г?(-)) = {« € {0; qj | (а - q)rf(6) = 0}, v(9,x) € V(0; г](-)) = {v € R™ | |М| = 1 -rf(d)/q}.
Символом Ы(в; ??(•)) обозначим множество А(0; ??(•)) х V(0; ??(•))• Заметим, что определенное нами позиционное управление соответствует стандартному определению позиционного управления для системы (3.7)-(3.10) при фиксированной репараметризации времени ??(•).
4.2. Позиционный принцип минимума
Пусть а = (х(-), 7г(Т^)) — исследуемый на оптимальность процесс задачи (Pi). Обозначим через д = (rj(-), у(-), а(-), г70(•),77(-)) процесс задачи (ВР\), соответствующий а.
Будем использовать следующие обозначения:
Н(9, у, Ф, а, щ г?(-)) = ф • (f(y)rf(0) + G(y)au),
ф = -Ну(в,у,ф,а,и]г](-)), ) = с. (4.2)
Пусть ф(-) — решение сопряженной системы (4.2), в которой правая часть дифференциального уравнения соответствует а. Введем обозначения:
• ин{0,у,ф]Г](-)) = Argmin Н(в,у,ф,а,1У-,г](-)),
• — множество всех селекторов из у] ??(•)), соответствующих заданной репараметризации времени г?(•) € Т(М) (множество экстремальных позиционных управлений и(0, X] ??('))),
• У (О — множество всех решений Эйлера или Каратеодори, соответствующих £ € Сформулируем позиционный принцип минимума.
Теорема 1. Пусть а — оптимальный процесс задачи (Pi), a g = (rj(-),y(-),a(-), 17о(-),17(-)) — соответствующий процесс вспомогательной задачи (ВР\). Тогда (jj(-),y(-)) доставляют минимум в задаче:
(с,х(1)) ->■ min; V(-)GT(M), у(-) € |J У (и). (4.3)
Доказательство следует из очевидного факта, что функция (р(в,у) = ф(в) (у — у(в)) слабо убывает относительно управляемой системы (3.7)-(3.10). При этом Lp(l,y) = l(y) — l(y(l)). Поэтому на всех решениях Эйлера у(-), соответствующих экстремальным позиционным управлениям, будет выполняться
¥>(1,2/(1)) = l(y( 1)) - l(y( 1)) = 1(х(Ъ)) - 1(х(Ъ)) < 0,
где х(-) — траектория импульсной системы (2.5), соответствующая у(-). В силу оптимальности а и свойств решений Эйлера [19, стр. 186, Corollary 1.12] траектория процесса ~д допустима в задаче (4.3) и, следовательно, доставляет минимум. Доказательство в основных деталях повторяет доказательство аналогичного необходимого условия оптимальности в работах [2-4].
5. Example
Рассмотрим задачу оптимального импульсного управления (Р), являющуюся импульсно-траекторным расширением задачи (Ро)-
J = xi(l) + 2х2(1) - Ах3(1) -Hnf; (5.1)
Xi = l + X2Vi, Ж1(0)=Жю = 1, (5.2)
¿2 = 1 + ^1^2, Х2(0)=Х2О = 1, (5.3)
x3 = Vi+v2, Ж3(0)=0, Жз(1 )<м, (5.4)
vi(t)>0, v2(t)> 0, ¿€[0,1]. (5.5)
Здесь А > 2, М > 0 — заданные числа. В [6] была найдена точная оценка множества достижимости для импульсной системы, соответствующей (5.2)-(5.5) (где функция Хз(-) совпадает с Это множество достижимости в момент £ = ¿1 имеет вид
К(ь) = {рг(и,х1,х2,У) <0, г = 1~4, Уе[0,М}},
= 1, М = 5
Рис. 1. Множество достижимости при I
где функции (р 1, (р2, Рз, ^4 заданы следующим образом:
Х'2 ТЛ , п, XI Х20 +t --V + 2 т-—--—, х2>хг,
, . , Х\ Хю + í Хю +1
--V + 2 т-—--—, х2<хг,
Х2 Х20 + £ Х20 + £
Х1-Хю-1 Х2 Х'20 Ь
V------, Х2>Х\,
/, ТТХ ) Х2 — I Хю
XI, Х2, V) = < , ,
> XI — Х\о — I Х2-Х20-1
V------, Х2<Х\,
Ж 20 Х\—1
(РЗ^,Х\,Х2,У) = -Х\ +Жю + Щ^,Х1,Х2,У) = -Х2 + Ж20
Функции <£>1, (р2, Рз, ^Ра сильно монотонны относительно импульсной управляемой системы и задают точную оценку множества достижимости [6; 14]. Это множество изображено на рис. 1, а его сечение при фиксированном V (следовательно, а?з(1) = V) дано на рис. 2. Учитывая линейность функционала J, легко видеть, что оптимальному процессу задачи (Р) соответствует траектория с терминальным состоянием Ж1(1) = 2+М, Жг(1) = 2, ж3(1) = М. Обобщенному принципу максимума
Рис. 2. Сечение множества достижимости при V = 3, I = 1
(см., например, [5]) удовлетворяют два процесса: а (с указанным выше терминальным состоянием) и а, для которого Ж1(1) = 2, Жг(1) = 2 + М, ж3(1) = М. Заметим, что процесс а соответствует управлению тт(]1) с компонентами: = М5(1), ~р2 = 0, 5 = {0}, <13 = М, ш\ = 1, и2 = 0; а процесс а — управлению ¥(]!): ~Ц1 = 0, ~р,2 = М5(1), 5 = {0}, <13 = М, = 0, ш2 = 1. При этом оба процесса соответствуют репараметризации времени
'0, в € [0,М/(1 + М)],
»?(<?) =
(1 + М)0 - М, в <Е [М/(1 + М), 1].
Применение Теоремы 1 (позиционного принципа минимума) к процессу <т позволяет установить его неоптимальность. Кроме того, экстремальные позиционные управления, порождаемые функцией (р{9, у) = "Ф(@){у с 'Ф(') и ¥(')> соответствующими а, задают направления
спуска по функционалу задачи.
6. Заключение
В статье доказан позиционный принцип минимума для билинейных задач импульсного управления. Это необходимое условие оптимальности дает эффективный метод решения задач указанного класса.
Возможные усиления данного результата могут быть связаны с некоторым расширением множества экстремальных позиционных управлений для достижения спуска с экстремальных процессов (выхода из локального минимума), а ближайшие обобщения будут направлены на доказательство позиционного критерия для общей задачи типа (Р) с терминальными ограничениями.
Список литературы
1. Гурман В. И. Вырожденные задачи оптимального управления. М. : Наука, 1977. 304 с.
2. Дыхта В. А. Слабо монотонные решения неравенства Гамильтона-Якоби и условия оптимальности с позиционными управлениями // Автоматика и телемеханика. 2014. № 5. С. 31-49.
3. Дыхта В. А. Нестандартная двойственность и нелокальные необходимые условия оптимальности в невыпуклых задачах оптимального управления // Автоматика и телемеханика. 2014. № 11. С. 19-37.
4. Дыхта В. А. Вариационные необходимые условия оптимальности с позиционными управлениями спуска в задачах оптимального управления // Докл. Академии наук. 2015. Т. 462, № 6. С. 653-656. https://doi.org/10.7868/S0869565215180048
5. Дыхта В. А., Самсонюк О. Н. Оптимальное импульсное управление с приложениями. М. : Физматлит, 2003. 256 с.
6. Дыхта В. А., Самсонюк О. Н. Неравенства Гамильтона-Якоби и вариационные условия оптимальности. Иркутск : Изд-во Иркут. госуд. ун-та, 2015. 150 с.
7. Завалищин С. Т., Сесекин А. Н. Импульсные процессы: модели и приложения. М. : Наука, 1991. 256 с.
8. Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. М. : Наука, 1973. 448 с.
9. Миллер Б. М. Условия оптимальности в задаче управления системой, описываемой дифференциальным уравнением с мерой // Автоматика и телемеханика. 1982. № 6. С. 60-72.
10. Миллер Б. М. Условия оптимальности в задачах обобщенного управления. I, II // Автоматика и телемеханика. 1992. № 3. С. 362-370; № 4. С. 505-513.
11. Миллер Б. М. Метод разрывной замены времени в задачах оптимального управления импульсными и дискретно-непрерывными системами // Автоматика и телемеханика. 1993. № 12. С. 3-32.
12. Миллер Б. М., Рубинович Е. Я. Оптимизация динамических систем с импульсными управлениями. М. : Наука, 2005. 429 с.
13. Миллер Б. М., Рубинович Е. Я. Разрывные решения в задачах оптимального управления и их представление с помощью сингулярных пространственно-временных преобразований // Автоматика и телемеханика. 2013. № 12. С. 56-103.
14. Самсонюк О. Н. Монотонность функций типа Ляпунова для импульсных управляемых систем // Изв. Иркут. гос. ун-та. Сер. Математика. 2014. Т. 7. С. 104-123.
15. Самсонюк О. Н. Инвариантность множеств относительно нелинейных импульсных управляемых систем // Автоматика и телемеханика. 2015. № 3. С. 44-61.
16. Филиппова Т. Ф. Построение многозначных оценок множеств достижимости некоторых нелинейных динамических систем с импульсным управлением // Тр. ИММ УрО РАН. 2009. Т. 15, № 4. С. 262-269.
17. Arutyunov А. V., Karamzin D. Yu., Pereira F. L. On constrained impulsive control problems // J. Math. Sci. 2010. Vol. 165. P. 654-688. https://doi.org/10.1007/sl0958-010-9834-z
18. Bressan A., Rampazzo F. Impulsive control systems without commutativity assumptions // Optim. Theory Appl. 1994. Vol. 81, N 3. P. 435-457. https://doi.org/10.1007/BF02193094
19. Nonsmooth analysis and control theory / F. H. Clarke, Yu. S. Ledyaev, R. J. Stern, P. R. Wolenski. New York : Springer-Verlag, 1998. 277 p.
20. Daryin A. N., Kurzhanski A. B. Dynamic programming for impulse control // Ann. Reviews in Control. 2008. Vol. 32. P. 213-227.
21. Dykhta V., Samsonyuk O. Applications of Hamilton-Jacobi inequalities for classical and impulsive optimal control problems // European Journal of Control. 2011. Vol. 17. P. 55-69. https://doi.org/10.3166/EJC.17.55-69
22. Fraga S. L., Pereira F. L. On the feedback control of impulsive dynamic systems // Proceeding of the 47th IEEE Conference on Decision and Control. 2008. P. 2135-2140.
23. Karamzin D. Yu. Necessary conditions of the minimum in impulsive control problems with vector measures // J. of Math. Sci. 2006. Vol. 139. P. 7087-7150. https://doi.org/10.1007/sl0958-006-0408-z
24. Miller В. M. The generalized solutions of nonlinear optimization problems with impulse control // SIAM J. Control Optim. 1996. Vol. 34. P. 1420-1440. https://doi.org/10.1137/S0363012994263214
25. Motta M., Rampazzo F. Space-time trajectories of nonlinear systems driven by ordinary and impulsive controls // Differential Integral Equations. 1995. Vol. 8. P. 269-288.
26. Pereira F. L., Silva G. N. Necessary conditions of optimality for vector-valued impulsive control problems // Syst. Control Lett. 2000. Vol. 40. P. 205-215. https://doi.org/10.1016/S0167-6911(00)00027-X
27. Sorokin S., Staritsyn M. Feedback necessary optimality conditions for a class of terminally constrained state-linear variational problems inspired by impulsive control // Numerical Algebra, Control and Optimization. 2017. Vol. 7, N 2. P. 201-210. https://doi.org/10.3934/naco.2017014
28. Vinter R. В., Pereira F. L. A maximum principle for optimal processes with discontinuous trajectories // SIAM J. Control Optim. 1988. Vol. 26, N 1. P. 205-229. https://doi.org/10.1137/0326013
Владимир Александрович Дыхта, доктор физико-математических наук, заведующий лабораторией, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Российская Федерация, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952)453036 (e-mail: [email protected])
Ольга Николаевна Самсонюк, кандидат физико-математических наук, старший научный сотрудник, Институт динамики систем и теории управления им. В. М. Матросова СО РАН, Российская Федерация, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952)453151 (e-mail: samsonyuk. olga@gmail. com)
Feedback Minimum Principle for Impulsive Processes
V. A. Dykhta
Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, Russian Federation
O. N. Samsonyuk
Matrosov Institute for System Dynamics and Control Theory SB RAS, Irkutsk, Russian Federation
Abstract. We consider an optimal impulsive control problem with a terminal functional and trajectories of bounded variation. The control system we consider has a bilinear structure with respect to the state and control variables and is governed by nonnegative vector Borel measures under constraints on their total variation. This problem is the impulsive-trajectory extension for the corresponding classical optimal control problem, which, in general, does not have optimal solutions with measurable controls. We do not posit any commutativity assumptions guaranteeing the well-posedness property for the impulsive extension. The so-called singular space-time transformation is used to define an individual trajectory and transform the impulsive system to an auxiliary ordinary control system.
The aim of this paper is to prove a nonlocal necessary optimality condition for impulsive processes. This condition is based on feedback controls providing descent directions for the functional. This necessary condition is called the feedback minimum principle. It is a generalization of the corresponding principle for classical optimal control problems. The feedback minimum principle is formulated within the framework of the generalized maximum principle for impulsive processes. An example illustrating the optimality condition is considered.
Keywords: impulsive control, trajectory of bounded variation, feedback control, optimality condition.
References
1. Gurman V.I. Vyrozhdennye zadachi optimal'nogo upravleniya [Degenerate problems of optimal control]. Moscow, Nauka Publ., 1977, 304 p. (in Russian)
2. Dykhta V.A. Weakly monotone solutions of the Hamilton-Jacobi inequality and optimal conditions with positional controls. Autom. Remote Control, 2014, vol. 75, no. 5, pp. 829-844. (in Russian). https://doi.org/10.1134/S0005117914050038
3. Dykhta V.A. Nonstandard duality and nonlocal necessary optimality conditions in nonconvex optimal control problems. Autom. Remote Control, 2014, vol. 75, no. 11, pp. 1906-1921. (in Russian). https://doi.org/10.1134/S0005117914110022
4. Dykhta V.A. Variational necessary optimality conditions with feedback descent controls for optimal control problems. Doklady Mathematics, 2015, vol. 91, no. 3, pp. 394-396. (in Russian). https://doi.org/10.1134/S106456241503031X
5. Dykhta V.A., Samsonyuk O.N. Optimal'noe impul'snoe upravlenie s prilozheniyami [Optimal impulsive control with applications]. Moscow, Fizmatlit Publ., 2000, 256 p. (in Russian)
6. Dykhta V.A., Samsonyuk O.N. Optimal'noe impul'snoe upravlenie s prilozheniyami [Hamilton-Jacobi inequalities and variational optimality conditions]. Irkutsk, Irkutsk State University Publ., 2015, 150 p. (in Russian)
7. Zavalishchin S.T., Sesekin A.N. Impul'snye processy: modeli i prilozhenija [Impulsive processes: models and applications]. Moscow, Nauka Publ., 1991, 256 p. (in Russian)
8. Krotov V.F., Gurman V.I. Metody i zadachi optimal'nogo upravleniya [Methods and problems of optimal control]. Moscow, Nauka Publ., 1973, 448 p. (in Russian)
9. Miller B.M. Optimality condition in the control problem for a system described by a measure differential equation. Autom. Remote Control, 1982, vol. 43, no. 6, part 1, pp. 752-761.
10. Miller B.M. Conditions for the optimality in problems of generalized control. I, II, Autom. Remote Control, 1992, vol. 53, no. 3, part 1, pp. 362-370; no. 4, pp. 505-513.
11. Miller B.M. Method of discontinuous time change in problems of control of impulse and discrete-continuous systems. Autom. Remote Control, 1993, vol. 54, no. 12, part 1, pp. 1727-1750.
12. Miller B.M., Rubinovich E.Ya. Optimizatsiya dinamicheskikh sistem s impul'snymi upravleniyami [Optimization of dynamic systems with impulsive controls]. Moscow, Nauka Publ., 2005. 430 p. (in Russian)
13. Miller B.M., Rubinovich E.Ya. Discontinuous solutions in the optimal control problems and their representation by singular space-time transformations. Autom. Remote Control, 2013, vol. 74, no. 12, pp. 1969-2006. (in Russian). https://doi.org/10.1134/S0005117913120047
14. Samsonyuk O.N. Monotonicity of Lyapunov type functions for impulsive control systems. The Bulletin of Irkutsk State University. Series Mathematics, 2014, vol. 7, pp. 104-123. (in Russian).
15. Samsonyuk O. Invariant sets for nonlinear impulsive control systems. Autom. Remote Control, vol. 76, no. 3, pp. 405-418. (in Russian). https://doi.org/10.1134/S0005117915030054
16. Filippova T.F. Differential equations for ellipsoidal estimates for reachable sets of a nonlinear dynamical control system. Proceedings of the Steklov Institute of Mathematics, 2010, vol. 271, no. S1, pp. 75-84. (in Russian). https://doi.org/10.1134/S0081543810070072
17. Arutyunov A.V., Karamzin D.Yu., Pereira F.L. On constrained impulsive control problems. J. Math. Sci., 2010, vol. 165, pp. 654-688. (in Russian). https://doi.org/10.1007/s10958-010-9834-z
18. Bressan A., Rampazzo F. Impulsive control systems without commutativ-ity assumptions. Optim. Theory Appl., 1994, vol. 81, no. 3, pp. 435-457. https://doi.org/10.1007/BF02193094
19. Clarke F.H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Nonsmooth analysis and, control theory. Springer-Verlag, New York, 1998, 277 p.
20. Daryin A.N., Kurzhanski A.B. Dynamic programming for impulse control. Ann. Reviews in Control, 2008, vol. 32, pp. 213-227.
21. Dykhta V., Samsonyuk O. Applications of Hamilton-Jacobi inequalities for classical and impulsive optimal control problems. European Journal of Control, 2011, vol. 17, pp. 55-69. https://doi.org/10.3166/EJC.17.55-69
22. Fraga S.L., Pereira F.L. On the feedback control of impulsive dynamic systems, In: 47th IEEE Conference on Decision and Control, 2008, pp. 2135-2140.
23. Karamzin D.Yu. Necessary conditions of the minimum in impulsive control problems with vector measures. J. of Math. Sci., 2006, vol. 139, pp. 7087-7150. https://doi.org/10.1007/s10958-006-0408-z
24. Miller B.M. The generalized solutions of nonlinear optimization problems with impulse control. SI AM J. Control Optim., 1996, vol. 34, pp. 1420-1440. https://doi.org/10.1137/S0363012994263214
25. Motta M., Rampazzo F. Space-time trajectories of nonlinear systems driven by ordinary and impulsive controls. Differential Integral Equations, 1995, vol. 8, pp. 269-288.
26. Pereira F.L., Silva G.N. Necessary conditions of optimality for vector-valued impulsive control problems. Syst. Control Lett., 2000, vol. 40, pp. 205-215. http: //dx.doi.org/10.1016/S0167-6911(00)00027-X
27. Sorokin S., Staritsyn M. Feedback necessary optimality conditions for a class of terminally constrained state-linear variational problems inspired by impulsive control. Numerical Algebra, Control and Optimization, 2017, vol. 7, no. 2, pp. 201-210. https://doi.org/10.3934/naco.2017014
28. Vinter R.B., Pereira F.L. A maximum principle for optimal processes with discontinuous trajectories. SI AM J. Control Optim., 1988, vol. 26, no. 1, pp. 205-229. https://doi.org/10.1137/0326013
Vladimir Dykhta, Doctor of Sciences (Physics and Mathematics), Head of the Optimal Control Laboratory, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov St., Irkutsk, 664033, Russian Federation, tel.: (3952)453036 (e-mail: [email protected])
Olga Samsonyuk, Candidate of Sciences (Physics and Mathematics), Senior Research Scientist, Matrosov Institute for System Dynamics and Control Theory SB RAS, 134, Lermontov st., Irkutsk, 664033, Russian Federation, tel.: (3952)453151 (e-mail: samsonyuk.olgaSgmail.com)