Серия «Математика» 2014. Т. 7. С. 104—123
Онлайн-доступ к журналу: http://isu.ru/izvestia
ИЗВЕСТИЯ
Иркутского государственного университета
УДК 517.977.5
Функции типа Ляпунова для нелинейных импульсных управляемых систем *
О. Н. Самсонюк
Институт динамики систем и теории управления СО РАН
Иркутский государственный университет, Институт математики, экономики и информатики
Аннотация. В статье рассматриваются нелинейные импульсные управляемые системы с траекториями ограниченной вариации и управлениями типа векторной меры. Для таких систем предложена новая форма описания решений через полунепрерывные сверху многозначные отображения и установлена связь между новым и известными понятиями решения. Доказано, что множество решений импульсной управляемой системы, выходящих из заданной начальной точки, является замыканием множества абсолютно непрерывных решений в смысле сходимости графиков дополненных траекторий в метрике Хаусдорфа. Основное внимание в статье сфокусировано на исследовании свойств сильной и слабой монотонности функций типа Ляпунова относительно импульсной управляемой системы. Предложены определения сильной и слабой монотонности и У-монотонности функций типа Ляпунова. В этих определениях ключевую роль играет переменная V, которая характеризует, с одной стороны, так называемое быстрое время, в котором осуществляются скачки траекторий, а с другой — ресурс импульсного управления. Показано, что такая двойная интерпретация переменной V приводит к появлению двух разных систем понятий монотонности, названных свойствами монотонности и V-монотонности. В работе обсуждается связь соответствующих свойств монотонности и приводятся инфини-тезимальные критерии в форме систем дифференциальных неравенств Гамильтона - Якоби.
Ключевые слова: импульсная управляемая система, траектории ограниченной вариации, функции типа Ляпунова; монотонность.
* Работа выполнена при финансовой поддержке РФФИ, грант № 14-01-00699, федеральной целевой программы «Научные и научно-педагогические кадры инновационной России», соглашение № 8211 от 06.08.2012, и частичной финансовой поддержке Совета по грантам Президента РФ для государственной поддержки ведущих научных школ, НШ-5007.2014.9
1. Введение и описание импульсной управляемой системы
Под монотонностью функции относительно управляемой системы, описываемой обыкновенными дифференциальными уравнениями или дифференциальным включением, понимается ее монотонность вдоль всех траекторий системы (сильная монотонность) или хотя бы одной траектории (слабая монотонность), выходящей из произвольной начальной позиции (см. [1; 2; 3]). Попытки обобщения понятий сильной и слабой монотонности на класс нелинейных импульсных управляемых систем были предприняты в [4; 5; 6; 7; 8] с целью исследования условий устойчивости и оптимальности импульсных процессов. В этих работах была замечена необходимость модификации базовых понятий монотонности вследствие неавтономности импульсной системы по так называемому «быстрому» времени V, в котором осуществляются скачки траекторий. Кроме того, «быстрое» время V характеризует в некотором смысле ресурс импульсного управления. В данной статье показано, что такая двойная интерпретация переменной V приводит к появлению двух разных систем понятий монотонности, названных свойствами монотонности и V-монотонности.
Формально импульсная управляемая система описывается дифференциальным уравнением с мерой следующего вида
Здесь Т — заданный промежуток времени из М, и — компактное подмножество пространства Мг, К — выпуклый замкнутый конус в Мт, х() — функция ограниченной вариации, х(г) € Мга, п() — измеримая, существенно ограниченная функция, ц — ограниченная борелевская мера на Т, Вт — ст-алгебра борелевских подмножеств Т, сокращение «п.в.» означает «почти всюду по мере Лебега».
Отметим, что решение уравнения (1.1) не может быть определено стандартным образом из-за наличия в (1.1) некорректного произведения разрывной функции г ^ С(Ь,х(Ь)) на меру ц и зависит от способа доопределения такого произведения. Если рассмотреть множество решений (1.1), (1.2) с абсолютно непрерывными по мере Лебега (М мерами ц, то при доопределении, соответствующем замыканию этого множества в слабой* топологии в пространстве функций ограниченной вариации, управлениям п(-), ц и заданному начальному условию может соответствовать не единственная траектория х(-) [9; 10; 11; 12]. Полное описание импульсной управляемой системы, обладающей свойством единственности решения при заданных управлениях и начальном условии, будет приведено ниже.
(х(г) = ¡(г,х(г),п(г)) (г + о(г,х(г)) ц((г),
(1.1)
п(г) € и п.в. на Т, ц(В) € К V В еВт.
(1.2)
Очевидно, что абсолютно непрерывные решения (1.1), (1.2) удовлетворяют обычной управляемой системе
x(t) = f(t, x(t),u(t)) + G(t, x(t))v(t), (1.3)
u(t) G U, v(t) G K п.в. на T (1.4)
с измеримыми, существенно ограниченными управлениями u(-) и v(-). Множество скоростей системы (1.3), (1.4) не ограничено и, следовательно, последовательности траекторий могут поточечно сходиться к разрывным функциям. Построению конструктивных расширений систем вида (1.3), (1.4), и исследованию их свойств (в основном касающихся оптимизации импульсных процессов) посвящены многочисленные публикации, укажем лишь некоторые [9; 10; 11; 12; 13; 14; 15; 16; 17; 18; 19; 20; 21; 22; 23]. Заметим, что принятое в данной статье понятие решения импульсной системы является модификацией определения обобщенного решения, введенного в [11; 12; 16; 17; 21], и примыкает к определению V-решения из работ [10; 22; 23], данному при K = Rm.
Остановимся подробнее на замыкании множества траекторий системы (1.3), (1.4) и переходе к импульсной системе. Пусть T = [to,ti].
Будем считать выполненными следующие предположения. П1. Функции f (t,x,u), G(t,x) непрерывны по совокупности переменных, для любого компактного множества Q С Rn существуют такие константы l\q, L2Q > 0, что выполняются следующие неравенства
\f (t,xi,u) - f (t,X2,u)\ < liq\xi - X2I,
\G(t, Xi ) - G(t, X2 )\ < L2q\xi - X2 \
V (t, xi,u), (t,x2 ,u) G T x Q x U ; кроме того, существуют константы ci, С2 > 0:
\f (t,x,u)\ < ci(l + \x\), \G(t,x)\ < C2(l + \x\) V (t,x,u) G T x Rn x U.
П2. Множество f (t,x, U) выпукло V (t,x) G T x Rn.
Дополним систему (1.3), (1.4) функцией V(■), положив
V (t) = £\\v(£)\K, (1.5)
m
где \\v\\ := ^\vj\. Обозначим через Ку(-) := (x(^),V(■)) траекторию j=i
дополненной системы (1.3)—(1.5) и рассмотрим множество всех Ку, удовлетворяющих начальному условию
x(to) = xo G Rn. (1.6)
Теперь определим замыкание этого множества в смысле сходимости графиков дополненных траекторий в метрике Хаусдорфа. Для этого обозначим через
graphkVC := {(t,x,V) : t e [h,h], (x,V) = ^(t)}
[to,tl]
график Жу на [to,ti] — компактное подмножество Rra+2. Далее рассмотрим множество графиков всех дополненных траекторий, выходящих из точки (t0,x0). Обозначим его через Gyc(t0,x0), т. е.
GT(t0,x0) := {graph к^С(-) : *&(•) — решение (1.3)-(1.6)}.
т
Обозначим через d(A, B) расстояние Хаусдорфа между непустыми компактными множествами A и B из Rn+2, т. е. d(A, B) = min{e > 0 : A С BB С A£}, где A£ := (JxeA Be(x), B£ := (JxeB Be(x), а Bs(x) — замкнутый шар радиуса e с центром в точке x. Определим замыкание Gyc(t0,x0) в метрике Хаусдорфа и обозначим полученное множество через Gt(t0,x0). Теперь для каждого элемента Gt(t0,x0) определим многозначное отображение ку, заданное на T со значениями во множестве непустых компактных подмножеств из Rra+1. А именно, пусть A e GT(t0,x0). Тогда ку(t) = At, t e T, где At — сечение A при фиксированном t. Обозначим через T(t0,x0) множество всех отображений ку, соответствующих элементам Gt(t0,x0).
Определение 1. Назовем ку e T(t0,x0) дополненной траекторией импульсной управляемой системы, соответствующей системе (1.3)-(1.6).
Таким образом, траектории импульсной системы (1.1), (1.2), определенные на отрезке T = [t0,ti] и отвечающие начальному условию (1.6), понимаются как x-компоненты соответствующих ку e T(t0,x0). Отметим, что множество всех траекторий, выходящих из (t0,x0), будет совпадать с замыканием множества абсолютно непрерывных траекторий в слабой* топологии в пространстве функций ограниченной вариации, если вместо многозначных отображений рассматривать непрерывные справа на (t0,ti] селекторы ограниченной вариации.
Опишем теперь элементы множества T(t0,x0) явным образом, не прибегая к системе (1.3), (1.4). Для этого введем следующие обозначения:
— Ki = {v e K \ \\v\\ = 1};
— coQ — выпуклая оболочка множества Q;
— Цс, \^c\ и Sd(^) — соответственно непрерывная составляющая в разложении Лебега меры ц — векторной ограниченной борелевской меры на T, полная вариация меры fxc и множество, на котором сосредоточена дискретная составляющая меры ц, т. е. Sd(^) = {s e T \ K{s})=0};
- U(T,U) := [u^) G LX(T, Rr) \ u(t) G U п.в. на T};
- W (T,K) — множество пар [y, y (y)) =: n(y), в которых y — K-значная ограниченная борелевская мера на T, а y (y) — некоторое соответствующее y семейство [ds,us(^)}ses, состоящее из неотрицательных чисел ds и измеримых по Лебегу функций us(^), удовлетворяющих следующим условиям:
1) S — не более чем счетное подмножество отрезка T, Sd(y) С S ;
2) для каждого s G S ws : [0, ds] ^ co Ki,
f ds
ds >\\y{[s})\\, us(r)dr = y({s});
o
3) ds < ю.
ses
В дальнейшем элементы множеств U (T, U) и W (T, K) будем называть обычными и импульсными управлениями соответственно. Справедливо следующее утверждение.
Предложение 1. 1) Пусть ку G T(t0,x0). Тогда найдутся u(^) G U(T,U) и n(y) G W(T,K), такие, что выполняются следующие условия:
а) V t G T/S
ку (t) = { (x(t),V(t))}, функции V( ) и V( ) заданы следующими равенствами
V(t0) = x0, X(t) = x0 + ftQ f (t,X(t),u(t))dt + ftQ G(t,X(t))yc(dt)
+ E (x(s) - x(s-)), t G (t0,ti], s<t, ses v J
(1.7)
где для каждого s G S, X(s) = zs(ds), а zs(■) — решение дифференциального уравнения
dz (T)
-^1 = G{S,Zs(T))ujS(T), Zs(0)=X(S-), те [0,4], (1.8) V(ti) = 0, V(t) = \yc([t,ti])\ + ds, t G [t0,ti); (1.9)
s>t,ses
б) V s G S
Ky(s) = {(zs(T)),V(s) - t) \ T G [0,ds]}. (1.10)
2) Пусть многозначное отображение ку : [t0,ti] ^ Rn+i удовлетворяет условиям a), б) при некоторых
u() G U(T, U) и n(y) G W(T, K).
Тогда ку G T(t0,x0).
Доказательство. Докажем 1). Пусть ку e T(t0,x0). Обозначим через A график ку на отрезке T, т. е. A = {(t, x,V) : t e T, (x, V) = ку (t)}. Тогда A e Gt(t0,x0) и, следовательно, найдется такая последовательность {Ak}, что Ak e GTc(t0,x0) и d(Ak,A) — 0 при k -ж. Для каждого Ak определим траекторию системы (1.3), (1.4) кук и соответствующее ей управление (пк(),Vk(■)) так, чтобы Ak = graph кук.
т
Известно [5; 11; 12], что кук(■) =: (xk(),Vk(■)) посредством замены времени т = Пк(t) := t — t0 + Vk(t0) — Vk(t) вкладывается во множество траекторий следующей вспомогательной системы:
t' (т )= ш((т), t(0) = t0, t(Ti)= ti, x'(t) = f (t(r), x(T), V(t), u(T))^0(T)+
G(t(T), x(t ), V(t ))w(t ), x(0) = x0, V' (t ) = —1+ Ш0(т), V(ti ) = 0,
(1.11)
u(T) e U, (Ш0(т),w(t)) e coKi п.в. T e [0,Ti]. (1.12)
Здесь Ki = {(w0,w) \ w0 > 0, w e K, ш0 + ЦшЦ = 1} , Ti — нефиксированный конечный момент времени. Во вспомогательной системе к^ соответствует некоторое управление (щ(■),w0k(),Wk(■)), удовлетворяющее условиям uk(т) e U, w0k (т) > 0,
Wk(т) e K, U0k(т) + \\wk(т)\\ = 1 п.в. T e [0,Tik],
и траектория (tk(■), xk(■), Vk(). При этом имеем
Ak = graph ку% = {(tk (т), xk (т), Vk (т)) \ т e [0,Tik ]}. т
Поскольку функции {tk(■),xk(■), Vk(■)} равномерно ограничены и равностепенно непрерывны в силу предположений (П1),(П2), то найдется подпоследовательность {tki(), x^O), V^O } равномерно сходящаяся к некоторому решению (t(-), x(^), V(^)) системы (1.11), (1.12), соответствующему управлению (u(-),W0(-),w(-)) на отрезке [0,т1]. Тогда, очевидно, справедливо равенство
A = {(t(T), x(t), V(t)) \ т e [0, Ti]}.
Теперь, применяя обратную замену времени аналогично [11; 12], определим по (u(j,w0(j,w() управления u() eU(T,U) и п(ц) e W(T,K). При этом условия а), б) зададут многозначное отображение ку, соответствующее (t(T), x(t), V(t)) и, следовательно, совпадающее с заданным. Утверждение 1) доказано.
Для доказательства утверждения 2) достаточно заметить, что если ку удовлетворяет равенствам а), б) при некоторых u(^) e U(T,U)
и п(ц) Е W(T, K), то найдется траектория вспомогательной системы (1.11), (1.12) (t(-), x(-), V(-)) на отрезке [0,ri], такая, что
A := graph ку = {(t(r), x(t), V(t)) | т Е [0,n]}.
T
Кроме того, существует последовательность {t^(■), xk(■), Vk(■)}, равномерно сходящаяся к (t(T), x(t), V(t)), причем ее элементы удовлетворяют (1.11), (1.12) с управлениями uk(т) Е U, Ш0к(т) > 0,
шк(т) Е K, Шок(т) + Цшк(т)|| = 1 п.в. т Е [0,Т1к].
Отсюда следует, что существует последовательность траекторий [кУ^к] системы (1.3), (1.4), такая, что
Ак := graph *ук = {^к(т), Xk(т), Vk(т)) | т Е [0,ш]}. T
Но тогда Ак Е GT(to,Xo) и й(Ак,А) —> 0 при к —У ж. Следовательно, А Е Gt(to,xo) и ку Е T(t0,хо). Утверждение 2) доказано. Предложение доказано.
□
В дальнейшем импульсной управляемой системой будем называть систему следующего вида
dx(t) = f(t,x(t),u(t)) dt + G(t,x(t)) п(р), (1.13)
u(-) Е U(T, U), п(ц) Е W(T, K), (1.14)
в которой траекториями (дополненными траекториями) на отрезке T = [to,ti] являются полунепрерывные сверху многозначные отображения ку Е T(t0,x0), а связь между управлениями u(-), п(р) и соответствующей траекторией описывается соотношениями а), б) из Предложения 1.
До сих пор импульсная управляемая система рассматривалась в прямом времени, при t > to. Однако аналогичные рассуждения можно провести для системы в обратном времени при t < ti с условием x(ti) = xi. При этом в определении решения нужно заменить (1.7), (1.9) и (1.10) следующими равенствами соответственно:
f Н
x(ti)= xi, x(t) = xi — f(t,x(t),u(t))dt— -I G(t,x(t))^c(dt) — ^ (x(s+) — x(s)^j, t Е [to,ti), (1.15)
fil It
Cti
n s>t, ses
где для каждого в е Б, х(в) = а — решение дифференциаль-
ного уравнения
dzs (т)
(т
= G{в,Zs(т))ш3(т), Zs()= х(в+), т е [0,(э]; (1.16)
У(го) = 0, У(Ь) = \^с([1о,г])\ + ^ (3, г е (г0М; (1.17)
ку(в) = (т),У(в-)+ т) \ т е [0,(3]}.
Здесь функция х( ) считается непрерывной слева на промежутке [¿0^1), а У(-) — непрерывной справа на (¿0,г1].
В дальнейшем импульсная система будет рассматриваться как в прямом, так и в обратном времени, поэтому, чтобы избежать путаницы, траекторию в прямом времени будем называть правой и обозначать через к+, а в обратном — левой, с обозначением к—. При этом положим
к-(г 1 +) := {(Х1,т))}, к+(г0-) := {{хо,У(Ь))},
где У(-) задана равенствами (1.17) для к— и (1.9) для к+.
В работе [24] показано, что произвольный селектор [х(-),У(•)) дополненной траектории ку состоит из функций ограниченной вариации, причем его первая компонента х(-) является поточечным пределом некоторой последовательности {хк(•)} траекторий системы (1.3), (1.4), а вторая компонента У(•) характеризует в некотором смысле ресурс импульсного управления для каждого момента г е [¿0^1], связанный с заменой на отрезке [га,г^] разрывной траектории последовательностью абсолютно непрерывных, где [га,г^] = [г0,г] для левой траектории и {ка,г/з] = [г,г1] для правой. Это означает, что имеет место сходимость
/ \\ук (г)\\(г ^ У (г) или / \\ук (г)\\(г ^ У (г), где {ьк (•)} —управления
системы (1.3), (1.4), которым соответствует {хк(•)}. Заметим также, что функция У(•), часто интерпретируется как переменная «быстрого» времени, в котором реализуется импульсная динамика [9; 10; 11; 12]. При этом в левой дополненной траектории У(1) характеризует «быстрое» время, затраченное до момента реального времени г, а в правой — после
г.
2. Сильная и слабая монотонность: определения
Импульсная управляемая система с траекториями ограниченной вариации в общем случае неавтономна как по реальному г, так и «быстрому» У времени. Исключение составляют системы, в которых матрица G(г, х) при импульсном управлении удовлетворяет так называемому
условию корректности типа Фробениуса. Последнее выполняется, например, для линейных систем или систем со скалярным импульсным управлением. Поэтому для импульсных систем функции типа Ляпунова должны зависеть не только от t, x, но и от V. Игнорирование этого обстоятельства существенно сужает возможности применения функций Ляпунова к стандартным задачам позиционного и оптимизационного управления (см. [8; 26; 27]). Однако, как будет видно ниже, введение аргумента V вносит особенности в определение сильной и слабой монотонности функций в прямом и обратном времени. В частности, это приводит к появлению двух различных систем определений, основанных на разных интерпертациях V-компоненты дополненной траектории. В данном разделе будут даны определения монотонности и V-монотонности функций относительно управляемой системы (1.13), (1.14) и указана связь между ними. Свойства монотонности будут рассматриваться на отрезке времени [a,b] для непрерывных функций (t,x,V) ^ ф(t,x,V). Вначале определим свойства сильной и слабой V-монотонности. Пусть (ta,xa) е [a, b] х Rra, Va > 0. Определим два множества дополненных траекторий:
T-a(ta,xa ) = {к-, t е [a,to] I K-(ta+) = {(xa ,Va)}} ,
T+(ta,xa ) = {к+, t е [ta,b] 1 K+(ta— = {(xa,Va .
Таким образом, множество Tya(ta,xa) состоит из дополненных траекторий, определенных при t < ta и стартующих в обратном времени из точки xa в момент ta (или, иначе, приходящих в точку xa в момент ta), а множество T+ (ta,xa) — из дополненных траекторий, определенных при t > ta и стартующих из точки xa в момент ta. На соответствующем отрезке [a,ta] или [ta,b] эти траектории аппроксимируемы траекториями системы (1.3), (1.4) с ресурсом импульсного управления Va.
Зададим М > 0, допуская М = и заменяя в этом случае [0, М] на [0, +го).
Будем обозначать через graph ку график многозначного отображе-
[to,tl]
ния ку на отрезке [to,ti] С [a,b], т. е.
graph ку = {(t,x,V) | t е [to,ti], (x,V) = ку (t)}, [to,ti]
а через Qv(ta,xa,Va) множество точек (t,x,V), в которых значение функции ф не меньше, чем в заданной точке (ta,xa, Va), т. е.
Qv(ta,xa,Va) = {(t,x,V) е [a,b]xRra х[0,М] I ^>(t,x,V) > ф^ a, xa, Va) } .
Определение 2. Функция ф сильно V-возрастает, если для любых (ta,xa) е [a,b] х Rra, Va е [0,М] и любой дополненной траектории
ку Е T+(ta,xa) выполняется включение
graph ку с Qv (t a, xa, Va). (2.1)
[t a,b]
Определение 3. Функция ф слабо V-возрастает, если для любых (ta,xa) Е T х Rn и Va Е [0,M] найдется такая дополненная траектория ку Е T+(ta,xa), что выполняется включение (2.1).
Следующие определения дают свойства V-монотонности в обратном времени.
Определение 4. Функция ф сильно V-возрастает в обратном времени, если для любых (ta,xa) Е [a, b] xRn, Va Е [0, M] и любой дополненной траектории ку Е T—a(ta,xa) выполняется включение
graph ку с Qv (t a, xa, Va). (2.2)
[a,t a ]
Определение 5. Функция ф слабо V-возрастает в обратном времени, если для любых (ta,xa) Е T х Rn и Va Е [0, M] найдется такая дополненная траектория ку Е T—(ta,xa), что выполняется включение (2.2).
Сильное и слабое убывание ф определяются аналогично, для это-{о в определениях 2-5 нужно заменить Qv(ta,xa,Va) на множество {(t,x,V) Е [a, b] х Rn х [0,M] | ф(t,x,V) < ф^а^а,Va)}. Функции, обладающие хотя бы одним из свойств монотонности, будем называть функциями типа Ляпунова управляемой системы (1.13), (1.14).
Прокомментируем введенные определения.
1. Название V-монотонность связано с особой ролью переменной V. В частности, если в определениях 2-5 вместо Va Е [0, M] положить Va = M, то в силу свойств импульсной системы функции, удовлетворяющие новым определениям, будут обладать и V-монотонностью.
2. Заметим, что из свойства V-монотонности ф относительно импульсной управляемой системы следует ее монотонность вдоль каждого селектора произвольной (для сильной) или «выживающей» (для слабой) дополненной траектории, выходящей из заданной точки (ta,xa,Va). Обратное утверждение справедливо только для сильной монотонности.
3. Положим Qv(ta,xa,Va) = Q+(ta,xa,Va)UQ— (ta,xa,Va), где элементы Q+(ta,xa, Va) удовлетворяют условию t > ta, а Q— (ta ,xa,Va) — t < ta. Тогда свойство сильного или слабого V-возрастания ф в прямом времени равносильно соответственно сильной или слабой V-инвариантности множества Q+(ta,xa,Va) при каждом (ta,xa) Е [a,b] х Rn и Va > 0, а в обратном — Q— (ta,xa, Va) (см. [24; 25]).
4. Легко видеть, что определения 4, 5 получаются из 2, 3 обращением времени t и, следовательно, заменой правых дополненных траекторий
левыми. Однако от функций типа Ляпунова часто требуется как сильное свойство монотонности в прямом времени, так и слабое в обратном. В частности это относится к функции цены в динамическом программировании, а также к функциям, для которых множества вида Qv задают множества достижимости или управляемости. В таких случаях определения 2- 5 представляются неудобными, поскольку в них свойства в прямом времени формулируются через правые траектории, а в обратном — через левые. Как было отмечено выше V-компонента дополненных траекторий характеризует, с одной стороны, ресурс импульсного управления, а с другой, так называемое «быстрое» время, в котором осуществляется импульсная динамика, причем в определениях V-монотонности переменная V понимается в первом смысле. Но оказывается, что при второй интерпретации V можно получить другую систему определений монотонности. Она приведена ниже.
Определим свойства сильной и слабой монотонности функции ф относительно системы (1.13), (1.14).
Левую дополненную траекторию теперь будет удобнее рассматривать как траекторию в прямом времени как по реальному t, так и «быстрому» V, а правую наоборот — в обратном по t и V. Легко видеть, что теперь левая траектория к— на отрезке T = [t0 ,ti], соответствующая управлениям u(-) Е U(T, U), п(р) Е W(T, K) и заданному состоянию x0 в момент to, определяется следующими условиями:
а) Vt Е T/S = {(x(t),V(t)) }, где функции х(-), V(-) заданы равенствами (1.7), (1.17( соответственно;
б) V s Е S к—(s) = {(zs(t),V(s—) + т) | т Е [0,ds]}, где Zs(-) удовлетворяет (1.8).
Тогда как правая траектория к+, выходящая из точки xi в момент ti, и определенная при t < ti, удовлетворяет} условиям: а') Vt Е T/S к+(t) = {(x(t),V(t))}, функции х(-), V(-) заданы
равенствами (1.15), (1.9) соответственно; б') Vs Е S к+s = {{zs(t),V(s—) — т) | т Е [0,ds]}, где Zs(-) удовлетворяет (1.16).
Обозначим через и Т^щ*0 соответственно множества всех ле-
вых и правых дополненных траекторий системы (1.13), (1.14), определенных на отрезке [a, b] и значения V-компонент которых ограничены числом M > 0. Будем рассматривать сужения этих множеств на отрезки вида [a,ta] и [ta,b].
Определение 6. Функция ф сильно возрастает, если для любых (ta,xa) Е [a, b] х Rn, Va Е [0, M] и любой дополненной траектории ку Е T[t'Ib\р удовлетворяющей условию ку(ta—) = (xa,Va), выполняется включение
graph ку с Qv (t a, xa, Va)- (2.3)
t b]
Определение 7. Функция ф слабо возрастает, если для любых (ta,xa) е T х Rra и Va е [0,М] найдется такая дополненная траектория ку е Т^'ц, удовлетворяющая условию ку(ta—) = (xa,Va), что выполняется включение (2.3).
Определение 8. Функция ф сильно возрастает в обратном времени, если для любых (ta,xa) е [a,b] х Rra, Va е [0,М] и любой дополненной траектории ку е Т}М'°}, удовлетворяющей условию ку(ta+) =
[a,ta]
(xa,Va), выполняется включение
graph ку с Qv (t a, xa, Va). (2.4)
[a,t a ]
Определение 9. Функция ф слабо возрастает в обратном времени, если для любых (ta,xa) е T х Rra и Va е [0,М] найдется такая дополненная траектория ку е Т}°'М], удовлетворяющая условию ку (ta+) =
[a,ta]
(xa,Va), что выполняется включение (2.4).
Заметим, что в этой системе определений говорится о траекториях импульсной системы, являющихся сужениями на отрезок [ta,b] или [a,ta] некоторых траекторий, определенных на всем отрезке [a,b]. Это замечание послужило одним из мотивом введения V-монотонности, в определениях которой траектории начинаются или заканчиваются в момент ta, также как в аналогичных понятиях для обычных управляемых систем. Определения 6, 9 были введены раньше, чем определения V-монотонности, они оказались полезными при описании оценок множеств достижимости и получении необходимых и достаточных условий оптимальности импульсных процессов, включающих семейства слабо и сильно монотонных функций типа Ляпунова [5; 6; 7; 8; 26; 27].
Установим связь между понятиями монотонности и V-монотонности. Вначале заметим, что определения 7 и 9 после переобозначений переходят в определения 3 и 5 соответственно, и, следовательно, слабое возрастание и слабое V-возрастание совпадают.
Пусть ф сильно V-возрастает. Определим функцию ф1 правилом
ф1(t,x,V) = ф^, x, М - V).
Тогда ф1 сильно возрастает. Действительно, возьмем произвольные (ta,xa) е [a,b] х Rra, Va е [0,М] и траекторию ку е Т^М\ у которой ку(ta-) = (xa, Va). Имеем ку(b+) = (xb, Vb), при некоторых xb е Rra и Vb е Уа,М]. Продолжим ку так, чтобы V-компонента достигла значения М при t = b+, для краткости сохраним обозначение ку. Определим к+t = {(x,М - V) | (x,V) е ку(t)}. Тогда к+ е Т+_у (ta,xa) и,
следовательно, graph к+ с
t ,b] у { } Qv (ta ,xa, M — Va) = {(t,x,M — V) | фl (t, x, V) > фl(t a, xa,i Va) } .
Отсюда следует, что
graph ку с QV1 (t a, xa, Va)-t ,b]
Последнее доказывает сильное возрастание фl.
Аналогично показывается, что из сильного возрастания ф следует сильное V-возрастание фl, причем это верно как в прямом, так и в обратном времени.
В заключение этого раздела сформулируем свойства монотонности и V-монотонности ф в терминах ее возрастания вдоль траекторий импульсной системы.
Будем говорить, что функция (t,x,V) ^ ф(t,x,V) возрастает вдоль к—, если для любых (ti,xi, Vi), (t2, x2, V2), удовлетворяющих условиям
(xi,Vi) Е к—(ti), (x2,V2) Е к—(Ь2), ti < t2 или Vi < V2,
выполняется неравенство
ф^^иП) < ф^2, x2, V2), (2.5)
и возрастает вдоль к+, если (2.5) выполняется для любых (ti,xi,Vi), (t2,x2,V2), удовлетворяющих условиям
(xi, Vi) Е к+(и), (x2, V2) Е к+fo), ti < t2 или Vi > V2.
Тогда, очевидно, свойство сильного возрастания ф равносильно возрастанию вдоль любой левой дополненной траектории, а V-возрастания — правой. Однако слабое возрастание и V-возрастание ф равносильны возрастанию вдоль хотя бы одной (выживающей) правой дополненной траектории, выходящей из произвольно заданной точки (ta,xa, Va). Аналогичные утверждения справедливы при монотонности ф в обратном времени, если заменить правые траектории на левые и наоборот.
3. Инфинитезимальные критерии монотонности в форме неравенств Гамильтона—Якоби
Инфинитезимальные критерии монотонности функций типа Ляпунова, являющихся сильно монотонными в прямом времени и слабо монотонными в обратном (определения 6, 9), были получены в работах [6; 7;
8]. Для непрерывных функций ф инфинитезимальные условия задаются системами проксимальных неравенств типа Гамильтона-Якоби и описываются через проксимальные суб- и супердифференциалы функции ф в точке (t,x,V). Эти критерии нетрудно распространить и на другие типы монотонности, переходя от левых дополненных траекторий к правым и используя указанную выше связь между монотонностью и V-монотонностью.
Приведем сводку инфинитезимальных условий монотонности. Для большей наглядности будем рассматривать только гладкие функции ф, что позволит формулировать условия монотонности в форме дифференциальных неравенств и не использовать обобщенные производные.
Зададим функции h0, h\, H0 и следующими равенствами
h0(t,x^) = тт{ф, f (t,x,u)), h\(t,x,^) = min {ф,G(t,x)w),
ueü w€Ki
Ho(t,x,ф) = тах{ф,f (t,x,u)}, H1(t,x,ф) = max {ф,G(t,x)u}.
ueU шЕК1
Эти функции являются аналогами нижнего и верхнего гамильтониана по обычному и импульсному управлениям для системы (1.13), (1.14).
Определим для системы (1.13), (1.14) дифференциальные операторы типа Гамильтона-Якоби y[ф], Г[ф] и ^~[ф], Г_[ф] следующими равенствами
Y^](t,x,V) := min {ф + ho(t,x^x))Шо + (фу + h(t,x^x))шЛ ,
wo ,w1 >0 ш0+ш1 = 1
r^](t,x,V) := max {ф + Ho(t,x^x))шо + (фу + H1(t,x^x))шЛ ,
^о>^1>0 ^ 4 ' 4 ' '
w>o+w>i = 1
Y-^](t,x,V):= min {(фг + ho(t,x^x))Шо + (-фу + h(t,x^x))шЛ ,
wo 1 > о ш0+ш1 = 1
r-^](t,x,V):= max {ф + Ho(t,x^x))uo + (-фу + %1(t,x^x))шЛ .
wo W1 >0 W0+W1 = 1
Введем обозначения: фt(■, ■) := ф(t, ■, ■), фу0(■, ■) := ф(-, ■, 0). Для сокращения записи условимся, что все дифференциальные неравенства ниже, заданные через y[ф], Г[ф], Y- [ф] или Г-[ф], рассматриваются при V (t,x,V) е (a,b) х Rra х (0,М), дифференциальные неравенства относительно фу° — V (t, x) е (a, b) х Rra, а относительно ф1 — V (x, V) е Rra х (0, М) и заданного t = a или b.
Инфинитезимальные условия монотонности гладкой функции ф задаются следующими системами дифференциальных неравенств:
условия сильнои монотонности:
1) возрастание /
У-убывание в обратном времени
2) убывание /
V-возрастание в обратном времени
3) убывание в обратном времени / V-возрастание
4) возрастание в обратном времени / V-убывание
условия слабой монотонности:
5) возрастание в обратном времени / У-возрастание в обратном времени
6) убывание в обратном времени / У-убывание в обратном времени
& ) > 0; & ГШ,х,У) < 0; & ) > 0; & Г-[ф](1,х,У) < 0;
7Ш,х,У) < 0, фУ + Но(1,х,ф1°) < 0,
фУ + Нх(г,х,фх) < 0,
г = а;
Ш(1,х,У) > 0, фу0 + Но(1,х,ч%) > 0, фгу + Н1(1,х,фХ) > 0,
г = а;
7) убывание / У-убывание
7-Ы(Ь,х,У) < 0,
фу0 + Ьо(Ь,х,фУ) < 0,
-фУ + Н1(г,х,ф>Х) < 0, г = Ь;
Г-[ф](1,х,У) > 0,
«л / т/ ^ фУ0 + Но(г,х,фУ0) > 0,
8) возрастание / V-возрастание & гх ' ~
-фУ + Н1(г,х,фХ) > 0, г = ь.
Заметим, что дифференциальные неравенства, задающие условия сильной монотонности, распадаются на системы двух неравенств. Так, например,
7[ф](г, х^) > 0 & фг + Но(г, х, фх) > 0, фу + Нх(г, х, фх) > 0;
г[ф](г,хV) < 0 & фг + Но(г,х,фх) < 0, фу + Нх(г,х,фх) < 0.
Что касается условий слабой монотонности, то для первых неравенств справедливо
^\ф](1,х,У) < 0 ^ шт{фг + Н0(г,х,фх); фу + кг(г,х,фх)} < 0,
Г[ф](г,х,У) > 0 ^ шах{фг + Но(г,х,фх); фу + Ч\(г,х,фх)} > 0.
Однако при такой записи утрачиваются многозначные отображения (¿,х,У) ^ ш0(Ь,х,У), ш\{Ь,х,У), задающие для каждой точки (¿,х,У) значения переменных шо и ш\, доставляющие максимум или минимум в левой части неравенства, и тем самым игнорируется важная для построения «выживающих» траекторий информация.
Список литературы
1. Aubin J.-P. Differential inclusions / J.-P. Aubin, A. Cellina. - Berlin : SpringerVerlag, 1984. - 342 p.
2. Nonsmooth Analysis and Control Theory / F. H. Clarke, Yu. S. Ledyaev, R. J. Stern, P. R. Wolenski. - N. Y. : Springer-Verlag, Grad. Texts in Math. - 1998. -Vol. 178. - 276 p.
3. Vinter R. B. Optimal Control / R. B. Vinter. - Birkhauser, Boston, 2000.
4. Pereira F. L. Stability for impulsive control systems / F. L. Pereira, G. N. Silva // Dynamical Systems. - 2002. - Vol. 17, N 4. - P. 421--434.
5. Дыхта В. А. Неравенства Гамильтона - Якоби в задачах управления импульсными динамическими системами / В. А. Дыхта, О. Н. Самсонюк // Тр. Мат. ин-та им. В.А. Стеклова РАН. - 2010. - Т. 271. - С. 93-110.
6. Самсонюк О. Н. Условия сильной и слабой монотонности функций типа Ляпунова для нелинейных импульсных управляемых систем / О. Н. Самсонюк // Тез. докл. XI Междунар. Конф. «Устойчивость и колебания нелинейных систем управления» (конференция Пятницкого). Москва, ИПУ РАН, 1-4 июня 2010 г. - М. : ИПУ РАН, 2010. - С. 347-349.
7. Samsonyuk O. Lyapunov type functions for nonlinear impulsive control systems: monotonicity conditions and applications / O. Samsonyuk // Book of Abstracts of the 5th International Conference on Physics and Control (PhysCon 2011), September 5-8, 2011. - P. 87.
8. Dykhta V. Some applications of Hamilton-Jacobi inequalities for classical and impulsive optimal control problems / V. Dykhta, O. Samsonyuk // European Journal of Control. - 2011. - Vol. 17. - P. 55-69.
9. Дыхта В. А. Оптимальное импульсное управление с приложениями. / В. А. Дыхта, О. Н. Самсонюк. - 2-е изд. - М. : Физматлит, 2003.
10. Завалищин С. Т. Импульсные процессы: модели и приложения / С. Т. Завалищин, А. Н. Сесекин. - М. : Наука, 1991.
11. Миллер Б. М. Метод разрывной замены времени в задачах оптимального управления импульсными и дискретно-непрерывными системами / Б. М. Миллер // Автоматика и телемеханика. - 1993. - № 12. - С. 3-32.
12. Миллер Б.М. Оптимизация динамических систем с импульсными управлениями / Б.М. Миллер, Е.Я. Рубинович — М.: Наука, 2005.
13. Гурман В.И. Принцип расширения в задачах управления / В. И. Гурман. -2-е изд. перераб. и доп. - М. : Наука, 1997.
14. Принцип расширения в качественной теории управления / В. А. Батурин [и др.]. - Новосибирск : Наука, СО, 1990. - Гл.1. - С. 5-48.
15. Дыхта В. А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных процессов / В. А. Дыхта. — Иркутск : Изд-во ИГЭА, 1995. - 186 с.
16. Миллер Б. М. Условия оптимальности в задаче управления системой, описываемой дифференциальным уравнением с мерой / Б. М. Миллер // Автоматика и телемеханика. - 1982. - № 6. - С. 60-72.
17. Миллер Б. М. Условия оптимальности в задачах обобщенного управления I, II / Б. М. Миллер // Автоматика и телемеханика. - 1992. - № 3. - С. 362-370; № 4. - С. 505-513.
18. Arutyunov A. V. On constrained impulsive control problems / A. V. Arutyunov, D. Yu. Karamzin, F. L. Pereira // J. Math. Sci. - 2010. - Vol. 165, № 6. - P. 654-688.
19. Motta M. Space-time trajectories of nonlinear systems driven by ordinary and impulsive controls / M. Motta, F. Rampazzo // Differential Integral Equations. -1995. - Vol. 8. - Pp. 269-288.
20. Silva G. N. Measure differential inclusions / G. N. Silva, R. B. Vinter // J. of Mathematical Analysis and Applications. - 1996. - Vol. 202. - P. 727-746.
21. Miller B. M. The generalized solutions of nonlinear optimization problems with impulse control / B. M. Miller // SIAM J. Control Optim. - 1996. - Vol. 34. - P. 1420-1440.
22. Сесекин А. Н. О множествах разрывных решений нелинейных дифференциальных уравнений / А. Н. Сесекин // Изв. вузов. Математика. - 1994. - № 6. -С. 83-89.
23. Сесекин А. Н. Динамические системы с нелинейной импульсной структурой / А. Н. Сесекин // Тр. Ин-та математики и механики УрО РАН. - Екатеринбург, 2000. - Т. 6. - C. 497-510.
24. Самсонюк О. Н. Инвариантность множеств относительно нелинейных импульсных управляемых систем / О. Н. Самсонюк // Автоматика и телемеханика. - 2014. (Принята к печати.)
25. Samsonyuk O. N. Strong and weak invariance for nonlinear impulsive control systems / O. N. Samsonyuk // Book of Abstracts of IFAC WC 2011. - 2011. - P. 3480-3485.
26. Самсонюк О. Н. Составные функции типа Ляпунова в задачах управления импульсными динамическими системами / О. Н. Самсонюк // Тр. Ин-та математики и механики УрО РАН. - 2010. - Т. 16, N 5. - С. 170—178.
27. Дыхта В. А. Каноническая теория оптимальности импульсных процессов / В. А. Дыхта, О. Н. Самсонюк // Современная математика. Фундам. направления. - 2011. - Т. 42. - С. 118-124.
Самсонюк Ольга Николавна, кандидат физико-математических наук, старший научный сотрудник, Институт динамики систем и теории управления СО РАН, 664033, г. Иркутск, ул. Лермонтова, 134, тел.: (3952) 453151; доцент, Институт математики, экономики и информатики, Иркутский государственный университет, 664000, г. Иркутск, ул. К. Маркса, 1 (e-mail: [email protected])
O. Samsonyuk
Monotonicity of Lyapunov Type Functions for Impulsive Control Systems
Abstract. The paper is devoted to the study of impulsive dynamical systems with trajectories of bounded variation and impulsive controls (regular vector measures). A new concept of solutions for these systems is introduced. According to this concept, the solution is an upper semicontinuous set-valued mapping. The relationship between the new solution concept and conventional one is established. We prove that the set of solutions is a closure of the set of the absolutely continuous solutions. Here, the closure is understood in the sense of the convergence in Hausdorff metric for graphs of the supplemented absolutely continuous trajectories. In this paper, we focus mainly on the study of some monotonicity properties of a continuous function with respect to a nonlinear impulsive control system with trajectories of bounded variation. Definitions of strong and weak monotonicity and V-monotonicity are proposed and discussed. The set of conventional variables t and x of Lyapunov type functions is now supplemented with the variable V, which, on the one hand, is responsible for the impulsive dynamics of the system and has the property of the time variable and, on the other hand, characterizes some resource of the impulsive control. We show that such double interpretation of variable V leads to different definitions of monotonicity, which are called monotonicity and V-monotonicity. For smooth Lyapunov type functions, infinitesimal conditions of monotonicity in the form of Hamilton-Jacobi differential inequalities are presented.
Keywords: measure-driven impulsive control system, trajectories of bounded variation, monotonicity of Lyapunov type functions.
References
1. Aubin J.-P., Cellina A. Differential Inclusions. Berlin, Springer-Verlag, 1984. 342 p.
2. Clarke F.H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Nonsmooth Analysis and Control Theory. New York, Springer-Verlag, Grad. Texts in Math. Vol. 178, 1998, 276 p.
3. Vinter R.B. Optimal Control. Birkhauser, Boston, 2000.
4. Pereira F.L., Silva G.N. Stability for Impulsive Control Systems. Dynamical Systems, 2002, vol. 17, no. 4, pp. 421-434.
5. Dykhta V.A., Samsonyuk O.N. Hamilton-Jacobi Inequalities in Control Problems for Impulsive Dynamical Systems. Proc. of the Steklov Institute of Mathematics,
2010, vol. 271, pp. 86-102.
6. Samsonyuk O.N. Strong and Weak Monotonicity Conditions of Lyapunov Type Functions for nonlinear impulsive system [Usloviya sil'noj i slaboj monotonnosti funkcij tipa Lyapunova dlya nelinejnyh impul'snyh upravlyaemyh sistem]. Book of Abstracts of the XI International Conference «Stability and Oscillations in Nonlinear Control Systems» (Pyatnitskii Conference), June 1-4, 2010, pp. 347-349.
7. Samsonyuk O. Lyapunov Type Functions for Nonlinear Impulsive Control Systems: Monotonicity Conditions and Applications. Book of Abstracts of the 5th International Conference on Physics and Control (PhysCon 2011), September 5-8,
2011, pp. 87.
122
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18
19
20
21
22
23
24
25
26
Dykhta V., Samsonyuk O. Some Applications of Hamilton-Jacobi Inequalities for Classical and Impulsive Optimal Control Problems. European Journal of Control, 2011, vol. 17, pp. 55-69.
Dykhta V.A., Samsonyuk O.N. Optimal'noe impul'snoe upravlenie s prilozheniyami [Optimal Impulsive Control with Applications]. Moscow, Fizmatlit, 2000.
Zavalishchin S.T., Sesekin A.N. Impul'snye processy: modeli i prilozhenija [Impulse Processes: Models and Applications]. Moscow, Nauka, 1991.
Miller B.M. Method of Discontinuous Time Change in Problems of Control of Impulse and Discrete-Continuous Systems. Autom. Remote Control, 1993, vol. 54, no. 12, part 1, pp. 1727-1750.
Miller B.M., Rubinovich E.Ya. Optimizatsiya dinamicheskikh sistem s impul'snymi upravleniyami [Optimization of Dynamic Systems with Impulsive Controls]. Moscow, Nauka, 2005.
Gurman V.I. Printsip rasshireniya v zadachakh optimal'nogo upravleniya [The Extension Principle in Optimal Control Problems]. Moscow, Nauka, 1997. Baturin V.A., Dykhta V.A., Moskalenko A.I., et al. Metody resheniya zadach teroii upravleniya na osnove principa rasshireniya [Methods for Solving Problems in Control Theory on the Basis of an Extension Principle]. Novosibirsk, Nauka, 1990.
Dykhta V.A. Variatsionnyi printsip maksimuma i kvadratichnye usloviya optimal'nosti impul'snykh protsessov [The Variational Maximum Principle and Quadratic Optimality Conditions for Pulse Processes]. Irkutsk, IGEA, 1995. Miller, B.M. Optimality Condition in the Control Problem for a System Described by a Measure Differential Equation. Autom. Remote Control, 1982, vol. 43, no. 6, part 1, pp. 752-761.
Miller, B.M. Conditions for the Optimality in Problems of Generalized Control. I, II, Autom. Remote Control, 1992, vol. 53, no. 3, part 1, pp. 362-370; no. 4, pp. 505-513.
Arutyunov A.V., Karamzin D.Yu., Pereira F.L. On Constrained Impulsive Control Problems. J. Math. Sci., 2010, vol. 165, no. 6, pp. 654-688.
Motta M., Rampazzo F. Space-time Trajectories of Nonlinear Systems Driven by Ordinary and Impulsive Controls. Differential Integral Equations. 1995, vol. 8, pp. 269-288.
Silva G.N., Vinter R.B. Measure Differential Inclusions. J. of Mathematical Analysis and Applications. 1996, vol. 202, pp. 727-746.
Miller B.M. The Generalized Solutions of Nonlinear Optimization Problems with Impulse Control. SIAM J. Control Optim. 1996, vol. 34, pp. 1420-1440. Sesekin A.N. On the Set of Discontinuous Solutions of Nonlinear Differential Equations. Izv. Vyssh. Uchebn. Zaved., Mat., 1994, vol. 38, no. 6, pp. 83-89. Sesekin A.N. Dynamical Systems with Nonlinear Impulsive structure [Dinamicheskie sistemy s nelinejnoj impul'snoj strukturoj]. Trudy Inst. Mat. Mekh. UrO RAN, Ekaterinburg, 2000, vol. 6, pp. 497-510.
Samsonyuk O.N. Invariant Sets for Nonlinear Impulsive Control Systems. Autom. Remote Control, 2014. (To appear).
Samsonyuk O.N. Strong and Weak Invariance for Nonlinear Impulsive Control Systems. Book of Abstracts of IFAC WC 2011, 2011, pp. 3480-3485. Samsonyuk O.N. Compound Lyapunov Type Functions in Control Problems of Impulsive Dynamical Systems [Sostavnye funkcii tipa Lyapunova v zadachah upravleniya impul'snymi dinamicheskimi sistemami]. Trudy Inst. Mat. Mekh. UrO RAN, Ekaterinburg, vol. 16, pp. 170-178.
27. Dykhta, V.A., Samsonyuk O.N. Canonical Theory of Optimality for Impulsive Processes [Kanonicheskaya teoriya optimal'nosti impul'snyh processov]. Sovrem. Mat. Fundament. Napravl., 2011, vol. 42, pp. 118-124.
Samsonyuk Olga, Candidate of Sciences (Physics and Mathematics), Senior Researcher, Institute for System Dynamics and Control Theory of Siberian Branch of Russian Academy of Sciences, 134, Lermontov st., Irkutsk, 664033; tel.: (3952) 453151
Associate Professor, Irkutsk State University, 1, K. Marx st., Irkutsk, 664003 (e-mail: [email protected])