УДК 517.977
Е. Н. Хайлов, Э. В. Григорьева
ОПИСАНИЕ МНОЖЕСТВА ДОСТИЖИМОСТИ ОДНОЙ НЕЛИНЕЙНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ НА ПЛОСКОСТИ1
(кафедра оптимального управления факультета ВМиК)
На плоскости рассматривается нелинейная система х = Ах + шр(х)Ь-\- d со скалярным ограниченным управлением. При определенных предположениях исследуется множество достижимости Х(Т) такой системы. Применение принципа максимума позволяет установить, что каждой граничной точке множества Х(Т) отвечает кусочно-постоянное управление, имеющее не более одного момента переключения. Поскольку выполнение принципа максимума является лишь необходимым условием принадлежности конца траектории рассматриваемой системы границе множества достижимости Х(Т), то дополнительно изучается вспомогательное множество Z(T). Это множество состоит из концов траекторий исходной системы, отвечающих всевозможным кусочно-постоянным управлениям, имеющим не более двух моментов переключения. Исследуются свойства внутренних и граничных точек множества Z(T), которые затем дают возможность доказать совпадение множеств Х(Т) и Z(T). Отсюда вытекает требуемое описание границы и внутренности множества достижимости Х(Т), наследуемое им от множества Z(T). Результаты, представленные в настоящей работе, являются продолжением исследований авторов, ранее начатых в [1].
Рассмотрим на плоскости R2 следующую нелинейную управляемую систему:
x(t) = Ax(t) + u(t)(p(x(t))b+ d, t £ [0, T], x(0) = x0, (1)
где А — матрица порядка 2x2; ж(-), хо, b,d Е R2.
Под классом допустимых управлений Р(Т) понимаем всевозможные измеримые функции u(t), удовлетворяющие неравенству щ ^ и(t) ^ щ при почти всех t £ [О, Г].
Обозначим через а след матрицы А, а через ß — ее определитель.
Сформулируем предположения, при которых будут проводиться последующие рассуждения.
Условие 1. Векторы b, Ab линейно независимы.
Условие 2. Определены число М > 0 и область G С R2 такие, что, во-первых, хо £ G] во-вторых, для произвольного управления и(-) £ Р(Т) существует решение x(t) системы (1) на отрезке [О, Г], удовлетворяющее включению x(t) £ G и неравенству ||ж(£)|| < М для всех t £ [О, Г]; наконец, в-третьих, непрерывно дифференцируемая функция <~р{х) при любом х £ G подчиняется неравенству <~р{х) > 0. Здесь через ||у|| обозначаем евклидову норму вектора у £ R2.
Условие 3. Квадратное уравнение
А2 + (а - ur1(x))X+ (ß - иг2(х)) = 0 (2)
для всех х £ G и и £ [111,112] имеет положительный дискриминант
D(x, и) = (а — игi(x))2 — 4(/3 — игг(ж)).
Для его корней Ai;2 (ж, и) = 0,5 • (— (а — иг\(ж)) ± y/D(x, и)) существует такое число г/, что справедливо неравенство
Ai (ж, -гг) ^ v ^ А2 (х,и) (3)
при любых х £ G и и £ \u>i, U2I• Здесь под функциями гi (ж), гг(ж) понимаем выражения:
= (Й^' АЬ) '
Обозначим через Х(Т) множество достижимости системы (1) из точки xq в момент времени Г, т.е. множество значений ж (Г) решений (1), отвечающих всевозможным управлениям и(-) £ Р(Т). Из
1 Работа выполнена при финансовой поддержке РФФИ (проект 01-03-00737 и грант поддержки ведущих научных
школ НШ-1846.2003.1), а также программы "Университеты России" (УР.03.03.008).
теоремы 2 работы [2] следует, что множество Х(Т) есть компактное множество в К2, а из условия 2 немедленно вытекает включение Х(Т) С С.
Считаем, что дС} и \ritQ есть граница и внутренность компактного множества (5 С И2. В работе [1] для граничных точек множества Х(Т) было доказано следующее утверждение (был привлечен принцип максимума из [2]).
Теорема 1. Пусть точка х принадлежит границе множества достижимости Х(Т). Тогда отвечающее ей управление и{£), £ Е [О, Т], является кусочно-постоянной функцией, принимающей значения {щ^щ} и имеющей не более одного переключения на интервале (О, Г).
Теперь рассмотрим множество
А(Г) ={■&= (01, 02)Т £ К2 : 0 «С 1?! «С 02 ^ Т) .
Здесь знак т означает транспонирование.
Для каждой точки ■& 6 А(Г) построим управление и$(-) 6 Р(Т) по формуле
(И2, если 0 ^ £ ^ $1,
щ, если 1 < £ ^ 02, (4)
И2, если 02 < Ь ^ Т.
Затем обозначим через £ 6 [О, Г], решение системы (1), отвечающее управлению
После чего считаем функцию Ф^ (¿), £ 6 [О, Г], решением матричного уравнения в вариациях [3]
= ^ + ^ te[o,т], Ф4Т) = Е, (5)
где Е — единичная матрица.
Наконец, определим отображение Е : А (Г) —> К2 по правилу
= 1? е Л(т).
С помощью этого отображения введем множество Z(T) = Е(А(Т)).
В работе [1] было доказано утверждение, устанавливающее ряд важных свойств, которыми обладает множество Z(T).
Теорема 2. Выполняются следующие равенства:
Е(ЫА(Т)) = Ыг(Т)1 Е(дК(Т)) = дг(Т), (6)
и сужение отображения Е(-) на внутренность множества Л(Т) взаимно однозначно.
Из определений множества достижимости Х(Т), множества Z(T) и результатов теорем 1, 2 вытекают включения:
г{т)сх{т), дх{т)сдг{т). (7)
Дальнейшее изучение множества Z(T) связано с исследованием его границы. Анализируя определения множеств Л(Т), Z(T) и результаты, полученные в теореме 2, видим, что границу множества Z(T) образуют две кривые $ £ и ^(УЬ т £ [0, X1]. Первая состоит из всех концов х(Т)
траекторий £ 6 [О, Г], системы (1), отвечающих управлениям вида
, , /^2, если 0 ^ £ ^ 0, У( ' = \и1, если 0 < г <С Т.
Вторая образована концами х(Т) траекторий £ 6 [О, Г], системы (1), отвечающими управлениям вида
щ, если 0 ^ £ ^ (Г — г),
^ \и2, если (Г - г) < г <С Т. Здесь 0, (Т — г) есть моменты переключений, для которых 0, г 6 [О, Г].
Можно видеть, что для введенных выше кривых 7?(г) имеют место равенства:
®1=Х(0) = »7(0), х2=Х(Т) = г](Т). (8)
Замечание. Из соотношений (6) теоремы 2 следует, что кривые 7?(г) помимо ситуаций
из (8) не могут пересекаться или касаться друг друга для значений 0, г £ (0,Т) таким образом, что множество \iitZiT) разбивается на две или более непересекающихся областей.
Теперь изучим свойства функций $ £ и ^(У); г £ [0,X1]. Для этого, выполняя рассуж-
дения, подобные представленным в [4], вычислим производные:
г)т
— (*) = (И2 - (0)6, * 6 [0, Г], (9)
г)т
— (*) = (и2 - щ)ф(Т - г))0(£)0_1 (Г - т)Ь, * £ [Г - г, Г],
где матричные функции Ф(£), ©(£) являются решениями задачи Коши (5), отвечающими управлениям ги(£) и траекториям £ £ [О, Г], соответственно.
На основании этих выражений выпишем формулы для производных функций 7?(г)-
Лемма 1. Справедливы следующие соотношения :
х(0) = (и2 -И1)¥.(ж(0))ф-1(0)6, 0 6 (О,Г), (10)
77(т) = (И2 -^М^Т-г))©-1^-^ г 6 (О,Г).
Кроме того, из формул (9) находим равенства: пт ПТ
_(0) = (и2 - щМт)Ъ, ^(Т -т) = (и2 - щ)ф(Т - т))Ь. (11)
Определим для вектора Ь = (Ъ\, Ь2)т вектор д = (Ь2, — &1)т. Заметим, что этот вектор обладает следующими свойствами.
Лемма 2. Вектор д £ И2 подчиняется равенствам:
(Ь,д) = 0, (АЪ,д) = -с1еф, АЬ]. (12)
Здесь через с1е1;[р1,р2] обозначен определитель, в котором столбцами служат векторы р1,р2 £ И2. Поэтому из соотношений (11) и первого равенства из (12) следуют выражения:
Ш(г-Г)^)=0- (13)
Для оставшихся значений £ справедливо утверждение. Лемма 3. Имеют место неравенства:
¿еЬ[Ъ,АЪ](^),д) < О, Ь £ (0, Т], (14)
¿еЬ[Ъ,АЪ] < 0, ¿Е(Т-г,Т].
Доказательство проведем для функции §§(£), Ъ £ [0,Т]. Обоснование требуемого неравенства
д-д ' :яет
дх , ч \ , ч ( дх
из (14) для функции я^(^), £ £ [Т — г, Г], выполняется полностью аналогично. Введем функции:
51(*)= (15)
Для них из (13) и второй формулы из (12) имеем равенства:
Л(0) = 0, д2{$) = -(^-Щ) с1еф,А&Мж(0)).
Получим теперь дифференциальные уравнения для функций (15). Используем тот факт, что функция §f(i) удовлетворяет системе уравнений в вариациях, аналогичной (5). Тогда, учитывая первую формулу из (12), находим для gi(t) уравнение gi(t) = g2(t). Привлекая снова вторую формулу из (12) и теорему Гамильтона-Кэли [5] в виде А2 = а А — /ЗЕ, запишем для функции g2(t) выражение
Ù2(t) = -(3gi(t) + ag2(t) -det[b,Ab]v(t) . (16)
Используя определение (15) функций gi(t), g2(t) и выполняя в последнем слагаемом необходимые преобразования, перепишем равенство (16) в виде
Ы*) = ~{fi + av{t)ri{x{t)) - v{t)r2{x{t)))gi{t) + (a + v(t)r1(x(t)))g2(t). Таким образом, окончательно получаем для функций gi(t), g2(t) следующую задачу Коши: <71 (0 = 92 (t),
Ù2(t) = -(13 + av(t)ri(x(t)) - v{t)r2{x{t)))gi{t) + (a + v(t)ri(x(t)))g2(t), (17)
ffi (0) = 0, g2 (0) = ~(u2 -tii)det[M%(â:(0)).
Из [3] вытекает, что функции gi(t), g2(t) как решения данной задачи Коши могут быть продолжены на отрезок [О, Г]. Более того, из определения функции gi(t) и первого соотношения из (14) видим, что достаточно показать справедливость неравенства det[6, Ab]gi(t) < 0 при t G ($, Т]. Для этого приведем матрицу системы дифференциальных уравнений из (17) к верхнетреугольному виду. С этой целью, следуя работе [6], произведем в задаче Коши (17) замену переменных: 6 = gi, £2 = д2 —hgi, где h(t) — функция, подлежащая определению. Тогда, выполняя необходимые вычисления, находим
< = -(h(t) - {a + v{t)ri{x{t)))h{t) + h2{t) + {fi + av{t)ri{x{t)) - v(t)r2(x(t))))^(t)+ f .
+ (a + v(t)ri(x(t)) - h(t))Ç2(t), { J
= 6W = -(u2-u1)det[b,Ab]<p(x(^)).
Теперь доопределим функцию v(t) на отрезок [—T, 2Т] по правилу: v(t) = и2 для t G [—T, 0) и v(t) = u\ для t G (T, 2Т]. Тогда, как следует из [3], соответствующая функция x(t) продолжима на интервал (—5, Т + 25) для некоторого S > 0. Здесь 28 < Т.
Рассмотрим на интервале ( — 5, Т + 26) задачу Коши для линейного дифференциального уравнения второго порядка:
yW(t)-a(t)yW(t)+c(t)y(t) = 0, у(Т + 6) = 0, уМ(Т + 6)фО, (19)
где a(t) = а + v(t)ri(x(t)), c(t) = /3 + av(t)ri(x(t)) — v(t)r2(x(t)).
Поставим дифференциальному уравнению из (19) в соответствие обобщенное характеристическое уравнение ц2 (t) — a{t)fj,{t) + c(t) = 0. Его дискриминант преобразуется к виду
Q(t) = a2 (t) -4c(t) = D(x(t),v(t)), (20)
а потому, как следует из условия 3, он положителен при всех t G ( — 5, T-\-2S). Корни данного уравнения = 0,5 • (a(t) ± \/Q(t)) в силу (20) связаны с корнями квадратного уравнения (2) равенствами: ¡ii(t) = Xi(x(t), v(t)) + a, ¡-i2{t) = X2(x(t), v(t)) + a. Значит, из (3) и результатов работы [7] вытекает, что каждое нетривиальное решение y(t) рассматриваемого дифференциального уравнения имеет на интервале ( — 5, Т+25) не более одного нуля. Учитывая соответствующие начальные условия, получаем, что решение y(t) задачи Коши (19) удовлетворяет неравенству y(t) ф 0 при всех t G [0,Т].
Введем функцию h(t), t G [0,Т], по формуле h(t) = y(t) ■ (y(i))-1. Учитывая дифференциальное уравнение из (19), можно показать, что h(t) удовлетворяет на всем отрезке [0,Т] уравнению Риккати
h(t) - (а + v(t)ri(x(t)))h(t) + h2(t) + (fi + av(t)ri(x(t)) - v(t)r2(x(t))) = 0. Тогда, привлекая в систему (18) функцию h(t), получаем требуемую задачу Коши:
¿I(î) = M*)£I(*) + 6(Î),
¿(t) = (а + v(t)n(x(t)) - h(t)){2(t),
60?) = 0, = -(u2-u1)det[b,AbMx(i))).
Применяя в этой системе обобщение теоремы Ролля [6], находим, что функция имеет не более
одного нуля на интервале (О, Г). Начальное условие для функции и соотношение
^(0) = -{щ-и^АефтА^ф^))
позволяют сделать вывод о том, что с1е1;[Ь, < 0 при £ £ (0, Г]. Учитывая выполненную замену
переменных, имеем требуемое неравенство с1е1;[Ь, АЬ\д\{£) < 0 для £ £ (0, Г]. Доказательство желаемого факта завершено.
Как следствие леммы 3 на основании формул (10) получаем утверждение для производных функций х(0), г}{т).
Лемма 4. Справедливы следующие неравенства:
с1еф, АЬ] , д) < 0, (1 еф, АЬ] Ш, д) < 0, г £ (О, Г). (21)
Этот результат позволяет обосновать важное утверждение.
Теорема 3. Каждой точке х, отличной от точек х\, х2 из (8) границы множества отвечает единственное управление вида или £ £ [О, Г]. Точке х = х\ отвечают управление
с переключением 0 = 0 и управление ги(£) с переключением Т — т = Т. Точке х = х2 отвечают управление с переключением ■& = Т и управление ги(£) с переключением Т — т = 0.
Замечание. Данный факт говорит о том, что кривые х($)> 7?(г) помимо ситуаций из (8) не могут касаться друг друга для значений 0, г £ [О, Г] таким образом, что множество К2 \ Z(T) разбивается на две или более непересекающихся областей.
Доказательство проведем от противного. Предположим, что нашлась точка ж* £ дZ(T), которой отвечают различные управления вида или ги(£), £ £ [О, Г]. Рассмотрим возможные случаи.
Случай 1. Пусть ж* = х($1) = х($2) Ддя 0 ^ 01 < 02 ^ Т. Это означает, что точке ж* отвечают управления £ £ [О, Г], с переключениями 01,02 £ [О, Г]. Тогда ? = (х($2),д) Ддя
01 <02, что противоречит первому неравенству из (21). Значит, такой случай невозможен.
Случай 2. Пусть ж* = 77(7-1) = 1](т2) для 0 ^ т\ < т2 ^ Т. Это означает, что точке ж* отвечают управления -и?1 (£), ги2 (£), £ £ [О, Г], с переключениями (Т — 7*1), (Т — 7*2) £ [О, Г]. Поэтому (77(7-1), д) = (г](т2), д) для Г1 < 72, что противоречит второму неравенству из (21). Такой случай также невозможен.
Заметим, что при этом рассмотрены ситуации, когда одно из управлений, отвечающих точке ж*, является постоянным на отрезке [О, Г]. Тогда точка ж* есть концевая точка кривой или кри-
вой 1](т), для которой выполнены равенства (8). Аналогичное заключение можно сделать, когда оба управления, соответствующие точке ж*, постоянны на отрезке [О, Г].
Случай 3. Пусть ж* = = Для 0, ^ £ (О, Т). Это означает, что точке ж* отвечают два
управления — одно из них вида £ £ [О, Г], с переключением 0 £ (О, Г), а другое вида «?(£),
£ £ [О, Г], с переключением (Г — г) £ (О, Г). Тогда рассмотрим на множестве А(Г) неявное уравнение
с1е1;[Ь, А6](^(0) — ж*, д) = 0. (22)
Из определения функций «?(£), £ £ [0,Т], и формулы (4) вытекают соотношения: = (£),
то(^) = И(о,т-г)т (0> ^ ^ [0,2-1]. Тогда находим равенства: ж^ Т)т(Г) = .Р((0,Т)т) = ж* и Ж(о,т-т)т = = ^((0,Г — т)т) = ж*, из которых немедленно следует, что уравнение (22) имеет решения (0, Г)т, (0 ,Т-г)т.
Покажем теперь, что у уравнения (22) существуют решения, отличные от этих. Для этого рассмотрим функцию
/(0) = <1еф,АЪ](Р((#,Т)т)-х*,д), 0£ (0,Г).
Легко видеть, что /(0) = 0. Кроме того, из первого неравенства в (21) вытекает соотношение /(0) < 0. Значит, в малой окрестности величины 0 найдутся значения 01,02 £ (0, Г), что 01 < 0 < 02 и /(02) < < 0 < /(01). Следовательно, справедливы неравенства:
с1е1;[Ь, А6](^((01, Т)т) - х*,д) > 0, (1еф, А6](^((02, Т)т) - х*,д) < 0.
Отображение F(-d) является непрерывным на множестве А(Т). Поэтому в малых окрестностях точек (#i,T)T G дА(Т) и (i?2,Г)Т G дА(Т) найдутся точки G intA(T), для которых
det[b, Ab](F(ëi) - ж*, q) > 0, det[b, Ab](F(ë2) - жq) < 0.
Следовательно, существует точка G intA(T), для которой выполняется равенство
det[b,Ab](F(ë*) - ж*, g) = 0.
Заметим, что подобные рассуждения можно проделать и с точкой (О, Г — т)т.
Таким образом, установлено, что в малой окрестности точки ($,T)T G дА(Г) найдется точка G intA(T), для которой имеет место соотношение (22). В малой окрестности точки (О,Г — f)T G G дА (Г) существует точка G intA(T), которая также удовлетворяет (22). Поскольку множество Z(T) является компактным множеством, то из последних фактов следует, что прямая (ж —ж*, q) = 0 пересекает границу множества Z(T) помимо точки ж* еще и в точках у*, z*, которым отвечают управления v(t), t G [О, Г], с переключением i? G [О, Г], ■& ф ■& и w(t), t G [О, Г], с переключением (Г — f) G [О, Г], f ф г, соответственно. Значит, имеют место равенства: (х($)><7) = (х($)><7)> (л^)^) = , ç) • Оба этих соотношения противоречат неравенствам из (21). Поэтому ситуация, представленная в случае 3, не имеет места.
Таким образом, исходное предположение неверно и требуемое утверждение обосновано. Наконец, установим справедливость основного результата настоящей работы.
Теорема 4. Для множества достижимости Х(Т) и множества Z(T) имеет место равенство Х(Т) = Z(T).
Для доказательства требуемого соотношения, как следует из (7), достаточно показать выполнение включения Х(Т) С Z(T). Предположим противное, т.е. найдется точка у, удовлетворяющая соотношениям: у (f Z(T), у G Х(Т). Кроме того, возьмем произвольную точку z ^ Х(Т). Из результатов теорем 2 и 3 следует, что граница множества Z(T) разбивает плоскость R2 на два связных подмножества int Z(T) и R2 \Z(T). Связность последнего множества обеспечивает [8] существование такой непрерывной кривой 7(s), s G [0,1], что у = 7(0), z = 7(1) и 7(s) ^ Z(T) при s G (0,1). Поскольку множество Х(Т) является компактным множеством, то найдется значение s* G (0,1), что 7(5*) G дХ(Т). Таким образом, определена точка ж = 7(5*), удовлетворяющая одновременно соотношениям: ж G дХ(Т), х £ dZ(T), которые противоречат второму включению из (7). Значит, предположение неверно и требуемое включение имеет место. Утверждение доказано.
Таким образом, получено описание множества достижимости Х(Т) (его границы и внутренности) с помощью моментов переключений управлений (4), образующих множество А(Г), и отображения F(-d). Кроме того, в каждую внутреннюю точку множества Х(Т) приводит управление (4) с двумя переключениями, а в каждую граничную точку — с не более чем одним переключением.
СПИСОК ЛИТЕРАТУРЫ
1. Хайлов Е.Н., Григорьева Э.В. О множестве достижимости одной нелинейной системы на плоскости // Вестн. Моск. ун-та. Сер. 15. Вычисл. матем. и киберн. 2001. № 4. С. 27-32.
2. Ли Э.Б., Маркус Л. Основы оптимального управления. М., 1972.
3. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. М., 1982.
4. Hajek О. Control theory in the plane. Lecture Notes in Control and Information Sciences. 1991. V. 153.
5. Гантмахер Ф.Р. Теория матриц. M., 1988.
6. Dmitruk A. V. A generalized estimate on the number of zeros for solutions of a class of linear differential equations // SIAM. Journal on Control and Optimization. 1992. 30. N 5. P. 1087-1091.
7. Л e в и н А. Ю. Неосцилляция решений уравнения ж'"' + р\ (£)ж'"-1' + ... + pn(t)x = 0 // УМН. 1969. 24. № 2. С. 43-96.
8. Александров П. С. Введение в теорию множеств и общую топологию. М., 1977.
Поступила в редакцию 27.02.04