УДК 681.511.4;681.513.5
ПОСТРОЕНИЕ РОБАСТНОГО У0РА0ЛЕ0ИЯ ДЛЯ БИЛИНЕЙНОГО ОБЪЕКТА С ПАРАМЕТРИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТЬЮ
В.Н. Афанасьев, Е.Р. Бовшук
Рассмотрена задача робастного управления билинейной неопределенной системой в условиях неполной информации о ее параметрах. Поставлены задачи робастной стабилизации и ^-робастного терминального управления. Найдены необходимые условия существования стабилизирующего управления. Получены необходимые и достаточные условия существования терминального робастного управления.
Ключевые слова: робастное управление, билинейная система, параметрическая неопределенность, робастная стабилизация.
ВВЕДЕНИЕ
Билинейные системы достаточно хорошо моделируют реальные процессы в технике, экономике, биологии, социологии и др. Будучи нелинейными динамическими системами, при решении многих вопросов они допускают полное аналитическое исследование и, следовательно, позволяют получать результаты достаточно общего характера [1]. Нелинейность билинейных систем порождает большое разнообразие принципиально отличающихся частных случаев, анализ которых весьма специфичен и может потребовать привлечения специальной техники исследования. Цель данной работы заключается в разработке метода исследования поведения билинейного объекта с параметрической неопределенностью, находящегося под воздействием управления, синтезированного с помощью робастной линейной модели первого приближения. Рассматриваются задачи стабилизации и терминального управления с заданным показателем точности.
1. ПОСТАНОВКА ЗАДАЧИ
Пусть неопределенный билинейный объект описывается уравнением:
й х(?) = (А + а(?))х(?) + (В + р(?) + х(?)К)и(?). (1)
Здесь х е Я ”, и е Яг, г т п. Вектор-строка К размером 1 х г состоит из действительных элементов. Матрицы а(?), Р(?) е О содержат параметры, подверженные неконтролируемым возмущениям; О — замкнутое ограниченное множество в евклидовом
пространстве Яр. Начальное состояние принадлежит ограниченному множеству, т. е. х(?0) е Х0.
В работе не исследуется вопрос об управляемости объекта (1). Предполагается, что известная пара (А, В) обеспечивает объекту свойство управляемости при отсутствии параметрических возмущений и множество О таково, что при всех возможных а(?), Р(?) е О пара (А + а(?), В + р(?)) сохраняет управляемость объекта во всем интервале управления. Задана цель терминального управления: |п[х(Т)]| < й, п: Я” ^ Як — оператор проектирования из Я” в Як, й — фиксированная неотрицательная величина.
Задача управления объектом заключается в построении такой стратегии и(^ е и, при которой достигается цель управления и минимизируется функционал
/(х, и) = 1 хт(Т )¥х(Т) + т
+ 2 |{хт(00х(0 + ит(^Яи(^}Л, (2)
где задан интервал управления [?0, Т ], матрица Я — положительно определена, матрицы Q и ¥ — положительно полуопределены.
Сформируем робастную модель объекта (1): -|г(?) = (А + а*)г(0 + (В + р* + г(?)К)и(0,
¿(¿о) = хо. (3)
Здесь матрицы а*, в* е ЗО таковы, что
||(А + а*)г(0 + (В + в* + г(0К)и(?)|| 1 1 ||[А + а(?)]х(?) + (В + в(-) + х(?)К)и(?)||. (4)
Таким образом, решение уравнения (3) является мажорирующим (в смысле неравенства (4)) для различных решений уравнения (1). Модель (3) будет использоваться для нахождения управлений и(-).
2. СИНТЕЗ УПРАВЛЕНИЯ ПО ПЕРВОМУ ПРИБЛИЖЕНИЮ
Будем искать управление и(-) е и как функцию состояния объекта (1): и(-) = Нх(-). Поиск матрицы Н осуществляется с помощью линейной модели, которая имеет вид:
dtzM(t) _ (А + a*)zM(t) + (B + Р*)и*(?)’
zm(?o) = x0-
(5)
Для того чтобы регулятор в терминальной задаче содержал постоянные параметры, назначим матрицу штрафа первого слагаемого функционала
(2) в виде F = S, где положительно определенная матрица S является решением уравнения Рикка-ти—Лурье:
S(A +а*) + (A + a*)TS —
- S(B + p*)R-1(B + p*)TS + Q = 0. (6)
Очевидно, что в случае такого назначения матрицы F будет выполняться соотношение — S(t) = 0,
dt
т. е. S = const на всем интервале управления.
Оптимальное управление для модели (5) с функционалом качества (2), в котором вместо z(t) подставим ZM(t), имеет вид [2, 3]:
u*(t) = -R X(B + P*)T&m(í).
(7)
Нетрудно убедиться, что синтезированное управление (7) обеспечивает отрицательность вещественных частей корней характеристического уравнения системы первого приближения
-|гм(0 = {А + а* - (В + в*)Я-1(В + в*)т*Мгм(0,
что является необходимым и достаточным условиями ее асимптотической устойчивости.
Используем структуру управления (7) для построения управлением объектом (1) и его робастной модели (3). Уравнения объекта и его робастной
модели с соответствующими управлениями будут иметь вид
й-Д?) = {А + а(-) - (В + в(1) + х(-)К) х х Я-1(В + в*)т^}х(?), х(-о) = хо, й-ДО = {А + а* - (В + в* + ¿(-)К) х
х Я-1(В + в*)тад), ¿(-о) = хо. (8)
Что касается значения функционала качества, то справедливо следующее соотношение:
2хт(0)£х(0) т /(х(-), и(х(-))) т /(г(0, и(г(?))).
Отметим [4, 5], что использование управления по первому приближению для управления нелинейным объектом не изменяет качественной картины расположения траекторий в начале координат. Это можно отнести и к билинейным объектам; т. е. управление по первому приближению вида (7) для робастной модели (3) не изменяет качественной картины расположения траекторий в начале координат. Этим свойством, в силу условия (4), обладают и траектории объекта (1).
3. НЕОБХОДИМЫЕ УСЛОВИЯ СУЩЕСТВОВАНИЯ СТАБИЛИЗИРУЮЩЕГО УПРАВЛЕНИЯ
Найдем необходимые условия существования стабилизирующего управления вида (7) для робастной модели (3), т. е. условия, при которых ¿(¿) ^ 0 при - ^ да.
Решение уравнения (8) имеет вид:
¿(¿) = [ехр(П)] |г(0) - |[ехр(-Пх)]г(х)КЯ-1 х
X (B + p*)TSz(T)^, (9)
где П = A + a* - (B + e*)R X[B + p*]TS.
Обозначим N = KR-1(B + P*)TS, и перепишем уравнение (9) в виде:
lk(t)|| =
[exp(n)] s z(0) - J[exp(-m)]z(x)Nz(x)dx
Если z(t) ^ 0 при t ^ да, то
z(0) - J [exp(-m)]z(x)Nz(x)dx
или
J[exp(-№)]z(x)Nz(x)dx ^ ||z(0)|| при t ^ да. (10)
0
0
0
0
Так как величина ||г(0)|| конечна, то при - ^
Определение. Назовем билинейную систему
выражение
должно иметь
конечное значение. Учитывая, что
| [ехр(-Пт)]г(т)Л^(т)аГ
о
І
т |||[ехр(-Пх)]г(х)^г(т)||^х,
о
(11)
условие (10) будет выполняться, если подынтегральное выражение в правой части неравенства (11) будет убывать. Потребуем, чтобы положительно определенное подынтегральное выражение убывало монотонно.
Отметим, что запас устойчивости, определяемый выполнением этого требования, сужает область возможных значений начальных условий, при которых сохраняется устойчивость системы. Вполне уместно более узкий класс систем, в котором выполняется предъявляемое требование, отнести к системам, обладающим свойством «сверхустойчивости» («сверхстабилизируемым») [6].
Найдем условия, которые определят это свойство. Рассмотрим правую часть неравенства (11). Так как действительные части корней характеристического уравнения матрицы П отрицательны, то существуют постоянные Ь и р такие, что ||ехрГО || < Ье-^, - 1 0. Тогда
t t
|||{ехрп(? - т)}г(т)Л^(т)||йт т Ье-^ | ерт||г(т)^г(х)||йх.
о о
Если начальные условия системы таковы, что г(-) ^ 0 при - ^ да, т. е. система устойчива, то ||г(0)Л^(0)|| > ||г(?)Л^(?)||, - > 0. Следовательно
І
{||{ехрП(і - т)}г(т)ЛВД||Ст т 1 Х||г(0)Щ0))||[1
- е-рІ]
Что касается подынтегрального выражения, то условие сверхустойчивости, в том понимании, которое было введено выше, имеет вид:
||{ехрш}г(?)Л^(?)|| т Ье-(Ч|г(?)Л^(?)||.
При этом рост интегральной составляющей решения уравнения (9) не превосходит некоторого вполне определенного значения, т. е.
- е-рІ]
Сі
г(і) = [П + г(і)^]г(і),
г є
В”,
у которой корни А,;, I = 1, 2, ..., п, характеристического уравнения системы первого приближения имеют отрицательные действительные части, свер-хустойчивой, если
||{ехрп?}г(?)^г(?)|| т Ье-рЧ|г(?)^(?)||, -1 0,
где Ь > 0 и (-р) = шах(Ке^г) < 0. ♦
Вернемся к условию (11). Оно будет выполняться, если производная по времени от положительно определенной формы
||{ехр(-ш)}г(?)№г(?)|| > 0, г * 0,
будет отрицательной, т. е. условие монотонного убывания подынтегрального выражения (11) имеет вид [7]:
||П{ехр(-т)}г(0Л?г(0|| >
г * 0.
{ехр(-п)} с (г ( ^г( 0)
(
2)
Учитывая, что П{ехр(-П)} = {ехр(-П)}П, из условия (12) можно получить условие на изменение во времени билинейной части г(?)Л^г(?):
С ( г ( і) Щ Ї) )
СІЇ
< ||Пг(?)^г(?)||, -1 0, (13)
или, учитывая, что ||Пг(?)^г(?)|| 1 ||П||||г(?)^г(?)||,
С (г ( і) Ш( і) )
СІЇ
/||г(?)^г(?)|| < ||П||, г(і) * 0 при і = 0.
Так как при выполнении условия (13) обеспечивается монотонное убывание нормы подынтегрального выражения (10), то система (8) асимптотически устойчива.
Отметим, что матрица П зависит от ряда параметров, существенным из которых для выполнения условий задачи стабилизации системы положительная определенность матрицы ^ — решения уравнения (6). Так как ^ = £(0, В), то, назначая соответствующим образом матрицы 0 и В, при заданном начальном состоянии объекта ¿(0) и известной матрице N можно получить решение уравнения (8) таким, что будут выполняться условие стабилизации робастной модели объекта:
Сг(т ) ТУг( т )
СІЇ
< ||Пг(і)КВ Х(В + р*)Гад В)г(ї)||,
г(ї) * 0, і = 0.
(14)
Из неравенства (14), определяющего условия монотонной асимптотической сходимости подынтегрального выражения в неравенстве (11), при за-
да
о
о
данной матрице П и известных параметрах матрицы N можно определить условия для начального состояния объекта, при которых решение уравнения (8) будет устойчивым.
Полученный результат сформулируем в виде теоремы.
Теорема 1. Пусть задан билинейный неопределенный объект вида (1) и а*, в* е 30 такие, что ||(А + а*)х(-) + (В + в* + х(-)К) и(-)|| 1 ||(А + а(?))х(?) + + (В + в(-) + х(-)К)и(-)||. Тогда необходимое условие
существования управления вида и(-) = -В Х(В + в*) х х £х(?), где £ удовлетворяет уравнению (6), при котой (х (- )^( -))
ром x(t) ^ 0 при t ^ да, имеет вид:
dt
<
< ||Пх(?^х(?)||, х(-) * 0, - = 0. ♦
Несколько иное условие устойчивости можно получить, рассмотрев подынтегральное выражение правой части неравенства (11) и умножив его слева на [г(т)^(т)]т, т. е.
[г(0^(?)]т{ехр(-т)}г(0Щ0 > 0, г(-) * 0. (15)
Условие асимптотической устойчивости будет иметь место, если производная по времени левой части выражения (15) будет отрицательна при г(-) * 0:
й {(г(?№(0)т{ехр(-т)}г(№(?)} =
dt (z(t)Nz(t))T
+ (z(t)Nz(t)) {exp(-nt)}
{exp(-nt)}z(x)Nz(x) + d
dt
z(t)Nz(t)
- (г(?№(0)7П{ехр(-ш)}г(?)Щ0 < 0
или, учитывая коммутативные свойства выражения ехр(-П), будем иметь
dt (z(t)Nz(t))T
z(t)Nz(t) + (z(t)Nz(t))J
dt
z(t)Nz(t)
- (г(?№(0)7Пг(0^(0 < 0.
Таким образом, робастная модель системы с начальными условиями, при которых выполняется условие
dt (z(t)Nz(t))T
z(t)Nz(t) + (z(t)Nz(t))T
- (г(і)^г(і))гПг(і)^г(і) < 0, і = 0, г(0) * 0, (16)
асимптотически устойчива.
Сформулируем полученный результат в виде теоремы.
Теорема 2. Система
d-z(t) = [П + z(t)N]z(t), dt
z є Rn
асимптотически устойчива, если:
— решение уравнения —-¿^0 = Пгм(-), г^(-о) = хо
стремится к нулю при - ^ да;
— начальные условия системы таковы, что
- (z(t)Nz(t))T
z(t)Nz(t) + (z(t)Nz(t))T
dtz(t)Nz(t)
- ШШ(-))ТП(-)Ш(-) < 0, - = 0, г(0) * 0. ♦
Условия существования стабилизирующего управления вида (7) можно получить, введя функцию Ляпунова:
V =zT(t)Sz(t),
(17)
где положительно определенная матрица £ есть решение уравнения (6).
Производная функции (17)
й V = -гТ(-)[0 + £(В + в*)В-1(В + в*)Т£ +
+ &(^ + ^гт(?)£]г(?) < 0, г(-) * 0.
Таким образом, система, описываемая уравнением (8), асимптотически устойчива, если
гт(0Ш + £(В + в*)Я-1(В + в*)т£]г(-) >
> -zT(t)Sz(t)Nz(t) - zT(t)NTzT(t)Sz(t) < 0 при z(t) ^ 0.
(18)
Отметим, что условие (18) предъявляет требования к начальным условиям рассматриваемой системы менее строгие, чем условия (14) и (16).
4. РОБАСТНОЕ ТЕРМИНАЛЬНОЕ УПРАВЛЕНИЕ НЕОПРЕДЕЛЕННЫМ БИЛИНЕЙНЫМ ОБЪЕКТОМ
Рассмотрим вопрос о существовании управления вида (7) при движении билинейной неопределенной системы в заданном интервале времени из любого начального состояния в заданную область.
Очевидно, что область начальных условий Хо*, при которых задача робастного управления будет решена, зависит от значений параметров матриц А(-) = А + а(-), В(-) = В + в(-) и N и весовых матриц функционала 0, Я (и таким образом от управления и(-о, Т)), периода управления, задания области конечных состояний объекта, т. е. область возможных начальных условий определяется выражением
X* = |а(0, в(-) е О, К, и*(-о, Т): й|х(?) =
= A(t)x(t) + (B(t) + x(t)K)u(t), |x(T)| < d
Условие С-робастности для модели объекта
С г(і) = [А + а* Сі
(В + р* + г(і)К) х
х В !(В + р*)тадо, г(іо) = х0 є х,
имеет вид
||г(Т)|| =
т
[ехр(ПТ)]г(0) - |[ехр(-Пт)]г(т)Л^(т)Ст
о
Откуда
< С.
||[ехр(П7)]г(0)|| - С - С т | ||[ехр(-Пх)]г(т)№г(т)||йх.
о
(19)
Если условие (19) не выполняется, то это означает, что для робастной модели объекта
Сг(-) = [А + а* - (В + в* + г(-)К) х
х Я- 1(В + в*)т£]г(-)
с начальным условием г(0) = хо е Хо и заданным периодом управления [0, Т ] не существует управления вида и(-) = Нг(-) = -Я- 1(В + в*)Т£г(-) с постоянной положительно определенной матрицей £, определяемой решением уравнения (6), при котором будет выполняться условие ||г(Т )|| т С.
Выполнение условия (14) обеспечивает переходному процессу асимптотическое свойство и налагает соответствующие требования на поведение билинейной формы, входящей в систему. Таким образом, его выполнение является необходимым условием существования С-робастного управления.
Условие (19) является дополнительным условием, обеспечивающим достаточные условия существования С-робастного управления.
Выполнение обоих условий гарантирует решение задачи С-робастного управления нестационарным объектом.
Полученный результат сформулируем в виде теоремы.
Теорема 3. В задаче управления билинейным неопределенным объектом вида (3), где и(-) = -Я 1(В + + в*)£г(-) и матрица £ — решение уравнения (6), ус-
С ( г ( -) Nz( -) )
Iа
ловия
< ||Пг(і)^г(і)||, г(і) * 0, і = 0 и
||[ехр(ПТ)]г(0)|| - С т | ||(ехр(-Пт))г(т)^(т)||Ст,
о
являются соответственно необходимым и достаточным условиями существования С-робастного управления. ♦
5. ПРИМЕР
Предполагается, что управление по первому приближению найдено, билинейная система «объект — регулятор» имеет вид:
А
Аі
х1 I = I 0 1
:2-
х2 V V -2 -3 у V х-
или в координатной форме:
А
1 I +
2
Л
-х1х2 - 2х2 у
А*1
Т х2
Аі 2
- 2х1 - 3х2 - х1х2 - 2 х2.
Требуется найти такую область начальных условий, чтобы начинающиеся из нее траектории отвечали условию х(г) ^ 0 при ? ^ да.
Запишем для рассматриваемого примера матричное нелинейное неравенство (16), взяв производные по ?:
0
- 2x2 (0) - х1( 0) Х2( 0)
Л
(0 (-4x2(0) - х^0)) х
х [-2х1(0) - 3х2(0) - х1(0)х2(0) - 2х2 (0)] - х2)
- I 0 1
V -2 -3
2
0
- 2х2( 0) - х1( 0) х2( 0) х (0 -2х2 (0) - х1(0)х2(0)) < 0, х1(0) ф 0, х2(0) ф 0. Откуда:
(- 2х2( 0) - х1 (0) х2( 0 ))2 > 0
(- 2х2( 0) - х1( 0) х2( 0 ))[8 х2( 0) + 8х1( 0) х2( 0) + 5х2( 0) + + 6х1(0)х2(0) + 2х2(0) + х2(0)х2(0)] < 0.
Рис. 1. Область начальных условий. Начинающиеся из нее траектории асимптотически убывают
АНАЛИЗ И СИНТЕЗ СИСТЕМ УПРАВЛЕНИЯ
1
Рис. 2. Графики переходных процессов компонент вектора x(t)
Таким образом:
x1,1 2x2’ x1,2
- 4x2 - 3x2 -J6x2 + 3x3 + x2 ,
2 + xn
_ - 4x2 - 3x2 + ^/б x2 + 3x3 -4
2 3 x2 x2
2+x
Полученные матричные неравенства позволяют определить область начальных условий, начинающиеся из которой траектории асимптотически убывают. На рис. 1 показана эта область начальных условий X0 (заштрихована).
На рис. 2. представлены графики переходных процессов систем: время окончания переходного процесса T = 8 с; условие d-робастности |х(Т )| < 0,2.
ЗАКЛЮЧЕНИЕ
Представлен новый метод исследования поведения билинейных объектов с параметрической неопределенностью, находящихся под воздействием управления, синтезированного с помощью робастной линейной модели первого приближения. Рассмотрены задачи робастной стабилизации и С-робастного терминального управления. Найдена
область начальных условий, начинающиеся из которой траектории асимптотически убывают.
ЛИТЕРАТУРА
1. Емельянов С.В., Коровин С.К. Стабилизация неопределенных динамических объектов с непрерывным временем. В сб. «Новые методы управления сложными системами». — М.: Наука, 2004. — С. 87—148.
2. Атанс М., Фалб П. Оптимальное управление. — М.: Машиностроение, 1968.
3. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. — М.: Высшая школа, 2003.
4. Немыцкий В.В., Степанов В.В. Качественная теория дифференциальных уравнений. — М.: Едиториал УРСС, 2004. — 552 с.
5. Колдингтон Э.А., Левинсон Н. Теория обыкновенных дифференциальных уравнений. — Там же, 2007. — 472 с.
6. Поляк Б.Т., Щербаков П.С. Робастная устойчивость и управление.— М.: Наука, 2002. — 303 с.
7. Беллман Р. Теория устойчивости решений дифференциальных уравнений. — М.: Едиториал УРСС, 2003. — 216 с.
Статья представлена к публикации руководителем РРС О.В. Абрамовым.
Афанасьев Валерий Николаевич — д-р техн. наук, проф., зав. кафедрой, И [email protected],
Бовшук Евгения Руслановна — аспирантка, И [email protected], Московский государственный институт электроники и математики.