УДК 519.7
И. Б. Фуртат
АДАПТИВНОЕ УПРАВЛЕНИЕ НЕМИНИМАЛЬНО-ФАЗОВЫМИ НЕЛИНЕЙНЫМИ ОБЪЕКТАМИ
Представлено решение задачи адаптивного управления определенным классом нелинейных неминимально-фазовых объектов, когда измерению доступны только скалярные входной и выходной сигналы объекта. Приведены зависящие от параметров модели объекта и системы управления условия, при выполнении которых алгоритм управления, разработанный для минимально-фазовых объектов, работоспособен для неминимально-фазовых систем.
Ключевые слова: нелинейный объект, неминимально-фазовый объект, адаптивное управление, сингулярно возмущенная система.
Введение. При решении задачи управления объектом в условиях неопределенности, когда измерению доступны только скалярные входной и выходной сигнал объекта, часто выдвигается предположение о его минимально-фазовости. Наряду с этим в настоящее время предложены несколько решений по управлению неминимально-фазовыми объектами со скалярными входным и выходным сигналами в условиях неопределенности. Например, в работе [1] для управления неминимально-фазовыми устойчивыми объектами используется метод шунтирования. Последовательный компенсатор, позволяющий получить расширенную модель объекта с векторным управлением, рассмотрен в работе [2], однако это решение эффективно лишь для стабилизации объекта, который не подвержен воздействию внешних неконтролируемых возмущений.
В настоящей статье рассматривается решение задачи адаптивного слежения за эталонным выходным сигналом неминимально-фазовых нелинейных объектов определенного класса. Для синтеза закона управления используется модифицированный алгоритм адаптации высокого порядка [3]. Получены зависящие от параметров объекта и системы управления условия, при выполнении которых алгоритм, разработанный для минимально-фазовых систем, работоспособен и для неминимально-фазовых объектов.
Постановка задачи. Рассмотрим объект, модель которого описывается уравнением
Q(p)у(г) + N(р)*(уЦ)) = кЯ(р)п(1), ргу(0) = у, г = 1,..., п, (1)
где у(^, и(^) — скалярные выходной сигнал объекта и сигнал управления, доступные измерению; Q(p), N(p), Я(р) — нормированные дифференциальные операторы; *(у^)) — известная липшицева по у(^) гладкая нелинейность; р = Л / Л — оператор дифференцирования; к > 0 — неизвестный коэффициент; уг — неизвестные начальные условия.
Эталонную модель объекта определим уравнением
Qm (р)ут С) = ктг(), (2)
здесь ут(0 — выходной сигнал эталонной модели; г(^) — ограниченное задающее воздействие; Qm(p) — известный нормированный дифференциальный оператор с постоянными коэффициентами, причем Qm(Я) — гурвицев, где Я — комплексная переменная; кт > 0 — известный коэффициент.
Предположение 1. Коэффициенты операторов Q(p), N(p), Я(р) и коэффициент к — неизвестные числа, которые зависят от вектора неизвестных параметров $ е 2, где 2 — известное замкнутое множество возможных значений данных коэффициентов.
Предположение 2. Известны Q(p) = Qm(p) = п, Я(р) = т, N(p) < п и относительная степень у = п - т > 1.
Цель управления — синтез непрерывного закона регулирования, обеспечивающего ограниченность всех сигналов в замкнутой системе и выполнение целевого условия
|у(0 - Ут (г)| <5 при г > т и Уд е (3)
где т > 0 — момент времени, характеризующий начало выполнения неравенства (3); 5 > 0 — малое число.
Метод решения. Запишем оператор Я(р) в виде
Я( р) = Я+ (р) я~ (р), (4)
где Я(Х) и Я(Х) — многочлены с положительными и отрицательными вещественными частями корней соответственно; Я (р) = т\, Я(р) = т2.
Положим, что оператор Я(р) можно представить в виде следующей суммы:
Я+ (р) = Яо( р) + 6рАЯо( р), (5)
где Я0(^) — произвольный известный гурвицев многочлен, Я0(р) = т1, 9 > 0 — малый параметр. Запишем выражение (1), подставив в него уравнения (4) и (5):
9рАЯ)( р)"
б( р) у (г) + N (р) е (у (г)) = кЯ - (р) Я0( р )
1+-
Я0( р)
и (г).
(6)
(7)
Перепишем уравнение (6) в форме уравнений состояний:
х(г) = Ах(г) + Ее (у(г)) + В (и (г) + а(г)); у (г) = ц х(г);
¿(г) = 9~lF¿ (г) + Ж(г); с(г) = ¿2 ¿ (г),
где х(г) е Я", ¿(г) е Ят — векторы состояния медленных и быстрых составляющих соответственно; А, В, В, F, N, Ц1, Ц2 — числовые матрицы, полученные при переходе от выражения (6) к (7).
При а(г) = 0 первое уравнение системы (7) является минимально-фазовым, так как матрицы А, В и Ц1 зависят от коэффициентов устойчивых многочленов Q(X) и кЯГ(Х)Я0(Х). Третье же уравнение системы (7) является неминимально-фазовым, поскольку матрицы F, N и Ц2 зависят от коэффициентов устойчивого Я0(^) и неустойчивого АЯ0(^) многочленов. Поэтому необходимо определить возмущение а(г), при котором характер изменения системы (7) при а(г) ^ 0 будет подобен характеру изменения системы (7) при а(г) = 0. Воспользуемся теоремой об устойчивости сингулярно возмущенных дифференциальных уравнений [4], в соответствии с которой систему (7) перепишем следующим образом:
х(г) = Ах(г) + Ее (у(г)) + В (и (г) + а(г)) у (г) = ¿1 х(г); 92(г) = F¿ (г) + 9Ж(г),
о(г) = ¿2 ¿ (г).
Согласно теореме [4] рассмотрим сначала последнюю систему при 9 = 0:
х(г) = Ах(г) + Вм> (у(г)) + В (и(г) + о(г)) у (г) = ¿1 х(г), 0 = Fz (г), ст(г) = ¿22(г).
Третье уравнение системы (8) имеет нулевое решение 2 (г) = 0, а значит, и ст(г) = 0. Преобразуем в системе (8) первое уравнение к виду
Q( р) у (г) + N (р) е (у(г)) = кЯ- (р) Я (р)и (г). (9)
(8)
(10)
Запишем операторы ЯТ(р)Я0(р) и Q(p) в виде сумм:
Я~ (р)Дз (р) = 1 + ЛЯ(р), Q( р) = Qm (р) + AQ( р), здесь ЛЯ(р), ЛQ(p) — остатки разложения, ЛЯ(р) = т, ЛQ(p) < п.
С учетом выражений (2), (9) и (10) сформируем ошибку слежения е(0 = у(0 - ут(0:
Qm (рЖ) = к () + ЛЯ(р)и(0 - к-1AQ(р)у(0 - к-1 N(р)* (у(/)) - к~1ктТ(/)). (11)
Для синтеза закона управления воспользуемся модифицированным алгоритмом адаптации высокого порядка [5]. В соответствии с работой [3] зададим закон управления и(0:
и(/) = Т(р)7(0 = ), у(г) = / (0) , (12)
где Т(р) — линейный дифференциальный оператор, причем Т(Я) — гурвицев, Т(р) = п - 1; V (/) — оценка вспомогательного управляющего воздействия у(0; Т — матрица-строка, со-
ставленная из коэффициентов оператора Т(р); ) = V(/), V(/),..., V(п 1)(^) ; с(0 — вектор
Т
1 ии^ 1 Г Г у - Г и } •> ' у У1, }•> ' * (^), у(^) V (^)
сформированный с помощью следующих фильтров:
V (0 = КУи (0 + Ъи«), Уи (0) = 0; Уу (/) = КУу () + Ъу(1), Уу (0) = 0;
У§ (/) = КУ8 (/) + Ъ* (у(/)), У8 (0) = 0;
У а)=куг(г)+ъга), уга)=ьуа), у(0) = 0.]
Здесь Уи(0, Уу(0, Уг(0, Уг(0 е Яп - 1; К — матрица в форме Фробениуса с характеристическим многочленом Т(Я); Ъ = [0, ..., 0, 1] и Ь = [1, 0, ..., 0] имеют соответствующие размерности.
С учетом выражений (12) и (13) уравнение (11) преобразуем к виду
Т
вектор регрессии,
(13)
Qm (р)е(1) = кТ (р)
() - С0 ) ) + V (г) - V«)
где с0 — вектор неизвестных параметров, зависящий от коэффициентов операторов ЛЯ(р), AQ(p)/k, N(p)/k и коэффициента кт/к.
Для реализации закона управления (12) введем наблюдатель [5]
4(0=о&о+Ф0 (-чо), по=ьт «0)=0, (14)
здесь 4(Г) е Яп, 00 =
0 4-1 0 0
ф0 =-
-1 -2 -^д , Л2д ,..., ёп д
; 1п - 1 — квадратная единичная матрица порядка п - 1;
, д > 0 — достаточно малая величина, Л1, ..., ёп выбираются
исходя из условий гурвицевости матрицы G = - ФЬ , ф = [[, ..., Лп ] .
Введем в рассмотрение вектор ошибки оценки производных п(/) = Г-1 [4(/) - )], где
г ~\Т
Г = Ша§{дп - 1, дп - 2, ..., д, 1}, д(0 = у(0, у(0,..., У(п-1)(0 . Взяв производную по времени от ), с учетом выражений (14) получим
п (/) = д-1ал(/)+Ъу( п+1) (/),
У(/) - ) = дп-1 Ьп(/). Преобразуем последнюю систему относительно выходной переменной:
П(t) = |-1Gn(t) + bv(t), v(t) - v(t) = |n-1 ), где (t) = П(t)-li-nv(i)(t), i = 2, ..., n - 1, ni(t) = ЗД); b = [|1-n,0,... ,û"
Принимая во внимание выражения (15), преобразуем уравнение (11) к форме
(15)
Qm ( p)e(t ) = kT ( p)
(c(t) - со ) w(t) + |n-1 Ln(t)
(16)
Утверждение 1. Пусть выполнены условия предположений 1 и 2. Тогда существуют
Т
матрица Л = Л > 0 и числа а > 0, ц0 > 0, такие что при ц < ц0 и 9 = 0 система, состоящая из
(17)
уравнений (12)—(16), совместно с алгоритмом адаптации
c(t ) = -Ле(0 w(t ) - ac(t ), с(0) = с0
диссипативна и выполнено целевое условие (3).
Доказательство утверждения 1 аналогично доказательству, приведенному в работе [3]. Однако согласно постановке задачи объект управления (1) неминимально-фазовый. Поэтому получим условия работоспособности алгоритма (12)—(14) для исходной модели (7). Введем вектор отклонений Лг (^) = г (^) - 2 (^) для быстрых составляющих систем (7) и (8):
Az(t) =1FAz(t) + Nù(t), Ao(t) = L2Az(t). 9
(18)
Тогда уравнение для ошибки в{(), записанной в форме уравнений состояния, будет иметь следующий вид:
é (t ) = Am e(t ) + kB„
(c(t) - со ) w(t) + |n-1Ln(t)
+ Bmv(t ), e(t ) = Lé(t ).
(19)
Здесь в(^) е Я"; Ат, Вт, Вт1 — числовые матрицы, полученные при переходе от уравнения (16)
к (19) с учетом результатов (18); = ЯГ(р)Я0(р)о^)/^т(р)).
Утверждение 2. Пусть выполнены условия предположений 1 и 2. Существуют числа ц > 0 и 90 > 0, такие что решениями матричных неравенств
чт 2 __ _ /__ _ \Т "
ATmH1 + H1 Am + 2k 2|2n-2 H1 BmL (BmL )T +-2 H1Bm1 ((1 Bm1 ) < W
I
290
FT H2 + H2F + —0H2NTG0 (H2NTG0 T + 290|2n-2H2NTФ0L (H2NTФ0LT <-W
I
2
GTH3 + H3G + 4iln + 2H2b (H2b )T < -W3
(2о)
T T
являются положительно-определенные матрицы H\, H2 и H3, где W = W > 0, W = W > 0, t —
W3 = W3 > 0, k < k . Тогда при 9 < 90 система, состоящая из уравнений (12)—(14), (18), (19),
диссипативна и выполнено целевое условие (3).
Доказательство утверждения 2 приведено в Приложении.
Пример. Пусть модель объекта управления задана следующим уравнением:
(p3 + Ü2P1 + a1 p + a0 )y(t) + (p2 + ¡1 p + ¡0) ln (2 + sin y(t)) = k (1 -9p)u(t). (21)
Класс неопределенности S задан неравенствами: -5< ai <5; -1< f <1; i = 0, 1, 2; j = 0, 1; 1 < k < 2. Множество значений 9 > 0 подлежит определению.
Эталонную модель определим уравнением (p +1) ym (t) = r(t), r(t) = 1 + 2sin t.
Зададим оператор T(p) в виде T(p) = p + 2p + 1 и сформируем фильтры (13) следующим образом:
Vu (t) =
" 0 1 " "0"
-1 -2 Vu (t) + 1
Vg (t) = V (t ) =
u(t), Vu (0) = 0; Vy (t) = 1
0 1
-1 - 2
Vv (t) +
y(t), Vy (0) = 0;
0 1
-1 -2
К (t) +
" 0 1 " "0"
-1 -2 Vr (t) + 1
ln(2 + sin y(t)), Vg (0) = 0; r (t), v. (t) = [1,0] V. (t), Vr (0) = 0.
T t T T
Вектор регрессии зададим как w(t) = Vy (t), Vu (t), Vg (t), y(t), vr (t) . Выберем
T
Ф = [3, 3, 1] и | = 0,01 и сформируем наблюдатель (14) в виде
(v(t) - v(t)), v (t) = [1 0 0](t), 4(0) = 0.
~É1(t)" "0 1 0" "41 (t)" -3-10-2
42 (t) = 0 0 1 42(t) + -3• 10-4
4 3(t) 0 0 0 _4з (t) _ -1•10-6
Пусть Л = ё1а§ {10/3,10 5/2,10} и а = 0,01, тогда закон управления (12) и алгоритмы адаптации (17) могут быть сформированы как
и () = 41 (/) + 242 (<) + 43 «), ^) = / (Г) w(t), С(г) = {10/3,10-5 /2,10} в^)w(t) - 0,01с^), с(0) = 0.
Оценим интервал изменения для числа 9 с помощью неравенств (20), в котором алгоритм, разработанный для минимально-фазовых объектов, будет работоспособен и для неминимально-фазовых систем. Для этого предположим, что объект (21) можно представить в виде (7):
(22)
"-a2 1 0" " -1 " " 0"
x(t) = - a1 0 1 x(t) + - f1 ln (2 + sin y(t)) + к 0 (u(t) + o(t)), y(t) = [1 0
-a0 0 0 _-f _ 1
¿^) = -9-1 г ^) - ), о^) = г ^).
Покажем, что система (22) соответствует (21). С учетом того, что _у(0 = -1(0 и о(0 = ¿(0, преобразуем (22) к виду
(р3 + а2 р2 +а1 р + а0 ))) + (р2 + / р + /0 )1п (2 + y(t)) = к (и^) + 9и^) + ) + 90 (t) ),
о^) + 9(0 (t) = -2911 ^).
Подставив второе уравнение в первое, получим систему (21).
Пусть в системе (20) Ж1 = 10-5/3, Ж2 = 90 и Ж3 = /3. Заменим матричные неравенства (20) равенствами. Тогда эти уравнения будут иметь решения при 90 е (0; 0,006]. Значения 90, полученные при моделировании для объекта (21) с параметрами а2 = а1 = а0 = -5, /1 = /0 = -0,5, к = 1 для 1-го варианта и а2 = -3, а1 = -1, а0 = 3, /1 = /0 = 1, к = 2 — для 2-го варианта, находятся в интервале 90 е (0; 0,02].
Для иллюстрации работоспособности предложенной схемы управления примем, что объект управления начинает функционировать при начальных условиях у(0) = у (0) = у(0) = 1
и 90 = 0,02. На рисунке, а, б приведены графики переходных процессов по ошибке слежения е(г) при заданных параметрах объекта (21) для первого и второго вариантов соответственно.
б)
еЦ)
е(г) 2
1
-1
-2
г, с
Заключение. Решена задача адаптивного управления нелинейным неминимально-фазовым динамическим объектом со скалярным входным и выходным сигналами. При решении предполагалось, что объект управления можно представить в виде основного контура, описываемого минимально-фазовой передаточной функцией, и действующего на него возмущения, описываемого неминимально-фазовой системой. Модель объекта была декомпозирована на систему сингулярно возмущенных дифференциальных уравнений, где определялись ограничения на малый параметр, при котором алгоритм управления работоспособен. Как показали результаты расчетов, ограничения на малый параметр зависят от параметров самого объекта управления и параметров настройки в алгоритме регулирования. Получено условие для нулей передаточной функции исходного объекта, при выполнении которого алгоритмы, разработанные для минимально-фазовых систем, работоспособны и для неминимально-фазовых объектов.
ПРИЛОЖЕНИЕ
Доказательство утверждения 2. С учетом выражений (12) и (14) преобразуем уравнение (18):
М(г) = 0-1 яА2(г) + ЬТ(00£(г) + Ф0|и-1 Яф)), Да(г) = ЦДг(г). (23)
Перепишем уравнения (19), (23) и (15) следующим образом:
е(г) = Лте(г) + кБт (с(г) - С0 )Т Ъ>(г) + кБт|и-1 Ьц(г) + );
едг(г) = я & (г) + еЫТ (0 £(0 + ф 0|и-1Ьп(г)), > (24)
П (г) = !~1Оц(г) + Ь>(г). Воспользуемся первой леммой из работы [4], взяв функцию Ляпунова в виде
Р(г) = еТ (г) Ще(г) + Д*Т (г) Н2 Дz (г) + пТ (г) НзЛ(г) + (с(г) - С0 )Т (с(г) - С0). (25) Согласно лемме [4] рассмотрим систему (24) при е = 0. Тогда второе уравнение этой
системы имеет нулевое решение: Дг(г) = 0. Значит, функция
я - ( р ) Яр( р)
Qm (Р)
о(г) ограничена в
силу гурвицевости многочленов Qm(X), Я0(^). В соответствии с утверждением 1 система (24) диссипативна и все переменные в ней ограничены. Тогда |у(г)| < 81, |£(г)| < 82, |т>(г)| < 83, |с(г) -
-С0(г)| < 84, где 8г- > 0, 1= 1, ..., 4.
0
0
2
4
6
8
Определим теперь значение 90, при котором исходная система диссипативна. Пусть 9 = 90. Возьмем производную по времени от функции (25) вдоль траекторий (17) и (24):
Р^) = 8Г ^) (( + Н1 Ат ) )) + 2бГ (t)ЩкБт () - С0 ) м(1) +
+2вТ (t) Н^д и"1БmLл(t) + 2вТ ^) ЩБ^ у (t) + 9-^ ^) (Т Н2 + Н2 ^ ) Аг (t) +
+2АгТ (t) Н 2 КТ ) + Ф0 ди-1Ь^)) +
+д-1 пТ (t) (ТН3 + Н30 ) )) + 2г|Т (t) Н3Щ) + 2СТ (t) () - с0 ). Воспользуемся следующими оценками:
2вТ (t)Н1кдП-1 БтЬп^) < 2к2д2и-2вТ (t)Н1 БтЬ(Н1 БтЬ)Т в^) + 2ЛТ (t)п(0 ;
2вТ (ОН^ у(0 < 2д-1вТ (t) (НХБЩ )Т НХБЩв(t) + 2д§2 ; 2АгТ (t)Н2КТа04^) < 2д-1АгТ (t)Н2КТа0 ((2КЩ) )Т Аг^) + 2д§2 ; 2АгТ (t)Н2КТ00 дП-1 Ьп^) < 2д2и-2АгТ (t)Н2ЫТФ0Ь (Н2КТФ0Ь)Т А¿(t) + 2г|Т (t),
2пТ (t)Н2 ) < ^ пТ (t)Н2 Ь (Н2Ь )Т ) + 2д§2. д
Подставив оценки в производную функции Ляпунова, с учетом системы (20) получим Р^) < -вТ (О^в^) - 9-1АгТ (t)Ж2Аг(t) - д-1г|Т ^)Ж3пО") - 2д(() - с0 )Т () - с0 ) + 2д5 ,
где 5 = §2 + §2 + 52 + §4.
С учетом (23) оценим последнее неравенство:
Р(1) < -XV(») + 2д5 , х = ш!п(^Е), • ^ш*^' 2ц1 ■
[Ашах(Н1) 90Ашах(Н2) дАшах(Н 3) ] Решив данное неравенство, получим Р^) < Р(0)в_хГ + 2дх-1 (1 - в~х*) 5 . Используя это выражение, найдем оценку 5 в целевом условии (3) при t = т:
5 < /^ш1п (Н1) (Р(0)в"хт + 2дх-1 (1 - в"хт) 5) .
Из этого неравенства очевидно, что, уменьшая величину ц, можно достичь требуемой точности оценки 5 в выражении (3). Очевидно, что условия (20) грубые, однако из них следует, что существует значение 9, при котором алгоритм управления, разработанный для минимально-фазовых систем, работоспособен для определенного класса неминимально-фазовых объектов.
Статья подготовлена по результатам работ, выполненных при финансовой поддержке федеральной целевой программой „Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007—2013 гг." (государственный контракт № 11.519.11.4007).
список литературы
1. Андриевский Б. Р., Фрадков А. Л. Избранные главы теории автоматического управления с примерами на языке МЛТЬЛБ. СПб: Наука, 1999.
2. Цыкунов А. М. Применение адаптивного динамического регулятора для управления объектом по выходу // Тр. Междунар. конф. „Идентификация систем и задачи управления" 81СРК0'2005 / Ин-т проблем управления М., 2005. С. 1349—1357.
3. Цыкунов А. М. Модифицированный адаптивный алгоритм высокого порядка для управления линейным объектом по выходу // Автоматика и телемеханика. 2006. № 8. С. 143—152.
4. ХалилХ. К. Нелинейные системы. СПб: НИЦ „Регулярная и хаотическая динамика", 2009.
5. Atassi A. N., Khalil H. K. A separation principle for the stabilization of class of nonlinear systems // IEEE Trans. Automat. Control. 1999. Vol. 44, N 9. P. 1672—1687.
Сведения об авторе
Игорь Борисович Фуртат — канд. техн. наук, доцент; Санкт-Петербургский национальный иссле-
довательский университет информационных технологий, механики и оптики, кафедра систем управления и информатики; E-mail: [email protected]
Рекомендована
Институтом проблем машиноведения РАН
Поступила в редакцию 04.10.12 г.