УДК 62.50 ББК 32.817
СИНТЕЗ МНОГОФУНКЦИОНАЛЬНОЙ СИСТЕМЫ СЛЕЖЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ1
2 3
Краснов Д. В. , Уткин А. В.
(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва)
Формализован класс аффинных нелинейных систем с одним входом и одним выходом, для которых относительный порядок эквивалентной формы «вход-выход» инвариантен по отношению к наличию внешних несогласованных возмущений. Для данного класса систем разработаны методы синтеза многофункциональной системы слежения в условиях параметрической неопределенности модели объекта управления и неполных измерений. Для информационного обеспечения разрывного управления разработан оригинальный метод синтеза наблюдателя пониженного порядка для оценивания смешанных переменных (комбинаций переменных состояния, внешних воздействий и их производных) по измерениям только ошибки слежения. В данном наблюдателе с помощью линейных корректирующих воздействий с насыщением реализуется метод разделения движений ошибок наблюдения.
Ключевые слова: нелинейные аффинные системы с одним входом и одним выходом, слежение, разрывное управление, наблюдатель состояния, инвариантность, декомпозиция.
1 Работа выполнена при частичной поддержке гранта РФФИ №15-08-01543А и Гранта президента МД-5336.2016.8.
2 Дмитрий Валентинович Краснов, инженер-программист ([email protected]).
3 Антон Викторович Уткин, кандидат технических наук ([email protected]).
Управление большими системами. Выпуск 69 1. Введение
Объектом исследования являются нелинейные системы автоматического управления с одним входом и одним выходом (8КО-системы) при действии внешних несогласованных (т.е. не принадлежащих пространству управления) возмущений и параметрической неопределенности модели объекта управления. Рассматривается задача слежения выходной переменной за заданным сигналом в предположении, что только ошибка слежения подлежит прямым измерениям. Синтез инвариантной системы слежения в указанных условиях нетривиален и требует привлечения и разработки специальных методов. Стандартные методы компенсации или подавления неопределенностей здесь непосредственно не применимы, так как требуют выполнения условий согласования [3, 4, 10, 11, 13, 18], поэтому первостепенная роль в решении данной задачи отводится методам информационного обеспечения базового закона управления. В условиях неполных измерений этим целям служат наблюдатели состояния и возмущений. В классической постановке для реализации наблюдателей требуются параметрически определенные модели объекта управления и внешних возмущений [1, 12]. Однако адекватное моделирование возмущений в условиях постоянно меняющихся внешних факторов представляется практически неразрешимой проблемой.
В рассматриваемой нелинейной 8КО-системе с несогласованными возмущениями задача оценивания по отдельности неизмеряемых переменных вектора состояния и внешних возмущений не имеет решения без расширения пространства состояния за счет ввода динамических моделей, имитирующих внешние воздействия. В предположении, что внешние воздействия являются достаточно гладкими, ограниченными функциями времени, в данной работе в качестве основы для построения принят метод, в котором математическая модель объекта управления представляется в канонической форме «вход-выход» относительно смешанных переменных (комбинаций переменных состояния, внешних воздействий и их производных) [2, 6, 7, 8, 14]. Такой подход не требует выполнения в реальном времени
прямых и обратных замен переменных, так как задачи управления и наблюдения решаются относительно одних и тех же переменных нового координатного базиса.
В разделе 2 формализован класс аффинных систем, обладающих инвариантностью канонической формы «вход-выход», и, как следствие, сохраняющий свойства полной управляемости и наблюдаемости, присущие невозмущенной системе, при переходе к новому координатному базису смешанных переменных. Смешанные переменные формируются путем диф-феоморфных замен переменных состояния с аффинным вхождением внешних воздействий и их производных, возникающих в процессе получения эквивалентной системы «вход-выход» при многократном дифференцировании ошибки слежения. Существенно, что в полученной канонической форме «вход-выход» условия согласования выполняются. Это позволило синтезировать базовый закон разрывного управления относительно смешанных переменных, обеспечивающий стабилизацию ошибки слежения инвариантно по отношению к наличию внешних возмущений и неопределенности множителя перед управляющим воздействием.
Основной результат представлен в разделе 3, где вводится наблюдатель пониженного порядка смешанных переменных. Формализована процедура синтеза линейных корректирующих воздействий с насыщением, в которой реализован метод разделения движений в пространстве ошибок наблюдения. В разделе 4 приведены результаты моделирования разработанных алгоритмов для системы управления перевернутым маятником.
2. Класс рассматриваемых систем. Базовый закон управления
Рассматривается класс нелинейных 8КО-систем, математическая модель которых представима в так называемом треугольном виде [8]:
^ X = I, Ох. +qгт(xl, Х2 . х- ул.-=1п -1;
К = /п (х) + ч1 (х)л + ьп (х)и,
где x = (x\, ..., xn)T е Xс Rn - вектор состояния; u е R - управление, X\(t) е X\ с R - выходная (измеряемая и регулируемая) переменная; rj(t) = (r(t), ..., t]s(t))T е Rs - вектор внешних возмущений, компоненты которого полагаются неизвестными гладкими ограниченными функциями времени с ограниченными производными в общем случае до (n - 1)-го порядка:
(2) < = const > 0, t > 0, i = 0, n -1, j = .
Функции f(x1, ..., xi+1) и элементы вектор-строк qT(xb ..., xi) е Rlxs, i = 1, ..., n - 1, являются непрерывно дифференцируемыми по всем своим аргументам не менее n - 1 раз и
(3) dfi(Xl,•••,Xi+l) * о, i = 1П-1,
dXi+i
(4) b(x) * 0 .
Условия (3), (4) и аналогичные им ниже имеют локальный характер и выполняются в некоторой открытой ограниченной рабочей области изменения переменных x(t) е X с Rn Vt > 0, которая определяется технологией процесса. Вместе с тем допускается, что в системе (1) все функции f, qiT, i = 1, ..., n, b(x) могут содержать неопределенные параметры, но при этом для всех допустимых диапазонов изменения параметров структурные свойства (3)-(4) остаются неизменными.
Ставится задача синтеза обратной связи по состоянию и внешним воздействиям, обеспечивающей слежение выходной переменной x1(t) за заданным сигналом g(t) е X1 с R, который полагается гладкой, ограниченной функцией времени с ограниченными производными:
(5) |g(i)(t)| < G = const > 0, t > 0, i = 0n.
Как правило, в большинстве исследований по синтезу следящих систем в качестве объекта управления рассматриваются системы (1) с согласованными возмущениями, а именно
(6) qT(x1,...,xi) = 0, i = 1,n -1,
для которых выражения (3) являются условиями локальной наблюдаемости переменных вектора состояния относительно выхода x1(t), а выражения (3)-(4) - условиями управляемо-
сти [16]. Благодаря специальному составу аргументов функций /¿х..., хг+1), 7 = 1, ..., п - 1, такая система является носителем структуры «вход и - выход х1» с относительной степенью п, т.е. для данной системы существует диффеоморфная замена локальных переменных, приводящая к каноническому виду, в котором выход х1 от входа и с ненулевым коэффициентом усиления будет отделен п интеграторами: X = /;(х, хг) = *2, /;/дх2 Ф 0;
х2 = д /(х;, х2) + "д /2(х;, х2, хз) = Н2 (х;, х2, хз) = хз, дх дх
д/ / дх2 Ф 0, д/2 / дх3 Ф 0 ^ дН2 / дх3 Ф 0; ^ ' дН 1 _
(7) у=; дх] ] ]
д— /дхг+1 Ф 0,' = 3,п -;;
= I ^ /3 + дНП-1[(^Т (х)Ч + К (х)и] =
]■=; дх1 дхп
т -г дН , т дН ,
= Н(х) + дт (х)^ + Ъ(х)и, дт (х) = д„т, Ъ(х) = Ъп Ф 0.
дх„ дх„
п
~п
Каноническая форма (7) является стандартной основой для синтеза систем слежения и наблюдения, где проблемы обеспечения инвариантности по отношению к согласованным возмущениям решаются в рамках тех или иных методов в зависимости от типа неопределенностей путем их подавления или компенсации.
Если общий порядок исходной системы больше, чем ее относительный порядок, равный п, то входо-выходное отображение такой системы включает подсистемы внешней и внутренней динамики [1, 10]. Если решения подсистемы внутренней динамики ограничены, то уравнения (7) можно трактовать как подсистему внешней динамики минимально фазовой системы, а часть внешних возмущений - как переменные внутренней динамики.
В качестве основы для синтеза базового закона управления выходной переменной системы (1) с несогласованными возмущениями целесообразно использовать каноническое представление относительно смешанных переменных - комбинаций переменных состояния, внешних воздействий и их производных [2, 6, 7, 8, 14]. Данный подход к задаче синтеза диктует требования к классу допустимых систем (1), которые обоснуем в следующей лемме.
Лемма 1. Если в системе (1) выполняются условия (3), (4) и элементы вектор-строк д,Т е Я1'™, I = 1, ..., п - 1, постоянные (в том числе равны нулю) и/или не содержат иных аргументов, кроме указанных (8) д^(х1,...,х1) , г = 1,п -1,
то тогда система (1), (3), (4), (8) является носителем структуры «вход и - выход х » в координатном базисе смешанных переменных с относительной степенью п.
Доказательство. Для получения канонического вида нужно продифференцировать первое уравнение системы (1) (п - 1) раз. В отличие от системы с согласованными возмущениями (6) этот процесс порождает производные внешних возмущений до (п - 1)-го порядка. С учетом обозначений системы (7) имеем:
X = /1(Х,х2) + д^)^ у2, 5/1/дх2 Ф 0;
Уг = Ь2(X,X,X) + Я(X,X,Л,Л) = Уз,дк2 /дх3 Ф 0,
_ д/ ^ д/1 Т л Т
q2(хl,х2,Л,Л) =— Яг (хl)n + — Я.2 (X1,X2)Л+ СХ1Й;
дхг 5x2
У, = к, (х1 Хг+1) + (х1,..., X ) = Уг+1, яг, 1 яг? _
г Ф 0, д, = Р ^ яТ (Х1,...,х}-Уп + £Я-1,, = 3,п -1;
дх,+1 г }■=1 дх
У = Р ^/ + Р ^ д Тл+ 1+дкП-1 Ъи, п Р дх} / Р дх} Ч] ' шЧп-1 дхп п
и система (1), (3), (4), (8) представима в каноническом виде
(9) X = У2, Уг = У+1, г = 2,п-1;У = к(х) + д(х,Щ) + Ъ(х)и,
п сЛп Р1Р1 п сЛп
где Л(х) = 1 , Ь(х) Ьп Ф 0, д = £ ^ д]Л +
1=1 дх1 дхп 1=1 дх1
+ п= ес1(7,7(1),-,7(п"1)).
Как видим, наличие внешних, несогласованных возмущений с входными каналами (8), во-первых, не влияет на выполнение условий /дхм Ф 0, 7 = 2, ..., п - 1, следовательно, переход к смешанным переменным является диффеоморфным. Во-вторых, в канонической системе (9) управление появляется только в последнем, п-м уравнении, коэффициент перед управлением Ь(х) не равен нулю и не зависит от внешних возмущений, т.е. относительная степень системы (1) с несогласованными возмущениями равна п. Лемма 1 доказана.
Итак, выделен класс нелинейных аффинных систем (1), (3) (4), в которых относительная степень, присущая системе с согласованными возмущениями (6), не изменится при появлении несогласованных возмущений, если условие (8) выполнено.
Заметим, что если условия (8) не выполнены, то тогда в процессе получения канонического вида возможно «досрочное» появление управления в 7-м (7 = 2, ..., п - 1) уравнении с множителем, зависящим от возмущения, что изменяет относительную степень, а вопрос об управляемости останется открытым.
При выполнении условий (8) в новом координатном базисе системы (9) смешанные переменные
У,+1 = (Х1,..., хм) + д, (Х1,..., х, ,7,7(1),...,7(г_1)), , = 1, п -1, наблюдаемы относительно выхода х1. Система управляема, внешние возмущения и их производные принадлежат пространству управления, что позволяет применить к системе (9) известные методы обеспечения инвариантности для решения задач управления выходной переменной.
Так, для решения поставленной задачи слежения можно получить канонический вид относительно ошибки слежения е1 = х1 - g и ее производных. Существенно, что в уравнении
= ¡1 (х, х ) + дТ(х 8 множитель перед внешним воздействием £ постоянный, т.е. удовлетворяет условиям (8), следо-
вательно, форма «вход и - выход е1» имеет такой же относительный порядок п, что и система (9), а для системы относительно новых смешанных переменных е1 = х1 - g
(10) ei+l = к (Х1,...,х+1) + д - g(0,1 = 1, п -1,
структурные свойства наблюдаемости и управляемости сохраняются. В силу (10) получим систему «вход и - выход е!» вида
(11) ё = ег+1,, = 1,п -1; ёи = \(х, г) + Ъ(х)и , \(х, г) = к(х) + д(х, ^ ) - g(п),
которая служит основой для дальнейших построений. В системе (11) е = (еь ..., еп)т е Яп - вектор состояния; д(х,^)-g(п) -внешние воздействия. С учетом (2)-(5) будем полагать, что при допустимых вариациях параметров и Ух(0 е X с Яп, ^ > 0, имеют место оценки
(12) \\(х, г)\ < ^, Ъ < \Ъ(х)\ < Ъ , ё (г) < Е, г = 1п,
где Е Ъ , Ъ - известные константы, полученные исходя из технологических ограничений и наихудшего расчетного случая, знак Ь(х) постоянен и известен.
Базовый закон комбинированного управления, компенсирующий действие внешних возмущений [8], в данном случае нереализуем из-за неопределенности множителя Ь(х). Для обеспечения инвариантности к имеющимся неопределенностям воспользуемся «силовыми» методами их подавления.
Ориентируясь на практически значимый класс электромеханических систем, в которых управляющее воздействие имеет заведомо разрывной характер, вводится следующий базовый закон разрывного управления
Г1, 5 > 0,
(13) и = -М Ъ(х) • sgn 5 , sgn 5 =
-1, 5 < 0;
(14) 5 = с е = се +... + сп-1вп-1 + еп ,
где с, = const > 0 - коэффициенты гурвицева полинома, а именно, корни Л уравнения Л"-1 + сп-1А"-2 + ... + с2Л + с1 = 0 -действительные и/или комплексно сопряженные и Re Л < 0, i = 2, ..., п - 1.
Найдем нижнюю оценку для выбора амплитуды разрывного управления M = const > 0 из достаточного условия ss < 0 [13]. В силу (11)-(14) имеем:
fn-1 Л
ss = s\ Xciei+\ + t) - bMsgn b • sgn s I <
(15) ^ '
< |s|\"tciEM + F - bM j< 0 ^ M >\ §сД+1 + F | / b.
При выбранной на основе (15) амплитуде за конечное время
n f_ n-1 Л
0 < ts < X c,E, /\bM - X CjEj+i - Fj , Cn = 1
на поверхности s = 0 в пространстве Rn возникнет скользящий режим. При t > ts динамический порядок системы (11), равный n, понижается до n - 1. Выразив из равенства s = 0 (14) переменную en = -c1e1 - ... - cn-1en-1 и подставив ее в (11), имеем устойчивую систему
(16) ег = ег+1 > i = 1 n - 2; en-1 = -Ciei - ... - Cn-ien-1 > s(t) = 0 ,
где выбором с,, i = 1, ..., n - 1, обеспечиваются желаемые темпы
сходимости ошибки слежения lim е (t) = 0.
t
Для реализации базового закона разрывного управления (13) требуются текущие оценки смешанных переменных (10). Для решения этой задачи в следующем разделе представлен оригинальный метод синтеза наблюдателя пониженного порядка смешанных переменных, в котором также реализуется метод разделения движений.
3. Синтез наблюдателя смешанных переменных
Наша цель состоит в создании многофункциональной системы слежения, способной поддерживать различные режимы работы объекта управления без перенастройки параметров обратной связи. В связи с этим аналитический вид задающего воздействия не вводится, и считается, что наблюдаются только его текущие значения g(t), а производные задающего сигнала неизвестны, но ограничены. В неравенствах (5) заложены мак-
симально допустимые оценки для всех возможных режимов работы. Непосредственно измеряется только ошибка слежения е\{() = х\{() - g(t), шумы в измерениях отсутствуют.
Для реализации базового закона разрывного управления (13)-(14) и оценивания смешанных переменных (10) предлагается построить наблюдатель пониженного порядка п - 1 на основе системы (11) в виде
(17) ^г = *г+1 + V, г = 1 п - 2; ¿„-1 = Vn-1,
где г = ..., гп_1)т е Яп-1 - вектор состояния; уг-, I = 1, ..., п - 1, - корректирующие воздействия наблюдателя, которые формируются на основе измерений е^) так, чтобы обеспечить стабилизацию системы относительно ошибок наблюдения = е, - гг-, / = 1, ..., п - 1, которая в силу (11), (17) имеет вид:
(18) =ем - Vг, г =1 п - 2; ¿п-1 = еп - vn-l,
где еп(0 полагается ограниченным внешним воздействием для наблюдателя (12).
Эффективный метод оценивания неизмеряемых переменных состояния и внешних воздействий без ввода их динамических моделей заключается в построении наблюдателя состояния (17) с разрывными корректирующими воздействиями и организации скользящих режимов в пространстве ошибок наблюдения [5, 8, 13]. Однако в многомерном случае реализация таких алгоритмов может привести к возникновению неидеальных скользящих режимов и, следовательно, к ненадлежащему качеству (негладкости) восстановленных сигналов, что, в свою очередь, может привести к нежелательным эффектам при реализации разрывного управления (13) на основе восстановленных сигналов.
По указанной причине в системах с разрывным управлением целесообразно использовать наблюдатели с непрерывными корректирующими воздействиями. Преимущества наблюдателей на скользящих режимах, связанные с оцениванием внешних возмущений и разделением движений в пространстве ошибок наблюдения, можно обеспечить в допредельной ситуации с помощью так называемых ^-образных корректирующих воздействий, например, в виде сигма-функций [6, 7].
Для упрощения вычислительного аспекта алгоритмов управления в данной работе предложен метод синтеза корректирующих воздействий наблюдателя в виде 8а1>функций - кусочно-линейных функций с насыщением [19]. Такой подход обеспечивает решение задачи наблюдения с некоторой, наперед заданной точностью, но, в отличие от линейного наблюдателя с большими коэффициентами [17], не требует расширения пространства состояния для оценивания внешних возмущений [9]. Идея заключается в том, чтобы за конечное время Т > 0 обеспечить в системе (18) стабилизацию с заданной точностью ошибок наблюдения и их производных. Тогда при Т > 0 переменные наблюдателя сойдутся в малую окрестность неизмеряемых смешанных переменных ~ е7(0, 7 = 2, ..., п - 1, а из уравнения статики ¿и_! = еи - ^^ «0 будет получена оценка
Уп-1(0 ~ еп(^).
Лемма 2. Если в системе (18) с корректирующими воздействиями в виде линейных функций с насыщением M1sgn£1, ¡г! > 1//1,
(19) v1 = M1sat(/1s1) =
v¡ = Mi sat(/¿v¿ _j) =
M/ sx, 1/ ^; M sgnv,_i, |vf_J > 1/,
M/V-i, | Vi | < 1 / /, i = 2, и -1
начальные условия и функция en(t) ограничены известными
константами
(20) \st (0)| < E,, i = 1, п -1, \en (t)| < Fn = En ,
то тогда для любых, сколь угодно малых ё, T > 0, найдутся такие положительные действительные числа М*, ¡*, что УМ, li. Mi > Mi, li > li , i = 1, ..., n - 1, выполнятся неравенства
(21) \Bi (t )| <S, i = 1m—1, |en (t) - Vn-1 (t)| <ЗУг > T. Доказательство. Разделим отрезок времени [0; T] на 2(n - 1)
отрезков с помощью точек 0 < t1 < t2 < ... < t2n-3 < t2n-2 = T. Предполагая, что ё << min {E1, ..., En-1}, амплитуды Mi > 0, i = 1, ..., n - 1, корректирующих воздействий (19) будем выбирать так, чтобы обеспечить последовательно (сверху вниз)
сходимость корректирующих воздействии в линеиные зоны за конечное время:
(22) 1^(01 < 1//1 Vt > t1, \vt(t)| < 1//г+1 Vt > t2i_l.
Параметры li > 0, i = 1, ..., n - 1, выполняют роль больших коэффициентов и выбираются так, чтобы обеспечить (21), а также за время [t2i-i; t2i] выполнение неравенств
(23) |ei+1(t)_ v(t) = \ai+1(t) <AM <5Vt > t2l, i = 1,П_1; sn := ^. Решения системы (18)-(19) ограничены на любом конечном
интервале времени. Параметры корректирующих воздействий выбираются с целью стабилизации переменных состояния, что позволяет ввести ограничения
|ё (t) < F = const Vt > 0, i = 1,n _1.
В системе (18)-(19) sgn Vj(t) = sgn £j(t) Vt > 0 по построению, а совпадение знаков sgn Vj(t) = sgn £1(t), i = 2, n - 1, может не иметь места при 0 < t < t2i-2 и гарантируется только при Vt > t2i-2 вне окрестности |ег| < Ai (23).
Если sgn Vj(0) = sgn £j(0), i = 2, n - 1, то система (18)-(19) в начальный момент времени представима в виде
si = S+1 _M, sgn ё, i =1, n _1 sn := en. Ее переменные монотонно устремятся в некоторые окрестности нуля при выборе амплитуд корректирующих воздействий на основе достаточных условий
slSl < 0 (si+l _ Mi sgn ё) < \Si |(Fi+1 _ Mt) < 0 ^
(24) --1 '
^ M > F+l, i = 1, n _ 1,
где Fi = Ei, i = 1, ..., n - 1. В худшем случае области изменений ошибок наблюдения можно оценить следующим образом:
(25) F = К(0)| < E, F = |s2(t2) < E2 + (F3 + M2)t2,
^ = К (¡21-2) ^ Е + (^ + ыг )гъ_г, ; = 2,п -1, ^ = еп .
Неравенства для выбора амплитуд корректирующих воздействий М, обеспечивающих (22) за указанное время, имеют вид
К (*2;--2)|
(26) m > 2'_ + F+i, i = 1, n _ 1.
t2i_1 t2i_2
С учетом (25) из (26) последовательно снизу вверх имеем:
М - E"-1 + F + Mn-l)hn-4 , гр _V
Mn-1 >---—-+ Fn ^
t "> ... 1 t 1 — Л
(27)
М' - Е"-1 + 7Г < 1- < Т
Мп-1 - - , 2'2п-4 < 2п-3 < Т ,
2п-3 - 2п-4
М - Е + ^2г-1,2t2г-2 < t2г-1, г - П-12, м; - Е+
*2г-1 2г-2 t1
Таким образом, найдены М* (27): УМг- >М*, 7 = 1, ..., и - 1, неравенства (22) будут выполнены.
Положим, например А( = ¿2г-1 - 2^27-2, 7 = 2, ..., и - 1 и А( = ^ = 72 - ^ = 74 - = ... = 72и-2 - 72„_з > 0. Тогда верхняя оценка для выбора А( > 0, при котором обеспечивается заданное время Т > 0 сходимости ошибок наблюдения, имеет вид:
(28) Т = Л^2 + 22 + 23 +... + 2п-1) ^ 0 < At < Т /(2(2п-1 -1)). Амплитуды М-7 последовательно снизу вверх выбираются на
основе (27), (25) при принятом значении Аt (28).
С учетом (22)-(23) система (18)-(19) представима в виде
(29) ¿1 = -М111£1 + 52, \ех\< 1/^ Vt > ^ ;
- -М7гк-1 + ¿+1 - -Мг1г ¿г - "г) + ¿+1 , _
к, 1/1 1/1+ Л Vt > ^ ,, г - 2, п -1.
| г-11 г I г I г г 2г-1 " "
Для переменных системы (29) на интервалах [¿2г-1; ¿2г-1 + А = 72] справедливы оценки
(*) fi_ы*у
(30) k(t2)| <J—^L + u 21 M¿
Д млЛ
V 1 11 y
^M^A < F2 + M1 - F2 e^MiliA*
I, (, )| < H+L + a + M F'+1 eMAt, i = 2,n -1. '' 1 M¿ i M,1,
С учетом Vi = Mi¡i£i Vt >íb v, = Mili (e, - a,), Vi > t2i-1, i = 2, ..., и - 1, из (30) следуют нижние оценки для выбора коэффициентов ¡i > 0, при которых обеспечиваются неравенства (23):
(31) (Mi - FM)e-MiliA <Ai+i ^ l, >-L_]n ML—F±L, i = ^.
AMi А,+1
С учетом (30)—(31) при ^г < t < Т для переменных системы (29) имеем соответственно
, , Ы + Д, , , |^| + Д,+, -
(32) Ы -2 , Ы -— + Дг, 1 = 2,п-1.
( ) 11 Ы м1/1 1' ,
Из двух последних выражений (31), (32) следует, что неравенства \ejjt) _ vn_1(t)\ < 6, |еи-1(0| < 6 будут выполнены Vt > Т при любом /и_! > /*_1, если
(33) /¡-1 = ; -^ЫМп-1 - Р 1
/ *
п-1 — [мп3 Дмп-Г 3
Для выбранного ¡п-1 > ¡п-1* определяем точность 0 <Дп-1 <3-(Р +3)/(Мп-1/п-1) , которую нужно обеспечить выбором ¡п_2 (31). Оба неравенства
К-1« - ^п-2«| <Дп-1 <3Vt > ^4 ,
\еп-1«)\ <3^ \еп-2«)\ + Д п-2 <3 V > Т
Мп-21п-2
будут выполнены V/n-2 >/;-2 :
(34) /*п-2 = max
23-Р +3
мп- 11п-1. 1 ымп-2 -Рп-1
3Мп-2 'ДМп-2 3- К +3
мп-11п-1
Для выбранного /и_2 > /;_2 определяем значение 0 < Дп_2 < < 6 - (6 + Дп-1)/(Мп_2 ¡п_2), которое нужно обеспечить выбором ¡п_2 (31) и т.д. Таким образом, оба неравенства
М')- V, (?) <Д,+1 VI > Хъ ,
|ы+, (')| <3^Ы< 3 + Д,+1 +Дг <3 V? > Т 1 г+1М |г| М1 1
будут выполнены V¡i > ¡Д которые последовательно выбираются на основе неравенств
(35) /; = maxI-3+-Дi±1; —1—1П М-Р4, г = ,
1 [ 3М, ДМ, Дг+1 ]
где 0 < Аг+1 < ё - (ё + Аг+2)/(Мг+1/г+1). Лемма 2 доказана.
Заметим, что оценки (20) справедливы при нулевых начальных условиях z¿(0) = 0 в наблюдателе (17). По измерениям e1(t) можно сразу установить z¿(0) = е1(0) ^ е1(0), что несколько ускорит процесс сходимости ошибок наблюдения.
При использовании наблюдателя смешанных переменных (17), (19) базовый закон разрывного управления (13)-(14) будет реализован в виде
и — -М sgn Ъ(х) ■ sgn(c1e1 + c2 Z2 +... + сп_ xzп_! + vn _{) и в силу (21) за конечное время ts > T обеспечит попадание изображающей точки в (с2 + с3 + ... + сп-1 + 1) ё = А - окрестность многообразия s = 0 и при t > ts в замкнутой системе (1), (13)-(14), (17), (19) имеет место реальный скользящий режим
е = ei+l, 1 — Ъп-2 en-1 = -c1e1 -...-cn-1en-1 + s, |s(0| ^ А ,
что обуславливает решение задачи слежения с некоторой точностью (t)| Vt > ts.
4. Пример
В качестве иллюстрации разработанного метода рассмотрим процедуру синтеза системы слежения для опорной модели электромеханического объекта управления - перевернутого маятника [15], управляемого двигателем постоянного тока. С учетом редуцированной модели электрического исполнительного устройства, рассматривается система третьего порядка вида
х1 — Х2,
(36) Х2 — а21 sin х - «22X2 + °2з (Х + V), х3 — «32X2 ^33X3
+ Ъи,
где x1 [рад] - угловое положение маятника (регулируемая и измеряемая переменная); x2 [рад/с]- угловая скорость; x3 [Н-м] - вращающий момент, приложенный к маятнику на оси подвеса, который развивается двигателем постоянного тока с разрывным управлением u (напряжение якоря); области изменения переменных состояния имеют конструктивные ограниче-
ния \xi(t)\ < X¡; n(t) - неизвестная функция времени, которая характеризует действие внешних ограниченных возмущений (2); b3 > 0 Vay > 0, b3, a32, a33 - известные коэффициенты передачи: a2! = g /1, a22 = k/l, a23 = \/(ml2); g = 9,8 [м/с2] - ускорение свободного падения, m [кг]; l [м] - масса и длина маятника соответственно, k [Пас] - коэффициент вязкого трения, параметры m, l, k точно не определены, но известны диапазоны, в которых находятся их значения. Решается задача слежения за заданной допустимой траекторией g(t) (5) выходной переменной xi(t) в предположении, что только ошибка слежения ^i£t) = x1(t) - g(t) подлежит прямым измерениям.
В системе (36) внешние возмущения не согласованы, условия (3), (4), (8) выполняются. С помощью невырожденных замен переменных (10) представим систему (36) в каноническом виде относительно ошибки слежения (11):
(37) e = e2, é2 = e, ё = l(t) + bu, где
b = a2b, 0 < b < b < b , e = X - g, e2 = x2 - g, ез = «21 sin X - a22x2 + а2з(+ 7) - g,
|(t) = a2lX2 C0SX + «3^1 sin x - (a23a32 + )X +
- (a22+a33 )e + a33a2 7+a з7 - (a22+a33) g - g,
|e(t)| < E,i = 1,2,3 , Eu = , ||(t)| < F Vt > 0 .
Базовый закон разрывного управления (13) и неравенство для выбора амплитуды (15) имеют вид
u = -M sgn 5, 5 = сё\ + c2e2 + e, M > (cE2 + с2Е3 + F)/b. Для информационного обеспечения закона управления (39) в контур обратной связи введен наблюдатель пониженного порядка смешанных переменных (17) второго порядка с корректирующими воздействиями в виде sat-функций (19):
(38) z1 = z2 + v1, v1 = M1sat(/1£1); ¿2 = V2, V2 = M2Sat(l2V1) .
С учетом (37), (38) система относительно ошибок наблюдения £¡ = в\ - Zi, i = 1, 2 имеет вид: sl = s2 — V, ¿ = еъ — v2 • Базовый закон разрывного управления реализуется в виде
(39) u = —Msgn(c1e1 + c2z2 + v2) .
Моделирование замкнутой системы (36), (38), (39) проводилось в среде Matlab-Simulink при следующих параметрах: С = c2 = 4 , а32 = 2, а33 = 10, Ь3 = 10, X1 = 2л, X2 = 1. Рассматривались различные режимы работы при различных возмущениях с вариациями параметров m е [0,9; 1,1], l е [0,9; 1,1], ке [7; 9].
Для худшего расчетного случая были приняты следующие коэффициенты регулятора (38), (39):
(40) M = 24, Z = 50, Z2 = 100, M1 = 5, M2 = 10.
На рис. 1 показан процесс слежения выходной переменной x\(t) [рад] системы (36) за постоянным сигналом g(t) = 1,5 при внешнем возмущении ^i(t) = sin t. На рис. 2 показан процесс слежения за переменным сигналом g = sin (0,5t) при внешнем возмущении n(t) = 0,5 sin 2t при тех же коэффициентах (40).
х1
0123456789 10
Рис. 1. Процесс слежения выходной переменной х^) за постоянным сигналом g(t) = 1,5рад
Рис. 2. Процесс слежения выходной переменной x\(t) за переменным сигналом g = sin (0,5t) рад
Результаты моделирования подтвердили эффективность разработанного метода синтеза следящей системы в условиях неопределенности.
5. Заключение
Для нелинейных аффинных систем с одним входом и одним выходом при действии внешних возмущений, не принадлежащих пространству управления и в предположении об их гладкости, формализована каноническая форма «вход-выход», на основе которой задачи управления и наблюдения решаются относительно одних и тех же смешанных переменных нового координатного базиса. Основная идея работы, позволяющая расширить класс инвариантных систем слежения для динамических объектов, функционирующих в условиях неопределенности, заключается в разработке методов оценивания неизмеряе-мых смешанных переменных с помощью наблюдателя состояния, построенного на основе этой виртуальной модели.
Предложенный подход существенно упрощает структуру регулятора, так как не требует ввода автономных динамических моделей внешних воздействий, детализации и реального вычисления нелинейных выражений (что особенно актуально при синтезе системы управления на основе полной нелинейной модели), а также снижает требования к объему априорной
информации об объекте управления и среде его функционирования. Разработанные алгоритмы синтеза многофункциональной системы слежения универсальны, просты в реализации алгоритмы и не требуют перенастройки при существенном изменении параметров и внешних факторов в процессе эксплуатации, а также наличия полного комплекта датчиков в системе управления.
Литература
1. АНДРЕЕВ Ю.Н. Управление конечномерными линейными объектами. - М.: Наука, 1976. - 424 с.
2. АХОБАДЗЕ А.Г., КРАСНОВА С.А. Решение задачи слежения в условиях неопределенности на основе совместной блочно-канонической формы управляемости и наблюдаемости // Управление большими системами. - 2009. -Вып. 24. - С. 34-80.
3. БОБЦОВ А.А., КОЛЮБИН С.А., ПЫРКИН А.А. Стабилизация нелинейного объекта с входным запаздыванием и синусоидальным воздействием // Автоматика и телемеханика. - 2015. - №1. - С. 21-30.
4. ЕМЕЛЬЯНОВ С В., КОРОВИН С.К. Новые типы обратной связи. - М.: Наука, 1997. - 352 с.
5. КРАСНОВА С.А., КУЗНЕЦОВ СИ. Оценивание на скользящих режимах неконтролируемых возмущений в нелинейных динамических системах // Автоматика и телемеханика. - 2005. - №10. - С. 54-69.
6. КРАСНОВА С.А., МЫСИК Н С. Каскадный синтез наблюдателя состояния с нелинейными корректирующими воздействиями // Автоматика и телемеханика. - 2014. - №2. -С. 106-128.
7. КРАСНОВА С.А., УТКИН А.В. Сигма-функция в задачах синтеза наблюдателей состояний и возмущений // Проблемы управления. - 2015. - №5. - С. 27-36.
8. КРАСНОВА С.А., УТКИН А.В. Анализ и синтез минимально-фазовых нелинейных 8180-систем при действии внешних
несогласованных возмущений // Проблемы управления. -2014. - №6. - C. 22-30.
9. КРАСНОВ Д.В., РАССАДИН Ю.М., ШИНКАРЮК А.Г. Реализации метода разделения движений в задачах наблюдения // Материалы XIII Всероссийской школы-конференции молодых ученых «Управление большими системами» (УБС'2016), 5-9 сентября 2016 г., Самара. - М.: ИПУ РАН, 2016. - С. 121-133.
10. МИРОШНИК И.В., НИКИФОРОВ В.А., ФРАДКОВ А.Л. Нелинейное и адаптивное управление сложными динамическими системами. - СПб.: Наука, 2000. - 549 с.
11. НИКИФОРОВ В.О. Адаптивное и робастное управление с компенсацией возмущений. - СПб.: Наука, 2003. - 282 с.
12. УОНЕМ У.М. Линейные многомерные системы управления. Геометрический подход. - М.: Наука, 1980. - 376 с.
13. УТКИН В.И. Скользящие режимы в задачах оптимизации и управления. - М.: Наука, 1981. - 368 с.
14. УТКИН В.А., УТКИН А.В. Задача слежения в линейных системах с параметрическими неопределенностями при неустойчивой нулевой динамике // Автоматика и телемеханика. - 2014. - №9. - С. 62-81.
15. ANGELI D. Almost global stabilization of the inverted pendulum via continuous state feedback // Automatica. - 2001. -Vol. 37. - P. 1103-1108.
16. ISIDORI A. Nonlinear control systems. 3rd Ed. - Berlin: Springer-Verlag, 1995. - 550 р.
17. KHALIL H.K., PRALY L. High-gain observers in nonlinear feedback control // Int. J. Robust and Nonlinear Control. -2014. - Vol. 24. - P. 993-1015.
18. KVATERNIK K., LYNCH A.F. Global tracking via output feedback for nonlinear MIMO systems // IEEE Transactions on Automatic Control. - 2011. - Vol. 56, No. 9. - P. 2179-2184.
19. TEEL A.R. A nonlinear small gain theorem for the analysis of control systems with saturation // IEEE Transactions on Automatic Control. - 1996. - No. 41. - P. 1256-1270.
SYNTHESIS OF A MULTIFUNCTIONAL TRACKING SYSTEM IN CONDITIONS OF UNCERTAINTY
Dmitriy Krasnov, Institute of Control Sciences of RAS, Moscow, Software Engineer ([email protected]).
Anton Utkin, Institute of Control Sciences of RAS, Moscow, Cand.Sc. ([email protected]).
Abstract: Class of affine nonlinear single-input single-output systems, where the relative degree of the equivalent form of the input-output is invariant to the presence of external, unmatched disturbances, is formalized. Methods of synthesis of a multifunctional tracking system in the conditions of parametric uncertainty of the control plant model and incomplete measurements are designed for this class of systems. The original method of synthesis of a low dimension observer for estimating mixed variables (these are combinations of state variables, external influences and their derivatives) by measuring only tracking error is designed for information support of discontinuous control. In this observer, using the linear corrective effects with saturation, the method of separating the movements of observation errors is realized. As an illustration of the developed method, an electromechanical control object is considered - an inverted pendulum controlled by a DC motor. The simulation results for the worst case of varying parameters are given.
Keywords: nonlinear affine single-input single-output systems, tracking, discontinuous control, state observer, invariance, decomposition.
Статья представлена к публикации членом редакционной коллегии А.А. Шевляковым.
Поступила в редакцию 15.05.2017.
Опубликована 30.09.2017.