ОЦЕНИВАНИЕ ПРОИЗВОДНЫХ ВНЕШНИХ ВОЗМУЩЕНИЙ НА ОСНОВЕ ВИРТУАЛЬНЫХ ДИНАМИЧЕСКИХ МОДЕЛЕЙ1
Краснова С. А.
(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва;
Московский государственный технический университет им. Н.Э. Баумана, Москва)
В рамках каскадного подхода к синтезу наблюдателей состояния и возмущений предложен оригинальный метод оценивания производных внешних возмущений на основе виртуальных динамических моделей, составленных путем последовательного дифференцирования части производных переменных состояния объекта управления, на которые действуют внешние возмущения, подлежащие оцениванию. Разработана процедура каскадного синтеза наблюдателей производных возмущений, которые строятся как реплики этих виртуальных моделей, с кусочно-линейными корректирующими воздействиями. В данной процедуре реализуется метод разделения движений в виртуальном пространстве ошибок наблюдения. Не только переменные наблюдателя, но и их корректирующие воздействия служат оценками производных внешних возмущений и могут быть использованы для синтеза комбинированной обратной связи и/или текущей диагностики процесса управления.
Ключевые слова: нелинейные системы, внешние возмущения, наблюдатели возмущений, каскадный подход, метод разделения движений.
1. Введение
Проблема обеспечения инвариантности по отношению к внешним возмущениям является актуальной задачей теории автоматического управления. Известны различные подходы к ее решению в рамках различных методов при конкретных предположениях о природе внешних возмущений и каналах их действия на объект управления. Одним из методов синтеза инвариантных систем является формирование комбинированного управления, которое состоит из двух частей. Первая часть - об-
1 Работа частично поддержана грантом РФФИ 18-01-00846A.
2 Светлана Анатольевна Краснова, д.т.н., профессор ([email protected]).
ратная стабилизирующая связь по вектору состояния; вторая часть вводится для компенсации действия внешних согласованных возмущений, принадлежащих пространству управления, и производных внешних несогласованных возмущений в предположении об их гладкости. Такой подход предполагает использование в контуре обратной связи динамических моделей, служащих для получения текущих оценок внешних возмущений и их производных.
Наиболее разработанным в теории автоматического управления является метод синтеза инвариантных систем при наличии динамической модели, имитирующей действие внешних возмущений, и построение на ее основе динамического компенсатора или наблюдателя возмущений [1, 7-11, 13]. Реализация данного метода становится затруднительной, если в процессе эксплуатации характеристики внешних воздействий существенно меняются. Попытка априори предусмотреть все возможные вариации автономных моделей внешних воздействий, в которых изменению могут подлежать не только параметры, но и структура, может привести к недопустимому усложнению расширенной математической модели объекта управления и потребовать длительного машинного времени для выполнения вычислений в реальном времени. Другая альтернатива - разработка системы управления с учетом наихудших возмущений - может привести к неоправданно большому расходу ресурсов управления в штатной ситуации. Синтез эффективной системы управления требует привлечения специальных методов косвенного оценивания внешних возмущений и их производных в реальном времени.
В частном случае, когда параметры объекта управления известны и вектор состояния полностью измеряется, текущую информацию о внешних воздействиях можно получить, непосредственно оценивая их влияние на объект управления. Для этой цели можно использовать наблюдатель состояния с разрывными корректирующими воздействиями, функционирующий в скользящем режиме [2, 3, 16], или его допредельные реализации с непрерывными корректирующими воздействиями [4-6]. Такие наблюдатели, по сути, выполняют функции динамических дифференциаторов. Идея заключается в том, что с помощью
«^-образных корректирующих воздействий обеспечивается стабилизация ошибок наблюдения и их производных с заданной точностью за конечное время, а корректирующие воздействия наблюдателя в установившемся режиме отрабатывают внешние ограниченные возмущения и дают их оценку. Этот подход в данной работе распространяется на решение задачи оценивания производных внешних возмущений любого требуемого порядка в предположении об их гладкости. Основой для построения соответствующих наблюдателей служат дифференциальные уравнения переменных состояния второго и более высокого порядка, в правые части которых входят старшие производные внешних возмущений.
Работа имеет следующую структуру. В разделе 2 описывается рассматриваемая модель нелинейного объекта управления, аффинная по внешним возмущениям. В разделе 3 представлен базовый метод синтеза наблюдателя состояния на основе этой модели, в рамках которого оценивание внешних возмущений осуществляется с помощью кусочно-линейных корректирующих воздействий наблюдателя. Основной результат представлен в разделе 4. В рамках данного подхода разработан оригинальный метод оценивания производных внешних возмущений на основе виртуальных динамических моделей, составленных путем последовательного дифференцирования части производных переменных состояния объекта управления, на которые действуют внешние возмущения, подлежащие оцениванию. Сразу отметим, что данные динамические модели составляются аналитически, операция дифференцирования сигналов в реальном времени, которая весьма проблематична в практической реализации, не выполняется. Наблюдатели состояния строятся как реплики этих виртуальных моделей. В результате каскадного синтеза непрерывных, кусочно-линейных корректирующих воздействий наблюдателя реализуется метод разделения движений [10-11] в пространстве ошибок наблюдения. А именно, в каждом 7-м блоке наблюдателя, построенном на основе виртуальной модели, полученной после 7-го дифференцирования, используются оценки внешних возмущений и их производных до (7 - 1)-го порядка, полученные в предыдущих блоках, а оцениванию
с помощью корректирующих воздействий подлежат производные /-го порядка. Эти сигналы, в свою очередь, используются для формирования корректирующих воздействий в (/ + 1)-м блоке наблюдателя, где оцениванию подлежат производные внешних возмущений (/ + 1)-го порядка. Порядок виртуальной модели и соответствующего наблюдателя определяется потребностью в оценке старших производных внешних возмущений для целей управления и/или текущей диагностики.
В разделе 5 в качестве иллюстрации разработанных алгоритмов приведены результаты моделирования системы управления положением перевернутого маятника при действии внешнего, несогласованного возмущения с оцениванием его производной с помощью наблюдателя, составленного на основе виртуальной модели.
2. Описание модели объекта управления
Рассматривается математическая модель нелинейного объекта управления, аффинная по внешним возмущениям (1) х = /(х, и) + О(х)ц,
где х е X с К - вектор состояния; X - открытая ограниченная рабочая область изменения переменных состояния; и е К" -вектор управления; е К - вектор внешних возмущений, которые полагаются неизвестными гладкими функциями времени, ограниченными вместе со своими производными в общем случае до п-го порядка. Предполагается, что вектор состояния х(0 полностью измеряется, шумы в измерениях отсутствуют, кроме того
(2) галкО(х) = галк^ (х) = р < п Ух е X, Опх =
(О ^
ОК рх р)
КО2(( п-р)х р) ^
элементы вектор-функции Дх, и) и матрицы ^(х) известны и являются гладкими функциями, удовлетворяющими условиям Липшица, они и их производные в общем случае до п-го являются ограниченными в процессе управления, в частности
(3) law*ш)||f0:
dt
< Fo, Vt > 0,
где F0, F0i, i = 1, ..., n, - известные константы, значения которых определяются из худшего допустимого случая с учетом цели и закона управления, а также особенностей среды функционирования объекта управления. Для простоты изложения основные результаты излагаются на основе оценок норм векторов. Без ограничения общности нижеследующие результаты можно применить для получения более точных покомпонентных оценок.
Цель и закон управления для системы (1) в данной работе не детализируются. Для текущей диагностики и/или формирования комбинированного управления ставится задача наблюдения компонент вектора внешних возмущений п(0 и их производных в общем случае до и-го порядка (1 < и < n - 1) путем оценивания их влияния непосредственно на объект управления. Расширение пространства состояний за счет ввода генератора внешних возмущений, имитирующих внешние возмущения, в рамках данных построений не предусмотрено.
В следующем разделе приводится базовый алгоритм оценивания внешних возмущений с построением динамического наблюдателя с кусочно-линейными корректирующими воздействиями на основе модели объекта управления (1).
3. Базовый алгоритм оценивания внешних возмущений при отсутствии генератора возмущений
Представим систему (1) с учетом (2) в виде двух подсистем
(4) " = " U) +
*2 = Л(U) + 02 (")ш, где dim " = rankQ (x) = p Vx e X, dim x2 = n — p.
Полагая элементы векторов x(t) и u(t) известными функциями времени, для оценивания возмущений построим наблюдатель состояния на основе первой подсистемы системы (4) в виде
от
(5) ¿0 = Л(х, и) + у0,
где z0, и0 е К - вектор состояния и вектор корректирующих воздействий наблюдателя соответственно. В силу (4)-(5) запишем систему относительно ошибок наблюдения
(6) £0 = х -z0 е Яр : е0 = Ох(х)п~V
Идея заключается в том, чтобы с помощью корректирующих воздействий и0(ео), где £0(0 - измеряемые сигналы, обеспечить в системе (6) стабилизацию и ошибок наблюдения, и их производных. Тогда в силу уравнений статики корректирующие воздействия будут отрабатывать внешние возмущения и служить их оценкой.
Как известно, наблюдатели с разрывными корректирующими воздействиями, функционирующие в скользящем режиме, решают эту задачу за конечное время [2, 3, 16]: 50(г) = ё0(г) = 0 г * г0 > 0,
но в условиях ограниченности вычислительных ресурсов приводят к низкому качеству (негладкости) оцениваемых сигналов.
Новая парадигма заключается в использовании в наблюдателе (5) непрерывных, ограниченных ^-образных корректирующих воздействий (в виде гладких сигма-функций о(х) = 2/(1 + е~ь) - 1 [4] или негладких 8а1;-функций [5-6]), обеспечивающих, с одной стороны, лучшее качество восстановленных сигналов, но, с другой стороны, решение задачи оценивания с заданной точностью:
(7) 11^0(г)||в £ ¿0, 1ко(г)||в £ ¿о ^ ^(г)« &(х(г)Жг) У * г0 > 0.
Используем в нижеследующих построениях простые в настройке ^-образные, кусочно-линейные корректирующие воздействия вида и0 = М0 8а1;(^£0), где
sat(k0s0) = оо^а^кскл), ..., *а1(к0£0р)),
м0818П£ш , Ы >1/ k0,
(8) M0sat(ks0l) =
Mokoso,, Ы ^ !/ kc
которые имеют два настраиваемых параметра: M0 = const > 0 -амплитуда корректирующих воздействий, к0 = const > 0 выполняет роль большого коэффициента [5, 6, 18].
Очевидно, что в замкнутой системе (6), (8) при конечных начальных условиях 1/ко <|К(0)||
за конечное время 70 > 0 ошибки наблюдения попадут в область
Цео (0|| 1/ко
при выполнении достаточного условия [2-6, 14]
(9) иИ = еТ(0(х)7 "М81©ео) < ||ео||(^о "М) < 0 ^Мо > Fо,
а при |Ио(о)|| < 1/ ко, в частности при
го (о) = Д1(о) ^£о(о) = о, не выйдут за ее границы.
При У7 > 70 динамика ошибок наблюдения и их производных описывается следующими уравнениями:
Ио = х)Ш- Мо коИо,
Ио = хШ ) - М окоИо.
С учетом (3) и данных уравнений из достаточных условий найдем нижнюю оценку для выбора большого коэффициента, при котором обеспечиваются оба неравенства (7) при уже выбранном на основе (9) значении амплитуды М0 >
ИоЧ < №о -Моко|Ио||) < °
И1Ио < |Ио||(^о1 -Моко|\Ио\\) < о ^
(10) ^ко*>,о<Л < 1/С
М Л
Таким образом, с помощью корректирующих воздействий будут получены текущие оценки внешних возмущений за конечное время с заданной точностью:
(11) ф) «Ш(г) = д-\х(г))Уо(г) Чг>
Ш)Ш )|| |е-1( х(г ))[ Ло = Л
Замечание 1. Если в системе (1) условие (2) не выполняется, а именно,
гапк<2ихр = гапк^к^ хр) = Ро < р , то задача покомпонентного оценивания вектора возмущений не
имеет решения. В этом случае аналогично с помощью наблюдателя (5), где г0, и0 е Яр°, решается задача оценивания линейных комбинаций внешних возмущений максимально возможного ранга:
у°(г) * О1(х(г Мг).
Замечание 2. При неполных измерениях вектора состояния х(0 в рамках данного подхода можно решить задачу оценивания и неизмеряемых переменных состояния, и внешних возмущений, если они не сужают наблюдаемого пространства вектора состояния [2-6, 16].
Далее полученные оценки (11) используются для синтеза корректирующих воздействий наблюдателей состояния виртуальных моделей с целью восстановить текущие значения производных внешних возмущений в общем случае до и-го порядка, 1 < и < п - 1.
В следующем разделе будет показано, что для обеспечения заданной точности оценивания производных возмущений до и-го порядка в базовом алгоритме следует обеспечить стабилизацию с заданной точностью не только первых, но и старших производных ошибок наблюдения £0 до (и + 1)-го порядка путем соответствующего выбора коэффициента усиления. С учетом (3) из достаточных условий, аналогичных (10), с точностью до затухающих собственных движений старших производных имеем:
кГкГ фс0^,. -МХЦк®!) < 0, , = 2,...,о +1,^ (12) ^ к° >-——-^
М Л
^ У 0 (г! = 0, V +1, г > г0.
4. Каскадный синтеза наблюдателей производных внешних возмущений, построенных на основе виртуальных динамических моделей
Пусть для целей комбинированного управления требуются
ю
оценки производных внешних возмущений в общем случае до и-го порядка, 1 < и < п - 1. Покажем, что эту проблему можно решить с помощью динамических наблюдателей, построенных на основе виртуальных динамических моделей.
Для оценивания первых производных внешних возмущений за основу принимаются восстановленные выше сигналы (7)
Л(г) = 01 (х(г))ш(г)« ^(г),
которые полагаются виртуальным выходом для дальнейших построений в рамках задачи наблюдения производных внешних возмущений. Виртуальной динамической моделью будем называть полную производную указанного виртуального выхода, полученную, еще раз подчеркнем, путем аналитического, а не реального дифференцирования:
(13) у1 = Н (х, + 01(х)ш1, где
Ш = Ш1 6 яр, н(х, иШ = ^-01(х).
аг
Далее аналогично будут использоваться обозначения Пг =Ш+1 6, г = 1,...,".
В системе (13) при 7 > 70 неизвестными являются только производные возмущений ш(0. В силу (11) для их оценивания построим наблюдатель как реплику виртуальной модели (13) в виде
(14) г = Н (х, и,Ш)Ш + V,
где и е ^ - вектор состояния и вектор корректирующих воздействий наблюдателя соответственно. В силу (13)-(14) запишем систему относительно ошибок наблюдения
И = У- г 6 КР
в виде
(15) ¿1 = ДН + 01 (х)ш1 - У1, V = М^а^Оъ - ^)), где элементы вектор-функции
ДН1 = Н (х, и, — Н (х, и, согласно априорным предположениям удовлетворяют условию Липшица: ¡АНН < А Л.
При выполнении условий, аналогичных (3), (9), (12), а именно, если У( > 0 имеют место оценки (16) ||О1(х(г ))71(г )|| ю < Ъ,
л.
—(АЛ,(г) + О1( х)^1 (г))
< Ъ,, = 1,...,v,
то при выборе амплитуды корректирующих воздействий
(17) М> Ц5° + ^
ошибки наблюдения за конечное время попадают в область
¿(г )|| ю<Л° +1/к:, где сдвиг на ¿0 обусловлен выражениями (6), (7), (12):
(18) = У-к° ^-zl = ¿1 -к°.
Таким образом, корректирующее воздействие (15) и его производные в указанной области представимы в виде
V = М^кк -¿с))^ = Мкк -е°М)),, = а выбор большого коэффициента на основе неравенства
(19) к> тах{^°+^ р11,..., },° <Л< 1/к;
М161
обеспечит попадание ошибок наблюдения системы (15) и их производных в область
¿1°(г)|| < ¿° + ¿1 У, = У г > г1 > г°,
||О1(х)^1 - = ¿г) - АЯЦю < ¿° + ¿1 + Ц5° ^
(20) п(г) * О1( х(г)М(г).
Таким образом, с помощью корректирующих воздействий (15) имеем текущие оценки первых производных внешних возмущений:
(21) %(г) *^(г) = О1-1( х(г)Шг),
1к(г)- й(г)||ю < |ОГ1(х(г)^(Л° + ¿1 + Ц3°) = ¿1.
Замечание 3. В рамках данных построений в текущих оценках внешних возмущений (11) и их производных (21) фигурируют непосредственно измеряемые сигналы и0(х1(0 - z0(t)), «1(и0(0 - ^1(0), что требует высокого качества измерений х(0 или
30
их предварительной фильтрации при наличии шумов в каналах измерений. Этот недостаток, присущий любым наблюдателям пониженной размерности, которые требуют высокого качества оценивания и точного знания параметров объекта управления [14, 17], можно частично обойти при построении полноразмерного наблюдателя, а именно, для оценивания линейной комбинации внешних возмущений использовать сигнал наблюдателя
(14): _
¿хС) = л(0 — 2\(г) * о^ ^(г)* 01(х(г))ш(г) Уг ^ гъ
(22) ||г1(г) — а(х(г))ш(г)||ю<Ло + Л.
Точность оценивания (22) будет хуже по сравнению с (11), где ¡V» — х)ш|| < 5о , но в силу фильтрующих свойств динамической подсистемы (14) можно ожидать лучшего качества (гладкости) восстановленных сигналов. Следует отметить, что использование наблюдателя (14) для получения оценок внешних возмущений (22) соответствует схеме построения расширенного наблюдателя Халила [15]. Отличие состоит в том, что в наблюдателе Халила используются глубокие обратные связи, а в нашем случае используются всюду ограниченные корректирующие воздействия, которые не порождают перерегулирование. Кроме того, наблюдатель (14) выполняет двойную функцию: его переменные дают оценку линейной комбинации внешних возмущений (22), а корректирующие воздействия служат оценкой линейной комбинации первых производных возмущений.
Указанные построения последовательно повторяются для оценивания старших производных возмущений. Так, для оценивания вторых производных аналогично на основе виртуального выхода у2 = Ql Ш составляем виртуальную динамическую модель
(23) у 2 = Н (х, и, + 01 (х)ш, соответствующий наблюдатель
(24) ¿2 = Н (х, и,ШШ + V2
и систему относительно ошибок наблюдения
(25) ¿2 = У2 — ¿2 6 Яр : ¿2 = АН + 01 (х)ш2 — V2,
где
АН2 = Н(х, и, 7)71 - Н(х,и, 7)71, ||АЯ2|ю < Ь215° + Ь225х.
С помощью кусочно-линейных корректирующих воздействий и2 = М2$,д&(к2(и\ - ^2)), где у2 * «1 (20), при выполнении условий, аналогичных (16)-(19), У( > ¿2 > обеспечивается сходимость переменных состояния системы (25) и их производных в область
¿(°(г)|| <80 + ^+82 (0<#2< 1/к;) У, = °,...,о-1,
||О1(х)72 - = ¿2« - АН21 ю<
< ¿0 + ¿1 + ¿2+АгД + АгД ^ ^(г) * О1( х(г))72(г).
Как следствие, при У/1 > ¿2 имеем альтернативный по отношению к (20) вариант оценивания линейных комбинаций первых производных возмущений в виде
Z2(г) * У2(г) = О1(Х)71^|Z2 - О1(Х)7||ю < ¿0 + ¿1 + ¿2 (см. замечание 3), а также текущие оценки вторых производных возмущений
(26) 72 (г) * 72 (г) = ОгЧх(г)>2(г), |72(г) - 72(г )|| ю <
< ||ОГ1( х(г ^[(¿с + ¿1 + ¿2 + ь215° + ь225х) = ¿2,
и т.д. Оценки (11), (21), (26) следует учитывать при назначении точности оценивания 0 < ¿7 < 1/кД 7 = 0, ..., у на каждом 7-м шаге.
Итак, для оценивания внешних возмущений и их производных до и-го порядка потребуется наблюдатель (5) и и наблюдателей типа (14), (24). Эти наблюдатели, по сути, являются дифференциаторами, т.е. восстанавливают текущие значения правых частей соответствующих дифференциальных уравнений при условии их ограниченности. Еще раз отметим, что в рамках данных построений реальное дифференцирование сигналов не выполняется.
Процедура синтеза подсистемы наблюдения декомпозируется на независимо решаемые элементарные подзадачи в каждом блоке размерности р, а параметры кусочно-линейных корректирующих воздействий выбираются на основе неравенств.
Еще раз подчеркнем, что данный подход не требует расширения пространства состояний и составления реальных динамических моделей внешних возмущений. Виртуальные динамические модели типа (13), (23) используются только как основа для построения наблюдателей состояния и не вводятся в контур обратной связи.
Для реализации разработанного подхода достаточно худших оценок на диапазоны изменения составляющих объекта управления, внешних возмущений и их производных, которые могут быть получены из предметных соображений.
5. Пример
Для иллюстрации разработанного метода рассмотрим задачу управления угловым положением перевернутого маятника при действии внешнего возмущения. С учетом динамики исполнительного устройства имеем следующую математическую модель объекта управления [6, 12]
xi = Х2,
(27) x2 = а21 sin x ~ аг1хг + °гз (x + V), x = -a32x2 _ 3X3
+ Ъ3и,
где Xi [рад] - угловое положение маятника (регулируемая переменная); x2 [рад/с] - угловая скорость; x3 [Нм] - вращающий момент, приложенный к маятнику на оси подвеса, который развивается исполнительным устройством с непрерывным управлением и; а21 = g /1, а22 = к/1, а23 = 1/(ml2), g = 9,8 [м/с2] -ускорение свободного падения; m [кг], l [м] - известные масса и длина маятника соответственно; к [Па• c ] - известный коэффициент вязкого трения; а32, а33, Ъ - известные положительные коэффициенты передачи; n(t) - неизвестная функция времени, которая характеризует действие внешних, ограниченных возмущений с ограниченными производными \n(t) < F0 , \n(t)| < Fi, \r¡(t) < F2 t > 0.
Все переменные состояния системы (27) подлежат прямым измерениям, шумы в измерениях отсутствуют.
Ставится задача синтеза комбинированного управления по обратной связи, обеспечивающего слежение выходной переменной x(t) за заданной, допустимой траекторией g(t); g(t), g(t), g(t) , g(t) - известные ограниченные функции времени, которые заданы аналитически либо порождаются динамическим генератором задающих воздействий [1, 9].
Для решения поставленной задачи представим систему (27) в канонической форме «вход-выход» [6, 16] относительно ошибки слежения ex = x _ g и ее производной e2 = x2 — g:
(28) ei = e2, e3 = e3,
e3 = w(x, t) + bu, b = а2ф3 -Ф 0, где e3 = a21 sin x — a22x2 + аз(x + 7) — g,
w = a^x^ cosx — a22(e3 + g) — a23(a32x2 + a33x3 — 7) — g, и сформируем базовый закон комбинированного управления в виде
(29) u = —(w(x, t) + l1e1 + l2e2 + l3e3) / b,
где ¡i = const > 0 - коэффициенты гурвицева полинома. Замкнутая система (28)-(29)
ei = e2 , e2 = e3 , e3 = —liei — l2e2 — l3e3
устойчива, в ней обеспечивается асимптотическая сходимость к нулю ошибки слежения: lim e(t) = 0 .
t^+CC
Для реализации базового закона управления (29) нужно получить оценки внешнего возмущения n(t) и его первой производной 7(t).
Вначале для оценивания внешнего возмущения n(t) построим наблюдатель как реплику второго уравнения системы (27) в виде
(30) ¿o = a2i sin x — a22x2 + a^x + Vo
и запишем систему относительно ошибки наблюдения
S0 = x2 — ¿0 : S0 = a237 — V0 .
Выбор параметров кусочно-линейного корректирующего воздействия и0 = M0 sat(£0£0) на основе неравенств, аналогичных (9), (12), а именно,
„ ,» max{Fo, F, F2} *
Мо>a2зFo, ко>-* ^ , 0<¿o < 1/ko
МQSo
обеспечит стабилизацию ошибки наблюдения и ее производной (7) и позволит получить за конечное время с заданной точностью оценку внешнего возмущения
(31) \a23r(t)-Vo(0| = |¿o(t)|Vt>to.
Теперь для виртуального выхода y1 = a23 r составим виртуальную динамическую модель y = a2 Г, на ее основе построим наблюдатель состояния
(32) ¿i = vi, Vi = Misat(ki(vo - ¿*)),y » Vo
и запишем систему относительно ошибки наблюдения
= У - ¿i : = a23r-Vi • Выбор параметров корректирующего воздействия и1 в виде, аналогичном (17), (19), а именно
л,* т- ;» a23max{Fi,F2} *
Mi > a23Fi, k* > 23 д y' 21, o< Si < i/k* , m* s
обеспечит стабилизацию ошибки наблюдения и ее производной и позволит получить за конечное время с заданной точностью оценку производной возмущения
(33) 0r(t) - Vi(t) = |¿i(t) < So + s* Vt > ti > to.
Полученные оценки (31), (33) используются в законе управления (28) для формирования переменных e3(t), ^(t): e (t) = a2i sin x* (t) - a22^2 (t) + a23%3 (t) + Vo (t) - g(t), V<t) = a2i cos x* (t) • X2 (t) - a22(e3 (t) + g (t)) -- a23(a32X2 (t) + a33X3 (t)) + v* (t) - g (t).
Моделирование замкнутой системы (27), (29), (30), (32),
(34) проводилось в среде Matlab Simulink при следующих параметрах:
a32 = 2 , a33 = io, b = io, m = i, l = i, к = 8, x¿ (o) = i,
¿o (o) = X2(0) = o,
g = sin(o,5t) , r(t) = o,5sin2t, l* = i25, l2 = 75, l3 = i5, Mo* = 2, M* = 2, ko* = ioo, k* = 5o.
Результаты моделирования подтвердили эффективность разработанного подхода к оцениванию внешних возмущений и их производных. На рис. 1-2 показаны графики внешнего возмущения а2), его производной а2и соответствующих
ошибок оценивания а2_ V) (/), а2з^СО _ V ) •
012345678 о 2 4 6 8
Время, с Время, с
Рис. 1. Графики а23ц({) и а23г/({) - у0()
Время, с Время, с
Рис. 2. Графики а23г]ф и а23?/(0 — V (^)
Как видно из графиков, имеют место следующие оценки: (35) |а2з7(0 — г0(0| < 0,01 Ы > 0,
|а23?7(0 — V^)| < 0,06 Ы > 0,1 [с].
На рис. 3 представлены графики углового положения маятника Х\(?), заданной траектории g(t) и ошибки слежения ЫО = хх(1) - g(t)•
Как видим, для ошибки слежения имеет место следующая оценка
Ца )| < 0,01 [рад] У г > 2 [с], которая обусловлена ошибками оценивания (35).
Рис. 3. Графики х^), g(t) и е^)
Замечание 4. В рамках данного подхода мы могли использовать другой вариант информационного обеспечения базового закона комбинированного управления (29) [6, 16]. А именно, непосредственно получить оценки переменных е3(Г), у(() с помощью наблюдателя с кусочно-линейными корректирующими воздействиями, построенного на основе второго и третьего уравнения системы (28): (36) ¿2 = ¿3 + V2, ^ = М28аК£2(е2 - ¿2^
¿з = Ьи + Vз, Vз = Мэ8а1;(&з(у2 — ¿3)).
При соответствующем выборе параметров корректирующих воздействий обеспечивается стабилизация с заданной точностью ошибок наблюдения
¿2 = е2 — ¿2 , ¿3 = е3 — ¿3
и их производных
¿2 = £3 — ^, ¿з = ^( х, г) — V, что позволяет получить за конечное время последовательно оценки
ез(*) * ¿з(0, ^(0 *V2(г), <И0 *Vз(г)
и реализовать закон управления (29) в виде и = — (у3 + 11е1 + 12е2 + ¡^3)/Ь .
В этом случае структура регулятора упрощается, но возникают определенные трудности с получением оценок области изменения переменных е3(?) , у/({) , ц/(?), необходимых для настройки параметров наблюдателя (36).
Литература
1. АНДРЕЕВ Ю.Н. Управление конечномерными линейными объектами. - М.: Наука, 1976. - 424 с.
2. КРАСНОВА С.А. Каскадный синтез наблюдателя состояния для нелинейных систем при наличии внешних возмущений // Автоматика и телемеханика. - 2003. - №1. - С. 3-26.
3. КРАСНОВА С.А., КУЗНЕЦОВ СИ. Оценивание на скользящих режимах неконтролируемых возмущений в нелинейных системах // Автоматика и телемеханика. - 2005. -№10. - С. 54-69.
4. КРАСНОВА С.А., УТКИН А.В. Сигма-функция в задачах синтеза наблюдателей состояний и возмущений // Проблемы управления. - 2015. - №5. - С. 27-36.
5. КРАСНОВА С.А., УТКИН В.А., УТКИН А.В. Блочный подход к анализу и синтезу инвариантных нелинейных систем слежения // Автоматика и телемеханика. - 2017. - №12. -С. 26-53.
6. КРАСНОВ Д.В., УТКИН А.В. Синтез многофункциональной системы слежения в условиях неопределенности // Управление большими системами. - 2017. - Вып. 69. -С. 29-49.
7. МАЛИКОВ А.И. Синтез наблюдателей состояния и неизвестных входов для нелинейных липшицевых систем с неопределенными возмущениями // Автоматика и телемеханика. -2018. - №3. - С. 21-43.
8. НИКИФОРОВ В.О. Адаптивное и робастное управление с компенсацией возмущений. - СПб.: Наука, 2003. - 282 с.
9. УОНЕМ У.М. Линейные многомерные системы управления. Геометрический подход. - М.: Наука, 1980. - 376 с.
10. УТКИН В.А., УТКИН В.И. Метод разделения движений в задачах инвариантности // Автоматика и телемеханика. -1983. - № 12. С. 39-48.
11. ЮРКЕВИЧ В.Д. Расчет и настройка регуляторов для нелинейных систем с разнотемповыми процессами // Автометрия. - 2012. - Т. 48, №5. - С. 24-31.
12. ANGELI D. Almost global stabilization of the inverted pendulum via continuous state feedback // Automatica. - 2001. -Vol. 37. - P. 1103-1108.
13. DAROUACH M., BOUTAT-BADDAS L., ZERROUGUI M. H0-observer design for a class of Nonlinear singular systems // Automatica. - 2011. - Vol. 47, No. 11. - P. 2517-2525.
14. DELSHAD S.S., JOHANSSON A., DAROUACH M., GUS-TAFSSON T. Robust state estimation and unknown inputs Reconstruction for a class of nonlinear systems: multiobjective approach // Automatica. - 2016. - Vol. 64. - P. 1-7.
15. KHALIL H.K., PRALY L. High-gain observers in nonlinear feedback control // Int. Journal Robust and Nonlinear Control. -2014. - Vol. 24. - P. 993-1015.
16. KRASNOVA S.A., UTKIN A.V. Analysis and synthesis of minimum phase nonlinear SISO systems under external unmatched perturbations // Automation and Remote Control. - 2016. -Vol. 77, No. 9. - P. 1665-1675 (Рус.: КРАСНОВА С.А., УТКИН А.В. Анализ и синтез минимально-фазовых нелинейных SISO-систем при действии внешних несогласованных возмущений // Проблемы управления. - 2014. - №6. -С. 22-30).
17. LUENBERGER D.B. Observers of multivariable systems // IEEE Transactions on Automatic Control. - 1966. -Vol. AC-11. - P. 190-197.
18. TEEL A.R. A nonlinear small gain theorem for the analysis of control systems with saturation // IEEE Transactions on Automatic Control. - 1996. - No. 41. - P. 1256-1270.
ESTIMATION OF EXTERNAL DISTURBANCES DERIVATIVES BASED ON VIRTUAL DYNAMIC MODELS
Svetlana Krasnova, V.A. Trapeznikov Institute of Control Sciences of RAS, Moscow, Bauman Moscow State Technical University, Doc.Sc., Professor, Chief Researcher ([email protected]).
Abstract: The method of synthesis of invariant systems in the presence of a dynamic model, that simulates the effect of external disturbances, and the construction on its basis of a dynamic compensator or disturbances observer, is most developed in the theory of automatic control. An alternative method for estimating external influences that does not require the extension of the state space is to use state observers with discontinuous corrective actions functioning in the sliding mode or their continuous analogues. Within the framework of this approach, the original method for estimating the derivatives of external disturbances based on virtual dynamic models composed by sequential differentiation of a part of the derivative of state variables of the control plant, to which the estimated disturbances acting, is proposed. Virtual models are not introduced into the regulator, only dynamic observers of disturbances derivatives are present in the feedback loop. Observers are built as replicas of virtual models. Procedure for cascade synthesis of observers of disturbances derivatives with piecewise linear correcting actions is developed. In this procedure, the motions separation method in virtual space of observation errors is realized. And observer's variables, and their corrective actions, serve as estimates of the derivatives of external disturbances, and they can be used to synthesize combined feedback and/or current diagnostics of the control process.
Keywords: nonlinear systems, external disturbances, disturbances observers, cascade approach, motion separation method.
УДК 62.50 ББК 32.817
DOI: 10.25728/ubs.2018.76.1
Статья представлена к публикации членом редакционной коллегии В.А. Уткиным.
Поступила в редакцию 11.05.2018.
Опубликована 30.11.2018.