УДК 62—501.2
СИГМА-ФУНКЦИЯ В ЗАДАЧАХ СИНТЕЗА НАБЛЮДАТЕЛЕЙ СОСТОЯНИЙ И ВОЗМУЩЕНИЙ1
С.А. Краснова, A.B. Уткин
Для нелинейных систем, функционирующих в условиях неопределенности, на основе принципа разделения движений разработаны методы синтеза наблюдателя состояний с нелинейными корректирующими воздействиями в виде сигма-функций. Показано, что для систем, представимых в регулярной форме относительно внешних возмущений, данный подход позволяет получить текущие оценки неизмеряемых переменных состояния и внешних возмущений без расширения динамического порядка наблюдателя за счет модели, имитирующей действие внешних возмущений. Разработанные алгоритмы применены в системе управления асинхронным электроприводом с неполным комплектом измерительных устройств.
Ключевые слова: нелинейная система, наблюдатель состояний и возмущений, сигма-функция, асинхронный электропривод.
ВВЕДЕНИЕ
Рассматриваются нелинейные системы управления с функциональными неопределенностями математической модели объекта управления и при действии внешних возмущений, принадлежащих пространству управления. В таких системах инвариантность переменных вектора состояний по отношению к неопределенностям может быть обеспечена или с помощью разрывных управлений и организации скользящего режима [1], или с помощью непрерывного комбинированного управления с составляющей, компенсирующей действие возмущений при наличии их оценок. Практически значимый метод оценивания возмущений, не требующий составления их динамической модели, заключается в применении наблюдателей состояний с разрывными корректирующими воздействиями, функционирующих в скользящем режиме [2—4]. В § 1 продемонстрирована процедура синтеза такого наблюдателя, реализующая принцип разделения общего движения на разнотемповые составляющие при последовательном возникновении скользящих режимов на пересечении поверхностей в виртуальном пространстве ошибок наблюдения. Показано, что при выполнении определен-
1 Работа выполнена при финансовой поддержке РФФИ (грант № 15-08-01543а и 14-01-31190 то1_а.
ных условий данный наблюдатель позволяет получить текущие оценки и неизмеряемых переменных состояния, и возмущающих воздействий. Однако для обеспечения высокого качества оценивания требуется организовать скользящий режим, близкий к идеальному, при котором изображающая точка системы, записанной относительно ошибок наблюдения, движется по многообразию скольжения, совершая колебания с бесконечно большой частотой и бесконечно малой амплитудой. При большой, но конечной частоте переключений возникает реальный скользящий режим [5], в котором возможны хаотичные высокочастотные колебания изображающей точки в ненулевом пограничном слое многообразия скольжения, что приводит к неудовлетворительному качеству оценивания при использовании бортовых компьютеров с маломощным процессором. Этот факт стимулирует разработку альтернативных методов синтеза наблюдателя состояний и возмущений с непрерывными корректирующими воздействиями.
В § 2 представлен основной результат — методы синтеза наблюдателя состояний и возмущений с нелинейными непрерывными корректирующими воздействиям в виде сигма-функций. Показано, что такой наблюдатель, размерность которого равна размерности модели объекта управления, сохраняет преимущества наблюдателя на скользящих режимах в допредельной ситуации и, в то же время, обеспечивает лучшее качество (гладкость)
оцениваемых сигналов в условиях ограниченности вычислительных ресурсов. Формализована процедура настройки параметров сигмоидальных корректирующих воздействий на основе неравенств, обеспечивающих за заданное время заданную точность оценивания неизмеряемых переменных состояния и имеющихся неопределенностей. В § 3 в качестве приложения рассмотрена задача наблюдения неизмеряемых переменных состояния и внешнего возмущения в асинхронном электроприводе, приведены результаты моделирования.
1. ПРИНЦИП РАЗДЕЛЕНИЯ ДВИЖЕНИЙ В ЗАДАЧЕ НАБЛЮДЕНИЯ
Рассматривается математическая модель нелинейного объекта управления вида
х 1 = х2, х2 = /(х, г) + Ь(х^и,
(1)
где х = со1(х1, х2) е X с Е2 — вектор состояний; х1(?) е Е — выходная (измеряемая) переменная; фазовая переменная х2(г) не измеряется, но предполагаются известными либо область ее изменения в процессе управления |х2(г)| < Х2, либо область допустимых начальных условий |х2(0)| < Х2; и е Е — управляющее воздействие, Ь(х1) — известная функция, Ь(х1) ^ 0 УхДг), г > 0. Неизвестная функция /(х(г), г), которая включает в себя функциональные и параметрические неопределенности модели объекта управления, а также внешние возмущения, полагается ограниченной вместе со своей полной производной:
|/(х(г), г)| < F, |/(х(г), г)| < ¥1 Ух(г) е X, г > 0, (2)
где ¥ и ¥1 — известные положительные константы; динамическая модель неопределенностей не вводится. Требование гладкости на /(г) и / (г) не накладывается, достаточно, чтобы данные функции были кусочно-непрерывными и имели в каждой точке, включая точки разрыва, конечные правую и левую производные.
Моделью (1), имеющей регулярную каноническую форму, описывается представительный класс динамических объектов управления, например, механические и теплообменные системы. Модели ряда других объектов могут быть представлены в виде (1) с помощью диффеоморфной замены локальных переменных. Мы намеренно приняли за основу построений систему второго порядка, чтобы максимально детализировать основную идею разработанного метода. Без ограничения общнос-
ти нижеследующие построения распространяются на объекты управления более высокого порядка, математические модели которых представимы в регулярном каноническом виде.
В данной работе цель и закон управления не детализируются: проблема автоматического управления системой (1) в различных постановках решалась множество раз в рамках различных подходов. Ориентируясь на базовый закон комбинированного управления (по состоянию и по возмущению) ставится задача оценивания неизмеряемых сигналов х2(г), /(г).
Эта проблема может быть решена с помощью наблюдателя с разрывными корректирующими воздействиями, функционирующего в скользящем режиме, который строится на основе системы (1) в виде
г 1 = г2 + г2 = Ь(х1)и + v2,
(3)
где г = со1(г1, г2) е Е2 — вектор состояний, V = = со1^, е Е — вектор разрывных корректирующих воздействий наблюдателя. Задача наблюдения сводится к задаче стабилизации системы, записанной относительно ошибок наблюдения е = х — г = со1(в1, е2) е Е в силу модели (1), (2) в виде
Е1 = е2 - V1, Е2 = /(г) - ^
(4)
Согласно каскадному методу синтеза наблюдателей состояний на скользящих режимах [4], в первом уравнении системы (4) формируется разрывное корректирующее воздействие от известных переменных v1 = м181§пе1, которое при выполнении достаточных условий
е1 е 1 < 0 ^ м1 > м* = |Е1(0)|/г1 + ф2,
|Е2(г)| < ф2 у г > 0 (5)
обеспечит за конечное время г1 > 0 возникновение скользящего режима на прямой е1 = 0 в двумерном пространстве ошибок наблюдения. Заметим, что при установке начального условия г1(0) = х1(0) ^ ^ е1(0) = 0 скользящий режим возникает практически сразу и г1 « 0.
При г > г1 динамический порядок системы (4) понижается, и из уравнения статики е 1 = е2 — v1eq = 0
имеем эквивалентное корректирующее воздействие v1eq(г) = Е2(г). Этот сигнал может быть получен с выхода фильтра первого порядка с малой посто-
янной времени ц т, = —х, + v,, lim x,(i) = v1eq (t) 11 1 1 ^ ^+0 1 q
[1]. Тогда во втором уравнении системы (4) можно сформировать разрывное корректирующее воздействие v2 = M2signx1, что обеспечивает v2 = M2signs2 вне малой окрестности е2 = 0. Амплитуда разрывного воздействия выбирается на основе достаточных условий
Е2 е 2 < 0 ^ м2 > |е2(?1)|/(?2 - t1) + F. (6)
Пренебрегая быстро затухающими собственными движениями фильтра, можно считать, что за теоретически конечное время t2 > t1 на пересечении {е1 = 0 П е2 = 0} возникает скользящий режим. При t > ¿2 из уравнения статики е2 = /(t) — v2eq = 0 имеем эквивалентное корректирующее воздействие v2eq(t) = /(t). Этот сигнал, который является оценкой неизвестной функции, также может быть получен с выхода фильтра первого порядка:
Ц2Т 2 = —Т2 + ^ limn T2(t) = V2eq(t) = /(t).
^ +0 4
Тот факт, что, начиная с момента времени t1, переменная E2(t) начинает монотонно стремиться к нулю, позволяет оценить область ее изменения следующим образом:
|е2(t)| < |E2(t1)| < X2 + (F + M2)t1 = Ф2 Vt > 0. (7)
С учетом оценки (7) выбирается амплитуда разрывного корректирующего воздействия v1 (5).
Для стабилизации системы (4) за заданное время t2 = T с учетом условий (6) и оценки (7) имеем следующее неравенство для выбора амплитуды разрывного корректирующего воздействия v2:
M2 > |E2(t1)|/(t2 — t1) + F ^ M2 > M2* =
= (X2 + Ft2)/(t2 — 2t1), 0 < t1 < t2/2. (8)
Главное преимущество наблюдателя на скользящих режимах — оценивание за конечное время и неизмеряемой переменной x2(t) = z2(t), и возмущения x2(t) «/(t) Vt > T без ввода его динамической модели. Данный наблюдатель является робаст-ным, так как амплитуды разрывных корректирующих воздействий выбираются на основе неравенств, не требующих детализированной математической модели объекта управления. С другой стороны, динамический порядок наблюдателя (3) увеличивается в два раза из-за ввода фильтров, которые вносят дополнительные малые динамики. Кроме того, микропроцессорная реализация раз-
рывных управлений с большой, но конечной частотой переключений может привести к неудовлетворительному качеству оцениваемых сигналов, так как на полезный сигнал накладывается паразитный высокочастотный сигнал с малой амплитудой.
Гладкость оцениваемых сигналов обеспечивают наблюдатели с непрерывными корректирующими воздействиями. Известный способ стабилизации систем с неопределенностью — применение глубоких обратных связей. Так, выбор в системе (4) линейных корректирующих воздействий у1 = к1Б1, у2 = к2£1 с большими коэффициентами к1 . к2 . 0 обеспечит стабилизацию ошибок наблюдения с заданной точностью ||£(?)|| < 8 V? > Т, если возмущающее воздействие не затухает со временем. Для многомерных канонических систем с неопределенностью в последнем уравнении известны параметрические схемы настройки больших коэффициентов наблюдателя [4, 6, 7]. Основной недостаток таких наблюдателей: большие коэффициенты усиления, значения которых обратно пропорциональны степеням задаваемой области сходимости - -2
к2(1/8), к1(1/8 ), приводят к избыточному потреблению ресурсов управления на начальной стадии, что требует искусственного ограничения управляющего сигнала. Кроме того, для получения оценок имеющихся неопределенностей потребуется ввести дифференциальное уравнение, характеризующее их динамику [7].
Наша цель заключается в том, чтобы, во-первых, не расширять порядок наблюдателя для получения оценок возмущающих воздействий, во-вторых, не прибегать к искусственному ограничению управляющего воздействия и, в-третьих, избежать возможного всплеска в начале переходного процесса в замкнутой системе с наблюдателем. Этой цели отвечает выбор корректирующих воздействий наблюдателя из класса так называемых ^-образных непрерывных функций с насыщением (8а1;-функ-ция, сигма-функция, арктангенс, гиперболический тангенс и др.) [8, 9]. В следующем параграфе представлен основной результат: показано, что с помощью наблюдателя с непрерывными ограниченными корректирующими воздействиями в виде сигма-функций, размерность которого равна размерности объекта управления (1), можно получить оценки не только неизмеряемой переменной состояния, но и ограниченного возмущения. Принцип разделения движений в таком наблюдателе реализуется в допредельной ситуации, что приведет к решению задачи оценивания с некоторой, наперед заданной точностью, которая обеспечива-
ется за заданное время выбором параметров корректирующих воздействий. Показано, что в таких наблюдателях, в отличие от наблюдателя с глубокими обратными связями, имеется возможность учитывать имеющиеся ограничения на ресурсы управления на стадии синтеза и избежать существенного «всплеска» на начальном этапе процесса управления.
2. СИНТЕЗ НАБЛЮДАТЕЛЕЙ СОСТОЯНИЙ И ВОЗМУЩЕНИЙ С СИГМОИДАЛЬНЫМИ КОРРЕКТИРУЮЩИМИ ВОЗДЕЙСТВИЯМИ
Рассмотрим нелинейную гладкую ограниченную сигма-функцию a(kx) = 2/(1 + e kx) — 1, k = const > 0, которая является допредельной реализацией функции знака y = signx в следующем смысле: a(—kx) = — a(kx), a(kx) x~ 0 kx/2,
a(kx) k signx. Первая производная сигма-функции — положительная ограниченная функция, вторая производная — ограниченная нечетная функция:
a (kx) = k(1 - a2(kx))/2, a"(kx) = —ka'(kx)a(kx).
(9)
Для сигма-функции и ее первой производной в указанных интервалах справедливы оценки:
ст(к5) < |ст(кх)| < 1, У|х| > 5 > 0;
ст(Л5)|х|/5 < |ст(кх)| < ст(к5),
0 < ст (к5) < ст '(кх) < ст (0) = к/2 У |х| < 5. (10)
Отсюда следует, что при |х| > 5 сигма-функция близка к постоянной функции, а при |х| < 5 — к линейной. В качестве границы указанного разделения сигма-функции при х > 0 рекомендуется принять точку из интервала к5 = с е [1,3; 3], где ± 1,3 — абсциссы точек перегиба первой производной ст '"(±1,3) = 0 (при этом ст(±1,3) « ±0,57, ст (±1,3) « 0,34к); ± 3 — абсциссы вершин сигма-функции, в которых ее кривизна достигает максимума, при этом ст(±3) - ±0,9, ст (±0,9) ~ 0,095к [8].
Для дальнейших построений введем сигма-функцию с переменным ограниченным сдвигом
|ф(г)| < а у г > 0:
ст (кх) = ст(к(х — ф(г)), ст(к(х - А)) < ст (кх) < ст(к(х + А),
ст '(кх) = к(1 - ст2 (кх))/2.
Для функций a (kx) и a ' (kx) в указанных интервалах справедливы оценки:
a(k5) < |a (kx)| < 1 Vjxj > А + 5,
sign a (kx) = signx Vjxj > А,
a(k5)(|x| — А)/5 < |a (kx)| < a(k(2A + 5)) (11)
Vx: A < jxj < A + 5;
0 < a '(k(2A + 5)) < a '(kx) < k/2 Vjxj < A + 5.
Используем в наблюдателе (3) сигмоидальные корректирующие воздействия вида
v1 = M1a(k1s1), v2 = M2a(k2v1),
(12)
где М-, к > 0, / = 1, 2. Идея заключается в том, чтобы в системе (4), (12) обеспечить за заданное время стабилизацию с заданной точностью не только ошибок наблюдения, но и их производных е 12 « 0. Тогда неизмеряемые сигналы могут быть непосредственно получены из уравнений статики без расширения пространства состояний: v1 « Е2(г),
V2(г) - /(г).
Предварительно рассмотрим ситуацию, когда для целей управления требуется получить оценки только неизмеряемой переменной состояния х2(г) системы (1).
Лемма. Если в системе (4), (12) условия (2) выполнены, то для любых сколь угодно малых 5 , Т > 0 и любых конечных начальных условий е1(0), |е2(0)| < Х2
найдутся такие положительные константы к* > 0, М* > 0, / = 1, 2, что для всех к > к*, М > М* будут выполнены неравенства
|в1(<)| < 5, |s2(t)| < 5 Vt > T.
(13)
Конструктивное доказательство. Каждое корректирующее воздействие (12) имеет по два параметра. Амплитуды М; > 0, г = 1, 2, выбираются так же, как и амплитуды разрывных корректирующих воздействий с тем, чтобы обеспечить попадание ошибок наблюдения в некоторую окрестность нуля за заданное время. Большие коэффициенты к; > 0, г = 1, 2, выбираются так, чтобы обеспечить заданную точность стабилизации (13).
Рассмотрим первое уравнение системы (4), (12): ё I = ё2 — у1 ^ у1 = ё2 — ё х, тогда v2 = М2р(к2у1) =
М2а (к2ё2), где роль сдвига выполняет первая производная первой ошибки наблюдения <(?) = ёх (?) и, согласно оценкам (11), signv2 = signё2, если |ё2| > |ёх |.
Для регуляризации процедуры синтеза введем параметрическую связь
0 < с,- = кД, с,- е [1,3; 3], / = 1, 2, (14) и выделим интервалы времени 0 < < ?2 < Т для сходимости переменных 81 2(?), 81 (?) в указанные окрестности нуля:
ЦС)! < §1 < 8 V? > ?1, |82(?)| < |¿1 (?)| + 82, (15) |ех (?)| < А V? > ?2, 0 < А + 82 < 8, (16)
при этом |е2(0| < |¿2()| < Ф2 (7), (?)| < (?1)| < Ф2 + Щ-Для анализа устойчивости введем для системы (4),
(12) квадратичную форму = 1- (8^ + ). С учетом выражений (7), (10), (11), (14) для ее производной
Ко = 81(82 - V + 82(/ - У2) (17)
справедлива оценка: КО < |е1|(Ф2 — М1ст(с1)) + |е2|(^ —
— Ж2а(с2)). Неравенство К < 0 выполняется при Ж1а(с1) > Ф2, Ж2а(с2) > Г вне окрестности |е1| < с1/к1 = 81, |е2| < 1811 + 82, 82 = с2/к2. Неравенства для выбора амплитуд .Щ 2, при которых условия (15) обеспечиваются за заданное время, аналогичны неравенствам (5) и (8), а именно:
Х2 + „ с2)
м2 > M2* =
(t2 - tlMc2) - tl
, 0 < tj <
1 + a(C2)'
.1 > Щ = (|81(0)|/?1 + Ф2)/а(с1). (18)
Для целей анализа введем вспомогательное уравнение, которое характеризует динамику производной 81 (?):
81 = —.^'(к^) 81 + /(?) — У2. (19)
Для обеспечения выполнения неравенств (16) оценим решение уравнения (19) на интервале [?1; ?2]:
-к1а1<,*2 - Г1>
|8i (t)| < (Ф2 + Mj)e
+ (F + M2)/(k1a1) < 8 - 82
где a1 = M1(1 - a2(c1))/2 > 0, тогда Va: 0 < a < 8 - 82 имеем
k1 > kl = max
ln ((Ф2 + M1)/a). F + M2
ai(t2 - ti) a1(8 - 82 - a)J Выбор больших коэффициентов на основе неравенств
k1 > max{ kl; c1/81}, k2 > k2 = c2/82. (20) в зависимости от принятых значений c; е [1,3; 3], i = 1, 2, 82, a обеспечивает заданную точность стабилизации ошибок наблюдения за заданное время (13). Лемма доказана. ♦
Если задача оценивания неизвестной функции f(t) не ставится, то для оценивания фазовой пере-
менной х2(?) можно применить укороченный наблюдатель 11 = у1, у1 = М1ст(к1Е1). Тогда уравнение относительно ошибки наблюдения е1 = х1 — z1 примет вид е 1 = х2 — у1, и после стабилизации производной ошибки наблюдения е 1 « 0 можно будет непосредственно получить оценку неизмеряемого сигнала: у1(?) « х2(?). Для настройки параметров сигмоидального корректирующего воздействия у1 воспользуемся полученными выше результатами.
Из леммы вытекают два следствия.
Следствие 1. Если в системе (1) выполняются условия (2), |х,(?)| — X, а также \Ь(х(?))и(?)| — и V? > 0, то тогда при оценивании х2(?) с помощью укороченного
наблюдателя неравенство |х2(?) — у1(?)| — 8 V? > Т
будет обеспечено для любых 8, Т > 0, если
М1 > М* = (|е1(0)|/?1 + Х2)/а(С1), 0 — ?1 < Т, ((Хг + М1)/а). Е + и . С1}
k1 > k1 = max
ai(T- t1) ' ^(8 - а/ 8
где а1 = М1(1 - ст2(с1))/2 > 0, с1 е [1,3; 3], 0 < а < 8.
Следствие 2. Если в системе (1) внешнее возмущение отсутствует, Ь(х1, х2) и Дх^ х2) — известные функции, удовлетворяющие условию Липшица, \и(?)\ > и V? > 0, тогда с помощью наблюдателя ^ 1 = г2 + у1, ¿2 =/(г1, г2) + Ь(г1, г2)и + у2 можно обеспечить асимптотическую стабилизацию ошибок наблюдения Ит е1 2(?) = 0 ^ Ит г1 2(?) = х1 2(?) с
t^ + да ' t^ ' '
помощью сигмоидальных корректирующих воздействий (12) с параметрами
> N2 (X (1 + — -1 ) + — | Е1 ( 0 ) I -1 ) 2 а ( - ) - | -1 ,
M >
| £1 ( 0 ) I + - Ф 2 0 < t < етС£2>
О ( С 1 ) , 1 -2 :
k2 >
C2I N2 + 1N12 + 3 С2О ( С2)
k1 >
2| b2 + Ъ\ + 4N2 + IN2
= M2k20( С2) b2 =
С
2
M1 (1 - а (С1))
Ф2 = X2(1 + N2t1) + N1|61(0)|t1 + M2t1, c1; 2 e [1,3; 3], fx) + b(x)u - f(z) + b(z)u\ < NJeJ + N2)621, где N1 и N2 — известные константы.
Замечание. Неравенства (18) и (20) нацелены на выбор минимально допустимых амплитуд М1 2 при к ~ с/Ь1 (14), что при достаточно малых 8г может привести к плохо обусловленным вычислениям. Если принять сг- = Л^/^б^, сг- е [1,3; 3], / = 1, 2, где /г > 1 — коэффициенты пропорциональности произведения Мк, то можно понизить допустимые значения к благодаря увеличению амплитуд М. Тогда неравенства (15) и (16) представимы в виде
|е1(?)| < /1б1 V/ < /п, |е2(/)| < |е 1 (/)| + /2б2 V/ > /12,
0 < *11 < ¿1 < ^12 < /2 < Т
В областях б1 < |е1| < /1б1, | Е 11 + б2 < |е2| < | Е 11 + /2б2 для производной квадратичной формы (17) с учетом оценок (10) и (11) справедлива оценка
¿0 < |е1|(Ф2 - ь1|е1|) + У(Е- ^(Ы - |Е 1|)),
где Ь. = Мг.ст(с;)/(/г.бг) > 0. Неравенство 10 < 0 выполняется при М2 > Е/2/ст( с2 ), М1 > Ф2/1/ст( с1). Соответственно, требования (13) выполняются при условиях:
M2 > M2* = max I - + 12
Fl28
2U2
(¿12 - ?1 )ü(c2) - ?1 c2)(82 - a2)
^ ll£1(0)| + Ф2111 Ф21181 1
M > M* = max I' 1 1-—; -2-1—1-\ ,(21)
1 1 1 о (c 1 ) in 'a (c 1 ) (8 1 - a1 )fA
где l. > 1 выбираются желаемым образом, a;: 0 < at < 8г, i = 1, 2, выбираются так, чтобы обеспечить a2 > Ф2ехр(—b2(t2 — t12)), a1 > l181exp(—b1(t1 — t11)), а неравенства для выбора больших коэффициентов примут вид
k1 > max{ ; c1 /(l181)}, k2 > k*2 = c2 /(l282)}. (22)
Теперь рассмотрим общий случай, когда с помощью наблюдателя (3), размерность которого равна размерности объекта управления (1), решается проблема оценивания не только неизмеряе-мой переменной состояния x2(t), но и имеющихся неопределенностей /(?).
Теорема. Если в системе (4), (12) выполнены условия (2), то для любого, достаточно малого 8 > 0 и любых конечных начальных условий е1(0), |е2(0)| < X2
найдутся такие положительные константы k* > 0,
М* > 0, что при кг > к*, М > М* обеспечивается заданная точность оценивания х2(/), Д/), а именно:
|Еи(0| < б ^ |Х2(/) - ^2(/)| < б ,
IЕ2 (/)1 < б ^ |Д/) - г2(/)| < б . (23)
Конструктивное доказательство. Как показано в доказательстве леммы, условия (15) будут обеспечены при выборе амплитуд М (18) и > с;/8; (14), г = 1, 2. Требования (23) будут выполнены, если обеспечить выполнение условий (16) и |/(?) — у2(?)| < |ё21 < 8 . С учетом формул (9) и у1 = ё2 — ё1 для целей анализа введем вспомогательные дифференциальные уравнения относительно производных ё1 (?), ё1 (?) и ё2 (?), а именно уравнение (19) и уравнения
2 ■
ё'х = —М1а (^1ё1)(ё1 — ^1а(^1ё1)ё1 + М2а (Л2у1)ё1) + /,
ё2 = — М^а'(^2(62 - ёх))(ё2 - ёх) + /. (24)
Для анализа устойчивости виртуальной системы (19),
(24) введем квадратичную форму V = 1 (ё1 + ё1 + ё2).
С учетом условий (2), (10) и (11) для производной квадратичной формы справедлива оценка
VI < |ёх + М2 - ^^ |) + |ёх |(^1 - Ат1а1(|ёх | -
- ^а^)ё2 - 0,5М2^2|ё1|)) + |ё21(^1 + ^(М - М),
где а1 = 0,5М1(1 - а2(с1)) > 0, а2 = 0,5М2(1 - а2(с3)) > 0,
с3 = £2(8 + 2А) = с2 + 2£2А. Неравенство V! < 0 выполняется вне указанных окрестностей при выполнении условий
| ё21 < 82 + | ё11 < 8 при > = тах{с2/82; ^,/(а282)}, |ё11 < ^1/к1а1 + к1а(с1) ё! + 0,5М2^2|ё11 < 8 - 82, £2А < 2( 8 - 82)/М2, |ё11 < (^ + М2)/(к1а1) = А << 8 - 82,
= max
ст(Cl)(F + M2)2 + fll(Fx + 0,5M2k2(F + M2)) Cl
2 -
öl(5 - 5)
' — 1'
на основе которых выбираются большие коэффициенты 2, обеспечивающие заданную точность оценивания (23). Теорема доказана. ♦
Полученные результаты свидетельствуют о принципиальной возможности оценивания имеющихся неопределенностей с помощью наблюдателя состояний. Еще раз подчеркнем, что разработанный подход не требует расширения пространс-
тва состояний из-за учета динамической модели возмущения. Для простоты изложения при доказательстве не учитывались собственные затухающие движения вспомогательных переменных £ 1 (?), £ 1 (?) и £ 2 (?). При необходимости можно ввести их в рассмотрение, что позволит обеспечить неравенства (23) за заданное время.
Полученные с помощью наблюдателя оценки г2(?) « х2(?), у2(?) « /(?) используются для синтеза комбинированного управления с заданной целью управления системой (1).
3. СИНТЕЗ СИСТЕМЫ УПРАВЛЕНИЯ АСИНХРОННЫМ
ЭЛЕКТРОПРИВОДОМ ПРИ НЕПОЛНЫХ ИЗМЕРЕНИЯХ
3.1. Описание модели объекта управления.
Базовый закон управления
В качестве иллюстрации разработанных алгоритмов рассмотрим задачу управления асинхронным электроприводом, функционирующим в условиях неопределенности и при неполных измерениях. Динамическая модель асинхронного электропривода описывается в неподвижной системе координат (а, в) в векторном виде системой нелинейных дифференциальных уравнений шестого порядка [10]
X: 1 = ^1(^2Р(х3)х2 — + и), Х2 = —Р(хз)х2 + А4хр Х3 = - (А2%1^ - х4), Х4 = /(?), (25)
где х1 = со1(х1а, х1р) — компоненты тока статора, х2 = со1(х2а, х2р) — компоненты потокосцепления ротора, хз е Я — скорость вращения вала двигателя, х4 е Я — момент нагрузки на валу, и = со1(иа, ир) — напряжение питания статора (управляющие воздействия);
Р(Хз) =
( Аз Хз 1 > о, 5 = (
—х3 А3
0 -1 1 0
Р(0)^2 + Х2, Хт Х1 Х-^ ^^2,
4 = А-/(¿А - ), ¿2 = ¿/А-, а3 = Яг/А,
А4 = ¿5 = А2А4 +
где А. > 0, / = 1, 5 ; Я^, Яг, Р^, — приведенные активные и индуктивные сопротивления статора, ротора и взаимоиндукции. Прямым измерениям подлежат скорость вращения вала двигателя хз(?) и токи статора х1(?); /(?) полагается неизвестным ограниченным внешним воздействием с ограничен-
ной производной | /(?)| < Р, | / (?)| < Рр ||х2(?)|| < х2,
|х4(?)| < Х4 V? > 0, Р, Р, Х2, Х4 — известные константы.
Ставится задача слежения за заданной скоростью вращения вала двигателя хзД?) с обеспечением заданного потокосцепления в предположении, что аналитический вид задающих воздействий как функций времени и их производных первого и второго порядка известен.
В математической модели (25) имеется три управляемых и две управляющих переменных. Для того чтобы согласовать число управляемых и управляющих переменных, в работе [11] предложено свести задачу слежения за заданным потоко-сцеплением к задаче слежения за заданным квадратом вектора потокосцепления, который обозначим т
|х2/?)| := х1ахм е Я. В силу модели (25) дифферен-
циальное уравнение относительно управляемой
т 1
переменной |х2| := х^ х2 е Я примет вид ^ | Х21 =
т т
Хт ( Р(Хз)Х2 + а/^х^ ¿з^! + Хт Х1.
Базовый (т. е. в предположении, что все сигналы известны) закон управления, обеспечивающий асимптотическую стабилизацию ошибок слежения ез = х3 — хм, е2 = |х2| — |х2^|, сформируем согласно работам [11, 12] по иерархическому принципу. Вектор тока х1 е Я2 будем полагать фиктивным управлением, на компоненты которого нало-
т т
жим локальные связи: А2Хт 5 хы = х4 — рзез + /х
т 1
А4Х2 хы = —р2е2 + А3|х2^| + 21Хм |. Совместное решение этих уравнений дает выражение для расчета фиктивного управления
хы
-Х2 в Х2а
V Х.
2а х2в
1
(х4 - Рз ез + /х з а)
1 (-Р2 е2 + Аз| Х2 ^ + ¿1 *
(26)
С учетом невязки между реальным и выбранным значениями фиктивного управления е1 = х1 — хы е Я имеем систему относительно ошибок с замкнутыми локальными связями:
е 1 = А1(А2Р(х3)х2 — А5(е1 + хы) + и) — Х 1с1,
е2 = 2(А4хТ е1 — (Аз + р2)е2),
1 т т ез = - (А2Х2 5 е1 — рзез),
1
х
2
где желаемые темпы сходимости ошибок слежения обеспечиваются выбором коэффициентов обратной связи р23 > 0 при условии стабилизации невязки е1, что, в свою очередь, обеспечивается истинным управлением. Электроприводы, как правило, управляются с помощью инверторов напряжения, работающих в ключевом режиме, поэтому целесообразно использовать базовый закон разрывного управления
и = — Ш£пер 81§пе1 = со1(81§пе1а, 81§пе1|3). (27)
Выбор амплитуды разрывного управления на
т
основе достаточных условий ех е 1 < 0 ^ и > > ||^2Р(х3)х2 — — х 1с1 /^1|| обеспечит возникновение скользящего режима на многообразии е1 = 0 за конечное время гё > 0 [1], что и решает поставленную проблему слежения:
е,(г) = 0 ^ е23(г) ^ 0. (28)
1 * > 2' 3 < *
3.2. Синтез наблюдателя состояний и возмущений
Для реализации базового закона управления (27) по измерениям х3(г) и х1(г) требуется получить текущие оценки компонент вектора потокосцеп-ления х2(г) и момента нагрузки х4(г) с помощью наблюдателя, построенного на основе системы (25) в виде
¿1 = а^(^2Р(х3)г2 — ^5х1 + и) + v1,
С учетом непосредственно измеряемых сигналов Х 3(t) имеем:
v1 = M1a(k1s1), v2 = M2a(k2v1/(d1d2)),
ст = со1(ст1, ст2);
v3 = М3ст(к3Е3), v4 = -M4CT(k4/v3). (31)
Согласно следствию 2 и теореме (см. § 2) соответственно в первой подсистеме системы (30), (31) можно обеспечить асимптотическую стабилизацию ошибок наблюдения lim e1 2(t) = 0, а во вто-
t ^ + ю '
рой — заданную точность оценивания |e3 4(t)| < 8 Vt > T с помощью выбора параметров корректирующих воздействий (31). С учетом обозначений
Vc, = [1,3; 3], i = 174;
||e2(<)|| < X2 + ||z2(0)|| + M2/d3 = Ф2, |e4(?)| < 2X4 + |z4(0)| + M4t3 = Ф4 Vt > 0,
^3 < ||P(x3)|| < P = ^3 + X3, X = X(0)| + |xj, i = 1, 3
аналогично неравенствам (18) имеем следующие неравенства для выбора амплитуд M-, i = 1, 4 , сиг-моидальных корректирующих воздействий:
-d,t
M > (| + || -2 ( 0 ) II ) e " 31
2 ст(С2)(?2 - t1) - 1/d3
г2 = — Р(х3)г2 + ^4х1 + v2, г 3 = (4 гт А — *4) + Vз, ¿4 = V4, (29)
где г1, г2 е Е2, г3, г4 е Е — переменные состояния,
V!, v1 е Е2, v3, ^ е Е — корректирующие воздействия наблюдателя. С учетом выражений (25) и (29) составим уравнения относительно ошибок наблюдения е;. = хг — г., I = 1, 4 :
1) е 1 = ^1^2р(х3)е2 — v1, е2 = —р(х3)е2 — v2;
2) е3 = 1 (^е2Та — Е4) — Vз, е4 = /(г) — V4. (30)
Система (30) состоит из двух связанных подсистем вида (4). В первой подсистеме собственные движения переменных Е2(г) устойчивы, внешнее возмущение действует только на вторую подсистему. Используем в данном наблюдателе сигмои-дальные корректирующие воздействия вида (12).
|Е1( 0 )|/?1 + d^P Ф2
M > 2 V »2 I 2 2| f "Ц 1 ст(С1)
M4 >
2X4 + | Z4 ( 0 ) |
ст ( c4 ) ( +4 - ) - +3
4
t. > max <! U +
ст( С4 )
»2 Г'
t1,3 > 0,
M3 >
I Е 3 ( 0 ) | / 2+ + ( +2 Ф 2+ + Ф+) /+
ст ( ¿3 )
, U > t, + -;—i- .
2 1 | ст ( С2 )
обеспечивающие сходимость ошибок наблюдения Ег(г) в указанные окрестности нуля за заданное время:
^ < к1 уг > г1, « < ^ + Шуг > г2;
IЕ3(t)| < | Vt > Ц
IE4I < | + d2||E2|X1 + JIЕ3 (t)I Vt > t4.
^ - k4 "2"°21
Рис. 1. График регулируемой переменной |х2(?)| Рис. 2. График ошибки слежения е3(?)
Рис. 3. График ошибки наблюдения |е2(?)|
Рис. 4. График ошибки наблюдения е4(?)
Неравенство |е4(?)| < 8 может быть обеспечено за заданное время Т > t4 выбором больших коэффициентов к., аналогичным выбору на основе неравенств (20), а именно,
кх > тах
1п ((ММ^ + М)/а!), а ! ( -4 - - )
Ф,
' а ! (А ! - а 0 \ '
к2 >
М ( 1М (ф2/82)-(м4-м2)мз) к>М-
' 4 > 8 '
(Т- ^)Ига(С2)йъ
4
>тах
к3 >
1п( -(+ Ф4) + Щ /аз
ф.
аз(Ч -13 )
' аз(Аз- азу 8
где а. = Ш1 - а (с))/2 > 0, Уа,:0 < а, < А., I = 1, 3;
У82, 82, 84 > 0: А3 < (8 - 84 - 8282X)//, А 1 <
1 <
< йхй2с1ъ{82 - 82), Ф 1 = я^/ 1м(^2Х2Х1+Х4 + /Р2)Ф2 +
+ РМ2), Ф3 = (й2(( Р Ф2 + М2)Хх + 2^хЦФ2) + Р + + М)//.
Полученные оценки используются для вычисления (г2, г4, х3) (26). Базовый закон управления (27) реализуется в виде и = - Ц^п^ - ) и обеспечивает выполнение поставленной задачи (28) при Vt > td > t4 с точностью, меньшей, чем 8.
Моделирование проводилось в среде МаНаЪ-81тиИпк при параметрах модели объекта управления: / = 0,06, кг-м2, Р^ = 0,2596, Рг = 0,1484, Ом, Р^ = 0,0863, Гн, Рг = 0,0871, Гн, Рл = 0,0846, Гн, /(0 = 58Ы, и = 100, В, р2 = 1, р3 = 10.
Для решения задачи наблюдения с заданной
точностью 8 = 0,05 за заданное время Т = 2 с помощью наблюдателя (29) на основе полученных выше неравенств и с учетом условий (21) и (22) приняты следующие параметры сигмоидальных корректирующих воздействий (31): Мх = М3 = 300,
М2 = 10, М4 = 45, кг = 20, I = Т~4.
На рис. 1 показан график регулируемой переменной |х2(?)|, отрабатывающей заданный сигнал = 1; на рис. 2 — график ошибки слежения е3(?) = х3(?) — х3^(?), где х3^(?) = бШ — заданный сигнал. На рис. 3 и 4 представлены графики ошибок наблюдения |е2(?)| = е2г(?)е2(?) и е4(?). Результаты моделирования подтверждают эффективность разработанных методов оценивания.
ЗАКЛЮЧЕНИЕ
Для нелинейных систем, представимых в регулярной канонической форме с учетом возмущений, разработаны процедуры синтеза сигмоидаль-ных корректирующих воздействий наблюдателя состояний и возмущений, размерность которого равна размерности модели объекта управления. Данные наблюдатели в допрепредельной ситуации сохраняют преимущества наблюдателей с разрывными корректирующими воздействиями, функционирующих в скользящем режиме: выбор параметров корректирующих воздействий осуществляется на основе неравенств; задача синтеза декомпозируется на элементарные подзадачи; имеется возможность получить оценки неизвестных правых частей дифференциальных уравнений без детализации их динамической модели. В отличие от наблюдателей на скользящих режимах данные наблюдатели позволяют решить задачу оценивания с некоторой, наперед заданной точностью, но в условиях ограниченности вычислительных ресурсов и при шумах в измерениях обеспечивают лучшее качество оцениваемых сигналов. В отличие от наблюдателей с глубокими обратными связями не требуют увеличения динамического порядка и позволяют учитывать имеющиеся ограничения на ресурсы управления на стадии синтеза.
ЛИТЕРАТУРА
1. Уткин В.И. Скользящие режимы в задачах оптимизации и управления. — М.: Наука, 1981. — 368 с.
2. Краснова С.А., Кузнецов С.И. Оценивание на скользящих режимах неконтролируемых возмущений в нелинейных системах // Автоматика и телемеханика. — 2005. — № 10. — С. 54—69.
3. Ахобадзе А.Г., Краснова С.А. Решение задачи слежения в условиях неопределенности на основе совместной блочно-канонической формы управляемости и наблюдаемости // Управление большими системами. — 2009. — Вып. 24. — С. 34—80.
4. Краснова С.А., Уткин В.А. Каскадный синтез наблюдателей состояния динамических систем. — М.: Наука, 2006. — 272 с.
5. Емельянов С.В., Коровин С.К. Новые типы обратной связи. — М.: Наука, 1997. — 352 с.
6. Коровин С.К., Фомичев В.В. Наблюдатели состояния для линейных систем с неопределенностью. — М.: ФИЗМАТ-ЛИТ, 2007. — 224 с.
7. Atassi A.N., Khalil H.R. A separation principie for the stabilization of a class of nonlinear systems // IEEE Trans. on Automatic Control. — 1999. — Vol. 44, N 9. — P. 1672—1687.
8. Краснова С.А., Мысик Н.С. Каскадный синтез наблюдателя состояния с нелинейными корректирующими воздействиями // Автоматика и телемеханика. — 2014. — № 2. — С. 106—128.
9. Бабин В.А., Дик В.В., Краснова С.А. Допредельные реализации разрывных корректирующих воздействий наблюдателя, функционирующего в скользящем режиме // Тр. XII Все-рос. совещания по проблемам управления ВСПУ—2014 / ИПУ РАН. — М., 2014. — С. 374—390.
10. Чиликин М.Г., Ключев В.И., Сандлер А.С. Теория автоматизированного электропривода. — М.: Энергия, 1979. — 616 с.
11. Уткин В.А. Задачи управления асинхронным электроприводом // Автоматика и телемеханика. — 1993. — № 12. — С. 53—65.
12. Utkin V.A., Krasnova S.A., Utkin A. V. State observer in control systems of induction motor drives // Prep. of the 2013 IFAC Conf. on Manufacturing Modeling, Management and Control (MIM'2013). Saint Petersburg, Russia. June 19—21 2013. — P. 1204—1209.
Статья представлена к публикации членом редколлегии
М.В. Хлебниковым.
Краснова Светлана Анатольевна — д-р техн. наук,
гл. науч. сотрудник, И [email protected],
Уткин Антон Викторович — канд. техн. наук, ст. науч. сотрудник,
Институт проблем управления им. В.А. Трапезникова РАН,
г. Москва.
Не
овал книга
Орлов А.И. Полвека в мире формул: Комментарии к списку научных и методических трудов. 2-е изд., испр. и доп. —
М.: Институт высоких статистических технологий и эконометрики МГТУ им. Н.Э. Баумана, 2014. — 493 с.
Даны тематические комментарии к «Общему списку трудов А.И. Орлова». По каждому из 20 направлений работ приведена хронологическая сводка публикаций вместе с описанием оснований для проведения исследований. Рассмотрены все публикации А.И. Орлова в 1970—2013 гг. (более 850). Для облегчения восприятия информации описаны основные этапы профессионального пути автора.
Для научных работников, преподавателей, аспирантов, студентов, работников различных отраслей народного хозяйства, для всех, кто захочет узнать о публикациях профессора А.И. Орлова по той или иной тематике, о значении той или иной публикации, о соотношениях публикаций между собой, о логике развития исследований, о нерешенных проблемах в тех или иных направлениях исследований.
Основные публикации А.И. Орлова последних пятнадцати лет представлены на сайтах http://orlovs.pp.ru) и http://ibm.bmstu.ru/nil/biblio.html.