список литературы
1. Тулупьев А. Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб: Наука, 2006. 607 с.
2. Хедли Дж. Нелинейное и динамическое программирование: Пер. с англ. М.: Мир, 1967. 507 с.
3. Рассел С., Норвиг П. Искусственный интеллект: современный подход: Пер. с англ. М.: Изд. дом „Вильямс", 2006. 1408 с.
4. Дмитриев А. К., Юсупов Р. М. Идентификация и техническая диагностика. МО СССР, 1987. 521 с.
Александр Борисович Кузнецов
Никита Алексеевич Осипов
Игорь Владимирович Дорожко —
Сведения об авторах канд. техн. наук, доцент; Военно-космическая академия им. А. Ф. Можайского, кафедра автоматизированных систем подготовки и пуска ракет космического назначения, Санкт-Петербург; E-mail: [email protected]
канд. техн. наук, доцент; Военно-космическая академия им. А. Ф. Можайского, кафедра автоматизированных систем подготовки и пуска ракет космического назначения, Санкт-Петербург; E-mail: [email protected]
адъюнкт; Военно-космическая академия им. А. Ф. Можайского, кафедра автоматизированных систем подготовки и пуска ракет космического назначения, Санкт-Петербург; E-mail: [email protected]
Рекомендована кафедрой автоматизированных систем подготовки и пуска ракет космического назначения
Поступила в редакцию 04.04.12 г.
УДК 519.7
И. Б. Фуртат
РОБАСТНЫЙ СТАТИЧЕСКИЙ АЛГОРИТМ УПРАВЛЕНИЯ ЛИНЕЙНЫМИ ОБЪЕКТАМИ С ЗАПАЗДЫВАНИЕМ
Предложен робастный статический алгоритм управления динамическими объектами в условиях неопределенности и запаздывания, обеспечивающий достаточную близость выходного сигнала объекта к эталонному. Приведены результаты моделирования, иллюстрирующие работоспособность алгоритма.
Ключевые слова: робастное управление, наблюдатель производных, сингулярно возмущенный объект.
Введение. Проектирование схем управления объектом в условиях неопределенности и возможности измерения только его выходного сигнала является актуальной задачей современной теории и практики автоматического регулирования. В настоящее время предложено достаточно много решений для построения регуляторов на основе способов робастного управления.
Если относительная степень объекта (у) больше единицы, то для реализации робастных систем управления необходимо получить оценки производных соответствующих сигналов с использованием динамических наблюдателей. Так, в работе [1] рассматривается закон управления, позволяющий реализовать оценку производных выходного сигнала объекта с помощью динамического наблюдателя с переменной структурой (sliding mode observer), порядок которого равен размерности вектора состояния модели объекта. В работе [2] для синтеза сис-
темы стабилизации нелинейных динамических объектов используется закон управления, зависящий от оценок производных выходного сигнала объекта, которые получены с помощью динамического наблюдателя с большим коэффициентом усиления (high-gain observer), при этом порядок наблюдателя равен размерности вектора состояния модели. Робастный закон управления по ошибке слежения синтезируется в работе [3], где для оценки производных сигнала ошибки слежения используется наблюдатель с динамическим порядком, равным у - 1. В работе [4] синтезированы робастные системы управления с компенсацией внутренних и внешних возмущений с применением вспомогательного контура. Здесь для оценки производных сигнала, содержащего информацию о возмущениях объекта, используется предложенный в работе [2] наблюдатель с динамическим порядком у - 1. Анализ данных публикаций показал, что разработчики стремятся получить как простые в расчете регуляторы, так и регуляторы с невысоким динамическим порядком. Решению задачи построения регулятора, не содержащего динамического наблюдателя, посвящена настоящая статья.
В статье рассматривается задача построения робастной системы управления по выходу линейными динамическими объектами в условиях параметрической, сигнальной неопределенности и запаздывания. Для оценки производных в системе управления используется наблюдатель, основанный на левых разностях. Такой подход исключает применение интегрирующих звеньев в наблюдателе, что делает его статическим.
Постановка задачи. Рассмотрим объект управления, динамические процессы в котором описываются уравнением
Q(p )y(t) + D(p)y (t - x(t)) = kR( p)u (t) + f (t), (1)
где y(t) e R — регулируемая переменная, доступная измерению; u(t) е R — сигнал управления; ft) — внешнее неконтролируемое ограниченное возмущение; Q(p), R(p), D(p) — линейные дифференциальные операторы, deg Q(p) = n, deg D(p) < n, deg R(p) = m; k > 0; x(t) > 0 — неизвестное время запаздывания; p = d / dt — оператор дифференцирования.
Требуется спроектировать непрерывную систему управления, обеспечивающую выполнение целевого условия
|y(t) - Уэт (t)| <5 при t > T, (2)
где уэт (t) — гладкий эталонный сигнал; 5 > 0 — достаточно малая величина; T > 0 — время, по
истечении которого с момента начала работы системы должно выполняться неравенство (2).
Решим сформулированную задачу при следующих ограничениях (предположениях).
Предположение 1. Неизвестные коэффициенты операторов Q(p), D(p), R(p) и число k > 0 зависят от некоторого вектора неизвестных параметров объекта — х е S, S — известное множество.
Предположение 2. Известны порядки операторов Q(p) и R(p), причем относительная степень у = n - m > 1.
Предположение 3. Объект управления (1) минимально фазовый.
Предположение 4. В объекте управления доступен измерению только сигнал y(t).
Метод решения. Сформируем уравнение, характеризующее точность слежения выходного сигнала объекта за эталонным сигналом, в виде e(t) = y(t) - уэт(0, где e(t) — ошибка слежения. В соответствии с выражениями (1) и (2) преобразуем уравнение ошибки слежении к форме
Q(p)e(t) = R(p)u(t) + f (t) - Qyэт (t) - D(p)y (t - x(t)). (3)
Зададим закон управления
u (t) = -аМ (p)e(t), (4)
где а > 0; Мф) — линейный дифференциальный оператор порядка у, причем М(Х) — гурви-цев, X — комплексная переменная; e (t) — оценка сигнала e(t).
Следует отметить, что закон управления вида (4) использовался, например, в работах [2, 3], где последующий синтез системы управления осуществлялся с помощью динамических наблюдателей производных. В данной статье для дальнейшего синтеза системы управления используется статический наблюдатель производных.
Перепишем уравнение (3), подставив в него выражение (4):
Е (р)е(г) = у(/), (5)
где
Е(р) = ОФ) + аЯ(р)М(р), у(0 = ЛО - а(р)у^) - Б(р)у (I - 1(0) + аЯ(р)М(р)(е(1) - е (Г)).
Очевидно, что всегда существует а и М(Х), такие что Е(Х) будет гурвицевым. Причем выбор значений коэффициента а и полинома М(Х) обеспечивает требуемое распределение корней характеристического многочлена Е(Х) замкнутой системы.
Для реализации закона управления (4) рассмотрим наблюдатель
^(Г) = О4(Г - И) + Н (е(1) - е(1 - И)), ё{1) = Щ}),
(6)
И > 0 — малая
величина, Ь = [1, 0, ..., 0].
Отметим, что наблюдатель (6) представляет собой оценку производных с использованием левых разностей:
е(0 = е(0; Ш = «Ь^, ^(Г) -МЬМ^, ....4Т(О"И)
" 0 0 0 0" " 1 "
где 4(0 = [41(0,42(0,..., 4у(0]г,О = - 1/ и 0 0 0 V и
, Н =
1/ И И 1/ Иу-1 . .. V и 0 1 Иу_
И И
Структурная схема такого наблюдателя приведена на рис. 1.
И
Рис. 1
Сформулируем утверждение, при выполнении условий которого система управления будет работоспособной.
Утверждение. Пусть выполнены предположения 1—4. Тогда существуют числа а > 0 и И0 > 0, такие что при И < И0 система управления, характеризуемая уравнениями (4) и (6), обеспечивает выполнение целевого условия (2) и ограниченность всех сигналов в замкнутой системе.
Доказательство утверждения приведено в Приложении.
Проиллюстрируем полученные результаты на следующем примере.
Пример. Пусть математическая модель объекта управления описывается уравнением
(р3 + 42 Р2 + 41Р + 40) У (') + (а2 Р2 + 4 р + do) у ( - т(0) = г и () + / (). (7)
Класс неопределенности Е модели (7) задан неравенствами: 4 < 5; Щ < 5; / = 0, 1, 2; 1 < г0 < 5; ]Д0| <3. Зададим И = 0,01, М(р) = р и сформируем систему управления, реализуемую наблюдателем 41Ц) = 100 (е(Г) - еЦ - 0,01)), 42 Ц) = 100 (^ Ц) - 0,01)) и законом управления и ^) = -а (4 2 (Г) +1041 ^) + 25е(1)).
Положим yOT(t) = 1+sint+cos2t. Пусть параметры модели объекта (7) определены следующим образом: q2 = -5, q\ = -5, qo = -5, ¿/2 = 5, di = 5, do = 5, т(0 = 2 + exp(-0,5t), ro = 2, f(t) = =10(2 + sin 1,2t).
На рис. 2, а—в представлены результаты моделирования переходного процесса по ошибке e(t): а — при а = 10 и y(0) = y (0) = y (0) = 1; б — при а = 20 и y(0) = y (0) = y (0) = 0; в — при а = 30 и У(0) = y (0) = y (0) = 0.
Как показали результаты моделирования, переходные процессы в системе управления не зависят существенно от параметров модели объекта, а зависят в основном от выбора полинома М(Х) и коэффициента а. Так, при а = 10 ошибка слежения e(t) не превышает значения 5 = 0,15 через 2,5 с после начала работы системы; при а = 20 значение |e(t)| < 0,08 при t > 0,2 с; при а = 30 ошибка |e(t)| < 0,05 при t > 0,2 с (см. рис. 2, а—в соответственно).
Заключение. Решена задача робастного управления линейными динамическими объектами в условиях их параметрической и сигнальной неопределенности и при доступности измерению только скалярного выходного сигнала объекта. В отличие от работ [1—4] для оценки производных использовался статический наблюдатель. Полученный алгоритм компенсирует внутренние и внешние возмущения с заданной точностью. Моделирование показало хорошие качества переходных процессов и подтвердило теоретические результаты.
ПРИЛОЖЕНИЕ
Доказательство утверждения. Перепишем уравнения (5) и (6): s (t) = As(t) + By(t), e(t) = Le(t);
h"i(t) = G4(t - h) + Й(e(t) - e(t - h)), e(t) = L£(t), здесь A, B и L — матрицы, полученные при переходе от выражения (5) к первому уравнению системы (8), G = hYG, Й = hyH.
Воспользуемся теоремой, приведенной в работе [5, теорема 11.1]. Рассмотрим систему (8) при h = 0. Это равносильно тому, что решение второго уравнения системы позволит обеспечить точную оценку у-производных сигнала e(t). Значит, при h = 0 получим, что aR(pМ(p)(e(t) - e (t)) = 0. Тогда, в силу ограниченности сигналов f(t) и yOT(t), функция y(t) будет ограниченной. В результате при h = 0 система уравнений (8) асимптотически устойчива и все сигналы в ней ограниченны.
Так как условия используемой теоремы [5] выполняются, то существует число h0, такое что при h < h0 все переменные в замкнутой системе ограниченны. Однако асимптотическая устойчивость редуцированной системы (8) при h = 0 не гарантирует асимптотической устойчивости системы (8) при h > 0. Найдем значение h0, при котором для h < h0 система (8) будет устойчивой.
Рис. 2
Пусть в системе (8) И = И0. Выберем функционал Ляпунова — Красовского в виде
г Г
V = гт (Г)рг(Г) + | гт (я)Р2+ | 4т (я)Р34(эЩ, (9)
t—ho Г-И0
где Р1, Р2, Р3 — положительно-определенные симметричные матрицы, матрица Р1 является
т т
решением уравнения А Р1+Р1А=-Ж1, Ж1=Ж1
Возьмем от функционала (9) производную по времени вдоль траекторий системы (8):
V = -гт (Г ^г(г) + 2гт (Г) Р1Бу(Г) + гт (Г) Р2 г(Г) - гт (Г - И0) Р2г(Г - И0) +
+4т (Г) Р34 (Г) - 4т (Г - Й0) Р34 (Г - И0). (10)
Подставим в выражение (10) второе уравнение системы (8):
V = -гт (Г)Щг(Г) + 2гт (Г) Р1 Бу (Г) + гт (Г) Р2 г(Г) - гт (Г - И0) Р2 г(Г - И0) +
+И"2у4т (Г - И0)(ОтР3О4(Г - И0) + 2И0"УОт4т (Г - И0)Р3НЬг(Г) + -2И0"У4т (Г - И0)ОтР3НЬг(Г - И0) + И"2у гт (Г)£Нт Р3НЬг(Г) + +И"2угт (Г) £ Н тР3 НЬг(Г - И0) + И"2угт (Г - И0) £ Нт Р3 НЬг(Г - И0) - 4т (Г - И0) Р34 (Г - И0). (11)
Рассмотрим оценки
2гт (Г)РБу(Г) < 2И0-1гт (Г)РББтрг(Г) + 2И |у(Г)|2, у = вир |у(Г)|2;
Г
т
2И0"У4т (Г - И0 )ОтР3НЬг(Г) < 2И0-У4т (Г - И0 )ОтР3НЬ ((ОтР3НЬ) 4(Г - И0) + 2И0-угт (Г)г(Г);
т
2И0"У4т(Г - И0)ОтР3НЬг(Г - И0) < 2И0"У4т (Г - И0)ОтР3НЬ(ОтР3НЬ) 4(Г -И0) +
+2И0-Угт (Г - И0)г(Г - ИД
т
И"2угт(Г)ЬНтР3НЬг(Г - И0) < И0-2угт (Г)£НтР3НЬ(ЬНтР3НЬ) г(Г) +
+И0-2угт (Г - И0)г(Г - И0)
и введем следующие обозначения:
т
Ж2 = Ж1 - 2И0-1Р1 ББтР1 - Р2 - И0-2у ЬНтР3НЬ - 2И-УI - И-21 ЬтНтР3НЬ (ьтНтР3НЬ) ;
Ж3 = Р2 - И-2у £ НтР3НЬ - 2И0"У I - И-2у I;
т т
Ж4 = Р3 - И0-2уОтР3О - 2И0-уОтР3НЬ (ОтР3нь) - 2И0-уОтР3нь (отр3нь) ,
где I — единичная матрица.
Очевидно, что существует такое И0, для которого Ж* ^ 0, * = 2, 3, 4. Воспользовавшись оценками, перепишем уравнение (11) в виде
К < -гт (Г) г(Г) - гт (Г - И)^г(Г - ¿0) - 4т (Г - ¿0)^4(Г - ¿0) +
+2И0 У<-шт1П(Ж2)е2(Г) + 2И0 у, (12)
где ют1п(Ж2) — наименьшее собственное число матрицы Ж2.
Из выражения (12) следует, что при И < И0 выполняется неравенство |е(Г)| < ^2И0У/ютт(ж2) • Следовательно, при И < И0, изменяя а и И, можно получить требуемые величины 5 и т в целевом условии (2). Следует отметить, что оценка ошибки е(Г) доста-
T
точно груба, так как получена при исключении составляющих s (t - ho)W3s(t - Hq) и
. t - _
Е, (t - Hq )W4Е,(t - Hq ), участвующих в компенсации величины 2Hq V .
Статья подготовлена по результатам работ, выполненных при финансовой поддержке Российского фонда фундаментальных исследований (гранты № 12-08-01183 и № 12-01-31354) и федеральной целевой программы „Научные и научно-педагогические кадры инновационной России" на 2009—2013 гг. (соглашение 14.В37.21.0871, соглашение 14.В37.21.1480).
список литературы
1. Veluvolu K. C., Kim M. Y., Lee D. Nonlinear sliding mode high-gain observers for fault estimation // Intern. J. of Systems Science. 2011. Vol. 42, N 7. P. 1065—1074.
2. Atassi A. N., Khalil H. K. A separation principle for the stabilization of class of nonlinear systems // IEEE Trans. on Automatic Control. 1999. Vol. 44, N 9. P. 1672—1687.
3. Бобцов А. А. Алгоритм робастного управления в задаче слежения за эталонным сигналом // Автоматика и телемеханика. 2003. № 6. С. 104—113.
4. Цыкунов А. М. Алгоритмы робастного управления с компенсацией ограниченных возмущений // Там же. 2007. № 7. С. 103—115.
5. Халил Х. К. Нелинейные системы. М. — Ижевск: НИЦ „Регулярная и хаотическая динамика", Ин-т компьютерных исследований, 2009.
Сведения об авторе
Игорь Борисович Фуртат — канд. техн. наук, доцент; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра систем управления и информатики; E-mail: [email protected]
Рекомендована Поступила в редакцию
Институтом проблем 25.07.12 г.
машиноведения РАН