УДК 517.977.1
К. О. Железное1, М. В. Хлебников2
1 Московский физико-технический институт (государственный университет)
2 Федеральное государственное бюджетное учреждение науки Институт проблем управления
им. В. А. Трапезникова РАН
Применение метода инвариантных эллипсоидов для решения линейной задачи слежения
В работе рассматривается линейная задача слежения, состоящая в построении линейной обратной связи такой, чтобы выход системы был «как можно ближе» к сигналу, подаваемому на вход линейной системы управления. Предлагается подход к решению задачи, основанный на методе инвариантных эллипсоидов. Его эффективность продемонстрирована на примере двухмассовой системы.
Ключевые слова: линейная система управления, задача слежения, линейные матричные неравенства, инвариантные эллипсоиды, ограничивающие эллипсоиды.
1. Введение
Целью работы является исследование задачи управления регулируемым выходом линейной системы в одной из разнообразных постановок задачи слежения (см., например, [1-3]), одна из первых постановок этой задачи восходит к Р. Калману [4].
В работе рассматривается задача слежения в линейной системе управления. Цель управления (которое ищется в виде статической линейной обратной связи) состоит в том, чтобы регулируемый выход системы был как можно «ближе» (в некотором смысле) к сигналу, подаваемому на вход системы.
Предлагаемый подход к решению задачи основан на методе инвариантных эллипсоидов [5]; в качестве технического средства используется техника линейных матричных неравенств (Linear Matrix Inequalities, I.Ml) [6]. Такой подход позволил переформулировать исходную задачу к поиску минимального ограничивающего эллипсоида, содержащего выход рассматриваемой системы. В качестве критерия минимальности в работе выбран критерий следа, соответствующий минимизации суммы квадратов полуосей эллипсоида.
С технической точки зрения проблема сводится к решению задачи полуопределенного программирования (Semi-Definite Programming, SDP) и одномерной оптимизации [7]. Для ее решения существуют эффективные программные средства, в частности — свободно распространяемые пакеты SeDuMi и YALMIP на базе системы Matlab.
Эффективность метода продемонстрирована на примере управления двухмассовой системой [8].
2. Задача анализа
Рассмотрим линейную непрерывную динамическую систему
х = Ах + Df (t), ж(0) = х0, z = f (t) - Сх,
где А е Мгахга, С е М1хп, D е Rraxi, x(t) е М™ — фазовое состояние системы, z(t) е М1 — выход системы. Пусть матрица А устойчива, а сигнал f (t) е М1 удовлетворяет условию
f = Aof + Dow, (1)
где А0 е Mlxl, D0 е Mlxm, a w(t) е Мт — внешнее возмущение, удовлетворяющее ограни-
чению
||-w(i)|| ^ 1 Vt ^ 0. (2)
Матрицу Ао будем предполагать устойчивой (гурвицевой).
Рассмотрим расширенную систему
х = Ах + И/,
/ = А0/ + Бо-ш, (3)
г = / — Сх.
Введя в рассмотрение составной вектор
д = є Мга+г,
представим систему в матричной форме:
с
Нам понадобятся следующие определения.
Определение 1. Эллипсоид с центром в начале координат
гх = [х е Мга: хтР-1х ^ 1}, Р> 0, (5)
называется инвариантным для динамической системы х = Ах + И-ш, если из условия ж(0) е £х следует х(Ъ) е для всех моментов времени £ ^ 0. Это означает, что фазовое состояние системы будет всегда находиться в £х, если оно находится в этом эллипсоиде в начальный момент времени.
В дальнейшем все матричные неравенства понимаются в смысле знакоопределенности матриц.
Определение 2. Эллипсоид с центром в начале координат
Е2 = [г е Мг: гТ(СРСТ)-1г < 1}, Р> 0,
называется ограничивающим, по выходу для динамической системы
х = Ах + Б'ш, х(0) = хо, х = Сх,
соответствующим инвариантному эллипсоиду (5). Соответственно если состояние Хо принадлежит инвариантному эллипсоиду с матрицей Р, то выход системы г(Ь) будет находиться в эллипсоиде £г для всех £ ^ 0.
Теперь можно переформулировать задачу: будем минимизировать ограничивающий эллипсоид, содержащий выход г системы (4).
Теорема 1. Решение Р задачи
1тСР СТ —> ш1п
при ограничениях
АР + РАТ + аР + -5дт ^ 0, Р > 0,
а
где
1 = (о I) ■ 5 = Ц) ■ е = — 1) ■
а минимизация проводится по матричной переменной Р = РТ е М(га+т) х (га+т) и скалярному параметру а > 0; определяет, матрицу
СРСТ
Доказательство. Введем в рассмотрение квадратичную форму
V(д)= дтЯд, Я> 0,
построенную на решениях системы (4). Вычисляя ее производную в силу системы, имеем
V (д) = (Ад + Б w)тQg + gтQ(Ag + Б 'ш) = дт (А1 Я + ЯА)д + 2д ТЯИ и/.
Для того чтобы траектории системы не вышли за границу эллипсоида £д = [д: дтЯд ^ 1}, потребуем, чтобы при V(д) ^ 1 и ^ 1 выполнялось условие V(д) ^ 0. Иными словами,
дт(АТЯ + ЯА)д+ 2и]ТБтЯд ^ 0 V (д,'ш): дТЯд ^ 1, и)Т,ш ^ 1. (6)
Применяя б'-теорему [9] с двумя ограничениями, заключаем, что (6) эквивалентно выполнению следующего матричного неравенства при некоторых значениях а, Р таких, что а ^ Р ^ 0
(А? Я + ЯА + <у,Я
;)
-гг , < 0.
-р1;' ^
По лемме Шура полученное линейное матричное неравенство эквивалентно
АТЯ + ЯА + аЯ + рЯоЪТЯ < 0. (7)
Домножив (7) на матрицу Р = Я-1 слева и справа, приходим к матричному неравенству
АР + РАТ + аР + \ЪЪТ ^ 0;
Р
при этом, согласно [10], можно положить Р = Ртах =
Выбирая среди эллипсоидов полученного семейства
АР + РАТ + аР + 155т ^ 0
а
эллипсоид Р > 0 такой, что соответствующий ему ограничивающий эллипсоид с матрицей СРСТ обладает минимальным следом, приходим к утверждению теоремы. Теорема доказана. ■
Заметим, что V(д) является квадратичной функцией Ляпунова для системы (4) вне инвариантного эллипсоида с матрицей Р.
3. Задача синтеза
Рассмотрим линейную непрерывную систему управления:
х = Ах + Ви + 0/ (Ь), х(0) = хо, г = /(г) - Сх,
где А е Мгахга, В е Мгахр, С е М1хп, И е Мгахг, х(Ь) е М™ — фазовое состояние системы, и(1) е М — управление, г(1) е Мг — выход системы. Пусть сигнал /(1) е Мг удовлетворяет условиям (1), (2).
Задача состоит в построении регулятора К в форме статической линейной обратной связи по состоянию
и = Кіх + К2/, (8)
где Кі є Мрхга, К2 Є Мрхі, который стабилизирует замкнутую систему и минимизирует
(по критерию следа) ограничивающий эллипсоид для выхода г. Будем предполагать, что текущее значение сигнала /(Ь) известно, и поэтому можно его использовать для построения обратной связи.
Рассмотрим расширенную систему
X = Ах + Ви + И/,
/ = А0/ + Бо-ш, (9)
г = /(г) — Сх,
или, в виде, замкнутом регулятором (8),
X = (А + ВКі)х + (ВК2 + О)/,
/ = А0/ + Бои,, (Ю)
г = / — Сх.
Система (10) представима относительно вектора д в следующем матричном виде:
А + ВК1 О + ВК2\ ( 0
9 = I 0 Ао )9 + I п. )ш.
00»)
А Б
В следующей теореме устанавливается способ нахождения искомого регулятора для рассматриваемой системы, а также соответствующий ограничивающий эллипсоид.
Теорема 2. Решение Р > 0 ^ задачи минимизации
^ СР С т —> тіп
при ограничении
где
АР + РАТ + аР + ВУ + УтВт + 1 ББт < 0, (11)
^« а- >=т- ■>-о.:
а, минимизация проводится по матричным переменным Р = РТ € ^(п+1)х(п+1) ^
¥ € м(га+0х(га+0 и скалярном,у пара,метру а > 0; определяет, статический регулятор по состоянию
К = (Кг К2) = У Р-1
и матрицу
СРСТ
соответствующего ограничивающего эллипсоида, для выхода, системы (9).
Доказательство. Применяя теорему 1 к замкнутой системе, приходим к задаче минимизации
^ СРСТ —> шт
при ограничении
(А + В Кг О + ВКЛ„^„(А + В Кг О + ВКЛТ , _ 1 / 0 0\Т
( о л„ )р + Ч 0 Л, ) + “р + 7,{^) Ы <0
которое представимо в виде
(о а)р + р(о л)Т + аР+ ('0) (к'1 К*)Р+
+ р ^ К*)Т (оУ + 1 Ц)Ц,У « 0. <12>
В матричное неравенство (12) переменные Р, Кг ж К2 входят нелинейно. Введя матричную переменную
У = {Кг К2) Р,
неравенство (12) примет линейный (по переменным Р и У) вид (11). Теорема доказана. ■
4. Пример: двухмассовая система
Продемонстрируем предложенный подход к решению задачи слежения на примере двухмассовой системы [8] (см. рис. 1).
Рис. 1. Двухмассовая система
Обозначим через хг, координату и скорость левого тела, а через х2, у2 — координату
и скорость правого тела. Тогда
хг
Уг
х =
х2
2
есть вектор фазового состояния динамической системы. Пусть к левому телу приложено управляющее воздействие и, а задающий сигнал с компонентами ^ и /2 воздействует на каждое из тел.
Непрерывная модель возмущенных колебаний системы описывается уравнениями
хг = г , х2 = 2,
к к 1 „
Уг =-------хг +------Х2 +----/г + и,
тг т2 тг
к 1
У2 = —Хг---------Х2 +-----/2-
тг т2 т2
Будем считать массы тел и коэффициент упругости пружины единичными. Тогда в матричной форме имеем
Х = Ах + И/, г = / — Сх,
где
А =
0 1 0 0 0 0 0
—1 0 1 0 , о = 0 1 , в = 1
0 0 0 1 0 0 0
1 0 —1 0 1 0 0
а в качестве матрицы выхода выбрана
С =
ІООО
ОІОО
При
=
ОІОО
-0,5 0,5
—0,5
ч-0,5 —0,5 У = V—0,5У
с помощью теоремы 2 найдем охрани чивающий эллипс выхода и соответствующий рсгуля-
Заметим, что естественно потребовать ограничения на величину управления вида
||и(£)|| ^ № 'И ^ 0. (13)
Достаточное условие выполнения охраничения (13) установлено следующей леммой. Лемма 1 ([11]). Условие
(?Й) > «
гарантирует выполнение условия (13) внутри инвариантного эллипсоида с матрицей Р.
Это условие добавляется в качестве дополнительного охрани чения в формулировку теоремы 2.
Итак, полагая
№ = 5,
находим регулятор
К = (-31,3569 - 17,3058 9,4955 - 17,2320 26,2767 9,5308)
Ki
К2
и матрицу оіраничивающеі'о эллипса:
СрпТ = ( 0,3044 -0,1383\
= у-0,1383 0,6609 )
при этом tr СPСT = 0,9653.
На рис. 2 слева показан найденный охраничивающий эллипс выхода, а также траектория выхода системы при некотором начальном состоянии системы вне инвариантного эллипсоида и возмущении w(t) = sign sint; справа показан соответствующий график управляющих) воздействия.
1 2
0.5 ■ 1
0 ' \ 1 ] і 0
-0.5 ■ 4W Л -1
-1 \ -2
-1.5 ■ \ -з
-2 ■ \ -4
-2.5 \ -б
-1 -0.5 0 0.5 1
1.5 2 2.5
0
10
20
30
40
Рис. 2. Ограничивающий эллипс выхода, траектория выхода системы и управление
Заметим, что, не используя информацию о текущем значении сигнала /(і) (то есть при К2 = 0
ограничивающий эллипсоид окажется примерно в 6 раз больше по критерию следа.
5. Заключение
В статье предложен подход к построению обратной связи в одной из постановок линейной задачи слежения. Подход основан на методе инвариантных эллипсоидов, применение которого позволило переформулировать исходную проблему в терминах линейных матричных неравенств и свести поиск ограничивающего эллипсоида для выхода системы к задаче полуопределенного программирования, легко решающейся численно. Эффективность метода продемонстрирована на примере двухмассовой системы.
Литература
1. Мирошник И. В., Никифоров В. О., Фрадков А. Л. Нелинейное и адаптивное управление сложными динамическими системами. — СПб.: Наука, 2000.
2. Краснова С. А. Каскадный синтез наблюдателей состояния динамических систем. — М.: Наука, 2006.
3. Ахобадзе А. Г., Краснова С. А. Задача слежения в линейных многомерных системах при наличии внешних возмущений // Автоматика и телемеханика. — 2009. — № 6. — С. 21-47.
4. Kalman R. Contributions to the theory of optimal control // Boletin de la Sociedad Matematica Mexicana. - 1960. — N 1. — P. 102-119.
5. Хлебников M.B., Поляк Б. Т., Кунцевич В. М. Оптимизация линейных систем при ограниченных внешних возмущениях (техника инвариантных эллипсоидов) // Автоматика и телемеханика. — 2011. — № 11. — С. 9-59.
6. Boyd S., El Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in System and Control Theory. — Philadelphia: SIAM, 1994.
7. Поляк В. Т., Щербаков П. С. Робастная устойчивость и управление. — М.: Наука, 2002.
8. Reinelt W. Robust control of a two-mass-spring system subject to its input constraints // Proc. American Control Conference. — Chicago, USA, June 28-30, 2000. — P. 1817-1821.
9. Polyak В. T. Convexity of quadratic transformations and its use in control and optimization // Journ. Optim. Theory and Appl. — 1998. — V. 99. — P. 533-583.
10. Хлебников М. В. Время установления в линейной динамической системе с ограниченными внешними возмущениями // Автоматика и телемеханика. — 2012. — № 6. —
С. 3-17.
11. Назин С. А., Поляк Б. Т., Топунов М. В. Подавление ограниченных возмущений с помощью метода инвариантных эллипсоидов // Автоматика и телемеханика. — 2007. — № 3. - С. 106-125.
Поступим в редакцию 24-11.2012.