Научная статья на тему 'Робастная стабилизация нелинейного объекта с использованием SDC параметризации'

Робастная стабилизация нелинейного объекта с использованием SDC параметризации Текст научной статьи по специальности «Математика»

CC BY
147
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РОБАСТНОЕ УПРАВЛЕНИЕ / НЕЛИНЕЙНЫЙ ОБЪЕКТ / ROBUST CONTROL / NONLINEAR OBJECT

Аннотация научной статьи по математике, автор научной работы — Афанасьев Валерий Николаевич, Титов Д. В.

Сравнительно недавно теория робастных систем пополнилась новыми инструментами синтеза регуляторов. Для линейных неопределенных систем это матричное алгебраическое неравенство Риккати (АRI), для нелинейных матричное неравенство Гамильтона-Якоби (HJI). HJI является неравенством с частными производными, что затрудняет применение этого метода. К тому же АRI и HJI невозможно использовать для решения терминальных задач управления неопределенными объектами. В работе предлагается метод синтеза управления для нелинейного неопределенного объекта с параметрами, зависящими от его состояния (SDC), с использованием его линейной робастной модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Robust stabilization of nonlinear object with SDC-parameterization

Since the mid-90's, State-Dependent Riccati Inequality (SDRI) strategies have emerged as general design methods that provide a systematic and effective means of designing nonlinear controllers for a robust stabilization. In this paper, a new expression of free parameters to completely express the SDC form is proposed. This form is using to design linear robust model of nonlinear system and then to synthesis the controller with constant parameters. Finally, example to verify the advantage method is given.

Текст научной работы на тему «Робастная стабилизация нелинейного объекта с использованием SDC параметризации»

РОБАСТНАЯ СТАБИЛИЗАЦИЯ НЕЛИНЕЙНОГО ОБЪЕКТА С ИСПОЛЬЗОВАНИЕМ SDC ПАРАМЕТРИЗАЦИИ

В.Н. Афанасьев, Д.В. Титов

Кафедра кибернетики Московский государственный институт электроники и математики Трехсвятительский пер., 3, Москва, Россия, 109028

Сравнительно недавно теория Н^ робастных систем пополнилась новыми инструментами синтеза регуляторов. Для линейных неопределенных систем это матричное алгебраическое неравенство Риккати (АЫ), для нелинейных — матричное неравенство Гамильтона—Якоби (ШТ). ШЛ является неравенством с частными производными, что затрудняет применение этого метода. К тому же АМ и ШЛ невозможно использовать для решения терминальных задач управления неопределенными объектами. В работе предлагается метод синтеза управления для нелинейного неопределенного объекта с параметрами, зависящими от его состояния (ЯБС), с использованием его линейной робастной модели.

Ключевые слова: робастное управление, нелинейный объект.

Сравнительно недавно теория Нм робастных систем пополнилась новыми

инструментами синтеза регуляторов. Для линейных неопределенных систем это алгебраическое неравенство Риккати (АМ), для нелинейных — матричное неравенство Гамильтона—Якоби (ШЛ) [6]. ШЛ является неравенством с частными производными, что затрудняет применение этого метода. Одним из возможных способов нахождения робастного управления с использованием ШЛ является метод, основанный на аппроксимации ШЛ рядом Тейлора вокруг точки равновесия [7]. Однако метод, основанный на представлении неравенства с частными производными с использованием аппроксимации возле точки равновесия, не позволяет получить более общие решения. С другой стороны, использование нелинейных матричных неравенств дает возможность исследовать системы, параметры которых зависят от состояния (ББС) [8]. Этот тип нелинейных обыкновенных дифференциальных уравнений позволяет перейти при синтезе робастного управления от использования неравенства Гамильтона—Якоби к неравенству Риккати с параметрами, зависящими от состояния объекта (БОМ). Другим словами, если существует положительно определенная матрица P(x), параметры которой зависят от состояния объекта, и которая удовлетворяет неравенству Риккати (8БШ) и существует положительно определенная скалярная функция V(x), удовлетворяющая решению dV/dt = 2P(x)x, тогда эта функция удовлетворяет неравенству Гамильтона—Якоби (ШЛ).

Следует отметить, что использование метода БОМ для решения ШЛ наталкивается на проблему неоднозначного представления нелинейной системы в форме ББС [9]. Таким образом, решение БОМ может дать различные положительно определенные матрицы P(x). Добавим, что АМ и ШЛ невозможно использовать для решения терминальных задач управления неопределенными объектами [3; 4]. В работе предлагается метод синтеза управления для нелинейного неопределенного объекта с использованием его линейной (ББС) робастной модели.

РОБАСТНЫЕ СИСТЕМЫ

ЛИНЕЙНЫЕ РОБАСТНЫЕ СИСТЕМЫ

Рассмотрим следующую линейную систему 5/.

5

^х^) = )х(;) + )м>^) + В2()и^), х(0) = Хо,

dt (1)

2 ^) = С1 ^) х(t) + П12 (t )и^),

где ^(/) — неизвестное возмущение, г({) — управляемый выход системы, и(г) — управление, подлежащее нахождению.

Предположим, что параметры системы имеют интервальный характер неопределенности

Л < Л^) < Л, Б1 < Б^) < Б1, Б2 < Б2(t) < Б2,

_ — _ - (2)

С < Cl(t) < С1, < Dl2(t) < ^12

и при этом сохраняются структурные свойства системы (1) (управляемость и наблюдаемость). Кроме того, положим, что С ^) П12^) = 0, ПТХ7(1) П12^) = I, что

упростит формулировку результата, но не изменит общности постановки задачи. Алгебраическое неравенство Риккати (АМ) для рассматриваемой задачи имеет вид

5Ц)Л(г) + Лт (t)5(г) + 5(г)Б1(t)Р"1Б1Г (t)5(t) + СТ (г)1С(г) <

(3)

где S(t) положительно определенная матрица. В теории робастных систем при использовании £2-нормы для отыскания управления, организованного по принципу обратной связи, вместо обратимой положительно определенной матрицы Р обычно вводится скалярный показатель ||р|| = у2, а Я = I.

Учитывая интервальный характер параметрической неопределенности объекта (1) и неравенство Риккати (3), определим структуру Нм регулятора и действующего возмущения в виде [1; 2]

и(г) = -Я_1Б2ТБх^), ю<7) = -Р-^ТБх^), (4)

где положительно определенная матрица 5, содержащая постоянные параметры удовлетворяет неравенству

5Л + ЛТ8 + 5Б1Р- Б5 + С1С < 5 Б2Я-1 Б_Т5. (5)

Задача синтеза управления вида (4) может быть рассмотрена как проблема конструирования оптимального управления для робастной модели объекта (1) при антагонистическом воздействии м>(?)

4Хм ^) = Лхм ^) + Б1^0“) + В 2им ^X хм (0) = Х0,

dt (6)

г(1;) = С1 хм (1‘) + п12им (t),

с использованием функционала качества

^(г,им) =1 ]{|{{ -|{)(р +|\им«^} ,

(7)

где матрицы Q > 0, Я > 0.

Матрица Q такова, что неравенство (5) принимает вид равенства

Бм + Q = 0. (8)

БА + ЛТБм + с1с +

БгР-1 БТ1 - В2Я"1 ВТ2

Весовая матрица Р назначена так, что матрица М = В\Р 1 В\ - В2Я 1 В2 будет отрицательно полуопределенной (определенной). В этом случае одна из матриц, удовлетворяющих решению алгебраического уравнения Риккати (АКБ) (8), будет положительно определенной. Структура управления для объекта (1) будет такая же как (4), однако матрица £ будет заменена на положительно определенную матрицу Бм

и(1) = -Я-1 В2Бмх(г), О) = -Р-1 В\Бмха). (9)

С учетом условия выбора параметров робастной модели объекта и Хм(0)=

1-1 п Т

■ х0, можно утверждать, что

{Л -

В2Я-1 ВТ - В1 р~1В1

1-І

Бм } Хм (І)

>

>

Л(і) -

В2(і)Я"1 в2 -В1(і)р-1В1

-1

(10)

Оценим возможное рассогласование траекторий объекта (1) и его робастной модели.

Пусть А - А = а, В1, -В1 = Ь1, В2 - В2 = Ь2 и е(?) = хм (?) - х(1), где —х(1) = Ах(() + В_\^(^) + В 2и(г), х(?0) = х0,

— хм (?) = Ах(( ) + ВМ*) + В2и(( ^ хм ((0) = х0-

Тогда

где Ь = Л +

—є(і) = Ьє(і) - с (і), є(0) = 0, йі

(11)

В1 р- Ві - в2я-1 в2

Б и с (і) ={а +

Ь Р_1 В1 -р2 Я-1 ВТ

Б} х(і).

Запишем решение уравнения (11) в виде

|є(і )|| =

I

|{ехр Ь [ - т]с (т) — т

0

Учитывая, что корни характеристической матрицы Ь являются действительными и отрицательными, можно назначить такие положительные постоянные К и р, что ||ехрЬ?|| < Кв~р 1. Тогда

||є(і)|| < ЦехрЬ[і-т] ||с(т)|| —т< к\е-р[і-т] ||с(т)|| —т. (12)

0 0 Как было показано, управление (9) обеспечивает системе свойства асимптотической устойчивости, т.е. ||Х(0)| > ||Х(і)|| при і > 0 . Учитывая, что параметрические возмущения принадлежат ограниченной области возможных значений, справедливо считать, что || с (0) || > || с(і) || при і > 0.

Тогда из (12) будем иметь оценку максимально возможного рассогласования траекторий объекта (1) и его робастной модели.

І|є(і )||

<

К

1 - е

-рі

а +

ь1 р-1 Ві -р2я-1 ВТ

Б} х(0)

(13)

Бп1

НЕЛИНЕЙНЫЕ РОБАСТНЫЕ СИСТЕМЫ Рассмотрим следующую нелинейную систему Бп1:

— х({) = /(х) + &1(х М*) + &2(х )и({X х(0) = x0,

— (14)

^ 2(г ) = /*!( х ) + 712( х )и(^ ), где м>(1), г(£), и(г) — те же, что и в (1).

Цели робастного управления нелинейным объектом (14) те же, что и линейного объекта (1). Следуя [6] и предполагая, что к[ (х)у12(х) = 0, у12(х)у12(х) = I, управления, организованные по принципу обратной связи, будет иметь вид

„(,)=-к-'х){Цй} , т=-р-'£■ <15)

где скалярная положительно определенная функция V (х) удовлетворяет нера-

венству Гамильтона—Якоби (ИЛ):

- (16)

Т (16)

-2{ ахф}^2(х)я_1^2(х)|^| + н1(х)л1(х)+ехТ({)х({) -0, е>0.

При е хТ ^) х^) = хТ ^ ^х(?) неравенство (16) обращается в алгебраическое уравнение Гамильтона—Якоби.

Отметим, что уравнение Гамильтона—Якоби, являющееся уравнением в частных производных, в ряде случаев довольно трудно решить (а иногда это и невоз-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

можно). Конкретное решение может представлять лишь функционал вдоль данной траектории, а не во всей области X. Возникает проблема определения области X при заданных начальных условиях (х0, 0), «заполненную» траекториями х(г), произведенными управлениями (15). Таким образом, вопрос о существовании управления вида (15), переводящего систему (14) в начало координат из назначенного начального состояния, остается открытым.

ОБЪЕКТЫ С ПАРАМЕТРАМИ, ЗАВИСЯЩИМИ ОТ СОСТОЯНИЯ

Пусть

/ (г, х) = № х)+/2(г, х X (17)

\ - \/1(1, хЯ <0 я

где /х(г,х) — нелинейность низкого порядка, т.е. -—:—:—1<о, о — малая величина,

х

- ГСП \/2(г, х )| А I I А

/2 (г,х) — нелинейность высшего порядка [5], т.е. -—;—:—1 ^ 0 при х ^ 0.

I х |

Учитывая свойства рассматриваемых нелинейностей, перейдем от (17) к

/ (г, х) = А1(г) х(г) + а2( х) х(г). (18)

Предположим также, что

&1(х) = В1(хК &2(х) = В2(x), К(х) = С1(х)х(гК у12(х) = А2(х). (19)

Тогда нелинейная система (14) трансформируется в систему с параметрами, за-

висящими от состояния (ББС):

— х(0 = [А1(0 + А2(х)]х(0 + В1(хМ0 + B2(x)u(t), х(0) = x0,

п1 •) —г (20)

Б

2 (г) = С1( х) х(г) + Д2( х )и(г),

Определение. Представление управляемой и наблюдаемой системы (14) в виде (20) является эквивалентным, если матрицы А1(г) + А2(х)], [В1(х)]^ и ([ А&) +

+ А2(х)], [С2(х)]^ образуют управляемые пары, а матрицы ^[А1(г) + А2(х)],

[С1(х)]^ образуют наблюдаемую пару при всех возможных (г,х) е А.

Следует отметить, что представление нелинейной системы (14) в виде (20) может оказаться неоднозначным. Определим

{адГ=б( х) х<' ’■ <21)

Тогда неравенство (16) запишется в виде

хТ (г) {б (х) [1(г) + А2( х) ] + ]А1(г) + А2( х )]Т (х) Б (х) +

+Б(х)В1(х)Р_1ВТ (х)Б(х) + СТ (х)1 С(х)} х(г) <

< хТ (г ){б (х) В2( х) Я"1В2Т (х) Б (х)}).

Откуда получаем неравенство Риккати с параметрами, зависящими от состояния (ББЕІ):

ад [ 4(0 + 4(х)] + [ 4(0+4(х>] ад +

+Б(х)В1(х)Р“X (х)Б(х) + СТ (х)1С(г) < Б(х)В2(х)Я— (1)5(1).

Управления определяются выражениями

и(г) = (х) |дхШ = -Я~1ВТ2 (х)Б(х)х(г),

1 х() , (23)

) = -р-1 gT (х) | д.хм| = -р-1ВіТ (х )5 (х) х(г).

Как видно, найти положительно определенную матрицу 5(х), удовлетворяющую неравенству (20), ничуть не легче, чем отыскать функцию д¥ (х)/ дх(г), удовлетворяющую неравенству (16). Но даже нахождение матрицы 5(х) не гарантирует существования стабилизирующего управления, так как не определена область X, содержащая одновременно начальную пару (х0, 0) и цель управления,

«заполненную» траекториями, произведенными управлениями вида (22).

УПРАВЛЕНИЕ ОБЪЕКТОМ С ЗАВИСЯЩИМИ ОТ ЕГО СОСТОЯНИЯ ПАРАМЕТРАМИ

РОБАСТНАЯ МОДЕЛЬ ОБЪЕКТА

Сформулируем задачу управления объектом (ББС). Пусть управляемый объект описывается соотношениями (20). Необходимо построить управление, асимптотически переводящее систему за заданное время из заданного начального состояния х(0) = х0 в некоторую окрестность начала координат ||х(0)|| > ||х(т )|| < й,

й > 0.

Предположим, что удастся построить такое управление. Предположим также, учитывая неоднозначность представления нелинейной системы вида (14) в виде системы, параметры которой зависят от состояния (20), что класс рассматриваемых систем таков, что их параметры в процессе управления изменяются в соответствующих интервалах:

||Л(х(Т))|| < |\Л(х(1 ))|| < ||Л(х0)||, ||В1(х(Т))|| < |\В,(х(1))|| < ||В1(х0)|,

||В2(х(Т))|| < ||В2(х(г))|| < ||В2(х0)|, ||С1(х(Т))|| < ||С1(х(г))|| < ЦСДх,,)!,

|^12(х(Т)^||^12(х(г)^||^12(х0)|, г Є [г0,Т].

Учитывая (3), построим робастную модель системы:

ЯР

й г— п *

—хр (0 = [ Л + Л(х0) ] хр (г) + В^х,,)^) + В2(хт)и(г), х(0) = х0,

2п (г) = С1(х0 )хр (г) + °12 (хТ )и(гX

где хт — й.

СИНТЕЗ РОБАСТНОГО УПРАВЛЕНИЯ

Организуем управления вида (9). Для того чтобы матрица SM содержала бы информацию о начальном состоянии объекта и цели управления, назначим весовые матрицы функционала (7) Q, R, P следующим образом:

Q = 40)xT (0), IRI = d2, \\P\\ = у2, (25)

при этом назначение весового коэффициента у2 должно быть таковым, чтобы мат-

1 T 1 * _1 T *

рица M = — B1(x0)Bx (x0)-----B2(x„)R B2 (xT) была бы отрицательно полуоп-

у2 d

ределенной (определенной).

Положительно определенная матрица SM будет определяться алгебраическим

уравнением Риккати (ARE):

S..

+S,

A + A(X0)J + L A + A(x0)J Sм + C1 (X0)C(X0) +

— Bl(x0)B1 (x0) - —2B2(xt)B2 (Xt')

(2б)

Sм + X0 X0 = 0.

X й

При таком определении матрицы усиления робастного регулятора будет обеспечиваться следующее соотношение:

>

A + A(x0) Xp (t) +

[A(t) + A( x0)]x(t)

-1 Bl( Xp) BlT (X0) - d2 B2( Xp) b2T (xT)

+

-1 Bl (x) BlT (X0) -^ B2 (x) b2T (xT) y2 d

S

S

>

где x (t) и x(t) являются решениями уравнений

— Xp (t) = A(X0)Xp (t) +

\ Bl(Xp) BT (X0) -4г B2 (Xp )BT (xT)

Y

d2

—x (t) = A(x) x(t) + dt

Xp (0) = x(0).

B1(x )B1T (x0) - B2(x )B2T (xT)

Y d

Su ,

м

Рассмотрим пример, в котором нелинейный объект Бп1 описывается следующим дифференциальным уравнением

S

x(t) =

nl

z (t) =

x1 (t) - 2x2 (t) - 3X3 (t) u(t)

5x1(t)

10 X2 (t)

Г2 ^ Г11

+ v-b M(t) + v 0 ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

x0>

(27)

где xT = (x1 x2), ffl(t) = 30sin15t.

Запишем возможную SDC форму объекта (27): ( _5sin(2x^t)) ^

xi(t) x1(t) _ 3xj2(t)

0

v x2(t).

+

v _1У

ra(t) + u(t)

v 0 У

(28)

х(0) = х0.

Регулятор, синтезированный с использованием модели (28), имеет вид и(?) = -137,12 х^) + 80,97 хг(1). При этом управлении рассогласование между траекториями исходного объекта и его ББС модели нулевое.

Графики переходных процессов нелинейного объекта представлены на рисунке.

Рис. Графики переходных процессов

ЛИТЕРАТУРА

[1] Афанасьев В.Н. Управление неопределенными динамическими объектами. — М.: Физ-матлит, 2008.

[2] Афанасьев В.Н. Концепция гарантированного управления неопределенным объектом // Изв. РАН, ТиСУ. — 2010. — № 1.

[3] Афанасьев В.Н., Бовшук Е.Р. Робастное управление нелинейной системой, содержащей неопределенные параметры // Вестник РУДН. Серия «Инженерные исследования». — 2009. — № 4. — С. 29—37.

[4] Афанасьев В.Н., Бакина Е.Ю. Множество возможных робастно терминальных управлений неопределенным линейным объектом // Вестник РУДН. Серия «Инженерные исследования». — 2007. — № 4. — С. 52—59.

[5] Немыцкий В.В., Степанов В.В. Качественная теория дифференциальных уравнений. — Изд. 3-е, испр. — М.: Едиториал УРСС, 2004.

[6] Van der Schaft A.J. L2-gain analysis of nonlinear systems and nonlinear state feedback H* control // IEEE. Trans. On Automatic Control. — 1992. — V. 37. — P. 770—784.

[7] Patrong L., Sampei M., Koga M., Shimaizu E. A numerical computation Approach of Hamil-ton-jacobi-isaacs equation in nonlinear control problem. In 35h CDC. 1996.

[8] Lu Wei-Min and Doyle John C. H,, control of nonlinear systems: A convex Characterization // IEEE. Trans. On Automatic Control. — 1995. — V. 40. — P. 168—175.

[9] Sakayanagi Y., Nakayama D., Shigeki N. et al. Clarification of Free Parameters of State-dependent Coefficient Form: Effect on Solving State-dependent Riccati Inequality // 17th WC IFAC. Seoul. — 2008. — P. 182—187.

ROBUST STABILIZATION OF NONLINEAR OBJECT WITH SDC-PARAMETERIZATION

V.N. Afanasiev, D.V. Titov

Cybernetics Departament Moscow state institute of electronics and mathematics

B. Trehsvjetitelsky, 3, Moscow, Russia, 109028

Since the mid-90’s, State-Dependent Riccati Inequality (SDRI) strategies have emerged as general design methods that provide a systematic and effective means of designing nonlinear controllers for a robust stabilization. In this paper, a new expression of free parameters to completely express the SDC form is proposed. This form is using to design linear robust model of nonlinear system and then to synthesis the controller with constant parameters. Finally, example to verify the advantage method is given.

Key words: robust control, nonlinear object.

i Надоели баннеры? Вы всегда можете отключить рекламу.