Научная статья на тему 'Синтез оптимального управления нелинейными динамическими системами на основе концепции обратных задач динамики'

Синтез оптимального управления нелинейными динамическими системами на основе концепции обратных задач динамики Текст научной статьи по специальности «Математика»

CC BY
150
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Синтез оптимального управления нелинейными динамическими системами на основе концепции обратных задач динамики»

Харьков В.П.

ВУНЦ ВВС «ВВА им. проф . Н.Е. Жуковского и Ю.А.Гагарина»

СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ НА ОСНОВЕ КОНЦЕПЦИИ ОБРАТНЫХ ЗАДАЧ ДИНАМИКИ

Существует достаточно широкий класс динамических систем, на которые воздействуют контролируемые возмущения. Если цель управления заключается в отработке некоторого заданного процесса, то возникает задача непосредственного учета возмущений в законе управления.

Представляет определенный интерес синтезировать управление на основе концепции обратных задач динамики [2-4], позволяющей учесть все контролируемые воздействия непосредственно в законе управления .

Пусть динамическая система описывается дифференциальным уравнением вида

x (t) = Ax (t) + Bu (t) + V (t), (1)

где x (t)- n-мерный вектор состояния; u (t) - q-мерный вектор управления, V (t) - вектор контролируемых внешних возмущений; A, B -известные матрицы.

Процесс, предназначенный для отработки, определяется как

XT (t) = f (t) , (2)

где f(t) - s-мерная векторная функция, дифференцируемая требуемое число раз, удовлетворяющая

условию

s< q, (3)

Условие (3) удовлетворяет свойству управляемости на бесконечности, приt0 < t <¥ . Под управляемостью на бесконечности понимается возможность выполнения условия

xT (t) = Fx(t),їдеt e[t0,~], (4)

в котором

00 k 010k 0'

F = 00k 001k 0 , (5)

00k 000 k 10

где F - матрица размером p x n , состоящая из нулей и единиц.

Из условий (4), (5) следует, что компоненты вектора xt (t) имеют тотже физический смысл, что и некоторые компоненты вектора состояния (1).

В математическом плане задача управления формулируется следующим образом. Для системы (1) требуется найти вектор u (t)сигналов управления, обеспечивающий минимум функционала.

I = J[(Fx-xT) Q (Fx-xT) + uTKu ]dt, (6)

в которомО,К- заданные матрицы штрафов за точность и величину сигналов управления.

Из (6)следует, что целью управления является выполнение условия (4). Тогда можно записатьогра-ничение или условие (4) в виде [2] :

Lim [ Fx-xT] =0, (7)

которое учитывает, что в некоторый момент to условие (4) может не выполняться, например, из-за воздействия неконтролируемых возмущений. Приближение к нулю условия (7) может быть осуществлено по различным траекториям, конкретный вид которых определяется как исходной моделью объекта управления (1), так и требованиями к замкнутой системе управления. С учетом (1) будем полагать, что замкнутая система управления должна быть также линейной.

Если ввести обозначение p(x)=Fx-xt, тоусловие(7)можнопредставитьввидедифференциального уравнения

p(m)(x) + Cm-1p<m-1)( x) +...+ C1p(1)( x) + CoP (x) = 0, (8)

где Cj, j=0...m-1 - любые положительно определенные матрицы, обеспечивающие устойчивость решения (8) ; m <n - порядок дифференциального уравнения.

Полагая, что для управляемых координат известны не только значения, но и их первые m производных, получаем после подстановки (1) в (8) либо алгебраическое, либо дифференциальное уравнение относительно неизвестного вектора управления [2].

Для управляемой системы, следовательно, систему уравнений (8) с учетом (5) можно представить в виде уравнения Коши относительно вектора управления [1]:

u0=D0u0+R0z0, (9)

где u0 - [q (m - 1)J - мерный вектор, первый q компонент которого соответствуют

искомому управлению; D 0,R0 - матрицы, a z0 - вектор соответствующих размерностей, полученные после

преобразования системы (8) .

Отметим одну характерную особенность уравнения (9). Если матрица В имеет хотя бы один столбец, у которого все элементыкроме одного равны нулю, то соотношение (9) будет представлять собой совокупность как дифференциальных, так и алгебраических уравнений. Причем, если матрицаВ содержит строго q ненулевых элементов, то эти уравнения будут алгебраическими.

При анализе свойств замкнутой системы управления и оценке ее инвариантности по отношению к возмущениям будем полагать, что система (1) имеет вид

x1 (t ) = x2 (t)+ V1 (t) ,

x2 (t) = a12x1 (t) + a22x2 (t) + bu (t) + V2 (t),

(10)

где V1 (t ) ,V2 (t ) - контролируемые возмущения, непрерывно дифференцируемые по аргументу t.

Требуется определить такое управление u (t) , которое обеспечивало бы отслеживание заданной тра-

ектории Хт (t)

В этом случае функционал (б) примет вид I

|[(Х1-Х1Т)2 + Ku2]dt, а

ограничение

(8) запи-

шется как

(Х1 — Х1Т ) ^ + С1 (Х1 — Х1Т ) ^ + С0 (Х1 — Х1Т ) = 0, (11)

где матрицы C1,Co вырождаются в скаляры.

Так как для системы (10) матрица B= (0,b) имееттолькоодинненулевой элемент, тогда уравнение (11) будет алгебраическим. Подставляя (10) в (11) получаем

U = Ь |^—(^21 + Со)Х1 — (a22 + С1)Х2 — C1V1-V1-V0 + СоХ1тС1><1т + )&1т J, (12)

Замкнутая система (11) с управлением (12) преобразуется к виду

^(t) = Х2^) + V1(t); (13)

Х 2(t) =—CoХ1(t) — C1Х2(t) — k1(t) + k2(t),

где

k1(t) = C1V1(t) + \>1(t); k2(t) = CoMt) + C^t) + i«1T(t), (14)

Коэффициенты C1,Coопределяются из решения системы:

9I(C1,C„) = ai(C1,Cn) = 0 (15)

3C0 ’ 3C1 ’

при условии, что V1=0,V2=0, ax1T=const.

Рассмотримсвойства системы(15).Непосредственноиз(11),(15) видно, что возмущение V2(t) не влияет на процесс x(t). Для оценки точностиотслеживания процесса xn(t) определим передаточную функцию

W1 (p) от х1Т (р ) кх2Т(р).

Применив преобразование Лапласа к (15) при нулевых начальных условиях, получим:

■ p —1 ■ " Х1 (p)'

_С0 p+C0 _ _Х2 (p)_

где V1 (p) = Ї С1 (t

1

-P-C1

L1(p) +

0

p2+C1p+C0

x1T (p),

,-pt .

Тогда передаточная функция W1(p) имеет вид

W1 (p) = p2+C1p+C0 ° 1. (17)

p2+C1p+C0

0

(16)

Равенство W1(p)=l означает, что при начальных условиях Х1 (t0) = Х^ (t0)

входной сигнал xrr(t) будет отрабатываться точно, т.е. справедливо Х1 (t )@ x1T (t),t e[0,T].

В общем случае ошибка выходного сигнала определяется E(t) =Ex (t)+EV (t) , где Ex (t) - составляющая ошибки, обусловленная неточностью отработки входного задающего сигнала xrr(t), a Ev (t)- составляю-

щая ошибки, обусловленная действием возмущения V(t) . Анализ влияния возмущения V(t) управления будем проводить по передаточной функции W2(p) от V(p). Из (16) имеем

W2 ( p)

p+c1-(p+C1) = 0 p2+C1p+C0 '

(18)

на процессы

Следует отметить, что условие W2 (p) = 0 выполняется в случае измерения не только V(t), но и ее

производной V (t) .

Из (17) и (18) следует, что система (15) обладает инвариантными свойствами по отношению к возмущениям V1(t) и V2(t) и астатизмомвторого порядка по отношению ко входному задающему сигналу.

Рассмотримсвойствасистемы(15)впредположении,что контролируется только V2(t). В этом случае имеем передаточную функцию W2(p) вида

W2 ( p)

p

p2+C1p+C2

(19)

Если возмущение V2(t) представляет собой медленно меняющуюся функцию времени, то ошибка Ev (t), обусловленная действием V(t), определяется выражением [4]

E1 (t ) = CLv1 (t)-§у1 (t) +.

C20

Полученное соотношение означает, что замкнутая система управления обладаетинвариантнымисвойствамипоотношениюкпостоянномувозмущению V(t). Это утверждение справедливо, если параметры объекта(11) известны точно. В противном случае на переходных режимах свойства-

системы (15) будут определяться не значениями коэффициентов C1, C0 , аихсмещенными оценками С00 и СюВеличины Ао=С0-С00 и Д=С1-Сю, определяются априорной неопределенностью знания параметров системы .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из (13) следует, что система является инвариантной не только по отношению к возмущению V2(t), но и к коэффициенту Ь.Это достигается засчет непосредственного учета их в законе управления.

В заключение необходимо отметить, что полученный алгоритм является достаточно простым, доставляет замкнутой системе свойства инвариантности по отношению к возмущениям в случае, если известны не только значения, но и их производные. Требуемый порядок производных зависит от «точки» воздействия возмущения на систему и в общем случае не превышает(n — 1) . Так, например, для системы второго порядка (11) инвариантность достигается, если измеряются помехи V1(t), V2(t) и производная от V2(t) .

Работа выполнена при поддержке РФФИ11-08-00292

ЛИТЕРАТУРА

1. Меркулов В.И. Синтез оптимального управления дискретными системами с измеряемыми возмущениями - Радиотехника, 1999, №2.

2. Меркулов В.И., Харьков В.П. Синтез адаптивного регулятора для радиоэлектронных следящих систем - Радиотехника. 2007, №1.

3. Харьков В.П. Адаптивное управление динамическими системами на основе обратных задач динамики - Техн. кибернетика, 1994, №4.

4. Канащенков А.И., Меркулов В.И., Харьков В.П. и др. Авиационные системы радиоуправления, т. 3 - М.: Радиотехника, 2004.

5. Кочетков Ю.А. Основы автоматики авиационного оборудования. - М.: ВВИА им. Н.Е.Жуковского,

1995 .

i Надоели баннеры? Вы всегда можете отключить рекламу.