СИСТЕМЫ УПРАВЛЕНИЯ
УДК 517.977:519.876.2
Е. М. Воронов
МНОГОКРИТЕРИАЛЬНЫЙ СИНТЕЗ ПОЗИЦИОННОГО УПРАВЛЕНИЯ НА ОСНОВЕ МНОГОПРОГРАММНОЙ СТАБИЛИЗАЦИИ. Ч. 2
В рамках задачи многокритериального синтеза позиционного управления рассмотрено применение синергетического метода аналитического конструирования агрегированных регуляторов для получения стабилизирующих компонент используемого в процедуре синтеза многопрограммного позиционного управления нелинейной динамической системой на примере практически полезной модели движения летательного аппарата.
E-mail: [email protected]
Ключевые слова: многокритериальный синтез, позиционное управление, многопрограммная стабилизация, синергетический метод обеспечения асимптотических свойств траекторий, притягивающие многообразия, аналитическое конструирование агрегированных регуляторов, аэродинамический летательный аппарат.
Рассмотрим упрощенную нелинейную математическую модель продольного движения аэродинамического летательного аппарата (ЛА) с учетом динамики поступательного движения его центра масс в плоскости угла наклона траектории 9(t) и динамики совмещенного с данной плоскостью вращательного движения по углу тангажа $(t), а также кинематических уравнений относительно координат — высоты h(t) и горизонтальной дальности d(t) (рисунок). Система уравнений, подобная приведенной в работе [1 , п. 5.3.2], имеет вид
mV (t) = Pcos (ß — в) — D — mgsin в; (1a)
mV в (t) = P sin (^ — в) + L — mg cos в; (1б)
$(t)= wz; (1в)
Izüz (t) = Mz; (1г)
h = Vsin в; (1д)
d (t) = Vcos в; (1e)
pV 2 D = Cx (a, M) ^s; (1ж)
pV2 L = Cy (a, M) ^s, (1з)
\y = h
Координаты продольного движения ЛА
где х, у — оси системы координат, связанной с центром масс ЛА (переобозначения х = у = Н вызваны спецификой обозначений в много-програмной задаче управления); Р — сила тяги; Ь — подъемная сила; В — сила лобового сопротивления; т — масса летательного аппарата; д — ускорение свободного падения; а = $ — в — угол атаки; V — скорость ЛА; в — угол наклона траектории; 1г — момент инерции; Ыг — суммарный момент сил; — угловая скорость; Сх,СУ — аэродинамические коэффициенты; М — число Маха; р — плотность воздуха; 5 — площадь крыла ЛА.
Рассмотрим короткопериодическое движение ЛА, где задействована динамика поступательного движения центра масс ЛА и вращательного движения вокруг него. Вектор управления определяется соответственно управляющей силой Р — тягой двигателя и вращающим моментом Ыг — суммарным моментом сил.
В настоящей работе представлено обобщение поставленной в работе [1, п. 5.5.2] задачи обеспечения взлета с минимизацией невязок выхода на заданные значения скорости и высоты. В общем случае предполагается предварительное решение N задач оптимизации на множестве из N начальных условий на данном или расширенном векторе показателей, которые обеспечивают получение N результатов по управлениям и траекториям движения вида
и 0 = (пк1 ,пк2) = (Р* (г) ,ы:к
х\ (г) = (хк1... хкм) = (2)
= (V; (г), в* (г), $ к (г), и* (г), Нк (г), л (г));
Xk (to) = Xk0, k = 1,N (при решении функции D и L принимались равными Dt (t), Lk(t)).
В соответствии с первой частью статьи [2] это, например, будет N решений программно-оптимальных (ик = ик (¿)) многокритериальных задач управления системой (1а)-(1з), при различных начальных условиях хк(¿о), k = .
В соответствии с теорией многопрограммного позиционного управления (МПУ) универсальная структура МПУ имеет вид [2, 3]
N
и (х, = ит (х, + у(Ук 0)), У к = х - хк , ¿0 < t < ¿к, (3)
к=1
где
Ук (¿) = Ох(Ук (¿), V (Ук (¿))), Ук (¿о) = Уок = о, ¿0^<Ьк, к = 1, N,
(4)
— оператор системы в отклонениях относительно одной из многопрограммных траекторий хк(¿); v(yk(¿)) — стабилизирующая компонента МПУ, обеспечивающая устойчивость нулевого решения (4) (управление, стабилизирующее траекторию МПУ х(¿) относительно хк (¿) или, другими словами, обеспечивающее асимптотические свойства заданной траектории хк (¿));
N N , /lNs2
ит (х^) = ^ ик(¿) Д х % Д^))2, ик (хк= ик(¿) (5)
к=1 в=1, в=к
— многопрограммное управление без свойств стабилизации [2, 3].
Очевидно, что получение v(yk(¿)) для каждого к = 1, N формирует векторную асимптотику хк (¿), к = 1, N, как притягивающего многообразия для траектории х(¿), соответствующей МПУ (3).
В работах В.И. Зубова [4] и Н.В. Смирнова [5, 6] решена задача многопрограммной стабилизации для линейных стационарных и нестационарных систем, а также некоторых видов нелинейных систем в случае полной и неполной обратной связи на интервале ¿0 < t < то.
Универсальная форма многопрограммного управления в виде интерполяционного полинома Лагранжа-Сильвестра имеет вид [2]
N
и (х, ¿) = ^ (ик (¿) + Ск (¿) (х (¿) - хк (¿)))
i=l
N
,„ м V- (хк т - х, (¿))(х (Ь) - хк (())
к () ^ (хк ю - х «Р )х
А (х (0 - х, (ЭД2
х Л (хк т - х,№ (6)
Стабилизирующее свойства в (6) обеспечиваются введением дополнительной обратной связи с и0 = Ск (¿) (х - хк (¿)), к = 1, N,
которая формирует асимптотическую устойчивость всех хк(г), причем реализуемую на интервале г0 < г < то.
В работах Н.В. Смирнова и И.В. Соловьевой [3, 7] данный результат обобщен в форме (3) на конечном интервале г0 < г < гк в форме МПУ на основе метода позиционной оптимизации Р.Ф. Габасова [8], разработанного для линейных нестационарных управляемых систем. В работе [3] описана процедура использования метода для решения задачи стабилизации нулевого решения нелинейной системы в отклонениях (4) на интервале г0 < г < гк с кусочно-линейной аппроксимацией нелинейных правых частей системы (4). Задача получения стабилизирующей компоненты (3) для одной из заданных траекторий хк (г) и всего МПУ вида
решена с линеаризацией (4) для линейных (X (г) = А (г) х (г) + В (г) и) и билинейных X (г) = (А (г) х (г) + В (г) и) х) управляемых систем, а также управляемых систем типа Лотки-Вольтерры (х (г) = Рх + + Ц (х) х + и, &шх = п, Р = diag (Р1,..., Рк), Ц(х) = diag(q1x,... ..., qnx), q1,..., qn — строки матрицы Цо = {%, г = 1, п, у = 1, п}).
В настоящей работе рассматривается процедура получения стабилизирующей компоненты у(ук(г)) МПУ нелинейной системы (1а)-(1з) на отрезке г0 < г < гк, к = 1, N, без линеаризации правых частей (1) и (4) на основе синергетического подхода формирования притягивающих многообразий в форме метода аналитического конструирования агрегированных регуляторов (АКАР) [1, 2, 9].
Пусть без ограничения общности результата N = 2. Также отметим, что достаточно получить у(у1(г)), так как функция v(y2(t)), как будет показано далее, имеет вид, подобный у(у1(г)). Функция
yk = (x - Xk) = (V - Vk*,Q - Qk^ - - ш*к,h - hl, d - dk) =
Тогда МПУ в соответствии с (3), (5) со стабилизацией относительно х1 (г) после замены переменной х(г) принимает вид
u (x,t) = Um (x,t)+ v(yk (t)), yk = X - Xk(t) (7)
(yki,..., Vke), k = 1, 2; (8)
и1 = (Р*, М*1), и2 = (Р2,М*2). Из соотношения (8) следует, что
х = у 1 + хь
(10)
(9)
u (У1 + xi) = Ulf 1 +
(xi - x2)2
Поскольку и, и1, и2 в соответствии с (2), (10) являются двумерными векторами. Тогда vт(y1(t)) = (^(у^)), ^(у^))). Тогда
туи =
i(Xi-X2) У?\ „«У2
P¡ ( +P2;^+Щ (л)
cos (У 13 - У1 2+а 1)- Picos а\ - (D - Dl) -mg (sin (у 12 + в1) - sin в1); (12a) т(У11 + vi1)y/12 =
,(x1 -x2) , у2 V ™у2
Pi У1+ £ j +P1j- +V1 (У1 )J sin(y13-y12 + а1)-
-P1sina1 - У11Х12 + (L - L1) - mg(cos(y12 + в1) - cos в1 ); (12б) У/13 = У14; (12в)
Iz У/14 =
,(x1 - x2) , уЛ , , ,, У2
M¡1 ( ^ 1 l 2 У1 + Y ) + Ml2-f
+ V2 (y1(t)); (12г)
y/15 = (У11 + V*) sin (У12 + el) -V*sin el (12д)
У1 6 = (У 11 + V*)cos (y 12 + e*) — V*sm e*; (12е)
P* L * g
x 12 = —-V- sin a * +---1---- cos e*; l = (x1 — x2)2. (12ж)
12 mVj* 1 mV* V* 1 v 1 2; v 7
Для обеспечения устойчивости нулевого решения системы (12а)-(12ж) в соответствии с синергетической методикой системного синтеза [9] и применением метода АКАР [1] вводятся макропеременные
ф1 = У11, ф2 = У13 (13)
и уравнения
Тцф 1 + фх =0, T2ÍJ 2 + Ф2 = 0, (14)
где величины Т выбираются из условия [9] (2 ... 5)Т < tk. После подстановки (13) в (14) получаем
У/11 = —71ф1 = Т1 У11, y13 = —-1 Ф2 = — -1 У13. (15)
T1 T1 T2 T2
Уравнения (15) с учетом (12а), (12в) и (12г) в соответствии с (3) и (4) формируют управления v1(y1(t)) и v2(y1(t)), приводящие (при t ^ tk) y11(t), у13(t) и, следовательно, y14(t) (как будет показано далее) на притягивающие многообразия:
ф1 = У11 = 0, ф2 = y13 = 0 и, следовательно, y14 = 0. (16)
Действительно, подставляя (12а) в первое уравнение (15), имеем
vi (У1 (t)) = \~P* (1 + y, + y2^ - p*4 1 +
-p1 y, + yj - P2у
*
- —yiiP cos a, + (D - D,) + mg(sin (y,2 + в,) - sin в,) + —-1-7-x-. (17)
cos (y,3 - y 12 + a1)
Второе уравнение (15) приводится к виду
y13 = 2/13, (18)
T 2
но из уравнения (12в) следует замена
y14 = -Т1 У14. (19)
T 2
Как следствие из второго уравнения (15) получили уравнение (19) сходимости к нулю переменной y14.
Подставляя (12г) в уравнение (19) получаем стабилизирующее управление v2(y1(t)), которое при t ^ tk приводит к притягивающему многообразию:
ф2 = У14 = 0. (20)
С учетом уравнения (12в) и (15)
У14 = 2/13 = -т1 У13 (21)
T 2
управление v2(y1(t)) также обеспечивает при t ^ tk в соответствии с (21)
У13 (tk) = 0. (22)
Стабилизирующее управление
v2 (У1 (í)) = - ^У14 -T 2
,(X1 - X2) уЛ У2
MM 2 1 t 2 У1 +y) + м^у
. (23)
После определения ^(у^Ь)) и ги2(у1(Ь)), обеспечивающих при
Ь ^ tk
У11 ^ о, У13 ^ 0, У14 ^ 0, (24)
динамическая декомпозиция системы (12а)-(12ж) [9] оставляет три управления (12б), (12д) и (12е) с учетом (24). Уравнения (12д) и (12е) с учетом декомпозиции (у11 = 0) приобретают вид
У15 = ^п^ + в1 )-^в1п в1 ; (25)
У16 = ^^(У12 + в!)- в!. (26)
Вводим макропеременные
= У1яп(У12 + в1)—У^т в1 + «1У15 = У/15 + а У15; (27) = ^^(у^ + в1)—У*^ в1 +«2У16 = У16 + «1У16 (28) и уравнения
ЗД3 + ^3 = 0, 4 + ^4 = 0, (29)
обеспечивающее стабилизирующий переход к притягивающим многообразиям:
^3 = 0, ^4 = 0. (30)
Подставляя (27) и (28) в (29), получаем систему
У15 + аУ/15 = -Т1 (У/15 + а 1У15) , У16 + аУ/16 = — ^ (У/16 + а2У16) . (31)
В результате получаем, что функции
^3 = УУ15 + «1У15, ^4 = УУ16 + а2У16
автоматически стремятся к нулю при Ь—при условии (2.. .5) Т < Ьк,
г = 3, 4.
Таким образом, конечная декомпозиция принимает вид
У15 + «1У15 = 0, У16 + «2У16 = 0. (32)
Отсюда следует, что переменные /н, г = 5, 6, в звеньях (32) с постоянной времени 1/а, ^ = 1, 2, стремятся к нулю при Ь — Ьк, если (2...5)(1/а) <^.
Но при У15 — 0, У16 — 0 из (32) следует, что У15 — 0, У/16 — 0. Тогда из уравнений (25), (26) имеем
У15 = ^п(У12 + в1) - в1 — 0 при Ь — Ьк;
(33)
У16 = V1!'<cos(y12 + в1) — V1*cos в1 — 0 при Ь — Ьк.
Из (33) после преобразования разностей в произведения следует, что sin(y12/2) — 0, откуда
У12
—--> пп или У12 — 2пп, п = 0, ±1, ±2 ....
Из механики полета известно, что угол в(Ь) может изменяться лишь в пределах |в| < п/2, поэтому |у12| < п. Тогда п = 0 и У12 — 0.
Данный результат является также следствием того, что при У11 — 0, У15 — 0, У16 — 0 отклонение У12 — 0. Это следует из уравнений (1д) и (1е). Исследуем уравнение (12б) как результат динамической декомпозиции. После подстановки в (12б) управления (у1 (Ь)) и учета того, что У11 — 0, У13 — 0, У14 — 0 (как следствие У13 — 0), У15 — 0, У12 — 0, У16 — 0 (как следствие того, что У11 — 0, У15 — 0, У16 — 0)),
уравнение (12б) принимает вид
D — D*
Ь =--^ + (L — L1). (34)
cos а"
Но так как разность скоростей yk 1 = V — V" ^ 0 при t ^ tk то D = D(V) и L = L(V) стремятся к D* = D(V,*), L* = L(V{), поэтому в (34) y 1 2 ^ 0 при t ^ tk. Это подтверждает стабилизирующие свойства управления ут(у 1 (t)) = (v 1 (y 1 (t)), v2(y 1 (t))) т.е., как если бы по отклонению y12 была бы введена макропеременная ф5 = y12, для которой как следствие выполняются условия
= —-1 ф5, y12 = —71 У12, (35)
T 5 T 5
где при У12 ^ 0, У/12 ^ 0.
Таким образом, показано, что управление ут(y1(t)) = (v1(y1(t)), v2(y1(t))), в форме (17), (23) соответственно обеспечивает устойчивость нулевого решения системы в отклонениях (4) и поэтому является стабилизирующее относительно x1(t). Поэтому управление u(x, t) (7), (11) c учетом (10) (y1 = x — x1) формирует траекторию x(t) при любых начальных условиях x(to) в окрестности заданной точки x1 (t0) для которой x1 (t) обладает асимптотическими свойствами.
По аналогии может быть получено стабилизирующее управление v4y2(t)) = (v1 (y2(t)), v2(y2(t))) для N = 2
y2 = x — x2 (36)
в соответствии с заданной из (8), (9) парой u2 = (P|, M"2) и x2(t)
u (y + x2) = U2 (l + 2<xx—^ + ) +
V (x2 — x1) (x2 — x1) J
y2
+ ui y2 2 + v(y2 (t)). (37) (x1 — x2)
Тогда в соответствии с (33), (11) система (12а)-(12ж) с учетом (37) в квадратных скобках принимает подобный вид с заменой в соответствии с (8) k = l на k = 2.
Выражения для стабилизирующих управлений v1(y2(t)), v2(y2(t)) принимают вид
vi (У2 (t)) =
,(x2- Xi) , y|\ D,yin
-P21У2 + - - p;Y
+
-—У21Р cos a2 + (D - D2) + mg(sin (У22 + #2) - sin #2) + ——2-(-^-; (38)
COS (У23 - У22 + a2)
v2 (У2 (t)) = -13У14 -T 7
I (x2 - Xi) У2\ У2П
m^2 ( 2V 2 г 17 У2 + у) + Mi у
Многопрограммное позиционное управление u(x, t) (5), (7) в окончательной векторной форме принимает вид
u (x,t) = f Uk (t) Д (("X (tt\- XX + V1 (yi(t))+ V2 (y2(t));
k=1 s=1, s=k (Xk (t) Xs(t))
(40)
yi (t) = X (t) - Xi (t) , y2(t) = x(t) - X2(t). (41)
Векторы v1(y2(t)) и v2(y2(t)) описываются выражениями (17), (23) и (38), (39) соответственно. Начальные условия x(t0) любые в окрестностях векторов X1(t0) и X2(t0). Например, X(t0) принадлежит диапазону между X1(t0) и X2(t0).
Траектории X1(t) и X2(t) составляют притягивающие многообразия для траектории X(t), порожденной МПУ u(x, t).
СПИСОК ЛИТЕРАТУРЫ
1. Синергетические методы управления сложными системами: Механические и электромеханические системы / А.А. Колесников, Г.Е. Веселов, А.Н. Попов и др.; Под ред. А.А. Колесникова. - М.: Ком. Книга, 2008. - 304 с.
2. В о р о н о в Е. М. Многокритериальный синтез позиционного управления на основе многопрограммной стабилизации. Ч. 1 // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. - 2012. - № 2. - С. 3-19.
3. Соловьева И. В. Синтез многопрограммных систем управления на основе метода позиционной оптимизации: - Автореферат дисс.... канд. физ.-мат. наук /СПб. гос. ун-т, 2010. - 15 с.
4. З у б о в В. И. Синтез многопрограммных устойчивых управлений // Докл. АН СССР. - 1991. - Т. 318. - № 2. - С. 274-277.
5. С м и р н о в Н. В. Задачи многопрограммной стабилизации в различных классах динамических систем // Труды Средневолжского мат. общ., 2005. - Т. 7. № 1. -C. 192-201.
6. С м и р н о в Н. В. Многопрограммная стабилизация линейных и билинейных систем в случае неполной обратной связи // Изв. РАН. Теория и системы управления. - 2001. - № 3. - C. 40-44.
7. С м и р н о в Н. В. С о л о в ь е в а И. В. Применение метода позиционной оптимизации для многопрограммной стабилизации билинейных систем // Вестник СПб. ун-та. Сер. 10. Прикладная математика, информатика, процессы управления, 2009. - Вып. 3. - С. 253-261.
8. Б а л а ш е в и ч Н. В., Габасов Р. Ф., Кириллова Ф. М. Численные методы программной и позиционной оптимизации линейных систем управления // Журн. вычисл. математики и мат. физики. - 2000. // - Т. 40, № 6. - С. 838-859.
9. К о л е с н и к о в А. А. Синергетические методы управления сложными системами: Теория системного синтеза. - М.: Ком. Книга, 2006 - 240 с.
Статья поступила в редакцию 31.05.2012 Евгений Михайлович Воронов окончил в 1963 г. МВТУ им. Н.Э. Баумана. Д-р техн. наук, профессор кафедры "Системы автоматического управления" МГТУ им. Н.Э. Баумана.
Ye.M. Voronov graduated from the Bauman Moscow Higher Technical School in 1963. D. Sc. (Eng.), professor of "Automatic Control Systems" department of the Bauman Moscow State Technical University.