УДК 517.977:519.876.2
ОПТИМАЛЬНОЕ НЕЛИНЕЙНОЕ НАВЕДЕНИЕ НА ОСНОВЕ АЛГОРИТМА МНОГОКРИТЕРИАЛЬНОГО СИНТЕЗА МНОГОПРОГРАММНОГО ПОЗИЦИОНННОГО УПРАВЛЕНИЯ
Е.М. Воронов1, В.А. Серов2, И.А. Спокойный1
1МГТУ им. Н.Э. Баумана, Москва, Российская Федерация e-mail: [email protected]; [email protected]
2Московский государственный университет приборостроения и информатики, Москва, Российская Федерация
Рассмотрены алгоритмические основы метода многокритериального синтеза многопрограммного позиционного управления, полученного в работах Е.М. Воронова на основе обобщения подходов В.И. Зубова, Н.В. Смирнова, И.В. Соловьевой и Р. Ф. Габасова по формированию компонент многопрограммного позиционного управления, стабилизирующих траекторию объекта с таким управлением относительно множества оптимальных программных траекторий, придавая этим траекториям асимптотические свойства на конечном интервале времени. Обобщение заключается в способе нахождения стабилизирующих компонент многопрограммного позиционного управления, основанном на синергетическом подходе формирования "притягивающих многообразий", введением экспоненциально устойчивых макропеременных метода агрегированных регуляторов по A.A. Колесникову, а также в обеспечении многокритериального качества программных траекторий — асимптот на множестве начальных условий. Приведен пример применения устойчивых макропеременных для получения стабилизирующих компонент позиционного управления линейной нестационарной системы. Алгоритм метода многокритериального синтеза многопрограммного позиционного управления применяют для получения структуры оптимального нелинейного наведения управляемого объекта (противокорабельной ракеты) и многофакторного анализа его свойств. Многокритериальная оптимальность наведения и его нелинейная структура повышают эффективность перехвата цели.
Ключевые слова: многокритериальный синтез, многопрограммная стабилизация, многопрограммное позиционное управление, макропеременные, агрегированный регулятор, многокритериальная оптимизация, система уравнений противокорабельной ракеты, нелинейный метод наведения.
OPTIMAL NONLINEAR GUIDANCE BASED ON THE ALGORITHM OF MULTI-CRITERIA SYNTHESIS OF MULTI-PROGRAM POSITION CONTROL
E.M. Voronov1, V.A. Serov2, I.A. Spokoinyi1
1Bauman Moscow State Technical University, Moscow, Russian Federation e-mail: [email protected]; [email protected]
2Moscow State University of Instrument Engineering and Informatics, Moscow, Russian Federation
Algorithmic fundamentals of the method for multi-criteria synthesis of multi-program position control are considered. The method has been obtained in the works by E.M. Voronov on the basis of generalizing the approaches by V.I. Zubov, N.V.Smirnov, I.V. Solovieva, and R.F.Gabasov regarding the formation of the multi-program position control components which stabilize the object trajectory with such a control
with respect to a set of optimal program trajectories by imparting asymptotic properties to these trajectories within the finite time interval. The generalization consists in the method for finding the stabilizing components of multi-program position control that is based on synergetic approach for forming "attracting manifolds" by introduction of exponentially stable macro-variables of the method of aggregated regulators by A.A. Kolesnikov, as well as in providing the multi-criteria quality of program trajectories — asymptotes on the set of initial conditions. An example of using stable macro-variables to obtain the stabilizing components of position control of the linear non-stationary system is given. The algorithm of the method for multi-criteria synthesis of multi-program position control is applied for obtaining a structure of the optimal nonlinear guidance of the controlled object (anti-ship missile) and the multi-factor analysis of its properties. The multi-criteria optimality of guidance and its nonlinear structure improve the efficiency of target capture.
Keywords: multi-criteria synthesis, multi-program stabilization, multi-program position control, macro-variables, aggregated regulator, multi-criteria optimization, system of equations for anti-ship missile, nonlinear guidance method.
В работе [1] рассмотрены развиваемые направления приближенного многокритериального синтеза позиционных управлений как функций состояния системы и их свойства: метод синтеза программно-корректируемого управления с потактовым пересчетом программного оптимального управления и с применением современных нейроэво-люционных технологий; метод синтеза на основе комбинации генетического алгоритма и сетевого оператора; генетического алгоритма и структур, порождаемых теорией автоматов; численный метод позиционной оптимизации линейных систем со скаляризацией показателей. В некоторых из перечисленных методов существует проблема сходимости и "негрубости" структуры к незначительному изменению начальных условий по времени и состоянию.
В работах [1,2] сформирован метод многокритериального синтеза позиционного управления на основе метода многопрограммной стабилизации В.И. Зубова, Н.В. Смирнова [3-5], развитого до многопрограммного позиционного управления (МПУ) в работах Н.В. Смирнова и И.В. Соловьевой [6, 7]. При этом предварительно полученное многопрограммное множество траекторий, порожденных многокритериально оптимальными программными управлениями (как функциями времени) на множестве начальных условий, приобретает при многопрограммной стабилизации асимптотические свойства для траектории МПУ и выполняет роль практического расширения класса "притягивающих" многообразий — аттракторов по Г. Никольсу и Н. Пригожину [8]. В дополнение к результатам стабилизации на конечном интервале времени для линейных и линеаризуемых систем с билинейными моделями и моделями в форме Лотки -Вольтерры [6, 7] в рамках метода разработаны новые синергетические приемы многопрограммной стабилизации траектории МПУ для линейных и нелинейных систем [1, 2] на основе экспоненциально устойчивых макропеременных по А.А. Колесникову [9, 10].
В результате в работах [1, 2] на основе работ [6, 7, 9, 10] создан приближенный алгоритм многокритериального синтеза многопрограммного позиционного управления (АМС МПУ), в котором структура МПУ не зависит от начальных условий и обеспечивает сходимость траектории МПУ к множеству многокритериально оптимальных траекторий — асимптот на конечном интервале времени.
Алгоритм многокритериального синтеза МПУ можно представить следующими этапами:
1) многокритериальная оптимизация программных управлений и траекторий (МО ПУТ);
2) получение стабилизирующих компонент МПУ (СК МПУ);
3) численно-аналитическая реализация АМС МПУ в программной среде МЛТЬЛБ.
Многокритериальная оптимизация многопрограммных управлений. Пусть в соответствии с задачами МПУ объект описывается нелинейной системой дифференциальных уравнений
где х = (х1,...,хпу — п-мерный вектор состояния системы; и = = (и1,...,иг)т — г-мерный вектор управления, вектор-функция f (¿, х, и) принадлежит множеству С(Л1 х Еп х Ег) за исключением конечного множества точек меры ноль (в некоторых случаях). Управление принадлежит к классу ограниченных функций при £ € [¿о, ].
В задачах МО вводится вектор показателей — критериев:
Л = (71,..., ) ^ ех1х . (2)
Вариант специальной задачи МПУ — множество начальных условий
которое порождает число N программных движений системы (1) х1 (¿),..., х^ (¿) на множестве начальных условий, вызванных оптимальными в смысле (2) программными управлениями и1 (¿),..., и^ (¿). Число N программных управлений не связано ни с размерностью системы (1), ни с размерностью вектора управления ик (¿).
В работе [1] рассмотрены три типовых подхода [11-14], в которых сгруппированы известные методы. Это так называемые прямые интерактивные методы, например, на основе конусов доминирования и генетических алгоритмов со сплайнами, методы скаляризации (свертка показателей, пороговая и лексикографическая оптимизация); методы на основе компромиссов (на основе идеальной точки, точки Шепли и арбитражной схемы Нэша). Методы реализуются на таких технологиях оптимального управления, как принцип максимума, динамическое
X = f (t, x, u), u £ U,
(1)
Xk (to) = Xko, к = 1,... ,N,
(3)
с
min Ji
max J-»
\
Парето-область
= max J2
J2 = min J2
J(u)
'I _ mm J л
Парето-область . т Г mm J2
V
/
/f = min Ji
J I = max Jx J I
Рис. 1. Парето-области при I = 2 с точками компромисса с учетом вариации постановки:
1 (1') — идеальные точки; 2 (2') — искомые решения (точки компромисса) по вектору показателей на парето-области
программирование, численные методы, в частности, в форме генетических алгоритмов при приближенной аппроксимации управления вектором распределенных во времени параметров.
Применяя один из перечисленных выше подходов многокритериальной программной оптимизации, можно получить множество из N решений на множестве начальных условий. Для этого могут быть использованы прямые методы, методы скаляризации, методы на основе компромиссов. Пусть без ограничения выбора подходов это будет один из методов получения компромиссов на основе недостижимой идеальной точки, с помощью которого на парето-области показателей можно выбрать точку, самую близкую к идеальной точке, поэтому будет скомпенсирована неопределенность выбора на парето-области (рис. 1).
Вектору показателей на парето-области при заданных начальных условиях xk (t0), k = 1,..., N, соответствует оптимальное программное управление uk opt в случае решения задачи на основе функции Салуквадзе [11]:
Окончательно получим множество оптимальных программных управлений ик ор (¿), к = 1,..., N и соответствующих траекторий хк (£),
к =
Получение стабилизирующих компонент МПУ. Общий вид структуры МПУ на конечном интервале [£0 ] имеет вид [1, 6, 7]
min[(Ji - J*)2 + (J - J)2] ^ u = икopt.
(4)
N
В (5) оператор системы в отклонениях относительно одной из многокритериально оптимальных траекторий хк (¿)
v(yk (¿)) — стабилизирующая компонента МПУ, обеспечивающая устойчивость нулевого решения (6) (управление, стабилизирующее траекторию МПУ х(£) относительно траектории хк (¿) или обеспечивающее асимптотические свойства заданной траектории хк (¿)); многопрограммное управление без свойств стабилизации [6]:
ит (х £) =
Очевидно, что определение компоненты v(yk (¿)) для каждого к = 1,..., N формирует векторную асимптотику хк (¿), к = 1,..., N на интервале [£0,£к], как "притягивающего" многообразия для траектории х(£), соответствующей МПУ (5).
В работе [6] для получения стабилизирующей части (5) использован численный метод позиционной оптимизации Габасова, разработанный для линейных нестационарных управляемых систем. В связи с этим процедура применения метода для решения задачи стабилизации нулевого решения (6) на интервале [£0,£к] требует линейной аппроксимации нелинейной правой части (6).
В работах [1, 2] рассмотрено обобщение процедуры получения стабилизирующей компоненты v(yk (¿)) МПУ для линейных [1] и нелинейных систем [2] на интервале [¿0,£к] для любого к = 1,..., N без линеаризации правых частей (1) и (6) на основе синергетическо-го подхода формирования "притягивающих" многообразий в форме метода аналитического конструирования агрегированных регуляторов (АКАР) [9, 10]. В методе АКАР вводятся устойчивые макропеременные
где С принадлежит диапазону значений, определяемому динамическими свойствами (1) и (6), для получения компонент v(yk (¿)), обеспечивающих устойчивость нулевого решения (6) на основе экспоненциальной сходимости к нулю. Такой подход дополняет методику получения стабилизирующего управления v в (5) [6].
Краткий анализ применения синергетического метода АКАР для линейной нестационарной системы приведен в работе [1], применение метода в классе нелинейных систем с примером расчета — в работе [2].
уk(t) = Gk(Vk(t), v(Vk(t));
Vk (to) = Vok = 0, to < t < tk, к = 1,..., N;
(6)
Um (Xk ,t) = Uk (t). (7)
фг (t) = ^ (ykl, . . . , Vkn) ,
Ti фг + фг = 0, (СгТг) ^ tk, i = 1,..., n,
(8)
Для иллюстрации применения синергетического метода АКАР при получении многопрограммного позиционного управления (5), которое является основой многокритериального синтеза МПУ на интервале [to, ], в работе [1] рассмотрен аналитический результат его использования в классе линейных нестационарных систем. Таким образом, система (1) принимает вид
X (t) = A (t) x (t) + B (t) u dim x = n, dim u = r. (9)
При этом без ограничения общности результатов принято, что число заданных многокритериально оптимальных программных управлений и соответствующих траекторий составляет N = 2. Тогда в соответствии с (5)
Um (X,t) = Ui (Х - X2)2 + U2 (X - Xl)2 . (10)
(Xi - X2) (X2 - Xi)
Для k = 1 определим v(yk). В соответствии с (5)
X(t) = yi(t) + Xi(t). (11)
Следовательно, (10) можно представить в виде
f , (Xi + yi - X2)2 , yi
Um (Xi + yi,t) = Ui (Xi -X2)2 + U2 (X2-X? =
(X1 - X2)y1 y12 y12
= uM 1 + -:2Г +7-^ +U^7-^. (12)
(X1-X2)2 (X1-X2)2 (X2-X1)2
Систему (12) в отклонениях (6) можно записать как
yi (t) =A (t) yi (t) +
+ B (t)
(Х1-Х2)У1 У12 \ У12
«Н -^ +--^ +U2
(Ж1-Ж2)2 (Ж1-Ж2)V (Ж2-Ж1)2,
+
+ B (t) v (У1 (t)), (13)
где п 1
(х1-х2)2 = (х2-х1)2= (Х1г-Х2г)2=1 (¿) = 0, /1 = --. (14)
г=1
Тогда система (13) в отклонениях (6) преобразуется к виду У1 (*) =
= А (*) У1 (*) +В (*) v (У1 (*)) +С (*) У1 (*) (*) У12+Е (*) У12 =
= (А (*) +С (*)) У1+В (*) v (У1) + (Д (*) +Е (*)) У12 =
= А' (*) У1+В (*) v (У1)+Е' (*) У12. (15)
Далее без ограничения общности вывода принимаем п = 2, г = 2, с учетом чего
у2 = (у?1 + у22); В(^) = адае{^11,в22>. ( )
Пусть
Л(г) = {аг]}; С(¿) = {агз}; Л' = {«г,} = {аг] + с,}, г,; = 1, 2,
(17)
где
С =2В(*)и1(х1 - Х2)/1; Е' = {(к1+кз)у2; (к2 + к4)у1}т; по,
(18)
к1 = вииц/1; к2 = ^22«12/1; кз = вии^ь к4 = ^22^22/1. Система (15) в форме Коши с учетом (17) и (18) принимает вид
У/11=аиу11+а12у12+ви«1 (У1) + (к1+кз) V?; (19)
2/12= «21 У11+а22У12+в22«2 (У1) + (к2 + к4) V2.
Согласно методу АКАР, вводятся макропеременные [9]
-1 (¿) =«11 /11+012/12; -2 (¿) =а21У11+а22У12 (20)
с условием асимптотической устойчивости по каждой из них соответственно на основе экспоненциальной сходимости
ЗД (¿)+- (¿) = 0; Т2-2 (¿)+- (¿) = 0; (21)
(СгТг) « 1к. (22)
Тогда при г ^ 4 ^ 0, —2(¿) ^ 0 (^х(^к) = 0, -2 (¿к) =0 - "при-
тягивающие" многообразия). Пересечение многообразий дает систему
-1 = «11/11+0:12212= 0; (23)
-2= а21У11+а22У12= 0.
Решение системы (23) имеет место в точке
/11 (¿к) =/12 (¿к) = 0. (24)
Таким образом, к моменту времени ¿к "обеспечивается" асимптотически устойчивое "обнуление" отклонения у1 (¿). Далее необходимо найти управление ^т(у1) = («1(у1), (у2)), которое переводит систему (19) из точки у1(г0) = 0 на "притягивающие" многообразия —1 = 0, —2 = 0, т.е. определить стабилизирующее управление «1(у1) для получения асимптотических свойств х1(г).
В соответствии с методом АКАР [9] подставим выражения макропеременных (20) в уравнения (21)
-1= « 11/11+011/11+0 12/12+012/12= --1 -1; (25)
т 1
-2 = а 21/11+а21//11+(0 22У12+а222/12= -2. (26)
Т2
Подставляя в (25) и (26) уравнения системы (19), окончательно получаем
А1+аиви^1+В 1+С 1+«12 ^22^2+^1= -—
V (27)
А2+«21ви^1 + В 2 + С 2+«22 ^22^2+^2= — — ^2,
Т2
где
А = ¿11У11 + «11^1; = «пуп + «12^12; А = ¿21У11 + «21^1; В1 = «11 (&1 + кз) У2 = «ИВ; В2 = «21 (&1 + кз) У2 = «21В; С 1 = ¿12У12 + «12^2; ^2 = «21У11 + «22У12; (28)
= «12 (к2 + к4) У2 = «12^;
^2 = «22 (&2 + к4) У2 = «22^. Решая систему (27) относительно величин и -у2, получаем
Vi (У1) = [(«22«11 - «12«2l) ви]
-1
i «12^2 «22^ _ V T2 T1 '
— («22А1 «12А2) — («22«11 — «12«21) В — («22С1— «12С2) ^2 (У1) = (29)
= [(«21«12 «11 «22) в22]-1 ^Т1^2 — — («21А1— «11^2) —
— («21 «12 «11 «22) («21С1—«цС2)
Следовательно, на основе устойчивых макропеременных метода АКАР получено управление
стабилизирующее траекторию х(£) МПУ и(х,£) (9) относительно многокритериальной программно-оптимальной траектории х1(^) с заменой в выражении (28) у1(^) = х(£) — х1(^).
Вектор vт(y2) = (^1(у2),^2(у2)) будет иметь вид, подобный виду (29) с заменой величин и1(^), х1(^) в ее структурах как функциях переменных (и1(^), х1(^), х(£)) подобными функциями (и2(£), х2(£),
х(*)).
Численно-аналитическая реализация в форме оптимального нелинейного наведения АМС МПУ в программной среде MATLAB. Далее рассмотрен пример синтеза позиционного управления для сложного нелинейного объекта — конкретного образца
1
управляемого средства поражения (УСП). Задача заключается в синтезе алгоритма оптимального управления объектом при наведении в точку назначения (ТН). Объект управления (ОУ) - образец УСП со следующими характеристиками:
Начальный угол пуска с носителя УСП 90, град ....................0
Начальная масса m0, кг....................................................................582
Начальная скорость V0, м/с..............................................................443
Время полета tk, с..............................................................................Менее 450
Координаты цели до ТН, м:
Нц.................................................... 0
Хц.................................................... 120 000
Система дифференциальных уравнений движения ОУ имеет вид dV
m—— = Pg — Xa — mg sin 0; dt
d0
mV—- = Ya — mg cos 0; dt
dm = f (t' "тип двигателя"); (30)
= V sin 0;
dt
dX = V cos 0, dt
где V — скорость ОУ; 0 — управляющий угол траектории ОУ; m — масса ОУ; H — высота полета ОУ; X — горизонтальная дальность ОУ до ТН; P — тяга двигателя ОУ; g = 9,81 м/с2 — ускорение свободного падения; Xa и Ya — аэродинамические силы, Xa = CxaqS; Ya = CyaqS Cxaи Cya — аэродинамические коэффициенты, Cya = Nymg/ (qS) Cxa = f (Cya); S = 0,685 м2 — площадь поверхности крыльев ОУ q — скоростной напор, q = pV2/2; р = р (H) — плотность атмосферы, зависящая от высоты H; u = Ny — управляющая переменная в форме перегрузки, подлежащей формированию при наведении ОУ в ТН.
Двигатель ОУ — двухступенчатый со следующими характеристиками:
1) стартовая ступень: время работы ti = 3,8 с, сила тяги P = = 3000 кгс, масса топлива m1 = 47,8 кг, dm/dt = fT = 12,58 кг/с;
2) маршевая ступень: время работы t2 = 23 с, сила тяги P = 520 кгс; масса топлива m2 = 51,5 кг, dm/dt = fT = 2,24 кг/с, запуск не ранее 4 с, но не позднее 20 с после окончания работы стартовой ступени, время t1-2.
Аэродинамические коэффициенты Сха и Суа представлены полиномами. В расчетах необходимо учитывать ограничение |Суа | < Суа огр. Перегрузка Ху не должна превышать четырех единиц и должна удовлетворять следующему условию:
Ny mg
< Cya огр-
qS
Введем вектор состояния ОУ:
x1 = V; x2 = 0; x3 = m; x4 = H; x5 = X. (31)
Тогда система дифференциальных уравнений (30) принимает вид
Xi = — (Pg - CxaqS - Хзд sin X2);
X3
¿2 =-(CyaqS - Хзд cos X2);
XiX3 (32)
¿3 = /т;
x4 = x1 sin x2; x5 = x1 cos x2;
q (x1, x4) = p (x4) x2/2.
Критерии оптимизации (2) алгоритма наведения ОУ по u = Ny формулируются так:
1) максимизация скорости подхода VTH в ТН;
2) минимизация промаха ОУ ДХ = ХТН — Хц в ТН;
3) максимизация угла подхода 0ТН в ТН
J = V2(tk) ^ max;
J = (x5(tfc) - Хц)2 ^ min;
2 и
J3 = ) - |) ^ max.
Для того чтобы реализовать АМС МПУ в рассматриваемой задаче полезно переформировать исходную систему отсчета, т.е. перенести начало координат в ТН. Тогда координаты ТН по высоте (Нц) и по дальности (Хц) всегда будут равны нулю, а начальное условие по дальности пуска УСП X0 = — Хц.
Первый этап АМС МПУ в рассматриваемой задаче — многокритериальная оптимизация программных управлений и траекторий. Для этого применяют алгоритмы оптимизации, основанные на параметризации управления и последующем поиске минимума функции многих переменных в случае применения методов скаляризации, или получение парето-области, если используется генетический алгоритм (ГА) оптимизации. Общая структурная схема алгоритмов этапа МО ПУТ
Рис. 2. Общая структурная схема алгоритмов этапа МО ПУТ
представлена на рис.2. Параметризация управления заключается в выборе набора параметров, позволяющих описать вид программного управления «(£) как набора значений времени. Например, задаются ключевые моменты времени ¿г, для каждого из которых будет определяться значение параметра рг (¿г) с последующей интерполяцией этих точек сплайнами.
В исходной постановке задача является многокритериальной, т.е. имеется три показателя эффективности «71}..., 73. Если применяется метод свертки, то формируется линейная свертка показателей с весовыми коэффициентами аг:
I I
Фв = «г х 7гн; «г = 1 0 < «г < 1,1 = 3,
г=1 г=1
где 7гн — нормированное значение показателя.
Далее задача заключается в поиске экстремума функции Фв, для чего можно использовать встроенную в МЛТЬЛБ функцию поиска минимума скалярной функции нескольких переменных с ограничениями, начиная с начального приближения йттсоп.
При применении ГА учитывается векторная форма показателей без скаляризации с построением парето-границы и последующим поиском наиболее подходящего решения на основе экспертной оценки или идеальной точки (4). На первом этапе экспертная процедура выполняет предварительный отсев заведомо неподходящих точек парето-границы — решений, которые по тем или иным показателям не удовлетворяют требованиям, предъявляемым к задаче. Второй этап проведения оценки — выбор единственного решения, которое лучше отражает эффективность решения рассматриваемой задачи.
Идея ГА заключается в случайном формировании начальной популяции с заданным числом особей. Для каждой особи, которая представляет собой набор параметров определяются значения всех показателей. Затем на основе операторов скрещивания, мутации и селекции происходит формирование нового поколения, и процесс повторяется. В настоящей работе применена встроенная в МАТЬАБ функция gamultiobj, а также разработанный Серовым ГА многокритериальной оптимизации (ГАМО) [12-14].
Сравнительный анализ указанных алгоритмов в прикладной задаче позволяет сделать следующие выводы:
— метод свертки работает быстрее, чем ГА, но требует оценки весовых коэффициентов — значимость каждого показателя, что в некоторых случаях может быть затруднительно;
— в отличие от ГА для метода свертки необходимо обязательно формировать начальное приближение;
— вероятность попадания в локальный минимум методом свертки больше, чем при использовании ГА.
Без ограничения общности результатов исследована МО ПУТ для
следующих исходных данных:
Начальный угол пуска с носителя УСП в0, град......................0
Высота пуска Н, м..............................................................................15 000... 20 000
Дальность до цели ТН Хц, м............................................................120 000
Начальная масса т0, кг....................................................................582
Начальная скорость У0, м/с..............................................................443
Получим МО ПУТ для набора начальных условий: #0 = 0°; V) = 443 м/с; ш0 = 582 кг; Х0 = -120 000 м; Щ0 = 15 000 (для МО ПУТ 1) и 20 000 м (для МО ПУТ 2).
Результаты МО ПУТ в виде зависимостей скорости, аэродинамических коэффициентов, перегрузки и угла от времени и зависимость высоты от дальности представлены на рис. 3.
Определим стабилизирующие компоненты МПУ, для чего из системы (32) по методу, изложенному в работе [2], необходимо получить систему в отклонениях (6) относительно многокритериально-оптимальных траекторий (МОТ):
Ук = (х - X) = (V - - - ш*кЩ - Щ,Х - Хк) =
= (ш,...,У*б) , к = 1,...,Х; (33) ик = ик = Nyk, (34)
где ук — отклонение от к-й МОТ.
Рис. 3. Результаты МО ПУТ в виде зависимостей скорости (а), аэродинамических коэффициентов (б, в), перегрузки (г) и угла (д) от времени и зависимость высоты от дальности (е)
Из соотношения (33) следует, что
х=Ук+Хк; (35)
х=Ук+Хк. (36)
После замены переменных в уравнениях (33)-(36) получаем следующую систему в отклонениях:
1
Ук1 = -;- (Pg — CxaQkS — (yk3+Xk3) gsin (yk2+Xk2) ) —Xkl;
Укз +g^k3
Ук2 = 7-■-Г (u—cos (Ук2+Xk2)) —Xk2;
(Ук1+Xki)
yk3 = /т—Xk3;
Ук4 = (Ук1 +Xk1) sin (Ук2+Xk2 ) —Xk4; Ук5 = (Ук1 +Xk1) COS (Ук2+Xk2 ) —Xk5,
(37)
где
Xk1 = — (Pg — CXaQkS — Xk3gSin Xk2 ) ;
Xk3
Xk2 = — (uk — cos Xk2); Xk3=/т; Xk1
(38)
Xk4 = Xk1 sinXk2; Xk5 = Xk1 cosXk2;
Для системы (37) с началом координат в ТН следует определить, по каким компонентам будет осуществляться стабилизация (стабилизация всех компонент вектора состояния часто является излишней и в некоторых случаях нереализуемой задачей). В рассматриваемом случае при управлении тягой и перегрузкой, а также заданном режиме тяги двухступенчатого двигателя ОУ размерность вектора управления равна единице, а размерность вектора состояния системы — пяти. Кроме того, рассматривается движение только в вертикальной плоскости, а основные критерии — попадание в ТН и максимизация угла подхода. Поэтому достаточна стабилизация по высоте относительно МОТ в зависимости от текущей дальности, а максимизация скорости подхода будет обеспечена за счет экспоненциальной сходимости траектории, формируемой МПУ, к МОТ, обладающей оптимальностью по указанному критерию.
Следовательно, для получения стабилизирующих компонент в системе (37) достаточно учесть второе и четвертое уравнения, которые приводятся к виду
g í \
x2 = — (u-cos x2 );
Ук4 +Xfc4 (39)
sin X2 =-.
x1
Из первого уравнения (39) выражается величина u, а из второго — x2, тогда
x 2xi
u =--hcos x2;
. (уы+Хы\ (40)
x2=arcsin - .
x1
Далее применяется метод АКАР с учетом (39) и (40), в соответствии с которым вводится макропеременная (внутреннее управление)
Фк4 = Ук4 (41)
и уравнение
ЗДк4 + Фкл = 0. (42)
Система (40) с учетом выражений (41) и (42) примет вид
x2x1
v4k =--hcos Х2;
g
ж 2 = arcsin
x2 =x
Tk4_
(43)
T2 '
где — стабилизирующая компонента МПУ относительно k-й
X
2
программно-оптимальной траектории; ж2 — требуемое значение ж2 для обеспечения сходимости ук4 к нулю по методу АКАР; Тк4 — постоянная времени из уравнения (42), отвечающая за скорость сходимости ук4; Т2 — константа, задающая скорость сходимости текущего значения ж2 к значению
Стационарность процесса сходимости значения ж2 к значению ж2 (константа Т2) допустима, так как значение ж2 незначительно изменяется на траектории, а в окрестности терминальной точки все МО ПУТ совпадают.
Запишем из системы (43) выражение
arcsin
^+il4\
Тк4
- Ж2
-ук = ---^---Ж1+СОй Ж2 . (44)
Выражение для МПУ без свойств стабилизации имеет вид
- «=± -н н. (45)
С учетом (44) и (45) получим МПУ
«м = + (46)
Таким образом, определено МПУ (46), реализующее нелинейное наведение УСП, зависящее от текущего вектора состояния объекта и от заранее полученных значений МО ПУТ. Условия численной реализации алгоритма МС МПУ: 6>0= 0°; V = 443 м/с; т0 = 582 кг; Х0 = -120 000 м;
Х01 Х02 Х03 Х04 Х05 Х06
Но, м....................... 15000 16000 17000 18000 19000 20000
Результаты реализации АМС МПУ приведены на рис. 4 и 5. Значения времени полета T и оптимальных скорости подхода VTH, угла подхода вТН и промаха AX для каждого варианта начальных
условий (X0 = 120 000 м) приведены ниже:
Н0,м.................. 15000 16000 17000 18000 19000 20000
T, с.................... 379,13 406,28 333,23 323,69 373,85 411,03
Vth, м/с............... 268,80 291,78 321,02 321,02 305,83 284,74
#тн, град.............. -74,19 -88,00 -88,97 -86,59 -88,40 -87,02
ДХ, м................. 3,83е+01 3,36е-01 2,30е-02 3,47е+00 5,25е-01 1,78е+00
Рис. 4. Результаты реализации АМС МПУ в виде зависимостей скорости (а), аэродинамических коэффициентов (б, в), перегрузки (г) и угла (д) от времени и зависимость высоты от дальности (е)
Я- ю4, м
2,5 МО ПУТ 2
2,0 1,5 \/
1,0 3 2 1 МО ПУТ 1
0,5
0 | 1 1 1 1 1
-12
-10
-4
-2 х-104
Рис.5. Траектории полета при Hq = 15000 (1), 16 000 (2), 17000 (3), 18 000 (4), 19 000 (5) и 20 000 м (6)
Согласно изложенному выше, полученное МПУ (46) формирует траектории противокорабельной ракеты, которые отслеживают свойства многокритериально оптимальных программных траекторий (см. рис. 5) и обеспечивают оптимальные значения критериев на множестве начальных условий при высоте 15 000 < Н0 < 20 000 км. Поэтому на
основе аналитического выражения МПУ (46) по перегрузке Ny противокорабельной ракеты реализуется эффективный нелинейный многокритериально оптимальный метод наведения ракеты на цель, находящуюся в ТН.
ЛИТЕРАТУРА
1. Воронов ^^Многокритериальный синтез позиционного управления на основе многопрограммной стабилизации. Ч. 1 // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2012. № 2. С. 3-19.
2. Воронов Е.М.Многокритериальный синтез позиционного управления на основе многопрограммной стабилизации. Ч. 2 // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2012. № 3. С. 3-11.
3. Зубов В.Н.Синтез многопрограммных устойчивых управлений // ДАН СССР. 1991. Т. 318. № 2. С. 274-277.
4. Смирнов Н.В. Задачи многопрограммной стабилизации в различных классах динамических систем // Труды Средневолжского мат. общ. 2005. Т. 7. № 1. C. 192-201.
5. Смирнов Н.В. Многопрограммная стабилизация линейных и билинейных систем в случае неполной обратной связи // Изв. РАН. ТиСУ. 2001. № 3. C. 40-44.
6. Соловьева И.В. Синтез многопрограммных систем управления на основе метода позиционной оптимизации: автореф. дис.... канд. физ.-мат. наук. СПб.: Гос. университет, 2010. 15 с.
7. Смирнов Н.В., Соловьева И.В. Применение метода позиционной оптимизации для многопрограммной стабилизации билинейных систем // Вестник С.-Петербург. университета. Сер. 10. Прикладная математика, информатика, процессы управления. 2009. Вып. 3. С. 253-261.
8. Николис Г., Пригожин И.Познание сложного. Введение. М.: УРСС, 2003. 344 с.
9. Колесников А.А. Синергетические методы управления сложными системами: Теория системного синтеза. М.: КомКнига, 2006. 240 с.
10. Синергетические методы управления сложными системами: Механические и электромеханические системы / А.А. Колесников, Г.Е. Веселов, А.Н. Попов и др.; под ред. А.А. Колесникова. М.: КомКнига, 2008. 304 с.
11. Воронов Е.М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных решений / под ред. К.А. Пупкова, Н.Д. Егупова. М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. 576 с.
12. Серов В.А., Хитрин В.В. Комбинированный эволюционный алгоритм многокритериальной оптимизации программного режима биотехнологического процесса // Промышленные АСУ и контроллеры. 2010. № 8. С. 13-16.
13. Серов В.А. , Хитрин В.В. Эволюционная вычислительная технология многокритериальной оптимизации управления динамическими системами // Труды Института системного анализа РАН. Динамика неоднородных систем / под ред. Ю.С. Попкова. М.: КомКнига, 2008. Вып. 32 (3). С. 61-71.
14. Серов В.А. Генетические алгоритмы оптимизации управления многокритериальными системами в условиях неопределенности на основе конфликтных равновесий // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2007. № 4 (69). С. 70-80.
REFERENCES
[1] Voronov E.M. Multi-criterial synthesis of positioning control based on the multi-program stabilization. Part 1. Vestn. Mosk. Gos. Tekh. Univ. im. N.E. Baumana, Priborostr. [Herald of the Bauman Moscow State Tech. Univ., Instrum. Eng.], 2012, no. 2, pp. 3-19 (in Russ.).
[2] Voronov E.M. Multi-criterial synthesis of positioning control based on the multi-program stabilization. Part 2. Vestn. Mosk. Gos. Tekh. Univ. im. N.E. Baumana, Priborostr. [Herald of the Bauman Moscow State Tech. Univ., Instrum. Eng.], 2012, no. 3, pp. 3-11 (in Russ.).
[3] Zubov V.N. Synthesis of multi-program stable controls. Dokl. Akad. Nauk SSSR [Proc. Acad. Sci. USSR], 1991, vol. 318, no. 2, pp. 274-277 (in Russ.).
[4] Smirnov N.V. Problems of multi-program stabilization in different types of dynamic systems. Tr. Srednevolzhskogo mat. obshch. [Proc. Srednevolzhskoye Math. Soc.], 2005, vol. 7, no. 1, pp. 192-201 (in Russ.).
[5] Smirnov N.V. Multi-program stabilization of linear and bilinear systems in case of incomplete feedback. Izv. Rossiyskoy akademii nauk. Teoriya i sistemy upravleniya [Bulletin RAS. J. Comp. Systems Sc. Int.], 2001, no. 3, pp. 40-44 (in Russ.).
[6] Solov'eva I.V. Sintez mnogoprogrammnykh sistem upravleniya na osnove metoda pozitsionnoy optimizatsii. Avtoreferat diss. kand. fiz.-mat. nauk [Synthesis of multi-program control systems on the basis of positioning optimization method. Cand. phys.-math. sci. diss. abstr.]. SPb., SPbGU, 2010. 15 p.
[7] Smirnov N.V., Solov'eva I.V. Application of positioning optimization method for multi-program stabilization of bilinear systems. Vestn. S.-Peterb. Un., Ser. 10: Prikladnaya mat., inform., protsessy upravleniya [Vestn. S.-Peterb. Univ., Ser. 10: Appl. Math., Comp., Sc., Contr. Processes.], 2009, iss. 3, pp. 253-261 (in Russ.).
[8] Nikolis G., Prigozhin I. Exploring Complexity. Introduction. ("Synergetics from past to the future"). 3rd ed. New York, W.H. Freeman and Co, 2012. (Russ. Ed.: Nikolis G., Prigozhin I. Poznanie slozhnogo. Vvedenie. Moscow, URSS Publ., 2003. 344 p.).
[9] Kolesnikov A.A. Sinergeticheskie metody upravleniya slozhnymi sistemami: Teoriya sistemnogo sinteza [Synergetic control methods of complex systems: System synthesis theory]. Moscow, KomKniga Publ., 2006. 240 p.
[10] Kolesnikov A.A., Veselov G.E., Popov A.N. Sinergeticheskie metody upravleniya slozhnymi sistemami: Mekhanicheskie i elektromekhanicheskie sistemy [Synergetic control methods of complex systems: mechanical and electromechanical systems]. Moscow, KomKniga Publ., 2008. 304 p.
[11] Voronov E.M., Pupkov K.A., Egupov N.D. Metody optimizatsii upravleniya mnogoob'ektnymi mnogokriterial'nymi sistemami na osnove stabil'no-effektivnykh resheniy [Control optimization methods of multicriterial multiobjective system control based on the stably efficient compromises]. Moscow, MGTU im. N.E. Baumana, 2001. 576 p.
[12] Serov V.A., Khitrin V.V. Integrated evolutionary algorithm of multi-criterial optimization of biotechnological process program mode. Promyshlennye ASU i kontrollery [Ind. automatic-control system and controllers], 2010, no. 8, pp. 13-16 (in Russ.).
[13] Serov V.A., Khitrin V.V., Popkov Yu.S. Evolutionary computational technology of multi-criterial optimization of dynamical systems control. Tr. Inst. Sistemnogo Analiza RAN. Dinamika neodnorodnykh system [Proc. Inst. Systems Analysis RAS. Dynamics of heterogeneous systems], Moscow, KomKniga Publ., 2008, iss. 32 (3), pp. 61-71 (in Russ.).
[14] Serov V.A. Genetic algorithms of optimization of multi-criterial systems control under conditions of uncertainty based on the conflict equilibrium states. Vestn. Mosk. Gos. Tekh. Univ. im. N.E. Baumana, Priborostr. [Herald of the Bauman Moscow State Tech. Univ., Instrum. Eng.], 2007, no. 4, pp. 70-80 (in Russ.).
Статья поступила в редакцию 25.02.2014
Евгений Михайлович Воронов — д-р техн. наук, профессор кафедры "Системы автоматического управления" МГТУ им. Н.Э. Баумана. Автор более 200 научных работ в области теории управления и ее приложений.
МГТУ им. Н.Э. Баумана, Российская Федерация, 105005, Москва, 2-я Бауманская ул., д. 5.
E.M. Voronov — Dr. Sci. (Eng.), professor of "Automatic Control Systems" department of the Bauman Moscow State Technical University. Author of more than 200 publications in the field of control theory and its applications, control systems. Bauman Moscow State Technical University, Vtoraya Baumanskaya ul. 5, Moscow, 105005 Russian Federation.
Владимир Александрович Серов — канд. техн. наук, доцент кафедры "Управление и моделирование систем" Московского государственного университета приборостроения и информатики. Автор более 100 научных работ в области теории многокритериальной оптимизации и принятия решений в условиях конфликта и неопределенности.
Московский государственный университет приборостроения и информатики, Российская Федерация, 115093, Москва, 1-й Щипковский пер., д. 23.
V.A. Serov — Cand. Sci. (Eng.), assoc. professor of "Control and Simulation of Systems" department of the Moscow State University of Instrument Engineering and Informatics. Author of more than 100 publications in the field of theory of multi-criteria optimization and decision making under conditions of conflict and uncertainty. Moscow State University of Instrument Engineering and Informatics, Pervyi Shchipkovskiy per. 23, Moscow, 115093 Russian Federation.
Иван Александрович Спокойный — студент кафедры "Системы автоматического управления" МГТУ им. Н.Э. Баумана. Автор двух научных работ в области исследования технических систем.
МГТУ им. Н.Э. Баумана, Российская Федерация, 105005, Москва, 2-я Бауманская ул., д. 5.
I.A. Spokoinyi — student of "Automatic Control Systems" department of the Bauman Moscow State Technical University. Author of two publications in the field of investigation of technical systems.
Bauman Moscow State Technical University, Vtoraya Baumanskaya ul. 5, Moscow, 105005 Russian Federation.