УДК 681.51
Е. М. Воронов, А. А. Карпунин
АЛГОРИТМ ОЦЕНКИ ГРАНИЦ ОБЛАСТИ ДОСТИЖИМОСТИ ЛЕТАТЕЛЬНОГО АППАРАТА С УЧЕТОМ ТЯГИ
Рассмотрена задача оценки области достижимости летательного аппарата в трехмерном пространстве. Параметризовано описание границ области достижимости, при этом параметрами являются угол крена летательного аппарата, положение точки переключения знака тангенциальной перегрузки (тяги) на временном интервале, а также положение точки выключения/переключения нормальной перегрузки. На основе параметризации управления летательного аппарата получен алгоритм вычисления границ пространственной области достижимости и управлений летательного аппарата.
Результатом решения задачи классической теории оптимального управления является оптимальная траектория движения исследуемого объекта. Введение в рассмотрение ансамбля траекторий, областей неопределенности, управляемости, достижимости и других обобщений позволяет существенно расширить возможности анализа задач управления. В настоящей работе исследовано расширение анализа в классе задач управления на основе областей достижимости (ОД). Для динамических объектов типа летательного аппарата (ЛА) знание динамики развития ОД [1, 2] позволяет оценивать возможную область действия ЛА, его маневренность, а также области возможного взаимодействия ЛА. Динамика ОД может быть описана динамикой ее границ. Однако расчет структур управлений, приводящих на границу ОД и формирующих таким образом ее облик, представляет собой весьма сложную задачу оптимального управления, особенно для нелинейных математических моделей больших размерностей. В настоящей работе приведен алгоритм формирования ОД для системы нелинейных дифференциальных уравнений, описывающей динамику ЛА.
Приведение математической модели ЛА к компактной форме на основе суб-(супер-)достижимости (или энерговооруженности) и специальных систем координат. Как известно (например, [2, с. 263]), движение центра масс ЛА в нормальной земной системе координат (СК) OXYZ описывается следующей системой нелинейных дифференциальных уравнений:
V = д(пт — sin в);
в = g/v (n cos Ye — cos в); ф = — gn sin Ye/ „
ф /V cose; (1)
X = V cos в cos Ф;
Y = V sine; Z = — V cos в sin Ф,
где пт и n — тангенциальная и нормальная перегрузки; yс — скоростной угол крена; g — ускорение свободного падения.
Вектор управления ЛА принимает вид
uT = (n, n, Yc) ; jПтj < nm; jnj < nm; jYcj < n
где т — индекс располагаемой перегрузки.
При достаточной энерговооруженности ЛА, когда массой ЛА по сравнению с силой тяги и аэродинамической силой можно пренебречь, а также в альтернативном варианте в соответствии с условиями суб-(супер-)дости-жимости [2, с. 271] система (1) принимает вид
V = gnT;
0 = (%) cos Yc;
^ = - (% cos 0 n sin Yc; XX = V cos 0 cos Ф;
Y = V sin ©; Z = -V cos 0 sin Ф,
где условия суб-(супер-)достижимости представляются как
|nT| ^ пт(пт); | n | ^ (n);
(2)
nT = nm - 1; nT = nm + 1; n = nm - 1; n = nm + 1.
(3)
Введение неподвижных СК ОоХоУ^о, ОоХУ^Zv, полускоростной тра-екторной СК О1ХУкZfe, специальной траекторной 01ХскУс^ск, где О1 — центр масс ЛА [2, с. 262-263, с. 272-273] позволяет задать координаты целевой точки О' на заданном направлении V в двумерном пространстве (рис. 1).
Координаты целевой точки О' в СК ОоХУ^Zv имеют вид [2, с. 273]
(4)
где , , Vz) — координаты целевой точки О' в СК 0оХоУс^о.
Окончательно описать движение центра масс ЛА и управляющие силы в неподвижной земной СК ОоХУ^Zv с учетом специальной траекторной СК
"X¿" vx
Yq' = (vi + v| )1/2
.Z¿ _ О
OiX^Y^^ имеют вид [2, с. 272-273]
Vv = gnT:
©V = (%vJ ncosYcK:
ФV = - (g/Vv cos ©v) n sin Yck: Xv = vv cos e v c0s ív ;
Yv = Vv sin ©v;
Zv = —Vv cos ©v sin ív, где управление ЛА в СК O0Xv Yv Zv имеет вид
т / N Vz
U = (nT, n, Yck) ; Yc = Yck + Yv; Yv = arctg-.
VY
Тогда вектор управления в СК OXYZ или O0X0Y0Z0 можно представить в виде
пт пт 0
u = n = n + 0
Ye . Y^ _ . Yv _
; |Пт| ^ Пт (Пт); |n| ^ n (n) ;
(6)
Пт — n^ 1;
пт = n^ + 1; n = nm — 1; n = nm + 1.
Общая характеристика способа оценки области достижимости.
Область достижимости G(to,T) в момент времени T из начальной точки xg (to) и начального момента to определяется как множество значений вектора координат Yg(T) в момент времени T, полученных при всевозможных допустимых управлениях u(t) € U(to ^ t ^ T) и начальном условии Хд(to). Очевидно, что динамика ОД может быть описана динамикой ее границ. Если движение исследуемого объекта описывается линейной системой уравнений, то существуют относительно простые способы построения границы ОД с использованием функций перехода. Эта методика существенно использует выпуклость ОД линейных систем [1]. Для нелинейных систем свойство выпуклости ОД в общем случае не имеет места. Поэтому для них задача определения границ ОД или приводящих на границу ОД граничных управлений может быть сформулирована в следующем виде. Необходимо в пространстве координат ОдХдYg Zg выбрать направление v, например задав прямую, проходящую через начальное положение центра масс ЛА Oo и некоторую другую точку О' этого пространства (рис. 2), и решить две отдельные задачи:
1) найти управление, максимизирующее расстояние R2(T), пройденное объектом за фиксированное время T в направлении v;
2) найти управление, минимизирующее расстояние R2(T), пройденное объектом за фиксированное время T в направлении v.
Варьируя направление v в пространстве координат и каждый раз решая эти две поставленные задачи, можно сделать поточечную оценку ОД для фиксированного времени T (рис. 3).
При решении обеих задач желательно выявить структурные свойства оптимального в смысле общих критериев (max R2(T) и min R2(T)) управления, не зависящие от конкретного направления v и времени T. Знание структуры граничного управления существенно упрощает определение гра-
Рис. 2. К задаче достижения экстремума расстояния в направлении V за фиксированное время Т
Рис. 3. Поточечная оценка области достижимости
ниц ОД в фиксированный момент времени Т. Отметим, что решению задачи минимизации Л2 (Т) соответствует управление со структурными свойствами предельного быстродействия [2], а решению задачи максимизации Л2(Т) — в общем случае некоторая другая структура управления (например, в виде особого управления по Габасову-Кирилловой [3]), которую также необходимо определить.
Рассмотрим кратко вопрос существования оптимальных управлений в рамках данных задач.
В общем случае существуют такие направления V®, vm+1 (см. рис. 3), для которых вообще не найдется никаких управлений, удовлетворяющих краевым условиям за фиксированное время Т. Также возможна ситуация, когда существует единственное допустимое управление, обеспечивающее
попадание в ОД. В этом случае оно является решением для обеих задач (см. рис. 3; vi, vm). Наконец, существуют такие направления (от v2 до vm-1), для которых допустимое управление не единственное. Тогда существуют несовпадающие решения каждой из поставленных задач.
В работе [2] приведено решение задачи управления, доставляющего экстремум расстояния, пройденного в направлении v, получен вид оптимального управления u0(t) на интервале управляемого движения [t', T] (t' ^ to) на основе гипотезы о постоянстве скорости (пт = 0 ^ F = 0 ^ V = const) объекта (например, если ЛА — ракета), описываемого динамикой (5), в прогнозируемом времени т на программном такте программно-корректируемого закона управления (ПКЗУ) [t',T], где т = T - t', т.е. V*(T) = Vi(t/), применяемого на интервале [t', t ], где [t'', T] — следующий программный такт ПКЗУ с V (T) = Vi(t'').
Решим задачу оптимизации управления, доставляющего экстремум расстояния, пройденного в направлении v объектом, динамика которой описывается системой нелинейных дифференциальных уравнений (5), при переменной скорости, т.е. с учетом тяги ЛА — самолета.
Задача оптимизации R2(T) = X + Yv2. Далее для упрощения записи все индексы опущены. Критерий минимизации (максимизации) расстояния R2(T) в заданном направлении v имеет вид
J = min (X2(T)+ Y2(T)) (или J = max (X2(T)+ Y2(T))). (7)
Начальные условия при t0 = 0 в выбранной СК O0Xv YvZv следующие:
X(0) = Y(0) = Z(0) = 0(0) = Ф(0) = 0, V(0) = V^- (8)
Конечные условия на подвижном правом конце траектории при = T в соответствии с уравнением (5) и рис. 1 следующие:
Fi = X(T) - CY(T) = 0, (9)
vx
где C =
(4 + 4)1/2
F = Z (T) = 0; (10)
V (T )= var; 0(T )= var; Ф(Т )= var. (11)
Запишем гамильтониан системы (5):
H = ФхVcos0cosФ + ФуVsin0 - Ф^Vcos0si^+ +ФVgnT + Фе (g/v) n cos 7ск - Фф (g/v cos 0 n sin 7.
(12)
Необходимо отметить, что гамильтониан (12) линеен относительно управления.
В соответствии с методологией принципа максимума Понтрягина [4] сопряженная система принимает вид
dH
ФV = — dH = —ФХ cos в cos Ф — фу sin в + Ф^ cos в sin Ф+ dV
т ng cos y T ng sin y + Фе — Фф- '
V2 ф V2 cos ©:
• dH • dH • dH
Фх = —dX = 0; ^ = — dY = 0; ^ = —aZ = 0;
дн
Фe = — дн = ФХ v sin © cos Ф — íY V cos ©— д ©
т T^ . ^ . т т ng sin y sin© — ízV sin © sin Ф + Фф —' ;
V cos2 ©
dH
Фф = — -— = Фх V cos©siní + íZ V cos © cos Ф. дФ
Окончательно для определения ближней и дальней границ области достижимости (суб-(супер-)достижимости) в направлении v сформирована система соотношений (3)-(6) и условий (8)-(13).
Замечание 1. Проведение исследований для энерговооруженных ЛА приводит к замене в соотношении (3) пт (Пт) и n (n) на n^ и nm соответственно.
Замечание 2. При учете силы тяжести ЛА переход к СК O0Xv Yv Zv не дает описания, подобного системе уравнений (1), так как учет силы тяжести формирует вторые слагаемые правых частей первых двух уравнений системы (1) только на основе связи полускоростной СК OiXk YkZk и неподвижной СК OXYZ (или подвижной СК O1XYZ, см. [2, с. 262]). При переходе к связи траекторной СК OiX^Y^Z^ и неподвижной СК O0XvYvZv вторые слагаемые первых двух уравнений (1) изменят вид.
В соответствии с работой [4, гл. 1, § 6] общее условие трансверсальности для задачи с подвижным концом имеет вид
(Ф ■ A)|Í=T = 0,
где Л — вектор касательной гиперплоскости к некоторому гладкому многообразию, которое образовано пересечением гиперповерхностей, составляющих условия подвижного конца.
В данной задаче вектор Л имеет вид
Л = (Ах, ay, aZ, Ae, аф, Ay).
В общем случае рассматривается пересечение трех гиперплоскостей в пространстве (X, Y, Z), определяющих принадлежность точек вектора
x(T) = (X(T), Y(T), Z(T), ©(T), Ф(Т), V(T))
на правом конце при t = T в пространстве
/i = X 2(T) + Y 2(T) — J0 = 0;
/2 = Fi = X (T) — CY (T) = 0;
/a = F = Z (T) = 0,
где J0 = opt (X2(T)+ Y2(T)); С — заданная величина; ©(T) = var,
u
Ф^) = var, V (T) = var — свободные переменные.
Замечание 3. Исследование условий трансверсальности в задаче с подвижным правым концом траектории при t = T и переменной скорости ЛА приводит к следующему результату:
Ф(Г) = (Фх (T), Фу(T), Ф^(T), Фу (T), Ф©(Т), Фф (T)) =
= (Сх, Су, cz, 0, 0, 0), (14) где Сх, Су, cz — фиксированные неизвестные величины.
Замечание 4. В ходе решения задачи поиска экстремума R2(T) было выявлено, что функция Гамильтона линейно зависит от управления, что свидетельствует о возможности существования особого управления. Это особое управление, претендующее на оптимальность, имеет вид
П0соб (т) = 0, т € [t*,T] , (15)
где t* — момент выключения управления.
Анализ структурных свойств оптимального управления ит = = (пт, n, y) на ближней, дальней и боковой границах ОД в направлении
v. Общая структура пт, n, y и ход решения задачи оптимизации.
В соответствии с принципом максимума и результатами [2, с. 275] максимум (минимум при максимизации показателя J) H достигается при
n0 = +(-)< sign (дФу (t)) = +(-)< sign (Фу (t)); (16)
о w . ( /Ф© cos y Фф sin y\\
n = +(-)n sig4g — V^os^;), (17)
где знак + соответствует задаче максимизации H, знак — соответствует задаче минимизации H. Взяв соотношения (17) при V(t) > 0 имеем
n° = +(-)n' sign (Vg (Ф© COS Y - ^¿JOs^l2) )
= +(—)n' sign ( Ф© cos y —
Фф sin y cos 0
Аналогично [2, с. 275] из условия dH
dY
Yo
= n —Ф© sin y —
Фф cos y cos 0
= 0
Yo
при n = 0 следует
tg Yc0K = —
Фф
Ф© cos 0 '
тогда
Y0 = — arctg
Фф A VZ
--TT + arctg —.
Ф© cos 0 Vy
(18)
(19)
(20)
(21)
Следует отметить, что для достижения максимума гамильтониана по пе ременной 7 необходимо равенство нулю выражения (19) и достаточно вы полнения условия
д2Н
dY2
< 0.
(22)
o
Y
Исследуем знак неравенства (22) подобно тому, как это сделано в работе [2, с. 276]:
д2H ( Фед cos y0 Фф# sin y0
dY2
=n
V
+
V cos в
< 0
или
n
/^eg cos y0 Ф^ sin y
V
V cos в
> 0.
(23)
При условии, что перегрузка п принимает оптимальное значение в соответствии с формулой (17), условие (23) принимает вид
, . , >eg cos y0 n sign 1
V
Ф^ sin y0 V cose
Ф^ cos y0 Ф^ sin y0
V
V cos в
> 0 (24)
или
n
Ф^ cos y0 Ф^ sin y0
V
V cos в
> 0.
Поскольку п' > 0, то достаточное условие (22) в виде (24) справедливо всегда, если выполняется условие (17). Поэтому формулы (17) и (21) определяют оптимальные значения параметров управления п0 и 70 всегда, кроме отдельных моментов времени, оговоренных далее и называемых моментами переключения, когда п0 терпит разрыв первого рода. В случае если такой момент времени является началом участка особого управления (далее будет показано, что п°соб = 0), то 7 может быть любым, допустимым в соответствии с формулой (19).
Оптимальное значение параметра 70 в явном виде не зависит от параметра управления п0, а п0 явно зависит от текущего значения крена, поэтому сначала необходимо определить, какой конкретно вид имеет оптимальная программа изменения угла крена 7.
Предположим, что осуществляется "плоское" движение с креном
7 = 7(*) = 0, (25)
тогда система (5) упрощается, поскольку
Фф = 0 ^ Фф = const = Ф(0) = Ф(Г) = 0, что, в свою очередь, ведет к соотношению
(26)
Z(t) = 0 ^ Z(t) = const = Z(0) = Z(T) = 0.
При этом удовлетворено конечное условие (10).
Следующее преобразование уравнения для Фф из (13) с учетом системы уравнений (5) дает
Ф ф = cx Z + cZ XX. (27)
Учитывая выражение (26), уравнение (27) принимает вид
Ф ф = cZ XX. (28)
Далее следует ответить на вопрос, может ли быть осуществлено плоское движение (25) в классе экстремалей Понтрягина, определяемых уравне-
0
Y
0
X
X
нием (20). Очевидно, что если обеспечить условие
Фф(Ь°) = ФФ(Т) = 0,
то ответ на вопрос будет положительным.
Для момента времени Ь = Т справедливо условие
Ф©(Т) = Фф(Г) = 0.
Поэтому ясно, для выполнения соотношения (29) необходимо и достаточно, чтобы
Ф = 0.
Это вполне можно обеспечить, если принять
Ф^ (T) = Ф^ (t) = Ф^ (to) = Cz = 0. (30)
Кроме того, если выполняется условие (25), то формула (18) приобретает вид
n0 = n' sign ^ = n' sign (Ф©) •
Таким образом, движение с параметрами управления
n° = n sign (Фу);
n0 = n' sign (Ф©); (31)
Y 0(t) = 0
является экстремалью Понтрягина.
В соответствии с уравнением (6) экстремальное управление в исходной системе (2) будет иметь вид
u0 =
- nT ■ - nT ■ 0 " n^ sign (Фу )
n0 = n0 + 0 = n' sign (Ф©)
-Y0- Y0 . Yv _ arctg
(32)
Для системы (2) всегда существует множество направлений V, для каждого из которых условия и ^2, накладываемые на правый конец траектории, могут быть удовлетворены только при помощи единственного управления
u0 =
±ni, ±n', arctg — vy
являющегося частным случаем управления (32). Для каждого из множества таких направлений плоское движение (31) является единственной экстремалью. Из единственности экстремали следует ее оптимальность. Отсюда можно сделать вывод об оптимальности движения в плоскости.
Теперь необходимо определить оптимальное управление перегрузкой п° и тягой п° при движении с креном 7°(Ь) = 0 в плоскости X ОУ^ с учетом краевых условий (8), (14).
Исследование плоского движения ЛА с учетом тяги. С учетом формул (25), (29) и (30) исходная система (2) принимает вид
i
V = gnT;
© = (%) n;
' (33)
XX = v cos ©;
^ У = Vsin©. Вектор управления представляется как
u = [nT, n]T, |nT| ^ nT, |n| ^ n'. (34)
Критерий минимизации (максимизации) расстояния R2(T) в заданном направлении v остается неизменным и имеет вид (7). Начальные условия системы (33):
to = 0, X(0) = Y(0) = ©(0) = 0, V(0) = Vo. (35)
Конечные условия системы (33):
tfc = T = const, Fi = X(T) - CY(T) = 0,
©(T) = var, V(T) = var.
Система (33) с вектором управления в виде (34), начальными условиями (35) и конечными условиями (36) эквивалентна системе, рассмотренной в работе [5], где были получены структуры оптимальных управлений u0 = [n°, n0], с той лишь разницей, что в работе [5] решалась задача перевода системы (33), (34) в начало координат из произвольной точки на плоскости XOY.
В частном случае, когда nT = 0 скорость ЛА становится постоянной V(t) = V(0) = const, система (33) упрощается и принимает вид:
© = (g/V) n;
XX = Vcos©; V = const; u = n < |nm| ; (37)
Y = V sin©.
Система имеет аналитическое решение. Структуры оптимального управления и вид ОД системы (37) найдены в работе [2].
Система (33), (34) может быть представлена в виде
' XX = Vcos©;
Y = V sin©;
(38)
©= (%) nmui;
V = gnmu2,
где
nmu1 = n, n>2 = nT, us = [ui, u2]T, |u11 ^ 1, |u2| ^ 1, (39)
при этом управление нормировано.
Как известно, например из работы [6, гл. 9], решение краевой задачи со структурами uT = (nT, n, 7) в форме (15), (17), (20) методами прогонки позволяет найти векторы
Xopt(t) = (Xo(t), Yo(t), Zo(t), Vo(t), ©o(t), ío(t));
^opt(t) = (íxopt(t), Фу opt (t), ф^ opt(t), Фу opt(t), ^eopt(t), Ффopt(t))
и, следовательно, определить
uj.pt (Ь) = (Пторг(Ь), Порг(Ь), 7о^(Ь)) ,
обеспечивающее попадание на ближнюю и дальнюю границы ОД в направлении V.
В работе [5] приведено важное свойство системы (38), (39), свидетельствующее о существовании в задаче оптимизации особого участка управления, равного нулю (пособ = 0). Учитывая этот факт и замечание 4, приходим к выводу, что задача максимизации расстояния системы (33)—(36) в направлении V имеет особый участок управления.
Решение краевой задачи (34)-(36), (38), (39) методом прогонки позволило выявить следующие структуры управлений, приводящих на границы ОД.
Структура управления, приводящего на дальнюю границу ОД, имеет вид
U0 =
«1 = ±1 «2 = 1
ie[o,i-j
U
u1 = 0 «2 = 1
(40)
i€[i-,T]
где Ь — время перехода на особый участок управления пособ = 0.
Структура управления, приводящего на ближнюю границу ОД, имеет вид
u =
«1 = т1 «2 = -1
te[o, t+]
U
«1 = ±1 «2 = -1
ie[i+,T]
(41)
где — момент времени переключения знака управления нормальной перегрузкой.
Структура управления, приводящего на боковую границу ОД, имеет вид
ибок
«1 = ±1 «2 = -1
te[o, t+]
U
«1 = ±1 «2 = 1
te[i+,T]
(42)
где — момент времени переключения знака управления тягой.
Структуры оптимальных управлений объекта, описываемого динамикой
(38) с начальными условиями (35) при наличии ограничений на управление
(39), приводящие на границы ОД, изображены на рис. 4.
Рис. 4. Структуры оптимальных управлений
Анализ структуры оптимального управления на ближней, дальней и боковой границах ОД в направлении v. Исследование свойств ОД для системы (33)-(36) позволяет сформировать следующие утверждения.
Утверждение 1. ОД системы, описываемой динамикой (33)-(36), симметрична относительно оси OX.
Утверждение 2. Траектории движения системы на интервале времени [ti, t2] при постоянстве управляющей функции u = [пт, п]т представляют собой логарифмические спирали, причем имеется две различных траектории, соответствующие движению с максимальными по модулю управлениями. Управление в виде [+пГ; n' sign(n)]x соответствует траектории разгона, а в виде [—n^; n' sign(n)f — траектории торможения.
Утверждение 3. В отличие от системы, описываемой динамикой (37), ОД которой имеет только две границы: дальнюю, соответствующую задаче максимизации расстояния в направлении v, и ближнюю, соответствующую задаче минимизации [2, гл. 7], ОД для системы (33)—(36) имеет три границы: дальнюю, ближнюю и боковую.
Боковая граница возникает вследствие того, что дальняя и ближняя границы не имеют общих точек, и образуется при движении объекта в течение некоторого времени с максимальной перегрузкой по траектории торможения с последующим движением с максимальной перегрузкой по траектории разгона.
Для получения ОД системы (33)-(36) введем в рассмотрение угол у направления v, получаемого при задании конечных условий X (T), Y(T). Для этого используем условие подвижного правого конца (9). Тогда
X (T) R cos у
C = Y(T) = RSny = ctg у
где у — угол между осью OX и направлением v.
Задача максимизации расстояния в направлении v приводит на дальнюю границу ОД, если направление v лежит в диапазоне углов
г - -1 - + X (T, Us = [ui = 1, U2 = 1]т) (43
у € у] , у = arcctg ——-:----j^-, (43)
Y (T, Us = [ui = 1, U2 = 1] )
где управление us = [u1 = 1, u2 = 1]т соответствует траектории разгона с максимальной нормальной перегрузкой. Управления, приводящие на данную границу ОД, описываются уравнением (40).
Если направление v превышает величину у, то задача максимизации расстояния в направлении v приводит на боковую границу ОД при выполнении условия
у € [-у -у] U у у] ,
где у — максимальное значение угла у, получаемое при построении боковой границы ОД. Направления v, характеризуемые значениями углов у и -у, имеют смысл направлений v1 и vm, представленных на рис.3. Процедура получения у приведена далее. Управления, приводящие на данную границу ОД, описываются уравнением (42).
Задача минимизации расстояния в направлении v приводит на ближнюю границу ОД, если направление v лежит в диапазоне углов
г Л . X (T, Us = [ui = 1,U2 = -1]т)
у € [-у, у] , у = arcctg —(T--[--,--U-, (44)
Y (T, Us = [ui = 1, U2 = -1] )
где управление us = [ui = 1, U2 = — 1]т соответствует траектории торможе-
ния с максимальной нормальной перегрузкой. Управления, приводящие на данную границу ОД, описываются уравнением (41).
Задача минимизации расстояния в направлении v приводит на боковую границу ОД, если направление v лежит в диапазоне углов
р € [-р, -р] U [р, р] .
Управления, приводящие на данную границу ОД, описываются уравнением (42).
Таким образом, боковую границу ОД составляют траектории, определяемые управлениями (42), причем часть боковой границы является решением задачи максимизации расстояния в направлении v, а другая часть — решением задачи минимизации расстояния в направлении v. Данные части боковой границы имеют в каждой из полуплоскостей: П (XOY, Y ^ 0) и П2 (XOY, Y ^ 0) — по одной общей точке, соответствующей решению задачи поиска экстремума в направлении V, определяемом углами ±р.
Необходимо отметить, если угол р' направления v' не принадлежит диапазону углов (р' € [—р; р\), то на заданном интервале времени задача поиска экстремума в этом направлении не будет иметь решения.
Поскольку ОД объекта, описываемого динамикой (33)—(36), симметрична относительно оси OX (см. утверждение 1), то достаточно рассмотреть построение ОД только в одной из полуплоскостей: П1 (XOY, Y ^ 0) или Я2 (XOY, Y < 0).
При рассмотрении задачи построения ОД в положительной полуплоскости П1 (XOY, Y ^ 0) (вторая половина ОД получится отображением полученной области относительно оси OX) можно выделить три основные составляющие задачи: получение значения предельного направления v в задаче поиска экстремума пройденного расстояния; поточечная оценка границ ОД системы; поиск управления, доставляющего экстремум расстояния, пройденного объектом в выбранном направлении v. Сформированы структуры алгоритмов решения каждой из указанных задач.
Алгоритм получения приближенного значения предельного направления v в задаче поиска экстремума пройденного расстояния имеет следующую структуру.
1. Задание интервала времени T, на котором решается задача поиска экстремума расстояния.
2. Формирование равномерной сети густоты m по времени t+ смены знака тяги nx(t) с минуса на плюс при постоянстве знака нормальной перегрузки n(t) = const.
__T
3. Для каждого узла сети tj = At+i, i = 0,m, tj € [0, T], At+ = —,
выполняется построение точки (X,, Y) принадлежащей участку боковой границы ОД. Структура управления описывается выражением (42). Определение угла 0i направления v,, соответствующего каждой полученной точке,
X,
рг = arcctg —. (45)
Yi
4. Среди найденных направлений vi проводится поиск максимального значения р = max (р,), i = 0,m.
5. Вывод значения р и соответствующего ему времени смены знака управления.
Алгоритм поточечной оценки границ ОД системы, описываемой динамикой (33)—(36), состоит из следующих этапов.
Для каждого узла сети t+ = At+i, i = 0, li, t+ € [0, T], At+ = —, выполня-
1. Определение времени T, для которого строится граница ОД.
2. Формирование равномерной сети густоты l по времени t- перехода на особый участок управления нормальной перегрузкой пособ = 0. Для
_ _ _ _ _ T
каждого узла сети = At i, i = 0,l, t» € [0, T], At = у, выполняется построение точки (X», Y), принадлежащей участку дальней границы ОД. Структура управления определяется выражением (40). Запись точки (X», Y) во множество граничных точек G. Запись соответствующего управления во множество возможных управлений U.
3. Формирование равномерной сети густоты m по времени t+ смены знака тяги nx(t) с минуса на плюс при постоянстве знака нормальной перегрузки n(t) = const. Для каждого узла сети t+ =
__T
= At+i, i = 0 , m, t+ € [0, T], At+ — —, выполняется построение точки
(Xj, Yj), принадлежащей участку боковой границы ОД. Структура управления описывается выражением (42). Запись точки (Xj, Y) во множество граничных точек G. Запись соответствующего управления во множество возможных управлений U.
4. Формирование равномерной сети густоты li по времени t+ смены знака управления нормальной перегрузкой n(t) со знака минус на знак плюс.
__T
++ - л++о о" — п 7_ ++ [0, T] At+ = -
li
ется построение точки (Xj, Yj), принадлежащей участку ближней границы ОД. Структура управления определяется выражением (41). Определение угла у» направления v» по формуле (45). Запись точки (Xj, Yj) во множество граничных точек G при условии у» ^ 0. Данное условие обусловлено тем, что построение ближней границы ОД для выбранной структуры управления нормальной перегрузкой (с "минуса" на "плюс") даст точки как в полуплоскости ni (XOY, Y ^ 0), так и в полуплоскости П2 (XOY, Y ^ 0). При этом точки, принадлежащие полуплоскости П2, будут внутренними точками ОД, т.е. не лежащими на границе ОД. Запись соответствующего управления во множество возможных управлений U.
5. В п. 1-4 сформирована поточечная оценка границы ОД G(T) в полуплоскости Hi(XOY, Y ^ 0). Необходимо получить оценку границы ОД в полуплоскости П2 (XOY, Y ^ 0). Для этого отобразим относительно оси OX в множество G2(T) полученное множество граничных точек G(T), что равносильно смене знака Y элементов (X», Yj) € G. Соответствующие управления могут быть найдены сменой знака uii(t) элементов [uii(t), u2i(t)] € U.
6. Вывод множеств G(T) и G2(T).
Приведем пример построения множества G(T) в полуплоскости Hi (XOY, Y ^ 0). На рис.5 изображены дальняя, боковая и ближняя границы области достижимости, траектории разгона и торможения предельной кривизны, а также примеры траекторий, приводящих на границы.
Алгоритм поиска приближенного управления, максимизирующего (а) и минимизирующего (б) расстояние, пройденное объектом в выбранном направлении v, имеет следующую структуру.
1. Задание угла у направления v.
2. Определение интервала времени T, на котором решается задача поиска экстремума расстояния.
3. Проверка принадлежности угла у направления v диапазону углов:
а) у € [—у, у], где у определяется формулой (43);
Рис. 5. Пример построения границ ОД
б) р € [—9$, р], где р определяется формулой (44).
Если условие выполняется, переходим к п. 4, иначе — к п. 5.
4. Формирование равномерной сети:
а) густоты I по времени перехода на особый участок управления нормальной перегрузкой пособ = 0. Для каждого узла сети = Д£-г, г = 0,1,
Т
^ € [0, Т], Д£ = у, выполняется построение точки (X, У), принадлежащей участку дальней границы ОД. Структура управления определяется выражением (40). Определение угла р^ направления щ по формуле (45). Запись направления V во множество возможных направлений N. Запись соответствующего управления во множество возможных управлений и.
б) густоты ¿1 по времени смены знака управления нормальной перегрузкой п(£) со знака минус на знак плюс. Для каждого узла сети = Д£+г,
__Т
г = 0, ¿1, € [0, Т], Д£+ = —, выполняется построение точки (X, У),
¿1
принадлежащей участку ближней границы ОД. Структура управления определяется выражением (41). Определение угла р^ направления V по формуле (45). Запись направления V во множество возможных направлений N при условии р^ ^ 0. Данное условие обусловлено тем, что построение ближней границы ОД для выбранной структуры управления нормальной перегрузкой (с минуса на плюс) даст точки как в полуплоскости П (ХОУ, У ^ 0), так и в полуплоскости П2 (ХОУ, У ^ 0). При этом точки, принадлежащие полуплоскости П2, будут внутренними точками ОД, т.е. не лежащими на границе ОД. Запись соответствующего управления во множество возможных управлений и.
Переход к п. 8.
5. Проверка принадлежности угла р направления V диапазону углов: р € [—р, р]. Если условие выполняется, переходим к п. 6, иначе — к п. 7.
6. Вывод сообщения о том, что в течение заданного времени T в выбранном направлении v не обнаружено положения ЛА, принадлежащего ОД.
7. Формирование равномерной сети густоты m по времени t+ смены знака управления тягой пт (t) со знака минус на знак плюс. Структура управления определяется выражением (42);
Ti __t
а) для каждого узла сети tj = —, i = 0,m, t^ € [0, i+], At+ = —,
выполняется построение точки (Xj, Yi), принадлежащей участку боковой границы ОД;
Ti ___ T
б) для каждого узла сети t^ = —, i = 0,m, tj € [ij, T], At+ = —,
выполняется построение точки (Xi, Yi), принадлежащей участку боковой границы ОД. Определение угла pi направления v по формуле (45). Запись направления v во множество возможных направлений N. Запись соответствующего управления во множество возможных управлений U.
8. Если направление v принадлежит полуплоскости n2(XOY, Y ^ 0), т.е. угол р < 0, то производим смену знака элементов множества N и элементов uii(t) множества U.
9. Поиск угла pi направления v € N, удовлетворяющего условию |р — pi| ^ min. Вывод управления [uli(t), u2i(t)] € U, соответствующего выбранному направлению.
Структуризация пространственной задачи получения ОД с учетом тяги на основе экстремальных свойств y(t) = const и комбинации релейных и особых структур nT, n. Как было показано ранее, экстремаль, обеспечивающая оптимальное движение системы (2), является плоской, что позволяет свести пространственную шестимерную систему к ранее рассмо-
Еачало
Рис. 6. Блок-схема алгоритма формирования границ пространственной ОД ЛА
Боковая
Место по,
соответст :кания
пределы 'Ково
в задаче максимизации границ ОД
пройденного ДА расстояния
Рис. 7. Граница позиционного множества достижимости ЛА (решение задачи максимизации пройденного расстояния)
тренной плоской четырехмерной. Данный факт позволяет структурировать пространственную задачу получения ОД на основе плоских сечений по углу крена 7 и сформировать блок-схему алгоритма построения пространственной ОД (рис. 6).
На рис. 7 приведен пример построения границы трехмерного позиционного множества достижимости ЛА (описываемого системой дифференциальных уравнений (2)), являющейся решением задачи максимизации пройденного расстояния.
Выводы. В настоящей работе рассмотрена задача оценки ОД ЛА в трехмерном пространстве, которая сведена к задаче поиска экстремума расстояния, пройденного объектом за фиксированный интервал времени в плоскости движения ЛА с фиксированным углом крена. Получены три структуры оптимальных управлений, приводящих на границу ОД. Выявлены и исследованы части границы ОД. Сформированы алгоритмы получения значения предельного направления в задаче поиска экстремума пройденного расстояния, поточечной оценки границ ОД ЛА с учетом тяги, поиска управления, доставляющего экстремум расстояния, пройденного объектом в выбранном направлении. Сформированы структуры алгоритмов решения каждой из указанных задач.
Работа выполнена при финансовой поддержке РФФИ, грант № 07-08_00509-а "Многокритериальная оптимизация структурно-сложных систем управления ".
1. Красовский Н. Н. Игровые задачи о встрече движений. - М.: Наука, 1970.
2. В о р о н о в Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных игровых решений: Учеб. / Под ред. Н.Д. Егупова. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2001. - 576 с.
СПИСОК ЛИТЕРАТУРЫ
420 с.
3. Габасов Р., Кириллова Ф. М. Особые оптимальные управления. - М.: Наука, 1973.-256 с.
4. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. - М.: Наука, 1969.-384 с.
6. З в е р е в В. Ю., Плотников В. Н. Расчет систем управления летательными аппаратами. - М.: Изд-во МО СССР, 1980.
5. Бердышев Ю. И. Синтез оптимального по быстродействию управления для одной нелинейной системы четвертого порядка // Прикладная математика и механика. - 1975. - Т. 39. - С. 985-994.
Статья поступила в редакцию 31.05.2007
Евгений Михайлович Воронов родился в 1940 г., окончил в 1963 г. МВТУ им. Н.Э. Баумана и в 1969 МГУ им. М.В. Ломоносова. Д-р техн. наук, профессор кафедры "Системы автоматического управления" МГТУ им. Н.Э. Баумана. Автор 150 научных работ в области теории управления и ее приложений.
Ye.M. Voronov (b. 1940) graduated from the Bauman Moscow Higher Technical School in 1963 and the Lomonosov Moscow State University in 1969. D. Sc. (Eng.), professor of "Automatic Control Systems" department of the Moscow State University for Instrument Engineering and Information Technology. Author of 150 publications in the field of control theory and its applications.
Александр Александрович Карпунин родился в 1980 г. Окончил в 2003 г. МГТУ им. Н.Э. Баумана, в 2006 г. — очную аспирантуру МГТУ им. Н.Э. Баумана. Ассистент кафедры "Системы автоматического управления" МГТУ им. Н.Э. Баумана. Автор 24 научных работ в области теории управления и ее приложений.
A.A. Karpunin (b. 1980) graduated from the Bauman Moscow State Technical University in 2003. Assistant of "Automatic Control Systems" department of the Bauman Moscow State Technical University. Author of 24 publications in the field of design of automated library and communication systems.