УЧЕНЫЕ ЗАПИСКИ ЦАГИ
Том XXVI 1995 № 3-4
УДК 629.735.33.016.
ОПТИМИЗАЦИЯ ТРАЕКТОРИЙ СНИЖЕНИЯ САМОЛЕТА В ВЕРТИКАЛЬНОЙ ПЛОСКОСТИ
Н. М. Гревцов, О. Е. Ефимов, И. О. Мельц
Рассматривается оптимизация траектории самолета при снижении в вертикальной плоскости с учетом ограничений на фазовые и управляющие переменные. Оптимизация проводится с использованием принципа максимума. В качестве управлений принимаются тяга силовой установки и угол наклона траектории.
Предлагается методика построения поля экстремалей для рассматриваемой задачи и приводятся результаты расчетов поля экстремалей и отдельных оптимальных траекторий для некоторых начальных условий.
Наряду с задачей об оптимальном наборе высоты самолетом представляет интерес и задача об оптимальном снижении, в том числе о снижении за минимальное время. Решение такой задачи может быть использовано, например, для управления самолетом при разгерметизации кабины на большой высоте.
Оптимальные по времени перелеты, сопровождающиеся диссипацией механической энергии, могут быть реализованы с использованием пространственных маневров с большими нормальными перегрузками. Снижение самолета относится именно к такому классу перелетов. Однако в некоторых случаях по тем или иным причинам требуется, чтобы траектория снижения находилась в вертикальной плоскости. Оптимизация управления нормальной скоростной перегрузкой и тягой силовой установки с учетом этого требования на участках диссипации энергии приводит к «скользящему» режиму для нормальной перегрузки [1]. Это объясняется невыпуклостью допустимой области изменения управляющих переменных. Очевидно, что невыпуклость сохранится, если вместо нормальной скоростной перегрузки в качестве управляющей переменной использовать коэффициент аэродинамической подъемной силы или угол атаки. В задаче о наборе высоты за минимальное время невыпуклость допустимой области изменения управляющих переменных несущественна.
Для преодоления этой трудности в настоящей статье для описания движения самолета в вертикальной плоскости используются так называемая «промежуточная» модель, предложенная в [2]. В качестве управляющих переменных этой модели используются угол наклона траектории и тяга двигателей. В работе [2] модель применяется для решения задачи о полете на максимальную дальность при заданных времени и расходе топлива, причем ограничения на фазовые и управляющие переменные не накладываются. Термин «промежуточная» по отношению к используемой модели связан с тем, что по уровню подробности описания движения самолета в вертикальной плоскости она находится между полной моделью движения центра масс самолета (в которой управляющими переменными являются нормальная скоростная перегрузка и тяга) и моделью, соответствующей энергетическому подходу.
При использовании этой модели для рассматриваемой в настоящей статье задачи ограничения на управляющие переменные являются существенными и должны учитываться. Существенными также являются ограничения на скорость, скоростной напор и высоту полета.
Для оптимизации траектории снижения используется принцип максимума. Основная трудность состоит в корректном учете ограничений на фазовые переменные. В работе большое внимание уделяется построению оптимальных траекторий, частично лежащих на границе допустимой области, и их поведению в окрестности границы. Особенностью рассматриваемой задачи является наличие особого решения, которое необходимо учитывать при построении оптимальных траекторий.
1. Постановка задачи. Движение центра масс самолета задается уравнениями
У = 8(пх -вшб),
Н = КвшЭ,
где V— скорость полета самолета, Н~ высота полета, пх— тангенциальная перегрузка, 0 — угол наклона траектории, g — ускорение свободного падения.
Тангенциальная перегрузка определяется по формуле
в _рРтах(Н,М) Я^х(стуП,М) (2)
Х mg
Здесь Ртах— максимальная тяга двигателей самолета, р — относительный коэффициент тяги, т — масса самолета, М число Маха, # скоростной напор, Я — расчетная площадь крыла, сх — коэффициент лобового сопротивления, с£п— коэффициент аэродинамической подъемной силы в горизонтальном полете.
В качестве управляющих переменных принимаются величины /> и 8ш 0. В дальнейшем используется обозначение и = вш0. Управляющие переменные должны удовлетворять условиям
Область допустимых режимов полета задается типичными для самолета ограничениями:
Значение Утіп определяется условием возможности горизонтального полета при сгуп = сутах.
Пусть в момент і = 0 задаются начальные условия V(0) = У0,
минимальное время перелета Т в заданные условия V (Т) = Ук,
При этом управляющие переменные должны удовлетворять условиям (3), (4), фазовые — условиям (5).
2. Условия оптимальности. Для решения задачи используется принцип максимума [3, 4]. В рассматриваемой задаче первые три ограничения в (5) являются существенными. Отдельные участки оптимальных траекторий могут находиться на границах. Функции, описывающие ограничения, не содержат явно управления. Управляющие переменные входят в первые производные этих функций. Поэтому, когда траектория лежит на участке границы, определяемом равенством V - Ктах = 0, управляющие переменные должны удовлетворять условию
когда траектория лежит на участке границы, определяемом равенством 9 ~ <7тах = 0 > они Должны удовлетворять условию
и, когда траектория находится на участке границы Нтт~Н = 0, управление должно удовлетворять условию
0 < р < 1,
(3)
(4)
«тіл * и < щ
‘тах •
У-Упшх* 0,
Ч ~ (7тах ^
ТГ -И<0,
(5)
Н(0) = Н0. Требуется определить управление р*, и*, обеспечивающее
Н(Т) = Нк, т.е.
{/>*,«*] = а^ттГ.
рм
(6)
у = £(и* - “) = °>
(7)
Н = Уи = 0.
Гамильтониан для задачи (1) — (6) имеет вид
Н = g(Xvnx(p) + Л<) + HifaOO - и) +
+^2 [gQV»x (Р) + (Vq'h ~ g9V)“] - \^Vu.
Здесь
R = XHV / g - Ху ,
Ху, Xн — сопряженные переменные; \il} \i2, \i3 — множители
Лагранжа. При этом ц,- = 0, если оптимальная траектория находится внутри допустимой области, и ц,- > 0, если она находится на соответствующем граничном участке.
Оптимальное управление р , и* определяется из условия
\р*, и*} = aigminH. (8)
р,и
На оптимальной траектории Н = const <0. В соответствии с (8) внутри допустимой области оптимальные значения управляющих переменных определяются следующим образом:
_* Г1, если .Ху <0,
Р = 1
[0, если Ху > 0;
и = j“max, еСЛИ R < 0, l“min. если R>0-
В интервалах своей непрерывности сопряженные переменные Xv, Xff удовлетворяют дифференциальным уравнениям
V = ~Щг = -gn’xyXy - Хни - Wxv - + <&п'ху) +
Ля'н + V(l'kv ~ g<№v)u\ + Цз“,
= -НЯ = -gXVn'XH - у.хп’Хн - ^(я'нуПх + qyn'XH) +
+(q'hhv - Q'hvg)u\
(9)
Поскольку фазовые переменные в начальной и конечной точках заданы, значения сопряженных переменных в этих точках заранее не определены. Они должны быть выбраны так, чтобы были удовлетворены условия на фазовые переменные. В силу однородности гамильтониана по Ху, Хн, щ, ц2, М-з сопряженные переменные в начальной или конечной точке можно выразить через один параметр. Например, при интегрировании уравнений (9) слева направо сопряженные переменные в начальной точке можно задать в виде
А,^(0) = совср, /?(0) = вшф. (10)
Значение X# (0) в этом случае определяется по формуле
Х.я(0) = *[Д(0) + М0)]/К.
Если оптимальная траектория целиком лежит в допустимой области, то для ее нахождения необходимо выбрать единственный свободный параметр ср.
Несколько сложнее построить оптимальную траекторию в случаях, когда часть этой траектории лежит на границе или совпадает с особой траекторией (см. п. 4).
Поскольку ограничения (5) не зависят от времени, в момент входа на границу гамильтониан должен сохранять свою непрерывность. Это требование приводит к определенному условию, которое накладывается на сопряженные переменные слева от момента входа и в конечном счете определяет значение <р в (10). В точке входа сопряженные переменные могут иметь разрыв, величина которого определяется конечными условиями на фазовые переменные.
3. Управление на границе и вблизи нее. Рассмотрим, как определяется оптимальное управление на каждом участке границы допустимой области и какую конкретную форму принимают условия оптимальности в момент входа траектории на границу. Нас будут интересовать только траектории, приводящие к снижению, хотя на некоторых участках возможен и набор высоты.
Как уже было отмечено ранее, на участке границы V - Утяг = 0 управляющие переменные должны удовлетворять условию пх(р) -и = 0. В соответствии с [3, 4] в момент входа оптимальной траектории на рассматриваемый участок границы возможен разрыв в сопряженной переменной
+
причем АХу < 0.
Для зависимости пх(р) введем обозначения пхт;п = лх(0), пхтах = = «*(!)• В случае «хтт-«тт>0 на участке границы V - Утах = 0 оптимальные значения управляющих переменных составляют р = 0, и = пхт^. Непосредственно перед входом на оптимальных
траекториях р* = 0, и* = «т|п. Условие непрерывности гамильтониана приводит к равенству Д(ГХ) = 0, при этом Н(/м) = Н(£х) =
Множитель Ц! в выражении для гамильтониана определяется из условия
Н^=^-и = 0.
Траектория будет оставаться на границе, пока > 0. Как
только цх поменяет знак, произойдет сход траектории с границы и значение и* станет равным ытах.
Поведение оптимальных траекторий вблизи границы для этого случая показано на рис. 1, а.
Если на участке границы V - Ктах = 0 выполняется неравенство
пхтт - «ШШ ^ 0, то На ЭТОМ участке и* = итщ, а значение р* определяется из условия л* (]>*) = итт- На входящих оптимальных траекториях р* = 1, и* = итт. Условие непрерывности гамильтониана дает
Ьк(&) = °, при этом н('вх) = Н('вх) = ^«шш-
Множитель Ц! определяется в соответствии с условием
н 'р = &уп'Хр + ^п'Хр = О,
из которого получаем = -gXy. Сход траектории с границы происходит при Ху г 0, при этом знак Я может быть любым. Поэтому после схода управление и* может принимать как значение Ища*, так и ит\„. Поведение оптимальных траекторий в окрестности рассматриваемого участка границы показано на рис. 1, б.
Условия, накладываемые на значения сопряженных переменных слева от момента входа на границу, обеспечиваются за счет соответствующего выбора параметра <р в (10). Поведение оптимальной траектории далее будет определяться также одним параметром, а именно величиной разрыва сопряженной переменной Ху.
Следует отметить, что для самолета область на плоскости Н, V, где пхтт ~ мтт > располагается, как правило, выше области, где
пХтт - ишш < 0- Оптимальная траектория, находясь на границе, может перейти из первой области во вторую.
Рис. 1. Оптимальное управление на границе V - = 0 и вблизи нее
Поведение траектории перед входом на границу для этого случая иллюстрируется на рис. 1, а, затем характер управления непрерывным образом меняется, а после схода с границы возможны траектории вида, показанного на рис. 1, б.
На участке границы, где д - дтах = 0, управление удовлетворяет условию (7). Возможные разрывы сопряженных переменных на оптимальной траектории в момент входа /вх равны
Л^-к = уф, ЛХн = \д'н, (11)
где V < 0 — параметр.
Особенности управления на рассматриваемом участке границы
Уа'тг
определяются знаком выражения яхтщ - Аит-т, где А = 1-----------—. Если
пхтш ~ Л«тш > то на границе р* - 0, и* = пхт1П/А. Из условия непрерывности гамильтониана в момент /вх должно выполняться равенство = 0. Из равенства = 0 можно определить ц2;
Цл = 1 ,
ЯЧ'у ~ уЯ'н
Знаменатель в последнем выражении положителен, т. е. знак ц2 совпадает со знаком Я. Следовательно, оптимальная траектория находится на границе, пока Я > 0. Как только Я меняет знак, она сходит с границы, причем после схода м* = мтах. Управление р* остается равным нулю. Поведение траекторий входа и схода с границы в ее окрестности для этого случая показано на рис. 2, а.
Если на участке границы д - #тах = 0 выполняется условие
ихтт - Литт ^ то “* = “тт> а Р* определяется из равенства пх(Р) = Аитж- Условие непрерывности гамильтониана при / = /вх приводит к равенству ^к(^вх) = ПРИ этом из условия = 0 следует, что ц2 = ■
Сход с границы происходит при ц < 0 или Ху > 0. Поэтому после схода р* = 0, а и* может принимать значения как ггт1П, так и итах. На рис. 2, б. приведено возможное поведение оптимальных траекторий в окрестности рассматриваемого участка границы.
Рассмотрим, каким условиям должно удовлетворять оптимальное решение в точке пересечения участков границ V - Ктяу =0 и д - дтак = 0. Переход оптимальной траектории с первого участка на ВТОРОЙ ВОЗМОЖеН ТОЛЬКО ПрИ Идгтш - Аит\п < 0 или Игт|п - КШщ > 0. В
первом случае управляющая переменная и* остается равной «т1п, а управление тягой меняется: до точки перехода р* определяется из
условия пх\р*) = Ищщ, а после точки перехода — из условия пх(р*) = . Из условия непрерывности гамильтониана следует, что
слева от момента перехода Ху(!~х) = 0.
Г-
и*-и
г) лхт1„-АипЫ <0
Рис. 2. Оптимальное управление на границе д - дтах = 0 и вблизи нее
В случае «хлип - «пил > 0 при переходе с участка границы
V - Утях =0 на участок д - ^тах = 0 управление тягой остается неизменным: р* = 0, а управление и* меняется с и* = ихтш на и* = Пхпйц/А. Условие непрерывности гамильтониана требует, чтобы слева от момента перехода 7?(/вх) = 0.
Требования на сопряженные переменные слева от момента перехода накладывают условие на величину разрыва ДХу в момент входа на участок границы V - Ктах = 0. Следует отметить, что разрывы сопряженных переменных в момент входа на участок границы определяются так же, как и ранее, согласно (11).
Непосредственно перед входом на участок границы Нт\п - Н = 0 оптимальными для управляющих переменных являются следующие значения: р* - 0, и* = иШщ. На границе значение р* не меняется, а и* становится равным нулю.
В момент входа /вх оптимальной траектории на рассматриваемый участок границы сопряженная переменная Xн терпит разрыв, величина которого удовлетворяет условию ДА. д > 0. Для выполнения условия непрерывности гамильтониана в точке входа необходимо, чтобы выполнялось равенство Л(7“х) = 0.
Значение множителя ц3 на границе определяется из условия Н|,=0: 11-$ = gR.IV. Сход с границы происходит при выполнении условия .К £ 0.
Анализ показывает, что при пХт.п - Аитт > 0 оптимальная траектория может переходить с участка границы д - #тах = 0 на участок Нт\п - Н = 0. При этом в точке перехода должны выполняться те же условия оптимальности, что и при входе на этот участок из внутренней области допустимых режимов полета. Для выполнения условия Я = 0 слева от момента перехода необходимо в точке входа на участок границы 0 - #тах = 0 подобрать соответствующее значение параметра
V в (11).
4. Особое решение. В рассматриваемой задаче особое решение соответствует условию R(t) = 0 и, следовательно, Л = 0, откуда с использованием уравнений (1) и (9) при ц,- =0, /= 1,2,3 получим
Д = -Ху(п'хн¥ - £/^к - ргх/У) = 0.
В связи с этим на особой траектории
»х=—[У”'хн-е»'ху)- (12)
ё
Анализ и расчеты показывают, что особое решение практически возможно лишь при р = 1.
Уравнение (12) при р = 1 в плоскости Н,У определяет программу наилучшей энергетической скороподъемности самолета. Она может содержать разрывы, но на интервалах непрерывности можно выбрать управление, обеспечивающее полет по этой программе.
Пусть из (12) получена программа Н = Нпр(У). Продифференцируем эту зависимость по времени и воспользуемся уравнениями (1). Получим известную формулу
. Л Епх^пру /10Л
(13)
Если полученное таким образом управление и удовлетворяет условию (4), то особая траектория может быть реализована.
При расчете и согласно (13) нужно иметь в виду, что зависимость #пр(Г) может быть неоднозначной. Для расчета управления целесообразно эту зависимость выразить в форме Н = Нпр(Е), где
Е - Н + У2К2*) - удельная механическая энергия. Программа Нпр(Е),
как правило, является однозначной, и управление и можно рассчитать по формуле (см. [5])
Особое решение для управления р невозможно, так как при выполнении условия = 0 из уравнений (9) следует, что А.я<0-0, а это делает невозможным нахождение управления с использованием принципа максимума.
5. Результаты расчетов. Расчеты оптимальных траекторий и поля экстремалей проводились для сверхзвукового самолета, аэродинамические характеристики которого были получены по методике, изложенной в [6]. В качестве исходных были приняты следующие компоновочные параметры: относительная толщина профиля крыла - 0,04, эффективное удлинение крыла - 2, угол стреловидности - 50°, удлинение фюзеляжа - 6,7. В качестве тяговых характеристик силовой установки использовались характеристики, приведенные в [6].
В расчетах удельная нагрузка на крыло принималась равной 300 кг / м2, тяговооруженность при стандартных условиях (Н - 0, М = 0) - равной 1, а значения параметров, определяющих границы области допустимых режимов, принимались следующими: Утах = 600 м/с,
дтяу = 7000 кг / м2, Нт[л = 0, Сутах =0,8. Предельные значения для 0 были равны -'30° и 30°, т. е. ит-,п = -0,5, итах = 0,5.
На рис. 3 представлены три оптимальные траектории для одного начального условия: К0 = 350 м/с, Н0 = 10 км. Первая траектория, имеющая конечные условия Ук = 245 м/с, Нк = 6 км, полностью находится внутри допустимой области и состоит из двух участков, на первом и* = Мщщ, на втором и* = Ища*, на всей траектории
На второй траектории, заканчивающейся при Ук = 190 м/с, Нк =1,1 км, самолет сначала разгоняется (р* =1), затем до выхода в конечную точку р* = 0. Значение управляющей переменной ы* равно “пип Д° входа на участок границы д - дтах =0. В рассматриваемом
"100 200 300 400 500 V, м/с
Рис. 3. Примеры оптимальных траекторий для начального условия У0 = 350 м/с, /Уд = 10 км
Н,к
расчетном случае на всем этом участке пх т1п - Аит^ > 0, откуда следует, что и = пх пип/Л. После схода с участка границы, где 9 - ?тах = 0 > траектория переходит на участок границы, где Нтт - Н = 0, и затем после торможения на этом участке выходит в конечные условия.
Особенность третьей траектории состоит в том, что в своей средней части она совпадает с особой траекторией. Конечные условия находятся на участке границы - дтах = 0. Выход в эти условия
происходит при р = 1, и* = цт1п. Следует иметь в виду, что только единственная точка рассматриваемой траектории, а именно, конечная, лежит на границе, поэтому условия входа на границу могут и не выполняться.
Одной из целей решения оптимизационных задач является создание алгоритмов управления. Если в результате решения не удается построить оптимальный синтез управления, основой для разработки алгоритмов может служить анализ поля экстремалей.
В настоящей работе построение поля экстремалей производится для фиксированных начальных условий К0, Н0.
Для расчета экстремалей начальные значения сопряженных переменных задаются в виде (10). Если бы в задаче не было ограничений на фазовые переменные и отсутствовало особое решение, для построения всего поля экстремалей достаточно бьгло бы построить оптимальные траектории, выполнив совместное интегрирование уравнений (1) и (9) при условии (8) для заданных с некоторым шагом значений ф из диапазона 0 -г- 360°.
Однако наличие фазовых ограничений и особого управления усложняет построение поля. Сначала для различных ср производится построение экстремалей в соответствии с описанной выше процедурой. Если экстремали находятся внутои допустимой области, то они берутся в качестве элементов поля.
Для построения оптимальных траекторий, содержащих участок на границе, выбирается значение ср, при котором обеспечивается выполнение условий на сопряженные переменные в точке входа на границу. Затем задается ряд значений величины разрыва сопряженных переменных и для них строятся оптимальные траектории с учетом необходимости выполнения ограничения. Если траектория входит на другой участок границы, то указанная выше величина разрыва сопряженной переменной выбирается так, чтобы удовлетворить условиям входа на этот другой участок. Далее семейство оптимальных траекторий строится для ряда значений величины разрыва сопряженной (сопряженных) переменной в точке входа на последний участок границы и т. д. В принципе для рассматриваемой в работе задачи возможны траектории, последовательно проходящие по всем трем участкам границы.
Назовем поле экстремалей, построенное описанным выше способом, регулярным. После построения регулярного поля находится траектория, соответствующая особому решению, и строятся исходящие из нее экстремали.
Последним шагом при построении поля экстремалей является комбинирование двух полей: регулярного и поля, состоящего из особой траектории и исходящих из нее экстремалей.
На рис. 4 приведено поле экстремалей для начального условия У0 = 200 м/с, Н0 = 15 км. Показаны граничные участки и особая траектория. Экстремали заканчиваются при V = Р/гп!п.
Фрагмент поля экстремалей в области больших скоростей для начального условия У0 = 550 м/с, #0 = 15 км приведен на рис. 5. В этом случае среди экстремалей нет особой траектории.
Уа "200м/с; Нв -15км
Рис. 4. Поле экстремалей при наличии особой траектории У0=550м/с; Н0 - 15 км
При постановке задачи основным допущением является возможность мгновенного изменения угла наклона траектории. Как видно из полученных решений, на оптимальных траекториях внутри допустимой области реализуется не более одного переключения с 0т1п на 0тах. Другие переключения 0 возможны при входе на границу или особую траекторию и сходе с них. При этом величина скачка 0 по абсолютной величине во всех случаях меньше, чем разность 0тах - 0 т|п. При раз-
работке алгоритма управления с использованием поля экстремалей рассмотренной задачи необходимо учитывать ограничение на скорость изменения угла 0.
Хотя постановка рассмотренной в работе задачи является естественным результатом учета особенностей снижения самолета, эта же задача может быть решена и для случая набора высоты с выходом на ббльшее значение механической энергии. Результаты решения этой задачи также могут быть использованы при разработке алгоритмов управления самолетом с учетом указанных выше замечаний относительно управления углом 0. Поле экстремалей для случая как снижения, так и набора высоты представлено на рис. 6. Следует отметить, что большая часть траектории выхода на большую высоту и скорость (на большой уровень механической энергии) совпадает с особой траекторией. При этом разрывы угла 0 имеют меньшую величину, чем при снижении.
Работа выполнена при поддержке Российского фонда фундаментальных исследований
ЛИТЕРАТУРА
1. Seywald Н. Long flight-time-range-optimal atmospheric flight vehicle trajectories. // Proceedings of the A1AA Guidance, Navigation and Control Conf.— Scottsdale, AZ. Aug. 1—3, 1994.
2. Me non P. K. A., Kelley H. J., Cliff E. M. Optimal symmetric flight with an intermediate vehicle model // A coll. of tech. papers of the AIAA Guidance and Control Conf. Gutlinbuig, Tennessee. Aug. 15—17, 1983.
3. Понтрягин JI. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. - М.:
Наука. - 1976.
4. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. - М.: Мир. — 1972.
5. Прокопец Н. Б., Савельев А. В. Приближенный синтез управления самолетом для набора высоты с заданной конечной скоростью за минимальное время // Ученые записки ЦАГИ. — 1986. Т. XVII, № 4.
6. Остославский И. В. Аэродинамика самолета. - М.: Гос. изд-во оборонной промышленности. - 1957.
Рукопись поступила 29/XII1993 г.