УЧЕНЫЕ ЗАПИСКИ Ц А Г И Т О м IV 197 3
№ 1
УДК 629.782.015
ОБ ОДНОМ СПОСОБЕ ПОСТРОЕНИЯ ПРИБЛИЖЕННО ОПТИМАЛЬНЫХ ТРАЕКТОРИЙ ГИПЕРЗВУКОВЫХ АППАРАТОВ В АТМОСФЕРЕ
В. Т. Пашинцев
Предлагается простой способ построения одного класса приближенно оптимальных законов управления на основе использования колебательных свойств траекторий гиперзвуковых аппаратов в атмосфере при докруговых скоростях полета. В основу предлагаемого способа положена гипотеза, предполагающая возможность замены обычного понятия оптимальности управления некоторым понятием оптимальной степени демпфирования колебаний функции высоты полета.
Определение оптимальных траекторий движения в атмосфере гиперзвуковых аппаратов, обладающих подъемной силой, как показывают исследования (см., например, [1], [2]), сопряжено с большими трудностями. Эти трудности связаны с необходимостью решения многопараметрических краевых задач, к которым обычно сводятся задачи оптимального управления с помощью принципа максимума Л. С. Понтрягина [3], [4]. В связи с этим важное значение имеет разработка простых способов построения приближенных законов управления, являющихся близкими к оптимальным законам.
В данной статье предлагается достаточно простой способ построения законов управления, позволяющих реализовать приближенно оптимальные траектории движения в тех задачах управления пассивным движением гиперзвуковых аппаратов в атмосфере, в которых правый конец фазовой траектории является свободным. В предлагаемом способе не используются обычные условия оптимальности управления [3], [4], а также какие-либо существенные упрощения уравнений движения. Реализуемая при этом точность демонстрируется на численных примерах.
Автор благодарит Г. Е. Кузмака, сделавшего полезные замечания.
Основные предпосылки. Рассмотрим пассивное движение с до-круговой скоростью (V<СУ^7?) гиперзвукового аппарата, обладаю-
щего аэродинамическим качеством. В изотермической атмосфере без учета вращения Земли уравнения движения имеют вид
cos 6 ;
da)
dl ____ Т Г Л
—.= V cos О at
R
г
dr\
dt
V cos 0
d<o
dt
dk
dt
Vcos 6 sin If)
(16)
V cos 6 COS K)
Г COS?1
где
a
'X
r — R-\- ft; g = g0 -pr ; P = p0e-*h ,
V, h — скорость и высота полета; / — дальность полета; 0 — угол наклона траектории; R — средний радиус Земли (.^ = 6371 • 103 м); g0, Ро — ускорение силы тяжести и плотность атмосферы у поверх-
угол (между проекцией вектора скорости на плоскость местного горизонта и местной параллелью); <р, /. — широта и долгота; 7 —угол крена (положительное значение х увеличивает ^).
Пусть требуется максимизировать (либо минимизировать) произвольный, функционал при свободном праврм конце фазовой траектории*. В качестве управления и, подлежащего оптимизации с точки зрения максимума; (либо минимума) функционала, в (1) принимается любая из следующих функций: угол атаки а, угол крена ?, площадь несущей поверхности ,5. В общем случае управление и может быть ограниченным. , .
Преобразуем систему уравнений движения в плоскости развертки (1а), исключив из первого уравнения величины р, 0 и с?/ с помощью остальных уравнений (1а). В предпол )жении r.~R(g~g0) будем иметь . , ,.
* Правый конец фазовой траектории будем считать свободным также в том случае, когда в (1) используется Некоторое; условие признака конца, достигаемое при .любом управлении,. .
dE
(2)
где Е—^ 2^7—удельная механическая энергия. Из уравнения (2)
следует, что управляемый процесс в системе (1) всегда подчинен соответствующему распределению потери энергии Е между двумя формами рассеивания, одна из которых связана с изменением угла наклона траектории 0 (t), а другая — с изменением дальности полета в плоскости развертки l(t).
Сказанное дает осцован,ие предполагать, что процесс оптимизации управления в системе (1) условно может быть представлен как процесс определения рациональной степени активного воздействия на характер поведения функции 0(£), которая, в свою очередь, на докруговых скоростях полета характеризует собой колебательный процесс изменения высоты полета h{t). На основе сказанного предположим, что близкое к оптимальному управлению движение может быть достигнуто за счет непосредственного влияния управляющей функции на отдельные характеристики колебательного процесса функции h(t). Очевидно, что при этом необходимо прежде всего установить, какие из характеристик колебательного процесса (амплитуда, частота, центр колебаний) являются определяющими для рассматриваемого класса задач. Анализируя результаты многочисленных расчетов оптимальных траекторий гиперзвуковых аппаратов в атмосфере с точки зрения характера колебаний, можно заметить, что при всем разнообразии задач эти траектории обладают общим характерным свойством: оптимальная программа управления всегда способствует либо демпфированию колебаний высоты полета, либо, наоборот, усилению колебаний (фиг. 1 и 2).
Опираясь на этот факт, предположим, что для рассматриваемого класса задач степень демпфирования траектории h(l) является определяющей. Принимая далее в качестве некоторой эталонной траектории „максимального демпфирования" траекторию квазиста-ционарного планирования (dftjdt ~0), сформулируем следующую рабочую гипотезу.
В задачах оптимального управления гиперзвуковых аппаратов в атмосфере при свободном правом конце траектории стандартную
процедуру поиска оптимального управления можно заменить процедурой поиска некоторой оптимальной для того же функционала степени демпфирования колебаний высоты полета относительно траектории квазистационарного планирования.
Очевидно, что оптимальное демпфирование при этом может оказаться как положительным, так и отрицательным.
Т1„=1311км; У„=782Пм/сет К =2,5
Формулировка способа определения приближенно оптимального управления. В соответствии со сформулированной гипотезой укажем один из возможных способов влияния управления на степень демпфирования колебаний траектории, а также последовательного улучшения управления.
Изменение высоты к (() с ростом дальности /(£) согласно (1а) подчинено уравнению
(3)
где _
Г л г йк , Vсоэб ,, . 0
^ = —7—8 = 1,Н'
я — угловая дальность полета.
С учетом допущения
Г — Я (£~£0), (4а)
а также тождества
^ет=‘«!в+1' <4б>
из (3) и (1а) следует [5]:
Ъ-Р{Р, У)Р = Р(?, V), (5)
где
Р( р, 1/)^0=Я£^^РОе~г*~ЙСО8Т-(^-1). (6)
Уравнение в вариациях относительно некоторой опорной траектории сравнения А* согласно [5] имеет вид >
ДА — 2 Р* (р*, V*) А Л == ДР(р, V) [1 + (Л*)2]. С учетом (46) и (6) при обозначениях
(7)
“ = Тр"с°п мСТ>0'’ В=(^-|)>0 ■
(8)
выражение (7) окончательно преобразуется к следующему виду:
где функции и*, Р* ив* соответствуют опорной траектории. Линейно* относительно ДА уравнение (9) описывает колебательный процесс, происходящий под влиянием линейно входящей в (9) активной составляющей возмущения Дм. В связи с этим, задавая, например, регулирование по производной в виде
при С>0 „коэффициент демпфирования1* Р* можеаг быть увеличен, а при С<0—- уменьшен. При этом улучшающей вариации Дм0р« в (10), очевидно, должно соответствовать оптимальное значение параметра С.
Функция и в соответствии с (8) представляет собой некоторое „обобщенное" управление, включающее в себя функции 5, я и 7. Поэтому вариация Ди в (10) в общем случае является линейной комбинацией соответствующих вариаций Д5, Да и Д7. Так, если, например, в (1) управляющей функцией является -г, то из условий1 (8) и (10) следует: .
Таким образом, если в качестве опорной траектории А*(£) принять траекторию квазистационарного планирования Апл(1/, и), то в рамках предлагаемого метода задача определения улучшающей вариации управления Ди0Р1 сводится к оптимизации в (10) передаточного коэффициента С. Последовательное же улучшение управления в системе уравнений (1) может быть осуществлено по стандартной схеме итерационного процесса
где у — порядковый номер итерации; и} — управление, порождающее траекторию п(У, и) на у-й итерации. .
При использовании условия (10) учет ограничения на управляющую функцию в (1) осуществляется,достаточно просто обыч-ной „срезкой11. ,
ДА-2Р*(р*, У*)Ь
ги*ДЛ = Дие-^>-^, (9)
Ди = — СДА,
(10)
где
ДА=^0-^в*,
(10а)
' ' р 08 6*
Д соэ у == сое т — сое 7* — — С (1ё 0 — в*)-----
%^Ро
(11)
и(Я-1) — иі + Д«ор1 у,
(12)
4—Ученые записки ЦАГИ Л"» 1
49
Вычисление опорной траектории. Согласно предложенному выше способу опорной траекторией является траектория квазистационарного планирования. Целесообразность этого обусловлена тем, что, во-первых, траекторию квазистационарного планирования можно считать траекторией „максимального демпфирования", относительно которой происходят колебания любой другой траектории сравнения, и, во-вторых, в таком случае исключается необходимость в предварительном запоминании опорной траектории, так как существуют все необходимые аналитические зависимости.
Рассматриваемая опорная траектория является универсальной для произвольных начальных условий движения.
Итак, в предположении а также с учетом допуще-
ния (4а) в режиме квазистационарного планирования имеем:
0 _ (\ 2со& 8
V У* ' ’
Воспользуемся равенством
^РпЛ __ ^Рпл Л V ._ ^ (1Н ! , л ч
М ~~ дУ й1 ~ 2рпл М • ’
С учето^ (1а) и (13) из (14) следует уравнение для определения функции 6(У) в режиме квазистационарного планирования:
• (И)
При дополнительном допущении вида
' ^о^трУ*»^^, (16)
справедливом обычно в диапазоне больших скоростей пассивного полета, из (13) и (14) вместо формулы (15) вытекает следующая [6]:
*л.т=-7-^—а?)
_ СОЭЧ
Из (15) и (17) следует, что второе слагаемое знаменателя в формуле (15) представляет собой поправку к формуле (17) для случая малых скоростей полета.
Определяя ВплСЮ из (15), в дальнейшем в формуле (10а) будем полагать
е*(У) = 6пл(1/). (18)
Пример 1. Задача о максимизации (минимизации) дальности полета в плоском движении (ч==0).
Будем считать, что регулирование дальности полета происходит за счет изменения площади несущей поверхности аппарата 5. Будем также полагать, что полет в плотных слоях атмосферы
происходит при постоянных аэродинамических характеристиках аппарата
^(V7) —const, с (У) = const, К — const, (19)
где
К = су/сх — аэродинамическое качество. (20)
В таком случае
a, (S) = «,,(•*)*, (21)
и, следовательно, в качестве оптимизируемой управляющей функции в (10) в дальнейшем может быть принята величина с*, изменяющаяся в диапазоне
~х mln (Snjin
)<з,< шах №»„). (22)
Задача состоит в максимизации (минимизации) величины / в момент достижения некоторой конечной высоты полета hK*.
В соответствии с принципом максимума Л. С. Понтрягина [3], [4], оптимальное в (1а) управление о* opt гранично на множестве (20). Следовательно, если используемая гипотеза близка
к истине, то можно утверждать, что в рамках приближенного за-
кона управления, определяемого с учетом (8), (10) и (21) из условия
°Х opt (/+1) ~ °xj C0pt [tg ® (0*/-f-l) tg 0ПЛ (3*;)] cos бпл (?х j), (23)
оптимальное значение параметра С в (23) при наличии ограничения (22) должно удовлетворять условию
I Copt | ~ ос (24)
независимо от опорного управления axj. Момент переключения в (23) граничного управления о* opt (/+п определяется из условия выполнения равенства
®(e*</+ij. (25)
где функция вПл (CTjry-* V) определяется по формуле (15) с учетом (21).
Таким образом, использование в рассматриваемой задаче предлагаемого способа позволяет достаточно просто получить синтез улучшающего закона управления на каждой итерации. Действительно, если, например, начальные условия движения в (1а) таковы, что минимальной дальности полета (/mj„) заведомо соответствует отрицательное демпфирование (С<0), способствующее усилению колебаний (что в практике обычно имеет место), то улучшающий закон управления на каждой итерации согласно (22) — (25) принимает следующий вид:
/ /min
3* шах 1фИ tg б < tg 0ПЛ (<Зх), V)’, \
mill при tg 6 > tg епл (sxJ, V); J
G* opt (/+1)
/ “ Іт ах
a* min при tg б < 0ПЛ (axj, V)\ ^x шах при tg б > 6ПЛ (axJ, V).
Gx opt (у-1-І) :
(26)
(27)
* Подобная задача рассматривалась ранее в работе [7].
Итерационный поиск состоит в последовательном уточнении функции 0„л (°^у. V) подстановкой в формулу (15) улучшающего управления <зх ори получаемого на /-й итерации из условия (23).
Численные расчеты с использованием в (1а) формул (15), (26) и (27) при начальных условиях 1/0 = 7350 м/сек, б0 = — 15°, А0 = 106 м,
К = 0,5 и ограничении на управление зх = ах/ах() вида ^<5, <1,5,
где ох 0 = 0,0002 м/кгс, показывают, что если принять в качестве начального приближения опорного управления величину 1,
то уже при одной итерации получаемая траектория незначительно отличается от оптимальной траектории (фиг. 3).
Hg-JOOKMi V,‘7SSBM/ceK-ee
Ь[т]
SB
1
1
1
V 1 1
\ 1
в. = , б: U пра/ля №-
х бхо щая финн-
З'ч! Цця
SB0 IfitM]
приб/Ц/жеино оптимальные траектории (метод на -стоящей работы)
1-min 1 оптимальные ■1тдх г траектории [7]
Фиг. 3
Пример 2. Задача о максимальном приближении аппарата к заданной точке земной поверхности.
Рассмотрим задачу максимизации функционала вида
. 1= cos а> = cos<sK cos <рд cos(XK — XJ + sin «рк sin (28)
где ш — угловое расстояние от аэродрома (<ра, Ха) до конечной точки траектории (ерк, К) в момент достижения некоторой фиксированной
скорости полета V"K ^предполагается, что |а>К-^-^ . Управляющей функцией в (1) принимается угол крена ч, ограниченный неравенством
7U
Т
(29)
* Указанная задача при различных предположениях рассматривалась ранее в работах [1] и [8].
Обратимся к программе квазиоптимального управления углом крена, предложенной в работе [2], а затем использованной применительно к аналогичной задаче в работе [8]:
tg*r =
b
ногатепри
-b
•tgjTlmax Sign 8 При
tg'al
< q + 6 sin
(30)
где b = — 1 ^ s*n Я — cos s! S — свободный параметр; 8 — те-
кущее угловое расстояние до плоскости большого круга, проходящего через фиксированную точку возврата (<ра, Ая) и конечную
9
1*
X Л приближенно ептима/ рявление (мет ad насть 6оты)при c*cSffi я tpfy | - 0 f ф0рмуле(ЗО) шее длящей ра-wt/jre(3l)i (метай ропати
9
1
Y
ж
-у
h L
\ \r
-Si \
\, 1 si Л
у-управляющая функция —& Л r
| V r
3° к о Фиг. 4
О,Of
s[pad]
точку траектории (<рк, Хк) (1]; е —угол между текущей плоскостью движения и указанной выше плоскостью с наклонением к экватору г = р. Двухпараметрическая программа (30) с параметрами Р и 5 отличается от оптимальной программы, определяемой в условиях квазистационарного планирования [1], поправкой вида Д^ = 0з1п£. В частном случае, когда в (30) ^ = 0, указанные программы совпадают.
Примем однопараметрическое управление 7„л(Р) в качестве опорного и в соответствии с (11) улучшающее управление будем определять по формуле
cos Topt = COS тг„л (р) — С [tg 0 (V) — tg епл (У)] cos 0ПЛ (V). (31)
В рассматриваемом случае программа управления (30) может быть использована для оценки эффективности предлагаемого способа. Расчеты показывают, что использование в (31) процедуры оптимизации ТпДР) при различных фиксированных значениях параметра С с последующим определением величины Copt приводит к более устойчивому процессу по сравнению с аналогичной оптимизацией в (30) параметров р и 5. Улучшение же функционала за счет оптимизации параметра X в (30) и параметра С в (31) при этом оказывается примерно одинаковым (фиг. 4).
1. Ш к а д о в JI. М., Б у х а н о в а Р, С., Илларионов В. Ф,, Плохих В. П. Механика оптимального пространственного движения летательных аппаратов в атмосфере. М., .Машиностроение', 1972.
2. Пашинцев В. Т. К вопросу об оптимизации пространственного маневра орбитального аппарата в атмосфере. Труды ЦАГИ, вып. 1243, 1970.
3. П о н т р я г и н Л. С., Болтянский В. Г., Г а м к р е л и д-зе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М., Физматгиз, 1961.
4. Р о з о н о э р Л. И. Принцип максимума Л. С. Понтрягина
в теории оптимальных систем 1—III. „Автоматика и телемеханика', т. XX, № 10—12, 1959. .
5. Кб nig Н. Lenkraethoden fur warmeoptimale esene Abstiegs-
bahnen von aerodinamischen WiedereintrittskOrpern. Raumfahrtforschung, 14, № 3, 1970. .
; 6. Коняев В. Г. О приближенном расчете одного класса тра-
екторий планирования. „Ученые записки ЦАГИ“, т. I, Ха 1, 1970.
7. Пашинцев В. Т. Об одном методе последовательных при-
ближений оптимизации управления. „Ученые записки ЦАГИ“, т. I, № 6, 1970.; \ : : ; : : ,
8. Пашинцев В. Т. Приближенное оптимальное управление углом крена в задаче возвращения гиперзвуковых аппаратов. „Ученые записки ЦАГИ“, т. III, № 4, 1972.
Рукопись поступила 22jV 1972