электронное научно-техническое издание
НАУКА и ОБРАЗОВАНИЕ
Эл № ФС77 - 30569. Государственная регистрация №0421100025. ISSN 1994-0408
Исследование свойств квазиоптимального и оптимального алгоритмов переориентации космического аппарата
77-30569/345396
# 02, февраль 2012 М.А. Велищанский
УДК 629.78, 62-50
МГТУ им. Н.Э. Баумана [email protected]
1. Введение
Данная работа посвящена сравнению двух различных алгоритмов управления переориентацией космического аппарата (КА). Один из алгоритмов базируется на концепции обратных задач динамики, второй - строится как решение задачи оптимального управления с использованием принципа максимума Понтрягина.
Задача переориентации космического аппарата (КА) подразумевает изменение его ориентации в инерциальной системе координат за заданное время. Под самой ориентацией КА обычно понимают положение связанной с КА системой координат по отношению к некоторой инерциальной системе координат. В этом случае параметры разворота известны заранее, еще до начала маневра, а исходные углы рассогласования начального и требуемого положения КА могут быть любыми (от нескольких градусов до 180).
Данная задача в различных постановках рассмотрена в целом ряде работ [1-13]. В большинстве из них — это задача оптимизационная. В работах рассматриваются вопросы получения управления, оптимального по быстродействию [1,2], расходу топлива или интегралу энергии [1,3,5].
Для осесимметричного тела известно аналитическое решение задачи нахождения оптимального по быстродействию управления, построенное на основе принципа максимума Понтрягина [2]. Другой вариант синтеза управления, оптимального по быстродействию, для решения динамической задачи переориентации основан на использовании метода экстенсивного разворота [1], базирующегося на теореме Эйлера о конечном повороте твердого тела, имеющего неподвижную точку. Во многих алгоритмах [3,4, 6] решения для данных частных случаев используются для построения прогнозирующих траекторий, с помощью которых предпринимается попытка построения траекторий, оптимальных по критерию расхода топлива или быстродействия в более общей постановке.
В работе [5] рассматривается задача оптимального управления пространственным разворотом КА из произвольного начального в заданное конечное угловое положение за заданное время. Оптимизация траектории производится по критерию минимума интеграла кинетической энергии вращения КА, с использованием принципа максимума Понтрягина. Автором приводятся структура оптимального управления и соотношения для определения программного движения КА. Для динамически симметричного КА дается полное решение задачи переориентации в замкнутой форме. Приводится расчет программный управлений при наличии конкретного вида ограничений.
В работах [7-9] авторы строят множество программный траекторий при помощи дважды дифференцируемы« функций, что позволяет им уйти от достаточно традиционнык ограничений на класс движений в виде плоского поворота Эйлера или поворотов вокруг главных осей КА. Предлагаемый авторами алгоритм управления переориентацией базируется на концепции обратный задач динамики [11], что позволяет авторам синтезировать алгоритмы управления, обеспечивающие достижения требуемых динамических характеристик динамических систем [12,13].
В связи с большим разнообразием алгоритмов переориентации, многие из которых строятся как решение задачи оптимального управления, возникает вопрос, на сколько сильно проигрывает решение, полученное на основе концепции обратных задач динамики, решению, построенному на основе принципа максимума Понтрягина. Для ответа на данный вопрос сравним алгоритмы, предложенные в [5] и в [7-9].
2. Сравнение алгоритма переориентации КА на основе концепции обратной задачи динамики и алгоритма с минимальным интегралом энергии
Остановимся подробнее на последних двух алгоритмах. В обоих подходах в качестве кинематических параметром, описывающих пространственное движение КА, используются кватернионы, а сам КА рассматриваеется как твердое тело. В этом случае движение КА вокруг центра масс описывается следующей системой кинематических и динамических уравнений:
2Л = Л о и, (1)
1и + и х 1и = и, (2)
где кватернион А(£) = (А0(£), А^), А2(£), А3(£))т удовлетворяет условию нормировки
|Л(*)|2 = А0(*) + А?(*) + А2(*) + А2(*) = 1 (3)
и задает положение связанной системы координат относительно неподвижной системы координат, и = (и>1, и2, и3)т € К3 — вектор угловой скорости в проекциях на оси связанной системы координат, и = (и1, и2, и3)т € К3 — управление, I — матрица моментов инерции
КА, о — операция умножения кватернионов. В работах [7-9] предполагается, что компоненты вектора управления как функции времени непрерывны. В работе [5] предполагается, что связанная система координат совпадает с главными центральными осями инерции КА, то есть матрица инерции КА I в (2) является диагональной.
В [7-9] рассматривается задача переориентации КА из произвольного заданного начального положения
Л(0)=Ло, и(0) = ио (4)
в заданное конечное положение покоя
Л(г,)=Л,, и(и) = 0 (5)
за интервал времени Т = [0,г,]. В [5] в качестве конечного положения КА может быть задано не только положение покоя.
Предлагаемый в [7-9] алгоритм управления переориентацией предполагает, во-первых, построение программной траектории, переводящей КА из заданного начального положения в заданное конечное положение покоя, и реализующего ее программного управления и, во-вторых, синтез управления, стабилизирующего траекторию КА.
Результаты, изложенные в [7], позволяют строить программные траектории КА, удовлетворяющие заданным начальным и конечным условиям в классе дважды дифференцируемых функций. В [7] кинематическая траектория Л = (А0(г), А1(г), А2(г), А3(г)))т, г € Т, строится на основе полиномов 5-й степени следующего вида:
\Й"2<() (6)
"г (г) = А« + ог1(г - г,)3 + ог2(г - г,)4 + ег3(г - г,)5, г = 0,3,
где коэффициенты сгк, г = 0, 3, к = 1, 3, однозначно выражаются через граничные условия (4)-(5), определяя тем самым единственную кинематическую траекторию. Изменение этой траектории возможно только путем изменения общего времени маневра При этом реализующее кинематическую траекторию Л(г) непрерывное управление имеет вид:
и = 21 (Л-1(г) о Л(г) - Л-1 (г) о Л(г) о л-1(г) о А(г)) + 4Л-1(г) о Л(г) х 1Л-1(г) о Л(г). (7)
В работах [8,9] множество таких полиномов расширялось до параметрических классов функций, на основе которых и строится программная траектория. Это позволяло выбирать в таких классах траектории, оптимизируемые по некоторому критерию. Таким критерием может быть расход топлива, максимальный управляющий момент и т.д. Подобный подход позволяет использовать численные методы оптимизации программной траектории. С теоретической точки зрения данный подход является применением метода Ритца — Галеркина в обратных задачах динамики [10], когда решение ищется в заданном классе функций, а
определению подлежат лишь коэффициенты при данных известных функциях. Кроме того, данный подход позволяет учитывать ограничения, накладываемые на вектор управления и вектор угловой скорости КА. Выбор полиномов в качестве функций, на основе которых строится программная траектория, диктуется прежде всего удобством и простотой вычислений. Авторами предлагается использовать полиномы, степень которых выше 5 или функции, построенные на основе кубического сплайна с дефектом 1.
При использовании полиномиальных расширений к функциям ^г(Ь), г = 0, 3, заданным в виде (6), добавляются полиномы следующего вида:
^ (ь) = Ь3(Ь — и)3(ог4 + ог5г +... + егк. гк'-4), г = 0Д (8)
В этом случае мы получим полиномы ¡1г(Ь) = ^г(Ь) + (Ь), также удовлетворяющие граничным условиям (4)-(5). В качестве параметров оптимизации выступают коэффициенты при шестой и старших степенях.
Использование кубических сплайнов с дефектом 1 для расширения набора функций заключается в том, что к каждой функции ^г(Ь) (6), г = 0, 3, добавляется слагаемое
^(Ь) = Ь(Ь — и)рг(Ь), г = 0,3,
гдерг(Ь) — кубический сплайн дефекта 1, который вместе со своей первой производнойр'г(Ь) равен нулю на концах интервала времени Т. В этом случае все время переориентации разбивается некоторой сеткой на произвольные временные отрезки, а в качестве оптимизационных параметров выступают значения сплайна во внутренних узлах сетки.
Так же в работах [8, 9] привен алгоритм синтеза управления в виде нестационарной обратной связи, стабилизирующей программную траекторию. Даны рекомендации по учету ограничений на управления.
В работе [5] задача оптимального управления пространственным разворотом КА в общем случае рассматривается в кинематической постановке, т.е. в качестве управления рассматривается вектор угловой скорости и = (и^ и2, и3)Т Е К3 КА. В качестве критерия оптимальности траектории выступает интеграл кинетической энергии вращения КА:
t*
О = 2 У (Ли? + Ли22 + 1зш1)М, (9)
0
где /1, /2,13 - главные центральные моменты инерции КА. Полученное автором при помощи принципа максимума Понтрягина программное управление и(Ь) определяется согласно следующим соотношениям [5]:
Рг _
иг = Ь •-г, г = 1, 3, рр = —и х р, (10)
Л
где Ь = (11и1)2 + (12и2)2 + (13и3)2 — модуль кинетического момента КА. Уравнения (10) совместно с (1) полностью решают поставленную задачу нахождения оптимального управления в кинематической постановке. К сожалению, как отмечено в [5], найти общее решение
системы уравнений (1), (10) практически невозможно. Трудность заключается в вычислении граничных условий р(0) и р(£*), которые связаны следующим соотношением:
Л(^) ор(ъ) о Л(*») = л(о) ор(о) о Л(о).
Лишь для динамически симметричного КА, т.е. когда 30 = З3, задача оптимального управления решена до конца [5]. Для произвольного КА (т.е. при 3\ = 30 = З3) решение системы уравнений (1), (10) предложено находить численными методами. Кроме того, данное решение предполагает скачкообразное изменение вектора т.е. мгновенного достижении КА в начальный момент времени £ = 0 некоторой расчетной угловой скорости ^рас, движению по инерции (главный момент сил равен нулю) и мгновенном сбросе имеющейся кинетической энергии в момент времени £ = ¿* [5].
Ограничение величины располагаемого управляющего момента приводит к появлению ограниченных по времени участков набора и и гашения угловой скорости. В [5] рассматривается задача набора и гашения угловой скорости за минимальное время при помощи принципа максимума Понтрягина. В качестве ограничений на управления рассматривается случай, когда область возможных управлений описывается условием:
¿1 I 2/ \ ¿1 / ¿1
и1 + и0 + и3 < ш° .
В [5] показано, что на этапе разгона управление должно выбираться по формуле:
и = т0 3
| з • и
а на этапе торможения:
и = -т03 "
|3 • '
т.е. и во время разгона, и на этапе торможения вектор управления и должен быть параллелен вектору кинетического момента КА. В случае, когда на этапах разгона и торможения величина момента и постоянна, в [5] приводятся оценки для времени набора и гашения угловой скорости, величины «проигрыша» в критерии (9) по отношению к оптимальному релейному управлению и т.п.
3. Моделирование
В качестве примера рассмотрим результат численного моделирования из [5]. Рассмотрим разворот КА на 180° из начального положения Л(0), совпадающего с осями неподвижной системы координат, в заданное конечное положение Л(£*) за время = 240 с. Итак, имеем следующие исходные данные:
- начальное состояние
Л(0) = (1, 0, 0, 0), ^(0) = (0, 0, 0), £ = 0;
- конечное состояние
Л(£») = (0, У05, 0,59, 0,39), = (0, 0, 0), = 240;
- матрица моментов инерции КА
/ 118952,1 0 0 \
0 350466,9 0 .
V 0 0 269497,0 )
В результате решения кинематической задачи переориентации КА из Л(0) в Ä(i*) (задача оптимального разворота в импульсной постановке) в [5] было получено следующее значения вектора начальной угловой скорости:
^рас = (0,654311 °/с, 0,057723 °/с, 0, 515097 °/с).
На приведенных далее графиках независимой переменной является безразмерное время
Т = t/t,, т G [0,1].
На рис. 1 представлены компоненты вектора угловой скорости w(t). На графике хорошо различимы интервалы разгона и торможения КА. На этих интервалах компоненты вектора угловой скорости изменяются практически линейно под действием постоянно действующего момента, вычисляемого согласно полученным в [5] формулам. В момент перехода КА на этап движения по инерции и в момент окончания этого движения возникает характерный излом, видный на графиках. Значение функционала (9) составило G = 4016 Дж • с.
ю., градус/с
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Рис. 1. Компоненты вектора угловой скорости &(t)
Далее, на рис. 2-4, представлены графики программных угловых скоростей, управлений и компонент кватерниона углового положения соответственно, рассчитанные на основе ме-
Рис. 2. Компоненты вектора ш(Ь)
Рис. 3. Компоненты вектора п(Ь)
Рис. 4. Компоненты кватерниона Л(£)
тода, приведенного в [8,9]. В качестве параметрических классов функций использовались полиномы 6-й степени. В отличие от результатов, полученных согласно [5], все функции, представленные на рис. 2-4, являются гладкими. Этот факт легко объясняется тем, что, как уже отмечалось в данной статье, при построении алгоритма управления, согласно методу [7-9], программная траектория ищется в классе дважды дифференцируемых функций. Значение функционала (9) составило С = 4517,2 Дж ■ с.
Анализ приведенных результатов моделирования показывает, что при использовании численной оптимизации программной траектории управление, построенное согласно [8, 9], принимает «импульсный» характер: на начальном этапе (составляющем примерно треть интервала управления) КА сообщают необходимую угловую скорость, затем на промежуточном этапе (составляющем примерно треть интервала управления) КА движется как свободное тело (управления близки нулю), наконец на заключительном этапе происходит торможение КА. Проведенное моделирование показало, что увеличение степени полинома или числа интервалов п при использовании сплайн-расширения при построении кинематической траектории не изменяет характера управления. С ростом степени полинома или числа п лишь уменьшается время разгона и торможения и, как следствие, увеличивается максимально потребный момент управления.
Так же было проведено моделирование по методике, представленной в [7], т.е. без какой-либо оптимизации. Значение функционала (9) при этом составило С = 7579,2 Дж ■ с.
4. Заключение
В работе проведено сравнение двух различных алгоритмов управления, один из которых базируется на концепции обратных задач динамики, а другой основан на решении задачи оптимального управления при помощи принципа максимума Понтрягина. Приведен пример численного моделирования процесса переориентации КА при использовании управления, построенного по обоим алгоритмам. Приведены рекомендации по целесообразности использования того или иного алгоритма.
Выигрыш алгоритма, описанного в [5], по критерию минимума интеграла энергии вращения КА в рассматриваемом примере составил около 12%. При этом максимальный суммарный момент управления у выигравшего алгоритма примерно на те же 12% выше, чем у алгоритма, базирующегося на концепции обратных задач динамики. Выигрыш указанного алгоритма был легко предсказуем, так как сам алгоритм целиком направлен на минимизацию именно указанного в примере критерия. Таким образом, если основной целью при выполнении переориентации КА является минимизация указанного выше критерия, то следует остановить свое внимание на алгоритме, приведенном в [5]. Данный алгоритм, хотя и не является полностью оптимальным из-за того, что, согласно принципу максимума Понтря-гина, оптимальное управление подразумевает скачкообразное изменение вектора угловой скорости в начальный и конечный моменты времени, но строит управление, наиболее близкое к оптимальному. При этом следует отметить, что в данном методе связанная с КА система координат должна совпадать с главными центральными осями инерции КА. Так же остается открытым вопрос о стабилизации полученной программной траектории.
Второй из рассмотренный алгоритмов, изложенный в работах [7-9], является менее узкоспециализированным по сравнению с [5]. В качестве оптимизационного критерия может выступать и уже упоминавшийся интеграл кинетической энергии КА, и величина суммарного момента, и величина максимального момента и т.п. Данный алгоритм в отличие от предыдущего работает и в случае произвольной матрицы инерции КА. Построенное на его базе управление, стабилизирующее программную траекторию, позволяет осуществлять переориентацию КА в случае ошибок в инерционнык параметрах КА, а так же в случае воздействия каких-либо неучтенных факторов. Однако получаемые по данному методу траектории переориентации КА не являются оптимальными с точки зрения какого-либо критерия, так как синтезируемые методы управления являются результатом численной оптимизации, а не аналитическим решением оптимизационной задачи. Таким образом, данный алгоритм управления является более предпочтительным в случаях, когда при переориентации КА в разных ситуациях возникает потребность в оптимизации траектории по различным критериям, а также в случаях, когда действуют какие-либо неучтенные факторы, например ошибки в матрице инерции или внешние возмущающие моменты.
Работа выполнена при поддержке гранта РФФИ 11-01-00733 и Программы Президента РФ по государственной поддержке ведущих научных школ (грант НШ-3659.2012.1).
Список литературы
1. Алексеев К.Б. Экстенсивное управление ориентацией космических летательных аппаратов. М.: Машиностроение, 1977.
2. Бранец В.Н., Шмыглевский И.П. Применение кватернионов в задачах ориентации твердого тела. М.: Наука, 1973.
3. Левский М.В. Оптимальное управление пространственным разворотом космического аппарата//Космич. исслед. 1995. Т. 33, №5. C. 498-502.
4. Левский М.В. Задача оптимального управления терминальной переориентацией КА // Космич. исслед. 1993. Т. 31, №4. C. 12-17.
5. Левский М.В. Управление переориентацией космического аппарата с минимальным интегралом энергии // Автоматика и телемеханика. 2010. № 12. C. 25-42.
6. Челноков Ю.Н. Управление ориентацией космического аппарата, использующее кватернионы//Космич. исслед. 1994. T. 32, №3. C. 21-32.
7. Ермошина О.В., Крищенко А.П. Синтез программных управлений ориентацией космического аппарата методом обратных задач динамики // Изв. РАН. ТиСУ. 2000. № 2. C. 155-162.
8. Велищанский М.А., Крищенко А.П., Ткачев С.Б. Квазиоптимальная переориентация космического аппарата // Механика твердого тела. 2002. Вып. 32. C. 144-153.
9. Велищанский М.А., Крищенко А.П., Ткачев С.Б. Синтез алгоритмов переориентации космического аппарата на основе концепции обратной задачи динамики // Изв. РАН. ТиСУ. 2003. № 5. C. 156-163.
10. Крутько П.Д. Обратные задачи динамики управляемых систем: линейные модели. М.: Наука, 1987.
11. Крутько П.Д. Обратные задачи динамики управляемых систем: нелинейные модели. М.: Наука, 1988.
12. Петров Б.Н., Крутько П.Д. Обратные задачи динамики управляемых систем. Нелинейные модели // Изв. АН СССР. Техн. кибернетика. 1980. № 5.
13. Крутько П.Д. Конструирование алгоритмов управления нелинейными объектами на основе концепций обратных задач динамики. Системы с одной степенью свободы // Изв. АН СССР. Техн. кибернетика. 1980. № 3.
electronic scientific and t echnical periodical
SCIENCE and EDUCATION
El № FS77 - 30569. №0421100025. ISSN 1994-0408
Analysis of properties of quasioptimal and optimal algorithms for the spacecraft spatial reorientation
77-30569/345396
# 02, February 2012 M.A. Velishansky
Bauman Moscow State Technical University
The comparative analysis of two various approaches to synthesis of control's algorithms for a spatial reorientation of the spacecraft is given. One of such approaches is based on the concept of the inverse problems of dynamics. It allows to synthesize a smooth programmed control, to build the controls stabilizing program trajectories, to consider restrictions and allows to spend numerical optimization of a trajectory by the chosen criterion. The second approach is based on a synthesis of the optimal program control using the Pontryagin maximum principle. The results of numerical modeling are shown. The comparative analysis of the received results is given.
References
1. AlekseevK.B. Jekstensivnoeupravlenie orientaciej kosmicheskihletatel'nyh apparatov. M.: Mashinostroenie, 1977.
2. Branec V.N., Shmyglevskij I.P. Primenenie kvaternionov v zadachah orientacii tverdogo tela. M.: Nauka, 1973.
3. Levskij M.V. Optimal'noe upravlenie prostranstvennym razvorotom kosmicheskogo appa-rata//Kosmich. issled. 1995. T.33. № 5. C. 498-502.
4. Levskij M.V. Zadachaoptimal'nogoupravlenijaterminal'noj pereorientaciej KA. //Kosmich. issled. 1993. T.31. № 4. C. 12-17.
5. Levskij M.V. Upravlenie pereorientaciej kosmicheskogo apparata s minimal'nym integralom jenergii. //Avtomatika i telemehanika. 2010. № 12. C. 25-42.
6. Chelnokov Ju.N. Upravlenie orientaciej kosmicheskogo apparata, ispol'zujuwee kvaterniony //Kosmich. issled. 1994. T.32. Vyp.3. C. 21-32.
7. Ermoshina O.V., Kriwenko A.P. Sintez programmnyh upravlenij orientaciej kosmicheskogo apparata metodom obratnyh zadach dinamiki // Izv. RAN. TiSU. 2000. № 2. C. 155-162.
В. Veliwanskij M.A., Kriwenko A.P., Tkachev S.B. Kvazioptimal'naja pereorientacija kos-micheskogo apparata // Mehanika tverdogo tela. 2GG2. Vyp 32. C. 144-153.
9. Veliwanskij M.A., Kriwenko A.P., Tkachev S.B. Sintez algoritmov pereorientacii kosmich-eskogo apparata na osnove koncepcii obratnoj zadachi dinamiki // Izv. RAN. TiSU. 2GG3. M 5. C. 15б-1б3.
1G. Krut'koP.D. Obratnye zadachi dinamiki upravljaemyh sistem: linejnye modeli. M.: Nauka, 19В7.
11. Krut'ko P.D. Obratnye zadachi dinamiki upravljaemyh sistem: nelinejnye modeli. M.: Nauka, 19ВВ.
12. Petrov B.N., Krut'ko P.D. Obratnye zadachi dinamiki upravljaemyh sistem. Nelinejnye modeli // Izv. AN SSSR. Tehn. kibernetika. 19BG. M 5.
13. Krut'ko P.D. Konstruirovanie algoritmov upravlenija nelinejnymi ob"ektami na osnove kon-cepcij obratnyh zadach dinamiki. Sistemy s odnoj stepen'ju svobody // Izv. AN SSSR. Tehn. kibernetika. 19BG. M 3.