УДК 519.9+534.01
ОПТИМАЛЬНОЕ ДЕМПФИРОВАНИЕ КОЛЕБАНИЙ ТВЕРДОГО ТЕЛА ПРИ ЕГО ДВИЖЕНИИ ВОКРУГ НЕПОДВИЖНОЙ ТОЧКИ
© 2015 Ю.М.Заболотнов, А.А.Лобанков
Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет)
Поступила в редакцию 30.07.2015
Разработана методика построения приближенно'-оптимальных управлений при демпфировании колебаний твердого тела при его движении относительно неподвижной точки. Методика основывается на совместном применении принципа динамического программирования Беллмана и метода усреднения. Рассматриваемый метод имеет приложения в динамике управляемого движения космических аппаратов в атмосфере, при стабилизации движения малого космического аппарата на тросе и в других задачах, близких к движению твердого тела в классическом случае Лагранжа. Ключевые слова: твердое тело, случай Лагранжа, оптимальное управление, динамическое программирование, метод усреднения, устойчивость.
В работе рассматривается метод расчета приближенно оптимального регулятора для стабилизации движения твердого тела, близкого к телу вращения, относительно неподвижной точки. Предполагается, что движение твердого тела близко к движению в классическом случае Лагранжа. Метод основывается на совместном применении принципа динамического программирования Беллмана [1] и метода усреднения [2]. Метод усреднения применяется для приближенного решения уравнения в частных производных Гамильтона - Якоби - Беллмана, что позволяет осуществить синтез регулятора. Предлагаемый метод расчета регулятора может быть использован во многих задачах, близких к задаче о движении волчка Лагранжа (движение твердого тела в атмосфере, движение твердого тела на тросе при развертывании орбитальной тросовой системы и др.).
Синтез регулятора в данной работе проводится для малых углов нутации, поэтому невозмущенная система представляет собой линейную систему с гироскопическими членами. После преобразования системы к нормальным координатам синтез управления осуществляется по квадратичному критерию оптимальности на асимптотически большом интервале времени. Обратное преобразование координат позволяет записать уравнение регулятора в исходных переменных и, тем самым, решить поставленную задачу.
Движение твердого тела вокруг неподвижной точки описывается классическими динамическими и кинематическими уравнениями Эйлера относительно некоторой неподвижной системы координат. При рассмотрении движения твер-
Заболотнов Юрий Михайлович, доктор технических наук, профессор. E-mail: [email protected] Лобанков Антон Алексеевич, аспирант. E-mail: [email protected]
дого тела в окрестности статически устойчивого положения равновесия, то есть при малых углах нутации, эти уравнения удобно записать в комплексной форме. Тогда, используя результаты работы [3], получим
= sF(,¿Ш2,Ф) + 8Ы , (1)
®z = sf (r, 4 , Ф), (2)
Ф = az + sR ((, 4 ) (3)
где 4 = 9ew - комплексный угол нутации, r -
вектор медленно изменяющихся переменных,
a1 = AzG/ J, J =(jx + Jy)/2; Ax, Ay, Az - проекции
вектора Ar, определяющего положение центра масс тела относительно неподвижной точки, на оси связанной системы координат; Jx, Jy, Jz
- осевые моменты инерции тела; Jz= Jz/ J;
G - сила тяжести, Ф=^+^; sF(r,g,4;,az,ф),
s f (r, 4,az, Ф), sR ((,|) - функции, характеризующие действие малых возмущений; -классические углы Эйлера (нутации, собственного вращения и прецессии); a>z - угловая скорость вращения тела вокруг его продольной оси z ; SU
- управление, s - малый параметр.
Невозмущенное движение тела описывается следующими уравнениями
- Ja z+a 4=, (4)
Ф = a>z, az = const, r = const. (5) Решение невозмущенного уравнения (4) можно записать в виде
W2
£ = ах е4*1 + а2 е -, (6)
где и - амплитуды колебаний (вещественные величины), щ = © + щ (0) и у/2 = + У2 (0) - фазы; |щ(0),щ2(0) - начальные значения фаз; а>\ 2 = Jzсz / 2 ± © - частоты
—2 2 2 Jz сог /4 + со .
Резонансные случаи движения твердого тела, когда угловая скорость © « ©2 в данной работе не рассматриваются, так как требуют особого анализа.
Дифференцируя функцию (6) по времени в силу невозмущенной системы, получим
$ = \ (а©*1 + а2© ещ2 ). (7)
Рассматривая соотношения (6) и (7) как замену переменных (/йг)^(аьаъуъу2) и применяя метод вариации произвольных постоянных, получим стандартную систему с быстрыми фазами [3]
а = еХ (и, а ,ф,г), (8)
ф = а(г) + £У (и,а,ф,г), (9)
где а = (а1;а2) ф = (щщ2).
С учетом вышесказанного ставится задача определения управления е и, обеспечивающего динамическую устойчивость движения твердого тела вокруг неподвижной точки исходя из минимума квадратичного критерия оптимальности Т
I = е\ Ж а2, иа, ир)(М, (10)
где
W =
Ъ^2 + b2a2 + c[и2а + uß ), b,b2,c > 0
ве-
ua,uß v да дф dr
+W (а, иа, uß)) = 0,
(11)
где V (а,ф, г) - производящая функция [1], а точка (•) означает скалярное произведение векторов.
Выражение, стоящее под знаком минимума (11), представляет собой квадратичный степенной полином по компонентам управления иа, и р. Поэтому, взяв от этого выражения частные производные по иа,ир и приравняв их к нулю, нетрудно получить оптимальное управление в виде
иа =_
1
z (-1)'
(
4с®в к=1 - _L _dV_
ак dWk
dV даi
-cos Wk'
\
sin Wk
(12)
uß =-
4с®в к=1
Z (-1)
к+1
dV
да
- sin Wk +
1 dV
Л
"cos Wk
(13)
ак дУк
Выражения (12-13) обеспечивают минимум функционала (10) в силу положительной определенности функции Жа2,иа,ир) и при надлежащем определении производящей функции V. Подставив соотношения (12-13) в выражение (11) приходим к уравнению в частных производных Гамильтона - Якоби - Беллмана
д V V ( . ч д V , , .
е—• Х0 (а фг) + 70 (а, фг) +
да дф
dV
dV
+-дф'а(г) + -дт■r + *Z Ъкак + U = 0, (14)
дф dr k=1
где Xo, Fo - часть функций X ,Y, не зависящая от
управления, U = -ес
(а) +(
• = O (е), а i
и и°р определяются выражениями (12-13).
Для решения уравнения (14) применяется метод усреднения. После проведения операции усреднения уравнения (14) по фазам получим
д^
совые коэффициенты, u = uß+ iua. Причем амплитуды колебаний определяются в силу возмущенной системы и должны удовлетворять условиям динамической устойчивости ¿¡1, ¿¡2 < 0 в каждый момент времени.
Движение твердого тела рассматривается на асимптотически большом промежутке времени T = L / е, где L <ж - некоторая константа, поэтому функционал (10) изменяется на величину порядка O (1).
Согласно принципу динамического программирования, оптимальное управление определяется из условия [1]
. (dV . dV ; dV . min I —— • а + — • ф + — • r +
ua,uß ß
0 •(X0 (а,ф,r)) + е Z Ъ'а2 + да 1 ' ■ •
к=1
-(U) + O (е2 ) +... = 0,
(15)
где (•) - стандартный оператор усреднения по фазам, V) = (у),
и=-
16c® в
( dV0 ^
дал
( dV0 ^
да2
Пусть положительно определенная функция Vo (а) есть решение, удовлетворяющее уравнению первого приближения (15). Ее полная производная по времени, определенная в силу усредненной системы первого приближения, будет равна
V) =-/Ж (а,и°а,ир)\.
(16)
Учитывая вид функции W(а,ua,uß) (10) ее усредненный аналог [ж (а,ua,uß)) есть знако-
+
е
определенная по a и положительная функция. В этом случае знакоопределенность и положительность Vq (a) ведет к монотонному убыванию V (a) в силу решений усредненной (замкнутой по управлению) системы и, значит, к монотонному убыванию нормы ||a||.
Рассматривается действие линейных возмущающих функций вида sF (r, , £) = s(i/zaz + //), где Лz и л - некоторые заданные коэффициенты, которые могут зависеть от вектора r .
Усреднение функций Xq (a,ф,r), входящих в уравнение первого приближения (16) дает
Xq (a,ф,r)) = 1, (17)
2юв {V2a2 )
где Vi,2 = ±/zaz ± /®i,2, Лz и Л - параметры, характеризующие действующие возмущения.
Решение уравнения (15) в этом случае нетрудно найти, используя метод неопределенных коэффициентов. Тогда, определяя решение в виде = 2 2
V0 = S Bkak , подставляя его в (15) и приравнивая к нулю коэффициенты при ai2 и af, получим
Bk = 2а в
cVk + \fc 2ук + k
(18)
где к = 1,2.
Тогда функции оптимального управления (12-13) примут вид
ur/ ■
i
4c®,
S (-i)
в k=i
V dak
coWk'
s dV ■
--—^sin ^t
ak dWk
(19)
U°° =-
4crn,
s (-i)
k+i
в k=i
dVr
\dak 1
sin¥k +
s dV,
+——^соящ
(20)
ак д¥к
После подстановки оптимального управления (19-20) в уравнения для амплитуд и усреднения по фазам, получим в первом приближении метода усреднения
еа12 Г~2 а1,2 + Ь1,2/ с . 2тв *
(21)
рассчитанный по исходной нелинейной модели движения твердого тела.
В работе была изложена методика расчета приближенно оптимальных регуляторов, предназначенных для стабилизации движения твердого тела вокруг неподвижной точки (волчок Лагран-жа). Показано, что при наличии малых линейных возмущений существует аналитическое решение поставленной задачи.
1
¿в _1 0.5
-0.5
íímfí у. \
)) - У К i
Вид уравнения (21) подтверждает динамическую устойчивость dal 2/ & < 0 движения твердого тела при действии возмущений.
В качестве примера расчета оптимального регулятора рассматривается случай демпфирования колебаний твердого тела при следующих исходных данных:
со = 0.8с"1, (oz (0) = 1с_1, 7г = 0.8, в(0) = я72, Л = 0.05, лг = 0.01, Ъ1 = Ъ2 = 1, с = 100.
На рис. 1 показан процесс демпфирования нутационных колебаний с помощью определенного приближенно оптимального регулятора,
-1
О 0.5 1 1.5 2
Рис. 1. Процесс демпфирования колебаний на плоскости (д,в)
Хотя выше рассматривается движение твердого тела в нерезонансных областях, однако предлагаемый метод управления может быть полезен для уменьшения влияния резонансов на движение системы. При пересечении резонансных областей юz ~®1,2 система может вести по-разному. Особенно опасна реализация длительных резонансных режимов движения твердого тела (захватов в резонанс), когда резонансные отношения частот поддерживаются длительное время в силу действующих возмущений. В этом случае, как правило, происходит существенное увеличение значений амплитуд колебаний по углу нутации, что недопустимо в прикладных задачах. Во многих работах (например, [4], [5]), посвященных изучению резонансных эффектов при движении твердого тела в случае Лагранжа, показано, что поведение системы в резонансных областях (oz « а>12 в существенной степени зависит от вида пространственного движения тела, который реализуется при подходе к резонансной области. Пусть, например, при приближении к резонансной области имеем G>z > 0, тогда осуществляется проход через резонанс са1 1, и устойчивость резонансного режима движения определяется изменением амплитуды аВ общем случае реализация захвата в резонанс имеет вероятностный характер (случайными являются значения фаз и других характеристики движения тела при пересечении резонанса). Однако, если значения амплитуды а 1 малы, то достаточные условия устойчивости резонанса, как правило, не
выполняются, и реализация захватов в резонанс маловероятно. Отсюда следует очевидный вывод, что если тело близкое к телу вращения имеет специально созданную закрутку в положительном направлении сoz > 0, регулятор надо строить так, чтобы осуществлялось приоритетное демпфирование амплитуды а 1, что можно обеспечить в рамках рассматриваемой постановки задачи, увеличивая весовой коэффициент Ь1 в критерии оптимальности (10). С точки зрения описания движения в исходных переменных при подходе к резонансной области необходимо реализовать случай так называемой обратной прецессии твердого тела, когда соz > 0 и dу / & < 0. Аналогично, если az < 0, то необходимо уменьшить амплитуду а2, чтобы обеспечить dщ / dt > 0.
СПИСОК ЛИТЕРАТУРЫ
1. Летов А.М. Динамика полета и управление. М.: Наука, 1969. 360 с..
2. Моисеев Н.Н. Асимптотические методы нелинейной механики. М.: Наука, 1981. 400 с.
3. Заболотнов Ю. М., Любимов В.В. Вторичные резонансные эффекты при вращении твердого тела вокруг неподвижной точки // Механика твердого тела. 2002. № 1. С. 49-59.
4. Ярошевский В.А. Движение неуправляемого тела в атмосфере. Москва. Машиностроение. 1978. 168 с.
5. Заболотнов Ю. М. Асимптотический анализ квазилинейных уравнений движения в атмосфере КА с малой асимметрией III // Космические исследования. РАН. 1994. Т.32. Вып.4-5. С.112-125.
OPTIMUM OSCILLATIONS SUPPRESSION OF THE SOLID BODY AT ITS MOTION ROUND THE FIXED POINT
© 2015 Yu.M.Zabolotnov, A.A.Lobankov
Samara State Aerospace University named after academician S.P. Korolev (National Research University)
The technique of construction of approximately optimal controls at oscillations suppression of a solid body at its motion concerning a fixed point is developed. The technique is based on joint application of a principle of dynamic programming of Bellman and an averaging method. The considered method has appendices in dynamics of controlled motion of space vehicles in atmosphere, at stabilization of motion of the small space vehicle on a tether and in other problems, close to motion of a solid body in a classical case of Lagrange.
Keywords: solid body, case of Lagrange, optimal control, dynamic programming, method of averaging, stability.
Zabolotnov Yurii Mikhailovich, Doctor of Technical Sciences, Professor. E-mail: [email protected] Lobankov Anton Alekseevich, Graduate Student. E-mail: [email protected]