Научная статья на тему 'Алгоритм параметрической адаптации базового закона управления ориентацией большой космической конструкции на основе оценки огибающей мод упругих колебаний'

Алгоритм параметрической адаптации базового закона управления ориентацией большой космической конструкции на основе оценки огибающей мод упругих колебаний Текст научной статьи по специальности «Математика»

CC BY
155
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
БОЛЬШАЯ КОСМИЧЕСКАЯ КОНСТРУКЦИЯ / УПРУГИЕ КОЛЕБАНИЯ / ОГИБАЮЩАЯ / АДАПТИВНОЕ УПРАВЛЕНИЕ / LARGE SPACE STRUCTURE / FLEXIBLE OSCILLATION / ENVELOPE / ADAPTIVE CONTROL

Аннотация научной статьи по математике, автор научной работы — Силаев Андрей Владимирович

Рассмотрена проблема снижения уровня упругих колебаний в угловом движении большой космической конструкции. Для ее решения предложен алгоритм адаптации параметра базового закона управления ориентацией объекта. Алгоритм основан на получении оценки общей огибающей мод упругих колебаний и ее минимизации методом случайного поиска с обучением.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Силаев Андрей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ALGORITHM OF PARAMETER ADAPTATION OF A BASE ORIENTATION CONTROL LAW FOR A LARGE SPACE STRUCTURE ON THE BASE OF FLEXIBLE MODES ENVELOPE ESTIMATION

The problem of reduction of flexible oscillation magnitude in angular motion of a large space structure is considered. The algorithm of parameter adaptation of a base orientation control law is proposed to solve the problem. The algorithm is based on estimation of the total envelope of flexible modes and its minimization by means of random search with training.

Текст научной работы на тему «Алгоритм параметрической адаптации базового закона управления ориентацией большой космической конструкции на основе оценки огибающей мод упругих колебаний»

У

правление подвижными объектами

УДК 517.977.5:629.7

АЛГОРИТМ ПАРАМЕТРИЧЕСКОЙ АДАПТАЦИИ БА3000Г0 ЗАКОНА УПРАОЛЕНИЯ ОРИЕНТАЦИЕЙ БОЛЬШОЙ КОСМИЧЕСКОЙ КОНСТРУКЦИИ НА ОСНООЕ ОЦЕНКИ ОГИБАЮЩЕЙ МОД УПРУГИХ КОЛЕБАНИЙ1

А.В. Силаев

Рассмотрена проблема снижения уровня упругих колебаний в угловом движении большой космической конструкции. Для ее решения предложен алгоритм адаптации параметра базового закона управления ориентацией объекта. Алгоритм основан на получении оценки общей огибающей мод упругих колебаний и ее минимизации методом случайного поиска с обучением.

Ключевые слова: большая космическая конструкция, упругие колебания, огибающая, адаптивное управление.

ВВЕДЕНИЕ

При разработке систем управления ориентацией больших космических конструкций (БКК) необходимо учитывать возмущающее влияние упругих колебаний нежестких элементов конструкции (панелей солнечных батарей, антенн и др.) на угловое движение объектов. Эти упругие колебания описываются модами, общее число которых может быть достаточно большим. При определенных условиях возможен резонанс отдельной моды, т. е. ее амплитуда будет неограниченно возрастать, и при достижении ею некоторого критического значения произойдет захват регулятора упругими колебаниями и потеря устойчивости БКК.

В связи с этим алгоритмы управления ориентацией БКК, полученные для жесткого объекта, оказываются неработоспособными. Необходима разработка алгоритмов, позволяющих в условиях полета, во-первых, контролировать текущий уровень упругих колебаний и, во-вторых, снижать его до

1 Работа выполнена при финансовой поддержке РФФИ (проект № 08-08-00512).

допустимого значения, в идеальном случае минимизируя его. Первая задача была решена в работе [1], решению второй посвящена данная работа.

1. ПОСТАНОВКА ЗАДАЧИ

В качестве математической модели углового движения БКК рассмотрим модально-физическую модель [2] как наиболее удобную форму описания упругих мод:

х = т(и),

х + ю2 х = кгт(и), і = 1, п, (1)

П

х = х + х, х = ^ х і,

і = 1

где х — координата движения БКК как абсолютно жесткого тела; х г- — координата і-й моды упругих колебаний; юі и кі — соответственно собственная циклическая частота и коэффициент возбудимости і-й моды; п — число учитываемых мод; т(и) — приведенный управляющий момент; и = и(х, х,

t, 1) — базовый релейно-логический закон управления; х и х — доступные измерению координаты

объекта; X — дополнительная составляющая координаты х, обусловленная упругими колебаниями; X — параметр базового закона управления, доступный адаптации.

Предполагается, что собственные частоты мод ю; упорядочены по возрастанию. Отметим, что случай недемпфированных мод наиболее опасен в смысле влияния на устойчивость всей системы управления ориентацией БКК в целом, именно поэтому он и рассматривается в данной работе.

Рассматривается базовый релейно-логический алгоритм управления, наиболее распространенный в практике угловой стабилизации БКК с большим сроком существования. Применение подобных алгоритмов, как правило, вызывает автоколебания, которые не должны нарушать требуемую динамику процессов управления в замкнутой системе, что достигается выбором соответствующего алгоритма. Обычно эти алгоритмы формируются в виде релейной функции, содержащей зону нечувствительности е и гистерезис у, существенно влияющие на динамические характеристики системы управления ориентацией.

Рассмотрим один из возможных алгоритмов [3], на основе релейно-логической функции ы(х, ?) с использованием только одной измеряемой координаты х. Если пренебречь упругими колебаниями

(т. е. при х « 0, х « х), то в окрестности координат, достаточно близко примыкающей к области существования предельного цикла, этот алгоритм может быть описан следующим образом:

ы(х, ?) =

+ ыЕУ|х < е V ? < ^;

— UMVX ^ Е V t £ [ tо, ], х() = Е — у, — tfl = Т^;

+ ы^х < е — у л t е [ /ь t1 ], ^ = т2 = к{1ь к < 1;

+ Ы^|х < Е — у V t > t2.

Сигналы (напряжения) +ыи, — ыи, +ые используются для включения исполнительного органа, создающего управляющие воздействия +ти, — ти, +т& соответственно. Для пояснения работы алгоритма на рис. 1 представлена фазовая плоскость, отображающая автоколебания, вызываемые данным алгоритмом при некоторых значениях его параметров. Пусть «0» — начальная точка, соответствующая моменту ^ начала функционирования системы стабилизации. Для определенности х(/0) > е. В соответствии с данным алгоритмом к объекту прикладывается воздействие — ти, уменьшающее начальное отклонение. В некоторый момент t =

Рис. 1. Движение системы на фазовой плоскости в окрестности предельного цикла без учета упругих колебаний

т(и(х,1))

+Щ<

+тг

С 11 5 < 13 >

-т„ < Т0 »

Рис. 2. Приведенный управляющий момент в режиме автоколебаний

изображающая точка попадет на линию переключения Х2(х(/х) = е — у). Время движения по траектории «0 — 1», равное тх = — /0, измеряется и за-

поминается. По сигналу датчика угла х(^) = е — у управляющее воздействие, приложенное к объекту, меняет знак на противоположный (+ти), под влиянием которого осуществляется торможение объекта в течение расчетного времени т2 = к{т1,

0 < к < 1. Далее под влиянием «слабого» управления +тЕ по траектории пассивного движения «2—3» внутри зоны нечувствительности система возвращается на исходную правую границу зоны нечувствительности в точке 3 (х(/3) е Хх), выходя в конечном счете на траекторию предельного цикла Г. Функционирование регулятора в режиме автоколебаний (Г), представленное периодической последовательностью импульсов управляющего воздействия, отображено на рис. 2. Вид автоколе-

баний, установившихся в системе, зависит от соотношения значений т , т и к.. Автоколебания,

и е t 5

представленные на рис. 1 и 2, соответствуют случаю минимального расхода энергии и являются односторонними, т. е. фазовая траектория движения системы никогда не пересекает левую границу зоны нечувствительности, на которой x(t) = —Б.

Параметры автоколебаний хх, т2 и т3, как и общий период цикла Т0 = + т2 + т3, определяются

параметрами базового алгоритма б, у, к, ти и те по известным соотношениям [3]. При учете упругих

колебаний БКК X фазовый портрет движения системы искажается. При малых начальных значениях фазовых координат мод X (0), X (0) и их коэффициентов возбудимости кг, i = 1, п в фазовом портрете движения возникают небольшие отклонения от предельного цикла движения БКК как жесткого тела (рис. 3). С ростом начальных значений и коэффициентов возбудимости мод фазовый портрет все более «размывается», и предельный цикл пропадает.

Рассмотрим базовый алгоритм более общего вида

и(х, *) =

'+меу|X < е V г < г0;

—ицV* ^ е V г е [], х() = е — у, = Т1;

+м^^х<е — уА ге [], г2 — = Т2 = ^^т^;

+меV* е [—е, е — у) а X; < 0 V г е (?2, г3], х(г3) = —е;

+ и^х < —е V х е [ —е, — е + у)а X; > 0 V г е [ г3, ^), х(г4) = — е + у, — ?з = Т3;

—WцVx ^ — е + у А г е [/4, /5], /5 — /4 = Т4 = &^Тз;

—и^х < е а г > г5.

В алгоритме (2) параметр kt доступен целенаправленному изменению в определенных пределах. Если пренебречь упругими колебаниями, то данный алгоритм при определенных значениях ии, ие и к приводит к двухсторонним автоколебаниям, характеризующимися пересечением левой границы зоны нечувствительности в момент времени t3(x(t3) = —б). При этом к объекту прикладывается управляющее воздействие +ти, действующее до момента времени ^, при котором x(t4) = —б + у. Длительность отрезка времени Ц = t4 — Ц запоминается, управляющее воздействие меняет знак, становится равным —ти и действует в течение времени т4 = кт3 до момента t5. После этого воздействие принимает значение — те до пересечения изображающей точкой линии переключения Ьг Возможны и другие версии приведенного алгоритма.

(2)

Рис. 3. Движение системы на фазовой плоскости при малых начальных значениях координат мод и коэффициентов возбудимости

В данной работе в качестве базового алгоритма будем рассматривать алгоритм (2).

Для учета влияния упругих колебаний на динамику движения замкнутой системы необходимо знать не сами мгновенные значения координат

мод X' (0, а их амплитуды, которые изменяются во времени в зависимости от управляющего воздействия т(и). Поэтому будем характеризовать моды

их огибающими а;.(^, i = 1, п, а дополнительное

движение X (О, обусловленное упругими колебаниями, — общей огибающей а(^. Существуют различные методы получения этих огибающих. В работе [1] предложены два метода получения огибающих упругих мод: тригонометрический (при релейно-логическом управлении) и метод динамического оценивания (при более общем виде управления). Остановимся на втором из них.

В соответствии с методом динамического оценивания огибающая а. /-й моды определяется следующим образом:

Л. = —(к./ю)т(и^ іпю.і, Ві = —(к./ю.)т(и)со8юі,

/~2 ~2 -----------------

а. = *]ЛІ + В■ , і = 1, п,

(3)

(4)

при начальных условиях А г- (0) = X г- (0), Вг- (0) =

= — X' (0)/юг, где начальные значения мод X,■ (0) и

X (0) предполагаются заданными (например, оцениваются с помощью наблюдателя состояния).

а

Движение х {(t) ограничено областью [—аг(^, а;(ЭД. Общая огибающая п учитываемых мод определяется суммой огибающих отдельных мод

П

я(0 = аг(^. Движение БКК с учетом упругих

I = 1

колебаний всегда будет находиться в области

[ х (^ — а(^, х (^ + я(0].

При определенных условиях, налагаемых на спектр сигнала управления и упругих мод, возможен неограниченный рост огибающей а(^ по сравнению со значением координаты х (^.

Необходимо разработать алгоритм адаптации параметра к* базового закона управления (2) в зависимости от имеющейся информации (от частот упругих мод, коэффициентов возбудимости и начальных условий, управляющего воздействия т(и) в виде функции времени, угловой координаты х объекта и угловой скорости х), позволяющий существенно снизить общую огибающую упругих колебаний, не допустив ее неустойчивости.

2. АЛГОРИТМ ПАРАМЕТРИЧЕСКОЙ АДАПТАЦИИ

Для разработки алгоритма параметрической адаптации необходимо сначала оценить зависимость общей огибающей упругих мод а от коэффициента к*, доступного адаптации. Результаты цифрового моделирования движения конкретного объекта, о котором речь будет идти в дальнейшем, при законе управления (2) показали, что общую огибающую а(^ можно приближенно считать почти периодической функцией. Поскольку влияние параметра к* на значение а(^ проявляется не мгновенно, а с определенной динамикой, зависимость общей огибающей от к* следует оценивать не по мгновенному значению а(^, а по осредненному на отрезке времени длительностью, значительно превышающей период функции а(^, как это было предложено в работе [4] для выявления неустойчивой моды.

Таким образом, для оценки характера зависимости общей огибающей упругих мод от параметра адаптации к* необходимо при одних и тех же начальных условиях мод вычислять среднее значение

*0 + т

общей огибающей а = - [ а(^Л на отрезке вре-

*0

мени [^, ^ + Т ] при различных значениях к* в заданном диапазоне. Полученная в результате зависимость для конкретного объекта, значения параметров которого приведены далее (см. § 3 данной работы), представлена на рис. 4. Видно, что зави-

Рис. 4. Зависимость среднего значения общей огибающей мод от параметра адаптации

симость а (к*) имеет локальные минимумы. Задача сводится к адаптивной настройке параметра к* к своему значению, при котором обеспечивался бы локальный (или, в наилучшем случае, глобальный)

минимум функции а. Эта задача нелинейного программирования вследствие явно нелинейного

характера зависимости а (к*).

Описать аналитически данную зависимость не

представляется возможным, поскольку а зависит, кроме параметра к*, от многих других факторов: начальных значений мод, их собственных частот и коэффициентов возбудимости и ряда других. Поэтому для решения этой задачи применим поисковый алгоритм адаптации, основанный на методе случайного поиска с обучением [5].

Предлагаемый алгоритм работает в реальном времени параллельно с базовым алгоритмом управления (2) и заключается в следующем.

1. На начальном шаге (*0 = 0, к = 0) задается начальное значение параметра к* = к(0).

2. Моделируется общая огибающая мод а(^ по уравнениям (3) и (4), вычисляется среднее значение общей огибающей а( 0) = а (к*0)) в момент времени t = Т, выбирается случайное вещественное число г(0), равномерно распределенное на отрезке [-1, -].

3. Переход к новому шагу к = к + 1, устанав-

, (к) ,(к - 1) ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ливается новое значение параметра к* = к* +

+ г(к — 1)Ак*, где Ак* — заданное малое приращение параметра.

4. Моделируется общая огибающая мод по уравнениям (3) и (4), запоминается предыдущее

—(к - 1)

значение а в момент времени ? = (к + 1) Т, вы-

-(к)

числяется новое значение а и его относительное

„ 1/-(к) -(к - 1К,-( к),

изменение 8 = |( а — а )/а |.

5. До момента времени ? = (к + 1)Т, меньшего некоторого заданного значения ТтПп, при выборе

следующего случайного числа г(к) используется

опыт, полученный на предыдущем шаге: если

-(к) -(к -1) „ а < а , то направление поиска значений

параметра к на предыдущем шаге было выбрано верно, и его необходимо сохранить прежним на текущем шаге, поэтому выбирается новое случайное число г(к) одного знака с предыдущим числом г(к 1), в противном случае г(к) выбирается противоположного знака по отношению к г(к 1). Для исключения случайного однократного изменения

-(к) -(к) -(к - 1)

знака А а = а — а с минуса на плюс при

условии, что на протяжении нескольких (например, четырех) тактов подряд значение а( к) уменьшалось, это изменение знака игнорируется, и знак

(к) _(к) тт

г ’ изменяется лишь при повторном росте а . Далее переход к п. 3.

6. В случае 11 ТтП проверяется условие окончания процесса адаптации: если 8 < 80, где 80 — заданное малое положительное число, в течение нескольких (например, шести) тактов подряд (что свидетельствует о приближении к локальному минимуму а), то фиксируется последнее значение параметра к, в противном случае переход к п. 3. ♦

Необходимость фиксации к в конце работы алгоритма объясняется тем, что в противном случае при приближении к значению к соответствующему локальному минимуму а, начинается чередование знака случайного числа г(к) вследствие существенных колебаний значений а около своего минимального значения (см. § 3).

Значения ТтП и 80 выбираются экспериментальным путем.

3. ИЛЛЮСТРИРУЮЩИЙ ПРИМЕР

Рассмотрим с помощью цифрового моделирования работу алгоритма для системы управления ориентацией БКК, математическая модель которой имеет вид (1) при следующих значениях исходных

данных: ю1 = 0,44 с—1, ю2 = 0,755 с—1, к1 = 0,0213, к2 = 0,0216 и базовом алгоритме (2) при б = 5^ 10—4,

у = 10 4, ти = 4 • 10 5, те = 10 6 и начальных условиях X 1 (0) = 2,75 • 10—6, X 1 (0) = Х2 (0) = Х2 (0) = 0,

х (0) = 4,5Ч0_4, X (0) = 2,2Ч0_5.

Отметим, что учет только двух низкочастотных мод (п = 2) не является принципиальным ограничением, а принят с целью сокращения времени моделирования, поскольку из-за длительного времени функционирования объекта его моделирование тоже должно проводиться на большом отрезке времени (более 20 000 с). Это ведет к необходимости выбора малого шага интегрирования дифференциальных уравнений мод (1), причем с ростом частоты моды этот шаг должен уменьшаться соответствующим образом, чтобы избежать накопления недопустимого значения погрешности при численном интегрировании уравнений мод. Работоспособность алгоритма оценки общей огибающей объекта с пятью модами (в том числе тремя высокочастотными) была продемонстрирована в работе [1], там же была оценена адекватность полученной огибающей исходной точной модели движения. В связи с этим введение новых высокочастотных мод, имеющих, как правило, существенно меньшие значения амплитуд и коэффициентов возбудимости, не должно привести к нарушению работы алгоритма, но значительно (на несколько порядков) увеличит время цифрового моделирования на том же отрезке времени.

Значение параметра адаптации к может изменяться в диапазоне от 0,28 до 0,4. Пусть начальное значение к равно 0,31. Работоспособность алгоритма существенно зависит от выбора начального значения к: в диапазоне варьируемых значений

параметра к функция а (к) должна изменяться относительно медленно и иметь малое число локальных минимумов. В соответствии с этим правилом по рис. 4 можно установить, что при заданных начальных условиях мод допустимые значения к в смысле работоспособности предложенного алгоритма лежат в диапазоне от 0,3 до 0,363. Этим и обусловлен выбор начального значения кг При изменении начальных условий мод в определенных пределах (до четырех-пяти раз в сторону увеличения и до нуля в сторону уменьшения) характер зависимости а (к) качественно не изменяется, и всегда присутствует участок медленного изменения а с несколькими локальными минимумами. Количественные значения этих минимумов изменяются.

Рис. 5 характеризует работу замкнутой системы без адаптации параметра кгЗадача оптимизации расхода энергии здесь не ставилась, поэтому при заданном соотношении величин ти, те и к в сис-

Рис. 5. Работа системы без параметрической адаптации:

а — движение системы на фазовой плоскости; б — приведенный управляющий момент; в — координата х упругих колебаний и общая огибающая а на малом отрезке времени; г — общая огибающая упругих колебаний и ее среднее значение а

х10

г, с

г, с

Рис. 6. Работа системы с адаптацией параметра к,

x10 5

x104

Рис. 7. Работа системы при отсутствии в алгоритме адаптации фиксации значения параметра к,

теме устанавливаются двухсторонние автоколебания (рис. 5, а и б). Из рис. 5, в видно, что а(?) на участке установившихся колебаний можно считать периодической функцией с периодом около 45 с, поэтому длительность Т интервала осреднения а(?) выберем значительно большей, например, равной 500 с. Из рис. 5, г видно, что устанавливаются колебания общей огибающей а(?) около своего среднего значения а = 2 •Ю-5. При этом шаги интегрирования для каждой моды были выбраны различными: для первой 5^10 4 с, для второй 10-4 с. Обеспечивается хорошая точность совпадения огибающей а(?) с дополнительной координатой х (?) упругих колебаний.

Теперь применим предложенный алгоритм параметрической адаптации с фиксацией значения к,, если в течение шести тактов относительное изменение а не превышало величины 80 = 5 %, причем минимальное время Тш1п, после которого начинает действовать это правило, равно 10 000 с. Результаты работы алгоритма представлены на

рис. 6. Из рис. 6, а и б видно, что а стабилизируется около значения 6,6-10 6 при фиксированном значении параметра к, равном 0,3389. Таким образом, установившееся значение а снизилось в три раза.

Если не фиксировать параметр к( при относительно малых изменениях а, то процессы в системе будут иметь вид, представленный на рис. 7: начнутся колебания величин а, а и к{ около значений, соответствующих локальному минимуму а,

причем амплитуда колебаний а и а будет весьма существенной.

ЗАКЛЮЧЕНИЕ

Предложен алгоритм параметрической адаптации базового закона управления угловой ориентацией БКК, основанный на методе случайного поиска с обучением в зависимости от результатов на предыдущем шаге (шагах). Критерием адаптации служит среднее значение огибающей упругих колебаний объекта. На конкретном примере продемонстрирована эффективность алгоритма, выражающаяся в существенном (троекратном) снижении значения данного критерия.

Применение конкретного базового алгоритма, учет только двух низкочастотных мод не снижают общности полученных результатов.

Применение предложенного метода ограничено условием относительно низкого уровня рассматриваемых мод по отношению к координате движения БКК как абсолютно жесткого тела. Оценка их допустимого соотношения осталась за рамками данной работы и может составить предмет дальнейших исследований.

ЛИТЕРАТУРА

1. Силаев А.В., Суханов В.М. Методы оценки огибающей упругих колебаний деформируемого космического аппарата // Автоматика и телемеханика. — 2002. — № 4. — С. 76—90.

2. Рутковский В.Ю., Суханов В.М. Большие космические конструкции: модели, методы исследования и принципы управления // Там же. — 1996. — № 8. — С. 55—66.

3. Rutkovsky V.Yu., Sukhanov V.M., Dodds S.J. Nonexciting control by orientation of flexible space vehicles // Proc. 14th IFAC Symposium on Automatic Control in Aerospace, Seoul. 1998.

4. Силаев А.В. Синтез корректирующего закона управления деформируемым космическим аппаратом на основе оценки огибающих упругих мод // Авиакосмическое приборостроение. — 2006. — № 2. — С. 57—63.

5. Банди Б. Методы оптимизации. — М.: Радио и связь, 1988.

Статья представлена к публикации членом редколлегии В.Ю. Рутковским.

Силаев Андрей Владимирович — канд. техн. наук,

ст. науч. сотрудник, Институт проблем управления

им. В.А. Трапезникова РАН, г. Москва, ®(495) 334-87-79.

i Надоели баннеры? Вы всегда можете отключить рекламу.