УДК 62.50 ББКЖ30
АДАПТИВНОЕ УПРАВЛЕНИЕ ЛЕТАТЕЛЬНЫМ АППАРАТОМ С ИДЕНТИФИКАЦИЕЙ НА СКОЛЬЗЯЩИХ РЕЖИМАХ 1
Андриевский Б. Р. 2 Фрадков А. Л. 3
(Учреждение Российской академии наук Институт проблем машиноведения РАН, Санкт-Петербург)
Рассматривается адаптивное управление угловым боковым движением беспилотного летательного аппарата при слежении за командным сигналом по углу рыскания и наведении. Предложено использовать комбинированный адаптивный регулятор, содержащий параллельный компенсатор («шунт»), контур идентификации параметров, регулятор с переменной структурой и настраиваемую последовательную модель. Процедура синтеза адаптивного регулятора продемонстрирована на типовой модели динамики движущегося в атмосфере летательного аппарата. Приведен численный пример управления полетом многорежимного летательного аппарата.
1 Работа выполнена при финансовой поддержке РФФИ, гранты №№ 08-01-00775, 09-08-00803, Совета по грантам Президента РФ для поддержки молодых ученых и ведущих научных школ, проект НШ-2387.2008.1 и Межсекционной программы фундаментальных исследований ОЭММПУ РАН 2 «Проблемы управления и безопасности энергетики и технических систем». Авторы признательны С. А. Красновой и
В. А. Уткину (ИПУ РАН) за внимание к работе и ряд полезных замечаний.
2 Андриевский Борис Ростиславич, доктор технических наук, ведущий научный сотрудник ([email protected]).
3 Фрадков Александр Львович, доктор технических наук, заведующий лабораторией ([email protected]).
Ключевые слова: беспилотный летательный аппарат, адаптивное управление, метод шунтирования, идентификация, скользящий режим.
1. Введение
С развитием авиационной техники к системам автоматического управления летательными аппаратами (ЛА) предъявляются все более строгие требования. Системы автопилотирования ЛА должны обеспечивать точную и быструю реакцию на командное воздействие, несмотря на значительные изменения условий полета. Поэтому важным требованием при разработке автопилотов является обеспечение высоких динамических свойств при существенной параметрической неопределенности [7,16,17,39]. Адаптивное управление [2,3,7,11,16,17,21,24] является одним из основных методов выполнения указанных требований. Выбранный метод адаптации должен удовлетворять противоречивым требованиям к быстродействию процесса адаптации и качеству процессов в системе при недостатке текущей информации о элементах движения ЛА. Алгоритмы управления систем с переменной структурой, использующих принудительные скользящие режимы, обеспечивают высокое быстродействие при парировании параметрических возмущений в некоторой области [20], но в общем случае не обеспечивает оптимального поведения замкнутой системы. Методы настройки регулятора, основанные на адаптивной идентификации, облегчают возможность решения оптимизационных задач, но обычно связаны с более длительным периодом настройки [2,3,7,17,24].
В данной статье для задачи управления полетом многорежимного ЛА используется комбинированный адаптивный регулятор [5,25], который включает как регулятор с переменной структурой, так и подсистему идентификации, что облегчает выполнение указанных выше требований. При синтезе регулятора учитывается также неполнота сведений о текущих координатах объекта управления. Недостаток информации о состоянии объекта мотивирует разработку методов адаптивного управления с неизвест-
114
ным относительным порядком модели объекта и при измерении только его выхода (а не производных), см. [9, 15]. Недостатком известных методов является сложность (высокий порядок) предлагаемых алгоритмов, которая затрудняет их реализацию и снижает помехоустойчивость. Некоторые более простые алгоритмы предложены в [15] и описаны в книге [14]. На преодоление этого недостатка направлен также развитый в [23,25,26] метод шунтирования, основанный на использовании параллельного компенсатора (шунтирующего звена, или «шунта»). Основная идея метода заключается в обеспечении свойства строгой минимально-фазо-вости (СМФ) расширенного объекта (включающего собственно объект управления и компенсатор [14,23,30,31,35]).
В 1960-х годах в ИПУ РАН положено начало развитию теории и методов применения систем управления с переменной структурой (СПС) [10,18-20]. Основная идея построения СПС состоит в использовании переключающихся законов управления (соответствующим различным структурам замкнутой системы) [19,20]. Переключение происходит на основе текущей информации о состоянии объекта управления в соответствии с выбранной функцией переключения. Такой принцип построения устройства управления существенно расширяет возможности управления вследствие использования полезных свойств каждой из структур и, кроме того, позволяет получить новые свойства, не присущие ни одной из них. Возможны различные способы построения СПС. Наиболее универсальным и разработанным методом является принудительная организация в замкнутой системе скользящих режимов, при которых изображающая точка в пространстве состояний системы движется по выбранной поверхности. На эту поверхность точка попадает за конечное время после начала переходного процесса [18,20], а затем остается на ней. В результате поведение замкнутой системы мало зависит (или совсем не зависит) от параметров объекта управления, а определяется выбранным при синтезе регулятора уравнением поверхности переключения. Тем самым, принудительные скользящие режимы позволяют снизить чувствительность системы к параметрическим и
115
координатным возмущениям, а также добиться инвариантности по отношению к задающему воздействию. Требуемые динамические свойства замкнутой системы обеспечиваются надлежащим выбором поверхности переключения, вид которой задается при синтезе. Полезной особенностью скользящих режимов является также возможность декомпозиции задачи проектирования. Синтез регулятора разбивается на две более простые подзадачи:
- создание устойчивых скользящих режимов;
- выбор поверхности переключения, движение по которой обладает желаемыми свойствами.
Скользящие режимы могут использоваться также для идентификации параметров и состояния объекта [12,20].
В [5,25] предложен подход, основанный на совместном использовании метода шунтирования, скользящих режимов и процедуры идентификации. Алгоритм управления включает регулятор с переменной структурой с принудительными скользящими режимами [20], алгоритм параметрической идентификации и параллельный компенсатор (или шунт) [23,25,30,31,34]. Использование метода позволяет существенно снизить требования к полноте текущей информации о поведении объекта. Комбинированный алгоритм адаптации обеспечивает заданные динамические свойства замкнутой системы при изменении параметров объекта управления в широких пределах.
В данной работе показано применение подхода [5,25] к таким задачам управления ЛА, как отработка командного угла рыскания и задача сближения с подвижным объектом (самонаведение). Результаты работы были ранее частично изложены в [5,27,28,32].
Постановка задачи адаптивного управления угловым движением ЛА дается в разделе 2, где также приведена используемая в данной работе модель динамики ЛА. Общая процедура синтеза комбинированных адаптивных регуляторов указанного типа описана в разделе 3. Применению данного метода для управления боковым угловым движением ЛА посвящен раздел 4, где рассмотрен процесс отработки программного задающего сигнала рыскания, а также процесс сближения с движущейся целю.
116
Приведены результаты моделирования для гипотетического ЛА.
2. Постановка задачи. Уравнения динамики ЛА
В качестве примера применения предложенного метода рассмотрим задачу управления движением летательного аппарата (ЛА) по рысканию. Пусть ЛА имеет постоянные, априорно неопределенные параметры, значения которых лежат в заданной ограниченной области. Заметим, что подобная ситуация может иметь место при полете на различных режимах, когда высота, скорость и нагрузка ЛА изменяются медленно по сравнению с темпом угловых движений. Для описания динамики углового движения ЛА используем следующие линеаризованные уравнения [6-8]
(в (г) = Шу (г) + авх в (г) - а6/ 5г (г),
(1) I Шу (г) = -а^у в (г) - а^у Шу (г) - ат 5г (г),
[^(г) = Шу (г),
где ф(г), шу(г) - угол и угловая скорость рыскания; в(г) - угол
скольжения; 5Г (г) - угол поворота рулей направляния; а^, а^у, Огпу, а^ и аёту - параметры ЛА. Их значения зависят от указанных выше факторов и могут изменяться в широких пределах в зависимости от высоты и скорости полета. Точные значения параметров априорно не определены. Предполагаем также, что динамикой исполнительного органа можно пренебречь и считать, что управляющим сигналом, вырабатываемым автопилотом, является непосредственно величина отклонения рулей §г(г). Считаем, что доступна измерению только регулируемая координата ф(г), без угловой скорости шу(г). Уравнениям (1) отвечает передаточная функция (2), где deg А(в) = 3, degB(s) = 1, к = 2 .
Естественным требованием является обеспечение заданных динамических характеристик замкнутой системы “автопилот-ЛА” для различных условий полета. Эти требования часто выражаются через заданную эталонную модель.
Коэффициенты передаточной функции объекта управления (2) связаны с параметрами модели ЛА (1) соотношениями
ШУ в в ШУ в
a1 — amy az j a2 — amy arriy az j
a3 — 0, bo — -asmiy, bi — ^ aPz + afr amy.
3. Алгоритм комбинированного адаптивного управления
Для решения поставленной задачи применим комбинированный адаптивный регулятор [5,25,32]. Ниже, следуя [5], приводятся вспомогательные сведения, необходимые для дальнейшего изложения.
3.1. Математическая формулировка задачи
Рассмотрим линейный стационарный объект управления со скалярным управлением и выходом, уравнения состояния которого имеют вид
(1) Xp(t) — ApXp(t) + Bpu(t), yp(t) — CpXp(t),
где xp(t) G Rn, u(t) G R , yp(t) G R. Передаточная функция объ-
екта (1) имеет вид
(2) Wp(s) — Cp (sin - Ap)-1 Bp — AS),
где s G C - аргумент; degA(s) — n, degB(s) — m,k — n —
m - относительный порядок передаточной функции объекта. Полагаем, что Wp(0) > 0, k > 1.
Рассмотрим задачу адаптивного управления объектом при существенной априорной неопределенности его параметров. Кроме того, считаем, что измерению доступен только выход y(t) (а не его производные). Пусть требуется, чтобы поведение замкнутой системы отвечало следующему уравнению (см. также [2,16,24,30])
(3) Am(p)yp(t) — K B(p)r(t),
118
где r(t) - задающее (командное) воздействие; p - оператор дифференцирования (p = d/dt); Am(s) - некоторый заданный гурвицев
Am(0)
многочлен степени n; K = ^ . Уравнение (3) соответствует
рассмотренной в работах [22, 26] неявной эталонной модели и приводит к менее жестким ограничениям на поведение системы, чем явная эталонная модель (см., напр., [11, 16]). Параметр K вводится для обеспечения астатизма системы.
3.2. Алгоритмическая структура комбинированного адаптивного регулятора
Используемый в данной работе алгоритм адаптивного управления включает в себя:
— регулятор систем с переменной структурой (СПС) для организации скользящих режимов, обеспечивающий «идеальное» слежение за командным сигналом;
— настраиваемую последовательную модель (далее называемую «префильтром»), предназначенную для выработки командного сигнала на СПС;
— блок параметрической идентификации объекта;
— шунтирующее звено, позволяющее снизить число измеряемых выходных координат объекта.
Ниже подробно описываются алгоритмы работы указанных подсистем.
3.3. Метод шунтирования
Для достижения цели (3) обеспечим точное слежение за преобразованным командным сигналом yf (t), который вырабатывается настраиваемым префильтром, уравнения которого приводятся ниже. Эта задача может быть решена путем организации движения в скользящем режиме [20]. Можно показать, что условие строгой минимально-фазовости (СМФ) [21,22] достаточно как для обеспечения скользящего режима, так и для решения задачи прямого адаптивного управления с эталонной моделью. Для
119
скалярных объектов условие СМФ означает, что числитель передаточной функции объекта - гурвицев многочлен с положительными коэффициентами и к = 1. В данной задаче выполнение этого условия не предполагается. Возникающих при этом трудностей можно избежать введением параллельного компенсатора («шунта»), развитого в работах [5,23,26,29,35,36], что позволяет обеспечить выполнение указанного условия для расширенного объекта, включающего собственно объект управления и шунт.
Обозначим передаточную функцию шунта через
Выход расширенного объекта у (г) = ур(г) + ус(г). Передаточная функция расширенного объекта от и к у имеет вид
Шунтирующее звено возьмем в виде, предложенном в работе
Как показано в [23], расширенный объект (4) с шунтом (5) обладает следуюими свойствами:
1) Пусть Шр(в) (2) - минимально-фазовая (В^) - гурвицев многочлен), имеет относительный порядок к > 1 и Шр(0) >
0. Тогда существуют параметр к0 > 0 и функция £0(к) > 0 такая, что передаточная функция Ш(в) = Шр(в) + Wc(s)
- строго минимально-фазовая (СМФ) для всех к > к0 и 0 < £ < £о(ко).
> ¿еёА'(8)=п'.
А'(в)
(4)
где ^(в) = А^В'^) + А'^В^) .
[23]:
(5)
2) Пусть Шр(в) - устойчивая (А(в) - гурвицев многочлен), имеет относительный порядок к > 1 и Шр (0) > 0. Тогда для любого £ > 0 существует достаточно большое значение к0 такое, что Ш(в) = Шр(в)+Шс(в) - СМФ для всех к ^ к0.
Таким образом, можно ввести шунт (5) порядка deg(As(s)) = к - 1 = п - т - 1, который при достаточно большом к и малом £ обеспечивает условие СМФ для расширенного объекта (4) при любом минимально-фазовом объекте управления и произвольной заданной области параметров. Как следует из утверждения 2, при другом способе выбора параметров шунта (5), условие СМФ выполняется для устойчивых (и, возможно, неминимально-фазовых) объектов. В этом случае уравнение шунта можно упростить, а
именно, вместо (5) можно взять Шс(в) =-----.
3.4. Настраиваемая последовательная модель
Для обеспечения слежения за г(г) с заданной динамикой заметим, что выход расширенного объекта у (г) не совпадает с выходом объекта управления ур(г) и идеальное слежение у (г) за у/(г) не означает того же самого для ур(г). Отсюда определяются условия для выбора последовательной модели (префильтра). Получим передаточную функцию Шг(в) от г(г) к ур(г), предполагая, что у(г) = у/(г). Учитывая (4) и уравнение, шунта получим, что
где Wf (в) - передаточная функция префильтра. Из (3), (6) следует что цель управления будет достигнута, если у (г) = у/(г) и если Ш/ (в) взять в виде
(6)
(7)
Уравнение (7) в неадаптивном случае описывает фильтр с постоянными параметрами. При неопределенности параметров объекта вместо (7) следует использовать настраиваемый префильтр, задаваемый уравнениями
(8) х}(г) = х^(г) + г(г), yf(г) = оТ(г)х}(г),
где Xf (г) е Мм; О(г) е Мм - вектор настраиваемых параметров: £}(г) = [ш\(г), (г), ..., (г)]Т, N = п + п. Номинальное
значение О(г) = О* зависит от параметров объекта и должно удовлетворять (7) для передаточной функции Wf (в) = &Т(в1 -Л^)-1Bf. При записи уравнений префильтра в канонической
форме фазовой переменной выполнено Г (в) = ^ ¿=1 ш*вм-г . Отсюда получается система линейных уравнений для параметров префильтра: ш*, г = 1,... ,М
N
(9) £ ш*вм-г = К (А(в)В'(в) + А' (в)В(в)).
г=1
Эти значения зависят от параметров объекта. Для получения в реальном времени оценок неизвестных параметров используем описанный ниже алгоритм адаптивной идентификации.
3.5. Алгоритм идентификации параметров
Для оценки неизвестных параметров объекта по измерениям только входного и выходного сигналов воспользуемся известным алгоритмом идентификации, представляющим собой вариант расширенного фильтра Калмана [7,13,24,33].
Запишем полиномы Л(в), В (в) передаточной функции объекта (2) в виде
Л(в) = вп+а1вп-1 +------+ап, В (в) = Ьовт+Ь1вт-1 +------+Ьт-1,
где аг, Ь^ (г = 1,2,... ,п, ] =0,1,... ,т -1) - неизвестные параметры объекта.
122
Введем вектор ф («регрессор») как
ф(г) = [у(п—1) (г),.. .,у(г),у(г), -йт)(г),..., -й(ЩТ,
где й, у - выходы фильтров состояния, возбуждаемых сигналами й(t), у(г):
(10) 0(р)у(г) = y(t), В(р)ф(г) = ф(г)
с некоторым гурвицевым многочленом О(р) = рп+йцрп-1 + ■ ■ ■ + <!п степени п. Заметим, что компоненты вектора ф(г) могут быть получены на основе измерений только входа и выхода объекта управления (без выполнения операции дифференцирования). Обозначим через в вектор оценок параметров объекта
О — со1{а1, а2,..., an, а0,... ат— 1},
где аг, Ьз - оценки соответствующих коэффициентов аг и Ьз передаточной функции (2).
Алгоритм идентификации имеет вид
(11) в(г) = -Г(t)ф(t)£(t), где «невязка» алгоритма е(Ь) определяется как
(12) £(г) = уП(г) + вT(t)Ф(t),
а матричный коэффициент усиления Г(г) задается уравнением Г(г) = -Г(г)ф(г)ф(г)Тг(г) + aГ(t),
(13) ко1 ^ Г(0) = Г(0)Т > 0,
в котором а > 0 - параметр регуляризации; к0 > 0 - величина начального значения матрицы усиления.
Замечание 1. Известны и другие варианты алгоритма идентификации (11)-(13). Например, вместо (13) можно использовать алгоритм [5,25]
Г(г) = -Г(г)Ф(г)Ф(г)ТГ(г)+
(14) +(г(г)- , Г(0) = ко1.
Результаты применения алгоритмов (13), (14) показывают, что алгоритм (14) лучше работает в условиях помех, а алгоритм (13) обладает более высокой скоростью оценивания и, следовательно, обладает преимуществом при существенной нестацио-нарности объекта.
Доказательство сходимости оценок параметров модели объекта к их истинным значениям опирается на предположение, что система подвержена неисчезающему возбуждению со стороны сигнала управления й(г) [5,21,24,25].
3.6. Регулятор с переменной структурой
Предположим теперь, что шунт (5) выбран надлежащим образом и расширенный объект (4) удовлетворяет условию СМФ. Таким образом, в рассматриваемой задаче требуется найти управляющее воздействие й(г) и закон настройки О(г) в (8) такой, что для любого данного значения относительного порядка к объекта управления, его выход асимптотически удовлетворяет (3). С этой целью используем регулятор с переменной структурой [20, 38] со скользящим режимом, обеспечивающий сходимость ошибки слежения а(г) = у (г) - у^ (г) к нулю за конечное время. Для обеспечения скользящего режима на поверхности а = у - у^ = 0 выберем сигнал управления в виде
(15) й(г) = -кза(г) - ^$щп(а(г)),
где к3 > 0 и ^ > 0 — параметры. Управление (15) обеспечивает существование у системы устойчивого скользящего режима [5, 25].
Структурная схема адаптивной системы представлена на рис. 1.
При обосновании сходимости оценок параметров при идентификации к их истинным значениям обычно возникает условие неисчезающего возбуждения [14,21,24,37]. Выполнение указанного условия в рассматриваемой системе управления ЛА неочевидно, так как идентификация осуществляется в замкнутом контуре управления угловым положением и, кроме того, командный
124
Рис. 1. Структурная схема адаптивной системы
сигнал, вырабатываемый пилотажной системой более высокого уровня (например, навигационной системой, летчиком или контуром самонаведения), также зависит от текущего положения ЛА. Аналитическая проверка этого условия в сложной многоконтурной нелинейной нестационарной системе с разрывным управлением встречает значительные трудности, поэтому работоспособность процедуры идентификации исследована в настоящей работе компьютерным моделированием.
4. Адаптивное управление летательным аппаратом.
Применим описанные в предыдущем разделе алгоритмы к сформулированной в разделе 2 задаче управления ЛА.
4.1. Задача слежения за задающим воздействием
Очевидно, что здесь не требуется проводить оценивания а3; следовательно, можно уменьшить число оцениваемых параметров и упростить алгоритм идентификации.
В рассматриваемом примере относительный порядок объекта
125
k = 2 и шунт (5) может быть задан передаточной функцией
(1) Wc(s) = ^—, к > 0,Л> 0.
S + Л
Используем фильтры состояния (10) третьего порядка с характеристическим многочленом D(s) = s3 + d1s2 + d2s + d3.
Для рассматриваемой системы в алгоритме идентификации
(11) компонентами вектора оценок 9(t) G R4, получаемого алгоритмом идентификации (11), являются оценки параметров а\, а2, b0, b1 передаточной функции ЛА. Входящая в формулы (13), (14) матрица r(t) имеет для данного примера четвертый порядок.
Рассмотрим теперь регулятор с переменной структурой. Введем выходной сигнал «расширенного» объекта ya(t) = ÿ(t) + yc(t), где yc(t) - выход шунтирующего звена и выберем сигнал управления в виде
(2) 5r (t) = —k.sij(t) - y sign a(t),
где j(t) = y(t) - yf (t); yf (t) - выход префильтра (8).
Для достижения цели управления (3) найдем параметры пре-фильтра так, чтобы при выполнении предположения о сходимости оценок параметров ЛА в установившемся режиме к их истинным значениям уравнения префильтра (8) удовлетворяли (7),
где K = и многочлен F (s) = Ap(s)B'(s) + A'(s)Bp(s) .
B(0)
Характеристический многочлен эталонной модели (3) для данной задачи имеет порядок три, Am(s) = p3 + amp2 + a^^V + а^-. Для данной системы получаем
(3) F (s) = ks3 + (ка1 + b0)s2 + (ка2 + b0 Л + b1)s + b1\
и знаменатель передаточной функции Wf (s) (7) - многочлен четвертой степени:
Am(s)A'(s) — s4 + (A + d\)s3 + (Xd\ + d2)s2 + (\d2 + d3)s + \d%
126
Окончательно получаем следующие уравнения настраиваемого префильтра (8):
x f,i(t) = xf,2 (t'), x f,2(t) = xf,3(t), x f,3(t) = xf,4(t),
xf,4(t) = -\d3Xf,i(t) - d3xf,2(t) - (Xdi + d2)xf,3(t)
- (X + di)xf,4(t) + r(t),
4
Vf(t) = K(t) ^ Шi(t)xf,i(t),
i=l
Ui(t) = 04(t)X, U2(t) = O4 (t) + X63(t) - K02 (t),
U3(t) = ô3(t) - Kdi(t), U4 = K,
(4) K (t) = d3
&4(t) '
Проверим теперь выполнение условия СМФ для рассматриваемой системы. В данном случае числитель ^(в) передаточной функции расширенного объекта (4) имеет вид (3) и должен быть гурвицевым многочленом третьей степени. Коэффициенты числителя передаточной функции ЛА имеют отрицательные значения [7, 8], Ь0 < 0, Ъ\ < 0. Следовательно, для параметров ЛА и шунта должны выполняться неравенства:
(5) к < 0, b0 + ка1 < 0, Xb0 + ка2 + bl < 0, Xb2 + кХа-\^b0 + K2ala2 + b0bl - кХЬ1 > 0.
Для примера рассмотрим численный пример управления углом рыскания гипотетического ЛА, имеющего для различных режимов полета параметры, указанные в таблице 1.
Таблица 1. Параметры модели ЛА
в a'z a am a&yr y £ a a1 a2 bo b1
№ c-1 c-2 c-1 c-1 c 1 c-2 c-2 c-2 c-3
1 — 1,10 15,5 1,20 0,09 33,0 2,3 16,8 —33 —35
2 —0,86 5,81 0,18 0,06 9,15 1,0 6,0 —9,2 —7,5
3 — 1,34 — 12,5 0,45 0,07 15,2 1,8 —12 — 15,2 —21,2
Как видно из таблицы, параметры изменяются в широких пределах и режим 3 соответствует статически неустойчивому ЛА.
Зададим следующие значения параметров алгоритмов управления и идентификации:
- характеристический многочлен эталонной модели
Am(s) = s3 +ar?s2+a? s+a?, а? = 14,2 c-1,am = 51 c-2,aim = 90 c-3
- параметры шунтирующего звена: A = 10 c-1, к = —2 ;
- параметры фильтров (7): d1 = 20 c-1, d2 = 200 c-2, d3 = 103 c-3 ;
- параметры регулятора с переменной структурой: ks = 10,
Y = 3;
- начальные значения переменных в процедуре идентификации: Г(0) = k0I, k0 = 103, 0(0) = [0,0,0, —10]; параметр а = 5.
Неравенства (5) определяют область СМФ расширенного объекта, т. е. диапазон значений параметров ЛА, для которых применим закон управления (2). На рис. 2 показана область ужесточенной СМФ, для которой числитель передаточной функции расширенного объекта (4) F(s) имеет степень устойчивости п = 0,5. При построении области СМФ варьировались параметры a^, am,y,
asmy. Параметры a6^ = 0,07 с-1, a^ = 0,18 с-2. Цифрами на рис. 2 обозначены точки, соответствующие строкам таблицы.
128
Рис. 2. Граница области СМФ для п = 0.5.
Рис. 3. Процесс идентификации параметров ЛА
Результаты моделирования приведены на рис. 3, 4. Переходные процессы по углу рыскания при задающем воз-
129
действии т(Ь) = ф* в виде «прямоугольной волны»
ф * (£) = ф* sign( бш(0,2п£)),
где ф* = 5 град. для различных значений параметров из таблицы 1 приведены на рис. 3. На рис. 4 показаны графики оценок параметров ЛА для режима 1 (следует обратить внимание на разницу масштабов времени). Результаты моделирования показывают достаточно высокую скорость настройки параметров регулятора. Некоторое отличие переходных процессов в системе по истечении времени адаптации связано с тем, что числитель передаточной функции замкнутой «эталонной» системы имеет нуль, совпадающий с нулем передаточной функции ЛА (см. (3)) и, следовательно, зависит от изменяющегося параметра а^.
Замечание 2. Выбор малого статического коэффициента передачи шунта (1) (отношения к/А) приводит к тому, что выход расширенного объекта уа (£) от угла рыскания ЛА ф (£) отличается незначительно. Поэтому иногда можно пренебречь искажениями, вносимыми шунтом при отработке командного сигнала ф* (£), и, следовательно, исключить процедуру настройки префильтра, а
130
также связанную с ней процедуру параметрической идентификации. Это приводит к существенному упрощению структуры адаптивного регулятора, а также к повышению помехоустойчивости системы.
Замечание 3. В состав бортовой аппаратуры управления ЛА обычно входит датчик угловой скорости (ДУС), позволяющий измерять угловую скорость рыскания шу. Тогда оказывается естественным суммировать выход шунтирующего звена не с выходом объекта управления (углом рыскания ф), а с выходным сигналом ДУС. Таким образом, при выводе и аналитическом обосновании алгоритма управления в модели объекта можно учесть дополнительные инерционные звенья, прежде всего - приводы рулевых органов. В настоящей работе исполнительные приводы считаются безынерционными. Исследование скользящих режимов с учетом инерционности приводов, в частности - определение частоты перекладки руля направления и коэффициента одновременности нагрузки приводов (усредненного отношения модуля скорости перекладки рулей к ее максимально возможному значению) является важной для практики задачей, требующей отдельного исследования.
4.2. Задача самонаведения
В системах самонаведения можно выделить два контура. Внешний контур (собственно контур наведения) служит для выработки сигнала наведения на основе текущей информации о взаимном положении ЛА и цели. Эта информация получается на основе сигнала визирующего устройства, входящего в головку самонаведения и бортовых датчиков. Внутренний контур, включающий автопилот, служит для отработки команд наведения, передаваемых в виде задающего воздействия по угловому положению или ускорению ЛА [1,8,39]. Вся система в целом является нестационарной вследствие изменения кинематических параметров в процессе сближения с заданной точкой.
В рассматриваемой далее структуре контур наведения используется для формирования задающего воздействия по рысканию ф*(£), передаваемого на адаптивный автопилот. Основной
131
целью проводимых ниже исследований является установление возможности проведения идентификации в замкнутом контуре, в котором задющее воздействие фомируется на основе текущего состояния системы.
Закон наведения. В системах самонаведения наиболее широкое применение находит закон пропорциональной навигации [1, 8, 39]. Ввиду того, что основным направлением проводимых в данной работе исследований является анализ возможности применения рассматриваемой схемы адаптивного управления к задачам самонаведения, здесь рассматриваются более простые методы прямого наведения и «погони». Напомним, что в методе прямого наведения ось ЛА направлена на цель (т. е. продольная ось ЛА совпадает с линией визирования цели), а при методе погони на цель направлен вектор скорости ЛА. Уравнения кинематических связей для горизонтальной плоскости, соответствующие указанным методам, имеют вид:
Ф* — ф = 0 - метод прямого наведения
Ф* — Ф = 0 - метод погони.
Здесь через Ф* обозначен азимут визирования цели со стороны ЛА, Ф - угол курса ЛА, ф - угол рыскания (см. (1)). Как известно [6,7], в горизонтальном полете имеет место Ф = ф — в, т. е. отличие в кинематических траекториях при методах прямого наведения и погони возникает вследствие скольжения с углом в. С помощью бортового координатора измеряется угол визирования цели в осях ЛА ф* = ф — Ф*. Значение ф* используется при формировании сигнала самонаведения. Кинематическая траектория движения по методу погони при постоянной скорости ЛА и прямолинейном движении цели может быть найдена аналитически [1,8]. Анализ показывает, что при сближении ЛА и цели угол Ф* стремится к нулю. Следовательно, при любых начальных значениях угла Ф*,0 = п в конце наведения ЛА будет приближаться к цели всегда с задней полусферы. Все траектории, таким образом, кроме случаев Ф* = 0 и Ф* = п будут криволинейными (траектория сближения с передней полусферы, т. е. при Ф* = п неустой-
132
чива), и для их осуществления необходим разворот с некоторой скоростью (и перегрузкой). Расчет кинематических траекторий по методу прямого наведения сложнее, так как при нем приходится принимать во внимание и динамику углового движения ЛА. Принято, что кинематические траектории сближения при методе погони приближенно описывают и характер движения ЛА и в случае прямого наведения. Отметим, что метод погони приводит к меньшим значениям промаха, однако его сложнее реализовать, так как темп изменения углового положения ЛА (угла рыскания ф) выше, чем темп изменения движения центра масс (угла курса Ф). Кроме того, измерение курса связано с использованием, помимо гироскопов, дополнительных средств, например, навигационного оборудования.
Исходя из приведенных уравнений методов наведения, сформируем следующим образом командный сигнал ф*(£), который поступает на адаптивную подсистему автопилотирования:
(6) ф* = —кд (ф + ф*) - метод прямого наведения,
(7) ф* = — кд (Ф + фt) - метод погони,
где кд - некоторый коэффициент самонаведения. Стоит заметить, что требуемое по методу погони значение курсового угла Ф представляется в (7) заданным углом рыскания ф*. Это связано с тем, что подсистема автопилотирования непосредственно управляет угловым положением ЛА, а не движением центра масс. По окончании переходных режимов, при движении по прямолинейной траектории, разница между углами рыскания и курса (т. е. угол скольжения) становится малой.
Замечание 4. Уравнение метода самонаведения, определяющее кинематическую траекторию, отличается от закона наведения, который задает способ формирования сигнала наведения при реализации выбранного метода. Поэтому могут быть использованы другие, отличные от (6), (7), законы наведения, например, интегральный.
Для исследования процесса сближения используем следую-
133
щие кинематические соотношения
x = Vt,
xt = Do + VXt t, zt = zto + VZt t, m Ax = xt — x, Az = zt — z,
() D = VAx2 + Az2,
z = —V Ф,
Ф/: = — arctan(Az/Ax),
где Vxt и Vzt - компоненты вектора скорости цели. Выполнено:
Vxt = Vt cos qt, Vzt = — Vt sin qt, где qt - курсовой угол цели
(в некоторой земной системе координат); x(t), z(t), xt(t), zt(t)
- боковые координаты ЛА и цели (соответственно); V - земная скорость ЛА.
Рассмотрим следующие численные примеры.
Вариант 1. Для этого варианта приняты следующие значения параметров модели гипотетического ЛА: = —1,3 с-2, af =
—0,4 с-1, am = 9,85 с-2, aZr = 2,6 ■ 10-3 с-1, атУ = 0,37 с-1
1 ' 1ту 1 ' z 1 'У '
(заметим, что рассматривается неустойчивый ЛА с корнями характеристического многочлена передаточной функции {0, 0,75,
— 1,53}). Земная скорость ЛА V = 500 м/с; модуль скорости цели Vt = 20 м/с; курсовой угол цели qt = 90 град. Приняты следующие желаемые собственные числа контура управления угловым положением: s = { — 10, —2,1 ±2,14i, —0,8}. Начальная дальность до цели D0 = 10 км.
Переходные процессы изменения оценок параметров ЛА a1(t), a2(t), b0(t), b1(t) показаны на рис. 5, 6. Длительность процесса идентификации составляет около 2,5 с. Таким образом, идентификация параметров проходит со скоростью, близкой к скорости изменения углового положения ЛА. На рис. 7 показана траектория сбижения ЛА с целью в относительных координатах (Ax, Az) для двух методов самонаведения - (6) и (7) Показано, что метод (7) является предпочтительным по точности при сближении с двжущейся целью. На рис. 8 показан график ошибки отработки командного сигнала ^*(t). Этот график дает представление о динамических свойствах внутреннего контура. График отклонение рулей напрвления показан на рис. 9.
134
Рис. 5. Оценки ах (£), а2 (£) параметров ах, а2 (вариант 1)
Рис. 6. Оценки Ь0, параметров Ь0 (£), (£) (вариант 1)
Вариант 2. Рассмотрим теперь другой режим полета ЛА, ха-
135
Л I, м
1 і і І і ——1 і
О 2000 4000 6000 8000 Ах, м
Рис. 7. Траектории сближения: 1 - закон наведения (6);
2 - закон наведения (7), (вариант 1)
О 5 10 15 20
Рис. 8. Ошибка слежения (£) = * (£) — (£) (вариант 1)
5Г(І), град
Рис. 9. Управляющее воздействие дг (£) (вариант 1)
растеризующийся следующими значениями параметров: а^у =
15,5 с-2, аЧ = -1,1 с-1, а^ = 33 с-2, а^ = 0,09 с-1,
атУ = 1,2 с-1 Эти параметры соответствуют устойчивому угловому движению ЛА с собственными числами {0, -1,15 ± 3,94г}. Все остальные параметры и характеристики движения ЛА и цели оставлены теми же, что и в предыдущем варианте.
Результаты моделирования для данного варианта показаны на рис. 10-14. Как видно из графиков, время оценки параметров не отличается от полученного в предыдущем варианте. Траектория полета показана на рис. 12. Очевидно, что она не имеет заметных отличий от аналогичной траектории для варианта 1. Графики показывают также, что использование регулятора с переменной структурой в данной задаче не приводит к форсированному отклонению рулей направления. Это связано, в первую очередь, с использованием последовательного префильтра, который формирует гладкое задающее воздействие ф* (£) с реалистичным временем переходного процесса.
Рис. 10. Оценки а1 (£), а2 (£) параметров а1, а2 (вариант 2)
Рис. 11. Оценки Ь0, Ъ\ параметров Ъ0 (£), Ъ\(£) (вариант 2)
Рис. 12. Траектория сближения; закон наведения (7), (вариант 2)
Заключение
В статье показано применение комбинированного алгоритма адаптации для управления угловым движением многорежимного летательного аппарата. Использование метода позволяет существенно снизить требования к полноте исходной и текущей 138
Щ с1ед
Рис. 14. Управляющее воздействие 8Г (Ь) (вариант 2).
информации о динамике ЛА. Комбинированный алгоритм адаптации обеспечивает заданные динамические свойства замкнутой системы при изменении параметров объекта управления в широких пределах. На последнем примере задачи самонаведения продемонстрирована возможность применения алгоритма для систем со значительной парметрической неопределенностью и при наличии внешних обратных связей. Результаты моделирования подтверждают работоспособность алгоритма и демонстрируют обеспечение предъявленных к системе управления требований.
Литература
1. АГАДЖАНОВ П. А., ВЕЙЦЕЛЬ В. А., ВОЛКОНСКИЙ
С. А. И ДР. Основы радиоуправления: Учебное пособие для вузов / Под ред. В.А. Вейцеля. - М.: Радио и связь, 1995.
2. АЛЕКСАНДРОВ А. Г. Оптимальные и адаптивные системы: Учебное пособие. - М.: Высш. шк., 1989.
3. АЛЕКСАНДРОВ А. Г. Методы построения систем автоматического управления. - М.: Физматлит, 2008.
4. АНДРИЕВСКИЙ Б. Р., СТОЦКИЙ А. А., ФРАДКОВ А. Л. Алгоритмы скоростного градиента в задачах управления и адаптации. Обзор // АиТ. - 1988. - №12.
5. АНДРИЕВСКИЙ Б. Р., ФРАДКОВ А. Л. Избранные главы теории автоматического управления с примерами на языке МАГЬАБ. - СПб.: Наука, 1999.
6. БОДНЕР В. А. Системы управления летательными аппаратами. - М.: Машиностроение, 1973.
7. БУКОВ В. Н. Адаптивные прогнозирующие системы управления полетом. - М.: Наука, 1987.
8. ДМИТРИЕВСКИЙ А. А. Баллистика и навигация ракет.
- М.: Машиностроение, 1989.
9. ДРУЖИНИНА М. В., НИКИФОРОВ В. О., ФРАДКОВ А. Л. Методы адаптивного управления нелинейными объектами по выходу // АиТ. - 1996. - №2.
10. ЕМЕЛЬЯНОВ С. В. Системы автоматического управле-
ния с переменной структурой. - М.: Наука, 1967.
11. ЗЕМЛЯКОВ С. Д., РУТКОВСКИЙ В. Ю. О некоторых результатах развития теории и практического применения беспоисковых адаптивных систем // АиТ. - 2001. - №7.
12. КРАСНОВА С. А., УТКИН В. А. Каскадный синтез наблюдателей состояния динамических систем. - М.: Наука, 2008.
13. ЛЬЮНГ Л. Идентификация систем. Теория для пользователей. - М.: Наука, 1992.
14. МИРОШНИК И. В., НИКИФОРОВ В. О., ФРАДКОВ А. Л. Нелинейное и адаптивное управление сложными динамическими системами. - СПб.: Наука, 2000.
15. НИКИФОРОВ В. О., ФРАДКОВ А. Л. Схемы адаптивного управления с расширенной ошибкой. Обзор // АиТ. - 1994.
- №9.
16. ПЕТРОВ Б.Н., РУТКОВСКИЙ В.Ю., ЗЕМЛЯКОВ С. Д.
Адаптивное координатно-параметрическое управление нестационарными объектами. - М.: Наука, 1980.
17. ТЕРЯЕВ Е.Д., ШАМРИКОВ Б. М. Цифровые системы и поэтапное адаптивное управление. - М.: Наука, 1999.
18. УТКИН В. И. Скользящие режимы и их применения в системах с переменной структурой. - М.: Наука, 1974.
19. Теория систем с переменной структурой / Под ред. С. В. Емельянова. - М.: Наука, 1970.
20. УТКИН В. И. Оптимизация и управление в системах со скользяшимирежимами. - М.: Наука, 1981.
21. ФОМИН В. Н., ФРАДКОВ А. Л., ЯКУБОВИЧ В. А. Адаптивное управление динамическими объектами. - М.: Наука, 1981.-448 с.
22. ФРАДКОВ А. Л. Синтез адаптивной системы стабилизации линейного динамического объекта // АиТ. - 1974. -№12.
23. ФРАДКОВ А. Л. Адаптивная стабилизация минимальнофазовых объектов с векторным входом без измерения производных от выхода // Докл. РАН. - 1994. - Т. 337, №5.
24. ФРАДКОВ А. Л. Адаптивное управление в сложных си-
стемах: беспоисковые методы. - М.: Наука. 1990.
25. ANDRIEVSKY B.R., FRADKOV A.L., STOTSKY A.A. Shunt compensation for indirect sliding-mode adaptive control // Proc. 13th Triennial IFAC World Congr. V. K. S. Fr., USA, 1996.
26. ANDRIEVSKY B.R., FRADKOV A. L. Implicit model reference adaptive controllers based on feedback Kalman-Yakubovich lemma //Proc. 3rd IEEE Conf. on Control Applications. Glasgow, 1994.
27. ANDRIEVSKY B. R. Analysis of time-varying control system with combined adaptation law // Proc. 6th Saint-Petersburg Symposium on Adaptive Systems Theory. (SPAS’99) - Vol. 1.
- St.Petersburg, 1999.
28. ANDRIEVSKY B. R., FRADKOV A. L. Combined adaptive flight control system // Proc. 5th Intern. ESA Conference on Spacecraft Guidance, Navigation and Control Systems. Frascati, Italy, 2002. (ESA-516, 2003).
29. BAR-KANA I. Parallel feedforward and simplified adaptive control // Int. J. Adapt. Control and Signal Processing. - 1987.
- Vol. 1.
30. BARTOLINI G., FERRARA A. A simplified discontinuous control scheme for uncertain linear systems: an Input/Output approach // Proc. IEEE Workshop “Variable Structure and Lyapunov Control of Uncertain Dynamical Systems”. -Sheffild, UK, 1992.
31. BARTOLINI G., FERRARA A., STOTSKY A. Stability and exponential stability of an adaptive control scheme for plants of any relative degree // IEEE Trans. Autom. Contr. - 1995. -Vol. 40, No1.
32. FRADKOV A. L., ANDRIEVSKY B. R. Combined adaptive controller for UAV guidance // Europ. J. of Control. - 2005. -Vol. 11 (1). - Pp. 71--79.
33. GAWTHROP P. J. Continuous-Time Self-Tuning Control. -Letchworth, U.K.: Research Studies Press, 1987.
34. IWAI Z., MIZUMOTO I. Realization of simple adaptive con-
trol by using parallel feedforward compensator // Int. Joum. Contr. - 1994. - Vol. 59.
35. KAUFMAN H., BAR-KANA I., SOBEL K. Direct adaptive control algorithms. - N.Y.: Springer-Verlag, 1994.
36. MAREELS I. A simple self-tuning controller for stable invertible system //Syst. Contr. Letters. - 1984. - Vol. 4.
37. NARENDRA K. S., ANNASWAMY A.M. Persistant excitation in adaptive systems // Int. J. of Control. - 1987. -Vol. 45, №1.
38. SANNUTI P. Direct singular perturbation analysis of high-gain and cheap control problems // Automatica. - 1983. -Vol. 19.
39. WHITE B.A, TSOURDOS A. Modern missile flight control design: an overview // Proc. 15th IFAC Symposium on Automatic Control in Aerospace, Bologna, Italy, 2001.
ADAPTIVE FLIGHT CONTROL BASED ON PARAMETER IDENTIFICATION PROCEDURE SIMULTANEOUSLY WITH SLIDING MODE MOTION
Boris Andriesky, Institute for Problems of Mechanical Engineering of RAS, Dr.Sc., Leading Research Fellow (Saint Petersburg, 61, V.O. Bolshoy Av., +7 812 321-4766, [email protected]). Alexander L. Fradkov, Institute for Problems of Mechanical Engineering of RAS, Dr.Sc., Head of the Laboratory (Saint Petersburg, 61, V.O. Bolshoy Av., +7 812 321-4766, [email protected]).
Abstract: The problem of adaptive control for lateral angular motion of unmanned aerial vehicle for the cases of tracking the yaw reference signal and homing guidance is considered. The combined adaptive controller, including the parallel feedforward compensator (“shunt”), parameter estimator, variable structure controller and the adjustable sequential reference model is proposed. Design technique is demonstrated by the typical atmospheric aerial vehicle model. The numerical example of flight control for multiple-mode aerial vehicle is presented.
Keywords: unmanned aerial vehicle, adaptive control, shunting method, parameter identification, sliding mode.
Статья представлена к публикации членом редакционной коллегии А.П. Курдюковым.