НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н. Э. БАУМАНА
НАУКА и ОБРАЗОВАНИЕ
Эл № ФС77 - 48211. Государственная регистрация №0421200025. ISSN 1994-0408
электронный научно-технический журнал
Управление четырехвинтовым вертолетом
# 05, май 2012
Б01:10.7463/0512.0397373
Белинская Ю. С., Четвериков В. Н.
УДК 517.977.1
Россия, МГТУ им. Н.Э. Баумана [email protected] [email protected]
Четырехвинтовой вертолет (квадрокоптер, четырехроторный вертолет) представляет собой летательный аппарат с четырьмя винтами (рис. 1). Винты закреплены на двух пересекающихся крест-накрест жестких балках и вращаются диагонально в противоположных направлениях, как показано на рис. 2.
Рис. 1. Модель четырехвинтового вертолета Рис. 2. Вращение винтов вертолета
В работах [1, 2] показано, что движение квадрокоптера описывает плоская система. Каждое решение плоской системы однозначно определяется набором произвольных функций времени. Для управления такими системами применим метод динамической обратной связи. Однако в работах [1, 2] свойство плоскостности используется только частично: задача стабилизации в окрестности положения равновесия решается заменой системы на ее линеаризацию, а для решении задачи терминального управления используются только движения вдоль координатных осей.
В данной работе решаются задачи терминального управления на этапах взлета и посадки, а также задача стабилизации в окрестности желаемой траектории. При этом используется метод динамической обратной связи, разработанный для плоских систем [3,4].
1. Математическая модель квадрокоптера
Движение четырехвиитового мииивертолета можно считать суммой поступательного движения центра масс и сферического движения тела относительно центра масс [2]. Центр масс квадрокоптера находится на пересечении балок, на который закреплены винты.
Обозначим за Ох, Оу, Ог оси глобальной системы координат (связанной с землей), а за ОХ, ОУ, OZ оси локальной системы координат, связанной с квадрокоптером. Начало второй системы находится в центре масс квадрокоптера.
Запишем второй закон Ньютона динамической системы:
та = -тдег + Я(ф, ф)й,
где а = (X, у, г)т — суммарное ускорение динамической системы, т — масса системы; ех — единичный вектор, направленный вдоль оси Ог, Я(ф,$, ф) — матрица поворота локальной системы относительно центра масс; ф — угол крена; $ — угол тангажа; ф — угол рыскания; й — сумма неконсервативнык сил, действующих на систему (включая силы лобового сопротивления и силу тяги винтов). Мы будем для упрощения считать, что силы сопротивления отсутствуют и в качестве й выступает только суммарная сила тяги четырех винтов, которую можно записать в виде:
и
i=l
i=l
где ¿з — единичный вектор, направленный вдоль оси OZ; ki — некоторые положительные константы; ui — угловые скорости винтов.
Матрица поворота в данном случае имеет вид (здесь обозначено sin а = sa, cos а = ca):
(
я(фЛф)--
Умножим Я(ф,$, ф) на и:
Ci) Оф
s-ф S)
(
и
* *
si
* * C) sv \ * * C) cv J
Í0\ 0
VI/
и
Í -Si) \ C) sv
\ci) cv J
-si \
cф s) scp Sф c<p s) scp Sф + cф c<p c) scp
\ cф s) cif + ss) cif s<£ c) cif J
где и = Y1 hu2. Получим следующую систему обыкновенных дифференциальных уравне-
i=l
ний:
mx = —и sin <&, my = и cos sin ф, mz + mg = и cos cos ф.
Дополним систему уравнениями по остальным переменным:
mx = — u sin my = u cos $ sin mz + mg = u cos $ cos
Ф = fA, $ = f,
Ф = V
где f = (f0, f?, fr)T — вектор угловых ускорений точки в локальной системе.
Квадрокоптером можно управлять, только увеличивая или уменьшая силу тяги каждого винта, т.е. величинами fi = k^2, i = 1, 4. Приведем формулы связи /ь f2, f3, f4 и u, f (их
вывод можно найти в [2]). Считаем, что винты и их двигатели идентичны: к = к, г = 1, 4, а расстояние их до центра масс одинаково и равно I. Обозначим через 1с матрицу инерции квадрокоптера и положим Пс(п) = и(п), где
1
J (п)
0
—s, \
Sy c,
\0 — Sy cv c, J
Тогда
т = nG(n)f + П с(п)п,
(2)
где п = (Ф, <Р)Т, т = (ъф, т?, ту)1 и
Т
Тф = k(wf + — — ту = /(^2 —
Получаем следующие выражения для сил тяги:
Тф ту , u
/ = k 77 — ту + ,
4k 21 4k
Тф
u
f2 = k — 4k +2! + 4k
/з = МТт + Й + ^
(3)
f4 = k(
4k 21 4k
kt _ Z± + \ M 4k 21 + 4k).
Далее, решая задачи управления, мы будем использовать систему (1), считая Г и п входом (управлением) системы. После того, как закон управления в виде функций Г и п от времени и состояния будет найден, мы найдем выражения для истинных управлений /1, /2, /з, /4, используя формулы (2) и (3).
Отметим, что выбором соответствующего Гу мы можем обеспечить любое значение угла крена и первой производной угла крена, а от переменной ф остальные уравнения не зависят.
Поэтому четвертое уравнение системы (1) можно рассматривать отдельно от остальных и исследовать систему
mx = —u sin $, my = u cos $ sin
mz + mg = u cos $ cos <£, (4)
$ = f?,
= fr
с состоянием (x, y, z, $, <£, x, y, z, $, <¿>) и управлением u, f?, fr.
2. Метод динамической обратной связи
Рассмотрим систему с управлением вида
х = /(Ь,х,п), X е Ега, п е (5)
где Ь — независимая переменная; х — вектор состояния; п — вектор управления (вход системы); / — гладкая векторная функция. Задача терминального управления для системы (5) заключается в поиске такой функции п(Ь) в классе допустимых управлений, при которой траектория системы переходит из начального (заданного) состояния х(Ь0) в конечное (заданное) состояние х(Т) за заданное время Т — Ь0.
Динамической обратной связью системы (5) называют обратную связь вида
С = а(Ь,х,С^), п = 6(Ь,х,С^), С е Ж*, V е (6)
с состоянием С, входом (х, V) и выходом п. Динамическую обратную связь можно понимать как преобразование системы (5) в систему
х = / (ь,X,b(ь,X,С,v)), С = а(£,х,С^) (7)
с состоянием (х, С) е К(га+1) и управлением V. Второе равенство в (6) определяет отображение из множества решений системы (7) в множество решений системы (5).
Говорят, что система (5) линеаризуема динамической обратной связью (6) (или просто динамически линеаризуема), если получающаяся с помощью этой связи система (7) преобразуется в эквивалентную систему вида
уТ^ = V», г = 1, т, (8)
обратимой заменой переменных
ь = ь, Г = У(Ь,Х,С), V = V, (9)
где у = (у1, у1,..., 1), у2,..., Утт 1)) — состояние системы (8).
Пусть для системы (5) мы нашли управление и(г), которое позволяет следовать желаемой траектории х*(£). Однако на техническую систему могут воздействовать (как правило, случайным образом) внешние силы, которые не учитываются в модели (5). В результате этих воздействий система может изменить свое состояние в некоторый момент времени г0 на х(Ь0) = х*(£0). В этом случае ставится задачи стабилизации: используя управление, вернуть систему на заданную траекторию х*(£).
В случае системы (5) линеаризуемой динамической обратной связью (6) задача стабилизации решается выбором таких функций V = V(г,х,£) и £*(г), что (х*(£),£*(£)) есть асимптотически устойчивое решение системы
х = f (г,х,Ь(г,х,^ (г,х,£))), (10)
£ = а(г,х,^ (г,х,£)). (11)
При этом управление выбирается в виде
и = Ь(г,х(г),£(г)^ (г,х(г),£(г))),
где х(г) — текущее состояние системы, а £(¿) — решение системы обыкновенных дифференциальных уравнений (11) с начальным условием £(Ь0) = £*(Ь0). Задача терминального управления
х(Ь0) = х0, х(Т) = хт (12)
для динамически линеаризуемой системы (5) решается следующим образом. Для вспомогательных переменный £ задаются произвольные начальные и конечные значения, и задача терминального управления ставится для расширенного пространства состояний:
х(^) = х0, х(Т ) = хи £(¿0) = £0, £(Т )= £т. (13)
Система (7) обратимой заменой переменной вида (9) преобразуется в эквивалентную систему (8). Применяя преобразование (9), получаем для системы (8) задачу терминального управления
У(¿0) = П*0,х0,£0), У(Т) = У(Т, хт,£т). (14)
Решение этой задачи обычно ищется в каком-то заранее заданном пространстве, напри-
т
мер, в пространстве полиномов по г степени 2 ^ пг — 1, где коэффициенты полиномов
г=1
выбираются так, чтобы выполнялись условия (14). Обозначим это решение за (у*(г)^(г)), где vi(t) = (у*>г(г))(а,1\ г = 1, т. Применяя обратную к (9) замену переменный, получаем решение (х*(г),£*(г)^(г)) системы (6). Это решение удовлетворяет (13). Таким образом, зависимость
и(г) = Ь(Ь,£*(Ь),х*(Ь)МЬ)), г е [¿0,Т], (15)
решает задачу терминального управления (12). Для решения задачи стабилизации в окрестности траектории ж* (t) строится обратная связь
ni -1
V = (y*,i(t))(ni) + £ Yi,j(y(j) — (y*,i(t))(j)), i = vm, (16)
j=0
где постоянные коэффициенты Yi,j находятся из условия асимптотической устойчивости следующей системы линейных дифференциальных уравнений (здесь ei = yi — y*;i(t)):
ni-l
e(ni) = £ Yij e(j), i = l~m. (17)
j=0
Обратная связь (16) дает решение задачи стабилизации для системы (8). Решение задачи стабилизации для системы (5) задается соотношением (15), где v(t) — функция (16), записанная в переменных ж, £.
3. Плоские системы с управлением
Рассмотрим системы, к которым применим метод динамической обратной связи. Система (5) называется плоской [3], если определены такие функции
y1 = h1(t, ж, u, u,..., u(1)), ..., yr = hr (t, ж, u, u,..., u(1)), (18)
что переменные ж и u выражаются через t, функции (18) и их производные в силу системы (5) до какого-то конечного порядка, а любой конечный набор этих функций, их производных в силу системы (5) и функции t функционально-независим. При этом набор функций (18) называется линеаризующим (плоским) выходом системы (5). Теорема [2]. Функции
hi = ж, h,2 = y, h,3 = z (19)
являются плоским выходом системы (4).
< Количество функций плоского выхода равно количеству входов системы. Отсюда и из теоремы 2 из [4] следует, что достаточно выразить переменные состояния через функции плоского выхода и их производные.
Некоторые переменные выражаются тривиальным образом:
ж = h1, y = h2, z = h3, ж = h1, y = h2, z = h3.
Чтобы выразить $ и запишем первые три уравнения системы (4) в виде
h1 = — — sin $, m
h2 = — cos $ sin <£, (20)
m
3u h3 + g = — cos $ cos m
Поделив второе уравнение в (20) на третье и выразив из полученного выражения у, получим
у = arctgf J^) , (21)
\h з + д)
а поделив первое уравнение в (20) на третье и выразив оттуда §, получим
§ = - arctg ( cos у.. hl | , (22)
V h з + д)
где у выражается через h с помощью (21).
Дифференцируя по времени равенства (21) и (22), получаем выражения для § и у. ►
j -
Заметим, что управления п, т? и могут быть выражены через Ь, г = 1, 3, = 0, 4. Действительно, возведем в квадрат выражения (20) и сложим их. После всех сокращений получим
u
Wh 1 + h 2 + (h3 + g)2. (23)
Дифференцируя по времени полученные при доказательстве теоремы выражения для § и у, получаем выражения для т? = § и = у.
4. Построение динамической обратной связи
Любая плоская система динамически линеаризуема [3]. Для построения динамической обратной связи, линеаризующей систему (4), используем алгоритм, изложенный в [4]. Введем дополнительные переменные С1 , С2 равенствами
С1 = \М2 + ^2 + (Ьз + ^)2, С2 = С1. (24)
Такой выбор дополнительных переменных объясняется тем, что функции (24) вместе с функциями состояния системы (4) определяют обратную замену переменных к переменным
О
(25)
h(j), i = l, 3, j = 0, 3.
Используя указанную замену переменных, выразим производные £ь £2 и входы системы через £ь £2, переменные состояния и vi = h(4), i = l, 3. Продифференцировав (24) по времени, получаем
б = 6,
£2 = 6 (cos2 $у2 + $2) — sin $ ■ v1 + cos $ sin у ■ v2 + cos $ cos у ■ v3. Суммарная сила тяги u выражается, исходя из (23) и (24), тривиально:
u = m^1. (26)
Чтобы выразить f^ = уз и f, = г3, используем равенства (21) и (22). Получаем
f¿3 = £" ^sec $ ■ (v2 cos у — v3 sin у) — 2у (£2 — £1$ tg $)) ,
£1
f, = — — cos у| sec у| ( v1 cos $ + (v3 cos у + v2 sin у) sin $ + £1 cos $ sin $ ■ у2 + 2£2$) . £1 ^ '
(27)
Формулы (25), (27), (26) определяют динамическую обратную связь, линеаризующую систему (4).
5. Решение задач терминального управления и стабилизации
Предположим, что нам нужно попасть в точку (ха, уа,га, 0, 0, 0) из нулевого начального положения, причем ха = у а = га = На. Пусть г0 = 0 — начальный момент времени, г = Т — время окончания движения. Таким образом, поставлена задача терминального управления
х(0) = 0, у(0) = 0, г(0) = 0,
хх(0) = 0, у/(0) = 0, х(0) = 0,
0(0) = 0, 0(0) = 0, ((0) = 0, ((0) = 0,
х(Т) = На, у(Т) = На, г (Т) = На,
х(Т) = 0, у(Т) = 0, х(Т) = 0,
0(Т) = 0, 0(Т) = 0, ((Т) = 0, ф(Т) = 0.
Начальные и конечные значения переменных £ зададим следующим образом: £1(0) = = £1(Т) = д, £2(0) = £2(Т) = 0.
Для решения задачи ее нужно поставить в переменных Н. Воспользуемся формулами (19), (20), (21), (22) и поставим задачу в переменных Н:
Н1(0) = 0, Н2(0) = 0, Н3(0) = 0, Н 1(0) = 0, Н2(0) = 0, Нз(0) = 0, Н1(0) = 0, Н2(0) = 0, Нз(0) = 0, ¿1(0) = 0, Ы0) = 0, Нз(0) = 0,
Н1(Т) = На, Н2(Т) = На, Нз(Т ) = На, )
Н 1(Т) = 0, Н2(Т) = 0, Нз(Т) = 0, Н.1(Т) = 0, Н2(Т) = 0, Нз(Т) = 0, ЫТ) = 0, Н.2(Т) = 0, Нз(Т) = 0,
Решение этой задачи в переменный Н в пространстве многочленов порядка 7 выглядит следующим образом:
Н*г = —20Н^Т) + 70На ^— 84Н^+ 35Н^. (30)
Благодаря выбору начальных значений переменной £1 желаемая траектория по всем трем координатам одинакова, а также координата г не уходит в отрицательную подобласть. Эта траектория изображена на рис. 3 (при Т = 4 с, На = 10 м).
Поскольку по условию задачи вертолет может испытывать внешние воздействия, необходимо решить задачу стабилизации системы вблизи желаемой траектории. Для решения этой задачи рассмотрим следующую устойчивую систему обыкновенных дифференциальных уравнений:
е(4) = —4 е г — бёг — 4ёг — ег, г = 1Л. (31)
12 3 4
Рис. 3. Желаемая траектория по координате x
Полагая d(t) = x(t) - x*(t), e2(t) = y(t) - y*(t), e3(t) = z(t) - z*(t), а также vx = x(4)(t), v2 = y(4)(t), v3 = z(4)(t), из формул (31) получаем стабилизирующую обратную связь.
В качестве обратной связи по ф выберем обратную связь, стабилизирующую нулевое положение равновесия угла крена, т.е.
Тф = -ф - ф.
При решении задачи стабилизации необходимо проверить допустимость найденного управления. По условию задачи
¡г > 0, г =1, 4, (32)
где ¡г — сила тяги г-го винта. Для проверки (32) вычислим матрицу 1с инерции квадро-коптера. В силу симметричности квадрокоптера матрица 1с диагональная. Для простоты предположим, что квадкоптер представляет собой систему точечных масс, причем в центре масс сосредоточена масса в 1,2 кг, а на месте винтов — массы по 0,2 кг. Винты удалены от центра масс на расстояние I = 0,25 м. Используя стандартные формулы, получаем
0,02 0 0
IG
0 0,02 0 V 0 0 0,04 )
Подставляя найденные в процессе решения значения г(£) и в формулы (2) и (3), находим ¡1 (¿), .. ., /4(£) и проверяем условия (32).
Решим аналогичным образом задачу терминального управления квадрокоптера на этапе выполнения предпосадочных маневров. Предположим, что нам нужно перевести вертолет из положения (На, к^, ко) в положение (0, 0, Нк), где Нк — достаточно близкое к нулю значение (после достижения этой точки ставится задача парковки, которая не рассматривается в
рамках данной работы). Таким образом, поставлена задача терминального управления:
х(0) = На, у(0) = На, г (0) = На,
х(0) = 0, у/(0) = 0, х(0) = 0, 0(0) = 0, 10(0) = 0, ((0) = 0, (((0) = 0, х(Т) = 0, у(Т) = 0, г(Т) = Нк,
х(Т) = 0, у(Т) = 0, х(Т) = 0,
0(Т) = 0, 0(Т) = 0, ((Т) = 0, ф(Т) = 0.
В качестве значений переменный £ зададим опять же £1(0) = £1(Т) = д, £2(0) = £2(Т) 0. Решение этой задачи в пространстве многочленов порядка 7 имеет вид
Н* = На + 20На ( Т) — 70 На (+ 84Н^— 35 На (^
г = 1,2;
Нз = На + 20(На — Нк)(Т) — 70(На — Нк) (Т) +84(На — Нк)(Т) — 35(На — Нк)(Т На рис. 4 и 5 изображена желаемая траектория по координатам х и г (при Нк = 0,5).
(34)
Рис. 4. Желаемая траектория по координате х
Рис. 5. Желаемая траектория по координате г
6. Результаты численного моделирования
Приведем графики изменения переменный состояния и силы тяги от времени. Как известно, вертолет может испытывать внешние воздействия. Предположим, что эти воздействия ограничиваются тем, что в начальный момент времени систему отклонили от нулевого положения так, что
х(г0) = —1; у(Ь0) = —1; г (¿0) = 0,2; х(г0) = 0,5; у(Ь0) = 0,5; ¿(¿0) = 0,5;
В качестве времени окончания движения выберем Т = 10 с, чтобы обратная связь «успела сработать». На рис. 6-15 приведены графики изменения переменный состояния (графики у и у совпадают с приведенными графиками х и х) и силы тяги от времени при отсутствии внешних воздействий и при наличии указанный внешних воздействий.
Рис. 6. График х(Ь)
Рис. 8. График ¿(¿)
Рис. 10. График Щ)
Рис. 7. График Х(Ь)
Рис. 9. График ¿(¿)
Рис. 11. График
Рис. 12. График /1({) Рис. 13. График /2(£)
Рис. 14. График /з(£) Рис. 15. График /4(£)
На графиках видно, что желаемая траектория движения квадрокоптера является ассим-тотически устойчивой, и выполняются условия допустимости управления.
Приведем графики изменения переменных состояния на этапе выполнения предпосадочных маневров. Предположим, что внешние возмущения ограничиваются начальным воздействием на систему так, что
х(^) = у(^) = ¿(¿0) = На + 1, х(^) = ^/(¿0) = ¿(¿0) = —0,5.
В заключение приведем графики изменения переменных состояния на этапе выполнения предпосадочных маневров, в качестве времени окончания интегрирования выбрано Т = 10 с (рис. 16-25).
Рис. 16. График х(£) Рис. 17. График Х(£)
Рис. 18. График г(£) Рис. 19. График ¿(¿)
Рис. 20. График $(г)
Рис. 22. График /1 (¿)
Рис. 21. График
Рис. 23. График /2 (¿)
Рис. 24. График /3(г)
Рис. 25. График /4 (¿)
Видно, что желаемая траектория является ассимптотически устойчивой, и выполняются условия допустимости управления.
Заключение
Приведенные результаты демонстрируют, что метод динамической обратной связи, разработанный для плоских систем, применим и к рассматриваемой нелинейной модели че-тырехвинтового вертолета, несмотря на ее сложность (12-мерное состояние и 4-мерное управление).
Работа выполнена при финансовой поддержке гранта НШ-4144.2010.1 ведущих научных школ и РФФИ (проект 10-07-00617).
Список литературы
1. Beji L., Abichou A. Trajectory and Tracking of a Mini-Rotorcraft // Proceedings of the 2005 IEEE Int. Conf. on Robotics and Automation, 2005. P. 2618-2623.
2. Beji L., Abichou A., Slim R. Stabilization with Motion Planning of a Four Rotor Mini-rotorcraft for Terrain Missions // Fourth Int. Conf. on Intelligent Systems Design and Applications (ISDA), 2004. P. 335-340.
3. Fliess M., Levine J., Martin Ph., Rouchon P. A Lie — Backlund approach to equivalence and flatness of nonlinear systems // IEEE Trans. Automat. Control. 1999. V. 44, No 5. P. 922-937.
4. Четвериков B.H. Управляемость плоских систем // Дифференциальные уравнения. 2007. Т. 43, № 11. С. 1518-1527.
SCIENTIFIC PERIODICAL OF THE BAUMAN MSTU
SCIENCE and EDUCATION
EL № FS77 - 48211. №0421200025. ISSN 1994-0408
electronic scientific and technical journal
The control design for a four-rotor rotorcraft
# 05, May 2012
DOI: 10.7463/0512.0397373
Belinskaya Yu. S., Chetverikov V. N.
Russia, Bauman Moscow State Technical University
[email protected] [email protected]
An aerial vehicle with four rotors (the four-rotor rotorcraft) is considered. Rotors are attached to two bars rigidly fastened in the middle. Rotors on different bars rotate in opposite directions. Changes of tractive forces of rotors allow controlling motion of the rotorcraft. The mathematical model of such aerial vehicle represents a dynamical system with a 12-dimensional state and a 4-dimensional control. In the article, a dynamic feedback linearizing this system is constructed. The feedback is used to track given reference trajectories with stability at the stages of take-off and landing. The admissibility of the found input is checked. Numerical simulation results demonstrate effectiveness of the approach.
References
1. Beji L., Abichou A. Trajectory and Tracking of a Mini-Rotorcraft. Proc. of the 2005 IEEE International Conference on Robotics and Automation, 2005, pp. 2618-2623.
2. Beji L., Abichou A., Slim R. Stabilization with Motion Planning of a Four Rotor Mini-rotorcraft for Terrain Missions // Fourth Int. Conf. on Intelligent Systems Design and Applications (ISDA), 2004, pp. 335-340.
3. Fliess M., Levine J., Martin Ph., Rouchon P. A Lie — Backlund approach to equivalence and flatness of nonlinear systems // IEEE Trans. Automat. Control. 1999. V. 44, No 5. P. 922-937.
4. Chetverikov ^^Controllability of Flat Systems //Differential Equations. 2007, vol. 43, no. 11, pp. 1518-1527.