Cloud of Science. 2019. T. 6. № 1 http:/ / cloudofscience.ru
Исследование решения задач стабилизации линеаризованной модели робота типа «акробот»
И. В. Рядчиков*, А. А. Свидлов**, А. Э. Бирюк*, С. И. Сеченев* А. А. Гусев*, Е. В. Никульчев***
Кубанский государственный университет 350040, Краснодар, ул. Ставропольская, 149
Южный научный центр РАН 344006, Ростов-на-Дону, пр. Чехова, 41
МИРЭА — Российский технологический университет 119571, Москва, пр-т Вернадского, 78
e-mail: [email protected]
Аннотация. В работе рассматривается задача стабилизации робота типа акробот «Acrobot» методом обратной связи линеаризацией. Рассматриваемая модель акробота представляет собой роботизированную конструкцию двухзвенного робота с единственный приводом в вертикальной плоскости (локте). Рассматриваемая модель представляет интерес, определяемый возможностью аналитического исследования динамических уравнений с незначительным числом параметров. Получено решение задачи стабилизации конструкции акробота линейно-квадратичными регуляторами. Однако найденные решения не обеспечивают робастность параметров, что затрудняет их практическое использование. Приведены результаты вычислительных экспериментами. Ключевые слова: акробот, стабилизация нелинейных систем, кусочно-линейный квадратичный регулятор.
1. Введение
Acrobot — это роботизированный двухзвенный робот с единственный приводом рука в вертикальной плоскости, работающим против силы тяжести [1]. Конструкция похожа на двухзвенную руку робота с одним приводом в локте, стабилизация напоминает гимнаста (или акробата) [2], который контролирует свои движения, применяя крутящий момент в талии. Интерес к задаче стабилизации акробота определяется возможностью аналитического анализа уравнений движения [3], т. е. значительную часть моделирования можно выполнить «вручную».
Схема конструкции приведена на рис. 1. Конструкция состоит из двух звеньев, соединенных суставом. Управление движением осуществляется с помощью электродвигателя в межзвенном суставе. Главное отличие рассматриваемой задачи от известных работ [4, 5] заключается в запрете на траектории, при которых нижнее
И. В. Рядчиков, А. А. Свидлов, А. Э. Бирюк, и др.
звено слишком сильно отклоняется от вертикали (происходит падение на землю), а также верхнее звено осуществляет вращение и т. п. Эти ограничения не позволяют использовать такие способы, как стабилизация вблизи гомоклинной орбиты или так называемые energy based подходы.
Рисунок 1. Схема конструкции Acrobot
На рис. 1 приведена схема конструкции, называемой в литературе «Acrobot». Конструкция состоит из двух звеньев, параметры которых следующие: т — масса /-го звена; I — длина /-го звена; Ji — момент инерции 7-го звена относительно его центра масс. Будем считать, что центр масс звена расположен в геометрическом центре звена. Положение конструкции однозначно задается двумя параметрами: в — угол поворота нижнего, т. е. 1-го звена, относительно вертикали; а — угол поворота второго звена относительно первого (см. рис. 1). Конструкция актуирова-на силовым воздействием: т — входной вращательный момент, прикладываемый ко второму звену со стороны первого.
2. Синтез стабилизирующего регулятора
Потенциальная энергия задается следующим выражением:
П = втк С08 в + ^ / ^р + /2 cos(а + в)^,
где первое слагаемое соответствует потенциальной энергии первого звена, второе слагаемое — второго, g — ускорение свободного падения. Переходим к нахождению кинетической энергии. Угловые скорости первого и второго звена соответственно:
со1 = (3, со2 = а + (3.
Скорость центра масс первого звена определяется следующим выражением:
Квадрат скорости центра масс второго звена можно вычислить, исходя из теоремы о сложении скоростей [6]:
v2 = P^i2 + ^ (а + Р)%2 + РА О* + PV2cos а-
Тогда кинетическая энергия первого звена равна
K =
J M mv2
2 í
m
а кинетическая энергия второго:
К = J2®2 , m2Vl =J (¿ + P)2 , 1 2 2 2 2 2 2
2^2 , „.,„, _ r V" . f; +Lm\ |3/2 + I(a + |3)2/22+|3/1(á + |3)/2cosa|.
Запишем Лагранжиан системы:
í Г- т\
L{ a,á,|3,|3) =
г- Jx m, — + — v 8 2 y
--С08Р ~~ ёт2 С08Р + С08(а + Р)^
Для рассматриваемой конструкции уравнения Лагранжа второго рода [6] имеют вид
|32 +^w2íp2/2 +i(á+|3)2/22 +^(¿+13)/, cosa
1
d Г - dL
dt да
d í8.^ dL
dt
--= 0.
чар^ ар
Выпишем все частные производные, входящие в уравнения Лагранжа второго
рода:
— = — т2Г2(а +13) + — m2/j/2|3cos a+J2(á +13), й 4 2
— = -—ff72/j/2|3(á + |3)sina + — gm2/2sin(a + P), da 2 2
dL
ар
f
\
J
p + m2/2p + ^ m2i\ (fi+á)+m2lll2 í ~ + P | cos a + J2 (á + P),
= \ smhsin P+gm ^ li sinP+112sin(a+e) j.
Итак, выписываем уравнения Лагранжа второго рода
И. В. Рядчиков, А. А. Свидлов, А. Э. Бирюк, и др.
í .. Г- i ■
■■ . . 1 Г» 2
ь,
J2(ä + ß) + m2 (ä + ß)-j + — ß"/j/2sina + — ß"/j/2cosa -—gm2/2sin(a + ß) = x,
1
'mJL+^
v
J
ß + m2/j°ß + m2C (ß + а)+т2Ц2 ^ + ß j cos a - т21Л12 ^ + ß j à sin a+J2 (ä + ß) -
1
- gml sin в - gm2 ^ l sinP + —12 sin(a + в) j = 0. Произведя элементарные преобразования, перепишем уравнения в следующем виде
( 1 Л ..( 1.1 I 1 1
äl J2 + —mj2 I + ßl J2 + —m2l2 + —mJJ^cosa I + — ß"m,/j/2sina-—gm2/2sin(a + ß)=x,
(I , 1 A ■■( 1 , , 1 , ^
äl —m2l2 + — m2lxl2 cos a + J2 I + ßl Jx +J2+—llml +1Л m2 + —l2m2 +lll2m2 cosa I -
1
1
— (ä + 2ß)ä/j/2m2sina--gmk sin ß - gm2\ /jsinß + — /2sin(a + ß) =0.
2
2
1
Вводя обозначение q = [а р]т, перепишем полученные уравнения в матричном виде:
где
D(q)q + C(q,q)q + B(q)=
v 0 J
(l)
D(q) =
J^ Л
2 4 2 2
J +1 m2l22 +1 m2lxl2 cos а
J +1 m2l\ +1 m2lxl2 cos а J + J2 +1 l^ml + l^m2 + lxl2m2 cos а v 4 2 4 J
J^ + ^W^l) 4
J^ + l-—2 4
Л
J +1 m2ll J + J +1 lm + lfm2 +1 l2m2
+ — m2\l2 cos а
C(q,q) = -~^m2lil2 sina
f 0 d + ß á
Г 0 1 ^
v1 2J
B(q) =
gm2l2 sin(a + ß) -1 gml sin ß - gm Г l sin ß +112 sin(а + ß)
Заметим, что
дП дП
да др
Отметим важное для установления пассивности системы равенство
^ 0(с|) - С(с].с]) = т21л12 эта
( 0 -а-2|Зл а + 2|3 О
В силу кососимметричности матрицы 1/2(6^)) — С^,с[) выполнено тождество Запишем выражение полной энергии конструкции при помощи матрицы Э^)
1 т
Е^Щфд + Щф. Вычислим полную производную по времени от полной энергии вдоль траекто-
рии
ГтЛ^
чОуу
1-4тЁ)(Ч)44чтв(я)=
чОу
чОу
= ат.
Последним равенством устанавливается пассивность системы с входом т и выходом а. В самом деле, мы получили равенство
Е(Т)-Е(0) = |ат<#.
В силу неотрицательности энергии E применима теорема 2.4 из [7], утверждающая пассивность.
Найдем все старционарные точки системы. Очевидно, что точка (а0,Р0) является стационарной тогда и только тогда, когда существует такой управляющий момент т = т0, что выполняются уравнения
gm2l2sin(аo + р0) = т0,
-1 gm118Ш Ро - gm2 ^I sinPo + ^ sin(аo + Ро) ^ = 0.
Пусть Р0 — некоторый данный угол. Выразим угол а0 е М и управляющий момент г0 е К через Р0.
Вычтем из первого уравнения второе, получим:
о
И. В. Рядчиков, А. А. Свидлов, А. Э. Бирюк, и др.
1 mlll + j g sin ß0 = x0. (2)
Решив первое уравнение относительно а0, получим выражения для а0:
а0 = -ß0 - aresin ~~~ + 2ли, п е Z (3)
или
2т
а( i = ~ßi i ~71 + aresin-— + 2TW, neZ. (3 *)
gm2l2
Для точки а = а0, á = 0, ß = ß0, ß = 0, х = х0, где а0, ß0, х0 — найденные параметры, найдем линейное управление, обеспечивающее ее асимптотическую устойчивость по Ляпунову.
Сделаем замену a = aHOB+a0, ß = ßHOB+ß0 и т = тнов+т0, после чего «сотрем индексы "нов"»:
( 1 Л ■■( 1.1 ^ 1 -о
äl J2 +—т21-2 I + ßl J2 + —m2l; + —m2l\l2 cos(a + a0) I + —$~т21Л1.2sin(a + a0) -
-1 gm2l2 sin(a + ß + a0 + ß0) = т + т0,
ä^j^mJl + ^m2lll2 eos(a + a0) + J2 j +
■■( 1 o o 1 o ^
+ßl Jj +J2+—l{ml +¡{m2 +— l2m2 +/1/2m2eos(a + a0) I-
--^(á + 2ß)d/j/2m2 sin(a + a0) - -^gmxlx sin(ß + ß0) -
-gm2 ^lx sin(ß + ßo) +112 sin(a + ß+ao + ßo) j = 0. Запишем линеаризованные уравнения:
-1 gmlßcosßo - gm2 ^Ißcosßo +112(a + ß)cos(ao + ßo) j = 0. Запишем в матричном виде
( а} ( т 1
V -W — V 0 у
где
V — D(q0) —
J + m2
l2 1
J + m + — m2lxl2 cos a0
—m2l22 +1 m2lxl2 cos a0 + J J + J +1 tfm +l2m +1 '2m + hhm2 cos a0
(1
ж =
— gm2l2 Cos(ao + Po )
-gm2l2cos(ao + Po ) — gm2l2cos(a0 + Po) — g (m + 2m2 )l— cosPo +—gm2l2 cos(ao + Po)
T —
i—— t—2
\
V t21 t22 у
= V"1W.
Полная система линеаризованных уравнений
0 0 10 0 0 0 1
(a1 ( 0 0 101(a1 ( 0 1
d_
dt
Р
а
Kt2l t22 0 0Д|3У
tn tl2 0 0
0
V4
V11
V4
V 21 у
Эта система является управляемой тогда и только тогда, когда
ёй(Ь,АЬ,А2Ь,А3Ь) Ф 0.
Здесь
( 0 0 10 ^ ( 0 ^ 0 0 0 1 0
A =
tn t12 0 0
, ь =
у
Вычислим определитель det(b, Ab, A2b, A3b): det(b, Ab, A2b, A3b) = -(1024g 2(lJ¡m¡ cos P0 - 4 JJ2m2 cos(a0+P0) + +4 J2lm cos P0 + 8 Jlm cos P0 + 4lj2l2m2 sin a0 sin в -
-lj2ml cos(2a0+P0) + llllmlm2 cosP0 + l2l2mim2 cos(a0 - в))2) / (4l2l22m2 sin2 a0 + +mj^llm+16 Jl^m+4 Jml2+4 Jj^m+16 jj )4.
Проанализируем полученную формулу. Знаменатель дроби больше нуля в силу неорицательности всех параметров. Числитель может обращаться в нуль. Последний факт порождает необходимое и достаточное условие на управлемость линеаризованной модели:
V
11 V-1
V 21 У
Vr /
И. В. Рядчиков, А. А. Свидлов, А. Э. Бирюк, и др.
lj2 m2 cos Р0 - 4Jjl2m2 cos(a0+P0) + 4J2llmí cos в + 8J2llm2 cos в +
+4l2l2m2 sin a0 sin P0 - ljl2 m2 cos(2a0 + в ) + lfámm cos в + l^^mm cos(a0 - P0) ^ 0.
Ясно, что это выражение положительно при малых углах a0 и Р0, что означает управляемость системы в окрестности положения равновесия. Более того, в общем положении это выражение не равно нулю, поэтому далее будем считать, что модель является управляемой при выбранных параметрах.
Управление будем искать в виде линеной обраной связи по состоянию системы методом линейного квадратичного регулятора (LQR), т. е.
т — - K
Р
а
13
где
находится методом LQR.
В исходных переменных управление будет и + и0, поскольку на самом деле мы получили:
"нов =^аанов+^р|Знов+^аа+^р|3,
что в исходных координатах выражается следующим образом:
« - «о = КМ- ао) + (|3 -13 о) + КА+
Обратная связь с частичной линеаризацией (РРЬ). Из результатов моделирования следует, что одной из основных причин потери управляемости системы при линейном управлении является быстрое возрастание угловых скоростей движения звеньев конструкции, из-за чего возрастает нелинейное слагаемое в урав-
нении движения (1) системы. В силу своего вида это слагаемое полностью отбрасывается при линеаризации в окрестности положения равновесия.
В работе [1] предложена идея частичного учета нелинейных слагаемых. Здесь мы адаптируем эту идею к рассматриваемой нами задаче.
Рассмотрим задачу стабилизации в окрестности точки равновесия а0,Р0,то удовлетворяющим соотношениям (2), (3).
Для удобства, сделаем замену а = анов+а0, Р = Рнов+Р0 и т = тнов+т0, после чего сотрем индексы «нов»:
f 1 -Л ■■( 1 о 1 ^ 1 • ,
al J2 +—m2l2 I + |3I J2 + —m2l2 + cos(a + a0) I + sin(a + ao) ~~
-1 gm2l2 sin(a + в + a0 + в) = т + т0,
'(i
a| ~^m2l2 + m2lxl2cos(a + a0) + J2 | + p[ Jx + J2 + + l\m2 + + khm2cos(a + a0) |-
1 4
+ 2|3)а 1х12т2 зт(а + а0) этф + ро) -
-gm2 ^¡х 8т(Р + р0) +1 /2 sin(a + в + а0 + Р0)^ = 0.
Запишем эти соотношения следующим образом:
<Зхха + ¿/12Р + с|32 +ЬХ = х + т0, й2Х а + ¿/22Р - с( а + 2|32)а + Ь2 = 0. Коэффициенты ^,Ь и с зависят от а,а0,Р,Р0-
Вводим новое управление м = т + т0 получим:
a =
dX] 1
л
Р = — с(а + 2Р)а-62 ——и
с122 ^ с!хх у
Линеаризуем последнюю систему в окрестности а = 0, Р = 0, а = 0, Р = 0, а = 0, р = 0, и = 0.
и
а =
m^l2
g | 1 m + m2 j 11в c0s в0 + 1 gm2l2 (a + в) COs(a0 +в0 ) -
( \
m2lxl2 cos a0 2J +1 mJ?
P =
Jx+J2+ + 1\т2 + ^2т2 + Ц2Р2 С08 а0 Запишем последнюю систему в матричном виде:
И. В. Рядчиков, А. А. Свидлов, А. Э. Бирюк, и др.
Г а^ ГО 1 0 01 Г а^ Г<П
й 7, а = 0 А 0 А 0 А 0 1 а + и /з А
Р 1Р; 0 Л 0 0 0 ¡2 1 Р 1Р; 0
(4)
где
/ =
gm2l2cos(a0 + р0)
• + • +1¡2 т + ¡2 т +1 ¡2т2 + Ц2т2 ео8 а0
/2 =
g ( 2 т,+ т2 ) ¡,Со5 Ро + 2 ^ СО5(а0 + Ро )
• + •+_ ¡2 т + ¡2 т¡2т + Ц2т со® а0
/з =■
•л + л
2 4 2 2
-1 -
/4 =
т2Ц2со8а0
1 2
2 • + — т^2
• + • +1 ¡2 т + ¡2 т+, ¡2т + ¡¡2т со® а0
Проверим последнюю систему на управляемость. Система управляема тогда и только тогда, когда система векторов
(о 1 о о (о)
/з
о
V /4 ]
к = о,1,2,3
о о о о о о о 1
Л 0 ¡2 0У
образует базис пространства М4. Это эквивалентно условию /, + /2/4 Ф 0. В общем положении оно выполняется, т. е. выполняется при всех значениях параметров системы за исключением быть может некоторого множества меры нуль. Управление линеаризованной системы можно строить при помощи ЬС^Я. Для и = т + тп — б/|2Р — ф2 — Ъх получим:
а =
<ЛУ 1
(
\
Р = — с(а + 2Р)а-62 ——и
с122 ^ с!и у
Пусть управление и найдено. Выразим т через и :
1
(
\
х = и + — с(а + 2|3)а-62——и +ф~ +ЬХ -х0.
<322 ^ ёи )
Последняя формула не содержит вторых производных от переменных состояния, что позволяет ее применять с таким же набором датчиков положения системы, как и метод LQR.
Для проверки работоспособности и определения размеров областей управляемости проведем серию численных экспериментов на модели акробота со следующими значениями параметров:
X 2 X 2 Н
т = X кг; т2 = X кг; I = X м; ¡2 = X м; ^ =—кг • м ; ^ = — кг • м ; g = 10—.
12 !2 кг
При определении коэффициентов линейного регуляртора методом LQR минимизируем функционал
F = J (а- а,,)2 + (ß -ß0)2 + d2 +132 + (х - х 0fdt.
В случае стабилизации методом обратной связи с частичной линеаризацией коэффициенты для линейного управления м в вспомогательной системе управления (4) мы ищем методом LQR, минимизируя функционал:
G = J (а - а,,)2 + (ß -ß0)2 + d2 +ß2 +irdt.
0
3. Вычислительные эксперименты
Рассмотрим эксперименты по стабилизации в строго вертикальном положении, то есть, при а = Ро = 0.
Эксперимент 1. Начальное положение конструкции а(0) = |3(0) = а(0) = 0, Р(0) = 0.0239. Стабилизация методом LQR.
alpha dbet
■J / \ - da ha '
\
1
0 0.2 0.4 0.6 0.8 1 1.2 1.4 18 1.8 2
oflset=o Time
Рисунок 2. Стабилизация методом LQR при начальном положении а(0) = (3(0) = а(0) = 0, р(0) = 0.0239
0
И. В. Рядчиков, А. А. Свидлов, А. Э. Бирюк, и др.
Из представленных на рис. 2 данных моделирования видно, что система стабилизируется методом ЬС^Я при данном начальном положении.
Эксперимент 2. Начальное положение конструкции а(0) = (3(0) = а(0) = 0, Р(0) = 0.0240. Стабилизация методом LQR. Из представленных на рис. 3 данных моделирования видно, что система не стабилизируется.
Рисунок 3. Стабилизация методом LOR при начальном положении а(0) = (3(0) = а(0) = 0, 0(0) = 0,0240.
Численные эксперименты 1 и 2 позволяют сделать вывод, что при а(0) = Р(0) = а(0) = 0 устойчивость управления, построенного методом LQR, определяется диапазоном параметра Р(0) : (0.0239; 0.0240).
Эксперимент 3. Начальное положение конструкции а(0) = (3(0) = а(0) = 0, Р(0) = 0.0215. Стабилизация методом обратной связи с частичной линеаризацией. Из представленных на рис. 4 данных моделирования видно, что система стабилизируется методом PFL при данном начальном положении.
Рисунок 4. Стабилизация методом РРР при начальном положении ¿(0) = (3(0) = а(0) = 0, Р(0) = 0.0215
Эксперимент 4. Начальное положение конструкции а(0) = (3(0) = а(0) = 0, Р(0) = 0.0216. Стабилизация методом PLF.
Рисунок 5. Стабилизация методом РРЬ при начальном положении а(0) = (3(0) = а(0) = 0, (3(0) = 0.0216
Из представленных на рис. 5 данных моделирования видно, что система не стабилизируется.
Численные эксперименты 3 и 4 позволяют сделать вывод, что при а(0) = (3(0) = а(0) = 0, стабилизация на основе метода РБЬ обеспечивается только, если значение в(0) находится между 0.0215 и 0.0216.
Теперь рассмотрим эксперименты по стабилизации в положении при в = 0,1, а — находится по формуле (3).
Эксперименты 5-8. Стабилизация методом LQR.
Рисунок 6. Стабилизация методом LOR при начальном положении а(0) = (3(0) = 0, а(0) = а0, (3(0) = (30 + 0.042
о а.2 аэ 0.4 os а« 0.7 о.в q м го гн л5 м
OfftiH) Time gTins
Рисунок 7. Стабилизация методом LOR при начальном положении а(0) = (3(0) = 0, а(0) = а0, (3(0) = (30 + 0.043
И. В. Рядчиков, А. А. Свидлов, А. Э. Бирюк, и др.
Рисунок 8. Стабилизация методом LOR при начальном положении а(0) = (3(0) = 0. а(0) = а0. (3(0) = (30 -0.014
|--овсля
С- ' -
\ \
. 1
Рисунок 9. Стабилизация методом LOR при начальном положении а(0) = (3(0) = 0. а(0) = а0. (3(0) = (30 -0.015
На рис. 6-9 представлены результаты четырех экспериментов, которые устанавливают диапазоны значений параметров, определяющих стабилизирующее управление, синтезированное методом LQR.
Эксперименты 9-12. Стабилизация методом PFL.
Рисунок 10. Стабилизация методом PFL при начальном положении а(0) = (3(0) = 0, а(0) = а0, (3(0) = (30 + 0.0073
V —- - ■ ^_^
i"
Рисунок 11. Стабилизация методом PFL при начальном положении а(0) = (3(0) = 0, а(0) = а0, (3(0) = (30 + 0.0074
Рисунок 12. Стабилизация методом РРЬ при начальном положении а(0) = (3(0) = 0. а(0) = а0. (3(0) = (30 -0.013
Рисунок 13. Стабилизация методом РРЬ при начальном положении а(0) = (3(0) = 0, а(0) = а0, (3(0) = (30 - 0.014.
Эксперименты 9-12 (см. рис. 10-13) устанавливают границы устанавливают диапазоны значений параметров, определяющих стабилизирующее управление, синтезированного методом РБЬ.
4. Обсуждение и выводы
Таким образом, проведены численные эксперименты, направленные на выявление робастности решения задачи стабилизации линейными квадратичными регуляторами. При том, что решения найдены, их чувствительность к измению угла очень высокая.
Описанная в статье задача рассматривалась в контексте стабилизации движения неантропоморфного двуногого робота, основанную на работе только лишь с суставами ног, как вариант альтернативной конструкции стабилизации маховиками и/или с гиродинами [8, 9]. Из проведенных исследований видно, что использование модели акробота не позволит синтезировать робастное стабилизирующее управление конструкции в процессе шага, т. е. при переносе одной ноги за счет коленного сустава другой (опорной) ноги.
Полученные в статье результаты представляют методический интерес, как методика аналитического иследования динамических управляемых моделей на примере конструкции акробота и примеры соответствующих вычислительных экспериментов могут быть использованы для оценки робастности параметров в задачах управления.
И. В. Рядчиков, А. А. Свидлов, А. Э. Бирюк, и др.
Литература
1. Spong M. W. The swing up control problem for the acrobot // IEEE Control Systems. 1995. Vol. 15. No. 1. P. 49-55.
2. Tedrake R. Underactuated Robotics: Algorithms for Walking, Running, Swimming, Flying, and Manipulation (Course Notes for MIT 6.832). 2017 [Электронный ресурс] http://underactuated.mit.edu/
3. Krafes S., Chalh Z., Saka A. A Review on the Control of Second Order Underactuated Mechanical Systems // Complexity. 2018. Vol. 2018. Article ID 9573514.
4. Ahmadi M., Topcu U., Rowley C. Control-Oriented Learning of Lagrangian and Hamiltonian Systems // 2018 Annual American Control Conference (ACC). — IEEE, 2018. P. 520-525.
5. Han W., Tedrake R. Feedback design for multi-contact push recovery via LMI approximation of the piecewise-affine quadratic regulator // 2017 IEEE-RAS 17th International Conference on Humanoid Robotics (Humanoids). — IEEE, 2017. P. 842-849.
6. Голубев Ю. Ф. Основы теоретической механики : учебник. — М. : МГУ им. М. В. Ломоносова, 2000.
7. Фантони И., Лозано Р. Нелинейное управление механическими системами с дефицитом управляющих воздействий. — М.; Ижевск : ООО «Компьютерная динамика», 2012.
8. Гусев А. А., Никульчев Е. В., Рядчиков И. В., Соколов Д. В. Синтез и исследование модели глобального экспоненциально-устойчивого наблюдателя угловой скорости для обратного маятника с маховиком // Прикаспийский журнал: управление и высокие технологии, 2018. № 3 (43). С. 71-88.
9. Арановский С. В., Бирюк А. Э., Рядчиков И. В., Никульчев Е. В., Соколов Д. В. Синтез наблюдателя в задаче стабилизации обратного маятника с учетом ошибки в датчиках положения // Известия РАН. Теория и системы управления, 2019. № 2. C. 163-171.
Авторы:
Игорь Викторович Рядчиков — кандидат физико-математических наук, заведующий лабораторией робототехники и мехатроники; Кубанский государственный университет
Александр Анатольевич Свидлов — кандидат физико-математических наук научный сотрудник отдела аридных зон, лаборатория проблем распределения стабильных изотопов в живых системах; Южный научный центр РАН
Андрей Эдуардович Бирюк — кандидат физико-математических наук, доцент кафедры теории функций; Кубанский государственный университет
Семен Ильич Сеченев — аспирант кафедры вычислительных технологий; Кубанский государственный университет
Александр Алексеевич Гусев — аспирант кафедры прикладной математики; Кубанский государственный университет
Евгений Витальевич Никульчев — доктор технических наук, профессор, профессор кафедры управления и моделирования систем; МИРЭА - Российский технологический университет
Study of the Solution of Stabilization Task for the Linearized Acrobot Robot Model
I. Ryadchkov*, A. Svidlov**, A. Biruk*, S. Sechenev*, A. Gusev*, E. Nikulchev***
Kuban State University, Krasnodar, st. Stavropol'skaya, 149, 350040
Southern Scientific Center of Russian Academy of Sciences, Rostov-na-Donu, pr. Chekhova, 41, 344006 ***MIREA-Russian Technological University, Moscow, Vernadskogo pros., 78, 119454 e-mail: [email protected]
Abstract. The paper deals with the problem of stabilization of an Acrobot-type robot using the feedback method with partial linearization. The considered Acrobot model is a robotic two-link robot with a single drive in the vertical plane (elbow). The considered model is of interest, determined by the possibility of an analytical study of dynamic equations with a small number of parameters. The solution of the problem of the stabilization of the structure with linear-quadratic regulators did not allow obtaining robust values of the ranges of parameters that provide the specified quality control, which was confirmed by numerical experiments. Key words: Acrobot, non-linear systems stabilization, piecewise linear quadratic regulator.
References
1. SpongM. W. (1995) IEEE Control Systems, 15(1):49-55.
2. Tedrake R. (2017) Underactuated Robotics: Algorithms for Walking, Running, Swimming, Flying, and Manipulation (Course Notes for MIT 6.832). http://underactuated.mit.edu/
3. Krafes S., Chalh Z., Saka A. (2018) Complexity, 2018:9573514.
4. Ahmadi M., Topcu U., Rowley C. (2018) Control-Oriented Learning of Lagrangian and Hamiltonian Systems. In 2018 Annual American Control Conference (ACC). P. 520-525.
5. Han W., Tedrake R. (2017) Feedback design for multi-contact push recovery via lmi approximation of the piecewise-affine quadratic regulator. In 2017 IEEE-RAS 17th International Conference on Human-oid Robotics (Humanoids). P. 842-849.
6. Golubev Yu. F. (2000) Osnovy teoreticheskoy mekhaniki : uchebnik. Moscow, MGU im. M. V. Lomon-osova [In Rus]
7. Fantoni I., Lozano R. (2012) Nelineynoye upravleniye mekhanicheskimi sistemami s defitsitom uprav-lyayushchikh vozdeystviy. Moscow, Izhevsk : OOO «Komp'yutemaya dinamika» [In Rus]
8. Gusev A. A., Nikulchev E. V., Ryadchikov I. V., Sokolov D. V. (2018) Prikaspiyskiy zhurnal: uprav-leniye i vysokiye tekhnologii, 43:71-88. [In Rus]
9. Aranovskiy S.V., Biryuk A.E., Nikulchev E.V., Ryadchikov I.V., Sokolov D.V. (2019) Journal of Computer and Systems Sciences International, 58(2):297-304.