Системный анализ и управление
УДК 681.5
С.Ф. Бурдаков, П.А. Сизов
алгоритмы управления движением мобильного робота
в задаче преследования
S.F. Burdakov, P.A. Sizov
the mobile robot motion control algorithms for the pursuit problem
предложены алгоритмы управления движением мобильного колесного робота в задаче преследования, которые обеспечивают выполнение цели управления при неполной информации о движении преследуемого робота. В качестве объекта управления использованы кинематические уравнения в переменных состояния, характеризующих выполнение цели управления. линейная и угловая скорости догоняющего робота рассматриваются в качестве управлений. линейная и угловая скорости преследуемого робота являются возмущениями неопределенного характера. Алгоритмы с обратной связью базируются на методе компенсации и классическом представлении об астатизме систем управления. при анализе устойчивости замкнутой системы и настройке алгоритмов управления использованы методы ляпунова. теоретические результаты подтверждены компьютерным моделированием. приведены траектории и графики процессов в замкнутой системе при произвольных маневрах преследуемого робота. показаны реверсивные траектории преследуемого робота, при которых догоняющий робот не достигает цели.
мОБильный робот; ЗАДАчА ПрЕСЛЕДОВАНИЯ; мЕТОД ляпунОВА; алгоритмы управления; неполная ииформадия; робастностъ; моделирование.
The paper suggests the mobile wheeled robot motion control algorithms for the pursuit problem which allow implementing control when the information about the pursued robot motion is incomplete. Kinematic equations with state variables are used as the control target. Linear and angular velocities are considered as the pursuing robot controls. Linear and angular velocities are perturbations of uncertain nature for the pursued robot. Algorithms with feedback are based on the method of compensation and classical approach to control systems astatism. Lyapunov's methods are used in the stability analysis for the closed loop system, as well as to adjust the control algorithms. The theoretical results are confirmed by computer simulation. The trajectories and plots of the processes in the closed loop system are presented for the case of the random maneuvers of the pursued robot. There are shown the reversionary trajectories of the pursued robot in case the pursuing robot does not reach the target.
MOBILE ROBOT; PURSUIT PROBLEM; LYAPUNOV'S METHOD; CONTROL ALGORITHMS; INCOMPLETE INFORMATION; ROBUSTNESS; SIMULATION.
Задачи управления движением мобильных колесных роботов помимо теоретического значения приобретают в последнее время все большее практическое в различных областях техники и технологий. Спектр
решаемых задач при этом оказывается очень широким: от игровых задач до специальных задач обеспечения безопасности. Высокие требования к характеристикам движения роботов обусловливают необходимость ис-
пользования средств математического и компьютерного моделирования на всех этапах синтеза алгоритмов управления. При этом используются как традиционные не-голономные модели роботов [1, 2], так и голономные модели, позволяющие описать такие эффекты, как проскальзывание колес, заносы и т. п. [3, 4].
В настоящей работе с использованием кинематических моделей движения рассмотрена задача преследования одного робота другим. В различных постановках похожие задачи рассматривались разными авторами. Управление неголономным мобильным роботом при слежении за предписанной траекторией на основе скользящих режимов рассмотрено в работах [5, 6]. Для решения траекторной задачи в [7] использован метод бэкстеппинга. В [8] рассмотрена задача синхронизации движения двух мобильных роботов. при этом использовались идеи методов пассификации [9] и бэкстеппинга. В отличие от известных постановок в рассматриваемую задачу внесен элемент неопределенности, связанный с неполной информацией о характеристиках движения преследуемого робота. Использование метода компенсации и классического представления об астатизме систем управления [10] позволило получить ряд новых нетри-
виальных результатов.
Постановка задачи
Рассмотрим систему, состоящую из двух мобильных колесных роботов, один из которых произвольно движется с линейной скоростью vr и угловой скоростью or, а второй, управляя линейной скоростью v и угловой скоростью к>, стремится его догнать. На рис. 1 показаны линейные и угловые координаты преследуемого xr, yr,9r и догоняющего x, y, 9 роботов, а также координаты xe, ye, 9е преследуемого робота в системе координат, связанной с догоняющим роботом.
Пренебрегая инерцией, запишем кинематические уравнения движения роботов в опорной системе координат OXY:
xr = vr cos 9r, x = v cos 9,
yr = vr sin 9r, y = v sin 9, (1)
9r = ar, 9 = о.
переходя к связанной системе координат O XY с помощью преобразования
Х e ' cos 9 sin 9 0" " xr - x
y = - sin 9 cos 9 0 Уг - y
9 e 0 0 1 9r -9
получим уравнения
*е = юуе - v + vr cos 9е, Уе = -(ÖXe + Vr sín 0е ,
0е = ю -ю,
(2)
которые можно рассматривать, как уравнения управляемого процесса с переменными состояния хе, уе, 0е, характеризующими ошибки догоняющего робота в достижении цели, с управлениями V, а и с возмущениями уг, юг, так как заранее неизвестно, как будет двигаться преследуемый робот.
Предполагается, что скорости преследуемого и догоняющего роботов ограничены < V., |юг| < Юг, VI - V, |а| < а , при этом предельные значения скоростей догоняющего робота V, а превышают предельные значения скоростей преследуемого робота V , юг.
Будем считать, что для догоняющего робота доступны измерения переменных состояния хе, уе, 0 е, а также имеются оценки скоростей преследуемого робота , Юг.
Требуется для догоняющего робота построить закон управления движением с обратной связью
(3)
V = v(xe, у, 0е, Гг, Юг ),
Ю = а(хе, уе, 0е , Vг, Юг ),
обеспечивающий для управляемого процесса (2) асимптотическое условие хе ^ 0, у е ^ 0, 0 е ^ 0 при ^ ^ ж.
Соответствующая структурная схема замкнутой системы управления (2), (3) представлена на рис. 2.
Управление при полной информации о движении преследуемого робота
Пусть помимо измерений переменных состояния хе, y е, 9 е имеется полная информация о скоростях преследуемого робота, то есть vr = vr, со, = cor.
По имеющейся информации сформируем закон управления движением догоняющего робота компенсационного типа с обратными связями по переменным состояния
(4)
v = vr cos 0 e + c1xe, ra = ar + c2ye + c30 e,
где cl, c2, c3 — настраиваемые коэффициенты обратных связей.
При подстановке управлений (4) в уравнения (2) получим уравнения для процессов в замкнутой системе:
Xe =гагУе - ci X + c2 У2 + c3 Уе0 e ,
Уе = -rarXe - c2ХеУе - c3Xe0e + Vr SÍn 0 e , (5)
0e = -c2ye - c30e .
Видно, что замкнутая система (5) имеет нулевое положение равновесия
xe = 0, ye = 0, 0е = 0. (6)
Исследуем его устойчивость. Для этого составим функцию Ляпунова:
1
21 Y
полная производная по времени от функции Ляпунова (7) на траекториях си-
V = ^К2 + Уе2 + А021, Y>0.
(7)
Рис. 2. Структурная схема системы управления
стемы имеет вид
V = -c,x2 - - c302 - y I- c20 - v sin 0 I.
1 e 3 e J e \ 2 e r e
Y VY )
Таким образом, асимптотическая устойчивость рассматриваемого равновесного состояния имеет место при
sin 0„
c1 > 0, c3 > 0, c2 = YVr
9.
(8)
Для определения значений коэффициентов с1, с3 проанализируем поведение системы (5) вблизи равновесного состояния (6) при постоянных значениях уг , юг. Для этого рассмотрим линеаризованные уравнения
xe = о y - Су xe ,
Уе = -°rxe + Vr9e, 9e = С2ye - С39e
(9)
и соответствующее характеристическое уравнение
A,3 + X2(cl + c3) + A(qc3 + c2vr + о2) +
+ c1c2vr + c3or = 0.
(10)
Выберем структуру желаемого характеристического уравнения в следующем виде:
(Х + 2£ю0)( X2 + 2 £ю0 X + ш0) = 0, (11)
где ю0 = (ю2 + У^2)1/2 — величина, определяющая темп желаемого движения.
Безразмерный параметр £ является свободным. Его выбор определяет конфигурацию корней характеристического уравнения (11). В частности, при £ = 1 получаются корни Х1 = -2ш0, Х2 = -ш0, Х3 = -ш0, что соответствует при каждом ю0 максимальной степени устойчивости системы (9). Второй свободный параметр у определяет баланс влияния величин уг и аг на скорость затухания переходных процессов в системе (9).
Характеристическое уравнение (10) приобретает желаемую структуру (11) при следующих значениях коэффициентов обратных связей:
С1 = сз = 2£(®2 + У^2)1/2, С2 = ууг, (12) что полностью соответствует условиям (8).
Заметим, что из дальнейшего рассмотрения следует исключить случай vr = 0, ш r = 0, для которого система (9) становится не полностью управляемой.
управление при неполной информации о движении преследуемого робота
Рассмотрим более общий случай, когда vr ф vr и шг ф шг. Закон управления (4) в этом случае имеет вид
v = vr cos 0e + c1xe,
ш = Шг + c2ye + c30e,
^Г2 Л^l/2 Л sin 0„
где c1 = c3 = 2£(шг + yvr)1 , c2 = yv
(13)
Запишем уравнения замкнутой системы (2), (13)
хе = К + С2Уе + с30е )уе - с1Хе + с°> ее, Уе = -(Иг + С2Уе + С3ее )хе + V, ЭШ ^ , (14)
е е = Д®г - С2 Уе - С3ее ,
где Дуг = уг - уг, Дюг = юг -аг — ошибки неполной компенсации.
Видно, что цель управления недостижима, т. к. равновесное состояние замкнутой системы (14) смещено относительно нулевого (6).
по аналогии с понятием об астатизме систем управления, робастность по компенсационным составляющим будем обеспечивать введением в закон управления (13) дополнительных интегральных слагаемых:
v = vr cos 9e + c1 xe + afj,
о = Or + c2 ye + c39e + Pv2,
t
(15)
где
W = j" C1 Xedt; Y2 = { (C2Уе + C30e № a и P -0 0 настраиваемые параметры, определяющие
скорость смещения положения равновесия к требуемому.
Подставляя соотношения (15) в уравнения (2), получим уравнения замкнутой системы:
Хе = (Ю, + c2Уе + С39е + Р^Уе - С1 Х -
- aw1 + Avr cos Qe, (16)
ye = -(fflr + c2Уе + Сз9е + P^K + Vr Sin 0e,
9е = A®r - С2Уе - С39е -
(16)
Ч>1 = С1 Хе ,
V2 = с2Уе + сз0е .
Замкнутая система (16) имеет следующее равновесное состояние:
Хе = 0, Уе = 0, 0е = 0, ^ = Д^ / а,
^2 = ДЮг / Р.
Для анализа устойчивости в малом этого положения равновесия линеаризуем систему и запишем ее характеристическое уравнение:
(17)
X + c1 -®r 0 а 0
®r X -Vr 0 0
0 C2 X + c3 0 ß
-c1 0 0 X 0
0 -C2 -c3 0 X
= 0.
(18)
Значения корней X,., I = 1..5 характеристического уравнения (18) зависят от реальных линейной и угловой скоростей vr, юг преследуемого робота, от их оценок Vг , Юг ,
а также от свободных параметров Y, а, ß.
Поскольку параметры а и ß имеют одинаковую размерность и определяют скорость смещения к нулевому положению равновесия по переменным хе, ye,9е, примем а = ß и построим корневой годограф (рис. 3) замкнутой системы в диапазоне значений 0 < а = ß < 50 при следующих значениях остальных величин vr = vr, С = с, Vr = vr, со, = О, % = 1, Y = 10.
Анализ корневого годографа характеристического уравнения (18) показывает, что при малых значениях параметра а = ß в конфигурации корней имеется два корня, близких к нулю, и три корня, близких к корням желаемого характеристического уравнения (11). Дальнейшее поведение корней видно из рис. 3. Можно подобрать такое значение параметра а = ß , при котором обеспечивается разделение движений на «быстрое» движение типа (11) и «медленное» движение, соответствующее смещению положения равновесия замкнутой системы (16) к нулевому по координатам хе, ye ,9е. На рис. 3 подобная конфигурация корней
Рис. 3. Корневой годограф замкнутой системы
при а = в = 0,19 обозначена кружками. Таким образом, имеет место локальная асимптотическая устойчивость равновесного состояния (17) замкнутой системы (16).
Заметим, что по управлениям (15) вблизи равновесного состояния можно уточнять оценки линейной и угловой скоростей Vг, со г
преследуемого робота в соответствии с выражениями V « vr, ш и шг и затем корректировать коэффициенты обратных связей С1, С2, С3, приближая их к значениям (12).
Устойчивость равновесного состояния замкнутой системы (16) при произвольных vr(V), шг(V), больших начальных рас-
Рис. 4. Траектории движения роботов и графики процессов при полной информации о движении преследуемого робота
согласованиях и ограничениях на значения управлений V, а анализировалась при компьютерном моделировании.
Результаты моделирования
Результаты моделирования подтвердили теоретические выводы и позволили уточ-
нить некоторые особенности движения догоняющего робота.
1. При полной информации о движении преследуемого робота моделировались процессы в замкнутой системе (5) при Е = 1, у = 10 и различных начальных условиях. рассматривались равномерное прямоли-
Рис. 5. Траектории движения роботов и графики процессов при неполной информации
о движении преследуемого робота
нейное движение преследуемого робота vr = const, га, = 0, равномерное движение по окружности vr = const, га, = const, а также различные маневры преследуемого робота с vr = vr (t), га, = га, (t). Цель управления достигалась во всех случаях, но с разным быстродействием. Достижение цели фиксировалось при попадании догоняющего робота в зону |xe| < 10-3, |ye| < 10-3, |ej < 10"3.
В целом траектории движения догоняющего робота при приемлемом быстродействии отличались гладкостью. Однако имели место и некоторые особенности. Например, при прямолинейном движении преследуемого робота и начальных условиях по углу ee близких к ee (0) = ±п на траекториях догоняющего робота появлялся характерный излом, показывающий, что догоняющий робот сначала движется задним ходом, а затем после остановки вы-
ходит на траекторию преследуемого робота и достигает его.
На рис. 4 приведены траектории Уг = У г (хг) преследуемого робота (пунктирная линия) и у = у(х ) догоняющего робота в опорной системе координат ОХУ, а также графики всех процессов для следующего маневра преследуемого робота. В начальный момент времени V = 0 он двигается прямолинейно с постоянной скоростью vr = V, = 0,1. Затем на пятой секунде движения он поворачивает влево на угол п /2 с постоянной угловой скоростью ш, = ш, = 1. Далее преследуемый робот три секунды движется прямолинейно со скоростью V, а затем с угловой скоростью шг поворачивает в противоположную сторону на тот же угол п /2 и выходит на траекторию, параллельную начальной.
Были приняты следующие начальные
Рис. 6. Траектории движения роботов и графики процессов при реверсивных движениях преследуемого робота
условия для преследуемого и догоняющего роботов:
xr (0) = 0,25, х (0) = 0, у (0) = 0,25, y(0) = 0,
er(0) = п /6, е(0) = 0.
По результатам моделирования быстродействие определялось величиной t* = 19,77. При этом управления v, ш не превышали следующих максимальных значений: vmax = 0, 26, штах = 1,09.
2. При неполной информации о движении преследуемого робота моделировались процессы в замкнутой системе (16).
На рис. 5 приведены траектории движения роботов и графики процессов достижения цели для описанного выше (см. п. 1) маневра преследуемого робота. Дополнительно были введены следующие данные: Vr = vr = 0,1, Шг = 0, а = в = 0,19, v1(0) = 0, у2(0) = 0.
Видно, что цель достигается и в этом случае, однако за больший промежуток времени t* = 32,53. При этом управления не превышали следующих максимальных
значений: vmax = 0,26, шmax = 0,8°.
При моделировании процессов в замкнутой системе (16) с настройками закона управления (15), соответствующими разделению движений, наблюдалась медленная сходимость процессов для круговых траекторий движения преследуемого робота. Это позволило предложить реверсивные траектории преследуемого робота, при которых догоняющий робот, не отработав предыдущих маневров, втягивался в периодическое движение, не приводящее к цели (рис. 6).
Моделирование процессов при введении ограничений на управления v, ш в достаточно широком диапазоне настроек закона управления приводило лишь к снижению быстродействия, не влияя на устойчивость замкнутой системы (16).
список литературы
1. Canudas de Wit C., Siciliano B., Bastin G.
(Eds). Theory of Robot Control. London: Springer — Verlag, 1996. 392 p.
2. мартыненко Ю.Г. Управление движением мобильных колесных роботов // Фундаментальная и прикладная математика. 2005. Т. 11. № 8. С. 29-80.
3. Бурдаков С.Ф., мирошник И.В., Стельма-ков Р.Э. Системы управления движением колесных роботов. СПб.: Наука, 2001. 227 с.
4. коньков В.Г., Андриков Д.А., кулаков Б.Б.
Синтез интеллектуализированной системы торможения колесного транспортного средства // Вестник МГТУ им. Н.Э. Баумана. Приборостроение. 2008. № 2. С. 3-26.
5. Aguilar L.E., Tamel T., Soueres P. Robust Path Following Control for Wheeled Robots via Sliding Mode Techniques // Proc. IEEE/RSI Int. Conf, Intell. Robot Syst. 1997. Pp. 1389-1395.
6. Dongkyoung Chwa et al. Sliding Mode Tracking Control of Nonholonomic Wheeled Mobile Robots // Proc. ACC. 2002. Pp. 3991-3996.
7. Jiang Zhong-Ping, Nijmeijer H. Tracking Control of Mobile Robots: A Case Study in Backstepping // Automatica. 1997. Vol. 33. No. 7. Pp. 1393-1399.
8. усик Е.В. Синхронизация нелинейных систем Лурье на основе пассификации и бэк-степпинга // Автоматика и телемеханика. 2012. № 8. С. 35-48.
9. Андриевский Б.Р., Фрадков А.л. Метод пассификации в задачах адаптивного управления, оценивания и синхронизации // Автоматика и телемеханика. 2006. № 11. С 33-37.
10. Первозванский А.А., Фрейдович л.Б. Об астатизме нелинейных систем // Автоматика и телемеханика. 1998. № 7. С. 35-43.
references
1. Canudas de Wit C., Siciliano B., Bastin G.
(Eds). Theory of Robot Control. London: Springer — Verlag, 1996, 392 p.
2. Martynenko Yu.G. Upravlenie dvizheniem mobilnyih kolesnyih robotov [Motion control of mobile wheeled robots], Fundamentalnaya i prikladnaya matematika, 2005, Vol. 11, No. 8, Pp. 29-80. (rus)
3. Burdakov S.F., Miroshnik I.V., Stelmakov R.E.
Sistemy urpravleniya dvigeniem kolesnyh robotov. St. Petersburg: Nauka Publ., 2001, 227 p. (rus)
4. Konkov V.G., Andrikov D.A., Kulakov B.B. Sintez intellektualizirovannoy sistemy tormogeniya kolesnogo transportnogo sredstva, Vestnik MGTU imeni N.E. Baumana. Priborostroenie, 2008, No. 2, Pp. 3-26. (rus)
5. Aguilar L.E., Tamel T., Soueres P. Robust
Path Following Control for Wheeled Robots via Sliding Mode Techniques, Proc. IEEE/ RSI Int. Conference, Intell. Robot Syst, 1997, Pp. 1389-1395.
6. Dongkyoung Chwa et al. Sliding Mode Tracking Control of Nonholonomic Wheeled Mobile Robots, Proc. ACC, 2002, Pp. 3991-3996.
7. Jiang Zhong-Ping, Nijmeijer H. Tracking Control of Mobile Robots: A Case Study in Backstepping, Automatica, 1997, Vol. 33, No. 7, Pp. 1393-1399.
8. usik E.V. Sinhronizatsiya nelineynyih sistem Lurie na osnove passifikatsii i beksteppinga
[Synchronization of Nonlinear Lur'e Systems Using Passification and Backstepping], Avtomatika i telemehanika, 2012, No. 8, Pp. 35-48. (rus)
9. Andrievskii B.R. Fradkov A.L. Metod passifikatsii v zadachah adaptivnogo upravleniya, otsenivaniya i sinhronizatsii [Method of passification in adaptive control estimation and synchronization], Avtomatika i telemehanika, 2006, Vol. 67, No. 11, Pp. 1699-1737. (rus)
10. Pervozvanskii A.A, Freudovitch S.F. Ob astatizme nelineynyih sistem [On the astatism of nonlinear systems], Avtomatika i telemehanika, 1998, No. 7, Pp. 35-43. (rus)
БуРДАкОВ Сергей Федорович — профессор кафедры механики и процессов управления Института прикладной математики и механики Санкт-Петербургского государственного политехнического университета, доктор технических наук.
195251, Россия, Санкт-Петербург, ул. Политехническая, д. 29.
E-mail: [email protected]
BuRDAKOV, Sergey F. St. Petersburg Polytechnic University.
195251, Politekhnicheskaya Str. 29, St. Petersburg, Russia.
E-mail: [email protected]
СИзОВ Павел Александрович — студент кафедры механики и процессов управления Института прикладной математики и механики Санкт-Петербургского государственного политехнического университета.
195251, Россия, Санкт-Петербург, ул. Политехническая, д. 29.
E-mail: [email protected]
SIZOV, Pavel A. St. Petersburg Polytechnic University.
195251, Politekhnicheskaya Str. 29, St. Petersburg, Russia.
E-mail: [email protected]
© Санкт-Петербургский государственный политехнический университет, 2014