Мобильные роботы с двумя независимыми соосными ведущими колесами: Динамика и схемы управления

Павловский В.Е.; Евграфов В.В.; Павловский В.В.; Петровская Н.В.

Поэтому сопряженные переменные и лагранжевы координаты удовлетворяют следующей системе уравнений Гамильтона:

г!грг _ дН'ф ._

ЛЬ ддг ' ЛЬ дфг ' >•••>•

Связь между полученными уравнениями и каноническими уравнениями Гамильтона определяется каноническим преобразованием вида

(я; ф) = (я; -р), Н* = -Н,

имеющим валентность -1. Здесь Н — стандартный гамильтониан системы и рг = дЬ/ддг, г = 1,...,п.

Заключение. Формулы дифференциалов, предложенные Д. Е. Охоцимским, можно использовать для исследования функционалов, в том числе и в теории дифференциальных игр, так же, как дифференциалы функций.

Методы теории управления обогащают стандартные методы классического вариационного исчисления, их можно применять для решения вариационных задач в неконсервативных постановках.

Методы оптимального управления и гамильтонова механика, представленные единой теорией, образуют эффективный инструмент для решения современных проблем науки.

Работа выполнена при поддержке РФФИ (грант № 07-01-00134).

СПИСОК ЛИТЕРАТУРЫ

1. Голубев Ю.Ф. Метод Охоцимского-Понтрягина в теории управления и аналитической механике. Часть 1: Метод Охоцимского-Понтрягина в теории управления // Вестн. Моск. ун-та. Матем. Механ. 2008. № 6. 50-56.

2. Охоцимский Д.Е. К теории движения ракет // Прикл. матем. и механ. 1946. X, вып. 2. 251-272.

3. Голубев Ю.Ф. Основы теоретической механики: Учебник. 2-е изд., перераб. и доп. М.: Изд-во МГУ, 2000.

4. Вариационные принципы механики: Сб. статей / Под ред. Л. С. Полака. М.: Физматлит, 1959.

Поступила в редакцию 26.03.2008

УДК 531.3.01

МОБИЛЬНЫЕ РОБОТЫ С ДВУМЯ НЕЗАВИСИМЫМИ СООСНЫМИ ВЕДУЩИМИ КОЛЕСАМИ: ДИНАМИКА И СХЕМЫ УПРАВЛЕНИЯ

В. Е. Павловский, В. В. Евграфов, В. В. Павловский, Н. В. Петровская

1. Введение. В работе исследуются задачи синтеза гладких траекторий и задачи планирования и корректной реализации движения мобильных роботов с двумя независимо управляемыми активными колесами — роботов с дифференциальным приводом. Актуальность изучаемых задач обусловлена эффективностью рассматриваемой кинематической схемы. Одно из возможных применений задачи — построение динамически корректного управления роботами-футболистами.

2. Динамика колесного робота и управление им. Рассмотрим робот с двумя независимыми активными колесами, оси которых лежат на одной прямой. Движение такого колесного робота изучалось в статье [1], затем авторами в [2, 3]. Исследование движения цепочки подобных объектов приведено в [4-6].

Модель. Пусть система представляет собой два абсолютно твердых диска, расположенные на осях, лежащих на одной прямой; в местах крепления колес к осям находятся точечные цилиндрические шарниры; колеса управляются идеальными электродвигателями. К осям жестко прикреплен корпус — абсолютно твердое тело, которое может перемещаться плоскопараллельно. Эта "тележка" движется по абсолютно шероховатой плоскости, колеса в точках касания с плоскостью не проскальзывают. Модель рассматриваемого робота приведена на рис. 1. При условии плоскопараллельного движения корпуса положение системы описывается пятью координатами (х, у, ), углы представляют собой углы пово-

рота ведущих колес робота относительно оси. Центр масс корпуса объекта находится в точке С (рис. 1). Положение центра масс корпуса С в связанной системе координат задается вектором Ь = (Ъ\,Ъ2). Середина расстояния между колесами обозначена 0(х,у). Влияние пассивных колес на движение системы считаем незначительным.

Постановка задачи. Пусть начальное состояние системы задано набором (Хо,уо,во), конечное положение — набором (Х1 ,у1,9\). Примем, что во время движения робота координаты (х, у, в) вместе с угловыми скоростями вращения колес непрерывны и ф| ^ тах. Рассматривается задача перехода робота из заданного начального состояния в заданное конечное состояние: робот должен перейти в заданную конечную точку с заданной ориентацией продольной оси и заданной скоростью вдоль этой продольной оси в конечной точке. Пример ситуации, описываемой этой задачей, — выход робота-футболиста на мяч и удар по нему корпусом в заданном направлении с заданной скоростью.

Уравнения движения. Исходные уравнения связей, наложенных на систему, и уравнения движения рассматривались в [1], эти исследования были продолжены в [2-6]. Из условия непроскальзывания колес выводятся следующие урав- Рис. 1. Схема модели мобильного робота нения связей: с дифференциальным приводом

Х = (ав + тф\) соъ(в),

у = (ав + тф1) 8ш(в), 2а ■

<Р2 = <Р1 н--0.

т

(1)

Рассматриваемая система имеет 2 степени свободы, в качестве независимых координат выберем (ф1,в). Уравнения движения системы записываются в виде уравнений Чаплыгина

т2(ш + т1)ф1 + ((т + т1)ат — т0Ь2т)в — т0Ь1 тв2 = Q1,

((ш + ш1)ат — т0Ь2^ф>1 + ((т + 2т1)а2 — 2т0Ь2 а + ^в + т0Ь1 твф1 = Qi,;

(2)

2а

Я*1 = + и2и2 - (Ц1 + ц2)ф1 - — /~12в,

2а ( 2а Л (3)

Я2 = — ( ^2и2 - ц2ф1 - — Ц2О I,

где то — масса корпуса робота; т1 — масса колеса робота; т — полная масса робота; .] — приведенный момент инерции робота, зависящий от моментов инерции корпуса и колес робота и остальных динамических параметров робота.

В правой части (2) введены обобщенные силы (3), описывающие действие моментов, создаваемых двигателями постоянного тока, на активные колеса. В (3) коэффициенты ^1, У2, Ц1, Ц2 — коэффициенты линейных моделей электродвигателей робота.

Исследование и решение уравнений. Пусть базовыми траекториями робота являются дуги окружностей и отрезки прямых. Непрерывные по скоростям ф 1, ф2 "склейки" окружностей, прямых при помощи спиральной кривой впервые рассмотрены в [3]. Основой для введения дополнительной кривой является тот факт, что при отсутствии такой "склейки" двух траекторий движения в точке их соединения происходит разрыв по скоростям ф 1, ф2. Это означает неопределенность в управляющих напряжениях, как следует из (2), и возможность возникновения динамических ударов в системе. В общем случае разрыв скоростей появляется при переходе с кривой на кривую, когда имеет место скачок функции ориентиро-

, ,, | [^Л^] I , в т(ф2 — Ф1) Ф1 + ф2

ванной кривизны траектории Ко (в) = —-—Ьг, откуда Ко = — = -, где V = г- —

(г(в),г(в))3/2 V 2ау 2

линейная скорость корпуса робота.

С целью исключить разрыв по ф 1, ф2 вводится дополнительный режим движения системы на интервале "склейки" [Т1, Т2], при котором угловые скорости колес меняются линейно. Схема "склейки" приведена на рис. 2, а.

Рис. 2. Закон управления. Непрерывная склейка угловых скоростей. Примеры синтезированных траекторий робота

Соответствующая интервалу [Т\ , Т2] кривая в координатах (х,у) получается подстановкой линейного закона изменения ф\, ф2 в первое и второе уравнения связей (1):

x(t) =Хо + а^ (sin(0o) - sin(0(í))) + al(C{¡3l) -C{¡32)) -a2(S(/3i) -S(fh)),

F

y(t) =Уо + а^ (cos(0(í)) -cos(do)) + sgn(F")ai(S(/3i) - S(f32)) + sgn(F~)a2{C(f31) -C{¡32)),

«w-S'+s«-«*"*

(4)

где а, FF +, во, а\, а2, (3\, (32 — константы или известные функции времени, С(х) и 5(х) — интегралы Френеля. Получающаяся кривая — обобщенная спираль Корню.

В [2,3] подробно описаны примеры синтеза траекторий движения робота, состоящих из двух окружностей, соединенных спиральной кривой (рис. 2, б). Эти случаи были также исследованы на предмет минимизации времени движения от точки к точке.

Исследование спиральных траекторий. Чтобы удовлетворить конечным условиям при движении по спиральной кривой, подставим в уравнения системы (4) соотношение Ь = Т. Для последнего уравнения получим

г (ф\ + Ф% + 2 2

9(т) = 25

откуда

Ф\ = -Ф1 + Ф\ + Ф°1 + ^ Ав.

(5)

Формула (5) определяет зависимость конечных угловых скоростей от изменения угла ориентации. Согласно (5), для заданных начальных угловых скоростей можно определить соотношение конечных угловых скоростей, при котором конечная ориентация робота станет заданной.

При подстановке соотношения Ь = Т в первые два уравнения системы (4) сами уравнения не меняют своего вида, изменяются только коэффициенты:

в(Т) = вг 1

А = -&+1Д9) ■ = ^

2naF

¿ = ± ((ti+ + %№))/■

l2narT

F-

(6)

гТ{ф%-ф\)* 4 aF~

П = во -

аг = a1 cos(n), а2 = a' sin(n)sgn(F ).

Пусть теперь начальные угловые скорости равны между собой: ф° = ф2. Тогда формулы (4) преобразуются к следующему виду (коэффициенты А\, А2 ,В\,...,В^ — известные выражения от

параметров робота):

х(Т, ф 1) = хо — В1 + ВзТ — В2ф 1Т + А1Т, у(Т, ф 1) = уо — В4 + ВбТ — В5ф 1Т + А2Т.

Данные соотношения описывают множество конечных точек для спиралей с одинаковыми начальными угловыми скоростями колес и заданной конечной ориентацией корпуса. Получившиеся кривые ограничивают область, в которую попадет рассматриваемая система при заданных условиях на угловые скорости и промежутки времени движения, — область достижимости. Указанная процедура позволяет с учетом заданных ограничений найти такие значения параметров, при которых система попадает из заданного начального положения в заданную конечную точку с заданной ориентацией корпуса.

Аналогичные построения можно провести и для уравнений с интегралами Френеля, которые получаются, если начальные угловые скорости не равны. Это первые два уравнения системы (4) с коэффициентами (6). В этом нелинейном случае разрешаемая система состоит из двух алгебраических уравнений, по одной из переменных имеется линейная зависимость, конечная точка (х, у) выбирается из области достижимости, в которой существует решение системы; при этом известны границы области изменения параметров, в которой численно ищется решение.

Полученные способы построения движения в заданную точку с заданной ориентацией корпуса позволяют строить корректные переходы с одной кривой на другую без разрывов скоростей. А это в свою очередь дает возможность далее строить составные траектории движения системы.

3. Реализация закона управления. Результаты проведенного анализа показывают, что планирование движения робота и управление этим движением могут быть выполнены по схеме: цель движения — синтез траектории — расчет управления — исполнение (реализация) движения.

Планировать движение можно на основе использования отрезков прямых и дуг окружностей, соединяемых отрезками склеивающих обобщенных спиралей Корню. Уравнения (2) при этом применяются для расчета управляющих напряжений, т.е. роботом решается обратная задача динамики. Однако целесообразно ввести промежуточный этап — синтез программного движения по схеме расчета требуемых линейной и угловой скоростей движения робота. Синтезированный таким образом закон управления исполняется в системе специальным модулем, реализующим обобщенную следящую систему. Основным режимом работы этого модуля является слежение за поддержанием выбранного направления движения робота. Можно сказать, что модуль реализует следящую систему по направлению.

Траектории робота определяются заданием (передачей в подсистему контроллера двигателей) в каждый момент времени текущего направления вектора, касательного к траектории. Такой метод универсален и компактен: траектории легко планируются и в любой момент времени могут быть перепланированы, они почти всюду гладкие и локально оптимальные. Недостаток этого метода состоит в следующем: из-за дискретности времени в системе управления в результате получается кусочно-линейное приближение траектории, которое в ряде случаев не дает достаточной точности. Поэтому в последних версиях системы дополнительно реализована отработка второй производной траектории (вращения вектора направления, что технически означает просто добавление постоянной вращательной составляющей к скоростям робота). При наличии этого дополнения даже в случае снижения точности приближения траектории качество отработки дуг большой кривизны (а именно здесь сильнее проявляется описанный недостаток) значительно улучшается.

Формальная схема системы такова. Система реализует нелинейное слежение в зоне малых отклонений, линейное слежение при больших отклонениях и снижение линейной скорости при увеличении ошибок. Коррекция угловой скорости выполняется при этом согласно формуле

Пересчет параметров траектории (ь,и) в угловые скорости колес выполняется очевидным образом: у1 = V + тш, у2 = V — тш.

4. Динамика робопоезда и управление им. Далее рассмотрим задачу управления аналогичными колесными объектами, объединенными в цепочки, в которых активным служит либо передний объект

ш = — sgn(Дa:)/(|Дa:|), /(х) = тах (к\Х, к2л/х) ■

(тягач), либо задний (толкающий) объект, либо некоторый внутренний объект цепочки. Активный объект цепочки является роботом с дифференциальным приводом. Такая цепочка названа робопоездом. Для задачи планирования движения робопоезда при обходе препятствий в случае движения в стесненных условиях построен алфавит базовых движений как обобщение решения задачи управления одиночным роботом, численно показана эффективность предложенных методов (вопросы устойчивости движения цепочки здесь не рассматриваем).

Модель робопоезда. Рассматривается цепочка, каждый объект которой представляет собой двухколесный аппарат с весомыми колесами и кузовом. Тележки соединены друг с другом цилиндрическими шарнирами, люфт в сцепках отсутствует. Проекция системы на горизонтальную плоскость показана на рис. 3. Тележки движутся по абсолютно шероховатой горизонтальной плоскости. Условие качения без проскальзывания приводит к наличию неинтегрируемых связей, аналогичных (1).

Положение системы описывают 5п координат Х1 ,у1,..., хп,уп, в1,...,вп, ф11 ,ф12,..., фп1, фп2. Уравнения движения системы с п элементами составляются, как уравнения Воронца [4] (эта динамическая система не является системой типа Чаплыгина, в отличие от одиночного робота). В качестве

Рис. 3. Проекция системы "робопоезд" на горизонтальную плоскость независимых переменных выберем углы поворота колес ведущей тележки фц, ф12:

фп = Р ■ Мот2 — К ■ Мот1 + Е4ф22 + Е5ф 12ф 11 + Е6ф 211, ф12 = Р ■ Мот1 — Q ■ Мот2 + Е1 ф\2 + Е2 ф 12 ф 11 + Е3 ф 11,

ф 12 + ф 11 , XI = Г---СОЭ в\, у 1

ф 12 + ф 11 . , Л

г---вт в\, в\ = г

У12 ~ <¿>11 , 2 а

для г = 2,

,п

х г —

( (асш^(-1)кфк - Ь8т^2(-1)кфк^фу2 + а к=2 к=2 '

+ (асов ¿(—1)кфк + Ь в1п (—1)кфЛ ф и ) ео^в1 + ,

^ к=2 к=2 / ^ к=2 '

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Уг ( асов - Ьтт^2(-1)к1рк )фу2 +

2а VV к=2 к=2 '

+ (асов (—1)кфк + ьв1п (—1)кфЛф 11 ) 8т(в1 + фЛ,

V 7-,— О 7-,— о / / V 7-,— о /

ф г1

к=2 22

2аЬсов Т. (—1)кфк + (а2 — Ь2) в1п £ (—1)кфк ф 12 + (а2 + Ь2) вт £ (—1)кфкф 11

к=2 к=2 к=2

к=2 22

к=2

2аЬ

г

г = 2р;

— (а2 + Ь2) в1п £ (—1)кфкф 12 + 2аЬ(—1)кфк — (а2 — Ь2) 8ш £ (—1)кфк ф 11

к=2

(7)

ф г2

( 2аЬ

— (а2 + Ь2) 81п Е (—1)кфкф 12 + (2аЬсов £ (—1)кфк — [а2 — Ь2) в1п £ (—1)кфк ) ф 11

к=2 к=2 к=2

-,г = 2р + 1;

2аЬ

'2аЬсов Е (—1)кфк + (а2 — Ь2) в1п £ (—1)кфЛ ф 12 + (а2 + Ь2) в1п £ (—1)кфкф 11

\_к=2_к=2_/_к=2_

2 аЬ

, г = 2р;

г = 2р + 1,

Г

^ 1 ; 2 аЪ

(г г—1\ /г ъ—1 \\

фк + сое ^](-1)к+ а( 8ш ^](-1)кфк + 8ш ^](-1)к^ -

к=2 к=2 ^ к=2 к=2 ' '

(г г-1\ , г г—1 \ \

СО^(-1)кфк + С08 ^(-1)кФч - 4 ^ !](-1)кФк + ВШ ^(-1)к) ^11

I,— О I, — О ' V I, — О I,— О ' '

к=2 к=2 к=2 к=2 г—1 \ / г г—1

-а

к=2 к=2 к=2 к=2

Здесь Р, Q, Я, Е1, Е2, Е3, Е4, Е5, Е§ — известные функции углов в шарнирах сцепок Ф2,... ,фп, геометрических и динамических параметров системы.

Из приведенной системы следует, что изменение числа объектов в системе не влечет изменения числа ее степеней свободы, которое всегда равно двум. В случае управляемого движения будем считать, что колеса ведущей тележки управляются электродвигателями, причем двигатели характеризуются развиваемыми ими моментами Мот1 и Мот2; для случая свободного движения эти моменты полагаем равными нулю.

Таким образом, строить движение робопоезда можно аналогично тому, как это делается для одиночного робота. Используя уравнения (7), можно построить алфавит базовых управляемых движений робопоезда. В класс этих программных движений введем следующие: прямая, окружность и спираль Корню [6].

Планирование движения робопоезда. Заметим, что, как и для одиночного робота, возможность динамически корректно реализуемого перехода из одной точки плоскости в другую обеспечивается комбинированием движений по траекториям базового алфавита, например по двум спиралям. Соответственно вводятся две схемы планирования движения системы — метод "коридоров" и метод "реперных точек".

В случае планирования траектории методом "коридоров" трасса задается следующим образом: строятся отрезки некоторых прямых, т.е. трасса задается ломаной линией, и окрестности около них. Планируется всюду гладкое движение системы в заданной окрестности (трубке заданной ширины) заданных отрезков трассы.

В методе "реперных точек" на плоскости координатами задается нумерованное множество точек. В этих точках задаются скорости вращения колес ведущей тележки и углы ориентации, с которыми должна пройти через эти точки ведущая тележка. Соответственно роботу необходимо пройти все точки заданного множества в заданном порядке и с заданными в каждой точке условиями на угол ориентации и скорость. Для этого следует построить вспомогательную траекторию, состоящую из отрезков прямых, проходящих через заданные точки. Планировать движение по такой траектории можно при помощи метода "коридоров". Следовательно, задача планирования траектории по "реперным точкам" сводится к задаче планирования движения по схеме "коридоров". Но ограничения на движение по методу "реперных точек" более жесткие. На основании проведенного численного анализа сделан ряд выводов о движении, в частности в задаче выхода системы из зоны препятствий отклонение движения хвостовой части системы относительно движения ведущей тележки максимально в начальный момент, а далее траектория движения хвостовой части системы асимптотически стремится к траектории движения ведущей тележки.

5. Заключение. На основании проведенных экспериментов установлена эффективность решения задач управления одиночным роботом с дифференциальным приводом и цепочкой таких объектов предложенными методами. Описанные схемы реализованы в мобильных роботах семейства "Аргонавт", принимающих участие в соревнованиях и фестивалях мобильных роботов в России и за рубежом, что подтвердило эффективность и построенных моделей, и методов управления. Развитием представленной работы являются эксперименты по управлению группой аналогичных объектов. Цель этих исследований — синтез согласованного управления "командой" роботов, достигающих общей цели. Эта система будет строиться как верхний уровень управления по отношению к системам, описанным в настоящей работе.

Работа выполнена при финансовой поддержке грантов РФФИ № 02-01-00750, 04-01-00065, 07-0100134, гранта НШ-1835.2003.1.

х

СПИСОК ЛИТЕРАТУРЫ

1. Буданов В.М., Девянин Е.А. О движении колесных роботов // Прикл. матем. и механ. 2003. 67, вып. 2. 244-255.

2. Охоцимский Д.Е., Павловский В.Е. Проблемы динамики и управления мобильных колесных роботов // Мат-лы научной школы-конференции "Мобильные роботы и мехатронные системы". М.: Ин-т механики МГУ, 2005. 31-52.

3. Павловский В.Е., Евграфов В.В. Синтез Б2-гладких траекторий для мобильного робота с дифференциальным приводом // Мат-лы научной школы-конференции "Мобильные роботы и мехатронные системы". М.: Ин-т механики МГУ, 2004. 150-158.

4. Павловский В.Е., Петровская Н.В. Исследование динамики движения цепочки "робопоезд". Уравнения движения, частные решения. Препринт ИПМ им. М.В. Келдыша РАН № 117. М., 2005.

5. Павловский В.Е., Петровская Н.В. Исследование динамики движения цепочки "робопоезд". Управляемое движение. Препринт ИПМ им. М.В. Келдыша РАН № 120. М., 2005.

6. Павловский В.Е., Петровская Н.В., Евграфов В.В. Исследование динамики движения цепочки "робопоезд". Методы планирования движения. Препринт ИПМ им. М.В. Келдыша РАН № 121. М., 2005.

Поступила в редакцию 21.04.2008

УДК 531.391.5

К ВОПРОСУ ОБ ИССЛЕДОВАНИИ ЛИНЕЙНЫХ НЕСТАЦИОНАРНЫХ СИСТЕМ В. И. Каленова, В. М. Морозов, П. М. Соболевский

1. Нестационарные системы, интегрируемые в замкнутой форме. Рассмотрим линейную нестационарную систему (ЛНС), описываемую следующей системой обыкновенных дифференциальных уравнений:

x(t) = A(t)x(t), x(t0) = x0, t <E I, (1)

где x(nx 1) — вектор состояния, A(t)(n x n) — матрица, элементы aj(t) которой определены и непрерывны на I = [to, то).

Случаи, когда система (1) имеет решение в замкнутой форме, общеизвестны:

1) A(t) — постоянная матрица (A = const); 2) A(t) — диагональная; 3) A(t) — треугольная; 4) A(t) — скалярная (A(t) = a(t)Ao, Ao = const); 5) A(t) — матрица так называемой эйлеровой системы [1-4]. Известен также ряд более общих и интересных классов ЛНС (1), для которых, во-первых, можно построить общее решение в замкнутой форме и, во-вторых, имеются нетривиальные приложения к задачам механики [4-6].

1.1. Системы специального класса. Пусть в системе (1) матрица A(t) непрерывно дифференцируема на интервале I и удовлетворяет уравнению

A = [D, A], D = const. (2)

(nxn)

Здесь через [D, A] = DA — AD обозначен коммутатор матриц A(t) и D.

Известно [7], что если матрица A(t) удовлетворяет условию (2), то система (1) интегрируема в замкнутой форме. Действительно, преобразование

x = T (t)y, T (t) = exp [D(t — to)] (3)

приводит систему (1) к стационарной системе

y = Ry, R = A(t0) — D = const (4)

и фундаментальная матрица системы (1) принимает вид

Ф(Мо ) = eD(t-t0) eR(t-t0). (5)

Отметим, что система (1) в случае, когда матрица A(t) удовлетворяет уравнению (2), приводится к стационарной системе (4) при помощи преобразования вектора состояния (3). В то же время существуют ЛНС (1), которые могут быть приведены к стационарным системам путем преобразования вектора состояния и замены времени, выполненных одновременно.

Мобильные роботы с двумя независимыми соосными ведущими колесами: Динамика и схемы управления Текст научной статьи по специальности «Физика»

Похожие темы научных работ по физике , автор научной работы — Павловский В. Е., Евграфов В. В., Павловский В. В., Петровская Н. В.

Текст научной работы на тему «Мобильные роботы с двумя независимыми соосными ведущими колесами: Динамика и схемы управления»