Научная статья на тему 'ПОСТРОЕНИЕ ДИФФЕРЕНЦИАТОРА ЗАДАЮЩИХ ВОЗДЕЙСТВИЙ ДЛЯ СИСТЕМЫ УПРАВЛЕНИЯ МОБИЛЬНЫМ РОБОТОМ'

ПОСТРОЕНИЕ ДИФФЕРЕНЦИАТОРА ЗАДАЮЩИХ ВОЗДЕЙСТВИЙ ДЛЯ СИСТЕМЫ УПРАВЛЕНИЯ МОБИЛЬНЫМ РОБОТОМ Текст научной статьи по специальности «Математика»

CC BY
61
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОЛЕСНЫЙ РОБОТ / ЗАДАЧА ПУТЕВОЙ СТАБИЛИЗАЦИИ / ДИНАМИЧЕСКИЙ ДИФФЕРЕНЦИАТОР / ИНВАРИАНТНОСТЬ / ДЕКОМПОЗИЦИЯ

Аннотация научной статьи по математике, автор научной работы — Кокунько Юлия Георгиевна

В рамках каскадного подхода к синтезу наблюдателей состояния динамических объектов при воздействии внешних неконтролируемых возмущений предложен метод восстановления производных любого нужного порядка детерминированной функции времени по ее текущим значениям, который не требует знания аналитического вида функции и численного дифференцирования. В предположении, что функция является кусочно-гладкой и ее производные ограничены известными константами, вводится виртуальная динамическая модель канонического вида с неизвестным входом, которая порождает на выходе данную функцию. На основе этой модели, порядок которой зависит от порядка производных, подлежащих восстановлению, строится динамический дифференциатор в виде наблюдателя состояния с кусочно-линейными корректирующими воздействиями. В данной работе указанные построения продемонстрированы на примере системы управления колесным роботом. Для синтеза обратной связи применяется нелинейный закон управления, стабилизирующий движение платформы вдоль допустимой криволинейной траектории. Для реализации обратной связи в задаче путевой стабилизации требуется текущая информация о переменных состояния модели объекта управления, задающих воздействиях и их производных первого и второго порядка. В предположении, что переменные состояния доступны для измерений, для оценивания производных задающих воздействий построены дифференциаторы третьего порядка.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DESIGNING A DIFFERENTIATOR FOR A CONTROL SYSTEM FOR A MOBILE ROBOT

In the framework of the cascade approach to state observers design for dynamic objects under the influence of external uncontrollable disturbances, a method for or reconstructing the derivatives of any desired order of a deterministic time function from its current values, which does not require knowledge of the analytical form of the function and numerical differentiation, is proposed. Assuming that the function is piecewise smooth and its derivatives are bounded by known constants, a virtual dynamic model of canonical form with an unknown input is introduced. On the basis of this model, whose order depends on the order of the derivatives to be recovered, a dynamic differentiator is constructed in the form of a state observer with piecewise linear corrective actions. In this paper, the above designs are demonstrated on the example of a control system for a wheeled robot. An nonlinear control law that stabilizes the motion of the platform along an admissible curvilinear trajectory is used to synthesize the feedback. The current information about the state variables of the control plant model, the setting influences and their first- and second-order derivatives is required to implement the feedback in the problem of track stabilization.

Текст научной работы на тему «ПОСТРОЕНИЕ ДИФФЕРЕНЦИАТОРА ЗАДАЮЩИХ ВОЗДЕЙСТВИЙ ДЛЯ СИСТЕМЫ УПРАВЛЕНИЯ МОБИЛЬНЫМ РОБОТОМ»

ПОСТРОЕНИЕ ДИФФЕРЕНЦИАТОРА ЗАДАЮЩИХ ВОЗДЕЙСТВИЙ ДЛЯ СИСТЕМЫ УПРАВЛЕНИЯ МОБИЛЬНЫМ РОБОТОМ

Кокунько Ю. Г. 1

(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва)

В рамках каскадного подхода к синтезу наблюдателей состояния динамических объектов при воздействии внешних неконтролируемых возмущений предложен метод восстановления производных любого нужного порядка детерминированной функции времени по ее текущим значениям, который не требует знания аналитического вида функции и численного дифференцирования. В предположении, что функция является кусочно-гладкой и ее производные ограничены известными константами, вводится виртуальная динамическая модель канонического вида с неизвестным входом, которая порождает на выходе данную функцию. На основе этой модели, порядок которой зависит от порядка производных, подлежащих восстановлению, строится динамический дифференциатор в виде наблюдателя состояния с кусочно-линейными корректирующими воздействиями. В данной работе указанные построения продемонстрированы на примере системы управления колесным роботом. Для синтеза обратной связи применяется нелинейный закон управления, стабилизирующий движение платформы вдоль допустимой криволинейной траектории. Для реализации обратной связи в задаче путевой стабилизации требуется текущая информация о переменных состояния модели объекта управления, задающих воздействиях и их производных первого и второго порядка. В предположении, что переменные состояния доступны для измерений, для оценивания производных задающих воздействий построены дифференциаторы третьего порядка.

Ключевые слова: колесный робот, задача путевой стабилизации, динамический дифференциатор, инвариантность, декомпозиция.

1. Введение

На современных складах и производствах активно используются мобильные роботы и беспилотные транспортные средства. Для реализации высокоточных алгоритмов автоматического управления, обеспечивающих движение объекта управления вдоль заданного пути, требуется информация не только о коор-

1 Юлия Георгиевна Кокунько, м.н.с. ([email protected]).

динатах целевой точки, но и о ее производных старшего порядка, т.е. необходимо аналитическое описание заданной траектории как функции времени. Однако полное аналитическое описание сложной траектории является достаточно трудоемким процессом, требующим привлечения теории графов, сплайновой интерполяции и других методов [1, 3, 10]. В предположении, что задающие воздействия поступают в систему управления в реальном времени из автономного источника в виде детерминированных сигналов, ставится задача восстановления их производных требуемого порядка с помощью вычислительных алгоритмов, реализуемых на бортовом компьютере. В качестве альтернативы реальному дифференцированию сигналов в данной работе предложен метод синтеза динамического дифференциатора, который строится в виде наблюдателя состояния виртуальной канонической модели с неизвестным входом, выходом которой полагается задающий сигнал.

Работа имеет следующую структуру. В разделе 2 описывается модель объекта управления, функционирующего в условиях внешних возмущений, которые действуют в пространстве управления и полагаются неизвестными, ограниченными функциями времени. В разделе 3 в рамках блочного подхода разработан закон комбинированного управления с линейной стабилизирующей составляющей, обеспечивающий отслеживание с заданной точностью выходными переменными заданных сигналов и е-инвариантность по отношению к ограниченным возмущениям. В разделе 4 представлен синтез динамического дифференциатора, дающего оценки производных первого и второго порядка целевого сигнала.

2. Описание модели объекта управления

При решении задачи слежения основной целью системы автоматического управления является выведение объекта на целевую кривую и обеспечение его движения по этой кривой. Отклонение объекта от кривой обычно реализуется как отклонение объекта от некоторой точки на кривой, называемой целевой. В первоначальном (и простейшем) варианте в качестве целевой

выбирается ближайшая точка кривой. При этом линейная скорость движения робота, которая служит частью управления в постановке данной задачи, а именно, в задаче путевой стабилизации, полагается произвольной функцией времени, состояния или времени и состояния [1]. В данной работе проблема управления скоростью не рассматривается, скорость полагается постоянной положительной величиной.

В качестве объекта управления рассматривается беспилотная трехколесная платформа, которая движется без проскальзывания, два задних колеса являются ведущими, переднее колесо является поворотным. Кинематические соотношения для платформы в неподвижной системе декартовых координат хОу без учета динамики привода переднего колеса имеют следующий вид [7-9] X =V0080,

(1) гс = V 8Ш0, 0 = Vu,

где Хс(0, Ус(?) - координаты базовой точки С, расположенной в середине задней оси платформы; У(() > 0 - скалярная линейная скорость базовой точки; 0 - угол между осью х и центральной линией платформы, которая совпадает с направлением вектора скорости (ориентация платформы относительно неподвижной системы координат); и - мгновенное значение кривизны линии движения базовой точки, которое трактуется как скалярное управляющее воздействие, связанное однозначно с углом поворота переднего колеса &.

(2) и = tgф/1, |и| < и,

где I - расстояние между задней осью и передним колесом, ф -угол поворота переднего колеса (см. рис. 1), который, как предполагается, меняется мгновенно.

О'-►

X

Рис. 1. Положение колесного робота относительно предписанной траектории

3. Синтез базового закона управления

Для системы (1)-(2) рассматривается задача путевой стабилизации. Требуется синтезировать закон управления в форме обратной связи, обеспечивающий вывод базовой точки на целевую (допустимую) траекторию и ее движение вдоль заданной кривой.

В данной работе для синтеза базового закона управления используется подход, в рамках которого вводятся путевые координаты [7-9]: 5 - значение натурального параметра (длина дуги) для точки заданной кривой, ближайшей к роботу, которую будем называть целевой точкой С^Х, Ys); ё - расстояние от базовой точки платформы С до заданной траектории движения (расстояние со знаком плюс, если базовая точка находится слева от кривой при движении в положительном направлении, и со знаком минус, если справа); - угол между центральной линией платформы и касательным вектором к заданной кривой в целевой точке (угловое отклонение), -я/2< \у<я!2.

Относительно путевых координат математическая модель движения объекта управления (1)-(2) принимает вид [7-9]:

(3) j = Vu -

= V sin j,

Vk cos j

1 - kd

. V cosj

s =-,

1 - kd

где k := k(s) - кривизна заданной кривой в целевой точке. Предполагается, что kd Ф 1, функция k(s) является кусочно-непрерывной и ограниченной |k| < u .

Для синтеза линеаризующей обратной связи пространство путевых координат системы (3) расширяется путем ввода независимой переменной %(t) и ее динамической модели: % = V(t) cos j > 0 . Таким образом, заменив дифференцирование по времени в системе (3) дифференцированием по получается искомая система: cosj

s = -

(4) d'=

(1 - kd)u(s, d, j) sin j

u(s, d, j)'

к 008У и

у =----+-.

(1 - кd )и(5 d ,у) и(5, d, у)

В качестве регулируемых переменных принимаются линейное и угловое отклонения от заданной кривой. (5) х1 = d, х2 = tg у.

Продифференцировав обе части второго уравнения, получим второе уравнение для канонического представления и к

cos j cos j(1 - kd) Преобразовав данное равенство с учетом тождества

1 = 1 + tgj,

cos2 j

получаем запись системы (4) относительно отклонений (5) в квазиканонческом виде:

(6) х'=- (1 + х2)к + (1 + х?)3/2г

2 1 - к^ 1 кХ^

1 - кх

Особенность системы (6) состоит в том, что правые части дифференциальных уравнений относительно канонических переменных Xl, X2 не зависят явно от 5 и переменная 5 не является стабилизируемой. В терминах системы (6) формируется комбинированное управление с линейной стабилизирующей составляющей в виде о(х) = С1Х1 + С2Х2, С1,2 > 0:

а( х) к 3 к С08ш

(7) и = -7л-аЗТТ + I-г--= а^,Х%ш)С08 Ш+ . , •

(1 + Х22)3/2 + х2(1 - кхх) 1 - М

Это обеспечивает асимптотическую устойчивость виртуальной системы (6), (7):

и решение задачи путевой стабилизации.

Для реализации закона управления (7) требуется вычислять в реальном времени кривизну заданной траектории в целевой точке к, отклонение ё от целевого пути и угловое отклонение ш Для этого надо знать текущие положение Хс(0, Yc(t), и ориентацию робота #(0, а также задающее воздействие g(t) и его производные первого и второго порядка £(£), £(£) . Задающее воздействие является двумерным вектором, элементами которого являются текущие координаты целевой точки С^Х^), Ys(t)) в неподвижной системе координат хОу.

В предположении, что измерениям доступны только переменные ХС(0, Yc(t), #(t), Х&), Ys(t), ставится задача восстановления производных задающих сигналов по их текущих значениям.

4. Синтез динамического дифференциатора

В данном разделе представлен основной результат, разработанный метод излагается применительно к задаче восстанов-

х^ — х^, х^ — с ^ х| с х^

ления первой и второй производных первого элемента gl(t) = Х$) вектора задающих воздействий. Для второго элемента Г^О следует использовать аналогичные построения.

Пусть в режиме реального времени из внешнего автономного источника в систему управления поступает незашумленный детерминированный сигнал gl(t) = Xs(t), который полагается непрерывной, кусочно-дифференцируемой функцией времени, аналитический вид которой не известен. Ставится задача восстановления текущих значений первой и второй производной данного сигнала в предположении, что функции £1г) (г) = gi+1 (г) , г = 1,3 , являются кусочно-непрерывными и ограничены известными константами:

(8) (0| < О, г = 2,4, г > 0.

Для формализации задачи в рассмотрение вводится виртуальная динамическая модель третьего порядка, представленная в канонической форме

(9) & = g 2 , 2 = gз, & = g 4(г).

Входом системы (9) является неизвестный ограниченный сигнал ^ (г) = (г), который трактуется как внешнее возмущение. Выходом является измеряемый сигнал gl(t).

Для упрощения проблемы оценивания переменных g2(t), gз(t) для системы (8) предлагается использовать нестандартный наблюдатель (дифференциатор) без собственных движений в виде

(10) ¿1 = VI, ¿2 = ^2 , ¿з = Уз,

где Zi - переменные состояния, V, - управляющие воздействия дифференциатора. Задача наблюдения сводится к задаче стабилизации ошибок наблюдения е{ = gг - ¿{, г = 1,3, в системе

(11) ¿1 = g 2 - У1,г2 = gз - У2,г3 = g 4 - V3,

где переменные gг (г), г = 2,4, трактуются как внешние ограниченные возмущения. Учитывая, что значение gl(0) известно, мы можем установить в дифференциаторе (10) следующие начальные условия.

¿1 (0) = ^ (0) ^ (0) = 0, ¿,. (0) = 0 ^ ¿г (0) = gi (0) ^

v1 — р ваОД е1) —

(12)

V = рг (V- - г)) =

Ц (0) < 8, Ц (0) < Юг, >> 8, г — 2,3.

Для обеспечения инвариантности по отношению к внешним возмущениям предлагается использовать процедуру каскадного синтеза кусочно-линейных управляющих воздействий:

Р\8\§л£\, ^ > 1/¡\, Р\1\^\,¿\| < 1/

Рг - гг ), К-\ - 2г\ > 1/ 1г ,

_Рг1г (Vг-\ - 2г ),|Vг-\ - 2г | < 1 / 1г , г — 2,33.

Линейные функции с насыщением являются гибридом линейной и разрывной обратной связи и привносят в замкнутую систему преимущества обоих методов, но свободны от их недостатков и рекомендуются для практической реализации [2, 4-6, 11]. Каждое корректирующее воздействие (12) имеет по два настраиваемых параметра: рг > 0 - амплитуду, от выбора которой зависит скорость оценивания, и I > 0 - большой коэффициент, от выбора которого зависит точность оценивания.

В силу уравнений (1 1 ) сигналы, формирующие корректирующие воздействия и, г = 2, 3 (12), и замкнутую систему (11),

(12) можно представить в виде

(13) ^ - — §' -8'-1 - 2' — -а'-Ъ 1 — 2Д

¿1 — §2 - Р18аг(/1е1),г?2 — £з - Рг ^ (бг -£г-1)У — 2Д

Как видим, для решения задачи наблюдения нужно обеспечить стабилизацию не только ошибок наблюдения в системе (10), но и их производных [12] путем выбора настраиваемых параметровр, I. Доказано следующее утверждение.

Лемма. Если в системе (11), (13) условия (8) и (12) выполняются, то тогда для любых сколь угодно малых 8, Т > 0 найдутся такие положительные действительные числа Р*, I*, что Ур, , ¡^ : Р > Р*, I > I*, г —1,3, выполнятся неравенства

(14) Ц (г) — Ь (х) - я, (х) <8, г — 1,3 , X > Т•

Доказательство. Разделим заданный интервал времени [0; Т] на 4 отрезка с помощью точек 0 = ^ < t\ < t2 < tз < t4 = Т

и формализуем во времени желаемое поведение ошибок наблюдения и их производных, обеспечивающих выполнение (14): (t)| <8, t > t0, ^ (t)| < Дп, t > ^, Дп <8,

(15) < Д12 , t > t2 , Д12 <8;

\e2 (t)| <8, t > t2, \e2 (t)| <Д21, t > t3, Д <8;

|e3 (t)| <8, t > t4.

C учетом (13) конкретизируем неравенства для ошибок наблюдения (15) в предположении, что на предыдущих интервалах указанные соотношения были выполнены: Ц(0| < 1/¡! <8, t > to;

(16) |vi-1(t)-z,(t)| = \et(t)-а^)\ < 1/1, » »|e,.(t)| < 1/1, + Дг-1д < 8,t > t2,-2,i = 2,3.

Сходимость аргументов управляющих воздействий в линейные зоны (16) обеспечивается выбором амплитуд pi > 0, а размеры линейных зон и выполнение остальных, вспомогательных неравенств (15) - выбором больших коэффициентов

l > o, i=13.

В первом уравнении системы (13) равенство знаков управляемой и управляющей переменной signn(t) = signei(t), t > 0 справедливы по построению и |ei(0)| < 8 (11). Нижнюю оценку для выбора амплитуды, обеспечивающую выполнение первого неравенства (15), найдем из достаточных условий сходимости в линейную зону:

(17) e1e1 = ex(g2 - AsigneO < -pY) < 0 ^ p > G2.

В остальных уравнениях системы (13) совпадение знаков

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(18) sign vx (t) = sign e , (t), i = 2,3

может не иметь места при 0 < t < t2(i-1)-1. На указанных интервалах эти уравнения в общем случае представимы в виде ¿j = gj+1 + pisign ej, i = 2,3 . Эти системы неустойчивые, значения e(t) растут по модулю на интервале [0; t2(i-\y\\:

(19) |ei(t)| < Iei(t2(i-1)-1) < 2Gi + (GM + pl)t2(MH, t > 0.

При t > ¿2(г-1)-1 выполнение (18) гарантируется вне окрестности ¿| < Аг-1,1 < б, 7 = 2, 3, соответственно и на интервалах t е (^2(7—1)—1; ¿2(г-1)] два последних уравнения системы (13) принимают вид

(20) = ёг+1 " Р, ^ ¿г, - = 2,3 •

Выбором рц 7 = 2, 3, нужно обеспечить сходимость ошибок наблюдения в области (16) за время t2(г—l)-t2(г—1)—1. В силу (19)—

(20) получим

......... К (У1)-1)| , ^ (—2(г-1)-1)|-б

Рг - —--Г--+ ^ > 7--+ ^ ,

'2(1-1) - 2(г—1)—1 '2(1-1) - 2(г—1)—1

откуда имеем

.Щ + (2г+1 + Р,)—2(г—1)—1 1П Рг ----—-+ 2г+1 ^

(21) —2(г—1) — 2(г-1)-1

22, + Ог+1— 2(-—1)

Р- = 7--,2—2(г—1)—1 < — 2(г—1)'- = 2,3

—2(1—1) 2—2(г—1)—1

Зададим минимальный интервал времени, например, так

(22) А— = = —з — —2 = —2(г—1) — 2—2(,—1)—1 > 0, - = 2,3,

(23) —4 = 9А— < Т ^ 0 < А— < Т/9.

С учетом (17), (21)—(23) имеем нижние оценки для выбора амплитуд, обеспечивающих сходимость аргументов корректирующих воздействий в линейные зоны (16) за заданное время:

Р* = ^

2 2&, + за а— 18а, „„

(24) Р2=—2-^ =-2 + 3в3,

V * п а— т

+ = 1823 + .

А— Т

Для настройки больших коэффициентов рассмотрим уравнения системы (13) в линейных зонах, куда они попадают в указанные интервалы времени:

¿1 = ё 2 — М^, К! < 1/11, — - 0,

(25) ¿2 = ё3 — Р212(е2 —¿?1), ¿2 —¿1 < 1//2, — - — 2,

¿3 = ё4 — Рз^Оз ¿3 -¿2| < 1/13, — - — 4.

Из достаточных условий сходимости ЕгЕг < 0 найдем нижние оценки для выбора /г > 0, г = 1,3 , обеспечивающих заданную точность оценивания (14), а также установим точность, которую надо обеспечить при стабилизации первых производных ошибок оценивания (15), разделив заданную величину 8 на две части, например, пополам:

)| <8(/ > 0) ^ ¡1 >

Р18

(26) |е2(/)| <+ |ё| <8(/>г21) ^¡2 >^Е1 < дп =8,

7 7 Р28 2

8/2

С 2 С 8

Ез(/) < —4- + |Ё2| <8(/ > /4) ^ ¡3 > —4, |Ё2| <Д 21 =-.

7з 7 Рз8 2

8/2

Выбором и, / = 1, 2, нужно также обеспечить сходимость первых производных ошибок наблюдения Еi (/) в установленные области (26) за время ¿2г-1 - ¿2г-2 = Д( (15) из начальных условий |е(/2г_2)| = 0г+1 + р (25). С этой целью оценим на указанных интервалах решения вспомогательной системы

(27) Е1 = &3 - МЕ1; Е2 = &4 - Р212 (Е2 - Е1 )

и установим точность, которую надо обеспечить при стабилизации Е :

с

е (/)| < ( + р1 )г-^Д' + -3- < д11 = - (/ > ц) ■-.-' пХ 2

8/4 7-1

8/4

1 л4°з. ^„4(а2 + р1)

^ I >— тах {—3;—1п (28) 1 Р1 { 8 Д 8

Г^ я

\Е2 (/)| < (Оз + Р2 )е-РЛД' + —^ + Е1 < Д21 = - (/ > /3) ^ ■-.-' ол, 7 2

8/8 8/4

8/8

^ ¡2 >^тах{801;—1п8(Оз + Р2) 1,Е <Д12 =8.

р2 [ 8 Д/ 8

И, наконец, выбором ¡1 нужно также обеспечить сходимость si (—) в установленную область (28) за время t2—tl = 2Аt

(15), (22) из начальных условий К (^)| = 2 + Р (27). С этой целью оценим на указанных интервалах решения вспомогательной системы ¿1 = ё4 - р1/1К1 :

¿1 (—)| < (2 + А ) -Р1/12А— + <б (— - —2) ^ ---' & 4

(29) б/8 /> ±тх + Р.)

1 р [б 2А— б Неравенства для выбора больших коэффициентов (26), (28), (29), полученные из оценок решений на разных интервалах, должны выполняться одновременно. Таким образом, с учетом уже выбранных амплитуд (24) получим итоговые нижние оценки, при которых все неравенства (15) будут выполнены:

/2=IйЗ:^.^чо^ 'ш8(бз+Р1)

1 р [ б ' б ' б ' А— б ' 2 А—

/. = -!тах[ш8(Сз + Р2) 1, /;= 2

Р2 у б б А— б \ Ръб

Лемма доказана.

5. Моделирование

Моделирование разработанных алгоритмов проводилось в среде МА^АВ Simulink. В начале обособленно был протестирован разработанный динамический дифференциатор на предмет восстановления производных задающего воздействия до 3 порядка включительно по сигналам без перенастройки параметров.

Для реализации закона управления (7) берутся такие данные, как вектор состояния, а именно координаты опорной точки С платформы, угол в между центральной линией платформы и осью Ох.

Для расчета управляющего воздействия также была разработана программа для минимизации функций для вычисления отклонения точки С от целевой кривой и параметра заданной кривой.

Для численного моделирования движения колесного робота в качестве примера рассматривалось движение по окружности радиусом равным 4:

(30) Хс (г) = 4 8т( г / 4), Ус (г) = 4 С08(г / 4),

где г - параметр заданной траектории.

Для наихудшего расчетного случая были приняты следующие параметры корректирующих воздействий (12):

Р = 4, р2 = 3, р3 = 2 ; 1Х = 12,12 = 12,1Ъ = 12, при которых проводилось оценивание производных целевого сигнала.

На рис. 2-4 показаны графики задающих воздействий, производных задающих воздействий до второго порядка включительно и их оценки.

Как видно из рис. 2-4, динамический дифференциатор задающих воздействий работает корректно без перенастройки параметров. Оценочные сигналы сходятся к истинным за 0,7 с, ошибки в установившемся режиме пренебрежимо малы.

При синтезе базового закона управления (7) были приняты параметры /1 = /2 = -60, С1 = /1*/2, С1 = - /1 - /2;

О 5 10 15 0 5 10 15

1.С 1,0

Рис. 2. Графики задающих воздействий gli(t) и их оценок гц^) [м] для траектории (30), 7 = 1, 2

Рис. 3. Графики задающих воздействий g2i(t) и их оценок Z2i(t) [м] для траектории (30), / = 1, 2

Рис. 4. Графики задающих воздействий gзi(t) и их оценок zзi(t) [м] для траектории (30), / = 1, 2

На рис. 5-6 показаны графики ошибок слежения в^(—) = хь(—)-ёi(—) [м],г = 1,3 (в предположении, что все задающие воздействия и их производные известны, а также с использованием динамического дифференциатора соответственно). На рис. 7 показан процесс сходимости центра масс к заданной пространственной траектории без использования дифференциатора и с его использованием.

Как видно из рис. 5-7, изображающая точка сходится к заданной траектории и далее движется вдоль нее, ошибка слежения в установившемся режиме составляет 7х10-10 [м].

Таким образом, результаты моделирования подтверждают эффективность разработанных алгоритмов в условиях неполной информации. Предложенный динамический дифференциатор производных задающих воздействий позволит расширить область применения известных методов синтеза динамической обратной связи для решения задач слежения и упростит процесс планирования режимов движения.

Рис. 5. Графики ошибок слежения eli(t) [м], / = 1, 2, без использования дифференциатора

Рис. 6. Графики ошибок слежения eli(t) [м], / = 1, 2 с дифференциатором

-4-2 0 2 4 -4 -2 0 2 4

х,м х,м

Рис. 7. Процесс сходимости центра масс к заданной пространственной траектории (30) без использования дифференциатора и с использованием дифференциатора

6. Заключение

Основной результат работы - метод построения и процедура настройки динамического дифференциатора задающих воздействий, который позволит расширить область применения известных методов проектирования динамических обратных связей для решения задач следования по траектории и упростит процесс планирования режима движения. Результаты численного моделирования подтвердили его эффективность.

Литература

1. ГИЛИМЬЯНОВ Р Ф., РАПОПОРТ Л.Б. Метод деформации пути в задачах планирования движения роботов при наличии препятствий // Проблемы управления. - 2012. - №1. -С.70-76.

2. КОКУНЬКО Ю Г., КРАСНОВА С.А. Оценивание производных задающих воздействий в системе управления БПЛА // Труды 13-й Международной конференции «Управление развитием крупномасштабных систем» (MLSD'2020, Москва). - М.: ИПУ РАН, 2020. - С. 725-736.

3. КОЧЕТКОВ С.А., УТКИН В.А. Метод декомпозиции в задачах управления мобильными роботами // Автоматика и телемеханика. - 2011. - №10. - С. 86-103.

4. КРАСНОВ Д.В., УТКИН А.В. Синтез многофункциональной системы слежения в условиях неопределенности // Управление большими системами. - 2017. - Вып. 69. -С.29-49.

5. КРАСНОВА С.А., УТКИН А.В. Сигма-функция в задачах синтеза наблюдателей состояний и возмущений // Проблемы управления. - 2015. - №5. - С. 27-36.

6. КРАСНОВА С.А., МЫСИК Н.С. Синтез инвариантной системы управления продольным движением летательного аппарата // Автоматика и телемеханика. - 2011. - №10. -С.104-116.

7. ПЕСТЕРЕВ А.В. Синтез стабилизирующего управления в задаче следования колесного робота вдоль заданной кривой // Автоматика и телемеханика. - 2012. - №7. - С. 25-39.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. ПЕСТЕРЕВ А.В., РАПОПОРТ Л.Б. Каноническое представление задачи путевой стабилизации для колесных роботов // Автоматика и телемеханика. - 2013. - №5. - С. 80-101.

9. ПЕСТЕРЕВ А.В., РАПОПОРТ Л.Б., ТКАЧЕВ С Б. Каноническое представление нестационарной задачи путевой стабилизации // Известия РАН. Теория и системы управления. - 2015. - №4. - С. 160-176.

10. ТКАЧЕВ СБ., КРИЩЕНКО А.П., КАНАТНИКОВ АН. Автоматическая генерация сложных пространственных траекторий БПЛА и синтез управлений // Математика и математическое моделирование. Электрон. журн. МГТУ им. Н.Э. Баумана. - 2015. - №01. - С. 1-17.

11. УТКИН А.В., УТКИН В.А. Задача слежения в линейных системах с параметрическими неопределенностями при неустойчивой нулевой динамике // Автоматика и телемеханика. - 2014. - № 9. - С. 45-64. (Англ.: Utkin V.A., Utkin A.V. Problem of tracking in linear systems with parametric uncertainties under unstable zero dynamics // Automation and Remote Control. - 2014. - Vol. 75, Iss.9. - P. 1577-1592).

12. УТКИН В.А., КРАСНОВА С.А. Повышение точности оцениваемых сигналов в наблюдателях состояния и возмущений // Материалы 12-й Международной конференции «Управление развитием крупномасштабных систем» (MLSD'2019, Москва). - М.: ИПУ РАН, 2019. - С. 468-471.

DESIGNING A DIFFERENTIATOR FOR A CONTROL SYSTEM FOR A MOBILE ROBOT

Julia Kokunko, junior researcher, V.A. Trapeznikov Institute of Control Sciences of RAS, Moscow, ([email protected]).

Abstract: In the framework of the cascade approach to state observers design for dynamic objects under the influence of external uncontrollable disturbances, a method for or reconstructing the derivatives of any desired order of a deterministic time function from its current values, which does not require knowledge of the analytical form of the function and numerical differentiation, is proposed. Assuming that the function is piecewise smooth and its derivatives are bounded by known constants, a virtual dynamic model of canonical form with an unknown input is introduced. On the basis of this model, whose order depends on the order of the derivatives to be recovered, a dynamic differentiator is constructed in the form of a state observer with piecewise linear corrective actions. In this paper, the above designs are demonstrated on the example of a control system for a wheeled robot. An nonlinear control law that stabilizes the motion of the platform along an admissible curvilinear trajectory is used to synthesize the feedback. The current information about the state variables of the control plant model, the setting influences and their first- and second-order derivatives is required to implement the feedback in the problem of track stabilization.

Keywords: wheeled robot, path following stabilization, dynamic differentiator, invariance, decomposition.

УДК 62.50 ББК 32.817

DOI: 10.25728/ubs.2022.95.6

Статья представлена к публикации членом редакционной коллегии В.А. Уткиным.

Поступила в редакцию 21.10.2021.

Опубликована 31.01.2022.

i Надоели баннеры? Вы всегда можете отключить рекламу.