КОВАЛЬЧУК Александр Кондратьевич
кандидат технических наук, доцент, директор МИПК (МГТУ им. Н.Э. Баумана)
fw
КАЛИНОВ Михаил Николаевич
зам. начальника отдела обеспечения учебного процесса МИПК (МГТУ им. Н.Э. Баумана)
УДК 681.5
Разработка системы управления робота специального назначения
А.К. Ковальчук, М.Н. Калинов
В статье описаны структура контура и методы управления шагающим роботом. Рассмотрен синтез робастного управления на основе H^-теории оптимизации. Представлены высокоточные адаптивные алгоритмы управления.
Ключевые слова: управление шагающим роботом, синтез робастного управления, адаптивные алгоритмы управления.
The article describes the structure of the circuit control and the control of walking robots. The synthesis of robust control based on H-optimization theory is considered. High-precision adaptive control algorithms are presented.
Keywords: control of a walking robot, synthesis of robust control, adaptive control algorithms.
Разработка современных робототехнических систем предполагает синтез высокоточных робастных систем управления. В настоящее время все большую популярность приобретают шагающие роботы: по заказу американского агентства перспективных исследований DARPA разработан шагающий робот BigDog, который позволяет переносить грузы до 150 кг со скоростью более 3...5 км/ч по пересеченной местности, где обычные колесные средства оказываются бесполезными. В начале 2011 г. это же агентство объявило новый заказ на создание быстро передвигающегося шагающего робота — гепарда, предназначенного для участия на поле боя. Следует отметить, что для шагающих роботов основые проблемы решения подобных задач состоят в разработке соответствующих систем управления робота. Системы управления шагающими роботами — сложные многоуровневые системы, в которых реализуются специализированные регуляторы (специализация осуществляется по функциям робототехнической системы). Такие системы управления предполагают использование высокоточных нелинейных регуляторов, требующих больших вычислительных ресурсов и сложных в реализации. Компактные линейные регуляторы обладают низкой точностью, поэтому их использование в современных системах управления шагающими роботами не представляется возможным. Поскольку функционирование шагающего робота осуществляется в стохастических условиях, а информация о статистических характеристиках возмущений отсутствует, то синтез регулятора проводится в условиях стохастической неопределенности. Таким образом, задача синтеза системы управления роботом специального назначения, в частности достаточно компактных робастных высокоточных регуляторов, является важной и актуальной.
Структура контура управления роботом специального назначения
Система управления робототехнической системы специального назначения, отличающейся низкой себестоимостью, включает в себя следующие подсистемы:
♦ навигации;
♦ стабилизации и управления;
♦ управления скоростью.
Система навигации определяет закон движения центра масс робота и обеспечивает движение по этому закону путем соответствующего изменения управляющих воздействий.
Система стабилизации сохраняет требуемое угловое движение робота вокруг центра масс с удовлетворительными характеристиками переходного процесса.
Система навигации состоит из двух блоков: блока навигации и блока управления. В блоке навигации осуществляется измерение всех параметров движения робота, их обработка и вычисление оптимальных оценок и прогнозов этих параметров для формирования команд в блоке управления, т. е. закона изменения траектории и самого алгоритма управления движением робота по выбранной траектории.
В блоке управления для синтеза алгоритма управления используются классические алгоритмы, например, принцип максимума и метод вариационных исчислений. Структурная схема контура управления представлена на рис. 1.
Рассмотрим некоторые методы, которые часто используются для оптимального управления динамическими системами.
Методы управления
В зависимости от функционалов качества и постановок задач наибольшее распространение получили методы управления трех видов: модальные регуляторы, оптимальные регуляторы состояния и адаптивные регуляторы состояния.
В основе модального управления лежит соответствие составляющих свободного движения системы корням характеристического уравнения, описывающего систему. Методы управления полюсами (корнями) замкнутой системы являются основой при разработке модальных регуляторов. Системе придается такое распределение корней, которое гарантирует оптимальность переходного процесса, устойчивость, быстродействие, малые энергозатраты и т.д.
Рис. 1. Структурная схема контура управления:
50— реальные параметры движения робота; 50 + А,? — навигационные параметры, выдаваемые блоком навигации методом оптимального оценивания; А,? — ошибки оценки; 50 + А,? — навигационные параметры, выдаваемые блоком навигации методом прогнозирования; А? — ошибки прогноза; Лсн — команда навигации (сигнал управления); — команда нормальных перегрузок; — созданные в реальности перегрузки;
и& — команда управления на рулевые приводы
Управление полюсами в модальных регуляторах производится посредством формирования цепей обратных связей. При наличии полной информации о векторе состояния и полной управляемости объекта, а также при заданном законе управления, представляющем собой линейную комбинацию функций вектора состояния, можно добиться любого желаемого расположения корней. В том случае, если передаточная функция не имеет нулей, часто применяют метод стандартных коэффициентов. Суть этого метода заключается в том, что для передаточной функции объекта выбирается характеристический полином с известным распределением корней. Существуют различные виды стандартных форм, например, стандартные формы Баттерворда, биноминальные стандартные формы и другие разложения, доставляющие минимум различным функционалам. Все эти формы получены эмпирически и используются в системах до восьмого порядка.
В биноминальных стандартных формах оптимального расположения корней добиваются обеспечением равенства всех корней характеристического полинома. Необходимо, чтобы корень, кратный порядку системы, был действительным и отрицательным. Модуль этого корня характеризует быстродействие системы. Биноминальные стандартные полиномы характеризуются довольно вялыми реакциями на внешние возмущения, поэтому их применение ограничено. Как и биноминальные формы, стандартные формы Баттерворда характеризуются симметричным распределением коэффициентов, однако их реакция отличается большей колебательностью.
Недостатком методов модального управления является возможность смещения вместе с корнями и нулей замкнутой системы, что может послужить причиной нежелательных реакций на внешние возмущения. Вследствие этого недостатка, а также из-за необходимости выбирать стандартную форму полинома с учетом свойств конкретного объекта, что не всегда удается сделать оптимальным образом, применение методов модального управления в задачах инерциальной навигации ограничено.
Другим видом алгоритмов управления являются регуляторы состояния. Эти регуляторы, синтезированные методами оптимизации, наиболее детально разработаны в инженерной практике. Оптимальные регуляторы состояния обеспечивают управление непосредственно вектором состояния, а не полюсами, как в модальных регуляторах, вследствие чего они свободны от недостатков, присущих модальным регуляторам.
Структура и параметры регуляторов состояния определяются путем минимизации некоторого критерия качества. Эти методы очень удобны при решении целого ряда задач. Например, для перевода объекта из заданного начального состояния в нулевое оптимальным образом можно построить регулятор состояния с переменными параметрами.
Уравнение оптимального регулятора состояния с переменными параметрами имеет вид
ип_. =-Кп_,хп_, ] = 1, 2 ..., п.
(1)
Здесь К — матрица регулятора состояния, которая определяется в результате решения рекуррентных уравнений с исходным значением Рп=0,
К- = (Я + Вт Р_В )-1 Вт Рп_ у+1 А; Р_ =а + Ат Рт_,+1 х
т_] +1
х[1 _ В(Я + Вт Рп_++1В )_1 Вт Рп_++1
(2)
(3)
Уравнение (3) — разностное матричное уравнение Риккати. Отметим, что в параметрических приложениях при незначительных изменениях параметров объекта применяются регуляторы состояния с постоянными параметрами. Так как К- сходится для_/ = 1,2,..., п, т. е. стремится к конечному значению, то в результате получается регулятор с постоянными параметрами:
ио ~ Ко хк.
(4)
Регуляторы состояния отличаются простотой технической реализации, но постоянные возмущения компенсируются со статической ошибкой из-за пропорциональной характеристики, а случайные возмущения, действующие
на объект в реальных условиях, вообще не учитываются.
В условиях случайных возмущений модель объекта описывается уравнением следующего вида:
хк+1 = Ахк + Вик + Ршк.
(5)
Предполагается, что случайное возмущение представляет собой дискретный аналог белого гауссового шума. Процессы х и ш некоррелиро-ваны. Поскольку переменные состояния и выходные сигналы в модели объекта (5) — случайные процессы, функционал качества (2) также случайная величина, то минимизировать нужно математическое ожидание этого функционала:
шт М{1} = шт М х
п—1
хж + +< Яик)
Х1тт М
к=0
(6)
Если минимум функционала / существует, то процессы минимизации функционала и вычисления математического ожидания коммутативны. Следовательно, уравнения стохастического регулятора аналогичны регулятору в детерминированном случае (3).
Несмотря на перечисленные ранее достоинства, оптимальные регуляторы состояния обладают целым рядом недостатков. Существенным недостатком является большой объем машинной памяти, необходимый для поиска приближенного решения уравнения Риккати, так как получить его в аналитическом виде удается не всегда. Другой, не менее серьезный, недостаток оптимальных алгоритмов — неспособность учитывать изменения внешних условий, а также изменения течения процессов, присущих объекту и влияющих на качество работы системы управления.
Системы, приспосабливающиеся к изменениям характеристик объекта и к изменениям процессов, происходящих в объекте, называются адаптивными. Существует два основных типа систем регулирования, в которых применяется принцип адаптации: системы с адаптацией по разомкнутому циклу и системы с адаптацией по замкнутому циклу.
Если свойства объектов полностью определяются внешними возмущениями, которые доступны измерению, и известно как должен настраиваться регулятор в зависимости от этих измерений, то применяется схема с адаптацией по разомкнутому циклу (в этой схеме регулятор не охвачен обратной связью). Однако, случаи соблюдения подобных условий на практике встречаются очень редко, поэтому применение систем, построенных по этой схеме, ограничено.
В случаях, когда нельзя получить необходимую информацию о динамике объекта, возможно использование системы с адаптацией по замкнутому контуру. Такая схема предусматривает получение информации об объекте путем обработки измерений входных и выходных сигналов.
В системах с адаптацией по замкнутому циклу применяются самооптимизирующиеся регуляторы или регуляторы с эталонной моделью. Самооптимизирующиеся регуляторы строятся по схеме, представленной на рис. 2. Цель самооптимизирующихся регуляторов — достижение наилучшего качества управления при заданном критерии оптимальности.
Функционал качества, минимизируемый в оптимальных алгоритмах управления, должен изменяться при действии на объект возмущающих воздействий и изменении динамических характеристик объекта. Для поддержания заданного в виде функционала уровня качества системы используется блок расчета регулятора, который содержит алгоритмы, корректирую-
Рис. 2. Схема системы регулирования с адаптацией по замкнутому циклу:
РР — блок расчета регулятора; ИО — блок идентификации (3)
щие параметры, или алгоритм управления регулятора. В качестве алгоритмов управления регулятора обычно используются оптимальные алгоритмы управления, отвечающие требованию малых потребностей в объеме машинной памяти и быстродействия. Самооптимизирующиеся регуляторы способны адаптироваться к неизмеряемым внешним возмущениям, что является существенным отличием от регуляторов с эталонной моделью.
Регуляторы с эталонной моделью (рис. 3) созданы для получения максимального сходства реакций исследуемого замкнутого контура управления и эталонной модели на входной сигнал. При хорошо подобранной модели и при измеряемом изменяющемся выходном сигнале эти регуляторы отличаются способностью быстро адаптироваться, но при неизмеряемом изменяющемся ш адаптивность учитывается.
Адаптивные системы управления обладают существенным недостатком — чрезвычайно трудной реализацией вычислительных алгоритмов. Это настолько усложняет конструкцию системы и снижает ее надежность, что применение рассмотренных адаптивных алгоритмов управления в робототехнике затруднительно.
В соответствии с принципом максимума Понтрягина решение системы уравнений с целью достижения значения максимума функции Гамильтона определяет оптимальное управление ы({) методом вариационного исчисления.
Рис. 3. Регулятор с эталонной моделью: ЭМ — эталонная модель; ум — выходной сигнал модели, Ау — выходной разностный сигнал
В зависимости от вида функционала / и условий ограничения существуют различные приближенные методы для решения задач оптимального управления [3]. Выбор конкретного метода для решения задач оптимального управления зависит от вида функционала качества с различными ограничениями, а также от требования к точности решаемых задач.
Таким образом, для стохастической задачи управления роботом необходимо решить матричные дифференциальные уравнения Рикка-ти. Поскольку матричное дифференциальное уравнение Риккати лишь в некоторых тривиальных случаях имеет аналитическое решение, то обычно оно решается с помощью численных методов [3]. В принципе, исследование проблемы синтеза системы оптимального управления в дискретном времени проще, чем в непрерывном времени, поскольку вместо дифференциальных уравнений и интегралов используются разностные уравнения и суммы. При этом можно уменьшить объем вычислений в спецвычислителе робота и повысить эффективность алгоритма обработки информации.
Робастный алгоритм управления
Рассмотрим синтез робастного управления на основе Н -теории оптимизации. Исследуемая система управления может быть представлена функциональной схемой, изображенной на рис. 4 [3].
0( 8 ) =
0П(8) 0и(8) С21(8) С22(8)
с; (8) с; (8) о; (8) с; (8)
— мно-
гомерная передаточная функция объекта оптимизации от вектора [;(¿) ы({)\ до вектора
Ьт и) Ут (0]т. Например, 0п (з) = 0; (з) —
многомерная передаточная функция объекта от возмущения ;(¿) до контролируемой переменной Iи). Передаточная функция от возмущения к контролируемой переменной г(0 системы замкнута регулятором К( 8).
Задачей Нш-оптимизации является синтез такого регулятора К, который бы минимизировал Нш-норму Т; (8) от ;) до г0) замкнутой
системы [3]:
Регулятор
Рис. 4. Функциональная схема системы управления
I I TW ( s) | | t =
: sUP sUWX maxTzWт (c - J(,))TzH (c + J®).
c>0 ш
(7)
Здесь s = c + Jm — комплексная переменная; Xmax — максимальное собственное значение квадратной матрицы TZW (c — Jm)Tzw (c + Jm).
Показатель качества управления
J( k) = | | TW(s) I I .; J( Kopt) = inf| I TW (s) I I . = Y opt.
В этом случае регулятор обеспечит минимальное влияние возмущений [3].
Структурная схема с учетом введенной параметризации изображена на рис. 5.
Достоинством параметризации регуляторов является то, что параметр Q(s) линейно входит
в выражение передаточной функции замкнутой системы и позволяет проводить более простой поиск оптимальных регуляторов. Использование центрального регулятора обеспечивает получение робастной системы с удовлетворительным качеством, которое принято в пространстве Яш.
Достоинство классического метода построения регулятора состоит в свободном выборе желаемых характеристик переходных процессов, а недостаток — высокий порядок регулятора [4].
Для управления возможно использование оптимального Н2-регулятора. Этот регулятор имеет линейную структуру и предусматривает определение в результате линеаризации матрицы представления объекта в пространстве состояний (А,В1,В2,С1,С2), решение уравнений
Параметр
Рис. 5. Система управления с параметризацией стабилизирующих регуляторов
Ат X2 + X2А - X2Б2Б2т X2 +С/ С = 0 и А72 + Г2Ат - Г2С2тС2Г2 + Б1Дт = 0.
Алгоритм управления оптимального ^-регулятора имеет вид
К 2 ( 8 ) =
А Б' 'А + Б 2 + Ь 2 С 2 - Ь 2 "
С 5_ Л 0 _
, (8)
где ¥г = -Б\ X2; Ь = -У2С2т.
Алгоритм синтеза оптимального Дш-регуля-тора несколько более трудоемкий. В отличие от Д2-регулятора, он требует специальной итерационной процедуры.
При \\TZW||м < у Д^регулятор, имеет следующий вид [3]:
А Б
С 5
К и (8 ) =
А + у-2 Б, бт X „ + Б 2 ^ + Ь„С2 ь
0
(9)
Представленный алгоритм является субоптимальным. Построение Дш-регулятора предусматривает решение двух уравнений Риккати в каждом цикле выбора коэффициента толерантности у.
В системах управления роботами используются линейные и нелинейные алгоритмы управления. Линейные алгоритмы отличаются простотой, надежностью и хорошо отработаны на практике. Поэтому в практических приложениях обычно осуществляется линеаризация
математических моделей управляемых объектов.
Выводы
Таким образом, представлены адаптивные алгоритмы управления, отличающиеся высокой точностью. При синтезе конкретной системы управления необходимо построить математическую модель шагающего робота и осуществить выбор базового адаптивного алгоритма. В качестве структуры системы управления могут быть использованы универсальные структуры. В зависимости от внешних условий функционирования и возможностей реализации проводится выбор адаптивного подхода к управлению роботом. На последнем этапе осуществляется адаптация разработанной системы управления к реальным условиям функционирования.
Литература
1. Фу К., Гонсалес Р., Ли К.Робототехника: Пер. с англ.; Под ред. В.Г. Градецкого. М.: Мир, 1989.
2. Вукобратович М. Шагающие роботы и антропоморфные механизмы. Мир, 1976.
3. Красовский А.Н. Теория управления движением. М.: Наука, 1968.
4. АндриковД.А., Коньков В.Г. Интеллектуальная система управления КТС с АБС. Вестник РУДН. 2007. № 14.
Статья поступила в редакцию 30.06.2011 г
д
д