УДК 681.3
Е. А. Энгель
МЕТОД ИНТЕЛЛЕКТУАЛЬНЫХ ВЫЧИСЛЕНИЙ ДЛЯ УПРАВЛЕНИЯ КОНФИГУРАЦИЕЙ МАНИПУЛЯЦИОННОГО РОБОТА
Рассматривается нейроэволюционный подход, который может использоваться для решения задачи управления манипуляционным роботом. Управление манипуляционным роботом представляет задачу, в которой для заданных объектов: мобильного робота, движимых объектов, располагая набором действий (в том числе манипулятора) робота, выполняется поиск последовательности действий с целью перемещения манипуляционного робота и грузов из начальной конфигурации в набор конфигураций цели. В формулировке указанной задачи ключевым аспектом является то, что заданы несколько типов действий манипулятора над объектом. Поэтому автоматические методы машинного обучения, такие как нейроэволюция, являются многообещающей альтернативой по сравнению с методами поиска шаблонов. Рассматривается многорежимность задачи управления манипуляционным роботом, составляющая в рамках нейроэволюционного подхода фенотип как иерархию генотипов, формируемых и настраиваемых c использованием нейроуправления как ней-росетевые законы управления для схемы с обратной динамикой нелинейного управления. Указанная схема управления конфигурацией робота PR2 в условиях случайных возмущений была реализована на основе программного обеспечения NEAT и OMPL. Имитационное моделирование решения задачи управления конфигурацией робота PR2 в условиях случайных возмущений было выполнено в GUI Moveit Rviz. Результаты указанного имитационного моделирования динамики подтверждают эффективность разработанного метода интеллектуальных вычислений в сравнении с методами DARRT (H) (CONNECT).
Ключевые слова: нейронная сеть, эволюционные вычисления, интеллектуальные системы, мани-пуляционный робот, многорежимность, нейроуправление, имитационное моделирование.
E. A. Engel
The Intellectual Computation Method for Control Problem in a Mobile Manipulation Domain
The article demonstrates how the neuro-evolutionary approach can be utilizing to solve Diverse Action Manipulation problem. The Diverse Action Manipulation is a problem in which a mobile robot, a set of movable objects, and a set of diverse, possibly non-prehensile manipulation actions are given, and the goal is to find a sequence of actions that moves each of the objects to a goal configuration. The key aspect of Diverse Action Manipulation problem is that multiple types of possibly non-prehensile manipulation are available for a single object. Therefore, automatic design methods utilizing machine learning techniques such as neuro-evolution are a promising alternative as compared to the DARRT (H) (CONNECT) search sampling methods. Multimodal structure of the Diverse Action Manipulation problem forming within neuro-evolutionary approach a phenotype as hierarchy of genotypes generating and tuning within the neurocontrol as a neural network control laws for the circuit with feedback control of nonlinear dynamics is considered. The
ЭНГЕЛЬ Екатерина Александровна - к. т. н., доцент ВАК, доцент кафедры информационных технологий и систем Хакасского государственного университета им. Н. Ф. Катанова. E-mail: [email protected]
ENGEL Ekaterina Aleksandrovna - Associate Professor of the Department of Information Technologies and Systems at Katanov State University of Khakassia in Abakan. E-mail: [email protected]
aforementioned control scheme for the robot PR2 performing Diverse Action Manipulation problem under random perturbations was implemented base on software NEAT and OMPL. The robot PR2 performing Diverse Action Manipulation problem under random perturbations base on hybrid intellectual computation method simulations have been carried out with the GUI Moveit Rviz. The aforementioned simulation results performance and robustness of the proposed hybrid intellectual computation method are confirmed as compared to the DARRT (H) (CONNECT) methods.
Keywords: neural networks, evolutionary computation, intelligent systems, manipulation robot, multimode, neurocontrol, simulation.
Введение
Необходимость интеллектуального управления манипуляционными роботами, функционирующими автономно в условиях агрессивной среды, назрела в робототехнике, авиации, ракетно-космической технике и т. п. В России актуальность разработанной интеллектуальной системы управления манипуляционного робота подтверждается следующими пунктами Указа Президента РФ [1]: «Технологии информационных, управляющих, навигационных систем» и «Технологии создания интеллектуальных систем управления новыми видами транспорта». В данном исследовании разработанный метод интеллектуальных вычислений используется для решения задачи управления манипуляционным роботом (Diverse Action Manipulation - DAMA [2]), в которой для заданных объектов: мобильного робота, движимых объектов (грузов), располагая набором действий (в том числе манипулятора) робота, - выполняется последовательность реконфигураций - управляемый процесс изменения конфигураций манипуляционного робота и грузов из начальной конфигурации в набор конфигураций цели. В формулировке задачи DAMA ключевым аспектом является то, что заданы несколько типов действий манипулятора над объектом (набор манипуляций робота). Очевидно, что данная проблема является многорежимной (multi-modal) задачей, решаемой динамическим изменением состояний системы объектов DAMA, принадлежащих множествам режимов и соответствующих конфигураций [2-3]. Существует большой объем работ, посвященных аспектам проблемы DAMA. Мейсон [4] рассматривает механику толкания объекта, а Брост [5], Догар и Шриниваса [6] рассматривают сочетание толкания и захвата как одну манипуляцию, Хуан и Мейсон исследовали расталкивание объектов [7]. Тем не менее эти работы описывают управление и моделирование динамики только для одного типа манипуляции. Задача DAMA связана с навигацией между подвижными препятствиями (navigation among movable obstacles - NAMO) [8-9]. В данном исследовании предполагается, что среда не содержит подвижных помех. Задачи NAMO рассмотрены в [8-9] и не являются предметом данной статьи. Решая задачу построения математической модели плоского движения свободнолетающего космического манипуляционного робота, В. Ю. Рутковский, В. М. Суханов, В. М. Глумов рассматривают вопросы синтеза алгоритма управления конфигурацией манипулятора, приводят результаты моделирования динамики робота в режиме управления конфигурацией [10].
В системе управления манипуляционным роботом выделяются стратегический, тактический и исполнительный уровни, на стратегическом уровне выполняется формирование иерархии примитивов, реализующих переход из начальной в целевую конфигурацию; на тактическом уровне для каждого примитива - составление траектории перехода из начального в целевое состояние; на исполнительном уровне для каждого примитива управление приводами манипуляционного робота. Решение задачи DAMA - полный путь из начальной в целевую конфигурацию, формируется в данном исследовании иерархией генотипов -фенотипом, инкапсулирующим и моделирующим в рамках нейроэволюционного подхода следующие характеристики и функциональные особенности управления манипуляци-онным роботом: иерархическую многорежимную структуру задачи DAMA; динамику манипуляционного робота как многосвязную нелинейную систему. Указанный фенотип формируется и настраивается иерархическим методом интеллектуальных вычислений.
Особенности многорежимной задачи DAMA
Примитив формально определятся как функция, возвращающая результирующую конфигурацию робота и подвижных объектов путем преобразования начальных конфигураций робота и объектов к конечной на основе реализации динамики примитива p¡ как многосвязной нелинейной системы с группой управляющих сигналов u(t), i = 1..4, j e 1..q'. В данном исследовании используются следующие примитивы: p1 - транзит (transit) - движение робота без груза, применимо к любой конфигурации, в которой робот перемещается без столкновений между любыми объектами в среде; p2 - твердая передача (rigid-transfer) - перемещение робота с объектом, удерживаемым схватом, применимо к любой конфигурации, в которой робот движется, удерживая объект, и не происходит столкновения между роботом и любыми объектами в среде; p3 - прямолинейное перемещение руки: перемещение по прямой линии в декартовых координатах; p4 - толкание (push) объекта, толчок применим к любой конфигурации, в которой есть двухсторонний контакт между манипулятором и толкаемым объектом с перемещением без столкновений; примитив не является хватательным. Примитив, перемещающий объект, - примитив передачи (transfer).
Многорежимная задача определяется кортежем <C^>, где С - пространство конфигураций, а X - пространство режимов [3]. Каждый режим аё^ с учетом специфики определяется набором ограничений, формирующих набор конфигураций, удовлетворяющих этим ограничениям. Для задачи реального времени DAMA непрерывные режимы описываются как дискретный набор семейств режима (mode families). Переходы между режимами в семействе режима запрещены, поскольку сначала режимы должны выйти из режима семейства.
Пусть задача DAMA задана кортежем <R,{op...,o}, {B1,.,BJ, {p1,.,pJ,cpG>, где R -робот; {op...,o} - набор движимых объектов (грузов), {Bp...,BJ=B - набор неподвижных препятствий; M={R,o1,.,oJ - движимые компоненты; {pp...,pm}=P - набор примитивов, cp - начальная конфигурация, G - набор конфигураций цели, включающий целевые конфигурации объектов; примитив pi имеет возможность манипулировать объектами множества классов {Ор...,Ок}. Для каждого примитиваpi и манипулируемых объектов класса Ок определяется одно семейство режима sik, представляющее связанную конфигурацию робота и объектов класса Ок и стационарные конфигурации объектов, не принадлежащих классу О, k = 1..K.Многорежимная задача DAMA (MM-DAMA) - задача DAMA, пополненная указанным пространством режима.
Существующие методы решения многорежимных задач DAMA
Для решения многорежимных задач Хэйсер [3] первоначально предложил многорежимный подход и несколько методов на основе шаблонов, требующих дополнительной информации не только о режимах задач, но и высокоуровневый граф режимов, управляющий и описывающий все возможные переходы, в том числе не осуществимые в действительности. Методы реконфигурации системы DAMA включают следующие дополнительные шаги: 1) создание шаблона конфигурации на пересечении двух режимов из графа переходов режимов; 2) планирование без столкновений возможного пути в одиночном режиме. Однако поскольку эти алгоритмы случайным образом выбирают шаблонный режим транзита, они могут не найти решения перемещений низкоуровневых подпространств в режиме собственных переходов. В целом задачи манипуляции требуют рассуждения о длинных цепочках связанных примитивов передачи. Поскольку примитивы передачи почти всегда предшествуют или следуют за транзитом, процедура выдачи шаблонов при пересечении двух режимов не отражает указанную многошаговую зависимость, которую хорошо реализует разработанный фенотип (рис. 1б). Идеализированный метод решения MM-DAMA задачи, содержащий два шага: 1) планирование последовательности режимов; 2) планирование каждого режима в последовательности, реализует только два способа (предложены в [9-10]), полагающиеся на аналитическое описание всех компонентов связности конфигурационного пространства робота. Вследствие перехода к высокоуровнему пространству конфигураций и наличия нехватательных примитивов указанные способы не применимы к решению
задачи MM-DAMA. Когда компоненты связности конфигурационного пространства робота не могут быть описаны, эффективные методы решения сосредоточены на поиске последовательности семейств режима, а не последовательности режимов в первом шаге. Поскольку транзит всегда располагается между каждым типом передачи (transfer) метод решения задачи MM-DAMA упрощается следующим образом: 1) формирование последовательности семейств режима передачи (transfer); 2) формирование каждого набора передачи (transfer), и траекторий транзита. Для решения задачи манипуляции [2] используются методы быстрого изучения случайных деревьев манипуляций (Diverse Action Rapidly exploring Random Tree
- DARRT): DARRT (H) (CONNECT), имеющие структуру быстрого изучения случайных деревьев (RRT) с контролем [12]. Метод DARRT (H) (CONNECT) сначала создает траекторию объекта с использованием DARRT (CONNECT) с проверкой только столкновений для этого объекта. Далее определяется последовательность примитивов передачи (transfer), используемых на этой траектории, и для каждого примитива, запускается DARRT (CONNECT) для поиска конфигурации, в которой применяется данный примитив. Наконец, подбирается решение для достижения конечного целевого набора. Оперирование только приближенными к действительности траекториями не гарантирует, что последовательность семейств передачи (transfer) найдет верную траекторию.
Метод интеллектуальных вычислений
В отличие от описанных в п. 2 методов DARRT (H) (CONNECT), использующих рандомизированные стратегии поиска, в данном исследовании решение задачи DAMA в рамках нейроэволюционного подхода формируется фенотипом [13] - иерархией генотипов, составленных и настроенных методом интеллектуальных вычислений.
Указанные в п. 2 особенности семейств режима формируют иерархическую структуру, которую целесообразно представить в рамках нейроэволюционного подхода как фенотип
- иерархию генотипов. Таким образом, в структуре фенотипа содержатся зависимости цепочек генотипов, которые выявляются в ходе нейроэволюции. Далее в исследовании рассматривается один объект (K=1, n=1 ), поскольку метод можно повторить для каждого объекта. Решение задачи DAMA представляет последовательность примитивов, реализующих реконфигурацию манипуляционного робота и объекта (груза) из начальной конфигурации cI в набор конфигураций цели G, формируемый фенотипом - иерархией настроенных генотипов s, инкапсулирующих динамики соответствующих примитивов p., каждый из которых представляет многосвязную нелинейную систему с группой управляющих сигналов uj(t), j î \..q'.
Примитивы p обуславливают нелинейный характер динамической зависимости текущей конфигурации робота g(t) от управляющих сигналов uj (t), вследствие существенного изменения угловой скорости двигателей со временем для постоянного управляющего сигнала (приводящего к периодическому изменению траектории), многосвязности манипу-ляционного робота и др. Каждый генотип si представляет нейросетевой закон управления (1) для схемы с обратной динамикой нелинейного управления [11]. Желаемая траектория движения робота задается в пространстве состояний подсистемы внешней динамики u i=f(g, U) для канала управления порядка q' как программа по времени ui(t). Дляj-го канала управления после линеаризации обратной связью внешняя подсистема u*=9 имеет вид: uj = 3. Для объекта управления вида ^(gAw*)=G_1(g)[-f[g)+9]+£o(g,9) (где £o(g,$) - малая остаточная ошибка аппроксимации) рассматривается задача терминального управления. Для ее решения при старте из различных начальных условий u(0)^ ud(0) новая переменная управления выбирается в виде: $=udj+kTe, где e=ud-u, т. е. e = [e,e,...,e(-1)] .Закон управления примет вид:
U = R(u'd+ K(ud -w), (1)
где матрица K содержит на диагонали коэффициенты усиления для всех qi каналов управления. Тогда уравнения для ошибки слежения: e = Ke + d, где матрица K - гурвицева
и определяется выбором вектора коэффициентов усиления k = \k0,kl,.,kj-l] ; через dобозначены неточности линеаризующего закона управления и возмущения.
Метод интеллектуальных вычислений для решения задачи {M, B, P, c; ,G)
включает два этапа.
I этап - составление и настройка фенотипа.
1 шаг: for i=1:m для примитива p. составляется генотип s. как объект, инкапсулирующий нейросетевой объект - динамическую двуслойную нейросеть, содержащую в скрытом слое 2 нейрона, во входном слое: n+1+q нейронов (n+1 входов соответствуют для времени t: координатам текущей конфигурации g(t) ( t = t^ соответствует начальной конфигурации) и расстоянию Евклида d(t)=||g-g(t)||, q' входов соответствуют текущим значениям выходов объекта управления yj (t) ); в выходном слое: q' нейронов выдают управляющие воздействия uj (t + 1). Генотип s. реализует нейросетевой закон управления (1). Составленная динамическая двуслойная нейросеть обучается на наборе экспериментальных данных {yj (t ), d (t ), uj (t )}, g. - начальная узловая конфигурация генотипа s, t = t g[ ..t '. next i.
2 шаг: на основе последовательных наборов экспериментальных данных, рассматриваемых с точки зрения деревьев с длиной пути l, формируются строки c''= (c"r... c"), где c'' j - индекс примитива, используемого для вершины j = 1..1. На основе с" инициализируются вершины фенотипов ( сс, инициализируетj-ю вершину и соответствующий ей генотип сс, ). Затем фенотипы на основе наборов экспериментальных данных эволюционируют на базе технологии NEAT [12]. В результате возвращаются графы-чемпионы Ft с длиной пути l, cFi = (c \,...c \ ), которые далее называются настроенным фенотипами.
II этап - решение задачи DAMA.
1 шаг: составляется иерархия используемых для решения задачи DAMA примитивов в виде строки c=(cr... cS), используя аннотацию полного пути, обеспечиваемую стандартным методом PATH (c1,G1,M,B, P).
2 шаг: используя алгоритм Astar [14], вычисляются узловые конфигурации пути g
i = 1..S, формирующие параметры конфигурации вершин фенотипа полного пути (рис. 1б),
gs=G ga=cr
3 шаг: Во множестве настроенных на 2 шаге I этапа фенотипов выбирается настроенный фенотип F, для которого cFs = (c\,...c' s)).
4 шаг: If c = cFs, то шаг 7 eise e=s+1, проверяется вхождение подстроки с в строки cF , F - обрезанный согласно подстроки c настроенный фенотип F. Выполнить шаг 7.
5 шаг: Формирование настроенным фенотипом полного пути.
for k=1: S if ||gk-g(t)||<e, then next k eise выполнить 7 шаг. (s - допустимая погрешность расстояния).
6 шаг: for k=0:S-1
for t=t...t+ö (ö - небольшой интервал времени) c целью выяснения выполнимости примитива в конфигурации g =g(t) выполнить 7 шаг.
7 шаг: i=ck настроенная нейросеть s., на основе полученных от робота {yj (t ), g (t )}, выдает управляющие воздействия uj(t). Нейронные сети s. в нелинейном контуре управления позволяют работать напрямую с общим видом уравнений uj(t ) = f ( yj (t ), g i, g (t )), не производя их линеаризацию и учитывая все взаимосвязи между разными каналами управления q".
Разработанный метод интеллектуальных вычислений реализован на языке С++. Нейро-эволюционные аспекты I этапа и 7 шаг II этапа: формирование, настройка и функционирование настроенного нейросетевого фенотипа реализованы на языке С++ с использованием библиотек нейроэволюции расширяющихся топологий NeuroEvolution of Augmenting Topologies (NEAT) [13]. Функциональные аспекты управления манипуляционным роботом реализованы с использованием стандартных объектов, функций ROS, пакета MoveIt (использующего OMPL планировщики [14]) и описаны далее в п. 4.
Фенотип пути целевой реконфигурации [13], отражающий узловые конфигурации
Рис. 1. Структура фенотипа манипуляционного робота: а - генотип s.; б - фенотип; в - схема k-й вершины
системы подвижных объектов DAMA (робота и груза), изображен на рис. 1б. Каждый лист дерева представляет вершину и ребро графа фенотипа (рис. 1а), имеющих те же значения параметров, хранящихся в генотипе и состоящих из нейронов и весов связи для каждого блока сети (вершина). Вершина графа фенотипа представляет блок нейронной сети и связи между ними (рис. 1в). Каждый блок s. имеет фиксированную архитектуру двуслойной нейросети, содержащей n+1+q',2,q', нейронов во входном, скрытом и выходном слоях соответственно. Переход от блока sk к блоку sk (соответствует выходу из семейства режима s) осуществляется по выполнению условия ||gk-g(0||<£.
Иерархическая структура вершин фенотипа пути отражает последовательный процесс реконфигурации системы подвижных объектов DAMA, происходящий посредством применения примитивов.
Необходимость формирования фенотипа возникает в случаях, когда стандартный планировщик не решает задачу, в этом случае для решения используются результаты эволюции фенотипа, сформированного методом интеллектуальных вычислений. Нейроэволюцион-ные технологии применяются в сложных системах DAMA, когда метод PATH не находит решения. Метод интеллектуальных вычислений сопряжен с формированием, настройкой и эволюцией фенотипа, требующими значительных вычислительных ресурсов. Целесообразно его использование для выполнения специализированных задач в специфицированной среде: например, для настройки робота-ассистента, выполняющего работу в конкретной квартире или позаданной карте местности, необходимо оптимизировать (например, по времени, расстоянию или другой характеристике) выполнение миссии мобильного мани-пуляционного робота.
Использование метода интеллектуальных вычислений при управлении конфигурацией робота PR2
Управление движением робота PR2 [14] компании Willow Garage на базе мета-операционной системы для роботов с открытым исходным кодом ROS и пакета планирования движения MoveIt [13] включает электрические, механические средства в комбинации с программным обеспечением, реализующие описанные в п. 1 примитивы. Схема управления движением показывает аппаратное и программное взаимодействие уровней ROS в контуре управления движением в режиме реального времени и офлайн (рис. 2). Реализующий управление исполняемый файл представляет узел, Пакет MoveIt реализует узел-интегратор move_group (рис. 3), обеспечивающий набор действий ROS. Основными концепциями ROS являются узлы, сообщения, темы, сервисы. Функциональные аспекты управления 1-2 и 3-5 шагов II этапа разработанного метода интеллектуальных вычислений реализованы интеграцией с глобальным и локальным планировщиками соответственно (рис. 4).
Для решения сформулированной в п. 2 многорежимной задачи DAMA метод интеллек-
Рис. 2. Схема управления движением робота PR2
Рис. 3. Архитектура move_group
туальных вычислений использует слой абстракции связанных узлов ROS, реализующих последовательность примитивов полного пути, получающих сообщение geometry_msgs/Pose (определяет текущую конфигурацию робота в трехмерном пространстве и ориентацию, обеспечивает получение сигналов g(t)=(X(t),Y(t),Z(t)),n=3) и передающих команды управления u(t), сформированные методом интеллектуальных вычислений к соответствующим контроллерам.
Например, нейросетевой генотип перемещения p использует слой абстракции узла локального планировщика (рис. 4) навигационного стека (отвечающего за управление перемещением робота) при формировании и передаче управляющих воздействий u1(t) контроллеру базы робота (base controller) в теме cmd_vel в сообщениях типа geometry_msgs/ Twist (linear задает линейную скорость перемещения робота по осям x,y,z, а вектор angular
Рис. 4. Стек навигации
- угловую скорость перемещения по осям x,y,z)). Далее команды преобразуются в управляющие сигналы шифратора и/или вращения двигателей, осуществляющие движение робота. Функциональные аспекты управления манипуляционным роботом привязаны к его конфигурации в каждый момент времени t е {tc^, tG}. Геометрические связи между кинематическими узлами заданы URDF моделью, работая с которой узел tf преобразует позицию из локальной системы координат робота в глобальную систему координат карты. Основным информационным выходом является сообщение moveit_msgs::RobotTrajectory
- последовательность точек конфигурации g(t) с временными метками t, скоростями y(t). Функционально согласование разработанного модуля интеллектуальных вычислений с другими обеспечивает модуль tf, который отвечает за все информационные преобразования между узлами и сервисами.
Результаты компьютерного моделирования метода интеллектуальных вычислений для управления конфигурацией робота PR2
Разработанным методом интеллектуальных вычислений решался набор задач DAMA роботом PR2, имеющим три степени свободы голономной базы, одна из них - семь степеней свободы рук и захвата объекта, что в общей сложности дало 16 измерений пространства конфигураций. Задачи DAMA заключались в следующем: PR2 приходилось маневрировать возле стола, подталкивать тарелку к краю, брать тарелку и переносить ее в целевую конфигурацию. Используя OMPL планировщики [14], реализованы описанные в п. 1 примитивы: p1 - транзит для рук и базы (q*=6, количество моторов - J1=6); p2 - твердая передача для рук и базы (q2=14, J2=8); p3 - прямолинейное перемещение руки (q=14, J3=9); p4 - толкание (q4=14, J2=8).
Метод интеллектуальных вычислений сформировал настроенный фенотип F5 (с длиной пути 1=5), строка cF = 13421 (цифра в строке - индекс примитива). Интуитивно строка cF^ определяет подцели, соответствующие тому, как человек решает указанную задачу: 1) подойти к столу (1), 2) подтолкнуть тарелку к краю стола (34), и 3) взять тарелку и переместить ее (21). Традиционный планировщик Mode-Specified формировал деревья манипуляций для базы и рук в трех- и семимерном пространствах соответственно, а методы интеллектуальных вычислений и DARRT (H) (CONNECT) формировали путь в пространстве размерности 16.
Рис. 5. Испытательные среды, моделируемые в ПП GUI Moveit Rviz
В таблице приведено сравнение результатов компьютерного моделирования ПП GUI Moveit Rviz [15] в четырех испытательных средах (рис. 5) разработанного метода интеллектуальных вычислений с существующими (Mode-Specified, DARRT (H) (CONNECT) [3]).
Среда 0 является тривиальной. В сложных системах DAMA (например, Среда 4) нейро-эволюционные технологии, реализованные методом интеллектуальных вычислений (ИВ), обеспечивают эффективное решение в сравнении с существующими методами: Mode-Specified, DARRT (H) (CONNECT).
Таблица
Общее время планирования методов после 50 прогонов
DARRT DARRTH DARRTConnect DARRTHConnect Mode-Specified ИВ
Среда 0 12 14 11 19 13 12
Среда 1 42 25 34 28 14 15
Среда 2 142 65 98 36 19 18
Среда 3 1004 171 436 61 36 40
Среда 4 411 218 165 240 - 101
Разработанный метод интеллектуальных вычислений в сравнении с DARRT (H) (CONNECT) эффективнее и быстрее формирует путь. Выигрыш достигается вследствие следующих факторов: 1) функция расчета ближайшего расстояния (необходимая для аппроксимации пути) является дорогостоящей и поскольку в методе DARRT на дерево пути сбрасывается при достижении подцели, DARRTH делает много меньше обращений к функции расстояния; при интеллектуальных вычислениях обращается к функции расстояния только S-1 раз; 2) перезагрузка при достижении цели - DARRT (CONNECT) - перезапускается с начального состояния, DARRTH (CONNECT) перезапускается с последней подцели, при интеллектуальных вычислениях перезапускается только для промежуточного участка пути, который не удалось спланировать; 3) добавление гауссова шума, имитирующего помехи в системе DAMA, не влияет существенным образом на качество и время
Заключение
В данном исследовании в рамках нейроэволюционного подхода эффективное решение задачи DAMA формировалось фенотипом, реализующим настроенные нейросети s. в нелинейном контуре управления, работающие напрямую с общим видом уравнений состояния робота, не производя их линеаризацию и учитывая все взаимосвязи между разными каналами управления q'.
Разработанный метод интеллектуальных вычислений в сравнении с DARRT (H) (CONNECT) является более эффективным в области мобильной манипуляции в пространствах высокой размерности, поскольку эффективнее и быстрее существующих методов формирует путь; нейросетевая архитектура вершин и ребер фенотипа обеспечивает робастное и устойчивое к возмущениям управление манипуляционным роботом.
Работа выполнена при поддержке РФФИ, проект №14-41-0402-а.
Л и т е р а т у р а
1. Указ Президента РФ «Об утверждении приоритетных направлений развития науки, технологий и техники в российской федерации и перечня критических технологий российской федерации» от 07.07.2011 № 899.
2. Barry J. Manipulation with Diverse Actions, Ph. D. dissertation, Massachusetts Institute of Technology, 2013.
3. Hauser K. Motion Planning for Legged and Humanoid Robots, Ph. D. dissertation, Stanford University, 2008.
4. Mason M. T. Mechanics of Robotic Manipulation. Cambridge, MA: MIT Press, August 2001.
5. Brost R. C. Automatic Grasp Planning in the Presence of Uncertainty, IJRR, vol. 7, no. 1, 1988.
6. Dogar M., Srinivasa S. Push-Grasping with Dexterous Hands: Mechanics and a Method, in IROS, 2010.
7. Huang W., Mason M. T. Experiments in Impulsive Manipulation, in ICRA, vol. 2, 1998.
8. van den Berg J., Stilman M., Kuffner J., Lin M., Manocha D. Path Planning among Movable Obstacles: A Probabilistically Complete Approach, in WAFR, 2008.
9. Simeon T., Laumond J.-P., Cortes J., Sahbani A. Manipulation Planning with Probabilistic Roadmaps, IJRR, vol. 23, no. 7-8, 2004.
10. Рутковский В. Ю., Суханов В. М., Глумов В. М. Уравнения движения и управление свобод-нолетающим космическим манипуляционным роботом в режиме реконфигурации // Автоматика и телемеханика. - 2010. - № 1.
11. Omidvar O. M., Elliott D. L. Neural Systems for Control, Elsevier, 1997.
12. James J., Kuffner J., LaValle S. M. RRT-Connect: An Efficient Approach to Single-Query Path Planning, in ICRA, 2000.
13. Miikkulainen R., Valsalam V. K., Hiller J., MacCurdy R., Lipson H. Constructing Controllers for Physical Multilegged Robots using the ENSO Neuroevolution Approach. Evolutionary Intelligence 5 (1): 4556, 2012.
14. URL: http://www.ros.org/ (дата обращения 01.04.2013)
15. URL: http://moveit.ros.org/install/ (дата обращения 01.05.2013)
16. URL: http://wiki.ros.org/navigation
17. PR2 overview: сайт исследовательского центра. URL: http://www.willowgarage.com/pages/pr2/ overview (дата обращения 01.06.2013)
R e f e r e n c e s
1. Ukaz Prezidenta RF «Ob utverzhdenii prioritetnykh napravlenii razvitiia nauki, tekhnologii i tekhniki v rossiiskoi federatsii i perechnia kriticheskikh tekhnologii rossiiskoi federatsii» ot 07.07.2011 № 899.
2. Barry J. Manipulation with Diverse Actions, Ph. D. dissertation, Massachusetts Institute of Technology, 2013.
3. Hauser K. Motion Planning for Legged and Humanoid Robots, Ph. D. dissertation, Stanford University, 2008.
4. Mason M. T. Mechanics of Robotic Manipulation. Cambridge, MA: MIT Press, August 2001.
5. Brost R. C. Automatic Grasp Planning in the Presence of Uncertainty, IJRR, vol. 7, no. 1, 1988.
6. Dogar M., Srinivasa S. Push-Grasping with Dexterous Hands: Mechanics and a Method, in IROS, 2010.
7. Huang W., Mason M. T. Experiments in Impulsive Manipulation, in ICRA, vol. 2, 1998.
8. van den Berg J., Stilman M., Kuffner J., Lin M., Manocha D. Path Planning among Movable Obstacles: A Probabilistically Complete Approach, in WAFR, 2008.
9. Simeon T., Laumond J.-P., Cortes J., Sahbani A. Manipulation Planning with Probabilistic Roadmaps, IJRR, vol. 23, no. 7-8, 2004.
10. Rutkovskii V. Iu., Sukhanov V. M., Glumov V. M. Uravneniia dvizheniia i upravlenie svobodnoletaiushchim kosmicheskim manipuliatsionnym robotom v rezhime rekonfiguratsii // Avtomatika i telemekhanika. - 2010. - № 1.
11. Omidvar O. M., Elliott D. L. Neural Systems for Control, Elsevier, 1997.
12. James J., Kuffner J., LaValle S. M. RRT-Connect: An Efficient Approach to Single-Query Path Planning, in ICRA, 2000.
13. Miikkulainen R., Valsalam V. K., Hiller J., MacCurdy R., Lipson H. Constructing Controllers for Physical Multilegged Robots using the ENSO Neuroevolution Approach. Evolutionary Intelligence 5 (1): 4556, 2012.
14. URL: http://www.ros.org/ (data obrashcheniia 01.04.2013)
15. URL: http://moveit.ros.org/install/ (data obrashcheniia 01.05.2013)
16. URL: http://wiki.ros.org/navigation
17. PR2 overview: sait issledovatel'skogo tsentra. URL: http://www.willowgarage.com/pages/pr2/overview (data obrashcheniia 01.06.2013)
^■Mir^r