Информационный обмен в коалициях мобильных роботов в условиях ограниченных коммуникаций на основе эпидемического алгоритма
В.Б. Шабанов
ООО «Научно-исследовательский институт многопроцессорных вычислительных и управляющих систем», Таганрог
Аннотация: В настоящее время большой популярностью пользуется тема создания групп мобильных роботов, для решения групповых задач. В связи с чем становится вопрос реализации информационного обмена внутри коллектива. В статье рассмотрены существующие подходы организации информационного взаимодействия в группах интеллектуальных роботов, а также содержится краткий анализ особенностей обмена информацией в зависимости от типа стратегии управления. Предложен метод организации обмена информацией с учетом ограниченности бортовых телекоммуникационных систем мобильных роботов. Предлагаемый метод основан на применении эпидемических алгоритмов и методов развертки роя для маршрутизации. Предоставлен результат моделирования программного обеспечения.
Ключевые слова: система группового управления, коалиция роботов, обмен информацией, эпидемический алгоритм, ограниченные коммуникации, малоразмерные роботы, динамические системы, программное моделирование, модель управления, взаимодействие роботов.
Введение
Мобильные роботы прочно заняли позиции в решении технически сложных задач. Одним из витков эволюции роботов является использование группового взаимодействия для повышения эффективности и функциональности в решаемых задачах [1-4]. Малогабаритные автономные роботы открывают огромные возможности, в частности, возможность снижения человеческих потерь в аэрокосмических операциях. Отсутствие людей на борту позволяет увеличить диапазон допустимых перегрузок и маневренности, снизить стоимость единиц такого оборудования. Такие роботы могут использоваться для картографирования, наблюдения [5], слежения, охраны спец объектов, перемещения габаритных тел, работу с радиоактивными отходами [6], телекоммуникаций [7], радиоэлектронной разведки, поисковых операций [8,9] и др.
Выполнение групповых задач требует создания системы управления, позволяющей достичь высокого уровня командного взаимодействия с учетом динамично изменяющейся среды и ограниченности радиуса взаимодействия членов коллектива, в этом случае одного оператора достаточно для постановки задачи и управления группой роботов [10,11].
Ключевыми преимуществами эпидемических алгоритмов является простота распространения информации в больших динамических системах, алгоритм позволяет легко развернуть систему и обеспечить высокий уровень отказоустойчивости.
Анализ существующих методов управления группами
Вычислительные и функциональные возможности малоразмерных мобильных роботов крайне ограничены, поэтому распределение задач в группе является актуальной проблемой. Существующие методы и подходы к управлению группами роботов, позволяют разделить их на 3 основные категории [12-14]:
• Стратегия централизованного управления. Все члены группы считаются единым объектом управления с четким распределением прав и обязанностей каждого элемента команды (см. рис. 1). Принцип основан на иерархической модели представления, схема включает центральное устройство управления (ЦУУ) и каналы, по которым происходит обмен информацией между всеми участниками. Каждый агент должен постоянно передавать информацию о своих координатах, своем состоянии, условиях окружающей среды в ЦУУ. Примером этого метода является проект "МЛЯТНЛ"[2];
Рис.1. - Централизованное управление.
• Децентрализованная стратегия управления. Управление коллективом автоматов, лишенных единого объекта управления, позволяет добиться высокой масштабируемости и нетребовательности оптимизации маршрутов движения роботов, что полностью отличает этот метод от централизованного [15-17]. В децентрализованной системе можно выделить два метода: коллективный и стайный (рис. 2);
Децентрализованное Децентрализованное с
лшешвное управление, управление.
Рис.2. - Децентрализованное управление.
• Комбинированная стратегия управления - объединены все основные методы группового управления [18].
Постановка задачи управления группами малоразмерных роботов
Задачу группового управления можно представить следующим образом. Пусть есть группа А состоящую из К-количества роботов
Я1(/ = \,W), функционирующих в условия среды Б. Состояние группы роботов задается вектором О^) =< ), R2(t),..., Rk ) >, где состояние робота в момент времени 1 Я = [ pu ), p2г (0,..., pzг (^]г, pxг - переменные состояния ьробота.
Задача группового управления роботами в интервале [^, te ], с учетом действий Л1 ^) для каждого робота группы Я е О при которых удовлетворятся все связи внутри коллектива, ограничения и условия, представляется в виде экстремума: Е =Ф(Б.,th) + I Т(Б ),О (t),С^),t)dt,
•^о
где Б*. - множество допустимых в момент времени 1 состояний робот-среда, Ог ^) - множество допустимых действий в момент времени 1;, С^) -
множество сил действующих в среде.
Специфика группового управления создаёт необходимость обмена информацией между участниками группы и задействование режима многоцелевого сопровождения с четкой идентификацией изменений.
Каждому участнику требуется постоянная осведомлённость как о своих «соседях», так и о поставленных целях - для решения данной задачи используется многоцелевой режим сопровождение. Проблема многоцелевого режима сопровождения заключается в достаточно большом интервале времени между поступающими сигналами измерений от одной цели, тогда как сигналы управления должны формироваться беспрерывно. Следует
отметить, что способ обработки поступающих сигналов в известных алгоритмах оценивания при одновременной обработке является нерентабельным, т.к. время обработки сигналов каждым датчиком различно, а также расположение в пространстве участников влияет на время поступления сигнала.
К основным проблемам группового управления следует отнести -проблему обмена информациями между участниками группы, так же следует отдельно отметить задействование режима многоцелевого сопровождения с четкой идентификацией изменений [19,20].
Предлагаемый подход к организации информационного обмена в группе
роботов
Эпидемические алгоритмы распространились, как эффективное средство распространения данных в больших системах . В дополнение к присущей им масштабируемости они отказоустойчивы и легко развертываются. Алгоритм легко настраивается для достижения высокой надежности, пакеты будут передаваться независимо от нестабильной сети, отключая процессы. Алгоритм имитирует распространение заразной болезни, подобно тому, как люди заражают других людей, и алгоритм передает свои данные неинфицированным объектам.
В первоначальном варианте использования эпидемического алгоритма все объекты находятся в режиме восприятия - узлы не знают статусы текущего сообщения, но есть возможность его получить. После получения сообщения происходит смена режима на режим заражения - узел начинает рассылку сообщений другим незараженным узлам в области действия сети. Существует 3 возможных варианта связи между агентами эпидемических алгоритмов:
- принятие инфекции. Опрос зараженных узлов на наличие новой информации. При наличии таковой происходит передача данных (см. рис.3);
Точка в радиусе видимости
Заражение
Рис.3. - Принятие инфекции. - передача инфекции. Алгоритм выбирает узел получения и производит передачу имеющейся информации. В этом случае инфекционные узлы инициируют передачу информации на незараженные объекты (см. рис.4);
Точка в радиусе видимости
Заражение
Рис.4. - Передача инфекции. - комбинированный. Между узлами поддерживается связь, при которой каждый участник готов как к передаче информации, так и к двусторонней передаче (см. рис.5);
Точка в радиусе видимости
Заражение
Рис.5. - Комбинированный алгоритм.
Случайность и возможность повторного заражения - основные причины надежности и безопасности эпидемических алгоритмов. Для организации функционирования алгоритма требуется ограничить количество возможных повторов заражения, для регулирования количества передаваемых сообщений в системе. Все описанные выше алгоритмы имеют возможность определить, когда прекратить передачу сообщений.
В модели «заражения и смерти» [21] узел передает каждое полученное сообщение только один раз, отбрасывая возможные копии этого сообщения, полученные позже. Есть также модели:
- с использованием счетчика на каждом узле, который увеличивает свой параметр после создания новых сообщений, в то время как это сообщение отправляется через дерево узлов с адресом и местом счетчика отправителя. Узлы дерева требуют сообщения, которое они еще не получили.
- с использование контролируемой случайности отправки сообщений вместо полной случайности, увеличивающей вероятность выбора цели ближе к иерархии узлов.
Реализация эпидемических алгоритмов требует некоторых ограничений:
- отслеживание заражения - робот должен понимать, что он уже «заражен» и не получать сообщения от других
- осведомленность о сети - коллектив должна знать количество участников в группе и на каком расстоянии они находятся друг от друга. Кроме того, топология сети должна поддерживать приемлемую производительность для передачи сообщений.
Осведомленность о сети - это фундаментальная проблема при реализации эпидемических алгоритмов. Поскольку «зараженный» объект может пересылать сообщения только известным ему объектам, которые позже сообщают об их статусе «заражение».
Внедрение и распространение эпидемии в большой группе роботов, требует полной децентрализации, для создания одноранговой сети.
Применительно к задаче информационного взаимодействия коллектива роботов алгоритм действий одного члена группы с использованием эпидемического подхода можно представить в виде блок-схемы, см. рис. 6.
Рис.6. - Алгоритм действий робота с использованием эпидемического
алгоритма.
Программное моделирование
Для изучения проблемы создания коалиции в условиях ограниченных коммуникаций было разработано программное обеспечение для проведения компьютерного моделирования. Серия программных экспериментов позволила получить приблизительное количество шагов для оповещения членов группы.
В ряде экспериментов пространственные размеры группы роботов могут превышать диапазон телекоммуникационных систем. В этом случае
вам необходимо ретранслировать пакеты на удаленные устройства, для этого вы можете использовать существующие методы маршрутизации [22-24]. Для передачи данных между «зараженным» устройством и остальной частью группы было решено использовать эпидемические алгоритмы. Смотри рис. 7.
Высокий уровень заражения видимыми агентами организован за счет повторной передачи информации, что позволяет не беспокоиться о локальной плотности и подавлении. В то же время существует ограничение неактивного доступа, поскольку сетевые узлы не являются индивидуально адресуемыми.
Рис.7. - Передача данных «один - всем». Передача сообщений с использованием эпидемического алгоритма. Черные окружности обозначают зону прямой связи, цветные стрелки - направление передачи сообщения.
В таблице 1 приведены результаты моделирования программного обеспечения для различного количества роботов в группе, показывающие обмен информацией в команде. В результате при указании небольшого радиуса взаимодействия и значительного удаления роботов на карте некоторые члены группы не были связаны с остальной частью команды.
Таблица 1.
Результаты передачи информации с использованием эпидемического алгоритма - среднее количество этапов заражения.
Количество роботов в группе 5 10 15
Диапазон видимости робота 300 350 400 300 350 400 300 350 400
Среднее количество шагов для «заражения» - 2.2 2.1 - 2.8 3.1 3.8 3.6 3.5
Выводы
Взаимодействие группы роботов при ограниченных коммуникациях, перспективный предмет для развития робототехники. Результаты программного моделирования показывают целесообразность использования эпидемического алгоритма для практического применения в задачах такого плана. В ходе дальнейшей работы необходимо более детально изучить возможности расширения сетей взаимодействия между членами команды, повышая энергозатратность, стоит обратить внимание на планирование и распределение целей в группах мобильных роботов. Также нельзя не отметить высокую нагрузку на сеть, созданную с помощью эпидемического алгоритма одновременной отправки большого количества пакетов по разным адресам.
Благодарность
Отчетное исследование финансировалось РФФИ в соответствии с исследовательским проектом №17-29-07054, №18-07-00050.
Литература
1. Kaliaev I., Kapustjan S., Ivanov D. Decentralized control strategy within a large group of objects based on swarm intelligence 2011. pp. 299-303.
2. Alami R. [и др.]. Multi-robot cooperation in the MARTHA project // IEEE Robotics & Automation Magazine. 1998. № 1 (5). pp. 36-47.
3. Sahin E. Swarm robotics: From sources of inspiration to domains of application 2004. pp. 10-20.
4. Seyfried J. [и др.]. The I-SWARM project: Intelligent small world autonomous robots for micro-manipulation 2004. pp. 70-83.
5. Smith S.L., Schwager M., Rus D. Persistent robotic tasks: Monitoring and sweeping in changing environments // IEEE Transactions on Robotics. 2012. № 2 (28). pp. 410-426.
6. Bashyal S., Venayagamoorthy G.K. Human swarm interaction for radiation source search and localization 2008. pp. 1-8.
7. Cross M., Campbell T. Mobile robot for telecommunication : U.S. Patent No. 8265793 - 2012.
8. Bernard M. [и др.]. Autonomous transportation and deployment with aerial robots for search and rescue missions // Journal of Field Robotics. 2011. № 6 (28). pp. 914-931.
9. Davids A. Urban search and rescue robots: from tragedy to technology // IEEE Intelligent systems. 2002. № 2 (17). pp. 81-83.
10. Капустян С.Г., Гайдук А.Р., Шаповалов И.О. Алгоритм управления движением группы мобильных роботов в условиях неопределенности // Инженерный вестник Дона, 2018, №3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5221.
11. Чачхиани Т.И., Серова М.Г. Мобильный робот в нестационарной среде // Инженерный вестник Дона, 2017, №4. URL: ivdon.ru/ru/magazine/archive/n4y2017/4546.
12. McLurkin J., Smith J. System and methods for adaptive control of robotic devices : U.S. Patent No 7117067 - 2006.
13. Solomon N. System, methods and apparatus for coordination of and targeting for mobile robotic vehicles : U.S. Patent Application No. 10421502 -2004.
14. Solomon N. System, method and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system : U.S. Patent No 7343222 - 2008.
15. Pallottino L. [h gp.]. Decentralized cooperative policy for conflict resolution in multivehicle systems // IEEE Transactions on Robotics. 2007. № 6 (23). pp. 1170-1183.
16. Savkin A. V, Teimoori H. Decentralized navigation of groups of wheeled mobile robots with limited communication // IEEE Transactions on Robotics. 2010. № 6 (26). pp. 1099-1104.
17. Kureichik V.M., Kazharov A. Using fuzzy logic controller in ant colony optimization. Springer, 2015. pp. 151-158.
18. Pape C. Le A combination of centralized and distributed methods for multiagent planning and scheduling 1990. pp. 488-493.
19. Dong W. Tracking control of multiple-wheeled mobile robots with limited information of a desired trajectory // IEEE transactions on robotics. 2012. № 1 (28). pp. 262-268.
20. Ren W., Atkins E. Distributed multi-vehicle coordinated control via local information exchange // International Journal of Robust and Nonlinear Control. 2007. № 10-11 (17). pp. 1002-1033.
21. Eugster P.T. [h gp.]. Epidemic information dissemination in distributed systems // Computer. 2004. № 5 (37). pp. 60-67.
22. Das J. [h gp.]. Devices, systems, and methods for automated monitoring enabling precision agriculture 2015. pp. 462-469.
23. Li J. [и др.]. Study on ZigBee network architecture and routing algorithm 2010. V2--389 p.
24. Skrzypczyk K. Game theory based target following by a team of robots 2004. pp. 91-96.
References
1. Kaliaev I., Kapustjan S., Ivanov D. 2011 IEEE 5th International Conference on Robotics, Automation and Mechatronics (RAM). IEEE, pp. 299-303.
2. Alami R. et al. IEEE Robotics & Automation Magazine. 1998. № 1 (5). pp. 36-47.
3. Sahin E. International workshop on swarm robotics. Springer, Berlin, Heidelberg, 2004. pp. 10-20.
4. Seyfried J. et al. Springer, Berlin, Heidelberg, 2004. pp. 70-83.
5. Smith S.L., Schwager M., Rus D. IEEE Transactions on Robotics. 2012. № 2 (28). pp. 410-426.
6. Bashyal S., Venayagamoorthy G.K. 2008 IEEE Swarm Intelligence Symposium. IEEE, 2008. pp. 1-8.
7. Cross M., Campbell T. Mobile robot for telecommunication : U.S. Patent No. 8265793 - 2012.
8. Bernard M. et al. Journal of Field Robotics. 2011. № 6 (28). pp. 914-931.
9. Davids A. IEEE Intelligent systems. 2002. № 2 (17). pp. 81-83.
10. Kapustyan S.G., Gajduk A.R., SHapovalov I.O. Inzenernyj vestnik Dona (Rus), 2018, №3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5221
11. CHachkhiani T.I., Serova M.G. Inzenernyj vestnik Dona (Rus), 2017, № 4. URL: ivdon.ru/ru/magazine/archive/n4y2017/4546
12. McLurkin J., Smith J. System and methods for adaptive control of robotic devices : U.S. Patent No 7117067 - 2006.
13. Solomon N. System, methods and apparatus for coordination of and targeting for mobile robotic vehicles: U.S. Patent Application № 10421502. 2004.
14. Solomon N. System, method and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system: U.S. Patent № 7343222 - 2008.
15. Pallottino L. et al. IEEE Transactions on Robotics. 2007. № 6 (23). pp. 1170-1183.
16. Savkin A. V, Teimoori H. IEEE Transactions on Robotics. 2010. № 6 (26). pp.1099-1104.
17. Kureichik V.M., Kazharov A. Artificial Intelligence Perspectives and Applications. Springer, Cham, 2015. pp. 151-158.
18. Pape C. Le Proceedings., IEEE International Conference on Robotics and Automation. IEEE, 1990.. pp. 488-493.
19. Dong W. IEEE transactions on robotics. 2012. № 1 (28). pp. 262-268.
20. Ren W., Atkins E. International Journal of Robust and Nonlinear Control. 2007. № 10-11 (17). pp. 1002-1033.
21. Eugster P.T. et al. Computer. 2004. № 5 (37). pp. 60-67.
22. Das J. et al. 2015 IEEE International Conference on Automation Science and Engineering. IEEE, 2015.. pp. 462-469.
23. Li J. et al. 2010 2nd International Conference on Signal Processing Systems. IEEE, 2010.. V2-389 p.
24. Skrzypczyk K. Proceedings of the Fourth International Workshop on Robot Motion and Control. IEEE, 2004. pp. 91-96.