Рубинович Евгений Яковлевич - Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук; e-mail: rubinvch@ipu.rssi.ru; 117997, г. Москва, ул. Профсоюзная, 65; тел.: +74953349111; зам. директора по научной работе; д.т.н.; профессор.
Rubinovich Evgeny Yakovlevich - Trapeznikov Institute of Control Sciences, Russian Academy of Sciences; e-mail: rubinvch@ipu.rssi.ru; 65, Profsoyuznaya street, Moscow, 117997, Russia; phone: +74953349111; deputy director on R&D; dr. of eng. sc.; professor.
УДК 355/359
О.Ю. Аксёнов, Ф.Ф. Дедус, В.Б. Ларюхин, И.В. Майоров, С.П. Морозов, П.О. Скобелев, Д.Ю. Убоженко, В.Н. Федюнин
МОДЕЛИРОВАНИЕ ПРОЦЕССОВ УПРАВЛЕНИЯ РЕСУРСАМИ МОНИТОРИНГА КОСМИЧЕСКОГО ПРОСТРАНСТВА В МУЛЬТИАГЕНТНОЙ СРЕДЕ
Обосновывается целесообразность проведения комплексного моделирования в интересах создания и эффективной настройки мультиагентной системы (МАС) управления перспективными информационными ресурсами мониторинга космического пространства. Представлены принципиальные основы построения комплексной модели, выполняющей поставленные задачи. Рассматривается структура и функции основных компонент муль-тииагентной среды для создания прикладных систем моделирования процессов управления ресурсами для мониторинга космического пространства, включая мультиагентную платформу, адаптивный планировщик, конструктор онтологий, моделей и сцен, сцену миру, базу данных, интерфейс пользователя и другие компоненты. Показываются также особенности метода решения задач, основных классов агентов и логики работы агентов системы, компонент интерфейса пользователя. Обсуждается разрабатываемый прототип мультиагентной платформы, который состоит из редактора начальной сцены, генератора событий, очереди событий с заданием их классов, моментов их появления и поступления в систему, мира агентов (движка системы), базовых классов агентов и протоколов переговоров, визуальных компонент для редактирования параметров агентов и их отображения, экспорта и импорта данных, подсистемы логирования и трекинга сообщений и финансовых счетов агентов, а также некоторых других вспомогательных компонент. Предлагается подход к разработке специального аппарата диагностики и оценки эффективности функционирования применяемой МАС.
Мультиагентная среда; моделирование; информационные ресурсы мониторинга космического пространства; принятие решений; распределение ресурсов.
O.U. Aksyonov, F.F. Dedus, V.B. Laryukhin, I.V. Mayorov, S.P. Morozov,
P.O. Skobelev, D.U. Ubozhenko, V.N. Fedyunin
MODELLING OF RESOURCE ALLOCATION FOR SPACE MONITORING IN MULTI-AGENT SIMULATOR
In this paper the decision making process of allocation of resources for space monitoring is specified and discussed. The concept, architecture and functionality of multi-agent simulation system for modelling decision making process of allocation of resources is presented. The basic principles of the development of computerized models of resource allocation are introduced. The key components of multi-agent simulator are presented. One of the main components is multiagent scheduler which is able to re-schedule plans of resources in case of unforeseen events. Multi-agent scheduler is ontology-based for customization of agents logic for problem domain specifics. The developed prototype of simulator is discussed which contains scene editor, event generator, event queue, basic classes of agents and protocols of their negotiations, visual components for
editing attributes of agents and their visualization, import and export of data, logging system and messages tracking, as well as some other components. Method of estimating of resource allocation efficiency is suggested.
Multi-agent system; modeling; allocation of resources; space monitoring; decision-making; real time.
Повышение уровня обороноспособности страны, предусмотренное планами военного строительства на ближайшую перспективу, существенным образом обеспечивается за счет наращивания возможностей контроля обстановки в околоземном космическом пространстве и оценки степени ее военной опасности. Это, в свою очередь, достигается дальнейшим развитием отечественной системы контроля космического пространства (СККП) и ее информационных ресурсов.
Однако простое увеличение группировки средств, осуществляющих наблюдения за космическими объектами (КО), не позволит получить полного эффекта от появления новых ресурсов. Дело в том, что все создаваемые специально для СККП средства являются управляемыми, т.е. их работа планируется централизованно на командном пункте системы. Поэтому для использования увеличенных информационных возможностей СККП в полной мере необходимо создание новой системы управления сбором информации, основанной на применении наиболее совершенных и прогрессивных технологий решения подобных задач.
Ранее уже предлагалось использовать для этих целей мультиагентые системы управления (МАС), как наиболее эффективные на сегодняшний день при решении задач динамического распределения реcурсов [1]. Учитывая сложность, существенную специфику создания такой системы управления, а также отсутствие должного опыта применения МАС для этих целей целесообразно предварительно провести комплексные исследования открывающихся возможностей и выбора среди них наиболее рациональных и эффективных.
Наилучшим образом для этого в методическом плане подходит проведение исследований на специально созданных средствах имитационного моделирования. Практика проведения подобных исследований в интересах создания и испытания сложных систем РКО насчитывает уже более пяти десятилетий.
Задача планирования использования информационных ресурсов в СККП предполагает выдачу заданий пространственно распределенным информационным средствам на наблюдение различных КО, находящихся на околоземных орбитах. При этом под наблюдением понимается получение по сопровождаемому в зоне средства объекту координатной и некоординатной информации, обеспечивающей его инвентаризацию в главном каталоге системы (ГКС). Чтобы оценить степень сложности поставленной задачи нужно иметь ввиду, что количество наблюдаемых таким образом КО может достигать тысячи, а состав информационных средств может насчитывать несколько десятков.
Структурная схема модели решения данной задачи представлена на рис. 1.
Блок формирования исходных данных (ИД) по группировке наблюдательных средств (НС) выдает планировщику, построенному на принципах мультиагентной технологии (далее МАС-планировщик), информацию по возможностям и характеристикам функционирования каждого заданного НС (координаты точки стояния, зона действия, состав и качество получаемой информации, условия выполнения наблюдений КО, надежностные характеристики и др.).
Блок формирования ИД по наблюдаемым КО выдает МАС-планировщику по каждому обслуживаемому КО информацию для организации его наблюдения (состав и качество необходимой для контроля данного КО информации, параметры орбит и ошибки их оценки, приоритет обслуживания, условия видимости и др.).
Блок ИД по ситуационным сценариям формирует для каждого задействованного в выполнении наблюдений КО средства состав, временной интервал и характеристики событий, способных повлиять на возможность его функционирования. Это позволяет оценивать реакцию МАС-планировщика на те или иные реальные внешние воздействия, требующие оперативной корректировки рассчитанного плана (изменение астроклиматических условий, возможные сбои в работе НС и др.).
Модель
выполнения
плана
Итоговая оценка и
отображение
качества
планирования
Рис. 1. Структурная схема модели
МАС-планировщик по указанным формализованным исходным данным и на основании представленной ниже тактики работы мультиагентной системы производит расчет наиболее рационального плана наблюдения заданных КО. Эти данные являются для планировщика внешними, т.е. не учитывают и не зависят от особенностей его построения. Манипулируя ими можно проводить сравнительный анализ работы того, или иного конкретного планировщика в зависимости от изменения параметров полей потребностей, ресурсных возможностей или условий выполнения необходимых наблюдений.
Использование мультиагентных технологий при решении задачи динамического распределения информационных ресурсов обусловлено тем, что они реализуют адаптивные методы и средства распределения ресурсов, планирования, со-
гласования, оптимизации, мониторинга и контроля исполнения планов в реальном времени, когда планы не строятся заново, а лишь постоянно адаптивно корректируются и перестраиваются по поступающим событиям или по мере их выполнения. В этих целях, в качестве методического подхода применяются сети потребностей и возможностей (ПВ-сети), которые позволяют выстраивать взаимодействия для получения согласованного по разным критериям решения, иными словами, поиск решения по одной целевой функции заменяется переговорами для достижения баланса интересов между многими разными целевыми функциями [2-5].
Структура мультиагентной системы-планировщика предполагает использование следующих основных взаимодействующих элементов:
♦ исполняющая система - представляет собой диспетчер агентов, передающий квант времени каждому агенту, представляющему собой машину состояний, по заданной дисциплине, с необходимыми сервисами передачи сообщений, сохранения состояний и т.д.;
♦ подсистема адаптивного планирования - компоненты для поддержки работы ПВ-сетей и методов адаптивного планирования, выполняющая динамическое планирование по событиям и при необходимости контроль работы ресурсов в реальном времени (например, одного из средств обслуживания);
♦ мир агентов - компоненты, обеспечивающие работу конкретных агентов в системе, включая базовых и специализированных агентов ПВ-сети (задач, ресурсов, операций и др.), использующих информацию из онтологии мира и сцены данных в заданный момент времени;
♦ онтология - структура данных (классы объектов и отношений), содержащая знания (модель мира) предметной области в формализованном виде, отделенном от программного кода и доступном для пополнения и редактирования специалистами;
♦ сцена мира - структура данных (сеть экземпляров объектов), отражающая ситуацию в реальном мире, сформированный и текущий исполняемый план действий в заданный момент времени;
♦ конструктор онтологий, моделей и сцен - позволяет создавать онтологии предметной области и на их основе формировать концептуальные модели рассматриваемых объектов и их сцены состояния в заданный момент времени;
♦ база данных - база для хранения начальных, промежуточных и конечных результатов работы системы;
♦ интерфейс пользователя - компоненты для ввода и отображения данных, а также коммуникации с пользователями, включая средства наглядной визуализации состояний объектов и процессов, отчеты и т.д.;
♦ специализированные компоненты - подсистемы (инструменты), характерные для каждой предметной области;
♦ интеграционные компоненты - компоненты для приема и передачи данных из внешних систем.
Важнейшей компонентой рассматриваемой системы является конструктор для работы с онтологиями, моделями и сценами, позволяющий создавать модели предметной области, которые используются агентами для решения поставленных задач.
Для распределения наблюдений объектов между имеющимися средствами создаются программные агенты, целью которых является оптимизация целевых параметров, например, обслуживание объекта необходимо выполнить как можно быстрее и с минимальной условной ценой, тогда как ресурс (средство обслужива-
ния) - должен быть максимально эффективно использован и не иметь простоев или перегрузок. Агенты делают это первоначально «эгоистично» (автономно), никого не спрашивая и потому очень быстро, если ресурсы свободны, но наталкиваясь на решения других агентов и выявляя конфликты - вступают в переговоры, идут на уступки и добиваются согласованного решения (консенсуса) в интересах объединяющего их целого (выполнить обслуживание всех объектов с заданным качеством за минимальное время).
Работу МАС-планировщика целесообразно строить на основе гомеостатического подхода для решения задачи многокритериальной оптимизации. В предлагаемом подходе система сама, отталкиваясь от достигнутых показателей и текущей ситуации с задачами и ресурсами, выбирает себе цели для улучшения вектора своих параметров, и в качестве первоочередной цели для улучшения своего состояния берет тот критерий, по которому имеется наиболее худшие значения показателей.
Гомеостатическая модель принятия решений формируется на следующих принципах:
1. Каждый агент задач имеет идеальные и текущие значения показателей критериев (компонент вектора целевых функций), по которым рассчитывается “удовлетворенность” агента текущим планом.
2. В системе задаются динамические величины весовых коэффициентов ска-ляризации целевой функции виртуального денежного эквивалента. Каждый показатель имеет свой коэффициент пересчета в виртуальные деньги, которые определяют способности агентов изменять расписание в свою пользу.
3. Общее решение системы рассчитывается агентом системы на основе решений отдельных агентов, имея информацию о том, какой из агентов лучше или хуже добился результатов по каждому своему критерию.
4. Каждый показатель (критерий) имеет свой коэффициент пересчета в виртуальные деньги, обеспечивая бонусы и штрафы за достижение своего идеального значения.
5. Каждый агент постоянно рассчитывает свой текущий виртуальный бюджет, который используется для улучшения локального места в расписании данного агента задачи или ресурса.
6. Виртуальный бюджет в каждый момент используется для устранения отклонений показателей от идеальных значений, для чего может использоваться как вся прибыль агента или кредит, который он может получить у агента системы, с учетом текущей ситуации.
7. Бюджет расходуется агентом на улучшение критерия, который в данный момент имеет наихудшее значение.
8. Итерационно агенты работ “подтягивают” свои критерии к локальнооптимальным значениям, компенсируя убытки других агентов за счет своего собственного бюджета (прибыли) или кредита от системы.
9. В зависимости от величины текущего показателя компоненты целевой функции агента задачи имеют характерный вид (может быть различным по форме для разных компонент вектора) с максимумом в оптимальном значении. Чем резче пик, тем больше чувствительность критерия к отклонениям от оптимума, чем шире основание - тем слабее зависит функция от неоптимального значения, и расписание меньше зависит от деталей решения в разрезе данной компоненты. Варьируя через пользовательский интерфейс формой и параметрами данной функции, можно увеличивать и уменьшать подвижность агентов по определенным критериям.
10. В каждом акте взаимодействия агентов работ (переговорах) агент определяет значения своей целевой функции и бюджет по текущему состоянию. Бюджет расходуется на перестройку расписания, но может и пополняться за уступки другим агентам. Чем ближе состояние к оптимуму, тем выше удовлетворенность агента, и, возможно, тем меньше средств ему еще потребуется для достижения идеала, и одновременно, его активность в этом движении может быть меньше. Чем дальше показатель от оптимума, тем возможно больше средств потребуется агенту, которые он может использовать на компенсации, и тем чаще он должен получать активность. Поэтому активность такого агента обычно выше и он требует больше «энергии» - виртуальных денег, которые агент расходует на улучшение показателей. Таким образом, каждый акт взаимодействия может рассматриваться как акт купли-продажи лучшего положения в расписании с использованием бюджетных ресурсов агента.
При всей своей привлекательности система планирования, построенная на указанных принципах - это сложная многофакторная система, получающая окончательное решение через значительное количество переговоров и итераций. Поэтому, чтобы раскрыть все заложенные в нее возможности требуется не только корректное формирование указанных компонент и описаний, но и весьма существенный объем работ по их настройке, возможно в дальнейшем - авто настройки системы (саморегуляции). С этой целью необходимо создание специальной программной платформы диагностики и оценки качества работы МАС-планировщика (далее - платформы).
Разрабатываемый прототип мультиагентной платформы состоит из редактора начальной сцены, генератора событий, очереди событий с заданием их классов, моментов их появления и поступления в систему, мира агентов (движка системы), базовых классов агентов и протоколов переговоров, визуальных компонент для редактирования параметров агентов и их отображения, экспорта и импорта данных, подсистемы логирования и трекинга сообщений и финансовых счетов агентов, а также некоторых других вспомогательных компонент.
На рис. 2 показаны (слева направо) окна с представлением сети ресурсов (два в данном случае), Гант-Чарт диаграмма использования ресурсов заказами, загрузка ресурсов, степень удовлетворенности заказов и ресурсов и некоторые другие характеристики.
Рассмотрим работу платформы на простых примерах.
Пусть имеется два ресурса обслуживания, на которые поступает поток заказов с требованиями обслуживания по срокам выполнения. Со временем, свободного места в расписании остается мало и на 20 секунде добавляется новый ресурс на обслуживание поступающих заказов. Далее, и он заполняется почти полностью, после чего на 28 секунде добавляется еще один ресурс. Заказы продолжают прибывать, и уже в системе накапливаются некорректно запланированные заказы, и даже незапланированные, получившие отказ в обслуживании в связи с недостатком ресурсов. На 50 секунде пусть отменяется 20 заказов, тогда почти все незапланированные заказы сразу находят себе места в расписании. На 55 секунде отменяется еще 20 заказов, после чего, на 60-й секунде отключается 4-й ресурс, так как у него остается мало работы, и его незапланированная работа перераспределяется между оставшимися. Еще через 5 секунд отключается еще один ресурс по той же причине, и его заказы также перераспределяются.
Показывается, что система может адаптивно реагировать на происходящие изменения в плане, оперативно подстраивая план для уменьшения негативного эффекта от изменений. Активность переговоров агентов меняется и по ней можно судить об общем состоянии системы, о том, как она в данный момент работает, насколько загружена и т.д.
Рис. 2. Общий вид интерфейса платформы
На графике баланса виртуальных бюджетных средств можно видеть увеличение виртуального баланса ресурсов, которые зарабатывают средства путем продажи своего свободного места заказам, и наоборот, как используют заказы свои бюджеты на захват наиболее подходящих ресурсов.
График удовлетворенности агентов ресурсов системы показывает, как система уменьшает их отклонения от идеала, причем как после внесения малых, так и больших возмущений. Например, на 40 единице модельного времени было крупное возмущение, с которым система все-таки справилась за время порядка 10 единиц модельного времени.
Аналогичный график для агентов заказов, который показывает адаптацию системы под изменения. Например, на 42 единице модельного времени было большое возмущение, которое привело к большому падению удовлетворенности (и виртуальной прибыли), но система смогла «отыграть» назад около половины падения, причем очень быстро. На 46 единице модельного времени также было внесено изменение, которое ухудшило ситуацию, но было смягчено, хотя не так хорошо и не так успешно (но тут уже ушло лишь около 3-4 единиц модельного времени).
На графике загрузки системы можно наблюдать происходящие изменения по загрузке ресурсов заказами.
Здесь также можно наблюдать изменения суммы значений целевых функций агентов системы и видеть адаптивную реакцию на ухудшающееся состояние системы - после очередного раунда переговоров агентов суммарное состояние системы улучшается.
В настоящее время платформа уже использована для быстрого построения прототипов новых мультиагентных систем управления ресурсами для вычислительных и энергетических сетей, управления проектами, производственного планирования и некоторых других.
Первый опыт показывает, что разработанная платформа позволяет в 3-4 раза ускорить разработку систем, что особенно важно для промышленных разработок рассматриваемых систем.
Если спланировать заданное обслуживание все же не удается, то выдается соответствующее сообщение и при необходимости продолжения работы с изменением ресурсных возможностей управление передается на блок эволюционного дизайна, который на основании выбранных предпочтений по изменениям вырабатывает соответствующие предложения. Такими предпочтениями могут быть следующие:
1. Увеличение группировки наблюдательных средств на основании выбранной тактики. Например, дополнить группировку аналогичными уже указанным средствами.
2. Передислокация средств обслуживания (изменение географических координат).
3. Увеличение зоны обслуживания для выбранного средства.
4. Изменение временных параметров подготовки и переподготовки средства к наблюдению.
Если предложения будут приняты, МАС-планировщик может приступить к корректировке плана обслуживания на принятых условиях.
По окончании построения плана выдается соответствующая информация с основными результатами планирования и оценками показателей работы планировщика.
Модель выполнения плана включается по команде оператора и в соответствии с заданными ситуационными сценариями должна промоделировать запланированные прохождения КО через зоны НС. С этой целью используются специальные имитационные модели работы информационных средств ККП. Последние не являются предметом данного рассмотрения. Они разработаны, откалиброваны и имеется определенный опыт их эксплуатации.
Блок анализа и отображения результатов выполнения плана производит указанные действия и выдает итоговую информацию в формализованном виде и в базу данных МАС-планировщика.
Вывод. Мультиагентные технологии за последние годы становятся все более популярными благодаря высокой эффективности решения задач, ранее трудно решаемых или вообще не решаемых в полностью автоматическом режиме. Сейчас они уже достаточно широко применяются и получили успешную апробацию при реализации различных проектов в коммерческой и производственнохозяйственной сферах.
Рассмотренные предложения можно отнести к первым шагам применения мультиагентных технологий в области укрепления обороноспособности для создания сложных систем вооружения и военной техники. Причем речь идет уже не о целесообразности их использования, а о том как это сделать наиболее технологично и эффективно.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Аксёнов О.Ю., Дедус Ф.Ф., Морозов С.П., Скобелев П.О. О применении мультиагентных технологий для решения актуальных задач развития системы контроля космического пространства // Сборник материалов Восьмой Всероссийской научно-практической конференции «Перспективные системы и задачи управления». - 2013. - С. 14-22.
2. Скобелев П.О. Открытые мультиагентные системы для оперативной обработки информации в процессах принятия решений // Автометрия. - 2002. - № 6. - С. 45-61.
3. Виттих В.А., Скобелев П.О. Метод сопряженных взаимодействий для управления распределением ресурсов в реальном масштабе времени // Автометрия. - 2009. - № 2. - С. 78-87.
4. Скобелев П.О. Мультиагентные технологии в промышленных применениях: к 20-летию основания Самарской научной школы мультиагентных систем // Мехатроника, автоматизация, управление. - 2010. - № 12. - С. 33-46.
5. Скобелев П.О. Интеллектуальные системы управления ресурсами в реальном времени: принципы разработки, опыт промышленных внедрений и перспективы развития // Приложение к теоретическому и прикладному научно-техническому журналу «Информационные технологии». - 2013. - № 1. - С. 1-32.
Статью рекомендовал к опубликованию д.т.н., профессор В.А. Виттих.
Аксёнов Олег Юрьевич - Научно-исследовательский центр Ракетно-космической обороны 4 ЦНИИ Минобороны России; e-mail: skobelev@smartsolutions-123.ru; 129345, г. Москва, ул. Осташковская, 12А; тел./факс: 84991841900; начальник центра; д.т.н.; профессор.
Морозов Сергей Петрович - старший научный сотрудник; к.т.н.
Убоженко Дмитрий Юрьевич - начальник управления; к.т.н.; доцент.
Федюнин Василий Николаевич - научный сотрудник.
Дедус Федор Флоренцевич - Федеральная служба по оборонному заказу; г. Москва, Уланский пер., 16; зам. директора; к.т.н.
Скобелев Пётр Олегович - Научно-производственная компания «Сетецентрические платформы»; e-mail: skobelev@smartsolutions-123.ru; 443013, г. Самара, Московское шоссе, 17, (ТОЦ «Вертикаль»), офис 1201; тел./факс: 88462793779; генеральный конструктор; д.т.н.
Майоров Игорь Владимирович - e-mail: imayorov@smartsolutions-123.ru; старший разработчик.
Ларюхин Владимир Борисович - e-mail: laryukhin@smartsolutions-123.ru; директор по разработкам.
Aksyonov Oleg Yur'evich - The 4th Central Research Institute of the Russian Defense Ministry; e-mail: skobelev@smartsolutions-123.ru; 12A, Ostashkovskaya street, Moscow, 129345, Russia; fax/phone: + 74991841900; dr. of eng. sc.; director; professor.
Morozov Sergey Petrovich - senior researcher; cand. of eng. sc.
Ubozhenko Dmitri Yur’evich - managing director; cand. of eng. sc.; associate professor. Fedyunin Vasily Nikolaevich - researcher.
Dedus Fedor Florencevich - Federal Service for Defense Contracts; 16, Ulansky per., Moscow, Russia; deputy director; cand. of eng. sc.
Skobelev Petr Olegovich - Software Engineering Company «Network-centric platforms», Ltd; e-mail: skobelev@smartsolutions-123.ru; 443013, 17 Moscovskoe Shosse, office center “Vertikal”, office 1201, Samara, Russia; phone/fax: + 78462793779; director; professor.
Mayorov Igor Vladimirovich - e-mail: imayorov@smartsolutions-123.ru; senior researcher.
Laryukhin Vladimir Borisovich - e-mail: laryukhin@smartsolutions-123.ru; director of developments.
УДК 004.5:004.9:007.52
С.В. Манько, Р.И. Александрова, С.А.К. Диане
ЧЕЛОВЕКО-МАШИННЫЙ ИНТЕРФЕЙС ДЛЯ МУЛЬТИАГЕНТНЫХ РОБОТОТЕХНИЧЕСКИХ СИСТЕМ
Предложены принципы построения человеко-машинного интерфейса для мультиа-гентных робототехнических систем (МАРС). Разработка удобных и эффективных средств оперативного управления группой роботов предполагает обеспечение комплексной автоматизации и интеллектуализации процессов информационной подготовки МАРС к