Научная статья на тему 'Субоптимальное по быстродействию управление мультиагентными системами с информационными ограничениями'

Субоптимальное по быстродействию управление мультиагентными системами с информационными ограничениями Текст научной статьи по специальности «Математика»

CC BY
120
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИАГЕНТНАЯ СИСТЕМА / РОБАСТНОЕ УПРАВЛЕНИЕ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / КОММУНИКАЦИОННОЕ ЗАПАЗДЫВАНИЕ / ИНФОРМАЦИОННЫЕ ОГРАНИЧЕНИЯ / MULTI-AGENT SYSTEM / ROBUST CONTROL / OPTIMAL CONTROL / COMMUNICATION DELAY / INFORMATION CONSTRAINTS

Аннотация научной статьи по математике, автор научной работы — Фуртат И. Б.

Предложено решение задачи робастного субоптимального по быстродействию управления мультиагентными системами, модели которых описываются нелинейными нестационарными дифференциальными уравнениями с неопределенными параметрами, возмущениями, коммуникационным запаздыванием и возможными информационными ограничениями в каналах измерения. Для компенсации возмущений используется метод вспомогательного контура, который представлен параллельной эталонной моделью для каждого агента системы. Для регистрирования по быстродействию используются классические методы оптимального управления. В результате для расчета оптимального управления можно использовать стандартные пакеты программ, например, MatLab. Приведены результаты моделирования, иллюстрирующие эффективность предложенного алгоритма в условиях неопределенностей, запаздывания и информационных ограничений. Моделирование показало, что точность регулирования может быть повышена за счет увеличения коэффициента усиления в законе управления, уменьшения высокочастотного коэффициента усиления во вспомогательном контуре и увеличения коэффициента обратной связи в наблюдателе.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Suboptimal speed control by multi-agent systems under information constraints

A robust suboptimal control solution of the speed control is proposed for multi-agent systems described by nonstationary nonlinear differential equations with uncertain parameters, disturbances, communication delay, and possible information constraints in the measurement channels. To compensate for disturbances, the method of auxiliary loop method is used with the loop presented by a parallel reference model for each agent. Classical methods of optimal control are used for speed control, and therefore calculation of optimal control may be carried out with the use of standard packages of existing software, e.g. MatLab. Simulation results are presented to demonstrate the effectiveness of the proposed scheme under uncertainties, delay, and information constraints. The results show that the control accuracy can be improved by increasing the gain in the control law, reduce the high frequency gain in the auxiliary loop, and increase the feedback gain of the observer.

Текст научной работы на тему «Субоптимальное по быстродействию управление мультиагентными системами с информационными ограничениями»

ПРИБОРЫ И СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ

УДК 519.7

DOI: 10.17586/0021-3454-2016-59-12-1003-1009

СУБОПТИМАЛЬНОЕ ПО БЫСТРОДЕЙСТВИЮ УПРАВЛЕНИЕ МУЛЬТИАГЕНТНЫМИ СИСТЕМАМИ С ИНФОРМАЦИОННЫМИ ОГРАНИЧЕНИЯМИ

И. Б. Фуртат

Университет ИТМО, 197101, Санкт-Петербург, Россия Институт проблем машиноведения РАН, 199178, Санкт-Петербург, Россия

E-mail: [email protected]

Предложено решение задачи робастного субоптимального по быстродействию управления мультиагентными системами, модели которых описываются нелинейными нестационарными дифференциальными уравнениями с неопределенными параметрами, возмущениями, коммуникационным запаздыванием и возможными информационными ограничениями в каналах измерения. Для компенсации возмущений используется метод вспомогательного контура, который представлен параллельной эталонной моделью для каждого агента системы. Для регистрирования по быстродействию используются классические методы оптимального управления. В результате для расчета оптимального управления можно использовать стандартные пакеты программ, например, MatLab. Приведены результаты моделирования, иллюстрирующие эффективность предложенного алгоритма в условиях неопределенностей, запаздывания и информационных ограничений. Моделирование показало, что точность регулирования может быть повышена за счет увеличения коэффициента усиления в законе управления, уменьшения высокочастотного коэффициента усиления во вспомогательном контуре и увеличения коэффициента обратной связи в наблюдателе.

Ключевые слова: мультиагентная система, робастное управление, оптимальное управление, коммуникационное запаздывание, информационные ограничения

Введение. Компенсация неконтролируемых возмущений является одной из актуальных задач в теории управления. Для ее решения используют два основных подхода. Первый основан на построении инвариантных (нечувствительных к возмущениям) систем управления. Такой подход широко применяется с использованием ^-оптимизации [1 ] или метода вложения систем [2]. Второй подход основан на динамической компенсации возмущений: с целью исключения влияния возмущения на объект управления выполняется оценка возмущений и выбор закона управления. Так, в работах [3—5] возмущения, которые с помощью методов адаптивного и робастного управления компенсируются, представлены системой дифференциальных уравнений. В статье [6] для выделения возмущений вводился вспомогательный контур параллельно объекту. В [7] предложена схема субоптимального робастного управления.

В настоящей статье предлагается алгоритм робастного субоптимального по быстродействию децентрализованного управления мультиагентными системами при измерении только выходных сигналов агентов (объектов). Для выделения возмущений и обеспечения субоптимального

управления в схему параллельно объекту вводится вспомогательный контур. Затем возмущения оцениваются и компенсируются.

Постановка задачи. Пусть каждый агент описывается уравнением

X; (г) = Л; (г)хг. (г) + Б; (г)и (г) + ^; (у (г), у2 (г),..., ук (г), г) N.. (г) +

к _ (1)

+Б; (г)/; (г) + 2 ву (г)ху (г - И]- (г)), у. (г) = ь.х. (г), х. (0) = хо., ; = 1, к,

з=1,; * з

где х. е Я"' — вектор состояния .-го агента; и., / и у. — скалярные вход, внешнее ограни» Г,": ХИ О П" Х„;

ченное воздействие и выход соответственно; элементы матриц Л; е Я ' ;, эгу е Я ' ',

х¥; е Я„Х„ , N е Я„ , Б; е Я" , е Я" — неизвестные функции, Ь; = [1, 0,..., 0]е Я1ХИ ; Из > 0 — коммуникационное время запаздывания з-го (смежного с ;-м) агента; хо; — известные начальные условия; к — количество агентов.

Необходимо синтезировать закон управления, обеспечивающий перевод каждого агента (1) из заданного начального положения у1 (0) в конечное у; (г/) за минимальное время г/ с

достаточно малой погрешностью 5. Будем решать сформулированную задачу при следующих предположениях:

1) элементы матриц Л;, Б;, Б;, N и неизвестны. Известны размерность матриц и множество возможных значений их элементов 2 . Также известны х; (0) = х0; и то, что элементы матриц Л;, Б;, Б;, N и ву — ограниченные функции;

2) выполнены условия: Л; (г ) = Л „; + Б";С[ ^) , ^) = Б„; ф б„{ Т ; ^) , О;" ^) = Б „^; ^) , N2(г) = Б„'■Ю'■ ( г), 8гу(г) = Б^б'(г) где Л„; е Я„X„', Б„; е Я„Xm' — известные номинальные постоянные матрицы, причем собственные числа Л"; не лежат в правой полуплоскости комплексной плоскости, с; (г) е Я„ , (г) е Я„ , т; (г) е Я, ю; (г) е Я и б у (г) е Я„; — неизвестные функции;

3) элементы матрицы ^ ((0, у2(г),..., ук (г), г) удовлетворяют глобальному условию

Липшица, ограничены по г и являются гладкими функциями;

4) объект (1) минимально фазовый и последние элементы векторов Б; и Б„; положительные.

Метод решения. С учетом условий предположения 2 преобразуем уравнение объекта (1) к виду

х; (г) = Л „; х; (г)+б „и (г)+б„ ф; (г), у; (г) = ь^ (г), х, (0) = х0;, (2)

где функция

Ф; (г) = с[ (г )х; (г) + т (г )и (г) +

к

(у1 (г), у2 (г),..., ук (г), г) с (г) + 2 е^ (г)хз (г - И'(г)) + К (г)/ (г)

3=1, I* з

включает в себя все параметрические и функциональные возмущения объекта (1). Рассмотрим уравнение номинального агента (когда в (2) ф; (г) = 0 ):

х;(г) = Лых;(г)+б„и; (г), у;(г) = ьх; (г), х; (0) = х0; . (3)

Пусть в уравнении (3) доступен измерению вектор х,, тогда, согласно, например [8], закон управления и0г-, позволяющий перевести объект (1) из начального положения у, (0) в конечное у, (/р) за минимальное время р, можно определить в виде

% (/) = а,81§п (С (/)) или п0, (/) = а,81§п ((х,)) • (4)

Здесь а, > 0, первое выражение в (4) задает программное управление с функцией времени переключения с, (/), второе обеспечивает управление с обратной связью с функцией переключения о, (х,) в фазовой плоскости.

Учитывая оптимальное управление п^ (4), представим уравнение (3) в виде

х, (/) = А п1 х, (/) + ЪпП01 (/) + Впт (/) + ви, ^ (/), у, (/) = Ь, х, (/), (5)

где ) = ф(/) (/).

Согласно [8], используя (4), переведем объект из начального положения в конечное за минимальное время, если в (2) ф, (/) = 0 . Но по условию задачи на объект (1) действуют неконтролируемые внутренние и внешние возмущения, т.е. ф,(/) ^ 0. Поэтому для выделения этих неопределенностей, как и в работах [6, 7, 9], введем вспомогательный контур

хV,(/) = Ап xvг (/) + Впгп0г (/) + РгВпП (/), Уу1 (/) = Ь^ (/), xvг (0) = х0,, (6)

где в, > 0. Принимая во внимание (5) и (6), составим функцию рассогласования в виде

6, (/) = А п,о, (/) + Вп, р (/), С (/) = Ца, (/), а, (0) = 0, (7)

где а, (/) е — вектор состояния (7), р, (/) = (1 - в,) щ (/) + у, (/). Преобразуем (7) к форме вход—выход

ап1 (рус, (/) = (р)р, (/), (8)

где Qni (р) — линейный стационарный дифференциальный оператор, полученный при переходе от (7) к (8).

Для компенсации возмущений в (1) функцию щ зададим в виде алгоритма

Щ (/) = -в-Ч~/ (РШт (Р)С■ ( 0 = -в--1р■ (/), (9)

где р, ( /) и £, ( — оценки сигналов р, ( /) и ^ ( /) соответственно. Для реализации алгоритма (9) рассмотрим наблюдатель [8]:

4■ ( /) = С0,4 ( /) + Б0,- (С, ( /) - ^ ( 0), С■ ( 0 = Ц4 ( /), (10)

где 4 (0 е Яп', С0, =

0 1 п, -1 0 0

I

п, -1

единичная матрица порядка п, -1.

Б

0,

-1 -2 -п Т

ёцц , ц ,..., ё^ц п , коэффициенты ёц, ^,..., выбираются из условия

гурвицевости матрицы С, = С0, - Б,Ь,, Б, =

, , ..., ёпл

, ц > 0 — достаточно малое

число.

Утверждение 1. Пусть выполнены предположения. Тогда существуют числа в, > 0 и ц0 > 0 такие, что при ц < ц0 система управления (6), (9) и (10) обеспечивает переход каждого агента (1) из начального положения у, (0) в конечное у, (I,) за минимальное время с достаточно малой погрешностью 8.

Доказательство утверждения 1 подобно доказательству утверждения в работах [10—12].

Утверждение 2. Пусть выполнены предположения, утверждение 1, выход каждого агента в (1) доступен измерению с погрешностью §1. Тогда цель управления будет достигнута с погрешностью 8 + 81.

Доказательство утверждения 2 подобно доказательству утверждения в работах [13—15]. Численные исследования. Рассмотрим мультиагентную систему:

" 0 1 ] " 0 ] " 0 0 ]

1 ) = а1(г ) а2(г ) _ Х1(г) + \(г) _ и1( г) + _ г) *2(г) -

((г), Уч($), О

" 0 ] + " 0 ]

п1( г)- _ г)-

*2(' - ^)) + /1( г), У1(о = [1 0]Х1( г);

Х 2( 0 =

0 1

а3( г) а4( г) 0

Х 2( г) +

0

М).

«2( г) +

о о Ы г) г)

(11)

ё2( 0_

0

П2( 0.

Х1( г - /1(0) + У2(0 = [1 о]х2(г).

/2(0 + ^ 2 ((), У2(г), г)

Класс неопределенности Е задан неравенствами: а^ ( г) < 10, 0 < Ь (г) < 10, |ёг- (г) < 10, |пг- (г) < 10, Sj (г) < 20, / (г) < 10, j = 0,4, г = 1,2. Предполагаются известными начальные

условия хТ (0) = [0 0]. Положим, что измерения выходных сигналов агентов квантованы по

уровню. Пусть ошибка квантования сигнала у1 не превышает 0,01, у2 — 0,03.

Синтезируем алгоритм управления, обеспечивающий перевод объекта (11) из начального положения у. (0) = 0 в конечное у1 (г/.) = 1 за минимальное время г. .

Выберем Ап1 =

"0 1 ] "0]

, Впг = и

0 0 1

и сформируем уравнение номинального агента (3) в

виде:

х/(г) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

"0 1 ] "0]

0 0 х,- ( г) + 1

г (г), Ут ( г) = [1 0] х,. (г).

(12)

Согласно принципу максимума Понтрягина [8, пример 10.5], зададим программное оптимальное управление и^ (г) для (12):

IX 0 < г < 1, и0, (г) = 1

0г [-1,1 <г< 2.

Пусть Р. = 0,002 . Рассмотрим вспомогательный контур (6) в виде:

Хуг (г) =

"0 1] "0] "0]

0 0 Хуг ( г) + 1 и0г ( г)+0,002 1

иы(г), уу.(г) = [1 0]Ху.(г), хт-(0) = [0 0].

2

Для оценки производных сигнала С>1 ( г) воспользуемся наблюдателем (10), где 4,- (г) е Я

[ ё2г ] =[2 1]Т, ^ = 0,1:

(г) = -2г (г) - 2 -10 ((г) - д (г)), 42. ( г) = -102 (42. ( г) - С,- ( г)), 4 (0) = 0.

Используя уравнения наблюдателя, управление (11) можно записать как

иш (г) = -500 -[1 0 0]р2г 4и 4и ]Т = -500Ё,г. Пусть параметры агентов (11) определены следующими функциями:

— первый агент: a^t) = 2 + sin2t, a^it) = 2 + 5sint, ^(t) = 1 + 3sint, s2(t) = 1 + 3sin2t, b^t) = 5 + sin3t, d1(t) = 10sin t, f1(t) = 2 + 2sin t, ^(t) = 2 + cost, h1(t) = 2 -e-2t,

(y1(t), У2 (t), t) =

" ln2 (1 +1У1 (t)У2 (t)|) ln2 (1 +1У1 (t)У2 (t)|) + sin (У1 (t)У2 (t))

ln2 (1 + |У1 (t)У2 (t)|) + sin (У1 (t)У2 (t)) ln2 (1 + |У1 (t)У2 (t)|)

— второй агент: a3(t) = 2 + cos2t, a4(t) = 2 + 5cos t, s3(t) = 1 + 3cos2t, s4(t) = 1 + 3cos2t, d2(t) = 10cost, b2(t) = 3 + cost, f2(t) = 1 + 2sin1,5t, n2(t) = 2 + cos3t, h2(t) = 1 + e-t,

(У1 (t), y2(t), t) =

" lg2 (1 +1У1 (t)У2 (t)|) lg2 (1 +1У1 (t)У2 (t)|) + cos (У1 (t)У2 (t))

lg2 (1 +1У1 (t)У2 (t)|) + cos (( (t)У2 (t)) lg2 (1 +1У1 (t)У2 (t)|)

На рисунке слева приведены графики переходных процессов по У1 (t) и УП1 (t) . На рисунке справа результаты моделирования по У2 (t) (14) и уП2 (t) . При этом на вход (12) подано оптимальное управление Uo¡ (t) .

У1, Уп1 1,2

1,0

0,8

0,6

0,4

0,2

0

У1 (t) Уш(0

/ ..........\./Г....... х

....../"-.......... S \

\

0,5

1,5

t, с

Численное моделирование показало, что переходные процессы, прежде всего, зависят от выбора чисел Рг- во вспомогательном контуре (6) и законе управления (9), а также числа р

в наблюдателе (10). Причем чем меньше значения Рг- и р, тем ближе графики у (^) и ум (¿) .

Заключение. В статье рассмотрен простой алгоритм децентрализованного робастного субоптимального по быстродействию управления мультиагентными системами с коммуникационным запаздыванием и информационными ограничениями. Для выделения неизвестных возмущений и обеспечения субоптимального по быстродействию управления параллельно объекту введен вспомогательный контур. Далее выделенные возмущения оценивались и компенсировались за конечное время. Результаты аналитических выводов подтверждены численным моделированием.

Результаты Утверждения 1 получены в ИПМаш РАН при поддержке РНФ (проект № 14-29-00142). Результаты разделов „Метод решения" и „Численные исследования" получены при поддержке гранта Президента Российской Федерации (договор № 14^01.16.6325-МД (МД-6325.2016.8)). Другие исследования частично поддержаны грантами РФФИ (16-08-00282, 16-08-00686, 14-08-01015), грантом МОН РФ (проект 14.Z50.31.0031) и грантом Правительства РФ (074-И01).

1

СПИСОК ЛИТЕРАТУРЫ

1. Методы классической и современной теории автоматического управления. Теория оптимизации автоматического управления / Под ред. К. А. Пупкова и Н. Д. Егупова. М.: Изд-во МГТУ им. Н.Э. Баумана, 2004. Т. 4.

2. Буков В. Н. Вложение систем. Аналитический подход к анализу и синтезу матричных систем. Калуга: Изд-во науч. лит. Н. Ф. Бочкаревой, 2006.

3. Никифоров В. О. Адаптивное и робастное управление с компенсацией возмущений. СПб: Наука, 2003.

4. Бобцов А. А. Алгоритм робастного управления линейным объектом по выходу с компенсацией неизвестного детерминированного возмущения // Изв. РАН. Теория и системы управления. 2003. № 2. С. 93—97.

5. Bobtsov A. A. A robust control algorithm for tracking the reference signal // Automatic and Remote Control. 2003. Vol. 64, N 8. P. 943—950.

6. Tsykunov A. M. Robust control algorithms with compensation of bounded perturbations // Automation and Remote Control. 2007. Vol. 68, N 7. P. 1213—1224.

7. Теория автоматического управления. Ч. 2. Теория нелинейных и специальных систем автоматического управления / Под ред. А. А. Воронова. М.: Высш. школа, 1986.

8. Atassi A. N., Khalil H. K. A separation principle for the stabilization of class of nonlinear systems // IEEE Trans. Automat. Control. 1999. Vol. 44, N 9. P. 1672—1687.

9. Фуртат И. Б. Робастное субоптимальное управление линейными нестационарными объектами по выходу // Мехатроника, автоматизация, управление. 2009. № 7. С. 7—12.

10. Furtat I., Fradkov A., Tsykunov A. Robust synchronization of linear dynamical networks with compensation of disturbances // Intern. J. of Robust and Nonlinear Control. 2014. Vol. 24, Is. 17. P. 2774—2784.

11. Furtat I. B., Putov V. V. Suboptimal control of aircraft lateral motion // Proc. of the 2nd IFAC Workshop on Research, Education and Development of Unmanned Aerial Systems. Compiegne, France, November 20—22, 2013. Vol. 2, pt. 1. P. 276—282.

12. Furtat I. B. Robust suboptimal control with disturbances compensation // Proc. of the 19th Intern. Conf. on Methods and Models in Automation and Robotics, MMAR 2014. MiçdZyzdroje, Poland, 2—5 September 2014. P. 532—537.

13. Furtat I. B. Robust Synchronization of the Structural Uncertainty Nonlinear Network with Delay & Disturbances // Proc. of the 11th IFAC International Workshop on Adaptation and Learning in Control and Signal Processing, University of Caen Basse-Normandie, Caen, France, 3—5 July 2013. P. 227—232.

14. Фуртат И. Б., Цыкунов А. М. Адаптивное управление объектами с запаздыванием по выходу // Изв. вузов. Приборостроение. 2005. № 7. С. 15—19.

15. Furtat I. B., Fradkov A. L., Liberzon D. Compensation of disturbances for MIMO systems with quantized output // Automatica. 2015. Vol. 60. P. 239—244.

Сведения об авторе

Игорь Борисович Фуртат — д-р техн. наук, доцент; Университет ИТМО, кафедра управления сложными

системами, профессор; ИПМаш РАН, лаборатория управления сложными системами, ведущий научный сотрудник; E-mail: [email protected]

Рекомендована лабораторией Поступила в редакцию

управления сложными системами 19.04.16 г.

ИПМаш РАН

Ссылка для цитирования: Фуртат И. Б. Субоптимальное по быстродействию управление мультиагентными системами с информационными ограничениями // Изв. вузов. Приборостроение. 2016. Т. 59, № 12. С. 1003—1009.

SUBOPTIMAL SPEED CONTROL BY MULTI-AGENT SYSTEMS UNDER INFORMATION CONSTRAINTS

I. B. Furtat

ITMO University, 197101, St. Petersburg, Russia Institute of Problems of Mechanical Engineering of the RAS, 199178, St. Petersburg, Russia E-mail: [email protected]

A robust suboptimal control solution of the speed control is proposed for multi-agent systems described by nonstationary nonlinear differential equations with uncertain parameters, disturbances, communication delay, and possible information constraints in the measurement channels. To compensate for disturbances, the method of auxiliary loop method is used with the loop presented by a parallel reference model for each agent. Classical methods of optimal control are used for speed control, and therefore calculation of optimal control may be carried out with the use of standard packages of existing software, e.g. MatLab. Simulation results are presented to demonstrate the effectiveness of the proposed scheme under uncertainties, delay, and information constraints. The results show that the control accuracy can be improved by increasing the gain in the control law, reduce the high frequency gain in the auxiliary loop, and increase the feedback gain of the observer.

Keywords: multi-agent system, robust control, optimal control, communication delay, information constraints

Data on author

Igor B. Furtat — Dr. Sci., Associate Professor; ITMO University, Department of Control of Complex Systems; Institute of Problems of Mechanical Engineering of the RAS, Laboratory of Control of Complex Systems; Leading Scientist; E-mail: [email protected]

For citation: Furtat I. B. Suboptimal speed control by multi-agent systems under information constraints // Izv. vuzov. Priborostroenie. 2016. Vol. 59, N 12. P. 1003—1009 (in Russian).

DOI: 10.17586/0021-3454-2016-59-12-1003-1009

i Надоели баннеры? Вы всегда можете отключить рекламу.