СИСТЕМЫ УПРАВЛЕНИЯ
1
УДК 517.977:519.876.2
СУБОПТИМАЛЬНОЕ РАВНОВЕСНОЕ ПОЗИЦИОННОЕ УПРАВЛЕНИЕ МНОГООБЪЕКТНОЙ СИСТЕМОЙ НА ОСНОВЕ МНОГОПРОГРАММНОЙ СТАБИЛИЗАЦИИ
Е.М. Воронов, А.А. Карпунин, С.В. Фролов, Чжан Сяньцзянь
МГТУ им. Н.Э. Баумана, Москва
e-mail: [email protected]; [email protected]; [email protected]
В рамках трех классов прикладных задач в условиях исходной структурной несогласованности, конфликтного взаимодействия и неопределенности в теории оптимального управления многообъектными многокритериальными системами на основе стабильно-эффективных компромиссов поставлена и решена задача многокритериального синтеза позиционного управления динамикой конфликта многообъектныгх систем в форме билинейной модели динамики средних. Решение данной задачи базируется на результатах многокритериального синтеза позиционного управления на основе методов многопрограммной стабилизации и синергетических подходов.
Ключевые слова: многокритериальный синтез, позиционное управление, многопрограммная стабилизация, динамика конфликта, билинейная модель, равновесие, динамическая самоорганизация.
SUBOPTIMAL EQUILIBRIUM POSITIONAL CONTROL OF MULTIPLE-OBJECT SYSTEM BASED ON MULTIPROGRAM STABILIZATION
E.M. Voronov, A.A. Karpunin, S.V. Frolov, Zhang Xianjian
Bauman Moscow State Technical University, Moscow e-mail: [email protected]; [email protected]; [email protected]
Within three classes of applied problems under conditions of initial structural non-coordination of the conflict interaction and uncertainty in the theory of optimal control of multiple-object multicriterion systems based on the stably effective tradeoffs, a problem is stated and solved regarding the multicriterion synthesis ofpositional
model of dynamics of averages. Solving of this problem is relied on the results of multicriterion synthesis of positional control based on the multiprogram stabilization methods and the synergetic approaches.
Keywords: multicriterion synthesis, positional control, multiprogram stabilization,
conflict dynamics, bilinear model, synergistic approaches.
Как известно [1], в классе задач конфликтного взаимодействия структурно и функционально сложных систем управления соединениями (многообъектными комплексами) летательных аппаратов (СУСЛА) выделяется набор задач, которые составляют поуровневые фрагменты трехуровневой системы. В рамках совместного или независимого исследования это задачи конфликтного взаимодействия группировок на основе моделей исследования операций и принятия решений [1, гл. 10]; задачи конфликтного взаимодействия малых групп
ЛА с нераздельной комбинацией моделей принятия тактических решений и траекторной динамики группы ЛА [1, гл. 10]; динамические задачи антагонистического противодействия — противоборства в дуэльной ситуации, в ситуации конфликтного сближения-уклонения, преследования и другие задачи (обзор по "антагонизму", некоторые модели и результаты даны, например, в работе [1, гл. 7, 8, 10]).
Настоящая статья открывает серию публикаций по применению разработанного метода многокритериального синтеза позиционного управления [2, 3] на основе многопрограммной стабилизации [4-6] и синергетических подходов [7] в практически полезном классе задач управления данной иерархической трехуровневой системой в целом и ее поуровневыми фрагментами, имеющими смысл многообъектных многокритериальных систем (ММС).
1. Типичной практически значимой структурой задачи конфликтного взаимодействия группировок на верхнем уровне СУСЛА является задача распределения ресурсов противников (целераспределение — ЦР) с учетом текущих конфигураций систем (КС) и конфликтно-оптимального прогноза динамики конфликта (ПДК), которая в целом может быть задана аббревиатурой: КС-ПДК-ЦР [1]. Подобным образом могут быть сформированы структуры задач конфликтного позал-пового взаимодействия авиационно-ракетной локальной (тактической) системы воздушного базирования (ЛС ВБ) и морской, сухопутной или симметричной воздушной локальной системы ПВО (ЛС ПВО).
В настоящей статье рассматривается этап КС-ПДК последовательного варианта алгоритма решения задачи КС-ПДК-ЦР [1], на котором формируются как функции состояния конфликтно-оптимальные доли множества активных средств каждой из конфликтующих систем для поражения активных и пассивных подгрупп объектов противника. Полученные позиционные функции затем используются в задачах ЦР конфликтующих ЛС ВБ и ЛС ПВО [1], структурированных на основе КС-ПДК.
Структура конфликтной ситуации для модели КС-ПДК с одним вариантом множества активных объектов (АО) и пассивных объектов (ПО) для каждой ЛС без ограничения общности анализа дана на рис. 1.
На рис.1 г/у(х, ¿) — доли множества АО-г системы г (г = 1,2), как функции текущей численности х объектов системы, где х = = (жвъ £в2, :':п| ■ хп2), выделенные для поражения АО (у = 1) или ПО {] = 2) противника в текущий момент времени залпового обмена. В частном случае, доли щ зависят от текущей численности активных средств противника, т.е. = /лДх. I), где х = хп (х = хв), % = 1
(г = 2).
2. Математическая модель ПДК базируется на уравнениях динамики средних [1, 8], которые, в свою очередь, есть следствие марков-
JIC ВБ (система 1)
/-\
ЛС ПВО (система 2)
Рис. 1. Структура конфликтной ситуации
ского процесса перехода из одного состояния в другое ("не поражен"-"поражен") единичного объекта под влиянием потока случайных событий с пуассоновским законом распределения. Характеристикой состояния систем ЛС ВБ, ЛС ПВО становится средняя численность
;/■,, | (1). хв2 и ;/'П| (Ь). хп2 (£) соответственно объектов, находящихся в состоянии "не поражен" (так как число пораженных объектов — это разность хВ1^о) — жВ1 • • •, Хп2^о) — с дисперсией [8]
где £ — момент времени (мгновенный такт) непрерывного залпового обмена подгрупп АО-1, АО-2 противодействующих сторон. При этом, как известно, истинные текущие численности принадлежат до-
верительным интервалам:
Непрерывному варианту конфликта со структурной схемой, приведенной на рис. 1, соответствует система уравнений динамики конфликта следующего вида:
¿в1(£) = — -Pnia.nl г/21ЖП1 ¿в2 = —Рп1ап11/22Хп1 Жп1 (£) = 0..в\ицХв\
где
Жпг(^о) — ЖпгО! ^ ~~ Жвг(^о) — ^вгСЬ 2 — 1, 2; (4)
Р/ — эффективность воздействия на один объект у-го типа одного объекта г-го типа (конфигурации систем могут быть учтены введением , причем 9, ф — метки положения г-го и у-го объектов соответственно); аг = 1пи ^ - скорострельность г-го
А t
~ KlXBl
- V,
(5)
объекта (г = в1, п1) (интенсивность пуассоновского потока событий); Р, (Д/;) — вероятность выстрела г-го объекта на интервале Д£; г/г° (г = в1, в2, п1, п2) — темп "истощения" объектов г-го типа, кроме поражения: ненадежность и др.
Кроме предельного варианта непрерывного позалпового взаимодействия ЛС ВБ и ЛС ПВО, модель ПДК может быть преобразована для описания в потактовом варианте, когда 1-й залповый такт из т залпов конфликтного взаимодействия не мгновенен, а имеет реальную длительность ДХ1 = Т/т, I = 1,2..... т. При этом а, = 1 на Д7], тогда конечномерное приближение системы (2) для 1-го такта залпового обмена принимает вид [ 1]
ЖВ1 (I + 1) = Жв1(0 - -Рп11г/21Жп1
— Рп!2^22Жп1
— Р"12г/12жП1
Кроме потактового (5) приближения (2), учитываются следующие реальные условия конфликта [8]: каждый активный объект нацеливается и обслуживает один объект противника. В системе (2) имеет место полная информация без запаздывания о текущих средних чи-сленностях. При усложнении модели (2) [1] может быть учтено запаздывание информации и конечное время перехвата цели, которые в (5) компенсируются конечным интервалом времени А--го такта залпового обмена.
Каждая группировка ЛС ВБ и ЛС ПВО имеет векторные показатели потерь. В работе [1] приведены восемнадцать вариантов. В настоящем варианте каждая локальная система имеет три показателя потерь (слагаемые в (6)): терминальные перевесы противника по пассивным и активным объектам и темп убывания активных средств противника. Данные показатели, взвешенные тактическими весами а, и Д, ска-ляризованы на основе метода свертки с нормированием слагаемых и
принимают вид
Л = Лб = «п1 [Жд1 _ + «2 - +
—)■ mm;
m
+«3 / ЖП1(
Jt0
„2 /+ \ ^2 /+ М | Я U2 /+ \ гг.2
"в!
(6)
% J^ XBl(
—» mm,
^21
а при условии (3)
г г
Как известно [5, 6], билинейная управляемая система имеет вид
Е*
)Щ X.
В соответствии с системой (2) имеем
Л (+\ — ТР.,О ,,0Т _ ( „о ,.0 „О „О \
где Е — диагональная единичная матрица. Матрица
4
эв
(V)
(8)
( -Р*1ап1 0 0 0 \ V О 0 0 -Р^ав1 )
V21
(9)
^12,
где
(u) = (-PnBionii/2i, -^¡Чп^гг, -Рвп120в1
(10)
Из (8), (9) следует, что матрицы А и В; (г = 1,4) не являются функциями времени.
3. В соответствии с методами многокритериального позиционного управления [2, 3] на основе многопрограммной стабилизации [4-6]
т
имеем N равновесных программных управлений [1] и траекторий, полученных из решения задачи (2)-(4), 6 на множестве из N начальных условий
Щ
V1
S.fcW) ЛпЫ
*( о) О,*, , , ^
в соответствии с определением и необходимыми условиями равновесия по Нэшу [1].
Определение 1 [1]. Управление игт(£) = (и^/:). и'п{Ь)) является равновесным по Нэшу, если имеет место система неравенств
Лб «> ив) > Лб ив) >
^ПВО (Чп, ^ <^ДВ0 (Чд, у
где данная система имеет смысл увеличения потерь каждой ЛС при отклонении от равновесного управления.
Тогда позиционное управление, реализующее многокритериальный синтез динамики конфликта с любыми начальными условиями, например из диапазона
min x0fe < х0 < max x0fe,
к к
(12)
в соответствии с подходом [2, 4] принимает вид
е(-е<
Ci
24 fv
х
х
п
Г, (13)
где u(x,t) = (un(x,t), uB(x,t)). Тогда, например,
Г / ■ xfel
гт
( Xl (t) Xe
X
П
X
r. (14)
В частном случае, отмеченном в п. 1, и(х, £) = (ип(хв, £), ип(хв, ¿)). Тогда, например,
Хв t - X
X,
-х:
Хв t -X
ъ,к'
X
в,к'
-хГ
X
X
п
Хв
1=1,tys lXB,fe'
11 (15)
х:
Управление (13) порождает траекторию системы (2)
X
(16)
для которой набор траекторий (£), к = 1. Лг обладает асимптотическими свойствами [2, 4].
Это достигается дополнительными обратными связями в (13)
где отклонение
= (х(
Г /
(18)
Выбор матриц С/г(£), к = 1. Дг, обеспечивает асимптотические свойства всех х£(£), к = 1, N, когда —> 0 при £ оо. После преобразования (18)
и подстановки (19) в (7) может быть получена нелинейная система относительно отклонений к = 1, N. В работах [2, 6] описывается методика формирования структурных требований к С^), к = 1, АГ, из условий устойчивости линеаризованной системы в отклонениях для каждого фиксированного к = 1, N:
У к =
где
т
Vb i(t)uik(t),
(20) (21)
а нулевое решение системы (20) при фиксированном к стабилизируется управлениями
^к = С/; (
где матрица С/.(£) имеет размер п х п, ас учетом системы (2), Управления а,¡. (Л) системы (2) имеют вид
Подставляя (23) в (20), получаем
Ук\ь,
Qfc(
D,
где
D
— гк\
Q*
), (25)
(26)
4. Применяя соотношения (20)-(26) к системе (2), из формул (9)-(11) имеем
= Ей0 + Ezfc(ur) = Е (и0 + Zfe(ur)) ,
(27)
где
2й(и/с) ~~ ( А; г ^в11ав1г/Ш;> -^в"1 ав 1 и12к ) ~~
Выражение (22) в соответствии с (9) с заменой щ на .¡'¡. (Л) дает
СШ = Е2(х^ (29)
где
2к(хк) = ( — Рп\ ашХв1к, —Рп1ап1Хв2к1 —ап1Жп1 к1 ~ав1 Хи2к) =
Из (27), (29) следует, что матрицы Р^(^) и — диагональные, с отрицательными элементами, так как 0 < < 1, а х\к((Ь) > 0 в соответствии с системой (2) — положительные монотонно убывающие функции.
Тогда, ограничиваясь диагональной структурой матрицы С/, (Л) = = {сцк),% = 1,4 [2] без ограничения общности обеспечения ее стабилизирующих свойств, имеем в соответствии с (25), (26)
Окончательно, в соответствии с (26) получаем следующую систему уравнений:
(122к = - г/в°2 + ¿^(хрсвд ^
В системе (31) элементы ^ являются отрицательными в соответствии с формулами (28), (30). Элементы г/° > 0 > 0, следовательно, при сии >0^^ = 1,4 элементы
(1пк <0, г = 174, V* е [0, оо). (32)
Тогда, как указано в [9, стр. 39], нулевое решение системы (20) в соответствии с системой (2) экспоненциально устойчиво, а из (18) следует, что (16) асимптотически устойчиво относительно асимптоты
Замечание 1. Более полное определение экспоненциальной устойчивости требует проверки неравенства (33).
Определение 2 [9]. Нулевое решение системы (25) является экспоненциально устойчивым, если существуют положительные константы а и ¡3, такие что
Проверим (33). Поскольку в (25) — диагональная матрица,
то система (25) может быть представлена в следующем виде
Решим эти уравнения
Угк
= d
пк \
Угк
где функции -йць{ Тогда
Но
пк \
> 0 и
inf (-dük(
(35)
(36)
(37)
При этом в (37) знак "меньше или равно" сохраняется, так как (3 совпадает с наименьшим из 6цк.
Возведение в квадрат неравенств (37), суммирование полученных неравенств и извлечение корня приводит к (33) при а = 1.
Замечание 2. Поскольку в исходном билинейном уравнении (7) на основе (2) матрицы А и В^, г = 1 ,т постоянные, то можно предположить формирование постоянных сак > 0, г = 1,4 общих для всех
5. Рассмотрим иллюстративный упрощенный пример решения задачи получения программных равновесных по Нэшу управлений и траекторий (11) для системы (2) по критериям (6) для двух вариантов начальных условий (./V = 2), с формированием позиционного управления (13) и траектории (16) и анализом свойств траектории (16) при задании асимптотических свойств (11) на основе (32) и замечания 2.
Моделирование субоптимальных программных равновесных по Нэшу управлений реализуется с простейшей параметризацией программных управлений [1, гл. 1] и с потактовым определением параметров на модели (5) в силу специфики задачи проводилось в программной среде многокритериальной параметрической оптимизации многообъектных динамических систем МОМДИС [1]. Математическая модель (5) описана системой следующих уравнений с переобозначениями ПС МОМДИС в виде конечно-разностных уравнений:
(38)
*
(39)
Эксперимент № 1.
Начальные численности:
Эффективности воздействия объектов г-го типа на объекты у-го типа:
Таблица 1
Результаты оптимизации на такте № 1
Численности Доли Показатели
х2 X3 X4 Q1 Q2 JA Jb
Начало 10 6 12 7 Хг^Хз Хз^Х!
Нэш 7 2 6 5 0,93545 0,38267 0,47651 0,43709
В табл. 1-4 ячейка (¿1 имеет смысл доли активных средств XI, воздействующих на активные средства противодействующей стороны ХЗ, а С}2 — доли активных средств Х'о, воздействующих на активные средства противодействующей стороны XI.
Таблица 2
Результаты оптимизации на такте № 2
Численности Доли Показатели
Xi X2 X3 X4 Q\ Q2 Ja Jb
Начало 77 2 6 5 Хх^Хз Хз^Хх
Нэш 4 1 3 3 0,81566 0,83623 0,42607 0,49486
По результатам моделирования получились зависимости, представленные на рис. 2, 3 и 4. Эксперимент № 2.
Рассмотрим влияние количественного превосходства ПВО. Начальные численности
Эффективности воздействия объектов г-го типа на объекты у-ю типа
Таблица 3
Результаты оптимизации на такте № 1
Численности Доли Показатели
Xi X2 X3 X4 Ql Q2 Ja Jb
Начало 12 10 30 10 Хг^Хз Хз^Хг
Нэш 4 2 15 7 0,91727 0,49422 0,46431 0,39945
Таблица 4
Результаты оптимизации на такте № 2
Численности Доли Показатели
Х2 Х3 х4 Q1 Q2 Ja Jb
Начало 4 2 15 7 A'i А'з А'з A'i
Нэш 0 1 8 4 0,81658 0,89722 0,31715 0,46641
в С1)
0,94 -0,92 -0,90 -0,88 -0,86 -0,84 -0,82 -0,80 -0,78 -
в (2)
0,3 -
0,2 -1-1-1-
О Г/2 Г г
б
Рис.3. Изменение доли средств ЛС ПВО <5(1) (уГа21 = 1 — «„х 1 = г^ч 1^)) (я) и «(2) «2,1 = 1 - <1,1 = <2,1 (б)
По результатам моделирования получились зависимости, представленные на рис. 5, 6 и 7.
а
Рис. 4. Изменение вектора состояний
Рис. 5. Изменение доли средств ЛС ПВО Q(l) и ЛС ВБ Q(2):
" Ип2,2 — 1 Ип1,2
' 22,2 V
У,б
ив2,2 ~ 1 Ив1,2 — iy12,2
Рис.6. Временная реализация для управления uni(x,i) (ип2(х, i) = 1--ual(x,t) = ¿/22(x,i)) (а) И uBl(x,i) (uB2(x,i) = 1 - wBl(x,i) = f12(x,i)) (6)
а
25 -20 -15 -10 -5 -0 -
0 ТУ2 / t
Рис. 7. Изменение вектора состояний в зависимости от синтезированного управления
В результате применения метода многокритериального синтеза позиционного управления на основе метода многопрограммной стабилизации с аппроксимированными оптимальными управлениями были получены субоптимальные равновесные позиционные управления в экспериментах № 1 и № 2.
Аналитический вид u(;r,t), где иДх, t) = ип(х, t) и и2(х, t.) = = ив(х, t) соответствует варианту (14). Вид выражения для позиционного управления uB(x, t) может быть получен по аналогии из (14) с заменой ип на ив. Диагональная матрица Ск = (сак), i = 1, тг с элементами сц = 1 в соответствии с (32) обеспечивает проявления асимптотических свойств всех x£(i), к = 1,2.
Временная реализация для управлений u^x, t) и и2(х. t) для компонент wni(x, t), uy.\ (х. t) при средних значениях x.iUi) (12) с малой кривизной данных компонент дана на рис. 6, а и 6, б.
Как следует из рис. 6, многокритериальное позиционное управление достаточно хорошо ориентировано на усредняющие свойства оптимальных программных управлений. Кроме того, асимптотические свойства обладают полезной грубостью.
На рис. 7 дано изменение вектора состояния при применении u(x, t).
Замечание 3. Очевидно, что увеличение числа тактов приближает реализацию программных управлений и траекторий на потактовой модели ПДК (5) к модели (2).
Рис. 7 показывает, что векторная траектория системы (2), вызванная законом управления, имеет определенную степень близости к траекториям-асимптотам, представленным на рис. 2 и 4.
Полученные законы управления ресурсами являются примером реализации алгоритмов динамической самоорганизации в структурно и функционально сложных системах [10].
СПИСОК ЛИТЕРАТУРЫ
1. Воронов Е. М. Методы оптимизации управления многообъектными многокритериальными системами на основе стабильно-эффективных компромиссов.
2. В о р о н о в Е. М. Многокритериальный синтез позиционного управления на основе многопрограммной стабилизации. Ч. 1 // Вестник МГТУ
3. В о р о н о в Е. М. Многокритериальный синтез позиционного управления на основе многопрограммной стабилизации. Ч. 2 // Вестник МГТУ
4. 3 у б о в В. И. Синтез многопрограммных устойчивых управлений // Докл. АН
5. С м и р н о в Н. В. Задачи многопрограммной стабилизации в различных классах динамических систем // Труды Средневолжского мат. общ., 2005. - Т. 7, № 1.
6. С о л о в ь е в а И. В. Синтез многопрограммных систем управления на основе метода позиционной оптимизации. - Автореферат дисс. на соиск. уч. ст. канд.
7. Колесников А. А. Синергетические методы управления сложными системами: Теория системного анализа. - М.: КомКнига, 2006. - 240 с.
9. Квакернак X., С и в а н Р. Линейные оптимальные системы управления.
10. Концепция иерархической пента-структуры (ИПС) модели (облика) интеллектуальной системы управления (ИСУ) и принцип "притягивающих многообразий" в самоорганизации и оптимизации ИСУ / Пупков К.А., Воронов Е.М., Карпунин А.А., Пролетарский А.В. // Интеллектуальные системы: Тр. X МежСтатья поступила в редакцию 31.05.2012