Методика синтеза кусочно-программного управления маневром уклонения с учетом терминальных ограничений
Ключевые слова:
кусочно-программное управление объектами, теория дифференциальных игр, летательные аппараты
Щербань И.В.,
профессор кафедры многоканальных телекоммуникационных систем Северо-Кавказского филиала Московского технического университета связи и информатики (СКФ МТУСиИ), д.т.н, [email protected]
Иванов С.В.,
аспирант кафедры многоканальных телекоммуникационных систем Северо-Кавказского филиала Московского технического университета связи и информатики (СКФ МТУСиИ), s i [email protected]
Введение
Алгоритмы управления объектами в конфликтных задачах, основанные на классических методах теории дифференциальных игр, требуют для реализации мощных вычислителей [1]. Особенно сложными являются комплексные задачи управления объектами, осуществляющими доставку полезного груза в заданную терминальную область пространства с заданными параметрами движения при одновременном совершении маневров уклонения от объектов нападающего. Причем, в большинстве практических случаев нападающий имеет возможность наблюдать управляемый объект союзника в реальном времени и корректировать свои средства, в то время как у объекта-со-юзника таких возможностей нет (например в случаях управления высокоскоростными летательными аппаратами специального назначения, преодолевающими активные средства
Рассмотрена методика синтеза кусочно-программного управления объектом, осуществляющим доставку полезного груза в заданную терминальную область пространства при одновременном совершении маневров уклонения от объекта нападающего, который имеет возможность наблюдать объект союзника в реальном времени и корректировать свои средства, в то время как объект-союзник имеет информацию только о начальном моменте функционирования объекта нападающего. Приведен пример, свидетельствующий о вычислительной эффективности представленной методики.
защиты нападающего). Алгоритмов решения таких задач, возможных для реализации в реальном масштабе времени современными бортовыми вычислителями, в настоящее время не существует [1,2].
Постановка задачи
Рассматриваемая конфликтная задача может быть формализована следующим образом. Пусть отрезок на числовой прямой [г0, гк ]е т — ограниченное ^ < T) время функционирования объектов; У — п-мерное, Z — т-мерное, и — г-мерное, №— р-мерное евклидовы пространства с элементами у, л, и, wсоответственно; Цу,1 gu(u,y,z.f) и М, д^луй
— соответственно п-мерные и т-мерные непрерывные нелинейные функции. Текущие состояния маневрирующего объекта (союзника) описываются фазовым вектором у() а состояния объекта-перехватчика — вектором т(^), и в фазовом пространстве задаются системой нелинейных дифференциальных уравнений [1-4]:
йу
— = /у (у, ') + (и у, 2 0, у(го) = у0 йг
йг
— = Л (z, г) + %м,( ^ 2 ^ г( 'о) = 2О йг
(1)
(2)
у,- )- ~ =ф ,■ (у, )= 0
(3)
(Ф; — вектор-функция размерности ^х1).
Органы управления объекта-союзника формируют ограниченные управляющие воздействия:
(4)
Объект у имеет целью приблизиться к некоторому заданному состоянию (3), а объект-перехватчик л — воспрепятствовать этому приближению, стремясь захватить объект союзника в некоторую область захвата, что определяется условием совпадения субвекторов размерности I (I < п, I < т) фазовых векторов у^) и (0< ^< Т, после чего объект у прекращает функционировать. Поэтому векторы управлений и, w должны одновременно обеспечивать оптимумы (максимум и минимум) некоторого заданного функционала характеризующего расстояние между противниками:
(5)
где и, w — управляющие функции объектов (и е Кг, wе Кр); ге [г0, гк] — ограниченное время решения задачи, 0 — начальный момент времени.
Заданы значения /-х (, = 1, п1, п1 < п) компонент вектора состояния объекта-союзника в конечный момент времени :
у (гк ) = Уг,
где у, — краевые значения, определяющие заданную конечную область пространства
где О — известная скалярная функция.
Тогда, учитывая ограниченность расходуемых на управление ресурсов — интенсивностей управления
'к г *к р
[Xи‘2(г)Л и [УwJ2(t) Л,
'ог=1 гО у=1
поиск оптимальных допустимых стратегий управления и0^) и №°(0 в сформулированной задаче необходимо осуществлять из условия минимакса [3]:
30
T-Comm #5-2009
JI u0, w0 (z, у, t )l = min max x
[ 1 w J )| <u j
x|q [у (tk), z(tk), tt ]+1 [ [ wT (t) Kw( t) - uT( t) K u t)] dt J =1 r, (6)
где K,(f), /^(f) — симметричные положительно определенные функции-матрицы соответствующих размерностей.
Решение задачи
При синтезе алгоритма воспользуемся подходом, изложенным в работах [3,4], позволяющем свести сформулированную игровую задачу к задаче одностороннего гарантированного управления аппаратом-союзником. В этом случае не требуется выполнение условия существования седловой точки, а также возможен синтез вычислительного алгоритма, реализуемого современными бортовыми вычислителями в реальном масштабе времени. Поиск оптимальной стратегии управления u0(f) осуществляется здесь из более узкого, в сравнении с (6), условия:
J\u 0; w (z, y, t )|= max {J Гм, w (z, y, t)},
L 1 |uj(t )| <Uj L J
j = 1, r,
(7)
(8)
w(x, Л, t) = K1 1
дw
Л;
dt дx
= ^[x(t),Л (t),t J
где f [x(t t ]=
с граничными условиями:
fy [x(t)t]+ gu [x(t), X(t), t] fz [x(t)t]+ gw [x(t), X(t), t]
xi(to) = x0i,i =1, n + m; x(td = ф( x t) = 0, , l < n, l < m
j=1, n1; Лі (tk )=-£
t=tk
(id
где ^(г, у, г) — допустимая функция управления объекта-нападающего. Предполагается, что противник формирует замкнутое управление по принципу обратной связи на основе собственных наблюдений "наихудшим" образом — может воспользоваться любым неоптимальным шагом, сделанным нашим объектом.
Вектор оптимального управления союзника находится при этом из условия максимума гамильтониана:
Решение двухточечной краевой задачи (ДТКЗ) (9-11) может быть получено на основе различных методов: коррекции краевых условий, прогонки, градиентного спуска и др. Данные методы требуют нескольких итерационных процедур в каждом такте решения ДТКЗ и, соответственно, значительных вычислительных затрат, поэтому в реальном времени управления объек-том-союзником реализованы быть не могут.
Тогда воспользуемся приближенными методами, сводящими ДТКЗ к решению задачи Коши в прямом времени. Наиболее широко используемым среди них является метод инвариантного погружения (МИП) [5]. Однако в МИП отсутствует возможность учета терминальных ограничений (например, вида (3)) и он не работоспособен в условиях, когда целевой функционал содержит ненулевой неквадратичный терминальный член, входящий аддитивно (как в (6)).
Поэтому воспользуемся методом сведения ДТКЗ к одноточечной задаче интегрирования системы обыкновенных дифференциальных уравнений, рассмотренным в работе [6] и свободным от указанных недостатков. В этом случае вместо ДТКЗ (9-11) в прямом времени интегрируется следующая система дифференциальных уравнений:
= M1 +f (x(t), Q( x(t)), t),
dt 1 dt
x, (to) = xo,,i = 1, n + m;
H (x(t), u 0(t), W(t),A( t), t) =
= max, {H(x(t), u(t),w(t), ^(t), t) }
|uj(t)| <u j
j = 1, r,
где x (t) = [ y(t )T z(t )T ]T — объединенный I тор состояния (т — знак транспонирования); d^o
dt
(12)
dMj df(x(t)), Q(t), t) M + дЛ x t)), Q t), t) M;. (13)
(14)
dt дx
dMг __ д<р(x(t)), Q(t), t) dt
дЛ
дx
M1+дМі)Ш4А M
дЛ
где
дQ(X(t)
Я(А - (п+т)-мерная вектор-функция, удовлетворяющая вместе с тройкой [хо, ио(^), W(') ] системе:
^=/[х ('), и0 (г), w (г), Я (г), г] = / [х (г) Я (г) г]; (9)
——=--—=ф[х (г), и0 (г) , w (г) ,Я (г), г 1 =
— г дх [ 1
дx
дQ ( x(t))
дx
■M1 - M г
f (x(t)), IQ(t), t) + q>(x(t), Q(x(t)), t)
Начальные условия для матриц чувствитель-
ности M = дx(Л0 (t),t) и M = дЛ(Лo(0, t) 1 дЛ0 M г ="
имеют вид:
M1 = 0, M г = E,
дЛ 0
(15)
(10)
где Е — единичная матрица размера (n + m) x (n + m).
Путем интегрирования системы дифференциальных уравнений (12-15) получаем субоп-тимальную программную траекторию союзника х(г) = | ~ (г)т ~(г)т | т, реализующего маневр уклонения от объекта нападающего и доставку полезного груза в заданную конечную область (3). Траектория получена исходя из представления о наиболее вероятных действиях объекта-нападающего с целью поражения аппарата союзника и с учетом ограниченности энергетики союзника в общей задаче доставки груза к цели (3). Но реализация любой программной траектории ~ (г), рассчитываемой однократно для граничных условий (11,15) на всем интервале ^ - 0), как известно, не позволяет учитывать текущую ситуацию и на значительных временных интервалах непременно имеет существенные методические ошибки [1,2,7].
Известно, что алгоритмы с прогнозированием широко используются при управлении подвижными объектами, предназначенными для доставки полезного груза в заданную терминальную область. Это обусловлено основными достоинствами следующих алгоритмов: во-первых, задача управления решается непосредственно в процессе движения объекта (управление в форме синтеза), во-вторых, достаточно просто обеспечивается адаптивность синтезируемого управления к текущим условиям функционирования объекта по результатам идентификации его динамических характеристик. Наиболее эффективными, например, для беспилотных ЛА, функционирующих в условиях интенсивных возмущений, жестких ограничений на фазовые переменные и управление, являются так называемые методы оптимального терминального управления, реализующие адаптивные алгоритмы с прогнозом [7]. В силу указанных достоинств, окончательное решение сформулированной задачи может быть получено именно на основе использования идеологии алгоритмов с прогнозирующими моделями.
В этом случае блок-схема алгоритма синтеза управления объектом, осуществляющим доставку полезного груза в заданную терминальную область пространства с заданными параметрами движения при одновременном совершении маневров уклонения от объекта нападающего, имеет вид, представленный на рисунке.
Сущность его заключается в следующем. По текущей навигационной информации определяются начальные условия х(го ) = хО (/ = 0, 1, 2,... — номер итерации в медленном контуре) и в так называемом "медленном контуре" решения задачи прогнозируется субопти-мальная траектория х1 (г) на последующий интервал движения объекта-союзника
T-Comm #5-2009
зі
fy (y,t ) =
gu (U, У, t) =
Блок-схема алгоритма синтеза управления объектом союзника
ге [го,т],(го = ^ г0>го)- В быстром контуре решается задача стабилизации относительно субоптимальной траектории х(г )-
В течение одной итерации построения программной оптимальной траектории в медленном контуре по текущей навигационной информации у('о ), в быстром выполняется
несколько итераций. Соответственно, такт решения задачи в быстром контуре определяется динамическими характеристиками аппарата союзника (устойчивостью, управляемостью и т.п.), а такт медленного контура — вычислительными возможностями его бортового вычислителя. При уменьшении временного интервала решения задачи в медленном контуре формируемое таким образом кусочно-программное управление все более стремится к управлению в форме синтеза.
Пример
С целью обоснования реализуемости и оценки вычислительной эффективности представленного подхода было выполнено численное моделирование следующего практического примера. В качестве объекта союзника использовалась модель гипотетического беспилотного высокоскоростного ЛА В качестве противника (ПР) использовалась простейшая модель осе-симметричного ЛА ракетной схемы. Пространственное движение обоих ЛА задавалось в единой скоростной системе координат (СК) в виде (1, 2), где:
у№ = у Уу К х у 2|Т =
=1 у у2 уз у4 у5 у6 Г;
2(1) = И5 уу* У^ хпр у"* гпр|Т =
-в0у5 / 2 , 2
? V Уі + Уг + Уз
ЗУ -
-Soу* I г , 2
[ УУі + Уг + Уз о.. _т(п У5 - Ус .
-Яуг - m(gr
L Sy3- (g г'
?»-*■)
-в0у5 I г , 2
[ VУі + Уг + Уз д.. -fn Уб -Zc
У4
У5
Уб
Poe УІ + Уг2 + Уз2
; 2m
SУгUl
Poe УІ + Уг2 + Уз2
У 2m
Poe-SOy Уі2 + Уг2 + Уз2)
2m
Sy iui
Su
fz (z, t) =
'-S np z.
s/ZE
2mnp
-S np z
- Y^p)
m^
7Pcos^"p -уїО
s/ZE
gw (w, Z, t) =
2mnp
p-rf)-
-Snpzs - (gr-
■5VZT
WlSІn(фпp - y3np)
2mnp
■5>/Z1r+
2mnp
ч> Poe-
-S npZiw2
Z5( z. + zj-
u(t) =|а S\T = U u2|T;
w(t) = p(t)/ m ау ft| = |w. w2 w3|
з2
Vx, Vy V, VxIlp, Vf, V?, X, у, z, X* упР, z"P -
составляющие векторов скорости и координат летательных аппаратов в скоростной СК; а, в,
aup,pup(\a(t)\ < «max, |в(t) I < Slmax) — углы атаки
и скольжения ЛA союзника и ЛA нападающего соответственно; cx, су, c^p , с^ — аэродинамические коэффициенты аппаратов; m,m°p,s, s°p
—массы и площади миделя аппаратов; х,у,тс— координаты центра Земли в нецентральной стартовой СК; Р — удельная тяга двигательной установки ЛА противника; тзх , созу, со32 — составляющие угловой скорости вращения Земли по осям координат; г, (лр — расстояние от центра Земли до каждого ЛА; р0 — начальная плотность воздуха; дг — ускорение земного притяжения, направленное к центру Земли; дю — ускорение земного притяжения, направленное параллельно оси вращения Земли в экваториальной плоскости; Р0 — градиент плотности атмосферы; ф — широта точки старта противнику г3^р =Ю3/
Условия приведения ЛА-союзника в цель задавались следующими терминальными ограничениями — координатами цели в инер-циальной СК:
x(T) = x(T); z(T) = Zц(T); y(T) = 0.
(16)
Неотрицательная скалярная функция, характеризующая расстояние между объектами, имела вид:
0 [У (ч ), 2(4)] = л/(х - хпр)2 + (у - у пр)2 + ( г - гпр)2
(17)
Компоненты вектора управления w (г) ЛА-противника задавались уравнениями:
= Я С05(уз -ф) + . 8ш(уз -ф) . (у2С05ф-у151Пф)
— Л 1 Г P -S0-X„ Vx7 + X8 + X9 ,
w2 =Л7-CySPoe ---------------------'
(18)
w3 = Л 1cySPoe S0'xi 1
x.+X2 + x9
а вектора управления u0 (t) ЛA-союзника — уравнениями:
ui0 = y7 sign(H2(ui);
u° =П sign(нз(uг)), б
(19)
где
H 7(u 1 ) = Нз (u7) =
CyPoe S0'X4x1 + x7 + X3г
2m
Cyp0e в 5 I + x2 + %
2m
Su7.
Ввиду громоздкости соотношения (12-14) не приводятся.
При моделировании реальное "неизвестное" объекту союзника управление нападаю-
Т-Сотт #5-2009
m
m
m
т
z
z
w
щего синтезировалось оптимально по Веллману. Предполагалось упрощающее рассуждение, не влияющее на общность полученных результатов, что нападающему "мгновенно" известна текущая информации о взаимном расположении обоих объектов и его управление синтезируется без временной задержки.
Моделировались два практических случая управления союзником. В первом случае задавалось программное релейное управление. При этом объект нападающего поражал ЛА союзника на 61-й секунде. Во втором случае синтезировалось управление союзником на основе сформированной методики. Тогда аппарат союзника выполнял маневр уклонения и обходил ЛА нападающего за счет преимуществ в скорости и энергетике, а затем выходил в заданную конечную область пространства (16).
Размерность интегрируемой в прямом времени системы дифференциальных уравнений при этом была равна 300, а затраты на реали-
зацию одной итерации разработанного алгоритма решения задачи синтеза управления ЛА-союзника составляли ~0,0480 06 КОп, что при шаге интегрирования Ь = 0,1 с потребует быстродействия вычислителя =4,8^ 106 КОп/с, что соответствует сегодняшнему уровню развития бортовых вычислителей.
Известно, что использование классических методов теории дифференциальных игр и традиционных минимаксных подходов на основе решения уравнения в частных производных Айзекса требует существенно больших вычислительных затрат и в рассмотренном случае высоких размерностей уравнений динамических объектов практически нереализуемо.
Полученные результаты позволяют сделать вывод об эффективности рассмотренной методики и о возможности управления объектами, осуществляющими доставку полезного груза в заданную терминальную область пространства при одновременном совершении маневров уклонения от объектов нападающего.
ЭКОНОМИИ
Литература
1. Пантелеев А.В., Бортаковский АС Теория управления в примерах и задачах. М.: Высш. шк., 2003.
2. Справочник по теории автоматического управления / Под ред. А. Красовского. М.: Наука, 1987.
3. Щербань И-В. Эффективный субоптимальный алгоритм управления игроком-союзником в конфликтной задаче // Изв.РАН. ТиСУ 2007. — №1. — С. 7-12.
4. Соколов СВ., Щербань И.В. Решение задачи синтеза оптимального управления в конфликтной задаче // Изв.РАН. ТиСУ 2003. — №5. — С.35-40.
5. Первачев СВ., Перов АН Адаптивная фильтрация сообщений. М.: Радио и связь, 1991.
6. Барков В.В., Кочетков ЮА Краевая задача оптимального управления нелинейными детерминированными системами // Изв. РАН. ТиСУ, 1995. — №6. — С.184-193.
7. Буков ВН Адаптивные прогнозирующие системы управления полетом. М.: Наука, 1987.
"ЦентрТелеком" и "Скай Линк" подписали соглашение о намерениях по организации сетей МУЫО в Центральном Федеральном округе РФ
ОАО "ЦентрТелеком" и ЗАО "Скай Линк" подписали соглашение о намерениях по организации виртуальных сетей подвижной радиотелефонной связи (МУЫО) на основе использования ресурсов сети 1МТ-МС-450. Соглашение подписано в рамках выполнения Генерального соглашения о сотрудничестве, заключенного 24 марта 2008 г. между ОАО "ЦентрТелеком" и ЗАО "Скай Линк" в целях развития и реализации совместных проектов на территории Центрального Федерального округа Российской Федерации.
В подписанном документе стороны выразили намерение о строительстве и вводе в эксплуатацию новых сетей 1МТ-МС-450 в Брянской, Смоленской, Курской, Липецкой, Белгородской, Орловской и Тамбовской областях. Согласно договоренности, ОАО "ЦентрТелеком" приобретет оборудование необходимое для обеспечения покрытия сети 1МТ-МС-450 на соответствующей территории, а также осуществит необходимые работы по монтажу телекоммуникационных систем. ЗАО "Скай Линк" в свою очередь предоставит "ЦентрТелекому" радиочастотный ресурс для организации МУЫО на территории перечисленных регионов.
По словам Генерального директора ОАО "ЦентрТелеком" Ваагна Мартиросяна, реализация совместного пилотного проекта по предоставлению услуг связи с использованием сети стандарта 1МТ-МС-450 на территории Костромской, Ивановской и Ярославской областей доказала эффективность существующей схемы взаимодействия ЦентрТелекома и ЗАО "Скай Линк". "Менеджмент компании доволен достигнутыми в течение 2008 и 2009 гг. результатами нашего партнерства. В настоящее время мы прорабатываем технические и экономические условия развития
Т-Сотт #5-2009
сотрудничества со "Скай Линком". Но уже сегодня можно с уверенностью говорить о том, что совместная работа наших компаний не только даст нам возможности для расширения спектра предоставляемых услуг с использованием синергического эффекта от использования ресурсов, но и позволит сделать еще один существенный шаг на пути решения проблемы цифрового неравенства в регионах ЦФО".
Проект предусматривает совместное использование технического ресурса действующих сетей CDMA450 (ЗАО "Скай Линк"), а также совместное строительство новых сетей в регионах, где "Скай Линк" имеет лицензии и частотный ресурс. Это 14 субъектов Российской Федерации в ЦФО, где можно обеспечить покрытие не только крупных городов, но и более полное покрытие на территории всех интересующих регионов, с общей емкостью сети до 1 млн. абонентов.
ОАО "ЦентрТелеком" планирует в ближайшее время предоставить в регулирующие органы документы, необходимые для получения лицензии на использование бизнес-модели виртуальных сетей подвижной радиотелефонной связи без использования собственного радиочастотного ресурса (MVNO) на территории ЦФО. Таким образом, ОАО "ЦентрТелеком" станет первым в России оператором связи, внедряющим услуги MVNO на базе собственного оборудования.
Согласно положениям подписанного соглашения, "Скай Линк" предоставит "ЦентрТелекому" ресурсы уже существующих сетей IMT-MC-450 на территориях Москвы и Московской области, а также во Владимирской, Воронежской, Тверской, Калужской и Рязанской областях.
33
л