2013
НАУЧНЫЙ вестник мгту га
№ 198
УДК-517.977
АВТОМАТИЧЕСКИЙ КОНТРОЛЬ БЕЗОПАСНОСТИ СБЛИЖЕНИЯ ДВУХ УПРАВЛЯЕМЫХ ВОЗДУШНЫХ СУДОВ ПРИ ПЕРЕСЕЧЕНИИ ИХ МАРШРУТОВ*
ВУ СУАН ХЫОНГ, А.В. ЗАЙЦЕВ, ЗО МИН ТАЙК, ТИН ПХОН ЧЖО
Сформулирована задача автоматического контроля сближения судов на пересекающихся маршрутах. Предложен метод вычисления функции риска столкновения судов на основе динамического программирования, что позволяет сформировать сигналы тревоги для принятия предупредительных мер по безопасному управлению боковым и продольным движением.
Ключевые слова: контроль безопасности, оптимальное управление, летательные аппараты, динамическое программирование, функция риска.
При пересечении запланированных маршрутов движения воздушных судов (ВС) возникает острая необходимость автоматического контроля безопасности их сближения. Особенно это важно, когда разница в моментах времени их попадания в точку пересечения заданных линий пути незначительна. Необходимо заранее установить этот факт, сформировать с помощью прогноза сигнал тревоги и передать системе управления движением команду на принятие предупредительных мер по предотвращению аварийного сближения ВС.
В данной работе в качестве основной меры предлагается дополнительное боковое маневрирование ВС для уклонения от их столкновения, а если этого недостаточно - изменение скоростей поступательного движения (одно ВС тормозит, другое повышает скорость).
Для реализации этого подхода нужно количественно оценивать разную степень тревоги, а значит и разную степень риска приближения ВС друг к другу. С этой целью в данной работе используется метод динамического программирования в непрерывной форме [1], на основе которого функция риска вычисляется в виде правой части уравнения Беллмана в случае оптимального управления двумя ВС одновременно, при следующей постановке задачи.
Постановка задачи
Дано:
1. Пусть движение первого ВС по заданной линии пути т1, являющегося основным объектом, для управления которым осуществляется контроль безопасности, подчиняется следующим дифференциальным уравнениям:
где х1 - координата бокового движения; х2 - боковая скорость; а1 и Ь1 - заданные параметры первого ВС; у3 - координата поступательного движения с заданной постоянной скоростью У1; и1 - синтезируемый сигнал управления первым ВС.
Введение
(1)
Работа выполнена при материальной поддержке РФФИ (грант № 13-08-00182)
2. Пусть движение второго ВС по другой заданной линии пути т2, пересекающейся с шх (как это показано на рис. 1) под углом 90г, подчиняется своим дифференциальным уравнениям:
Ух = У2;
у2 = - а 2 у2 + Ь2 и 2 ;
(2)
Х3 = У2,
где ух - координата бокового движения второго ВС; у2 - его боковая скорость; х3 - координата поступательного движения с заданной постоянной скоростью У2, равной (- V), если сближение с первым ВС осуществляется слева от него (рис. 1), либо равной Ух, если сближение происходит справа; и2 - синтезируемый сигнал управления вторым ВС.
, (3)
Рис. 1. Картина сближения ВС при их поперечном движении 3. Задан интегральный минимизируемый функционал У качества управления
Т
У = Г[^(их2 + и22) + %хх -шх)2 + (у -ш2)2] + х22 + у22) +-Т- 2
0 2 4 1 2 2К 2 727 1 + (хх + х3 + d)2 к + к (ух + у3 + ё)2
где т0, тх, т2, т3 - весовые коэффициенты значимости штрафов соответственно за расходуемую мощность, отклонения от заданных линий пути, отклонения по боковой скорости и штрафа за опасное сближение по сравнению с заданной величиной ё безопасной дистанции.
Последнее слагаемое в подынтегральном выражении /0 в формуле (3) определяет растущий риск столкновения по мере приближения судов друг к другу.
3. Начальные условия движения судов таковы, что при М - шх = ш2 и равных по модулю
скоростях попутного движения, они столкнутся в точке встречи А, вследствие чего система контроля должна своевременно сформировать сигнал о необходимости совершить дополнительное маневрирование во избежание аварийного сближения. Требуется:
- синтезировать алгоритмы оптимального управления боковым движением судов для увеличения минимальной дистанции между ними при их сближении;
- сформировать функцию риска опасного сближения судов, прогнозирующую в аналитическом виде зависимость возможного ущерба от значений координат движения двух судов в текущий момент времени.
Как было показано в [4], поставленным требованиям полностью удовлетворяет динамическое программирование в непрерывной форме [1], т.к. правая часть уравнения Беллмана в частных производных учитывает динамику управляемых объектов и по определению является функцией текущего риска, а оптимальное управление по текущему состоянию зависит от вектора координат движения. Как показано ниже, это позволило получить нужные результаты в аналитическом виде, что удобно для технической реализации.
Синтез оптимального управления боковым движением двух судов при их сближении
Прежде чем приступить к аналитическому синтезу, необходимо остановиться на координированном выборе направлении бокового движения обеих судов. Ранее в [5] было показано, что оба судна должны поворачивать вправо, если одно из них движется навстречу другому слева (рис. 1), или - влево, если встречное движение одного из них происходит справа.
Согласно теории оптимального управления [1; 2], условию оптимальности соответствует уравнение Беллмана
де " 5е
-— = тт{/0 (х, и1, и2) + (и1, и2)}, (4)
д^ и1,"2 7=1 дх{
а функцию Беллмана е нужно представить степенным полиномом
е = в1Х1 + в2х2 + в3У1 + вУ 2 + 0 5^1 х12 + 0 5Г2Х2 + 0 5ГзУ1 + 0 5 ^ + ¥12Х1Х2 + ¥13Х1У1 + ¥14Х1^2
+¥23 Х2 У + ¥24 Х2 У 2 + ¥34 У1У2
После чего уравнение Белмана (4), в том числе её правую часть р(х, у), являющуюся функцией текущего риска, можно представить в виде
де __
= т1ПШХ, У, ul, и2) + (в + 71Х1 + ¥12 Х2 + ¥13У1 + ¥14 У 2 ) Х2 + (в3 + Г3У1 + ¥3^2 + ¥13 Х1 + ¥23 Х2^2
д1 и1и2
+(в2 + Г2Х2 + ¥12Х1 + ¥23У + ¥24У2 )(Ъ1и1 - а1 Х2) + (в4 + 74У2 + ¥34^ + ¥14Х1 + ¥24Х2 )(Ъ2П2 - «2У2)} С5) = тт{р( xl, Х2, Уl, У2, и1и2)}
где /0 - подынтегральное выражение (3) минимизируемого функционала; Х1,Х2,У1,У2,и1и2) -минимизируемая функция текущего риска, используемая для контроля безопасности движения. Согласно принятой методике аналитического конструирования оптимальных регуляторов [3] с учетом квадратичной зависимости / от управлений и1 и и2, условию экстремума по и1 и и2
соответствуют при т0 = 1 следующие оптимальные управления
и1опт = -Ъ1 (в2 + 72Х2 + ¥12 Х1 + ¥23У1 + ¥24У2 ) Щопт = -Ъ2 (в4 + ПУ2 + ¥34У1 + ¥14Х1 + ¥24Х2 ) . (6)
Таким образом, для окончательного определения найденного алгоритма линейного оптимального управления необходимо вычислить искомые коэффициенты в2, Р4,72,74,¥12,¥14,¥23,¥24,¥34 - всего 9 коэффициентов функции Беллмана е .
Чтобы это сделать, нужно представить левую и правую части уравнения (5) степенным полиномом второго порядка относительно координат состояния. Для этого нужно, во-первых, избавиться от дробно рациональной функции штрафа за опасное сближение, входящей в состав подынтегрального выражения /0 , заменив дробь на степенной полином
т
3 ~ т3 - кт3 (Х + Х3 + ё)2 - кт3 (у1 + У3 + ё)2. (7)
1 + к ( х1 + Х3 + ё)2 + к (у1 + у3 + ё )2 Во-вторых, необходимо подставить найденные значения (6) оптимального управления и1опт и и2опт в слагаемые правой части уравнения Беллмана (5), их содержащие, и которые при т0 = 1 равны и2 и2
^ + Ъ1и1 (в2 + ¥12Х1 + 72Х2 + ¥23У1 + ¥24У2 ) + ~Г + Ъ2и2 (в4 + ¥34У + ПУ2 + ¥14Х1 + ¥24Х2 ) = 2 2 (8)
-0, 5Ъ12 (в + ¥12Х1 + 72Х2 + ¥23У1 + ¥24У2 )2 - 0 5Ъ22Ч2 (в2 + ¥34У1 + 74У2 + ¥14Х1 + ¥24Х2 )2
Подставляя полученные выражения (7) и (8) в уравнение (5), можно получить степенной полином второго порядка, содержащий 14 слагаемых, имеющих при разных степенях х^ и у свои
множители, нелинейно зависящие от 14 искомых коэффициентов функции Беллмана - .
Для их нахождения необходимо согласно [3] использовать условие = о для установив-
дХ
шегося состояния, приравняв множители при одинаковых степенях полинома относительно координат системы х1, х2, у1, у2 в левой и правой частях уравнения (5).
Тогда можно получить следующие 14 нелинейных алгебраических уравнений относительно всех неизвестных коэффициентов в,у,¥т и попробовать найти их приближенным путем.
1. т1ш1 + кт3 (х3 + ё) + Ъ2в2¥12 + д2Ъ22 ¥14в4 - ¥13Р = 0 .
2. А - аЛ - Ъ\ в2У2 - Ц^РК 24 + ¥23Р = 0 .
3. т - кт3 - ¥ - дХК = 0.
4. 0,5т + ¥12 - «1X2 - 0,5Ь?у22 - 0,5д2Ъ2¥224 = 0.
5. т1ш2 + кт3 (у3 + ё) + 23 + д2Ъ2¥34р4 -У3Р = 0 .
6. в - а2рА - ъЪ2в2¥24 - д2ъ1р4У4 + ¥34Р = 0 .
7. т - кт3 - ЪК - д2Ъ2к2 = 0. (9)
8. 0,5т2 + к34 -а2у4 - 0,5ЪК2 - 0,5д2Ъ2^ = 0.
9. Гх - аК12 - Ъ12¥12Г2 - д^КК = 0 .
10. ^3 - а2^34 - Ъ12¥23¥24 - Ц^ЪК = 0 .
11. Ъ12¥12¥23 + д2Ъ22¥14¥34 = 0 .
12. (а1 + а2К24 + Ъ\ У2¥24 + д^УКгККть = 0 .
13. ¥13 - (а2 + Ъ22Г4)¥14 - Ъ12¥12¥24 = 0 .
14. ¥13 - (а1 + Ъ12Г2)¥23 - д2Ъ22¥34¥24 = 0 .
Ясно, что найти строгое аналитическое решение для ^,у,¥ш в квадратурах невозможно, поэтому нужно принять ряд допущений. В качестве первого приближения допустим, что динамические свойства сближающихся ВС примерно одинаковы, т.е. а1 = а2,Ъ1 = Ъ2. Тогда внимательный анализ уравнений - 3, 7, 11, 13, 14 системы (9) показывает, что если принять у12 = ¥34, то коэффициенты ¥14 = ¥23 = 0 . Поэтому из уравнений 3,7 системы (9) получим
¥12 =¥34 = ^Т - кТ3 = N. (10)
Ъ1
Это позволяет сразу найти из уравнений 1 и 5 коэффициенты в2 и в4 :
= тш1 + кт3(х3 + ё) -¥3Р = 0 в = тш2 + кт3(у3 + ё) -У3Р = 0 (11)
в Ъ2 N 0, в дЪ] N (11)
Осталось найти у2, уА и к24, чтобы полностью определить параметры алгоритмов оптимального управления (6). Для этого требуется проанализировать уравнения 4, 8 и 12 системы (9). Ясно, что у2 = у4, а для нахождения у2 и ¥24 нужно учесть уравнения 4 и 12:
4. 0,5т + ¥12 - а^ - 0,5Ъ2Г2 - 0,5дЪК] = 0. 12. (2а + 2Ь2у2)к24 = 0.
В первом случае, если щ24 ф 0, из уравнения 11 получим
а
п=-^ <0-
что противоречит физическому смыслу процесса управления. В частности, при управлении одним ВС знак у2 положителен. Во втором случае, если предположить, что щ24 = 0, для нахождения у2 надо решить квадратное уравнение 4. Как показал анализ различных корней этого уравнения, при > 0 лучшим решением является приближенное
* £ + ^ . (12)
Й, ¿1
Полученных оценок (10-12) достаточно, чтобы сформировать оптимальное управление (6) в квадратурах, и главное - найти в квадратурах выражение для функции риска Б.
7 „ТЩ+ Т(х3 + ё) , , I-— а,.
= ¿1N 1 1 ъ 2 ^2 -- - - (У1 Т2 + 2 N - ¿О Х2;
и
1опт
где N =
7 ЛТ тт + кт3(у3 + ё)-N(a1 + Ъ2у7)р Л .1-— а,. (13)
= Ъ, -3^3 и2[т2 У 1-^^ - У,] - (V Т2 + 2 N -~1)у2,
-\1т1 - кт3
и
2 опт 1 - ±2 N2 -- ъ
ъ . (14)
Формулы (13) отличаются двумя особенностями. Во-первых, вдали от места сближения ВС сигнал управления и1 должен содержать разность (т1 - х1), а и2 - разность (т2 - х1), чтобы
т т
стремиться к заданной линии пути. Значит 1 =-1--> 1, а этому соответствует малое
Ъ12 N т - Т
значение кт3 □ т1 при т1 > 1. Например, для т1 = 10 можно взять величину кт3 = 1. Однако, во-вторых, в месте сближения ВС весовой коэффициент при разностях (х3 + ё - х1) и (у3 + ё - у1),
гарантирующих безопасное уклонение, будет равен —кТз— = — и окажется весьма мал. Это
Т кТз 9
произошло потому, что дробная функция штрафа (7) была нестрого заменена на степенной полином. Чтобы избежать этого недостатка, можно воспользоваться удачным приемом, использованным в [4] при "возвращении" вида дробной функции самому управлению с переменным коэффициентом при разностях (х3 + ё - х1) и (у3 + ё - у1), возрастающим по мере уменьшения расстояния Я между ВС
Я = 7(х - х3)2 + (у - у3)2 Тогда алгоритм оптимального управления выглядит так
иот = ¿1 щТт + ктС(х3 +Я1 - х ] - - х2;
ъ^ ъ2 N 2(1 + ) ¿1
, т кт3С(у3 + ё) , I- а ч
и2опт = ¿1 N\.1N т2 +-3^3 Я 2 - у1] - (4^+™ - ±1
ъ2 N 2(1 + 0^-) 1
1 4 ё2п
где в и п - параметры, подчеркивающие разницу в штрафе в зависимости от относительной
Я
дальности — между судами, при этом для в > 1 и и > 1 эта разница увеличивается; £ - коэф-ё
фициент, повышающий значимость дополнительного штрафа в месте сближения ВС. В частности, если взять £ равным величине
Ь2 N 2(1 + в) кт3
то в месте сближения при Я = ё у сигнала управления и1 появится слагаемое (х3 + ё - х1), а у и2 - слагаемое (у + ё - у1). Поэтому окончательно сигналы управления имеют вид
т (1 + в)(Хз +ё) ^ ^ |0 ЛГ а1
=ъ N[-^-2 т + - Х,] - (Т+Ш - % Х22;
Ь2 N
1 + в
(Я 2 ^п 1 " 2 Ъ
V ё 2 у
и
2 опт
7 т (1 + в)(у3 + ё) .- аь (15)
= Ъ N[77^ т2 +~-Т^Г^ - У1 ] - ^Т2 + 2N - -1)У2.
Ъ2 N2
1 + в
(Я 2 ^п 1 * 2 ъ
V ё 2 у
Формирование текущей функции риска для контроля безопасности сближения судов на пересекающихся курсах
Как было сказано выше, воспользуемся правой частью уравнения Беллмана (5) для вычисления функции риска ¥, для чего, кроме 9 найденных коэффициентов, необходимо доопределить коэффициенты у1,у3,щ13, Д, Д3. Согласно уравнениям 9,10 системы (9) величины их равны
Ух =73 = N (а + Ъ1ly1), (16)
а значения у/13 = 0 в соответствии с уравнениями 13 и 14. Значения Д и Д3 определяются из уравнений 2 и 6
Д = ДМ + Ъ2у2) ; Д = Д(а + Ъ2у2) . (17)
Подставив все оценки коэффициентов (10-12) и (16-17) в формулу для правой части уравнения (5), можно получить
* 2 2 2 2 и и
¥ = /о + [ДМ2 + Х + (N - аъ) Х2] Х2 + ДМ2 + У1 + (N - аУг) У 2] У 2-^¡Т, (18)
где N определяется по формуле (14); Д2 и Д4 - по формулам (11); у2 - по формуле (12); значения и1опт и и2опт - по формулам (15), а величина /0* в соответствии с выражением (3) равна
/0* = Т [(х1 - т1)2 + (у1 - т2 )2 ] + Т (х22 + У22) +-Т-7. (19)
0 22 2 1 + к(х1 + х3 + ё)2 + к (У1 + У3 + ё)2
При этом координаты системы х1, х2, х3, У1, У2, У3 определяются из дифференциальных уравнений (1) и (2). Таким образом, полученных формул достаточно, чтобы в квадратурах определить зависимость функции риска ¥ от координат состояния системы.
Необходимо заметить, что в формуле (18) управления и1 и и2 возводятся в квадрат и входят в функцию риска ¥ со знаком минус аддитивно. Это означает, что при отсутствии принятых мер при и1 = и2 = 0 функция текущего риска максимальна, при и1 = и1опт и и2 = 0 или и1 = 0 и и2 = иопт она снижается, а минимум риска возникает при координированном управлении движением двух судов при и1 = и1опт и и2 = и2опт, что соответствует физическому смыслу решаемой задачи.
Результаты моделирования процесса управляемого сближения двух ВС
С помощью уравнений движения (1) и (2), алгоритма (15) оптимального управления ими в среде Matlab проводилось моделирование процессов сближения двух судов на пересекающихся курсах, как показано на рис. 2.
Моделирование движения производилось при следующих исходных данных:
т1 = 40; т2 = 100 м; = от2 = c2 = d2 = 0,5; Ь1 = Ь2 = 0,1;
Т = 0,001; т2 = 2;т3 = 0,001; к = 0,001; ё = 30 м;0 = 0,2; п = 2;
/3 = 0,001; р = 10; д = 10.
Начальные условия движения таковы, что при отсутствии бокового маневрирования оба ВС столкнутся в точке А
X (0) = тх = 40; х2 (0) = 0; х3 (0) = М = 40; у (0) = т2 = 100; у2 (0) = 0; у3 (0) = 100. Кроме того, ввиду движения встречного ВС 2 слева по отношению к ВС 1, оба осуществляют боковое движение в одном направлении - вправо.
Одновременно с процессом движения вычислялась функция текущего риска ¥ по формуле (19), как показано на рис. 3.
Моделировалось два случая сближения судов - при управлении боковым движением только ВС 1 и при управлении обеими ВС 1 и 2. При этом в обоих случаях вычисляемая функция текущего риска сравнивалась с двумя порогами - ¥т1п и ¥тах, показанными на рис. 3. Если
¥ < ¥т1п, то дополнительное боковое маневрирование ВС не применяется вообще. Если ¥т1п < ¥ < ¥тах , то используется боковое движение одного ВС, а в случае ¥ > ¥тах необходимо маневрировать обоим ВС, либо менять скорости попутного движения.
20 ral« 60 30 100 120 140 160 130 200
I i у 1®
© /
_ _ _ _(Vi _
i
) 60 во 100 120 140 160 180 200 220 240 .
т2 Х(м)
У(м)
Рис. 2. Картина сближения двух ВС на пересекающихся под углом 90s курсах
В первом случае управления ВС 1 оказалось, что в новую точку встречи В воздушное судно 2 попадает в момент, когда ВС 1 находится в точке С, в результате чего расстояние между точками В и С получилось равным Я = 15м, что меньше заданной безопасной дистанции ё = 30м. Из графика соответствующей этому случаю функции риска ¥1 видно, что риск при I > ¿2 превышает порог ¥тах, что также подтверждает необходимость принятия дополнительных мер обоими судами.
Во втором случае координированного управления боковым движением обоих ВС функция риска ¥2 превышает порог через время ^ = Х1, после чего оба ВС маневрируют вправо. В результате во вторую новую точку встречи Б ВС 2 попадает в момент, когда ВС 1 находится в точке Е. При этом расстояние между точками Б и Е получилось равным Я = 35м > d, что гарантирует безопасность движения.
Таким образом, контроль безопасности движения при сравнении функции риска ¥ с различными порогами позволяет выбрать нужную альтернативу из каскада дополнительных мер по предотвращению аварийного сближения судов.
¡Ь'з прир^Ой и2-0
|Р] прн^/ОиТ^/О
20 40 60 80 100 120 140 160 180
Рис. 3. Поведение функций текущего риска ¥1 и ¥2 при управлении одним ВС и двумя ВС при их сближении
200 I,,
Заключение
На основании проведенных исследований можно сделать следующие выводы: 1. С помощью оптимального синтеза сформирован алгоритм управления боковым движением двух ВС при их сближении на пересекающихся курсах. Показано, что в сигнале управления в качестве задающего воздействия по линейной координате бокового движения используется: вдали от места сближения - заданная линия пути, а в точке сближения - заданная безопасная дистанция между двумя ВС.
2. Найдено аналитическое выражение для вычисления функции текущего риска в виде степенного полинома второго порядка от координат движения и управляющих сигналов. Обнаружено прогнозируемое свойство снижения риска при увеличении числа дополнительных мер в зависимости от одновременного бокового маневрирования и изменения попутной скорости.
3. Сравнение вычисляемой функции риска с заданными порогами позволяет выбрать нужную группу предупредительных мер, гарантирующих безопасность сближения ВС.
4. При контроле безопасности использовалась модель бокового движения судна, описываемая системой дифференциальных уравнений второго порядка, однако при синтезе самого управления необходимо использовать в предстоящих исследованиях модель более высокого порядка.
5. Необходимо уточнить решение задачи безопасного управляемого движения двух ВС на пересекающихся курсах под углом, неравным 90°.
ЛИТЕРАТУРА
1. Беллман Р. Динамическое программирование. - М.: ИИЛ, 1961.
2. Лебедев Г.Н. и др. Теория оптимальных систем. - М.: МАИ, 1993.
3. Лётов А.М. Динамика полета и управления. - М.: Наука, 1964.
4. Лебедев Г.Н., Чан Ван Туен, Китаев А.Н. Совместное управление и контроль безопасности полета воздушных судов при их сближении. - М.: МАИ, 2011. - Т. 18. - № 3. - С. 29-35.
5. Лебедев Г.Н., Тин Пхон Чжо, Чан Ван Туен Решение задачи динамического программирования при безопасном попутном движении воздушных судов // Труды МАИ. - 2012. - № 54.
6. Лебедев Г.Н., Тин Пхон Чжо, Зо Мин Тайк, Хахулин Г.Ф., Малыгин В.Б. Оптимальное управление и контроль безопасности поперечного движения речных и воздушных судов при пересечении их маршрутов // Ме-хатроника, автоматизация, управление. - 2012. - № 12. - С. 50-55.
AUTOMATIC CONTROL OF THE SECURITY APPROACH OF TWO CONTROLLED AIR OR SEA VESSELS CROSSING THEIR ROUTES
Zaw Min Htike, Vu Xuan Huong, Zaitsev А.В., Tin Phone Kyaw
The problem of automatic control of convergence of vessels on crossing routes. A method for calculating the risk function of collision based on dynamic programming, which allows us to formulate alarms for taking precautionary measures to control the lateral and longitudinal movement.
Key words: security control, optimal control, aircraft, dynamic programming, the risk function.
Сведения об авторах
Зо Мин Тайк, 1985 г.р., окончил МАИ (2011), аспирант МАИ, автор 3 научных работ, область научных интересов - методы оптимального управления.
Ву Суан Хыонг, 1984 г.р., окончил МАИ (2011), аспирант МАИ, автор 3 научных работ, область научных интересов - методы оптимального управления.
Зайцев Александр Владимирович, 1956 г.р., окончил Серпуховское высшее военное командное училище (1979), доктор технических наук, профессор кафедры систем автоматического и интеллектуального управления МАИ, автор более 60 научных работ, область научных интересов - система управления летательных аппаратов и системы искусственного интеллекта.
Тин Пхон Чжо, 1978 г.р., окончил МАИ (2007), кандидат технических наук, докторант МАИ, автор 18 научных работ, область научных интересов - методы оптимального управления.