У
правление подвижными объектами и навигация
УДК 629.735
МЕТОД ЛОКАЛИЗАЦИИ МНОГИХ ЦЕЛЕЙ С ПОМОЩЬЮ УГЛОВЫХ НАБЛЮДЕНИЙ
К.В. Андреев
Рассмотрена задача определения координат многих целей с помощью пассивной пеленгации радиолокационных станций с борта беспилотного летательного аппарата при наличии ложных наблюдений. Дан анализ различных методов субоптимального приближения метода многих гипотез Рида и алгоритмов Probability Hypothesis Density (PHD)-фильтрации. Рассмотрены варианты реализации алгоритмов PHD-фильтрации методом Монте-Карло и методом гауссовых сумм, который выбран как наиболее подходящий для решения данной задачи. Приведен иллюстрирующий пример.
Ключевые слова: угловые наблюдения, множественная фильтрация, метод многих гипотез, PHD-фильтрация.
введение
Обнаружение, локализация и идентификация целей, а также их сопровождение и целеуказание обычно выполняются с помощью пассивных средств наблюдения, таких как радиопеленгаторы (direction finders), оптические или инфракрасные камеры. Отсутствие прямых измерений дальности до цели приводит к необходимости решения задачи определения ее координат на основе только угловых наблюдений (bearing-only measurements).
Решение задачи локализации многих целей по пеленговым наблюдениям представляет собой один из наиболее важных этапов разработки алгоритма управления разведывательным беспилотным летательным аппаратом (БЛА), осуществляющим миссию пассивной разведки над районом расположения радиолокационных станций (РЛС) и предполагаемых целей. Априорное положение этих станций и режим их работы неизвестны, поэтому миссия должна планироваться в реальном масштабе времени с учетом ограниченных полетных ресурсов БЛА и наблюдаемых им источников радиоизлучения, демонстрирующих активность РЛС. Цель миссии состоит в наиболее точном по возможности определении координат РЛС, действующих в период выполнения миссии.
В настоящей работе исследованы алгоритмы определения координат многих неподвижных це-
лей по угловым наблюдениям. Предполагается, что наблюдения представляют собой наборы идентичных и неразличимых пеленгов, получаемых периодически в моменты времени {А?, 2А?, ..., кА?}, А? = 0,1 с. В каждый набор пеленгов Фг = {фл, ..., фт} в момент времени iАt входят как истинные (с вероятностью детектирования Рв и белым гауссовым шумом с ст = 26 мрад), так и ложные пеленги. Ложные пеленги распределены равномерно на интервале [0; 2п), их число имеет распределение Пуассона с постоянной интенсивностью X = 15. Неразрешенные наблюдения, рассмотренные в работе [1], в модели отсутствуют.
1. алгоритмы множественной фильтрации
Решение задачи определения координат неподвижного источника излучения по пеленговым наблюдениям впервые было предложено Стэнсфил-дом в 1947 г. [2]. На сегодня существуют различные алгоритмы локализации одной РЛС, среди них расширенный фильтр Калмана или набор таких фильтров, соответствующих различным диапазонам дальности [3]. Они применяются для определения координат единственной РЛС при отсутствии проблемы отождествления наблюдений с источником, возникающей при определении координат многих РЛС, когда они плотно расположены. Существующие алгоритмы определения коор-
динат многих целей опираются на два различных подхода, описанных далее: метод многих гипотез (п. 1.1) и метод Байесовской фильтрации (п. 1.2).
1.1. Метод многих гипотез Рида
В методе многих гипотез состояние системы описывается в виде таблицы треков, т. е. оценок координат и элементов движения отдельных целей. Необходимо строить гипотезы ассоциаций наблюдений с треками для решения проблемы отождествления наблюдений с источником. Впервые решение данной задачи было систематически описано Ридом [4]. Для формирования оценок координат и элементов движения различных треков применяются алгоритмы оценки координат одной РЛС, а истинными считаются те треки, вероятность существования которых больше некоторого порогового значения.
Алгоритм Рида является оптимальным, однако на практике он не применим [5]. Один из возможных способов субоптимальной реализации алгоритма Рида заключается в сохранении ограниченного числа наилучших гипотез ассоциации наблюдений с треками после обработки очередного набора наблюдений. Однако применение данного метода напрямую (генерация всех возможных гипотез и последующий выбор нескольких наилучших) по-прежнему неэффективно из-за сложности вычислений. В работе [6] впервые был сформулирован подход, позволивший в дальнейшем построить алгоритм, избегающий полного перебора гипотез. А именно, задача нахождения наилучшей гипотезы была сформулирована как задача о назначениях (linear assignment problem), а алгоритм Мурти позволяет выбрать лучшие назначения в порядке убывания их стоимости [7]. Такой подход позволяет быстро находить заданное число лучших гипотез ассоциации наблюдений с источником.
Однако в работе [5] показано, что при локализации целей по угловым наблюдениям в случае пересечения треков (т. е. при пересечении БЛА линии, проведенной через две какие-либо цели), получаемые оценки координат могут быть смещенными, в результате получаются «цели-призраки» («ghost-targets»).
1.2. Метод общей байесовской фильтрации
В работе [8] задача фильтрации наблюдений впервые была рассмотрена в рамках общего Байесовского подхода, сформулированного в терминах случайных конечных множеств [9]. Основная особенность такого подхода состоит в отказе от таблицы треков и построения гипотез ассоциации наблюдений с треком, а строится оценка совокупного состояния (т. е. координат и элементов дви-
жения) многих целей с помощью правила Байеса. Случайное конечное множество служит естественной математической моделью как состояния системы из нескольких целей, так и получаемых наблюдений, поскольку данные объекты характеризуются случайным числом случайных величин.
Пусть /цк(х |Фк) — плотность распределения вероятности состояния системы, полученная после получения и обработки 1с наборов наблюдений
Фк = {Фр ..., Фк}. Через Фк будем обозначать кумулятивный набор наблюдений вплоть до момента времени кА1, а через Ф; = {фл, ..., фш} — набор наблюдений в момент времени Ш.
Индексом к|к будем обозначать состояние системы после получения и обработки к наблюдений, а индексом к + 1|к — состояние системы, ожидаемое в момент времени к + 1 на основании получения и обработки к наблюдений, т. е. на шаге экстраполяции или предиктора.
Движение целей по предположению представляет собой марковский процесс. Плотность вероятности перехода от множества состояний системы х' при ? = кА1 к множеству х при I = (к + 1)А?
обозначим /к +1|к(х|х'). Пусть /к+ х (Фк + ^х) представляет собой функцию правдоподобия сенсора (т. е. плотность распределения вероятности получить набор наблюдений Фк + 1 при условии, что состояние системы описывается множеством х). Тогда общий байесовский фильтр описывается системой уравнений предиктора (уравнение Чепмена — Колмогорова):
и + 1|к(х |фк) = |4 +1 | к(х|х' Кф'ф)^ (1)
и корректора (правило Байеса)
A+1k + i(x |ф +1) =
k + 1ч _ 1ф+ 1(Ф + 11 X)fk + 1|k(x 1Ф)
\lk+ 1(фк +11 x)fk + 1|k(x|Ф )dx
(2)
1.3. Приближенное решение уравнений общей байесовской фильтрации — PHD-фильтр
В работах [10, 11] для приближенного решения уравнений байесовского фильтра используется статистический момент первого порядка, который представляет собой аналог плотности распределения вероятности dk|k(x ф^определенной на фазовом пространстве состояний одной цели x из области наблюдения Х0. За функцией d^k(x ф^ закрепилось название probability hypothesis density (PHD). Она отличается от плотности распределения вероятности тем, что для любого подмножества фа-
зового пространства ^ с Х0 интеграл |йк,к(х)йх
равен ожидаемому числу целей в При ^ = Х0
Nк\к = | ^к(х)Л — ожидаемое полное число целей.
х0
Соответствующий алгоритм фильтрации носит название РНЭ-фильтра. Появление новых целей на каждом шаге моделируется плотностью распределения вероятности Ьк + ^к(х) того, что цели с множеством состояний х появятся в момент (к + 1)А?. Принятым наблюдениям соответствует функция
правдоподобия сенсора +1 (ф|х), где ф — принятый пеленг. Ложные наблюдения имеют равномерное распределение ск(ф) = 1/(2п), их число имеет пуассоновское распределение со средним значением X. На шаге предиктора и корректора уравнения байесовского фильтра (1) и (2) примут вид:
ак+1\к(х) =
Ьк + 1\к(х) + 1Р5<х)/к + 1\к(х|х' И\к(х' ^
ik + + i(x) = (1 - PD(x))dk + 1\kPD(x)
x £ _lk + 1(x)_
фефк +1 2П + Jdk + i|kl* + i( x ) Pd ( x )dx
(3)
Величина PS характеризует вероятность того, что при переходе от шага к к шагу к + 1 цель останется доступной для наблюдений. Инициализация d0|0 PHD-фильтра осуществляется на основании имеющихся априорных оценок координат целей, или из равномерного распределения.
Поскольку PHD-фильтрация не использует в явном виде ассоциации наблюдений с треками, то ее применение позволяет избежать эффекта «целей-призраков» [5], потому в дальнейшем будет рассматриваться только PHD-алгоритмы. Решение уравнений PHD-фильтра связано с многомерными интегралами, поэтому для его практической реализации необходимо воспользоваться методами приближения PHD для получения решения в замкнутом виде.
2. АЛГОРИТМ ФИЛЬТРАЦИИ НАБЛЮДЕНИЙ
2.1. Фильтр SMC-PHD
Существует два наиболее распространенных способа решения рассматриваемой задачи. В работе [12] приведен подробный вывод уравнений для случая, когда PHD описывается приближенно с помощью системы взвешенных частиц
т. е. dk| k(x|Ф ) = £ Wk|k5(Xk|k ) I. Параметр v опре
деляет число частиц. Такая реализация получила название SMC-PHD-фильтра (Sequential Monte-Carlo).
Наиболее сложный в данном алгоритме шаг корректора. На этом шаге на основании полученных наблюдений обновляются веса частиц в соответствии с уравнением (3):
Wk|k = - 1 - PD( Xk + 1|k ) +
+
z
РД (хк + 1\к) -к + 1 ( хк + 1\к )_
" к ^
ф е Фк + 1 ХСк(ф) + 1 X Рд(хк + 1\ к) 1% +1(хк + 1\ к)
У = 1
Из системы взвешенных частиц необходимо получить новую систему частиц с одинаковыми весами. В противном случае эффективное число частиц, описывающих систему, может существенно снизиться из-за того, что веса большой доли частиц будут близки к нулю [12]. Основная трудность применения ВМС-РНЭ-фильтра при фильтрации угловых наблюдений вызвана наличием ненаблюдаемой компоненты координат РЛС. Самый простой способ генерации новой системы частиц состоит в дублировании/удалении частиц на основании их весовых коэффициентов. Для этого используется мультиномиальное распределение, с помощью которого генерируется V чисел ..., ел}::
..., g =
v!
'1 '1 'v
wk +1| k +1 wk +1| k +1... wk +1| k +1.
Для каждого элемента et данной выборки создается ег копий частицы хк + ^ + х. В случае, если et равно нулю, то частица удаляется.
В работе [12] предложено осуществлять процедуру повторной выборки точек с помощью оконных функций, в частности, окна Епанечникова. Такой подход приводит к тому, что случайный разброс координат точек вдоль ненаблюдаемой компоненты делает фильтр неустойчивым.
2.2. Уравнения фильтра GM-PHD
Другой подход основан на приближении PHD с помощью гауссовых сумм [13, 14]. В уравнениях GM-PHD-фильтра для приближения PHD используется набор взвешенных гауссовых компонент. Предполагается, что динамика каждой цели представляет собой марковский процесс с плотностью перехода fk + ^(x |x') = (x — Fkx'). Функция правдоподобия сенсора при линейной функции наблю-
X
i^... и,!
v
v
1
дений имеет вид lk +1 (ф|х) = NRk+ 1 (ф - Hk + 1x).
В приведенных выражениях 1
NQ(x - ц) =
V( 2 n)dimx| Q
exp(-1 (x- ц)ТQ 1(x- ц)
задает значение плотности нормального распределения со средним значением ц и ковариацией Q в точке x. Функция PHD в этом случае описывается уравнением
, Hk\k . dk|k(x|фk) = Z wk|k Кк]к(x - xk|k). i = 1
На шаге предиктора PHD примет вид
ak
dk + 1|k(x) = Z Pk (x - xb) + i = 1
'k
n
k\k
+ Z wk + 1|k Npi (x - xk + 1|k )
i = 1
k+ 1 k
(4)
ренного или неспецифического (ишсеМеё) в случае нелинейных уравнений динамики или наблюдений). Вес гауссовой компоненты вычисляется как
г, j
wk + 1|k +1
PD W'k+ 1|k К Dl ttT
Hk + 1 Pk + 1\ kHk + 1 + Rk + 1
(Аф''j)
Ь С(ф^ + 1) + PD Z NH P l HT + R
l=1 Hk + 1Pk + 1\ kHk + 1 + Rk + 1(Аф )
где Афг' 1 = фу — Нк + 1( х'к + 1|к) — соответствующая поправка к гауссовой компоненте, Нк +1(") — функция наблюдения (в общем случае может быть нелинейной). Заметим, что обновленная оценка
функции РНЭ имеет пк + 1|к +1 = пк + 1|к(1 + мк + 1)
компонент. Это значит, что число компонент экспоненциально растет со временем. Поэтому при практической реализации данного фильтра необходимо применять процедуры, уменьшающие общее число компонент, например процедуру удаления и слияния, описанную в работе [14].
где вес w'k + 1\k = PS w'k\k, предсказанное значение
координат xk + 1|k = Fkx'k\k и матрицы ковариации
P'k + 1|k = Qk + Fk Pk|k . Первая сумма в уравнении (4) соответствует новым целям, вторая — динамике существующих целей.
После шага предиктора аппроксимация dk + ^k(x) содержит nk + 1|k = nk|k + ak гауссовых компонент. Перепишем эту аппроксимацию PHD в виде
nk + 1 k
dk + 1|k + 1(xф) = Z w'k + 1k ~ P
i = 1
Ni (x - xk + 1|k).
k+ 1 k
Пусть после шага предиктора был получен на-
бор наблюдений Фк + 1 = {фк + 1, ..., фк+ +1} из Мк + 1 пеленгов, тогда уравнение корректора примет вид
1|к + 1(х) = (1 - рв)йк + 1|к(х) +
"k + 1|k
nk + 1\ k Mk + 1
+
Z Z wk
i = 1 j = 1
i j
+ 1|k + 1
N'
p.
k + 1\ k + 1
(x - xkj+ 1|k). (5)
Первое слагаемое соответствует вероятности того, что предполагаемые цели (представленные отдельно взятой гауссовой компонентой) не были детектированы. Второе слагаемое в виде двойной суммы по числу целей пк + и полученных наблюдений Мк + 1 соответствует обновлению каждой гауссовой компоненты каждым наблюдением с помощью уравнений фильтра Калмана (расши-
2.3. Предлагаемый алгоритм
При разработке алгоритма определения координат многих целей особое внимание необходимо уделить инициализации новых целей. Для повышения точности оценки координат РЛС для GM-PHD фильтра разумно использовать несколько гауссовых компонент на различном расстоянии от БЛА. Для обновления PHD при обнаружении новой предполагаемой цели к PHD добавляется набор гауссовых компонент (первое слагаемое в формуле (4)). Для каждой новой компоненты оценка xlb расположена вдоль направления, в котором обнаружена новая цель. Различным гауссовым компонентам соответствуют различные расстояния от
БЛА до оценки xJb по аналогии с работой [3].
Для инициализации новых целей применяется предварительная фильтрация угловых наблюдений. Фильтруется только пеленг (ф) и скорость его
изменения (ф). С каждым новым наблюдением ассоциируется новая гауссова компонента. Неопределенность скорости изменения направления выбирается исходя из скорости движения БЛА и минимального расстояния, на котором БЛА может обнаружить цель. Как и в работе [14], компонента с весом, ниже некоторого порогового, удаляются. Если какая-либо гауссова компонента в течение нескольких шагов подряд не была удалена и объединена с уже существующей гауссовой компонентой, то считается, что обнаружена новая цель. Если вес какой-либо компоненты превысил еди-
ницу, то полагается, что на линии, соединяющей БЛА и существующую цель, появилась новая цель. При обнаружении новых возможных направлений основной фильтр инициализирует гауссовы компоненты по аналогии с работой [2] и осуществляет оценку координат РЛС с помощью ОМ-РНЭ-фильтра.
Такой подход позволяет надежно обнаруживать новые цели и осуществлять точную локализацию благодаря небольшой начальной ковариа-ции каждой из гауссовых компонент. Двухступенчатая фильтрация позволяет существенно снизить общее число гауссовых компонент. Метод гауссовых сумм позволяет обновлять оценки координат для каждой гауссовой компоненты параллельно, поэтому можно добиться гарантированной обработки набора наблюдений в течение интервала времени между последовательными наблюдениями, ограничив максимальное число гауссовых компонент.
2.4. пример: сценарий моделирования
В большинстве работ при анализе алгоритмов фильтрации угловых наблюдений (см., например, работу [15]) информация о расстоянии до цели косвенно известна благодаря измерению двух углов (азимута и подъема). В данном примере обрабатывается только информация об азимуте.
В соответствии со сценарием оцениваются координаты трех РЛС с помощью БЛА, выполняющего полет по окружности радиусом 30 км с центром в начале координат (рис. 1). Ось ОХ направлена на восток, ось ОУ — на север. Беспилотный летательный аппарат стартует в точке (х, у) = (30; 0) км на север, скорость его полета постоянна и составляет 200 м/с. В начальный момент времени две активных РЛС (на рис. 1 обозначены «звез-
Рис. 1. Сценарий наблюдения за тремя РЛС
Рис. 2. Набор гауссовых компонент в различные моменты времени
дочками» 1 и 2) расположены на линии, соединяющей БЛА и центр окружности с координатами (±3; 0) км.
В момент времени t = 30 с для наблюдений становится доступна третья РЛС 3 с координатами (—6; —3) км.
После обнаружения двух целей GM-PHD-алго-ритм не может их различить. Для двух близких по значению наблюдений, полученных от различных целей, на каждом шаге обновления PHD (см. формулу (5)) количество гауссовых компонент удваивается. Затем, в результате процедуры слияния и удаления они вновь будут объединены, поскольку значения пеленгов близки. Вид PHD при этом схематично представлен в верхней части рис. 2 при t = 10 с.
В момент обнаружения третьей цели (см. рис. 2, t = 32 с) к смеси гауссовых компонент добавляются новые компоненты с различными расстояниями между БЛА и РЛС. Новая цель неотделима по направлению от двух ранее обнаруженных, потому гауссовы компоненты размножаются (см. уравнение (5)) и не могут быть удалены.
Алгоритм слияния и удаления, предложенный в работе [14], осуществляет процедуру объединения гауссовых компонент в порядке убывания их веса. Гауссовы компоненты PHD, описывающие обнаруженные цели, не будут объединяться с компонентами, имеющими большую ковариацию и меньший вес, т. е. оценки координат обнаруженных целей не ухудшаются со временем. В момент времени t = 98 с все три цели разделены. При десятикратном повторении эксперимента с различными независимыми последовательностями случайных чисел ложных срабатываний и пропущенных обнаружений новых целей предварительным фильтром не выявлено.
заключение
Рассмотрены различные алгоритмы определения координат многих целей по угловым наблюдениям: метод многих гипотез Рида и его субоптимальное решение с выбором К-лучших гипотез ассоциации, а также алгоритмы РНЭ-фильтрации, основанные на методе Монте-Карло и методе Гауссовых сумм. Метод многих гипотез Рида не позволяет определять координаты многих целей по угловым наблюдениям [5]. Алгоритмы 8МС-РНЭ-фильтрации не могут быть использованы из-за необходимости выполнения процедуры повторной выборки. Метод гауссовых сумм благодаря отсутствию маркировки треков и процедуры повторной выборки позволяет эффективно разделять близкие по углам цели.
литература
1. Емельянов Д.Д, Рубинович Е.Я. Слежение в многоцелевой обстановке. Метод многих гипотез в информационно-множественной фильтрации // Автоматика и телемеханика. - 2010. - № 2. - С. 59-75.
2. Stansfiled R.G. Statistical Theory of D. F. Fixing. Part III: Radiocommunication // Journal of the Institution of Electronical Engineers. - 1947. - Vol. 94 (15). - P. 762-770.
3. Peach N. Bearings-only Tracking Using a Set of Range-Parameterized Extended Kalman Filters // IEEE Proc. of Control Theory and Applications. - 1995. - Vol. 142 (1). - P. 73-80.
4. Ried D. An Algorithm for Tracking Multiple Targets // IEEE Trans. on Automatic Control. - 1979. - Vol. 24 (6). -P. 843-854.
5. Blackman S. Multiple Hypothesis Tracking for Multiple Target Tracking // Aerospace and Electronic Systems Magazine. — 1994. — P. 287—195.
6. Danchik R., Newman G.E. Reformulating Ried's MHT method with generalized Murty K-Best Ranked Linear Assignment Algorithm // IEEE Proc. Radar, Sonar and Navigation. — 2006. — Vol. 153 (1). — P. 13—22.
7. Murty K.G. An Algorithms for ranking All The Assignments in Order of Increasing Cost // Operations Research. — 1968. — Vol. 16, iss. 3. — P. 682—687.
8. Mahler R.P.S. Random Set Approach to Data Fusion // Proc. of SPIE. — 1994. — Vol. 2234 — doi:10.1117/12.181026/
9. Goodman I., Mahler R.P.S., Nguyen H. Mathematics of Data Fusion. — N.-Y.: Springer-Verlag, 1997.
10. Mahler R.P.S. A Theoretical Foundation for the Stein-Winter Probability Hypothesis Density (PHD) Multi-Target Tracking Approach // — Proc. of MSS National Symp. on Sensor and Data Fusion. — 2000. — Vol. 1.
11. Mahler R.P.S. Random Set Theory for Target Tracking and Identification. Data Fusion Handbook. — Boca Raton: CRC Press, 2001.
12. Zajic T., Mahler R.P.S. Particle-Systems Implementation of the PHD Multitarget Tracking Filter // SPIE Conference Series. — 2003. — Vol. 5096. — P. 291—299.
13. Ba-Ngu Vo, Wink-Kin Ma. The Gaussian Mixture Probability Hypothesis Density Filter // IEEE Trans. on Signal Processing. — 2006. — Vol. 54, N 11. — P. 4091—4104.
14. Clark D.E., Panta K, Vo B-N. The GM-PHD Filter Multiple Target Filter // 9-th Intern. Conf. on Data Fusion. — 2006. — P. 1—8.
15. Lanneuville D., Houssineau J. Passive Multi-target tracking with GM-PHD filter // 13-th Conf. on Information Fusion (FUSION). — 2010. — C. 1—7.
Статья представлена к публикации членом редколлегии
Е.Я. Рубиновичем.
Андреев Кирилл Владимирович — науч. сотрудник,
ЗАО «Телум», г. Москва,
® (495) 646-61-62, И [email protected].
iößaa книга
Цыкунов А.М. Робастное управление с компенсацией возмущений. — М.: ФИЗМАТЛИТ, 2012. — 300 с. —
ISBN 978-5-9221-1418-9.
Исследованы принципы построения робастных систем управления. Получены условия выбора параметров управляющего устройства, синтезированного с помощью метода внутренней модели, которые обеспечивают компенсацию возмущений с заданной точностью. При этом замкнутая система описывается требуемым характеристическим уравнением. Рассмотрены задачи робастного управления для различных структурно-неопределенных математических моделей объекта управления. Приведены результаты применения робастных систем управления для сингулярно-возмущенных объектов и принципы построения систем управления путем введения быстрых составляющих. Получены интегральные алгоритмы робастного управления для различных типов объектов. В отличие от ранее известных алгоритмов, они не требуют выделения сигнала, несущего информацию о возмущениях, что упрощает их техническую реализацию.
Предложен новый принцип построения робастных систем управления, позволяющий компенсировать параметрические и внешние возмущения с заданной точностью при наличии помех в каналах измерения. Выделен класс объектов, в которых можно скомпенсировать возмущения и помехи на выходе объекта управления.
С помощью предложенных подходов спроектированы робастные системы управления для различных типов объектов: стационарных и нестационарных, с запаздыванием и без запаздывания, линейных и нелинейных, а также для многосвязных. Все предлагаемые подходы теоретически обоснованы, для иллюстрации полученных результатов приведены числовые примеры и результаты их моделирования. Часть результатов публикуется впервые.
Для научных работников, инженеров, преподавателей, аспирантов и студентов, специализирующихся в области автоматического управления и прикладной математики.