УДК 621.391.172
О. А. Степанов, А. Б. Торопов
ИСПОЛЬЗОВАНИЕ ПОСЛЕДОВАТЕЛЬНЫХ МЕТОДОВ МОНТЕ-КАРЛО В ЗАДАЧЕ КОРРЕЛЯЦИОННО-ЭКСТРЕМАЛЬНОЙ НАВИГАЦИИ
Исследуется возможность применения последовательных методов Монте-Карло в задаче корреляционно-экстремальной навигации при учете изменчивости оцениваемого вектора. Обсуждаются особенности применения таких методов и предлагается алгоритм, основанный на апостериорной (повторной) существенной выборке.
Ключевые слова: метод Монте-Карло, фильтрация, точность, навигация.
Введение. В последнее время значительное развитие получили рекуррентные алгоритмы решения задач нелинейной фильтрации, основанные на последовательных методах Монте-Карло. К ним, в частности, относятся парциальные фильтры (particle filtres), бутстрэп (bootstrap) фильтры и ряд их модификаций [1—3]. В настоящей работе исследуется возможность применения аналогичных алгоритмов в задаче корреляционно-экстремальной навигации. Особенность этой задачи заключается в ее нелинейном и протяженном во времени характере, что обусловливает необходимость учета изменчивости оцениваемого вектора. Обычно такой учет осуществляется путем сведения исходной нелинейной задачи к некоторому линейному аналогу [4], что при определенных условиях приводит к снижению точности решения. В настоящей работе предлагается учитывать изменчивость в рамках нелинейной постановки задачи при ее решении с использованием последовательных методов Монте-Карло.
Постановка задачи корреляционно-экстремальной навигации. Задача корреляционно-экстремальной навигации может быть сформулирована следующим образом [4]. Пусть известны значения параметров ф/, Xi некоторой навигационной системы в i -е моменты времени
ф i = Ф/ + A(i, Х i =Х i +AÀ, i, (1)
где фi, Xi — истинные координаты объекта; Дфг-, AX/ — погрешность определения координат. Предположим, что имеются скалярные измеренные параметры некоторого геофизического поля, например, рельефа дна:
yi = У(Ф/,Xi) + X + Vi, i = 1, m, (2)
где у(ф/, Xi ) — известная функция, описывающая зависимость рельефа (глубин) дна от координат; х и Vi — систематическая и флуктуационная составляющие ошибок измерений. Введем
~ T
функцию у(ф/, Xi ) = у(фi — Дфг', Xi -AXi ) = si (Дфг-, AXi ) и векторы 0i =[A(i AXi ] и
t ~
X . Тогда, используя модель для вектора xi, задачу корреляционно-экстремальной навигации можно сформулировать как задачу фильтрации вектора
Xi = Фi x— + ri w i (3)
с использованием результатов измерений
У/ = s (0i) + X + Vi, (4)
где Wi — вектор шумов; Ф/ , Г/ — известные матрицы. Будем полагать, что W/ и V/
представляют собой центрированные гауссовы, дискретные, белые шумы с матрицей кова-риации Р и дисперсией Я. Вектор начальных условий хд также полагаем центрированным гауссовым с известной матрицей ковариаций РХд.
Суть задачи фильтрации заключается в следующем. Располагая накопленными к текущему
т т т т
моменту времени г результатами измерений У = [у1 ,у2 ,..., у, ] , необходимо найти алгоритм вычисления оптимальных по среднему квадратическому отклонению (СКО) оценок Х, (У) последовательности (3), минимизирующих критерий Ji = М {(хг - Хг (У))Т (хг - Хг (У,))} , и соответствующую матрицу ковариаций их ошибок. Известно, что это может быть сделано с помощью следующих выражений [4]:
ХГ(Уг ) = | Хг/( / Уг )<Х , Р^У ) = | (х, - Хг (у. ))(х,. - Хг (Уг ))Т/(Хг / У, )<Х, , (5)
в которых /(Хг / У) — апостериорная функция плотности распределения вероятности для
Г т т ~\т
составного вектора Хг = |_хх ,..., хг " . Таким образом, задача корреляционно-экстремальной
навигации в предложенной постановке сводится к вычислению интегралов (5). Для ее решения разработаны эффективные алгоритмы для случая, когда порождающие шумы отсутствуют, а матрица Ф, — единичная. Если оцениваемый вектор изменчивый, то для вычисления интегралов можно использовать последовательные методы Монте-Карло.
В дальнейшем рассматривается простейший случай, когда считается, что матрица Ф,
т Го 1 о"
также единичная, wг — двумерные векторы, матрица Г, =
0 0 1
т. е. считается, что
ошибки 9, описываются винеровскими последовательностями.
Простейший последовательный метод Монте-Карло. Запишем выражение для апостериорной плотности распределения вероятности в виде
/ (У, / Хг )/(Хг )
/ (х, / У, ) =
| / (У, / Хг )/(Хг ^
где / (У, / X,) — функции правдоподобия, / (X,) — априорная плотность распределения вероятности составного вектора.
Предположим, что имеется X, — выборка случайных векторов, соответствующих / (X,), тогда оценка и матрица ковариаций (5) могут быть вычислены с помощью метода Монте-Карло. В результате получим формулы [4]
Хг (У,)«хМс(У)=£*/хг, р (У)-РМС(У)=!?/ (У -хМс(У))( -хМс (У))т, (6)
г= г=!
где qJi — нормированные веса, определяемые как
=qi| Е ^, (7)
qJi = / (у / Х, ) — ненормированные веса. Формулы (6) и (7) могут быть получены, если полагать, что для функции / (X,) используется аппроксимация в виде [5]:
/(Хг)«Ь ^5(Хг -Х/ ), (8)
/=1
где §(•) — многомерная дельта-функция. Соответственно плотность распределения вероятности /(Х; / ¥) может быть записана как
/(X. / ¥г) «X q{ 5(Х. - X. ). (9)
/=1
Отличительная особенность приведенных выше соотношений заключается в том, что ненормированные веса могут вычисляться с помощью рекуррентных соотношений
q/ = / (У. / х/ )/ / = /(¥-1 / Х/-1), (10)
поскольку /(¥. / Х/ ) = /(У. / ¥.-1, Ху)/(¥м / Ху) = /(у. / х/)/(¥м/ Х^). Входящая в это
выражение функция /(у. / х/ ) легко вычисляется с использованием выражения (4).
Для вычисления выражения (9) необходимо промоделировать Ь выборок случайных векторов в соответствии с функцией / (Х;). Такие выборки могут быть получены рекуррент-
но с использованием Х /_1 и соотношений (3).
Однако анализ выражения (10) показывает, что для вычисления оценки и матрицы ко-вариаций (6) на каждом шаге достаточно иметь только выборки х/1, с использованием которых формируется выборка Х/ , / = 1, Ь . Таким образом, становится очевидным, что на каждом / -м шаге нет необходимости хранить в памяти всю „предысторию", т.е. выборки Х/^ .
При использовании соотношений (6) наибольший вклад в результат вычислений оказывают выборки, расположенные в областях, где апостериорная плотность существенно отлична от нуля. Поскольку при использовании простейшего последовательного метода выборка формируется в соответствии с априорной плотностью распределения вероятности / (Х/), то
значительное число элементов выборки этому требованию не удовлетворяет. В результате с течением времени может возникнуть ситуация, когда значения всех весов (6) станут близкими к нулю, что в полной мере проявилось при попытке применения этого метода в рассматриваемой задаче корреляционно-экстремальной навигации. Эта проблема известна как проблема „вырождения" алгоритма [5].
Существуют два основных метода преодоления этой проблемы: метод существенной функции и метод апостериорной (повторной) существенной выборки [5] — в настоящей работе используем второй.
Последовательный метод Монте-Карло с апостериорной существенной выборкой. Поясним идею применения метода апостериорной существенной выборки для решения задачи фильтрации. Запишем выражение для апостериорной плотности распределения вероятности в виде
Х (11)
\ / (У//х )/(Х//¥г-1)^Хг
ч
где /(Хг-/¥г--1) — плотность прогноза. Предположим, то имеется выборка Х/, полученная в
, тогда можем записать
/ (Х / ¥-1)« Ь ¿8( - Х/ ). (12)
соответствии с этой плотностью, тогда можем записать
Ь
Ь/ =1
Чтобы сформировать выборку X, , соответствующую / (X, /У,), необходимо рассчитать [6]
= / (у, )
Х;
(13)
в соответствии с дискретным . Каждому элементу этого мно-
и промоделировать выборку случайных величин
законом распределения, задаваемым множеством
жества соответствует вероятность q■ , вычисляемая по формуле (7), в которой = ^ . Затем для вычисления /(Х,+1/ У, ) = /(х,+1/ х,)/(Х, / У,) необходимо промоделировать выборку в
Е/(х, )
соответствии с плотностью распределения вероятности
которая используется
г=1
на следующем шаге для формирования
~1
хг+1
хг+1
. Описанная процедура повторяется на
каждом шаге, благодаря чему обеспечивается рекуррентный характер алгоритма фильтрации. Эффективность применения описанной процедуры в задаче корреляционно-экстремальной навигации проиллюстрирована на рис. 1 (а — график апостериорной плотности распределения вероятности; б — априорная выборка (серый цвет) и апостериорная выборка (черный); в и г — изолинии апостериорной плотности на фоне априорной и апостериорной выборки соответственно).
а)
Z 20
10
0
1000
2000
2000
-2000 X
в)
1600
2000
2400
2800
г)
3000 2000 1000 0 -1000
У 1600
2000
2400
2800 3000
2000 1000
0 -1000 X
X Рис. 1
Из представленного примера видно, что в результате применения описанной процедуры удается сформировать выборку, соответствующую апостериорной плотности распределения вероятности, в результате чего удается преодолеть проблему вырождения алгоритма. Бутстрэп-фильтр (В-фильтр), использующий такую процедуру, был впервые предложен в работе [2].
Результаты моделирования. Для оценки эффективности применения В-фильтра в задаче корреляционно-экстремальной навигации было проведено моделирование на участках поля рельефа с углами наклона в пределах 0—20°. Предполагалось, что информация о поле рельефа представлена в виде его значений в узлах равномерной сетки с расстояниями между
0
У
узлами, равными 30 А. Средние квадратические отклонения для ошибок по каждой координате принимались равными 30 А . СКО систематической составляющей погрешности выбиралось равным 5 А. Общее число используемых измерений, выполняемых с шагом 30 А, принималось равным 35. СКО шума измерений составляло 0,05—2 % от среднего значения глубины на участке движения. СКО порождающих шумов принималось равным 5 А .
При моделировании вычислялись характеристики точности, формируемые с использованием метода статистических испытаний [7]. Число реализаций метода Монте-Карло для расчета безусловных СКО принималось равным 1000, число реализаций Ь при использовании В-фильтра равнялось 625. Результаты моделирования приведены на рис. 2 (действительные 1 и расчетные 2 СКО оценок с использованием В-фильтра: а—в — с учетом изменчивости, г — без учета изменчивости; а, г — ошибка по широте, б — по долготе, в — погрешность карты).
а)
А, у.е.
25
15
1 .../.........
/
......А 2 ............к /
0 10 20 30 40
№ измерения
а)
А, у.е.
25
15
1 .. д........
\
........ \
2
0 10 20 30 40
№ измерения
в)
г)
А, у.е. 4
3 2
1
1 ... д........
\
/
/ 2
А, у.е 25 20 15 10 5
1
...... 2
5
5
0 10 20 30 40 0 10 20 30 40
№ измерения № измерения
Рис. 2
С целью сопоставления на рис. 2, г приведены действительные и расчетные СКО, соответствующие В-фильтру для одной из компонент вектора состояния, когда изменчивость ошибок навигационной системы в модели не учитывалась, т. е. в условиях, когда для случая винеровских моделей расчетная модель соответствовала неизменному во времени вектору.
Из представленных результатов следует, что применение В-фильтра позволяет решать рассматриваемую задачу фильтрации в условиях изменчивости ошибок навигационной системы. Подтверждением правильности получаемых результатов, в частности, служит совпадение расчетной и действительных характеристик точности.
Выводы. Проведенные исследования подтвердили эффективность применения последовательного метода Монте-Карло, основанного на апостериорной (повторной) существенной выборке, для решения задачи корреляционно-экстремальной навигации. В дальнейшем планируется реализовать эти методы при решении задачи корреляционно-экстремальной навигации в случае, когда используется более сложная модель ошибок навигационной системы.
Работа выполнена при поддержке гранта РФФИ № 09-08-00828а.
список литературы
1. Arulampalam S., Maskell S., and Gordon N. A Tutorial on Particle Filters for on-line nonlinear/non-Gaussian Bayesian tracking. DSTO 2001, IEEE 2001.
2. Gordon N. J., Salmond D. J., and Smith A. F. M. Novel approach to nonlinear/non-Gaussian Bayesian state estimate // IEEE Proc. Pt. F. 1993. Vol. 140, N 2. P. 107—113.
3. Doucet A., de Freitas N., and Gordon N. J. Sequential Monte Carlo Methods in Practice. NY: Springer-Verlag, 2001. P. 581.
4. Степанов О. А. Применение теории нелинейной фильтрации в задачах обработки навигационной информации. СПб: ЦНИИ „Электроприбор", 2003. 369 с.
5. Doucet A. On sequential simulation-based methods for Bayesian filtering // Technical Report CUED/FINFENG/ TR 310. Department of Engineering, Cambridge University, 1998. P. 26.
6. Smith A. F. M. and Gelfand A. E. Bayesian statistics without tears: a sampling-resampling perspective // Amer. Stat. 1992. Vol. 46. P. 84—88.
7. Степанов О. А. Основы теории оценивания с приложениями к задачам обработки навигационной информации. СПб: ЦНИИ „Электроприбор", 2009. 496 с.
Антон Борисович Торопов
Олег Андреевич Степанов
Сведения об авторах д-р техн. наук; Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра информационно-навигационных систем; E-mail: [email protected] ЦНИИ „Электроприбор", Санкт-Петербург; научный сотрудник; E-mail: [email protected]
Рекомендована кафедрой информационно-навигационных систем
Поступила в редакцию 07.05.10 г.