Использование последовательных методов Монте-Карло в задаче корреляционно-экстремальной навигации

Степанов Олег Андреевич; Торопов Антон Борисович

УДК 621.391.172

О. А. Степанов, А. Б. Торопов

ИСПОЛЬЗОВАНИЕ ПОСЛЕДОВАТЕЛЬНЫХ МЕТОДОВ МОНТЕ-КАРЛО В ЗАДАЧЕ КОРРЕЛЯЦИОННО-ЭКСТРЕМАЛЬНОЙ НАВИГАЦИИ

Исследуется возможность применения последовательных методов Монте-Карло в задаче корреляционно-экстремальной навигации при учете изменчивости оцениваемого вектора. Обсуждаются особенности применения таких методов и предлагается алгоритм, основанный на апостериорной (повторной) существенной выборке.

Ключевые слова: метод Монте-Карло, фильтрация, точность, навигация.

Введение. В последнее время значительное развитие получили рекуррентные алгоритмы решения задач нелинейной фильтрации, основанные на последовательных методах Монте-Карло. К ним, в частности, относятся парциальные фильтры (particle filtres), бутстрэп (bootstrap) фильтры и ряд их модификаций [1—3]. В настоящей работе исследуется возможность применения аналогичных алгоритмов в задаче корреляционно-экстремальной навигации. Особенность этой задачи заключается в ее нелинейном и протяженном во времени характере, что обусловливает необходимость учета изменчивости оцениваемого вектора. Обычно такой учет осуществляется путем сведения исходной нелинейной задачи к некоторому линейному аналогу [4], что при определенных условиях приводит к снижению точности решения. В настоящей работе предлагается учитывать изменчивость в рамках нелинейной постановки задачи при ее решении с использованием последовательных методов Монте-Карло.

Постановка задачи корреляционно-экстремальной навигации. Задача корреляционно-экстремальной навигации может быть сформулирована следующим образом [4]. Пусть известны значения параметров ф/, Xi некоторой навигационной системы в i -е моменты времени

ф i = Ф/ + A(i, Х i =Х i +AÀ, i, (1)

где фi, Xi — истинные координаты объекта; Дфг-, AX/ — погрешность определения координат. Предположим, что имеются скалярные измеренные параметры некоторого геофизического поля, например, рельефа дна:

yi = У(Ф/,Xi) + X + Vi, i = 1, m, (2)

где у(ф/, Xi ) — известная функция, описывающая зависимость рельефа (глубин) дна от координат; х и Vi — систематическая и флуктуационная составляющие ошибок измерений. Введем

~ T

функцию у(ф/, Xi ) = у(фi — Дфг', Xi -AXi ) = si (Дфг-, AXi ) и векторы 0i =[A(i AXi ] и

t ~

X . Тогда, используя модель для вектора xi, задачу корреляционно-экстремальной навигации можно сформулировать как задачу фильтрации вектора

Xi = Фi x— + ri w i (3)

с использованием результатов измерений

У/ = s (0i) + X + Vi, (4)

где Wi — вектор шумов; Ф/ , Г/ — известные матрицы. Будем полагать, что W/ и V/

представляют собой центрированные гауссовы, дискретные, белые шумы с матрицей кова-риации Р и дисперсией Я. Вектор начальных условий хд также полагаем центрированным гауссовым с известной матрицей ковариаций РХд.

Суть задачи фильтрации заключается в следующем. Располагая накопленными к текущему

т т т т

моменту времени г результатами измерений У = [у1 ,у2 ,..., у, ] , необходимо найти алгоритм вычисления оптимальных по среднему квадратическому отклонению (СКО) оценок Х, (У) последовательности (3), минимизирующих критерий Ji = М {(хг - Хг (У))Т (хг - Хг (У,))} , и соответствующую матрицу ковариаций их ошибок. Известно, что это может быть сделано с помощью следующих выражений [4]:

ХГ(Уг ) = | Хг/( / Уг )<Х , Р^У ) = | (х, - Хг (у. ))(х,. - Хг (Уг ))Т/(Хг / У, )<Х, , (5)

в которых /(Хг / У) — апостериорная функция плотности распределения вероятности для

Г т т ~\т

составного вектора Хг = |_хх ,..., хг " . Таким образом, задача корреляционно-экстремальной

навигации в предложенной постановке сводится к вычислению интегралов (5). Для ее решения разработаны эффективные алгоритмы для случая, когда порождающие шумы отсутствуют, а матрица Ф, — единичная. Если оцениваемый вектор изменчивый, то для вычисления интегралов можно использовать последовательные методы Монте-Карло.

В дальнейшем рассматривается простейший случай, когда считается, что матрица Ф,

т Го 1 о"

также единичная, wг — двумерные векторы, матрица Г, =

0 0 1

т. е. считается, что

ошибки 9, описываются винеровскими последовательностями.

Простейший последовательный метод Монте-Карло. Запишем выражение для апостериорной плотности распределения вероятности в виде

/ (У, / Хг )/(Хг )

/ (х, / У, ) =

| / (У, / Хг )/(Хг ^

где / (У, / X,) — функции правдоподобия, / (X,) — априорная плотность распределения вероятности составного вектора.

Предположим, что имеется X, — выборка случайных векторов, соответствующих / (X,), тогда оценка и матрица ковариаций (5) могут быть вычислены с помощью метода Монте-Карло. В результате получим формулы [4]

Хг (У,)«хМс(У)=£*/хг, р (У)-РМС(У)=!?/ (У -хМс(У))( -хМс (У))т, (6)

г= г=!

где qJi — нормированные веса, определяемые как

=qi| Е ^, (7)

qJi = / (у / Х, ) — ненормированные веса. Формулы (6) и (7) могут быть получены, если полагать, что для функции / (X,) используется аппроксимация в виде [5]:

/(Хг)«Ь ^5(Хг -Х/ ), (8)

/=1

где §(•) — многомерная дельта-функция. Соответственно плотность распределения вероятности /(Х; / ¥) может быть записана как

/(X. / ¥г) «X q{ 5(Х. - X. ). (9)

/=1

Отличительная особенность приведенных выше соотношений заключается в том, что ненормированные веса могут вычисляться с помощью рекуррентных соотношений

q/ = / (У. / х/ )/ / = /(¥-1 / Х/-1), (10)

поскольку /(¥. / Х/ ) = /(У. / ¥.-1, Ху)/(¥м / Ху) = /(у. / х/)/(¥м/ Х^). Входящая в это

выражение функция /(у. / х/ ) легко вычисляется с использованием выражения (4).

Для вычисления выражения (9) необходимо промоделировать Ь выборок случайных векторов в соответствии с функцией / (Х;). Такие выборки могут быть получены рекуррент-

но с использованием Х /_1 и соотношений (3).

Однако анализ выражения (10) показывает, что для вычисления оценки и матрицы ко-вариаций (6) на каждом шаге достаточно иметь только выборки х/1, с использованием которых формируется выборка Х/ , / = 1, Ь . Таким образом, становится очевидным, что на каждом / -м шаге нет необходимости хранить в памяти всю „предысторию", т.е. выборки Х/^ .

При использовании соотношений (6) наибольший вклад в результат вычислений оказывают выборки, расположенные в областях, где апостериорная плотность существенно отлична от нуля. Поскольку при использовании простейшего последовательного метода выборка формируется в соответствии с априорной плотностью распределения вероятности / (Х/), то

значительное число элементов выборки этому требованию не удовлетворяет. В результате с течением времени может возникнуть ситуация, когда значения всех весов (6) станут близкими к нулю, что в полной мере проявилось при попытке применения этого метода в рассматриваемой задаче корреляционно-экстремальной навигации. Эта проблема известна как проблема „вырождения" алгоритма [5].

Существуют два основных метода преодоления этой проблемы: метод существенной функции и метод апостериорной (повторной) существенной выборки [5] — в настоящей работе используем второй.

Последовательный метод Монте-Карло с апостериорной существенной выборкой. Поясним идею применения метода апостериорной существенной выборки для решения задачи фильтрации. Запишем выражение для апостериорной плотности распределения вероятности в виде

Х (11)

\ / (У//х )/(Х//¥г-1)^Хг

ч

где /(Хг-/¥г--1) — плотность прогноза. Предположим, то имеется выборка Х/, полученная в

, тогда можем записать

/ (Х / ¥-1)« Ь ¿8( - Х/ ). (12)

соответствии с этой плотностью, тогда можем записать

Ь

Ь/ =1

Чтобы сформировать выборку X, , соответствующую / (X, /У,), необходимо рассчитать [6]

= / (у, )

Х;

(13)

в соответствии с дискретным . Каждому элементу этого мно-

и промоделировать выборку случайных величин

законом распределения, задаваемым множеством

жества соответствует вероятность q■ , вычисляемая по формуле (7), в которой = ^ . Затем для вычисления /(Х,+1/ У, ) = /(х,+1/ х,)/(Х, / У,) необходимо промоделировать выборку в

Е/(х, )

соответствии с плотностью распределения вероятности

которая используется

г=1

на следующем шаге для формирования

~1

хг+1

. Описанная процедура повторяется на

каждом шаге, благодаря чему обеспечивается рекуррентный характер алгоритма фильтрации. Эффективность применения описанной процедуры в задаче корреляционно-экстремальной навигации проиллюстрирована на рис. 1 (а — график апостериорной плотности распределения вероятности; б — априорная выборка (серый цвет) и апостериорная выборка (черный); в и г — изолинии апостериорной плотности на фоне априорной и апостериорной выборки соответственно).

а)

Z 20

10

0

1000

2000

-2000 X

в)

1600

2000

2400

2800

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г)

3000 2000 1000 0 -1000

У 1600

2000

2400

2800 3000

2000 1000

0 -1000 X

X Рис. 1

Из представленного примера видно, что в результате применения описанной процедуры удается сформировать выборку, соответствующую апостериорной плотности распределения вероятности, в результате чего удается преодолеть проблему вырождения алгоритма. Бутстрэп-фильтр (В-фильтр), использующий такую процедуру, был впервые предложен в работе [2].

Результаты моделирования. Для оценки эффективности применения В-фильтра в задаче корреляционно-экстремальной навигации было проведено моделирование на участках поля рельефа с углами наклона в пределах 0—20°. Предполагалось, что информация о поле рельефа представлена в виде его значений в узлах равномерной сетки с расстояниями между

0

У

узлами, равными 30 А. Средние квадратические отклонения для ошибок по каждой координате принимались равными 30 А . СКО систематической составляющей погрешности выбиралось равным 5 А. Общее число используемых измерений, выполняемых с шагом 30 А, принималось равным 35. СКО шума измерений составляло 0,05—2 % от среднего значения глубины на участке движения. СКО порождающих шумов принималось равным 5 А .

При моделировании вычислялись характеристики точности, формируемые с использованием метода статистических испытаний [7]. Число реализаций метода Монте-Карло для расчета безусловных СКО принималось равным 1000, число реализаций Ь при использовании В-фильтра равнялось 625. Результаты моделирования приведены на рис. 2 (действительные 1 и расчетные 2 СКО оценок с использованием В-фильтра: а—в — с учетом изменчивости, г — без учета изменчивости; а, г — ошибка по широте, б — по долготе, в — погрешность карты).

а)

А, у.е.

25

15

1 .../.........

/

......А 2 ............к /

0 10 20 30 40

№ измерения

а)

А, у.е.

25

15

1 .. д........

\

........ \

2

0 10 20 30 40

№ измерения

в)

г)

А, у.е. 4

3 2

1

1 ... д........

\

/

/ 2

А, у.е 25 20 15 10 5

1

...... 2

5

0 10 20 30 40 0 10 20 30 40

№ измерения № измерения

Рис. 2

С целью сопоставления на рис. 2, г приведены действительные и расчетные СКО, соответствующие В-фильтру для одной из компонент вектора состояния, когда изменчивость ошибок навигационной системы в модели не учитывалась, т. е. в условиях, когда для случая винеровских моделей расчетная модель соответствовала неизменному во времени вектору.

Из представленных результатов следует, что применение В-фильтра позволяет решать рассматриваемую задачу фильтрации в условиях изменчивости ошибок навигационной системы. Подтверждением правильности получаемых результатов, в частности, служит совпадение расчетной и действительных характеристик точности.

Выводы. Проведенные исследования подтвердили эффективность применения последовательного метода Монте-Карло, основанного на апостериорной (повторной) существенной выборке, для решения задачи корреляционно-экстремальной навигации. В дальнейшем планируется реализовать эти методы при решении задачи корреляционно-экстремальной навигации в случае, когда используется более сложная модель ошибок навигационной системы.

Работа выполнена при поддержке гранта РФФИ № 09-08-00828а.

список литературы

1. Arulampalam S., Maskell S., and Gordon N. A Tutorial on Particle Filters for on-line nonlinear/non-Gaussian Bayesian tracking. DSTO 2001, IEEE 2001.

2. Gordon N. J., Salmond D. J., and Smith A. F. M. Novel approach to nonlinear/non-Gaussian Bayesian state estimate // IEEE Proc. Pt. F. 1993. Vol. 140, N 2. P. 107—113.

3. Doucet A., de Freitas N., and Gordon N. J. Sequential Monte Carlo Methods in Practice. NY: Springer-Verlag, 2001. P. 581.

4. Степанов О. А. Применение теории нелинейной фильтрации в задачах обработки навигационной информации. СПб: ЦНИИ „Электроприбор", 2003. 369 с.

5. Doucet A. On sequential simulation-based methods for Bayesian filtering // Technical Report CUED/FINFENG/ TR 310. Department of Engineering, Cambridge University, 1998. P. 26.

6. Smith A. F. M. and Gelfand A. E. Bayesian statistics without tears: a sampling-resampling perspective // Amer. Stat. 1992. Vol. 46. P. 84—88.

7. Степанов О. А. Основы теории оценивания с приложениями к задачам обработки навигационной информации. СПб: ЦНИИ „Электроприбор", 2009. 496 с.

Антон Борисович Торопов

Олег Андреевич Степанов

Сведения об авторах д-р техн. наук; Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра информационно-навигационных систем; E-mail: [email protected] ЦНИИ „Электроприбор", Санкт-Петербург; научный сотрудник; E-mail: [email protected]

Рекомендована кафедрой информационно-навигационных систем

Поступила в редакцию 07.05.10 г.

Использование последовательных методов Монте-Карло в задаче корреляционно-экстремальной навигации Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Степанов Олег Андреевич, Торопов Антон Борисович

Похожие темы научных работ по математике , автор научной работы — Степанов Олег Андреевич, Торопов Антон Борисович

SUCCESSIVE APPLICATION OF MONTE-CARLO METHOD TO EXTREME CORRELATION NAVIGATION PROBLEM

Текст научной работы на тему «Использование последовательных методов Монте-Карло в задаче корреляционно-экстремальной навигации»