Раздел III. Системы управления
УДК 519.283
ЕЛ. Рубинович
МАКСИМИЗАЦИЯ ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТИ ПРИ СТРОБИРОВАНИИ ЛОКАЦИОННОГО СИГНАЛА*
В докладе в дискретном времени ставится и решается задача оптимизации процесса позиционирования вложенной последовательности стробирующих окон при наблюдении с помощью локационного сенсора за движущейся целью в процессе ее преследования. Показано, что при гауссовском законе распределения помех в канале наблюдения (обычное допу-
), -ности попадания проекции вектора состояния цели в заданное окно. Решением задачи является конкретная рекуррентная процедура пошаговой оптимизации.
Локация; стробирование; преследование.
E.Ya. Rubinovich
CONFIDENCE PROBABILITY MAXIMIZATION UNDER SONAR SIGNAL
STROBING
In discrete time, a problem of optimal strobing gate positioning for a pursuit problem is considered in the case when a pursuer has a sensor of radar or sonar type. It is shown that on the hypothesis of Gaussian distribution law for noise process in the observation channel (an ordinary assumption in the case of location system) the original problem could be reduced to an auxiliary problem of confidence probability maximization for localization of the state vector projection into given window. Concrete recursive step by step optimization procedure is solved this problem.
Location; strobing; pursuit.
.
от цели эхосигналов в радиолокации используют стробирование, т.е. выделение временного окна, внутри которого разрешено обрабатывать принимаемые сигналы. По мере уточнения фазовых координат цели в процессе слежения это временное окно постепенно сужают, еще больше снижая уровень внешних помех [1].
В данной работе в дискретном времени решается задача оптимизации процесса позиционирования вложенной последовательности стробирующих окон при наблюдении за прямолинейно движущейся целью Е в процессе ее преследования на плоскости XY. Эволюция вектора состояния цели в, описывается линейным разностным уравнением с неизвестным начальным условием 0о, распределенным по нормальному закону. Наблюдения - линейны, с аддитивной гауссовской помехой, как в классической калмановской схеме. Предполагается, что преследователь Р движется прямолинейно с, вообще говоря, переменной скоростью и. Движение осуществляется вдоль заданной оси X, вдоль которой ориентирована и диаграмма направленности локационной системы преследователя.
*
Работа выполнена при поддержке Программы Президиума РАН «Динамические системы и теория управления».
Постановка задачи. Задача состоит в максимизации доверительной вероятности P{xt — lt < Л*0( < xt + h} попадания проекции вектора Bt в окно [xt — lt ■ Xt + /(] ДЛИНЫ 211 С центром В точке Xt на оси X, где А - единичный вектор, направленный вдоль оси X, * - символ транспонирования. Максимизация осуществляется путем выбора центров позиционирования Xt окон [xt — lt, xt + /<], (t=0,1,2,...) при выполнении условий монотонной вложенности двух последовательных окон [xt+i — it+i, £f+i + it+i] <[*t — lt, + lt]- Последовательность ['.■ j, t=0,1,2,..., задающая ширину окон, предполагается заданной (рис. 1).
Рис. 1. Последовательность вложенных стробирующих окон
Данная задача допускает точное аналитическое решение, которое приводится . .
Близкая постановка с терминальным критерием для непрерывного времени содержится в [2], где приводится субоптимальное решение.
Геометрия задачи представлена на рис. 2, где Р, и Е1 - текущие положения преследователя и цели соответственно (Р0 и Е0 их начальные положения). Рассматриваются два случая: 1) вектор г скорости цели известен и 2) г - неизвестный случайный двухкомпонентный вектор. При этом: а) вектор и = const или б) вектор - известная функция времени.
Рис. 2. Геометрия задачи
.
математическую формализацию. На вероятностном пространстве (П, Е.Р) заданы: ненаблюдаемый процесс в = (0()*=од,2,... € ГДО ^0 ~ ЛГ(ш, 7) и
процесс наблюдений £ = (&)*=!,2,,,. € Д , где £0 = 0 и
Здесь Ит = (№*)(=!,2,.., £ К' - дискретный белый шум, а
Обозначая 1р(1) = Ф((, 0)
.
(1)
(2)
матрицы и
матрица, можно представить решение уравнения (1) в виде
Таким образом, задача оценки вектора сводится к оценке вектора в0. Это замечание позволяет сформулировать упомянутую выше оптимизационную задачу в следующем виде. Определить процедуру выбора последовательности центров вложенных интервалов (окон)
так, чтобы максимизировать платежную функцию (плату), имеющую смысл доверительной вероятности
Данную задачу представм как задачу оптимального стохастического управления согласно следующей рекурсивной процедуре.
Шаг 1. Введем управление центрами xf стробирующих окон. Согласно (4)
где c.v = (at)t=o,i,2,... - управляющая последовательность, удовлетворяющая ограничениям
Шаг 2. Перепишем пошаговую платежную функцию (5) в виде или в эквивалентной форме
где /{■} - индикаторная функция, Е - символ математического ожидания и = (7 {£s. я < - ст-алгебра, порожденная предыдущими наблюдениями
Шаг 3. Положим формально во = 0о(О с уравнением динамики
и введем матричные функции
В новых обозначениях процесс наблюдений (2) принимает вид
Двухкомпонентный частично наблюдаемый процесс (7), (8) находится в рамках калмановской схемы фильтрации и его условные средние
удовлетворяют рекуррентным уравнениям (фильтр Калмана)
где D, = +j4i(t)7tAi(0]1/2i a W = ~ обновляющий про-
цесс - независящая от Ff последовательность независимых гауссовских векторов. Здесь верхний индекс + означает псевдообращение.
Шаг 4. Перепишем уравнение для платы J(a.t) в интегральном виде, учтя, что Р{А*#о < Л/'(А*?п,.(т^), где of = А*7(А. Имеем
/ ч i 1 Г,+1' ( (2-А’т,)2'
(<*,t) = Е \ ехр ( --
^ V -¿7T<rf \
или, полагая г = (z — A*mt)/crt,
J(c
2a'f
{1
/ .-.¡.I (9)
у -7Г У(а?|—Л*т<—/|)/<7|
Шаг 5. Сделаем еще одно преобразование платы (9). Для этого введем
вспомогательный процесс
Л
Тогда j/(+1 — xi+i — и, следовательно,
Окончательно, эволюция £/( описывается уравнением
Здесь ¿(+1, (£ = 0. 1,2....)- независимые гауссовские величины с нулевым средним и дисперсией = А*7(Л*(^)(£)^*)+.41(()7(А.
В терминах процессов у? и е*+1 плата (9) допускает представление
Заменяя здесь г на /'1 |u^ и усредняя по ~ Л'(О, 1), получаем
где С = 1/(2тг<74&-1)- Далее, используя одноступенчатую функцию \ \ ¡, перепишем (10) в окончательном виде
(11)
Таким образом, задача свелась к интегрированию двумерной гауссовской плотности вдоль полосы шириной 2it, сдвинутой на у относительно нуля.
Рис. 3. Гауссовский интегрант платы (11).
Г,
Г2 = -Г, + 1, +у
\ 1‘
/ \ч О \г,
£j'
r2--r,-l, +.У / ^
Рис. 4. Не сдвинутая (слева) и сдвинутая на у (справа) полосы интегрирования
Шаг 6. Из представления (11) следует, что максимизация платы ./(а,?) осуществляется компенсацией сдвига у, что реализует закон управления
Шаг 7. По данному о, выбор центра xt+i очередного стробирующего окна осуществляется рекуррентным образом по формуле (6):
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Holt M.D. Low-power - low-cost undersea telemetry system // Proc. of MTS/IEEE Oceans. 2005. - C. 1-6.
2. Liptser R.Sh. About confidence probability maximization by incomplete data // Кибернетика. - Киев, 1966. - № 1. - С. 83-86.
. . ., . . .
Рубинович Евгений Яковлевич - Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А.Трапезникова Российской Академии наук; e-mail: [email protected]; 117997, г. Москва, ул. Профсоюзная, 65; тел.: 84953349111; зам.
; . . .; .
Rubinovich Evgeny Yakovlevich - Trapeznikov Institute of Control Sciences, Russian Academy of Sciences; e-mail: [email protected]; 65, Profsoyuznaya street; Moscow, 117997, Russia; phone: +74953349111; the deputy director on R&D; dr. of eng. sc.; professor.
УДК 681.513
B.X. Пшихопов, М.Ю. Медведев, Б.В. Гуренко, А А. Мазалов
АДАПТИВНОЕ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ ОБЪЕКТАМИ ОДНОГО КЛАССА С ОБЕСПЕЧЕНИЕМ МАКСИМАЛЬНОЙ СТЕПЕНИ УСТОЙЧИВОСТИ*
Рассматривается алгоритм прямого адаптивного управления нелинейными объектами специального вида. Алгоритм обеспечивает максимальную область асимптотической устойчивости замкнутой системы при заданных ограничениях на управляющие воздействия. Для синтеза системы управления используется принцип максимума Понтрягина. Устойчивость замкнутой системы доказана посредством найденной функции Ляпунова для рассматриваемого класса нелинейных объектов. Приведены результаты численного , .
Прямое адаптивное управление; принцип максимума.
V.Kh. Pshikhopov, M.Yu. Medvedev, B.V. Gurenko, A.A. Mazalov
ADAPTIVE CONTROL OF A CLASS OF NONLINEAR OBJECTS FOR ASSURING MAXIMUM OF STABILITY DEGREE.
This paper presents algorithm of direct adaptive control for a class of nonlinear objects. The algorithm ensures maximal area of the system stability if the control is bounded. Control design method is based on the principle of maximum. Stability of the designed closed-loop system is proved by functions of Lyapunov method. Computer modeling results confirm theory.
Direct adaptive control; principle of maximum.
* Работа выполнена в рамках гранта Президента РФ НШ-1557.2012.10 для государственной поддержки ведущих научных школ Российской Федерации.