УДК 621.396.96
КОНФЛИКТНОЕ УПРАВЛЕНИЕ СОСТОЯНИЕМ ЛОКАЦИОННОГОЛОГРАФИЧЕСКОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ ПРИ ВЫПОЛНЕНИИ ОПЕРАЦИИ СОПРОВОЖДЕНИЯ ТРАЕКТОРИИ ЦЕЛИ
МАТЮХИН Н.И.
Рассмотрен метод математического описания состояния и поведения конфликтно-управляемой информационной системы, выполняющей операцию сопровождения траектории. Для описания использован аппарат конечных цепей Маркова с поглощающим состоянием. Найдены уравнения состояния и динамики системы.
1. Постановказадачи
В многофункциональной локационно-голографической информационной системе, основанной на применении сверхкрупноапертурной сильноразреженной самофокусирующейся антенной решетки, представляется возможным создать единый антенный ресурс, из которого формируются элементарные локаторы на время выполнения ими отдельных операций. В состав полной совокупности операций входят как традиционные операции (обнаружение траекторий, сопровождение), так и новые (получение голографического изображения цели).
Внешняя среда (поток целей и источников помех, среда распространения радиоволн, ионизированные образования, турбулентная атмосфера), изменяя свои параметры естественным путем или намеренно по принципу отрицательной обратной связи, мотивирует поведение информационной системы и, таким образом, осуществляет косвенное управление ее состоянием. Состояние внешней среды предлагается описывать одной из трех однозначно связанных функций времени: плотностью потока целей, входящих в зону обнаружения; интервалом их входа в эту зону и числом целей, вошедших в зону обнаружения к текущему моменту времени. Состояние информационной системы аналогичным образом предлагается описывать функционалами, определяющими плотность потока обслуженных целей, время обслуживания одиночной цели при выполнении отдельных операций, а также при выполнении полной совокупности операций и число полностью обслуженных целей в системе к текущему моменту времени. Уровень мощности совокупного мешающего сигнала от активных и пассивных помех влияет на эти характеристики информационной системы. Параметры внешней среды и ее состояние изменяются непрерывно во времени. Это приводит к необходимости организации непрерывного управления состоянием информационной системы. Рассмотрим наиболее общий случай, когда управление состоянием системы является многошаговым или позиционным, игровым, конфликтным и двустронним.
Информационная система обладает большими возможностями по управлению своим состоянием путем прямого изменения параметров на интервале между моментами излучения соседних зондирующих сигналов. Управление в этом случае осуществляется в процессе выполнения отдельных операций. Например, могут изменяться такие параметры системы, как размеры апертуры антенны на передачу и прием, угол поляризации зондирующего сигнала, плотность потока мощности на антенне, длина волны, ширина спектра излучаемых частот и др. Такое управление позволяет выявить предельные (потенциальные) возможности системы по согласованию своего текущего ресурса с изменяющимся ресурсом внешней среды. Это особенно важно для исследования технических возможностей системы (текущих ТТХ) на этапе ее системного проектирования. После этого возможен рациональный отход от оптимальности в интересах разработки практических алгоритмов управления.
Для организации двустороннего конфликтного управления состоянием информационной системы в интересах оптимизации основных параметров, текущей структуры, текущего ресурса и самого состояния необходимо составить уравнения состояния и динамики для каждой из выполняемых операций. Эти уравнения в правых своих частях должны содержать конфликтно-управляемые параметры информационной системы и системы средств создания помех, которые на время системного проектирования считаются переменными управления, подлежащими дальнейшей оптимизации. Найденные уравнения используются при постановке задач дифференциальной игры “Наблюдение-противодействие”. В концептуальном плане задача сводится к отысканию в аналитическом виде упомянутых скалярных функционалов, описывающих состояние системы и ее подсистем в зависимости от конфликтно-управляемых параметров самой системы и средств создания помех. В дальнейшем в качестве функционала, описывающего состояние системы, будем рассматривать скалярный функционал, определяющий время выполнения операции.
В статье предложен метод составления уравнений состояния и динамики для системы, выполняющей операцию сопровождения траектории. Для этого использованы методы траекторной обработки [1] и аппарат конечных цепей Маркова с поглощающим состоянием [2].
2. Уравнения состояния и динамики системы
Операция сопровождения выполняется после операции обнаружения траектории и осуществляется в целях повышения точности измерения пространственных координат наблюдаемой цели. С течением времени накопленная точность измерения координат может ухудшаться. Поэтому операция сопровождения может повторяться неоднократно. Сопровождение траекторий сводится к формированию его стробов.
С появлением или пропуском новой отметки изменяется точность измерения координат и размеры стробов, выставляемых на следующий период локации. Дискретному измерению точности координат ставится в соответствие дискретное изменение состояния операционной системы. Поэтому в качестве критерия, позволяющего оценить степень выполнения операции сопровождения, целесообразно применять точностной критерий [1].
68
РИ, 1998, № 2
Начальная точность измерения координат цели определяется ошибками единичных измерений, а текущая точность — числом принятых и пропущенных отметок, а также принятым методом сглаживания параметров траектории. Размеры стробов определяются суммарной ошибкой экстраполяции центра строба сопровождения на текущий период локации и ошибками единичных измерений. Объем строба сопровождения является функцией от числа
зондирующих n и отраженных к сигналов, не превысивших порог обнаружения (пропущенных отметок). В случае измерения трех координат объем строба сопровождения определяется выражением
Г(u,v,t,n,к) = ’’ 3<“■v-'• "■к) X
SR(u, v, t)
x h3sp(u’vt-nk) hase(u,v,t,n,к)
X--------------------------------;
S/3(u, v, t) Ss(u, v, t)
°Sy(u,v,t,n,к) = ^ly(u,v, t) + (nк);
, . Sy(u, v, t)
3uy(u, v, t) = , ,s. _■==,
Vn(T)DFW(u,v,t)
где (u, v, t, n, к) — суммарная ошибка определения
центра строба сопровождения по обобщенной координате (y = {R, в,е} );auy (и,v, t) — среднеквадратическая ошибка единичных измерений координат; &ey (n, к) — среднеквадратическая ошибка экстраполяции координат; h — коэффициент увеличения размеров строба h = 3,...,6 ; Sy(u,v,t) — разрешающая
способность локатора по координате y ; (f)DF -отношение сигнал/помеха, соответствующее вероятности правильного (D(u,v,t)) и ложного (F(u,v,t))
обнаружений (пороговому сигналу); W (u, v, t) — многомерная скалярная функция, объединяющая переменные управления информационной системой (u(t))
и средствами создания помех (v(t)), зависящих от текущего времени t.
Положим, что амплитуда собственных шумов приемника и мешающих сигналов распределена по нормальному закону, а амплитуда полезных сигналов — по обобщенному релеевскому закону. Тогда выражение для вероятности правильного обнаружения можно представить в виде [3]
D(u, v, t) = exp |- ф f [2 + ф dfW (u, С О \1 ^
где (T )F = sj 2ln F — отношение сигнал/помеха, соответствующее вероятности ложного обнаружения (порогу обнаружения). При F = 10-4 фF = 18,42 .
Рассмотрим наиболее простой случай, когда при сглаживании параметров траектории применяется линейная гипотеза движения объекта и оно производится методом фиксированной выборки [1]. Тогда нормированную суммарную ошибку измерения координаты у представим в виде двумерной функции от параметров к и n :
РИ, 1998, № 2
<з„ (u, v, t,n, к)
= O(n, к)
3uy ^ t)
O(n, к) =
n3 + 4n2
7n + 12(к + n -1)
n(n2
1)
к = 1,2... ; n = 1,2...
Примем ее за функцию, описывающую дискретное состояние системы сопровождения (рис. 1). На этом же рисунке показана одна из возможных реализаций дискретного состояния системы сопровождения. Если после двух зондирований было два непревышения порога обнаружения (n = 2, к = 2), система
окажется в состоянии ах, чему соответствует точность
измерения координат: (u,v, t,n,к) = 2,9 <Jiy(u,v, t).
Если после трех зондирований число пропусков отметок остается прежним, система переходит в состояние а2, а если добавится еще один пропуск
(n = 3, к = 3), система перейдет в состояние а3 и т.д. Образуется, таким образом, цепочка случайных дискретных состояний: а1, а3, а5, а7, а8, а9, а11, а12, а13 .
Рис.1. Двумерная функция, описывающая дискретные состояния операционной системы сопровождения траектории цели
Изменение дискретных состояний в дискретные моменты времени, описываемое функцией O(n, к), можно рассматривать как случайный процесс с дискретным состоянием и дискретным временем, т.е.
как цепь Маркова. Каждой паре чисел (n, к) на графике двумерной функции O(n, к) (рис. 1) ставится в соответствие состояние (а^...,а17) на размеченном графе состояний системы (рис. 2). Состояние а5 соответствует пороговому значению функции O(n, к), когда достигается заданная конечная точность измерения координат сопровождаемой цели
69
(порог устойчивого сопровождения). Состояние а14 соответствует другому пороговому значению функции O(n, к), называемому порогом сброса с сопровождения. В состояние устойчивого сопровождения а5 система переходит после приема подряд пяти сигналов, превысившихпорогобнаружения, авсосто-
яние а14 она переходит из устойчивого состояния а5 после пропуска сигнала в девяти периодах локации.
Рис. 2. Размеченный граф состояний операционной системы сопровождения траекторий
Если пропусков будет меньше, система займет промежуточное состояние (a6,...,а13). Матрица переходных вероятностей имеет вид
1 - D D 0 . . .
0 1 0 . . .
0 0 1...
Как видно из размеченного графа состояний (рис. 2) и матрицы переходных вероятностей, система сопро -
вождения имеет одно поглощающее состояние a14, однако оно соответствует выходу системы из режима сопровождения. Используя метод определения времени блуждания системы по своим невозвратным состояниям [2], можно определить время, прошедшее от начала сопровождения до момента выхода системы из режима сопровождения. Эта характеристика менее интересна, чем время перехода системы из начального в состояние устойчивого сопровождения а5. С приходом системы в это состояние достигается требуемая точность измерения координат и операцию можно считать оконченной. Поэтому в графе состояний следует оставить лишь те невозвратные состояния, которые ведут к а5. Это состояние будем
70
считать поглощающим. В этом случае размеченный граф состояний принимает вид, показанный нарис. 3.
1-D 1-D 1-D 1-D
Рис. 3. Размеченный граф состояний операционной системы сопровождения траекторий (упрощенный)
Ему соответствует матрица переходных вероятностей:
O I
1 - D D
0 1 - D
0 0
0 0
0
— 0
R = 0
D
0 0
D 0
1 - D D
0 1 - D
где I , O — единичная и нулевая матрицы; R —
—
матрица, получаемая из матрицы П после вычеркивания строк, соответствующих поглощающим состояниям, и столбцов, соответствующих не поглощае-
——
мым состояниям; Q — матрица, получаемая из
матрицы П вычеркиванием строк и столбцов,
соответствующих поглощаемым состояниям.
Вектор средних значений времени блуждания
системы ( т(и, v, t)) по своим дискретным состояниям (ai , i = 1,...,4) до момента попадания в поглощающее состояние (а5), соответствующее устойчивому, можно представить выражениями:
т(и, v, t)
т13(и, v, t) _ Tc D3 . .. D3
D4 .. D3
Т4.5 (и, v, t) 0.
X
= T
-L Г\
4_
D
где Т0 — период локации.
Аналогичным образом, в матричном виде, можно записать формулу для дисперсии флюктуаций времени выполнения операции сопровождения траектории цели. В результате преобразований получим выражение для среднего значения ( т15(и,v,t) = Tmid(и,v,t)) и
дисперсии (oT (и, v,t)) времени выполнения операции сопровождения траектории цели:
РИ, 1998, № 2
4T0
Tmid (V, v> *)
D(u, v, t)
oT(u, v, t) = 4T02[i - D(u, v, t)].
После аппроксимации выражений для среднего значения времени выполнения операции и его среднеквадратического отклонения обратно пропорциональными зависимостями от вероятности правильного обнаружения получим
Tmid (u, V, *) = 4Т0 ЄХР {f ^ [2 + (f)dF W^, V, *)Г1 };
&T (u, v, *) = І-09Г0 exp j(f)f [2 + (f)df w(u, v, *)] } Графики этих зависимостей приведены на рис .4.
Tos,mid(U,V,t) (-^-ros( U, V, t)
0,4 1,2 2,0 2,8 W(u,v,t)
Рис. 4. Среднее значение (а) и дисперсия (б) времени выполнения операции сопровождения в зависимости от отношения сигнал / помеха
Уравнения состояния и динамики операционной системы, выполняющей операцию сопровождения траектории, имеют вид
T (*) = Tmid (^ ^ *) + Y &T (u, v, *) ;
T (*) = T mid (u, v, f) + y<Jt (u, v, f) . Заключение
1. Математически описан конфликтно-управляемый процесс сопровождения траектории цели в терминах состояния и скорости изменения состояния системы. Найдены в аналитическом виде уравнения состояния и динамики системы, правые части которых зависят от конфликтно-управляемых параметров самой информационной системы и средств создания помех.
2. Полученные уравнения могут использоваться при постановке задач оптимального управления в форме дифференциальной игры “Наблюдение-противодействие” для отыскания оптимальных значений конфликтно-управляемых параметров самой системы и средств создания помех, а также для оценки технических возможностей (текущих ТТХ) этих систем с ограничениями на их текущие ресурсы. Литература: 1. Кузьмин С.З. Основы проектирования систем цифровой обработки радиолокационной информации. М.: Радио и связь, 1986. 351 с. 2. КемениД, Снелл Д. Конечные цепи Маркова. М.: Наука, 1970. 270 с. 3. Теоретические основы радиолокации / Под ред. Я. Д. Ширмана. М.: Сов. радио, 1970. 560 с.
Поступила в редколлегию 23.05.98
Рецензент: д-р техн. наук, проф. Раскин Л.Г.
Матюхин Николай Иванович, старший научный сотрудник ХГУ. Научные интересы: системный анализ применительно к сложным радиолокационным системам, динамика радиолокационных систем, двустороннее конфликтное управление состоянием систем. Адрес: 310204, Украина, Харьков, пр. Л. Свободы, 32, кв. 6, тел. 37-07-35.
УДК 621.396.96
МЕТОД СОСТАВЛЕНИЯ УРАВНЕНИЙ СОСТОЯНИЯ И ДИНАМИКИ ДВУСТОРОННЕ-УПРАВЛЯЕМОЙ РАДИОЛОКАЦИОННОЙ СИСТЕМЫ ПРИ ВЫПОЛНЕНИИ ОПЕРАЦИИ ОБНАРУЖЕНИЯ ТРАЕКТОРИИ ЦЕЛИ
МАТЮХИН Н.И.______________________
Рассмотрен метод математического описания состояния и поведения информационной системы перспективного класса при выполнении операции обнаружения траектории. Сама система и ее внешняя среда являются управляемыми в процессе выполнения операции. Внешняя среда, кроме того, косвенно управляет состоянием информационной системы. Найдены в аналитическом виде уравнения состояния и динамики системы, которые затем могут использоваться при решения оптимизационных задач.
1 .Постановка задачи
При математическом описании поведения или динамики радиолокационной системы возникает необходимость в отыскании в аналитическом виде уравнений состояния и динамики. Отыскание этих уравнений наряду с выбором целевого функционала и заданием ограничений на переменные управления и состояние определяет постановку задачи оптимального управления. Под состоянием системы будем понимать, как обычно, совокупность внутренних свойств и связей, устанавливающих однозначную зависимость между процессами на ее входе и выходе. Состояние определяется структурой системы и значением параметров как самой системы, так и внешней среды (системы средств создания помех). Состояние будем характеризовать скалярным функционалом, который объединяет на физической основе параметры этих двух систем. Будем считать, что радиолокационная система и ее внешняя среда взаимодействуют с противоположными интересами, т.е. в форме противоборства или радиолокационного конфликта. На время системного проектирования параметры противоборствующих систем будем считать переменными управления, зависящими от времени и подлежащими оптимизации. Поэтому искомый функционал должен зависеть от конфликтно-
РИ, 1998, № 2
71