У
правление подвижными объектами и навигация
УДК 531.3:681.5.01
ВЫБОР ТРАЕКТОРИИ ДВИЖЕНИЯ ОБЪЕКТА В КОНФЛИКТНОЙ СРЕДЕ1
A.B. Добровидов, Е.Л. Кулида, И.М. Рудько
Рассмотрена задача выбора траектории движения маневрирующего объекта и закона изменения его скорости в конфликтной ситуации, когда его пытаются обнаружить несколько наблюдателей, расположенных в заданном районе. Критерием выбора траектории объекта принята вероятность его необнаружения на всей траектории движения ни одним из наблюдателей. Предложен дискретный метод оптимизации этого критерия на основе принципа динамического программирования при условии, что время движения объекта ограничено известной величиной.
Ключевые слова: выбор траектории движения объекта, критерий выбора траектории, вероятность необнаружения объекта на траектории, динамическое программирование.
ВВЕДЕНИЕ
Рассматривается задача определения качества скрытного маневрирования объекта при прохождении им маршрута из заданной начальной точки в заданную конечную точку в некотором регионе, в котором объект сталкивается с противодействием ряда наблюдателей, осуществляющих поиск и обнаружение объекта. Возможность обнаружения объекта создает конфликтную ситуацию, поэтому среду, в которой движется объект, принято называть конфликтной. При современном уровне развития техники даже однократный акт обнаружения объекта одним из наблюдателей, как правило, позволяет считать, что задача, поставленная перед наблюдателями, решена. Поэтому под «скрытным маневрированием» в настоящей работе понимается такой выбор траектории и скорости движения объекта, при которых минимальна возможность его обнаружения хотя бы одним из наблюдателей. Задача выбора траектории и закона изменения скорости на ней может решаться, исходя из различных критериев качества. Так, например, в работах [1, 2] эта задача решается путем минимизации риска, который можно интерпретировать как суммарную энергию сигнала, принятого наблюдателями от движущегося объекта за время его пере-
хода из начальной точки в точку назначения по выбранному маршруту. В работе [1] ставится и решается вариационная задача построения оптимальной траектории при движении с постоянной скоростью, в работе [2] для случая одного наблюдателя решается задача нахождения как оптимальной траектории, так и оптимального закона изменения скорости при заданном времени прохождения траектории. Отметим, что минимизируемый риск в этих работах лишь косвенным образом связан с возможностью обнаружения объекта. Непосредственно такую возможность характеризует вероятностный критерий, представляющий собой вероятность такого события, при котором за время прохождения объектом маршрута его ни разу не обнаружит ни один из К (К 1 1) наблюдателей, расположенных в регионе и работающих в пассивном режиме. Обозначим эту вероятность Рн
необн
и
1 Работа выполнена при финансовой поддержке Программы Президиума РАН «Математическая теория управления».
будем называть ее вероятностью необнаружения объекта на всей траектории движения. Если задана траектория объекта и закон изменения скорости на ней, то одна из задач состоит в нахождении Рнеобн на этой траектории. Другая задача является оптимизационной и заключается в построении оптимальной траектории и оптимального закона изменения скорости, максимизирующих вероятность Рнеобн при заданном времени прохождения маршрута. Наконец, можно ставить задачу отыскания оптимального времени прохождения маршрута [3].
1. ВЕРОЯТНОСТЬ ОДНОКРАТНОГО ОБНАРУЖЕНИЯ ОБЪЕКТА
В работе рассматриваются только первые две из перечисленных задач на примере обнаружения объекта по сигналам первичного гидроакустического поля.
Модели поисковых средств. В процессе маневрирования объект сталкивается с противодействием ряда разнородных наблюдателей, осуществляющих поиск и обнаружение по сигналам первичного гидроакустического поля. К ним относятся:
— стационарные гидроакустические средства;
— корабли (надводные и подводные);
— системы пассивных гидроакустических буев, контролируемых авиационными носителями.
Последние два типа обнаружителей обычно относят к одному классу маневренных средств. В настоящей работе в качестве маневренных средств рассматривается только система пассивных буев.
В случае первичного гидроакустического поля часто требуется решать задачу обнаружения сигнала на фоне помехи, обладающей близкими к сигналу статистическими свойствами. Известно, что большинство приемных систем наблюдателей работают периодически, накапливая и обрабатывая сигнал в течение фиксированного времени Т0 (времени разового наблюдения). Затем процесс повторяется.
Пусть на входе системы обнаружения принимается сигнал Х(?) = S(t) + 0 < ? < Т0, состоящий из аддитивной смеси сигнала и помехи причем ? может быть как непрерывным, так и дискретным временем. Математическими моделями сигнала и помехи служат случайные процессы, и задача обнаружения сигнала на фоне помех решается на основе статистической теории оптимальных решений. Чаще всего в расчетах распределение сигнала на входе системы обнаружения предполагается гауссовским с нулевым математическим ожиданием как в случае одной помехи (гипотеза Н0:
N(0, стш)), так и в случае смеси сигнала с помехой
(гипотеза И^ N(0, ст0 + ст2)). Такая математическая модель оправдана как для узкополосных, так и для широкополосных случайных сигналов £(?). Распределения для помехи (шума) и смеси сигнала с шумом различаются только дисперсией (мощностью) наблюдаемых сигналов Х(?).
В связи с тенденцией компьютеризации приемных систем в дальнейшем будем рассматривать только дискретное время. Достаточно часто в качестве статистики от наблюдений выбирают [4] энергию сигнала, наблюдаемого на интервале [0, Т0]:
У =
X X V?),
(1)
где Т0 = пД?, Д? = 1/2ДД Д? — интервал дискретизации по времени, ДР — полоса пропускания входного фильтра системы обнаружения.
Закон распределения энергии принимаемого сигнала, заданный плотностью вероятности /(у) случайной величины У, позволяет математически описать вероятностные характеристики обнаружения: вероятность правильного обнаружения и вероятность ложной тревоги:
р =
обн
/ + рлт = ^/ш(y)dУ, (2)
к к где к — порог обнаружения, /0(у) — плотность вероятности случайной величины У при гипотезе И0, /с + ш(у) — плотность вероятности Упри гипотезе Иг Плотность распределения статистики У для га-уссовского процесса Х(/Д?), / 1 1 (как распределение суммы квадратов нормально распределенных случайных величин с нулевым средним и дисперсией ст2) описывается функцией плотности распределения:
/(у) = А к
ст
(
У
\ст
У > 0,
(3)
2
где кп(-) — плотность % -распределения [5]. Поскольку распределение гипотезы И0 отличается от распределения гипотезы Их только значением дисперсии, то дисперсия ст2 статистики У с плотностью (3):
тт 2 2 ~ 4
— в случае гипотезы И0: ст = ст0 = 2п стш,
(4)
тт 2 2 ~ , 4 , 2Ч2 — в случае гипотезы Их: ст = стх = 2п( стш + стс) .
Здесь п — число степеней свободы, которое в случае цифровой обработки равно числу слагаемых в сумме (1), а в случае аналоговой обработки определяется как п = 2Т0ДР.
Определим отношение сигнал/помеха в полосе ДР как
22 Р = стс / стш •
(5)
Тогда дисперсия распределения в случае гипотезы Их запишется в виде
ст2 = 2п[ ст0 (1 + р)]2 = 2п ст0 (1 + р)2. Таким образом, для гипотезы И0 вероятность
ложной тревоги Рлт является функцией от ст0 и п, а для гипотезы Их вероятность правильного обнаружения Робн — функцией от ст0, п и р.
Критерием задачи, описанным во Введении, служит вероятность необнаружения Рнеобн = 1 — в,
да
30
п
где для краткости Pобн = р. В соответствии с выражениями (2) и (4)
7 / 2
к/ст:
^еобн = 1 - в = {А Чу!= { ВД^
0 и1
= Fn(h/а!),
(6)
где Fn(•) функция х -распределения с п степенями свободы. Здесь порог h определяется из второго из уравнений (2) путем задания вероятности ложной тревоги Pлт = а. Тогда аналогично выражению (6)
7 / 2
к/ст0
1 - а = | кпШи = Fn(h/ а2). (7) о
2. УРАВНЕНИЯ ГИДРОЛОКАЦИИ
Определим соотношение, связывающее между собой величины Pлт, Pобн и р. Из уравнения (6) получаем 1 — в = Fn(h/ ах), откуда следует, что
hl := hl- в = h/а! -
(8)
квантиль уровня (1 — в) X -распределения Fn(•). Аналогично из уравнения (7) следует, что
\ := h1- а = V а0 -
(9)
квантиль уровня (1 — а) того же распределения. Поделив почленно уравнение (8) на уравнение (9),
получаем /1//0 = а2 / а2. С учетом формулы (5)
/1 = /0/(1 + р) или р = (/0 — (10)
Тогда вероятность обнаружения из уравнения (6) определяется как
^бн = 1 — ВД) = 1 — Fn(h0/(1 + Р)). (11)
Часто в литературе, посвященной обработке гидролокационной информации (см., например, [6]), заменяют х2-распределение нормальным распределением, так как при п 1 30 х -распределение с большой точностью аппроксимируется гауссовс-ким распределением с параметрами:
тт 2 2 ~ 4
— гипотеза Н0: m0 = п а0, а0 = 2п а0;
— гипотеза Бу m1 = п(а0 + а2), а! = 2п(а0 +
22 + ас) .
При использовании гауссовского приближения уравнение (11) приобретает другой вид. Для гипотезы Н0 при заданной вероятности ложной тревоги
Pлт = а квантиль h 0 уровня (1 — а) определяется из уравнения
(1 — а) = Ф((/ — «0)/а0) = Ф( h 0), (12) а для гипотезы И1 при заданной вероятности обнаружения квантиль / 1 уровня (1 — в) — из уравнения
(1 — в) = Ф((/ — т^/а,) = Ф( /1), (13)
где Ф(-) функция нормального распределения. Определяя порог / из уравнения (12) и подставляя его в уравнение (13), приходим к формуле, аналогичной формуле (10),
р
= ^ / 0 - / 1 . /1 + л/п/2
Компонентах отношения сигнал/помеха р на входе системы обнаружения наблюдателя [6], определяемые выражением (5), имеют следующий смысл:
2
• дисперсия ас определяется мощностью сигнала от объекта на входе системы обнаружения наблюдателя, зависящей от скорости объекта и дистанции до него, и описывается формулой:
а2 = аС0 (^Г^/Б)2,
где ас0 — интенсивность (мощность сигнала, излученного объектом), определенная на частоте 1 кГц, в полосе 1 Гц, на расстоянии d0 = 1 м от точки излучения; (у/у0)ш — степенная зависимость мощности сигнала объекта от его скорости; v0 — эталонная (например, минимальная малошумная) скорость; Б — расстояние (дистанция) между точками излучения и приема; обратная квадратичная зависимость затухания сигнала от дистанции определяется сферическим законом распространения сигнала (для глубокого моря); 2
• дисперсия а0 на входе приемной системы определяется интенсивностью (мощностью) помехи в районе расположения приемника и характеристикой его направленности (коэффициентом кон-
22
центрации антенны А(/)): аш = ам (/)/А(/), где
аМ (/) — мощность помехи (шумы моря и судоходства) на входе пространственного фильтра (антенны), / — частота.
Таким образом, в выражении (5) р является функцией дальности Б. Подставив (5) в формулу (11), получим выражение для вероятности правильного обнаружения как функции от дальности:
^00) = 1 — ^
/
1+
V /vо )т 4 1-И
22 ашБ
(14)
0
где п — число степеней свободы. Для вычисления Робн(Л) по формуле (14) при любых возможных значениях расстояния D и скорости объекта v требуется только задание числовых значений параметров Рлт, стС0 , m, ст0, и п.
Если требуется знать дистанцию, на которой можно обнаруживать объект с заданной вероятностью обнаружения Робн = в, то, находя из уравнения (11) квантиль кх и приравнивая его выражению в квадратных скобках формулы (14), получаем
к0 - к1 _ стС0(у/у0)
к
22 стш D
(Если от обеих частей уравнения (15) взять 101§(-), то получится уравнение, традиционно используемое в гидролокации, выраженное в децибелах (дБ) и известное как уравнение гидролокации [6]). Разрешая уравнение (15) относительно дальности, получаем дальность обнаружения Dобн гидроакустическим приемником в виде
Л2 = ^ ст С 0( у/Ур) т<*1
0бн ( к0 - к 1) ст 2 .
(16)
В гауссовском приближении с учетом формул (12) и (13)
2 _ (к 1 + ТпТ2) стС0(У/У0)т
Л2 =
Лобн
(к 0 - к 1)
(17)
(Следует помнить, что квантили к0, к0 и кр к1 в выражениях (16) и (17) вычисляются по-разному, и при описании сигнала на входе приемника необходимо пользоваться либо %2-распределением, либо гауссовским распределением.)
3. ВЕРОЯТНОСТЬ ОБНАРУЖЕНИЯ ОБЪЕКТА НА ТРАЕКТОРИИ
Вероятность Робн(Л) является функцией расстояния, причем само расстояние Л — функция времени, определяемая законом движения объекта. Пусть наблюдатель находится в начале координат (хнаб = 0, унаб = 0), а объект за время Т проходит путь из точки А с координатами (х(0) = х0, у(0) = у0) в точку В с координатами (х(Т) = х№ У(Т) = у^). Траектория движения описывается координатами (х, у) = (х(?), у(?)), 0 < ? < Т. Дистанция до наблюдателя в момент ? записывается в виде Л(?) =
= (?)2 + у (?)2. Если Т0 П Т, то за время однократного наблюдения Т0 дистанция Лг = Л(/Т0) =
= 7х(/Т))2 + у(г'Т))2 = ^х2 + У2, 0 < / т Ь - 1, до
цели практически не меняется; Ь = [Т/Т0], а скобки [ • ] обозначают целую часть числа. Приближенно считая сигналы на каждом /-м интервале статистически независимыми, по формуле (14) можно определить вероятность правильного обнаружения объекта на всей траектории как
ь
Р = 1 —
Робн 1
П (1 — Робн(Л/))
1 = 1
Пусть имеется Кст стационарных наблюдателей,
наб наб
находящихся в пунктах с координатами (хк , ук ), (15) к = 1, ..., Кст. При условии, что наблюдатели при-
К„„
нимают решения независимо, вероятность Робн того, что объект, находящийся в точке с координатами (хг, уг) и имеющий в этот момент скорость у, будет обнаружен хотя бы одним из Кст наблюдателей, определяется как
/ст = 1 — ± обн ±
К„
П (1 — Pобн(Dг,k)), к = 1
где Лк = ^ - хнаб У + (у, - уГ Г, а вероятность Робн(Л.к) определена формулой (14).
Таким образом, вероятность правильного обнаружения по всей трассе для Кст наблюдателей можно определить по формуле:
Ь Кст
РГбн = 1 — П П (1 — Pобн(Dг,k)),
г = 1 к = 1
а вероятность необнаружения на всей трассе
Рнеобн 1 Робн . (18)
Ранее были рассмотрены математические модели конфликтной ситуации для движущегося объекта и стационарных средств наблюдения. Модели обнаружения маневренными средствами представляют собой описания тактической ситуации, соответствующей минимуму информации о противнике. А именно, считаются известными лишь расположение и характеристики района, в котором происходит противодействие сторон, а также предположения о составе средств наблюдения и тактике их применения [7].
В случае, когда маневренные средства представлены неподвижными буями с неизвестными координатами, расставленными в районе поиска, через который проходит объект по некоторой траектории, вероятность необнаружения РНеобн объекта буями определяется следующим образом.
Пусть в районе Я площадью £р случайным образом с равномерной плотностью разбросано пб
наб 2
наб 2
2
ст
ш
буев. Дальность обнаружения буем объекта
при заданных а и в определяется формулой (16) или (17) и, как правило, значительно меньше размеров района поиска. Имея в виду, что рассматриваемая далее в § 4 задача оптимизации траектории объекта решается только на классе кусочно-линейных траекторий с постоянной скоростью движения на каждом отрезке, будем определять б
вероятность Pнеобн только на отрезках траектории.
Считается, что объект обнаруживается заданным буем, если последний находится внутри коридора шириной 2Бу, построенного вдоль отрезка траектории. Понятно, что этот коридор может полностью или частично пересекаться с районом Я. Пусть Т и Т — моменты входа и выхода отрезка
ВХ
траектории для района Я. Тогда интервал времени, в течение которого объект находится внутри района с буями, 8? = Т — Т . Если отрезок находится
вых ВХ
вне района Я, то полагаем = Т . Площадь ко-
вых ВХ
ридора, в котором объект может быть обнаружен, 5 = а вероятность его обнаружения робн =
= П 1. Используя разложение по малому па-
раметру 5/£р, получаем е
гобн
1 — рб = рб
обн необн
В случае применения пб одинаковых буев в районе Я и при условии, что наблюдатели принимают решения независимо, вероятность необнаружения объекта пб буями
рб = ( рб )П6 ^ Ч2"^0-)^</5р)
Pнеобн, П6 (Pнеобн) ~ е .
В случае, когда имеются Кб различных районов
с разбросанными на них буями, щ. — число буев в к-м районе, площадь которого равна Бк, в силу независимости решений, принимаемых в разных районах, для вероятности необнаружения буями получаем выражение
К
г, б -к6 -п6 $к/5к
необн = П е = еХР
к = 1
(
- X пк5к/Sk\ .(19)
к = 1
Поскольку критерием оптимизации в задаче служит вероятность необнаружения объекта разнородными средствами Pнеобн за все время его движения по маршруту (или по отрезку траектории, когда Т = 8?), то в предположении, что стационарные гидроакустические станции работают независимо от буев, эта вероятность записывается в виде:
1б (20)
P = р8 < рб
рне0бн рнеобн рнеобн :
где рне обн — вероятность необнаружения стационарными средствами, определяемая по формуле
(18), а рнеобн — вероятность необнаружения маневренными средствами, определяемая по формуле (19).
Эти характеристики в дальнейшем используются при моделировании.
4. ОПТИМИЗАЦИЯ ТРАЕКТОРИИ ПО ВЕРОЯТНОСТНОМУ КРИТЕРИЮ
Пусть объект перемещается из заданной начальной точки (хА, уА) в заданную конечную точку (хв, ув) по кусочно-линейным траекториям, с кусочно-постоянными параметрами движения (параметры движения постоянны на отрезках траекторий).
Траекторией движения объекта Z называется последовательность N отрезков прямых = [(хг, уг),
(Х + 1, У + 1)], ' = 0 N- Ь (xо, У0) = (xA, УA), ^^ Ун) = = (хв, ув), с заданной на каждом отрезке г,- постоянной скоростью движения V,- . Скорости движения V,- принимают значения из заданного конечного набора {V-, у = 1, /}.
Для каждого из средств обнаружения предполагается заданной математическая модель расчета вероятности необнаружения р, (к) объекта при
г
движении по отрезку со скоростью V- , к — номер наблюдателя. Вероятность необнаружения объекта К = Кб + Кст разнородными наблюдателями
при движении по отрезку г,- со скоростью V,- со-
г
гласно формуле (20) определяется как
рнеобн( ) рнеобн ( ) рнеобн ( ^г )
К
= п рг (к) := рК.
к = 1
Характеристикой отрезка г,- при выбранной скорости движения V,- служит двухкомпонентный
вектор (?,- , р,- ), где ?,- — время прохождения отрезка 1,- со скоростью V.- , р — вероятность необ-
г - г - г
наружения, определяемые формулами: - = л/( хг - хг + 1) 2 + (у г - у г + 1) 2 ! vj¡
р- = рк = п р- (к).
к = 1
Характеристикой траектории Z служит двухкомпонентный вектор dZ = (Тг, р^), где Т2 — время
К
б
прохождения траектории Д Р2 — вероятность необнаружения объекта К наблюдателями при прохождении всей траектории Д определяемые формулами:
N - 1 N - 1
Т2 = X ;; р2 = П рл. (21)
г = 0 г = 0
Величины Т2 и Р2 зависят от набора скоростей У; на отрезках ¿г.
■'г
Будем рассматривать конечное множество Ж характеристик й2 всевозможных траекторий X Задача заключается в оптимизации на множестве Ж одновременно двух критериев: минимизации времени прохождения траектории Т2 и максимизации вероятности необнаружения объекта на траектории Р2.
Замечание 1. Отметим, что одинаковые характеристики могут соответствовать разным траекториям, отличающимся как геометрией, так и скоростями движения на отрезках. Однако, поскольку по рассматриваемым критериям такие траектории неразличимы, они считаются эквивалентными. На практике это означает, что из всех траекторий с равными характеристиками выбирается одна (любая). ♦
Сначала рассмотрим оптимизацию по каждому из критериев в отдельности.
Определение 1. Характеристика й2т е Ж оптимальна по критерию минимума времени прохождения траектории, если не существует характеристики й2 е Ж, такой что Т2 < Т2т. ♦
Очевидно, что характеристика прямолинейной траектории из начальной точки в конечную с максимальной допустимой скоростью движения оптимальна по критерию минимума времени прохождения траектории.
Определение 2. Характеристика й2р е Ж оптимальна по критерию максимума вероятности необнаружения объекта на траектории, если не существует характеристики й2 е Ж, такой что Р2 > Р2р. ♦
Отметим, что может существовать несколько различных характеристик, удовлетворяющих определению 2. У всех этих характеристик вероятность необнаружения Р2р одинакова. Эти характеристики можно ранжировать по времени прохождения траектории и определить его минимальное значение Т7 .
¿р
Замечание 2. В дальнейшем из всех характеристик, у которых значения одной из компонент одинаковы, мы рассматриваем только одну характеристику, оптимальную по второй компоненте. ♦
Из определений 1 и 2 следует, что Т2т < Т2р и
Р¿т т Р2р.
Если для характеристик траекторий ZT и Zp выполнено хотя бы одно из двух условий Т?т = Т2р или Р7 = Р7 , то в силу замечания 2 выполнено
¿ т 7 р
и второе. Это означает, что в этом случае существует характеристика, оптимальная одновременно как по критерию минимума времени, так и по критерию максимума вероятности необнаружения, и, следовательно, других решений задача оптимизации по двум критериям иметь не может.
Если для характеристик траекторий ZT и Zp не
выполнено ни одно из двух условий Т?т = Т2р или Р7 = Р7 , то одновременно Т7 < Т7 и Р7 < Р7 .
¿т 7 р ^ 7 т ¿Р 7 т ¿Р
Это означает, что траектория ZT лучше траектории Zp по критерию минимума времени, а траектория Zp лучше траектории ZT по критерию максимума вероятности необнаружения. В таком случае нельзя определить, какая из траекторий ZT и Zp лучше по двум критериям.
Для оптимизации множества характеристик по двум критериям введем
Определение 3. Характеристика й2 е Ж оптимальна по двум критериям, если не существует характеристики й2 е Ж, такой что (Т2 < ) л
А (Р2 > Р¿0 ).
Утверждение 1. Траектории ZT и ZP оптимальны по двум критериям.
Доказательство. Докажем, что траектория Zr оптимальна по двум критериям.
Предположим противное, что Zr не удовлетворяет
определению 3, т. е. ЭZ е Ж такая, что (Т2 < Т2) л л (Рг < Рг). Это значит, что для траектории Z выполнено, в том числе, условие Т2 < Т2. Но это противоречит определению 1, следовательно, предположение неверно. ♦
Аналогично доказывается, что траектория Zp также оптимальна по двум критериям.
Определение 4. Характеристики й2 = (Т2 , Р2 )
и й2 = (Т^, Рц ) такие, что одновременно выполняется два условия Т2 < Т2^ и Р2 < Р2 , несравнимы по двум критериям.
Утверждение 2. Если две характеристики не являются несравнимыми по двум критериям, то они либо равны, либо одна из них лучше другой по двум критериям.
Доказательство. Если характеристики й21 = = ( Т^ , Р^) и йЦ = ( Т^ , Р^2) не являются несравнимыми по двум критериям, то два условия Тг < и Рг1 < Р^ не выполняются одновременно.
Если не выполнено первое условие, т. е. Т^ 1 Т2, а второе выполнено, т. е. Р^ < Р^ , то характеристика й22 лучше по двум критериям.
Если выполнено первое условие, т. е. Т^ < Т^, а второе не выполнено, т. е. Р^ 1 Р^ , то характеристика йЦ лучше по двум критериям.
Если не выполнены оба условия, т. е. Т^ ^ 12
1 Т7 и
Р2 1 Р^2, то либо характеристики равны, либо получаем один из рассмотренных случаев, с точностью до замены обозначений й21 на и на й21 . ♦
Определение 5. Подмножество характеристик О с Ж назовем несоизмеримым подмножеством множества Ж, если любые две характеристики из О несравнимы по двум критериям.
Определение 6. Подмножество характеристик О с Ж назовем оптимальным несоизмеримым подмножеством множества Ж, если оно несоизмеримо и для любой характеристики й2 е Ж найдется
характеристика йц е О такая, что (Тц < Т2) л
Л (Р2 1 Р2).
Утверждение 3. Оптимальное несоизмеримое подмножество О с Ж содержит все те и только те характеристики множества Ж, которые оптимальны по двум критериям.
Доказательство. 1. Докажем, что любая характеристика йЦ е 0 оптимальна по двум критериям.
Предположим противное: пусть некоторая характеристика е 0 не удовлетворяет определению 3, т. е.
Зй^ е Ж такая, что
(Тг < Т^ ) л (Р^ > Р^ ). (22)
В силу определения 6 для й^ е Ж найдется характеристика й~2 е 0 такая, что
(Т7 < Т2) л (Р7 1 Р2).
(23)
В силу выражений (22) и (23) для характеристик й^ е 0 и йЦ е 0 справедливо ( Т^ < Т^ ) л (Р^ > Р2 ),
а это противоречит тому, что, согласно определению 5, любые две характеристики из подмножества 0 несравнимы по двум критериям. Полученное противоречие доказывает, что любая характеристика йЦ е 0 оптимальна
по двум критериям.
2. Докажем, что все оптимальные по двум критериям характеристики множества Ж принадлежат его оптимальному несоизмеримому подмножеству 0.
Предположим противное, т. е. предположим, что существует характеристика й^ е Ж, оптимальная по двум критериям, такая, что £ 0. По определению 6 для этой характеристики й2 е Ж найдется характеристика е 0 такая, что (Т^ < Т^) л (Р^ 1 Р^), причем поскольку £ 0, а й^ е 0, то ф . В силу замечания 2 это означает, что ( Т^ < Т^) л (Р^ > Р^), что противоречит предположению о том, что й^ оптимальна по двум критериям. Утверждение доказано. ♦
Утверждение 4. Если несоизмеримое подмножество О с Жупорядочено в порядке убывания значений одной из компонент характеристики, то оно упорядочено также и в порядке убывания второй компоненты характеристики.
Доказательство. Не ограничивая общности, предположим, что подмножество 0 упорядочено в порядке убывания первой компоненты характеристики (компоненты времени движения), т. е. выполнено условие Т^ > Т„2 > ... > Т^, где М — мощность подмножества
0. Докажем, что в этом случае подмножество 0 упорядочено также и в порядке убывания второй компоненты характеристики (компоненты вероятности необнаружения), т. е. выполнено условие Р^ > Р^ > ... > Р2м.
Предположим противное: найдутся характеристики й2 е 0 и й2 е 0, г < у, такие, что одновременно выполнены два условия Т2 > Т2 и Р2 < Р2 , но это означает, что для характеристик й2 и й2 определение 4 не
выполняется. Поскольку по определению оптимального несоизмеримого подмножества 0 с Ж любые его две характеристики несравнимы по двум критериям, получаем противоречие. Следовательно, предположение неверно. ♦ Следствие 1. Если оптимальное несоизмеримое подмножество О с Ж упорядочено в порядке убывания значений компонент характеристики, то первая характеристика оптимальна по критерию максимума вероятности необнаружения на множестве Ж, а вторая характеристика оптимальна по критерию минимума времени на множестве Ж.
Доказательство. Докажем, что характеристика й21 оптимальна по критерию максимума вероятности
необнаружения на множестве Ж. Предположим противное: Зй^ е Ж такая, что (Т^ < Т^ ) л (Р2 > Р^ ). Из условия Рг > Р21 следует, что й2 £ 0. Это противоречит утверждению 3. ♦
Аналогично можно доказать, что характеристика й2м оптимальна по критерию минимума времени
на множестве Ж.
Следствие 2. Если среди характеристик й2 е О оптимального несоизмеримого подмножества О с Ж
выбрать характеристику С^ с максимальным временем Тг , удовлетворяющим условию Т^ < Ттах,
то эта характеристика оптимальна по критерию максимума вероятности необнаружения на подмножестве характеристик WT с содержащем
Т тах
все характеристики dZ е удовлетворяющие ограничению по времени TZ < Ттах.
Доказанные утверждения позволяют решить поставленную задачу оптимизации по двум критериям, а также решить задачу оптимизации по одному из критериев при заданном ограничении на второй параметр.
Задача оптимизации решается в три этапа.
1. Построение графа О для аппроксимации множества траекторий W множеством путей графа О.
2. Для каждой вершины графа О построение оптимального несоизмеримого подмножества характеристик на основе алгоритма построения кратчайших путей в графах с весовой вектор-функцией ребер [8].
3. Выбор оптимальной по критерию вероятности необнаружения траектории при заданном ограничении на время движения.
Рассмотрим эти этапы подробнее.
1. Построение графа С и расчет характеристик его ребер. Множество траекторий аппроксимируется множеством путей неориентированного графа О.
На плоскости выбирается равномерная сетка точек, через которые проходят траектории, эти точки образуют множество вершин графа О. Множество вершин графа О строится следующим образом: начальная точка (хА, уА) и конечная точка (хв, ув) являются вершинами графа О. Отрезок прямой, соединяющий точки (хА, уА) и (хв, ув), делится вершинами графа на отрезки равной длины. Число вершин на этом отрезке выбирается произвольно, в результате определяется длина d прямолинейных отрезков траектории при движении объекта (длина ребра графа О). Другие вершины графа О — это все точки рассматриваемой области, являющиеся вершинами равных равносторонних треугольников. Обозначим множество вершин
графа В = {Ь,, I = 0,7}.
Вершины графа соединяются ребрами со всеми вершинами, находящимися на расстоянии d от
них. Ребру в} графа О, соединяющему вершину Ь, с координатами (х,, у,) и вершину Ь, + 1 с координатами (х, + 1, у, + 1), сопоставляется пара (, V-), где — прямолинейный отрезок траектории из
точки (х,, у,) в точку (х, + 1, у, + 1), V- — скорость
движения на отрезке . Число ребер, соединяющих вершины Ь, и Ь, + 1, равно числу / различных допустимых значений скорости движения объекта на отрезке (чтобы различать такие ребра, используется верхний индекс).
При таком построении графа все траектории состоят из отрезков равной длины, что удобно для наглядной (графической) интерпретации результатов оптимизации.
Характеристикой ребра будем называть характеристику сопоставленного отрезка с выбранной на нем скоростью движения V; , определяемую формулами (21).
2. Построение оптимальных несоизмеримых подмножеств характеристик для вершин графа С. Путем в графе О называется последовательность
ребер (¿0°, ..., епп ) такая, что начало ребра в? является концом ребра \, I = 2, п . Каждому пути О в графе соответствует траектория, состоящая из сопоставленных ребрам этого пути отрезков и скоростей движения.
Характеристикой пути называется характеристика траектории, сопоставленной этому пути, определяемая формулами (21).
Будем рассматривать множество характеристик Wn всех путей графа О из начальной вершины ЬА с координатами (хА, уА) в вершину Ьп с координатами (х^ уп).
Для каждого такого множества строится оптимальное несоизмеримое подмножество характеристик (2п.
Алгоритм построения оптимальных несоизмеримых подмножеств основан на построении для каждой вершины Ьп е В графа О промежуточных множеств характеристик Бп с Wn. В алгоритме используется вспомогательное множество вершин р, для которых множества Бп непустые. Среди всех характеристик множества Бп будем выбирать вес вершины — характеристику, лучшую по критерию вероятности необнаружения, а если таких несколько, то лучшую из них по критерию времени.
Весом вершины Ьп назовем характеристику С = = (Т- , р-) е Бп такую, что УС = (Т,, р,) е Бп либо р- > р, либо (р- = р,) л (Т- < Т,).
Алгоритм построения оптимальных несоизмеримых подмножеств Оп
Шаг 1. Для каждой вершины Ьп е В графа С положить Лп = 0, Оп = 0; положить С = 0. Все вершины отметить как неудаленные.
Шаг 2. В множество Л0, сопоставленное начальной вершине, заносится характеристика (0,0); начальная вершина заносится в множество Р.
Шаг 3. Если множество Р пусто, то алгоритм завершен, иначе переход к шагу 4.
Шаг 4. В множестве Р ищется вершина с оптимальным весом й. Путь из начальной вершины в вершину Ъп , которому соответствует характеристика й, полагается текущим оптимальным путем. Характеристика текущего оптимального пути
переносится из множества Ли в множество .
"о "о
Если после этого множество Ли стало пустым, то
по
вершина Ъп удаляется из множества Р и отмечается как удаленная.
Шаг 5. Для каждой вершины Ът е В графа <7,
связанной ребром с вершиной Ъп и отмеченной как неудаленная, к множеству Ли добавляются
ит
характеристики, вычисляемые по формулам (21) для всех путей, полученных продолжением текущего оптимального пути ребром, соединяющим вершину Ъп с вершиной Ът (напомним, что число
таких ребер равно числу различных допустимых значений скорости). При этом множества Ль
т
должны оставаться несоизмеримыми. Для этого при добавлении очередной характеристики й1 к
множеству Ль проверяется, нет ли в нем харак-
ит
теристики й2 такой, что характеристики й1 и й2 не являются несравнимыми. Если такая характеристика есть, то, согласно утверждению 2, либо характеристики й1 и й2 равны, либо одна из них лучше
по двум критериям. В множестве Ли остается
ит
только лучшая из характеристик й1 и й2.
При добавлении характеристики к множеству Лъ вершина Ът добавляется к множеству Р. При
ит т
удалении характеристики из множества Ли вер-
т
шина Ът удаляется из множества Р. Шаг 6. Переход к шагу 3. ♦ 3. Построение пути в графе С, оптимального по критерию максимума вероятности необнаружения при заданном ограничении на время движения. Согласно следствию 2 из утверждения 4, при задан-
ном ограничении на время движения из оптимального несоизмеримого подмножества можно выбрать единственную характеристику, оптимальную по критерию максимума вероятности необнаружения.
Рассмотрим упорядоченное в порядке убывания значений компонент характеристик оптимальное несоизмеримое подмножество : {(Т, Р.),
у = 1, М} для конечной вершины (хт ум). Выбирается у * = шш{ у : Т. т Т *}. Согласно следствию 2 из утверждения 4 характеристика (Т..*, Р.*) является характеристикой искомой оптимальной траектории. Среди вершин, с которыми вершина (х№ yN) связана ребрами, находим вершину (xN _ 1, yN _ 1), в множестве QN _ 1 которой имеется характеристика (Т. * — TN _ 1, Р. */Р^ _ 1), где ^ _ 1, PN - 1) — характеристика ребра, соединяющего вершину (xN- 1, yN- 1) с вершиной (xN, ум). В силу построения множеств Оп такая вершина (xN - 1, yN - 1) существует; она принадлежит искомому пути. Повторяем процесс для вершины (xN - 1, yN - 1) и получаем вершину (xN - 2, yN - 2) и т. д. Через N — 1 шаг будет достигнута вершина (хА, уА) и оптимальный путь построен.
5. РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ
Основное достоинство предлагаемого подхода к отысканию оптимальной траектории заключается в независимости алгоритма выбора оптимального управления объектом от принятых математических моделей средств обнаружения, выделенных в отдельные программные блоки и используемых при вычислении характеристик дуг графа С. Математические модели средств обнаружения можно изменять, это позволяет исследовать эффективность управления объектом при различных математических моделях средств обнаружения. Алгоритм построения оптимальной траектории универсален, поскольку он не зависит от числа средств обнаружения противника, их взаимного расположения, их параметров, при условии наличия моделей для расчетов вероятностей необнаружения объекта этими средствами.
Проиллюстрируем работу программной системы, реализующей разработанный метод.
На рис. 1 отображен экран, на котором определяется постановка задачи: расположение стационарных гидроакустические средств, области действия маневренных сил, начальной и конечной точек искомой траектории и определяются параметры средств обнаружения. На панели в правой части экрана представлено окно ввода параметров гидроакустического поля маневренных сил.
Рис. 1. Экран постановки задачи
Рис. 2. Экран решения задачи
Время Вероятность (час) необнаружения
23.333334 0.794004
21,666666 21.527779 21.111111 20,972221 20.972221 20,555555 20,277779 19.861111 19,444445 18.750000 18,333334
0,788760 0.298815 0.288563 0.143735 0.143735 0,133715 0.132634 0.123389 0.114788 0.105926 0.098545
Отрезок Скорость Вероятность
траектории (м/сек) необнаружения
1 - • 2 5.000000 0.984222
2 - • 3 5.000000 0.984549
3 ■ ■ 4 5.000000 0.984736
4 ■ • 5 5.000000 0,985048
5 - ■ 6 5.000000 0,984618
6 ■ ■ 7 5.000000 0.984228
7 - • 8 5.000000 0,983727
8 ■ • 9 5.000000 0.983057
9 - • 10 5.000000 0,982996
10 - ■ 11 5.000000 0.982426
11 - • 12 5.000000 0,982285
12 - ■ 13 5.000000 0,982765
13 - ■ 14 5.000000 0.983192
14 ■ ■ 15 5.000000 0,983379
Рис. 3. Время движения и вероятность необнаружения набора траекторий
Рис. 4. Список характеристик отрезков
На рис. 2 представлено решение этой задачи. На панели в правой части экрана отображаются параметры полученных решений задачи, внизу отображен список характеристик (время движения, вероятность необнаружения) для построенного набора траекторий, на рис. 3 отдельно представлен этот список. Характеристики упорядочены в порядке убывания параметров. Каждой строке этого списка соответствует траектория, которая является оптимальным решением задачи при некотором ограничении на время движения.
В списке характеристик щелчком мыши можно выделить любую характеристику. На рис. 2 выде-
лена характеристика, верхняя в списке (оптимальная по вероятности необнаружения): время движения — 23,333334 ч, вероятность необнаружения — 0,794004.
На панели параметров для выделенной траектории отображается список характеристик отрезков (скорость на отрезке, вероятность необнаружения на отрезке), а также графики: вероятности необнаружения противником при движении по траектории, вероятности необнаружения противником на отрезках траектории, скорости на отрезках траектории. На рис. 4 отдельно представлен список характеристик отрезков.
Если оптимальная траектория не удовлетворяет заданному ограничению на время движения, то в списке характеристик нужно выбрать другую траекторию. Из списка решений для рассматриваемого примера (см. рис. 3) выберем вторую характеристику (время движения — 21,666666 ч, вероятность необнаружения — 0,788760). Траектория, соответствующая этой характеристике представлена на рис. 5.
Если эта траектория также не удовлетворяет заданному ограничению по времени движения, то выбирается следующая характеристика из списка: время движения — 21,527779 ч, вероятность необнаружения — 0,298815. Траектория, соответствующая этой характеристике представлена на рис. 6. Вероятность необнаружения на этой траектории значительно ниже, чем на траектории, представ-
Рис. 5. Первая оптимальная траектория с ограничением на время движения
Рис. 6. Вторая оптимальная траектория с ограничением на время движения
ленной на рис. 5. Это связано с тем, что на участках 3—4, 4—5, 5—6 и 6—7 траектория проходит по границе области действия маневренных сил. На графике видно, что вероятность необнаружения на этих отрезках сильно снижается. На отрезках 3—4 и 6—7 это снижение меньше, поскольку на границу области действия маневренных сил попадает только половина этих отрезков.
ЗАКЛЮЧЕНИЕ
Получено аналитическое выражение для вероятностного комплексного критерия качества, оценивающего траекторию движения объекта в заданном районе с учетом информации о наблюдателях различной физической природы. Показана связь вероятностного критерия с уравнением гидролокации при различных распределениях помех. Метод оптимизации этого критерия при выборе траектории основан на дискретном варианте принципа динамического программирования. Сам метод оптимизации не связан с конкретными математическими моделями средств обнаружения и является универсальным. Результаты численного моделирования по выбору оптимальных траекторий согласуются с представлениями экспертов в данной области.
ЛИТЕРАТУРА
1. Zabarankin M, Uyasev S., Pardalos P. Optimal Risk Path Algorithms // Cooperative Control and Optimization Ch. 1 /
Eds. R. Murphey, P. Pardalos. — Dortrecht: Kluer Acad., 2002. — P. 71—303.
2. Галяев A.A., Маслов Е.Р., Рубинович Е.Я. Об одной задаче управления движением объекта в конфликтной среде // Изв. РАН. Теория и системы управления. — 2009. — № 3. — С. 134—140.
3. Сысоев Л.П. Критерий вероятности обнаружения на траектории в задаче управления движением объекта в конфликтной среде // Проблемы управления. — 2010. — № 6. — С. 64—70.
4. Ван Трис Г. Теория обнаружения, оценок и модуляции. — М.: Советское радио, 1972. — Т. 1. — 744 с.
5. Крамер Г. Математические методы статистики. — М.: Мир, 1975. — 648 с.
6. Бурдик В.С. Анализ гидроакустических систем. — Л.: Наука, 1988. — 392 с.
7. Абчук В.А., Суздаль В.Г. Поиск объектов. — М.: Советское радио, 1977.
8. Панкратьев Е.В., Чеповский А.М., Черепанов Е. А., Чернышев С.В. Алгоритмы и методы решения задач составления расписаний и других экстремальных задач на графах больших размерностей // Фундаментальная и прикладная математика. — 2003. — Т. 9, вып. 1. — С. 235—251.
Статья представлена к публикации членом редколлегии Б.В. Павловым.
Добровидов Александр Викторович — д-р физ.-мат. наук, зав. лабораторией, Ш (495) 334-79-59, И dobrovidov.alexander @mail.ru,
Кулида Елена Львовна — канд. техн. наук, ст. науч. сотрудник, Ш (495)334-92-49, И [email protected],
Рудько Игорь Михайлович — канд. техн. наук,
ст. науч. сотрудник, Ш (495) 334-79-59, И [email protected],
Институт проблем управления им. В.А. Трапезникова РАН, г. Москва.