Научная статья на тему 'О методе упругих функций'

О методе упругих функций Текст научной статьи по специальности «Математика»

CC BY
51
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕПОДВИЖНАЯ ТОЧЕЧНАЯ ЦЕЛЬ / ПОДВИЖНАЯ ЦЕЛЬ / СТАЦИОНАРНЫЙ ОБЪЕКТ / ДИСКРЕТНАЯ ОПТИМИЗАЦИЯ

Аннотация научной статьи по математике, автор научной работы — Нартов Б. К.

In the paper the new method`s possibilities of the formalization of the path (trajectory`s) problems in the form of the optimal control problems are presented.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О методе упругих функций»

Математические структуры и моделирование 2001, вып. 8, с. 44-51

УДК 517.977

О МЕТОДЕ УПРУГИХ ФУНКЦИЙ Б.К. Нартов

In the paper the new method's possibilities of the formalization of the path (trajectory's) problems in the form of the optimal control problems are presented.

1. Введение

Разработку метода упругих функций стимулировала известная задача планирования поиска на плоскости неподвижных точечных целей е заданными функциями плотностей распределения вероятностей [4]. Долгое время не удавалось свести эту задачу к классическим задачам условной оптимизации. Основную проблему представлял аналитический учет пересечений и самопересечений полос поиска - непереборные решения строились лишь для частных случаев или получались при дополнительных ограничениях на управление поисковыми единицами. Предложенный нами в [1-3] подход решает эту проблему и позволяет формально просто записать общий случай планирования поиска в виде задачи оптимального управления.

Существенно, что предметная область найденного подхода оказалась много шире задач поиска стационарных объектов. Например, в задачах преследования целей с заданными траекториями метод упругих функций позволяет аналитически запоминать моменты первых касаний целей объектами-прееледователями и сколь угодно точно «затормаживать» движения коснувшихся пар. Таким образом, удается избавиться от дифференциальных уравнений траекторий объектов-прееледователей, обойти комбинаторные трудности и свести общий случай исходной задачи к классической задаче условной оптимизации. В контексте представляемого метода удалось формализовать в виде стандартных задач оптимального управления и некоторые задачи дискретной оптимизации, например задачу коммивояжера, интерпретируемую предварительно как «задачу преследования неподвижных целей».

Ниже мы опускаем проведенные доказательства и описания верифицирующих экспериментов, ограничиваясь по возможности наглядными примерами, представляющими три контрастных класса задач траекторного управления.

© 2001 Б.К. Нартов

E-mail: nartov@iitpm .omsk. net. ru

Омский филиал Института математики им. С.Л.Соболева СО РАН

Работа выполнена при финансовой поддержке РФФИ (проект 01-01-00303 - теоретическая часть, проект 01-07-90003 - верифицирующие эксперименты).

Математические структуры и моделирование. 2001. Вып. 8.

45

Рис. 1. Вспомогательная функция F(.s)

2. Преследование подвижных целей

Задача 1 (простейший случай). Задан временной интервал [0, £/], траектория дели а(£), 0 < t < £/, в евклидовом пространстве F3, начальная координата объекта-преследователя т(0), кинематические и пространственные ограничения на его возможные траектории т(-), выражающиеся в системе неравенств, связывающих функцию x(t) и ее производные до второй включительно.

Требуется формализовать задачу вычисления траектории т*(-), оптимальной в смысле задачи

С -»■ inf, (1)

2.

где - момент захвата цели, а именно минимальное решение неравенства |x(t) — a(t) | < щ, принадлежащее [0, t/], где щ задано.

Решение. Обозначив f(t) = x(t) — а(£), введем (рис.1) первую вспомогательную функцию F(s(t))1 s(t) = |f(t)|, удовлетворяющую трем условиям:

1. F(s) дифференцируема.

0 < F(s) < t-2 при 0 < s < 6Ц,

1 — 12 < F(s) < 1 при S > £ 1 + t2.

3. Значения щ и e2 регулируются параметрами функции F(s) независимо (в смысле неравенств 0 < t2 < г | и 0 < щ где г3 заданное число).

Конкретный вид F(s), удовлетворяющей этим условиям, вполне произволен.

Попытаемся теперь подобрать дифференцируемую функцию F(s(-),t), которая для любого интервала [0, t] С [0, £/] сколь угодно точно (регулировкой параметров функций F и F) приближает значения функции Fi(s(-),t) =mf0<T<tF(s(r)) при условии F(s(-),0) = 1.

Можно показать, что простейшая удовлетворяющая этим требованиям функция F(s(•),£) является решением дифференциального уравнения

F = а

F-F

F

(2)

46

Б.К. Нартов. О методе упругих функций

Рис. 2. К построению функции F.

где a - регулируемый положительный параметр.

Физически уравнение (2) обусловливает следующие свойства функции

F «достаточно быстро» убывает по t при F < F;

/•' «достаточно медленно» возрастает по / при F > F.

Введем для функции /•' естественный термин «упругая» функция, а для функции F - «трафаретная» функция.

Обратимся теперь к рис. 2, иллюстрирующему преобразование

s(t) F(s(t)) F(s(-),t), и запишем приближенное (см.ниже) решение ис-

ходной задачи в виде

if

J F(s(•),£) dt -Д inf.

о

(3)

Математические структуры и моделирование. 2001. Вып. 8.

47

Решая уравнение (2) е начальным условием F(s(-), 0) = 1, получим

F(A-)-t)

1 + “/ехР “/fPP)

О \ о

dr

exp —a

dr

о

F(s(t)) '

(4)

Подставляя (4) в (3), получаем классическую задачу вариационного исчисления, Фактически в (3) используется следующая интерпретация «упругой» функции /•:

§=Ж-)Л, (5)

где t - новая переменная - «управляемое» время (t(0) = 0), Можно доказать, что для любых параметров и начальных условий задачи 1 всегда найдутся такие конкретные параметры функций F и F, что функция t(tf) из решения (3) с заданной точностью приблизит момент захвата цели 1С (если, разумеется, захват вообще возможен - в противном случае t(tf) с заданной точностью совпадает с tf).

Практически случай одной цели и одного преследователя, разумеется, легко разрешим стандартными средствами и рассмотрен здесь лишь в качестве иллюстрации, Однако предлагаемый подход позволяет формализовать и многие общие случаи задач оптимального преследования, например

Задачу 2. Задан временной интервал [0, tf], траектории целей di(t),

0 < / < If. 1 < / < М, в евклидовом пространстве начальные координаты объектов-прееледователей %(0), 1 < j < N, кинематические и пространственные ограничения на их возможные траектории %(•).

Требуется формализовать задачу вычисления траекторий %(•);

1 < j < .Y. оптимальных в смысле минимизации суммарного времени жизни целей на интервале [0, tf]. Если цель захвачена каким-либо объектом-прееледова-телем (см, задачу 1), ее время жизни равно времени захвата, в противном случае время жизни цели совпадает со значением tf. При этом объект-преследователь, захвативший какую-либо цель, вычеркивается из дальнейшего рассмотрения.

Заметим, что схему решения задачи 1 нельзя тривиально распространить на общий случай. Необходимо, например, исключить следующие версии:

— «атаку» одной цели многими объектами-прееледователями;

— последовательные «атаки» многих целей одним объектом-прееледователем.

Учет подобных ограничений в функционале качества [3] существенно усложняет реализующий алгоритм.

3. Поиск стационарных объектов

Исходные данные рассматриваемых в этом разделе задач таковы. Односвязной области G С Е2 достоверно принадлежат К неподвижных целей с известными функциями плотностей распределения вероятностей fk(%), 1 < к < К, х = (,Г|. ./у) g [G] где [G] - замыкание области G, В замыкании [G] произвольным образом расположены в начальный момент времени t = 0 N поисковых

48

Б.К. Мартов. О методе упругих функций

единиц (ПЕ), При движении каждая ПЕ является центром окружности радиуса о, заметающей в области G полосу шириной 2о - полосу поиска; попавшая в полосу цель считается обнаруженной (рис, 3),

Рис. 3. Исходные данные в задачах поиска.

Введем следующие обозначения:

6(t) = £l(t)) - траектория i-й ПЕ, 1 < i < N, 0 < t < tf, tf - время

поиска;

К = /\ ({£,;( П 0 < / < tf, 1 < i < Л }•. /) - случайная величина - количество целей, обнаруженных на интервале времени [0,i], соответствующее стратегии поиска u = {6(f)|0 < t < tf, 1 < i < N}.

Считая реальные состояния поиска на заданном интервале (0, tf) неизвестными, сформулируем следующую задачу: при заданных кинематических и пространственных ограничениях на управления ПЕ вычислить стратегию поиска и* = {£*(6|0 < t < tf, 1 < i < Л }•. максимизирующую математическое ожидание количества целей M[K{u, tf)], обнаруживаемых за время поиска tf. Рассмотрим функцию

к

f(x) = ^2fk{x).

k=1

Очевидно

J f(x) dS = К.

G

Обозначим u{t) = {6(т)|0 < r < /. 1 < i < AT}, u{tf) = u. В каждый момент времени t £ (0, tf) множеству траекторий u(t) соответствует объединение полос поиска ПЕ СфЦб). Обозначим теперь G(u(t)) = G \ Gx{u{t)) и AG^t)) = Gi(u(t + At)) \ Gi(u(t)).

Математические структуры и моделирование. 2001. Вып. 8.

49

Рис. 4. функции Ли F.

Отсюда и из определения функции f(x) и математического ожидания М K(ii. £)] следует:

AM[K(u, *)] = / f(x) dS.

AGi(u(t))

Теперь исходную задачу можно записать в виде

J f(x)dS—> max. (7)

Gi(u(tf))

Из (6) очевидно, что при планировании слепого поиска необходим учет пересечений и самопересечений полос поиска ПЕ, составляющий основную проблему формализации (7) в виде задачи оптимального управления.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Предлагаемое ниже решение основано на описанном в предыдущем разделе механизме «упругих» функций F, задаваемых, однако, в другом виде.

Определим предварительно на области G вспомогательную функцию Л, связанную с координатами ПЕ,

Л(т, £(*))

1, если |£(i) — х\ < а, О, если |£(£) — х\ > а.

Зададим далее дифференцируемую колоколообразную функцию F(x, £(£)), сколь угодно точно приближающую значения Л. Конкретный вид F вполне произволен (рис. 4.)

Рассмотрим теперь функцию F(x,u,t), являющуюся решением дифференциального уравнения

N

г=1

F—F 1 -F’

(8)

50

Б.К. Мартов. О методе упругих функций

где a - регулируемый положительный параметр; F(x, и, 0) = 0,

Можно показать, что для любых начальных условий исходной задачи всегда найдутся такие I ) и F, что к моменту окончания поиска // функция F реализует над областью поиска G дифференцируемый профиль, повторяющий движения ПЕ, При этом высота профиля с заданной точностью будет равна единице над просмотренными областями, в том числе и над областями пересечений и самопересечений полос поиска, и с заданной точностью равна нулю вне просмотренных областей. Это полезное свойство F позволяет формализовать исходную задачу поиска (7) в виде

то есть получить функционал с дифференцируемым интегрантом, учитывающим любое возможное наложение полос поиска ПЕ,

Фактически относительно (9) утверждается следующее.

Для любых параметров и начальных условий исходной задачи и любого : > 0 найдутся такие I ) и F, что (9) формализует задачу (7) для некоторого набора плотностей вероятностей /Дт), 1 < к < К, из интервала |/Да;) — /ДД) | < е, где /Да;) - исходные плотности вероятностей,

В [3] по подобной схеме мы формализовали и некоторые задачи управления поиском в реальном масштабе времени, когда известны моменты обнаружения и координаты обнаруживаемых целей. Заметим здесь, что вопросы о цене представления /• в реализующем алгоритме и устойчивости траекторий ПЕ относительно точности приближения /Да;) требуют отдельного обсуждения,

4. Дискретная оптимизация

Используя результаты раздела 2, интерпретируем задачу коммивояжера как «задачу оптимального преследования неподвижных целей», а именно как задачу минимизации времени захвата последней из N неподвижных целей одним неуничтожаемым объектом-прееледователем.

Обозначим:

Х{ G Е‘А, i = 1, N - координата i-го пункта;

x(t) - координата коммивояжера, где т(0) задана;

F и F - трафаретная и упругая функции - в том виде, в котором они определены в модели оптимального поиска в разделе 3 (случай одной поисковой единицы);

L - длина минимального маршрута.

Запишем задачу

G

ts„ N

(10)

с ограничением на управление \x(t)\ < V, t £ [0, tf\.

Математические структуры и моделирование. 2001. Вып. 8.

51

Рис. 5. К задаче коммивояжера. /1.I \ - моменты е-касаний пунктов 1,... ,N.

Далее легко показать, что при условии Vtf > L для любого : > 0 найдутся такие /•’ и /’и ограничение на |т(7)|, что решение (10) обеспечивает ^-близкий и, с точностью до Ne, оптимальный обход пунктов (рис. 5).

Литература

1. Nartov В.К. Conflict of Moving Systems. A MSI '. Press, France, 1994. - 87 p.

2. Нартов Б.К. и др. Конфликт сложных систем. Модели и управление. М.: Изд-во МАИ, 1995. - 120 с.

3. Нартов Б.К., Чуканов С.Н. Модели траекторного управления: Монография. Омск: ОмГУ, 2001. - 95 с.

4. Хеллман О. Введение в теорию оптимального поиска. М.: Наука, 1985. - 254 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.