Научная статья на тему 'Задача преследования двумя догоняющими одного убегающего'

Задача преследования двумя догоняющими одного убегающего Текст научной статьи по специальности «Математика»

CC BY
181
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ / МАКСИМАЛЬНЫЕ СТАБИЛЬНЫЕ МОСТЫ / ОПТИМАЛЬНЫЕ СТРАТЕГИИ / ЧИСЛЕННЫЕ МЕТОДЫ

Аннотация научной статьи по математике, автор научной работы — Пацко Валерий Семенович, Ганебный Сергей Александрович, Кумков Сергей Сергеевич, Ле Менек Стефан

Приводятся результаты численного исследования антагонистической линейной дифференциальной игры, в которой функция платы подсчитывается в два момента времени с использованием операции минимума. С содержательной точки зрения рассматриваемая задача получается в результате линеаризации задачи преследования, где два догоняющих объекта атакуют на встречных курсах убегающий объект. Сложность решения вызвана тем, что функция платы (а, следовательно, и функция цены) не является выпуклой.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE PROBLEM OF PURSUIT OF ONE EVADER BY TWO PURSUERS

Results of the numerical investigation of an antagonistic linear differential game, where the payoff function is computed at two instants using the operation of minimum are presented. From the practical point of view, the problem is get after linearization of a pursuit-evasion problem, where two pursuing objects attack another evading one on collision courses. The difficulty of the solution is connected to the fact that the payoff function (and, therefore, the value function) is not convex.

Текст научной работы на тему «Задача преследования двумя догоняющими одного убегающего»

Общая и прикладная механика Вестник Нижегородского университета им. Н.И. Лобачевского, 2011, № 4, с. 276-277

УДК 517.977.8

ЗАДАЧА ПРЕСЛЕДОВАНИЯ ДВУМЯ ДОГОНЯЮЩИМИ ОДНОГО УБЕГАЮЩЕГО

© 2011 г. В.С. Пацко1, С.А. Ганебний1, С.С. Кумков1, С. ЛеМенек2

1Институт математики и механики УрО РАН, Екатеринбург 2EADS / MBDA France, Париж (Франция)

[email protected]

Поступила в редакцию 16.05.2011

Приводятся результаты численного исследования антагонистической линейной дифференциальной игры, в которой функция платы подсчитывается в два момента времени с использованием операции минимума. С содержательной точки зрения рассматриваемая задача получается в результате линеаризации задачи преследования, где два догоняющих объекта атакуют на встречных курсах убегающий объект. Сложность решения вызвана тем, что функция платы (а, следовательно, и функция цены) не является выпуклой.

Ключевые слова: дифференциальные игры, максимальные стабильные мосты, оптимальные стратегии, численные методы.

Исследуется дифференциальная игра с двумя догоняющими и одним убегающим. Три инерционных объекта передвигаются по прямой. Описание динамики для преследователей Р1 и Р2:

ZPj — aPx ■

Z P2 — aP2

ap1 — (u1 aP1 ) //p1 , aP2 — (u2 aP2 ) /lP2 ,

І и1І-М-ь aP1(to) — 0,

|u2 |-^2> aP2(to) — 0.

(1)

Здесь 2^ и — геометрические положения, аР1 и

ар — ускорения, вызванные управлениями и1, и2. Скорость отработки управляющих воздействий задается константами 1Р1 и 1Рг (постоянные времени).

Динамика убегающего Е имеет аналогичный

вид:

(2)

'¿Е = аЕ, аЕ = (V-аЕ)/ 1Е,

IV | ^, аЕ (¿о) = 0.

Зафиксируем моменты Тх и Т2 . В момент Т подсчитывается промах первого преследователя относительно убегающего, в момент Т2 — промах второго преследователя:

гръЕ (T1) = | Ze (T) - Zpi(T)\

Гр2,Е (T2) = 1 ZE (T2) - ZP2(T2)

(3)

Условимся, что преследователи действуют ко -ординированно. Это означает, что можно объединить их в одного игрока Р (назовем его первым), который распоряжается векторным управлением и = (и 1, и2). Убегающего Е считаем вторым игроком. Результирующим промахом назовем величину

Ф = тт^,е(T1), гр2,е(Т2)}. (4)

В каждый момент ^ игроки точно знают все фазовые координаты 2Р, ¿р , ар, 2Р , ¿р , ар , гЕ, ¿Е, аЕ. Первый игрок, строя свое управление по принципу обратной связи, старается минимизировать промах ф, второй максимизирует промах.

Соотношения (1)—(4) задают стандартную антагонистическую дифференциальную игру [1]. Требуется найти функцию цены и построить оптимальные стратегии игроков.

Опишем содержательную задачу, разумное упрощение которой приводит к формулировке модельной игры (1)—(4). Предположим, что два догоняющих объекта атакуют на встречных курсах убегающий объект. Например, это могут быть ракеты или самолеты в горизонтальной плоскости. Номинальное движение первого догоняющего подбирается по номинальному движению убегающего так, что в некоторый момент Т1 происходит их точная встреча. Аналогично подбирается номинальное движение второго догоняющего (встреча в момент Т2). Однако реальные начальные положения объектов отличны от номинальных. Кроме того, убегающий объект, используя свое управление, может изменять траекторию своего движения по сравнению с номинальной (но не принципиально, без каких-либо разворотов). Корректирующие координированные усилия догоняющих вырабатываются поэтому в процессе движения по принципу обратной связи так, чтобы минимизировать результирующий промах, определяемый как минимум из отклонений (по абсолютной величине) в моменты Т1 и Т2 соответст-

венно первого и второго догоняющего от убегающего.

Переход от нелинейной динамики к динамике, линеаризованной относительно номинальных движений, и дает рассматриваемую постановку.

Приведены результаты численного исследования игры (1)—(4) для всех возможных вариантов соотношений динамических возможностей преследователей и убегающего.

Сложность решения вызвана тем, что функция платы ф (даже если T1 = T2) не является выпуклой. В статье [2] был рассмотрен случай «сильных» преследователей и аналитическими методами исследовано множество разрешимости, соответствующее поимке с нулевым результирующим промахом. Для Т1 = Т2 получено точное решение, при T1 Ф T2 дана оценка сверху искомого множества. В общем случае получить аналитическое решение, на взгляд авторов, не является возможным.

При численном исследовании сделан упор на алгоритмы и программы решения линейных диф-

ференциальных игр, разработанные в Институте математики и механики УрО РАН [3]. Основой является попятное построение множеств уровня (множеств Лебега) функции цены. Оптимальные стратегии игроков строятся в результате обработки таких множеств.

Работа выполнена при поддержке РФФИ (гранты №№ 09-01-00436 и 10-01-96006).

Список литературы

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.

2. Le Menec S. Linear differential game with two pursuers and one evader. In: Annals of the International Society of Dynamic Games. Vol. 11: Advances in Dynamic Games. Theory, Applications, and Numerical Methods for Differential and Stochastic Games / Eds. M. Breton, K. Szajo-wski. Boston: Birkhauser, 2011. P. 209-226.

3. Алгоритмы и программы решения линейных дифференциальных игр / Под ред. А.И. Субботина, В.С. Пацко. Свердловск: Институт математики и механики, 1984.

THE PROBLEM OF PURSUIT OF ONE EVADER BY TWO PURSUERS V.S. Patsko, S.A. Ganebny, S.S. Kumkov, S. Le Menec

Results of the numerical investigation of an antagonistic linear differential game, where the payoff function is computed at two instants using the operation of minimum are presented. From the practical point of view, the problem is get after linearization of a pursuit-evasion problem, where two pursuing objects attack another evading one on collision courses. The difficulty of the solution is connected to the fact that the payoff function (and, therefore, the value function) is not convex.

Keywords: differential games, maximal stable bridges, optimal strategies, numerical methods.

i Надоели баннеры? Вы всегда можете отключить рекламу.