Об одном численном методе решения задач конфликтного управления

Корнев Дмитрий Васильевич

Известия Института математики и информатики УдГУ. 2012. Вып. 1 (39)

УДК 517.977 © Д. В. Корнев

ОБ ОДНОМ ЧИСЛЕННОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧ КОНФЛИКТНОГО УПРАВЛЕНИЯ1

Для линейно-выпуклых позиционных дифференциальных игр с показателями качества, оценивающими отклонения траектории движения в заданные моменты времени от заданных целей, обсуждается метод вычисления цены и оптимальных законов управления, основанный на рекуррентном построении выпуклых сверху оболочек подходящих вспомогательных функций.

Ключевые слова: дифференциальные игры, цена игры, седловая точка, минимаксная-максиминная стратегии.

§ 1. Постановка задачи

Рассматривается позиционная дифференциальная игра [1—3], описываемая уравнением дви-

Здесь х — фазовый вектор; х = йх/йЬ; и — управляющие воздействия первого игрока, V — второго; А(Ь) и f (Ь,и,и) — непрерывные по совокупности переменных матрица-функция и вектор-функция, соответственно; моменты времени Ьо и § зафиксированы; Р и Q компактны; Ьг € [Ьо,§]: и < Ьг+1, * = — 1, Ьн = §, — заданные моменты времени оценки

качества движения; сг € К” — целевые векторы, ^ — постоянные йг х п-матрицы с линейно независимыми строками; ^1(^1 ,...,ун) — норма в пространстве (^1 + ... + йн)-мерных векторов-наборов (у1,..., ун), составленных из йг— мерных векторов уг, г = 1,..., N. Первый игрок нацелен минимизировать показатель 7, второй — максимизировать.

Предполагается, что существуют нормы уг,..., ун) и &г(Уг, в), для которых справедливы

равенства

Ц-г(уг,... ,ун ) = аг(уг,в), в = Ц-г+1(уг+1,... ,ун), г = 1,...^ — 1.

Тогда [4] показатель качества 7 является позиционным [3, с. 43].

Известно [3, с. 71], что, если для системы (1) выполнено условие седловой точки в маленькой игре, то есть для любых т € К” и Ь € [Ьо, §] справедливо равенство

где (-, ■) обозначает скалярное произведение векторов, то рассматриваемая дифференциальная игра имеет цену и седловую точку в классе чистых позиционных стратегий и(Ь,х,е), v(t,x,e). Если же условие (3) не выполняется, то чистых позиционных стратегий недостаточно, и имеет смысл [1,3] рассматривать формализации дифференциальной игры (1), (2) в следующих классах стратегий:

(a) стратегии и(Ь,х,е) первого игрока — контрстратегии и(Ь,х,и,е) второго,

(b) контрстратегии и(Ь,х,и,е) первого — стратегии и(Ь,х,е) второго,

(c) смешанные стратегии игроков 5и и Бь (см. подробности в [2], а также в [3, с. 248]).

Цель работы состоит в развитии и программной реализации метода для вычисления цены и построения соответствующих оптимальных законов управления в игре (1), (2) во всех перечисленных выше случаях. Базу развиваемого метода составляют процедуры из [3,4], которые идейно связаны с конструкцией стохастического программного синтеза [1] и основаны на рекуррентном построении выпуклых сверху оболочек подходящих вспомогательных функций. Ниже приведем результаты численных экспериментов на модельном примере.

хРабота выполнена при финансовой поддержке РФФИ (проект 11-01-12088-офи-м-2011).

жения

х = А(Ь)х + f (Ь, и,у), Ь0 ^ Ь < §, х(Ь0) = х0 € Кп, и € Р С Кг, V € Q С К5,

(1)

и показателем качества

(2)

т\пшах(т, f(Ь,и^)) = тахш\п(т, f(Ь,и^)), и€Р и€Р

и€Р

(3)

§ 2. Пример

Рассмотрим дифференциальную игру, описываемую уравнением движения .. 4 и (и + у)2 2 у

x =

1 + e 8(t-2)

и показателем качества

2 1 + e 8(3-t)

u € P = {-1,1}, v € Q = {-1,1}

7 = д/ж2(1) + ж2(4).

to = 0 ^ t < $ = 4, x(0) = 0, X(0) = 0,

(5)

В данной игре условие седловой точки в маленькой игре не выполнено. Априорно вычисленная цена игры (4),(5) для случаев (а), (Ь) и (с) соответственно равна ра = 1.13, рь = 0.34 и рс = 0.36. На рисунке изображены траектории движения, смоделированные при совместном действии оптимальных законов управления игроков. Реализовавшиеся значения показателя качества составили, соответственно: 7„ = -\/(—0.053)2 + (—1.159)2 ~ 1.16, 7ь = л/(-0.022)2 + (-0.351)2 и 0.35, 7С = л/(-0.036)2 + (-0.371)2 и 0.37.

-1.2

-0.8

-0.6

-0.4

x

-0.2

0.2

0.4

0

Список литературы

1. Красовский Н.Н. Управление динамической системой. Задача о минимуме гарантированного результата. М: Наука, 1985. 520 с.

2. Красовский А.Н. Построение смешанных стратегий на основе стохастических программ // Прикладная математика и механика. 1987. Т. 51. Вып. 2. С. 186-192.

3. Krasovskii A.N., Krasovskii N.N. Control under Lack of Information. Berlin etc.: Birkhauser, 1995. 322 p.

4. Лукоянов Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала // Прикладная математика и механика. 1998. Т. 62. Вып. 2. С. 188-198.

Поступила в редакцию 15.02.2012

D. V. Kornev

On a numerical method of solving conflict control problems

Linear-convex positional differential games with quality indices that evaluate deviations of the motion trajectory at the given instants from the given targets are considered. A numerical method of computing the game value and optimal control laws is discussed. The method is based on a recurrent construction of upper convex hulls of appropriate auxiliary functions.

Keywords: differential games, game value, saddle point, minmax-maxmin strategies.

Mathematical Subject Classifications: 49N70

Корнев Дмитрий Васильевич, ассистент, кафедра вычислительной математики, Уральский федеральный университет, 620083, Россия, г. Екатеринбург, пр. Ленина, 51. E-mail: [email protected]

Kornev Dmitrii Vasil’evich, Assistant Lecturer, Department of Computational Mathematics, Ural Federal University, pr. Lenina, 51, Yekaterinburg, 620083, Russia

Об одном численном методе решения задач конфликтного управления Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Корнев Дмитрий Васильевич

Похожие темы научных работ по математике , автор научной работы — Корнев Дмитрий Васильевич

On a numerical method of solving conflict control problems

Текст научной работы на тему «Об одном численном методе решения задач конфликтного управления»