Известия Института математики и информатики УдГУ. 2012. Вып. 1 (39)
УДК 517.977 © Д. В. Корнев
ОБ ОДНОМ ЧИСЛЕННОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧ КОНФЛИКТНОГО УПРАВЛЕНИЯ1
Для линейно-выпуклых позиционных дифференциальных игр с показателями качества, оценивающими отклонения траектории движения в заданные моменты времени от заданных целей, обсуждается метод вычисления цены и оптимальных законов управления, основанный на рекуррентном построении выпуклых сверху оболочек подходящих вспомогательных функций.
Ключевые слова: дифференциальные игры, цена игры, седловая точка, минимаксная-максиминная стратегии.
§ 1. Постановка задачи
Рассматривается позиционная дифференциальная игра [1—3], описываемая уравнением дви-
Здесь х — фазовый вектор; х = йх/йЬ; и — управляющие воздействия первого игрока, V — второго; А(Ь) и f (Ь,и,и) — непрерывные по совокупности переменных матрица-функция и вектор-функция, соответственно; моменты времени Ьо и § зафиксированы; Р и Q компактны; Ьг € [Ьо,§]: и < Ьг+1, * = — 1, Ьн = §, — заданные моменты времени оценки
качества движения; сг € К” — целевые векторы, ^ — постоянные йг х п-матрицы с линейно независимыми строками; ^1(^1 ,...,ун) — норма в пространстве (^1 + ... + йн)-мерных векторов-наборов (у1,..., ун), составленных из йг— мерных векторов уг, г = 1,..., N. Первый игрок нацелен минимизировать показатель 7, второй — максимизировать.
Предполагается, что существуют нормы уг,..., ун) и &г(Уг, в), для которых справедливы
равенства
Ц-г(уг,... ,ун ) = аг(уг,в), в = Ц-г+1(уг+1,... ,ун), г = 1,...^ — 1.
Тогда [4] показатель качества 7 является позиционным [3, с. 43].
Известно [3, с. 71], что, если для системы (1) выполнено условие седловой точки в маленькой игре, то есть для любых т € К” и Ь € [Ьо, §] справедливо равенство
где (-, ■) обозначает скалярное произведение векторов, то рассматриваемая дифференциальная игра имеет цену и седловую точку в классе чистых позиционных стратегий и(Ь,х,е), v(t,x,e). Если же условие (3) не выполняется, то чистых позиционных стратегий недостаточно, и имеет смысл [1,3] рассматривать формализации дифференциальной игры (1), (2) в следующих классах стратегий:
(a) стратегии и(Ь,х,е) первого игрока — контрстратегии и(Ь,х,и,е) второго,
(b) контрстратегии и(Ь,х,и,е) первого — стратегии и(Ь,х,е) второго,
(c) смешанные стратегии игроков 5и и Бь (см. подробности в [2], а также в [3, с. 248]).
Цель работы состоит в развитии и программной реализации метода для вычисления цены и построения соответствующих оптимальных законов управления в игре (1), (2) во всех перечисленных выше случаях. Базу развиваемого метода составляют процедуры из [3,4], которые идейно связаны с конструкцией стохастического программного синтеза [1] и основаны на рекуррентном построении выпуклых сверху оболочек подходящих вспомогательных функций. Ниже приведем результаты численных экспериментов на модельном примере.
хРабота выполнена при финансовой поддержке РФФИ (проект 11-01-12088-офи-м-2011).
жения
х = А(Ь)х + f (Ь, и,у), Ь0 ^ Ь < §, х(Ь0) = х0 € Кп, и € Р С Кг, V € Q С К5,
(1)
и показателем качества
(2)
т\пшах(т, f(Ь,и^)) = тахш\п(т, f(Ь,и^)), и€Р и€Р
и€Р
(3)
§ 2. Пример
Рассмотрим дифференциальную игру, описываемую уравнением движения .. 4 и (и + у)2 2 у
x =
1 + e 8(t-2)
и показателем качества
2 1 + e 8(3-t)
u € P = {-1,1}, v € Q = {-1,1}
7 = д/ж2(1) + ж2(4).
to = 0 ^ t < $ = 4, x(0) = 0, X(0) = 0,
(5)
В данной игре условие седловой точки в маленькой игре не выполнено. Априорно вычисленная цена игры (4),(5) для случаев (а), (Ь) и (с) соответственно равна ра = 1.13, рь = 0.34 и рс = 0.36. На рисунке изображены траектории движения, смоделированные при совместном действии оптимальных законов управления игроков. Реализовавшиеся значения показателя качества составили, соответственно: 7„ = -\/(—0.053)2 + (—1.159)2 ~ 1.16, 7ь = л/(-0.022)2 + (-0.351)2 и 0.35, 7С = л/(-0.036)2 + (-0.371)2 и 0.37.
-1.2
-0.8
-0.6
-0.4
x
-0.2
0.2
0.4
0
Список литературы
1. Красовский Н.Н. Управление динамической системой. Задача о минимуме гарантированного результата. М: Наука, 1985. 520 с.
2. Красовский А.Н. Построение смешанных стратегий на основе стохастических программ // Прикладная математика и механика. 1987. Т. 51. Вып. 2. С. 186-192.
3. Krasovskii A.N., Krasovskii N.N. Control under Lack of Information. Berlin etc.: Birkhauser, 1995. 322 p.
4. Лукоянов Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала // Прикладная математика и механика. 1998. Т. 62. Вып. 2. С. 188-198.
Поступила в редакцию 15.02.2012
D. V. Kornev
On a numerical method of solving conflict control problems
Linear-convex positional differential games with quality indices that evaluate deviations of the motion trajectory at the given instants from the given targets are considered. A numerical method of computing the game value and optimal control laws is discussed. The method is based on a recurrent construction of upper convex hulls of appropriate auxiliary functions.
Keywords: differential games, game value, saddle point, minmax-maxmin strategies.
Mathematical Subject Classifications: 49N70
Корнев Дмитрий Васильевич, ассистент, кафедра вычислительной математики, Уральский федеральный университет, 620083, Россия, г. Екатеринбург, пр. Ленина, 51. E-mail: [email protected]
Kornev Dmitrii Vasil’evich, Assistant Lecturer, Department of Computational Mathematics, Ural Federal University, pr. Lenina, 51, Yekaterinburg, 620083, Russia