Научная статья на тему 'Об одном численном методе решения задач конфликтного управления'

Об одном численном методе решения задач конфликтного управления Текст научной статьи по специальности «Математика»

CC BY
87
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ / ЦЕНА ИГРЫ / СЕДЛОВАЯ ТОЧКА / МИНИМАКСНАЯ-МАКСИМИННАЯ СТРАТЕГИИ / DIFFERENTIAL GAMES / GAME VALUE / SADDLE POINT / MINMAX-MAXMIN STRATEGIES

Аннотация научной статьи по математике, автор научной работы — Корнев Дмитрий Васильевич

Для линейно-выпуклых позиционных дифференциальных игр с показателями качества, оценивающими отклонения траектории движения в заданные моменты времени от заданных целей, обсуждается метод вычисления цены и оптимальных законов управления, основанный на рекуррентном построении выпуклых сверху оболочек подходящих вспомогательных функций.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On a numerical method of solving conflict control problems

Linear-convex positional differential games with quality indices that evaluate deviations of the motion trajectory at the given instants from the given targets are considered. A numerical method of computing the game value and optimal control laws is discussed. The method is based on a recurrent construction of upper convex hulls of appropriate auxiliary functions.

Текст научной работы на тему «Об одном численном методе решения задач конфликтного управления»

Известия Института математики и информатики УдГУ. 2012. Вып. 1 (39)

УДК 517.977 © Д. В. Корнев

ОБ ОДНОМ ЧИСЛЕННОМ МЕТОДЕ РЕШЕНИЯ ЗАДАЧ КОНФЛИКТНОГО УПРАВЛЕНИЯ1

Для линейно-выпуклых позиционных дифференциальных игр с показателями качества, оценивающими отклонения траектории движения в заданные моменты времени от заданных целей, обсуждается метод вычисления цены и оптимальных законов управления, основанный на рекуррентном построении выпуклых сверху оболочек подходящих вспомогательных функций.

Ключевые слова: дифференциальные игры, цена игры, седловая точка, минимаксная-максиминная стратегии.

§ 1. Постановка задачи

Рассматривается позиционная дифференциальная игра [1—3], описываемая уравнением дви-

Здесь х — фазовый вектор; х = йх/йЬ; и — управляющие воздействия первого игрока, V — второго; А(Ь) и f (Ь,и,и) — непрерывные по совокупности переменных матрица-функция и вектор-функция, соответственно; моменты времени Ьо и § зафиксированы; Р и Q компактны; Ьг € [Ьо,§]: и < Ьг+1, * = — 1, Ьн = §, — заданные моменты времени оценки

качества движения; сг € К” — целевые векторы, ^ — постоянные йг х п-матрицы с линейно независимыми строками; ^1(^1 ,...,ун) — норма в пространстве (^1 + ... + йн)-мерных векторов-наборов (у1,..., ун), составленных из йг— мерных векторов уг, г = 1,..., N. Первый игрок нацелен минимизировать показатель 7, второй — максимизировать.

Предполагается, что существуют нормы уг,..., ун) и &г(Уг, в), для которых справедливы

равенства

Ц-г(уг,... ,ун ) = аг(уг,в), в = Ц-г+1(уг+1,... ,ун), г = 1,...^ — 1.

Тогда [4] показатель качества 7 является позиционным [3, с. 43].

Известно [3, с. 71], что, если для системы (1) выполнено условие седловой точки в маленькой игре, то есть для любых т € К” и Ь € [Ьо, §] справедливо равенство

где (-, ■) обозначает скалярное произведение векторов, то рассматриваемая дифференциальная игра имеет цену и седловую точку в классе чистых позиционных стратегий и(Ь,х,е), v(t,x,e). Если же условие (3) не выполняется, то чистых позиционных стратегий недостаточно, и имеет смысл [1,3] рассматривать формализации дифференциальной игры (1), (2) в следующих классах стратегий:

(a) стратегии и(Ь,х,е) первого игрока — контрстратегии и(Ь,х,и,е) второго,

(b) контрстратегии и(Ь,х,и,е) первого — стратегии и(Ь,х,е) второго,

(c) смешанные стратегии игроков 5и и Бь (см. подробности в [2], а также в [3, с. 248]).

Цель работы состоит в развитии и программной реализации метода для вычисления цены и построения соответствующих оптимальных законов управления в игре (1), (2) во всех перечисленных выше случаях. Базу развиваемого метода составляют процедуры из [3,4], которые идейно связаны с конструкцией стохастического программного синтеза [1] и основаны на рекуррентном построении выпуклых сверху оболочек подходящих вспомогательных функций. Ниже приведем результаты численных экспериментов на модельном примере.

хРабота выполнена при финансовой поддержке РФФИ (проект 11-01-12088-офи-м-2011).

жения

х = А(Ь)х + f (Ь, и,у), Ь0 ^ Ь < §, х(Ь0) = х0 € Кп, и € Р С Кг, V € Q С К5,

(1)

и показателем качества

(2)

т\пшах(т, f(Ь,и^)) = тахш\п(т, f(Ь,и^)), и€Р и€Р

и€Р

(3)

§ 2. Пример

Рассмотрим дифференциальную игру, описываемую уравнением движения .. 4 и (и + у)2 2 у

x =

1 + e 8(t-2)

и показателем качества

2 1 + e 8(3-t)

u € P = {-1,1}, v € Q = {-1,1}

7 = д/ж2(1) + ж2(4).

to = 0 ^ t < $ = 4, x(0) = 0, X(0) = 0,

(5)

В данной игре условие седловой точки в маленькой игре не выполнено. Априорно вычисленная цена игры (4),(5) для случаев (а), (Ь) и (с) соответственно равна ра = 1.13, рь = 0.34 и рс = 0.36. На рисунке изображены траектории движения, смоделированные при совместном действии оптимальных законов управления игроков. Реализовавшиеся значения показателя качества составили, соответственно: 7„ = -\/(—0.053)2 + (—1.159)2 ~ 1.16, 7ь = л/(-0.022)2 + (-0.351)2 и 0.35, 7С = л/(-0.036)2 + (-0.371)2 и 0.37.

-1.2

-0.8

-0.6

-0.4

x

-0.2

0.2

0.4

0

Список литературы

1. Красовский Н.Н. Управление динамической системой. Задача о минимуме гарантированного результата. М: Наука, 1985. 520 с.

2. Красовский А.Н. Построение смешанных стратегий на основе стохастических программ // Прикладная математика и механика. 1987. Т. 51. Вып. 2. С. 186-192.

3. Krasovskii A.N., Krasovskii N.N. Control under Lack of Information. Berlin etc.: Birkhauser, 1995. 322 p.

4. Лукоянов Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала // Прикладная математика и механика. 1998. Т. 62. Вып. 2. С. 188-198.

Поступила в редакцию 15.02.2012

D. V. Kornev

On a numerical method of solving conflict control problems

Linear-convex positional differential games with quality indices that evaluate deviations of the motion trajectory at the given instants from the given targets are considered. A numerical method of computing the game value and optimal control laws is discussed. The method is based on a recurrent construction of upper convex hulls of appropriate auxiliary functions.

Keywords: differential games, game value, saddle point, minmax-maxmin strategies.

Mathematical Subject Classifications: 49N70

Корнев Дмитрий Васильевич, ассистент, кафедра вычислительной математики, Уральский федеральный университет, 620083, Россия, г. Екатеринбург, пр. Ленина, 51. E-mail: [email protected]

Kornev Dmitrii Vasil’evich, Assistant Lecturer, Department of Computational Mathematics, Ural Federal University, pr. Lenina, 51, Yekaterinburg, 620083, Russia

i Надоели баннеры? Вы всегда можете отключить рекламу.