ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014
20
УДК 519.711.3:004.94
В. И. ПОТАПОВ
Омский государственный технический университет
ПРОТИВОБОРСТВО (ДИФФЕРЕНЦИАЛЬНАЯ ИГРА)
МЕЖДУ ПОДВИЖНЫМИ УПРАВЛЯЕМЫМИ ОБЪЕКТАМИ____________________
Дана постановка и разработана математическая модель игровой задачи противоборства между подвижными объектами, управляемыми двумя игроками. Дифференциальная игра сведена к матричной, решение которой ищется в смешанных стратегиях. Ключевые слова: математическая модель, противоборство, дифференциальная игра, подвижные объекты, функция выигрыша, стратегии игроков.
Работа выполнена в соответствии с заявкой на грант РФФИ, проект № 14-08-00555.
В работе [1] разработана математическая модель и алгоритм для решения игровой задачи типа «нападение — защита» для двух игроков, располагающих подвижными (нападающими) и неподвижными (защищающимися) объектами (системами) соответственно. При этом при приближении подвижного объекта к неподвижному на определенное расстояние противоборствующие системы начинают целенаправленно воздействовать друг на друга, увеличивая интенсивность отказов системы противника, т.е. уменьшать функциональную надежность соответствующей противоборствующей системы.
Дифференциальная игра между противоборствующими объектами сведена к минимаксной игре в смешанных стратегиях с функцией выигрыша, равной разности сумм вероятностей безотказной работы объектов нападения и объектов защиты в течение времени игры. При этом множеством стратегий, для выбора из них оптимальной, для нападающего игрока является набор траекторий движения подвижных объектов к местам нападения, а множеством стратегий для защищающегося игрока, для выбора из них оптимальной, является целенаправленный выбор места расположения объектов защиты в заданной области расположения защищающихся — неподвижных объектов.
Используя (по возможности) систему обозначений и основные положения, изложенные в [1], развивая эти положения, рассмотрим следующую игровую задачу противоборства между подвижными управляемыми объектами.
Игроки 1 и 2, участвующие в игре, располагают Ь1 и Ь2 подвижными объектами (системами) соответственно, которые в начале игры находятся в точках г10, 1 < к < Ь1 и г20, 1 < к < Ь2. В дальнейшем под понятиями подвижный объект и подвижная система будем понимать одно и то же — противоборствующий объект. Обозначим через tkf время движения (полета) к-го объекта, управляемого д-м игроком, д=1,2, от точки ткд0, до точки . Очевидно, что число tkf (время движения к-го объекта) зависит от траектории Тд = тя, выбираемой в процессе игры д-м игроком для управления к-м подвижным объектом, причем тд (0) = тд0 и Тд ) = тд . На траектории всех подвижных объектов тд (^ , д=1,2; 1 <к< Ьд
и законы их движения наложим те же ограничения, что и в [1 ] .
Противоборствующие стороны динамически активно влияют друг на друга при приближении к-го объекта, управляемого д-м игроком, к подвижному объекту противоборства на расстояние дальности активного взаимодействия, используя для этого соответствующие механизмы воздействия на увеличение интенсивности отказов противоборствующей системы, то есть уменьшая вероятность ее безотказной работы (функциональную надежность), приводящую, в конечном итоге, к отказу системы в целом.
Обозначим через ркд вероятность безотказной работы к-го подвижного объекта, управляемого д-м игроком; д=1,2; 1<к<Ьд ; 1 кд — интенсивность отказов соответствующего к, д-объекта. Тогда, при аппроксимации поведения в процессе игры противоборствующих подвижных объектов неоднородным марковским процессом [2], игра может быть описана следующей системой дифференциальных уравнений Колмогорова:
Ркд Ю = -1 кдР кд М. я = 1 2
с начальными условиями р д(0)=1, где
(1)
к =
1, 2, • , Ц при q = 1, 1, 2, • , Ь2 при q = 2,
а интенсивность отказов 1кд определяется из указанных выше условий противоборства подвижных систем следующим образом (2):
1 и =1к (і< тк)+2
1 к2 = ^\ Гк) + 2
|а(г,2)
іа(а)
(2)
(3)
при этом величина
0, если х > укд ;
1, если х < укд .
(4)
(=1
к
Г2 - Г1
ь
1
=1
к
В приведенных выражениях (2), (3), (4)
Укд — дальность действия к-го объекта, управляемого д-м игроком в процессе взаимодействия с противником;
{а(к,1)}, {а (к ,2)} — заданные последовательности действительных чисел, где а (к, д) определяется типом к-го подвижного объекта, управляемого д-м игроком;
1к (^, Гд) — интенсивность отказов к-го объекта д-го игрока, определяемая объективными факторами: временем t, влияющим на старение системы, и траекторией движения к-й системы, выбираемой д-м игроком в процессе противоборства с учетом имеющихся «препятствий» на пути движения системы;
X, МІГ? - Г,
——* X -
іа(г,2) '
а(!,1)
интенсивности
отказов, зависящие от функции взаимодействия подвижных объектов игрока 1 с подвижными объектами игрока 2 и объектов игрока 2 с объектами игрока 1 соответственно в пределах дальности действия каждого противоборствующего объекта.
В связи с тем, что дифференциальные уравнения в системе уравнений (1) имеют переменные коэффициенты, поскольку интенсивность отказов противоборствующих систем зависит от многих переменных и изменяется в пространстве и времени, то получить аналитическое решение для вычисления безотказной работы ркд каждого к-го подвижного объекта 1 <к<Ьд, управляемого д-м (д = 1,2) игроком, не представляется возможным.
Поэтому для решения системы дифференциальных уравнений (1) удобно использовать математический аппарат метода дискретизации, разработанный для решения подобных задач в [3].
Очевидно, что в рассматриваемой дифференциальной игре множеством стратегий Ш д-го игрока является множество траекторий гд ^) соответствующего подвижного объекта, участвующего в противоборстве, то есть
Шд = { Гдд р)| 1 £ к £ Ьд}, д = 1, 2.
В качестве функции выигрыша примем
А ^ Ь ^
-2 ] = Е Рк1(^ ) "Е Р к 2 (t^),
к=1 к=1
где - еШ1, а t — заданное время игры.
Решением рассматриваемой задачи, так же как и в [1], является вычисление оптимальных стратегий ~ и г2, для которых
К[~1,~2]= тт тах К[21,22].
-2 -1
В результате дифференциальная игра сводится к матричной и ее решение ищется в смешанных стратегиях [4].
Алгоритм численного решения рассматриваемой задачи противоборства между подвижными управляемыми объектами в значительной мере совпадает с алгоритмом, противоборства подвижных и неподвижных объектов, разработанным в [1], который может быть реализован на современных профессиональных персональных компьютерах. Для этого после ввода исходных данных выполняются процедуры 2 — 4 и 6—15, разработанного в [1] алгоритма последовательно для д =1,2.
Очевидно, что рассматриваемая модель предусматривает возможность объединения нескольких подвижных объектов, управляемых одним игроком, для достижения единой цели. Подобная задача будет рассмотрена в другой работе.
Библиографический список
1. Потапов, В. И. Дифференциальная игра между подвижными и неподвижными объектами / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. — 2012. - № 3 (113). - С. 268-271.
2. Вентцель, Е. С. Исследование операций / Е. С. Вентцель. — М. : Сов. радио, 1972. — 550 с.
3. Потапов, В. И. Новые задачи оптимизации резервированных систем / В. И. Потапов, С. Г. Братцев. — Иркутск : Изд-во Иркут. ун-та, 1986. - 112 с.
4. Оуэн, Н. Г. Теория игр и игровое моделирование / Н. Г. Оуэн // Исследование операций. Методологические основы и математические методы. - М. : Мир, 1972. -С. 513-549.
ПОТАПОВ Виктор Ильич, доктор технических наук, профессор (Россия), заведующий кафедрой «Информатика и вычислительная техника», заслуженный деятель науки и техники РФ.
Адрес для переписки: ту! @ omgtu.ru
Статья поступила в редакцию 18.11.2013 г.
© В. И. Потапов
і=і
(=і
к
к
Книжная полка
Певзнер, Л. Д. Теория систем управления : учеб. пособие для вузов по направлению подгот. 220400 «Управление в технических системах» / Л. Д. Певзнер. - 2-е изд., испр. и доп. - СПб. [и др.] : Лань, 2013. - 420 с.
Учебное пособие включает основные разделы современной теории управления динамическими системами, снабжено многочисленными примерами и иллюстрациями, даны упражнения для практических занятий. Книга в значительной мере автономна, в ее приложении содержатся достаточные сведения для понимания математического аппарата современной теории управления. Для студентов, обучающихся по специальности «Управление и информатика в технических системах» направления подготовки «Автоматизация и управление», «Управление в технических системах» и смежных направлений при изучении дисциплин «Теория автоматического управления», «Основы теории управления», «Автоматизация технологических процессов», а также для аспирантов.
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ