УДК 519.711.3:004.94
В.И. Попитое, V.I. Potapov e-mail [email protected]
Омский государственный технический университет, г. Омск, Россия
Omsk State Technical University.. Omsk:, Russia
РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ ИГРОВОЙ ЗАДАЧИ ПРОТИВОБОРСТВА ПОДВИЖНЫХ ОБЪЕКТОВ
DEVELOPMENT OF MATHEMATICAL MODEL GAME PROBLEM OF CONFRONTATION MOBILE OBJECTS
Дана постановка н разработана математическая модель игровой задачи противоборства между подвнж-ныме объектами управляемыми двумя игроками
Approach and mathematical model of the game task of confrontation between moving objects controlled by two gamers aie given and developed
Ключевые слова: мспшиатическая модель, противоборство, подвижные объекты, функция выигрыша, стратегии игроков
Keywords: mathematical model, confrontation, moving objects, game function, gamers strategies
Игроки 1 и 2 располагают Ly и управляемыми подвижными объектами соответственно, которые в начале игры при t = 0 находятся в точках xlv{0); (0);Xj^ v(0); v = 1,2. Стратегией v го игрока является множество траекторий zv = *2v(f)s —;*iTy(f)ï,
хь (t) = (v^.(О, ^¿,(0, хь-(*)) - траектория k -го объекта, управляемого v м игроком, который в дальнейшем будем называть (jir.v) - объектом. Множество стратегий zv обозначим через
FF . Функции xly(t) будем считать непрерывными и непрерывно дифференцируемыми на [0,fy], где tf— момент окончания игры.
Считаем, далее, что каждый подвижный объект есть система, состоящая их большого количества отказывающих в процессе конкуренции элементов данного типа. При этом объект конкурентоспособен, пока цел хотя бы один его элемент [1].
Обозначим через />fcv(f) ресурс работоспособных к моменту времени t элементов {fr.v)- объекта, например, вероятность безотказной работы, а через z~; f) - интен-
сивность отказов элементов (k.v) - объекта в момент времени t. которая определяется следующим образом:
h
zvl 0 = 0 + £Uv(%, , ( 1 )
г-1
А-
Avz?-t) = Al(хь,; 0 + X Рг<(0 и,5;?), (2)
Г-1
где py = (ply:p2v-: \Plv.v)',
{L, если v = 2, 2, если v = 1
Величина характеризует интенсивность отказов (£.V) - объекта, опреде-
ляемую объективными факторами (физико-географическими особенностями театра игры, метеорологическими условиями во время игры, радиационной обстановкой, качеством изготовления (к,У)- объекта и т.п.), определяет интенсивность отказов элементов
(к. V) - объекта, зависящую от воздействия на него (/. V) - объекта.
Для прояснения физического смысла решаемых в работе задач введем понятия «модель взаимодействия>; и {{уравнения взаимодействия двух конкурирующих объектов».
Моделью взаимодействия двух конкурирующих объектов назовем систему двух уравнений, в общем виде описывающих изменение во времени характеристик взаимодействующих объектов при фиксированном расстоянии между ними. Это определение подразумевает, что модель взаимодействия может с определенной точностью описывать изменение характеристик (например, ресурса игроков) реальных конкурирующих объектов, либо быть в определенном смысле произвольной (формальной). Во втором случае единственным требованием является учет в модели изменения характеристик объектов в зависимости от расстояний между ними.
Для определения количественных характеристик объектов модель их взаимодействия необходимо привести к соответствующим уравнениям. Уравнениями взаимодействия двух конкурирующих объектов назовем систему двух уравнений, количественно описывающих изменение во времени характеристик объектов при их произвольных перемещениях относительно друг друга. При этом в решаемых далее задачах будем считать, что:
- каждый подвижный объект есть система, состоящая из большого количества отказывающих в процессе конкуренции элементов данного типа;
- объект конкурентоспособен до тех пор. пока дел хотя бы один его элемент;
- объект характеризуется величиной Ш/) = С р(/). называемой ресурсом объекта, где /КО - вероятность безотказной работы к моменту времени / объекта (0 < < 1), а С независящий от времени параметр объекта, характеризующей степень влияния объекта на объекты конкурента, то есть параметр, определяющий сравнительную значимость объектов при данной величине р (/) .
Таким образом, модель взаимодействия дар; реальных физических объектов, учитывающую взаимозависимость их характеристик и расстояние между ними, можно, например, записать в виде
■ (3)
где и - некоторая размерная функция расстояния (функция взаимодействия), которая характеризует физические свойства - пространства между взаимодействующими объектами - например. плотность поглощающей излучение среды и характер воздействия одного объекта на другой.
Перепишем (3) в виде
А = -А С2 Рт. и2 СО - (0|);
(4)
р2 <= ~Р2 О. А »К^ (0 - (0|) -
Зададимся конкретной функцией взаимодействия и , например.
6г!(|х2 - хф = Е/зС!*! - х2\) = [I1 7^ ,
20В
где
1 при
Xj — х2\
при jq — jc2 < А
a зависят от t;k —1.2.
Подставляя: £7 в (4). получим уравнения взаимодействия двух объектов, которые тривиально преобразуются для случая двух игроков, управляющих произвольным количеством подвижных объектов.
Полученные уравнения взаимодействия определены физически обоснованной моделью.
Прояснив физический смысл задачи, в качестве функций выигрыша рассмотрим следующие величины:
Bl2ptl(tf\ (5)
i-l
Lj L,
S ^ьРиСД (6)
i-l i-l
где {iij: v = 12; 1 < jt < Ц. - заданные последовательности положительных действительных чисел.
Таким образом, мы рассматриваем две игры с платежами
IT(zh, zv) г- Ulf sup IT(zbz2); r = 1,2 (7)
Так как, по предположению, функции х£,СО непрерывны на [0,Гу], то, по теореме Вейешграсса, они равномерно непрерывны на [0,/^]. Следовательно, множество функций xj^(r) можно рассматривать как гильбертово пространство #■,[()_. г^] со скалярным произведением и нормой соответственно
< х^у >= j;; reo y(t)dt, и=(< х, х >у -.
Но тогда стратегия zr = {xb(i)|l< к < Д.} = {x^,(i)|l ^ к < Д.. 1 < j < 3} - является элементом гильбертова пространства н\'1 [0,if] со скалярным произведением
Ъ1Г
к=1
где х = (X!(г), д2(0,- -СОХ У = 0-1 СО,УгСО,■ -->>3,; (0) -
При этом множества стратегий И^, определяется конкретными ограничениями на траектории (к^у) - объектов.
Цели, преследуемые игроками в этих играх, можно интерпретировать следующим образом. В игре с функцией выигрыша игрок 1 старается максимально ослабить к концу игры игрока 2, не считаясь со своими потерями (выигрыш «любой ценой»), а в игре с функцией выигрыша 12 игрок 1 преследует ту же цель, но с учетом максимального сохранения своих ресурсов
Величины рь.(0являются решениями следующих уравнений взаимодействия:
Рь- = Л, (%, СО, Рь (3)
с начальными условиями = р^,.
Решением уравнения (8) в случае (1) является функция
А» С0 = Рь «ф
-Jo ^(x^TXzg^dT
(9)
В случае, когда стратегия игрока 2 известна, в игре участвует только игрок 1 и игровые 'задачи конкуренции превращаются в задачи оптимального управления подвижными объектами. в которых управлением является множество фиксированных траекторий игрока 1. Обозначим
N = Ц, М = Ь,, хкСО = хк1(!\ ак(О = СО, г2 = {ак(Г)|1= (Г)|1 < к < Щ. Тогда функции выигрыша г * 1,2 превращаются в функционалы качества
1Г (х). я задачи (7) - в 'задачи оптимального управления
/г(0 =. inf 7Дх)?
ietr
(10)
где W с: Н™[0, {хш (i)|l < к < N, 1 < ; < 3} , xt(г) = (хк1 (0,Лц (t\ хкг {t)) .
Библиографический список
1. Братцев. С. Г. О задачах оптимального управления конкурирующими подвижными объектами [Текст] / С. Г. Братцев, В. И. Потапов. Б. К. Нартов ; Омский политехнический институт. - Омск, 1937. -24 с - Деп в ВИНИТИ 20.06.87, №14<55-В37.
210