ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014
УДК 519.711.3:004.94
В. И. ПОТАПОВ
Омский государственный технический университет
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ ПРОТИВОБОРСТВА В КОНФЛИКТНОЙ СИТУАЦИИ ДВУХ ВОССТАНАВЛИВАЕМЫХ ПОСЛЕ ОТКАЗОВ СИСТЕМ____________________________
Поставлена задача и разработана математическая модель противоборства двух, восстанавливаемых после отказов, избыточных технических систем, участвующих в конфликтной ситуации. Разработан алгоритм решения поставленной задачи, которая сведена к дифференциальной игре между двумя конфликтующими системами. Ключевые слова: математическая модель, конфликтная ситуация, противоборство, дифференциальная игра, стратегия игрока, функция выигрыша.
Работа выполнена в соответствии с заявкой на грант РФФИ, проект №14-08-00555.
Введение. Конфликтные ситуации обычно возникают тогда, когда сталкиваются интересы двух или более враждующих сторон, преследующих различные цели, и между ними возникает противоборство за достижение собственных целей вопреки враждебным действием противоборствующей стороны. Подобные ситуации чаще всего имеют место в военном деле и в области экономики, да и другие области деятельности не являются исключением.
В данной работе в качестве конфликтующих сторон будем рассматривать две идентичные по структуре избыточные технические системы, содержащие основные и резервные компоненты (блоки), подключаемые вместо отказавших основных, для восстановления функциональных возможностей соответствующей системы, участвующей в противоборстве. Каждая из участвующих в конфликте сторон в процессе противоборства систем стремится ослабить противодействующую систему, уменьшая вероятность ее безотказной работы, путем целенаправленного воздействия (атаками) на ее компоненты, увеличивая интенсивность их отказов в течение времени взаимодействия.
В задачу каждой из противоборствующих сторон входит выбор оптимальной стратегии поведения в конфликтной ситуации с целью максимизации соответствующей функции выигрыша за счет оптимального использования резервных компонентов.
Математическая модель противоборствующих систем. Будем полагать, что каждая из двух участвующих в конфликте систем Б9(п, т, в),9=1, 2 состоит из п (п = п1+п2+...+пд) основных и т (т = в1 + в2+... ...+вд) резервных блоков, разбитых на д групп, в каждой из которых возможна замена отказавших основных только резервными блоками из этой группы. При этом целочисленный вектор в = ^1, S2,..., вд), соответствующий распределению резервных блоков в д группах каждой из систем, будем называть вектором резервирования. В процессе противоборства вектор резервирования каждой из Б9 (п, т, в) систем может целенаправленно изменяться в соответству-
ющие моменты времени т1 с целью перераспределения (настройки) резервных т блоков между д группами для максимизации вероятности безотказной работы соответствующей системы последовательно в моменты настройки и к моменту окончания противоборства. Вектор т = (т0, т1, т2, • , х1), элементы которого соответствуют моментам перераспределения резервных блоков в соответствующей системе, будем в дальнейшем называть вектором настройки системы и считать, что перераспределение резервных блоков в системе, то есть восстановление работоспособности ^-системы после отказов основных блоков в соответствующей д группе и замена их резервными блоками из числа т происходит с интенсивностью №?(£).
Постановка задачи. При постановке и решении задачи противоборства двух конфликтующих динамических систем Б9 (п9, т9, в9), д=1,2 будем пользоваться в дальнейшем терминологией и понятиями теории игр [1^3]. __
Пусть системой Б 1(п1, т1, в1) располагает и управляет игрок 1, а системой Б2(п2, т2, в2) располагает и управляет игрок 2. Как указано выше, системы
-,9 т9 7я
Б (п9 , шд , в9 j, <7=1,2 являются восстанавливаемыми
после отказов с интенсивностями восстановления №7(ї), одинаковыми для всех д блоков соответствующей системы. Игрок 1 располагает множеством
стратегий Ш1 = {в1 ,12, т1}, а игрок 2 располагает множеством стратегий Ш2 = {в2, I1, т2}, где в9 — вектор резервирования д-го игрока; I9 = (190^), 19(0.19ч М) —
вектор интенсивностей отказов в д группах системы
Б9 (п9, т9, в9) (в дальнейшем с целью упрощения систему Б9 (п9, т9, в9) иногда будем обозначать 5д).
В [4] показано, что поведение восстанавливаемой системы Б9 (п9, т9, в9) может быть описано векторным уравнением вида
— Pg(t) = Dg(mg(t))Pg(t),
(1)
с начальными условиями
Pg
(2)
K(Zl, Z2)=P‘(tf)-P2(tf),
где хдеШд — стратегия д-го игрока (д= 1,2) из множества возможных стратегий Ш7.
Решение задачи противоборства двух & систем.
Для решения поставленной задачи воспользуемся методом дискретизации. Будем полагать, что каждому моменту настройки т^ (0 < ст < I) системы Бд со-
gg а1' аа2'
q).
ответствует вектор резервирования ssg = (s Введем интервалы настройки Dtg =[tg, x^+j], причем xL+1=tf. Функции интенсивности отказов 1s(t) и интенсивности восстановления ms(t) будем считать кусочно-постоянными с возможными точками разрыва первого рода в моментах настройки. Обозначим для t е Ax1, I2 (t) = (i2„0, , • , i2) и m1 (t) = m,,
а для t е Ат, 1(t) = ^) и m (0 = mS.
Таким образом, игрок 1, управляющий систе-
C1
,:,Lq
(L + 1)х q
Л2 — матрица, составленная из координат векторов 12s:
где Pg(t) — вероятность безотказной работы системы Бд в течение времени t,
а т9 (£) = (т9 (f), т 9 (О т9 (0) — вектор интенсивности
восстановления после отказов в д группах системы Бд , то есть векторное управление, а матрица Dg(llg(t)) определена в [4].
Будем считать, что число д групп для игроков 1
и 2 одинаково, то есть векторы в1 и в2 имеют одинаковую размерность д. В процессе противоборства (игры) рассматриваемых систем положим, что игрок 1 старается максимизировать величину P1(t[)— P2(t[), где t[ — время окончания игры, а игрок 2 старается минимизировать эту величину. Обозначим через Рк9({), 1<к<тд вероятность того, что в б9(п9, т9, в9) системе к моменту времени t произошло к отказов.
Будем считать, что за время игры t[ игрок д (д= 1,2) имеет право не более чем Ь (Ь>1) раз изменять свой вектор резервирования в9 , не считая момента t=0, управляемой им динамической системы
Б9(п9, т9, в9). Наконец, вектор т9 = (т9, т9, •••, т9), т9 = 0 назовем вектором настройки д-го игрока. Очевидно,что т9 < tf.
Итак, для исследования задачи противоборства
двух систем БЯ (п9, т9, в9) получена игра двух лиц с нулевой суммой с функцией выигрыша
)2 ^oo l2o1 • 12oq
Л2 = i2o 122 • ^q
iLo 12L1 * iLq (L + 1)x(q + 1)
т1 — вектор интенсивности восстановления: ц1 =
= (т0 - т1- • - ) .
Для игрока 2, управляющего системой 52, множество стратегий Ш2 ={т2, С2, Л1, ц2} строится аналогично.
Введем теперь последовательность {^, t1,..., ^+1}, которая получается объединением последовательностей {т0 , т1 т!+1} и {т2 , т2 т!+1}, элементы
в которой расположены в порядке возрастания. Ясно,
что ^0 = 0, а ^2i+l = ^f .
Обозначим Дt =[t , t , ,].
у 1 у у+1-1
Таким образом, исходя из уравнений (1) и (2), получим дифференциальную игру между двумя системами Б9 (п9, т9, в9), описываемую уравнениями
— = D1 Is1 dt
- = d1 [s1, i1(t), m1(t)]p1,
)]P
(З)
£ = D2 [s2, 12(t), m (t)JP2
с начальными условиями
P ‘(o) =
1 1
o o
o , p2(o)= o
M M
o (m1 +1) o
(4)
(m2 +1)
где Pg (t) =
Pog (t)
P! (t)
P!g t)
(mg +1)
вектор — столбец размерности (тд+ 1); Бд — матрица размерности (тд +1)х(тд +1), определенная
г— т9
мой 51, получает множество стратегий Ш1 ={т1, С \ в [4]. Очевидно, что Р9 (() = X р9П(д=1,2).
Л2, ц1} , где т1 — вектор настройки игрока 1, С1 —
матрица, составленная из координат векторов резервирования sS ;
Решение уравнений, подобных (3), для оптимального восстановления работоспособности противоборствующей системы после отказов, обеспечивающего оптимизацию вероятности безотказной работы 5д-системы дано в [4].
Управления игроков систем 5д, участвующих в игре, подчиним следующим ограничениям.
s
s
o1
s
s
11
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ
ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014
18
тах тах
19 £ M
0<а^ 0</<я М9 ■
(5)
Данное условие показывает, что ресурсы нападения игроков ограничены.
2.
тт
0<ст^ (Т"+1 -Т") “а9
(6)
3. ті + 2 ^ = Ь1»; ті + 2 = Ь2і ! 0 < СТ < L . (7)
/= 0
4.
где ф9
я
2
І=1
-фі, 0<а<L,
(8)
т9+1
2 кР9«)
а число 1 и величина РЛ9? +1# (ті) находятся из условий:
т9
Рт>+,- (Ті) = 1 “і Рк. (Ті),
Это условие запрещает каждому игроку делать две последовательные настройки «слишком быстро».
Данное условие отражает тот факт, что в любой момент времени невозможно превосходить соперника и в нападении и в защите и что сумма своих ресурсов нападения и защиты каждому игроку в любой момент времени известна.
стратегий, где <1 (ф?) — число целых неотрицательных решений уравнения (8).
/ \ (а + т9 -ф?-1^
Известно [5], что 1(ф?) = I I.
I т-ф? 0
Итак, рассматриваемая дифференциальная игра двух систем Б9 (п9, т9, в9) свелась к матричной игре (К(~1;., ~2])) размерности у1ху2, где е ШИ1 — г-я
стратегия игрока 1, г2]- е ИИ2 — /-я стратегия игрока 2. Более того, обозначив “] = К (~1г, ~2].), получим нормальную форму матричной игры А=(а/) без ограничений на стратегии игроков, так как все ограничения (5) — (8) учтены при построении матрицы А и множеств И\ И2. Как известно [6], нормальная форма матричной игры всегда имеет решение если не в чистых, то в смешанных стратегиях.
Будем искать решение матричной игры А в смешанных стратегиях, так как выяснить существование седловой точки в матрице А практически невозможно даже для небольших чисел ю, Ь и достаточно малых е1, е2.
Для решения применим метод фиктивного разыгрывания [6], который, по существу, является имитацией многократного повторения игры. В соответствии с этим методом определяются две последовательности векторов {х“ }, {у“ } следующим образом.
Первоначально
=ті •
Четвертое условие (8) указывает, что к моменту настройки ті количество резервных элементов игрока д уменьшается на величину фі , представляющую собой математическое ожидание числа отказавших элементов в Бд системе.
~ я ~
Из формулы (7) вытекает, что ті = Ь9 - 2 ,
і=0
~ [1, если 9=2,
0<а<L , где 9=!
[0, если 9=1.
Теперь множество стратегий игроков, управляющих системами Бд , можно сузить так, что для д-го
игрока V/9 ={т9, п 9, 19}.
Покажем, что рассматриваемая дифференциальная игра между двумя системами Б9 (п9, т9, в9) сводится к матричной игре.
Пусть а = тіп {а1, а2} . На интервале [0, t[[ введем множество % = {0, а, 2а, 3а, ..., ша|, где ю = [^/а — 1]. Далее, пусть точность определения управления 19 ()
равна ед. Тогда каждая координата вектора 19 () может принимать [ Мд/ ед ] + 1 значений. Последовательность моментов настроек {т9 , т2, ..., тI} на
Ы
точках множества % можно распределить І I способами.
Таким образом, для д-го игрока существует
У9 =
М.
Г
+1
П 4рі)'
(д=1, 2)
Х° =0, і=1, 2, ..., т, У° =0, ;=1, 2, ..., п.
Далее, действуя по индукции, полагают, что X “ 1 и У “_1 выбраны и найдены такие г и / , что
У 2
к(а)=1, максимизирует 2
]-1
У1 1
и с (а )=/, минимизирует 2 “ ] Х .
1-1
Если существует набор решений, при которых указанные выше выражения достигают максимума или минимума, то любую из этих стратегий (максимизирующую или минимизирующую) можно взять в качестве решения [6].
При этом
Xа 1, если і Ф к(а)
1 | тла-1
(9)
4 Ї Г“-1 +1, } = с(а) . (10)
Две последовательности векторов определяют стратегии ха и уа :
ха 1 +1, если і = к(а),
7а =]7/Х1, если 1 Ф с(а)
х а= - Xа, у а= - У а .
а а
Очевидно, что при а>1 стратегии х“ и у“ будут смешанными.
Как отмечено в [6], не существует никаких гарантий, что последовательность {х“ } или { у“ } схо-
1
I=0
У
т
к=0
к=0
СО
L
є
і=1
у
дится, но поскольку она лежит в компактном множестве стратегий, то она должна содержать сходящуюся последовательность. Предел любой сходящейся последовательности { х“ } и { у“ } является оптимальной стратегией.
Данный метод требует большого числа итераций, но итерации достаточно простые и удобны для программирования.
Численный алгоритм решения задачи противо-
(п9, т9, в9).
18. Вычислить Xа, Уа по формулам (9) и (10).
і=1
19. Вычислить ха=—Xа , уа=—Уа
аа
считая, что
хи = Xи, у1
20. Если
= У0.
борства двух систем Б п9, т9, в9). На основании
изложенного предлагается следующий алгоритм решения поставленной задачи противоборства двух технических восстанавливаемых после отказов Бд-систем, который нетрудно реализовать на современных профессиональных персональных ЭВМ.
Алгоритм.
1. Задать е1, е2, а1, а2, М1, М2, ^ Ь, {Ь1о}, {Ь2о}, 0<о<Ь.
2. Вычислить а = шт {а1, а2,} и ю=[tf /а—1].
3. Сформировать множество % = {0, а, 2а, ..., юа}.
4. Задать вектор тд = (тд, тд, тЬ), д=1 2, где т? е с.
5. Задать матрицуЛ9 =(19) <7=1, 2,0<ст<1, 0<г<д, где
I9,. = У9а169, а <е{э, 1, 2. [М9]}.
6. Вычислить т9, 9=1, 2, по формулам (7).
7. Вычислить целочисленное неотрицательное решение в9 , д=1,2, уравнения (8).
8. Вычислить Pg(tf), д= 1,2, по рекуррентной процедуре, данной в [4] формулами (2.7) и (2.8).
P1(tf); P2(tf) — решения системы уравнений (3) с начальными условиями (4).
9. Вычислить а/=Р1^[) — Р2(у.
10. Выполнить процедуру пп. 7 — 8 для всех целых
неотрицательных я1,Я 2 решений уравнения (8).
11. Выполнить процедуру пп. 5— 10 для всевозможных комбинаций уд е {0, 1, 2, ..., [ Мд ]}, д = 1, 2.
12. Выполнить процедуру пп. 4—11 для всевозможных т9,9=1, 2, где т? е с, 0 < ст < I .
13. Сформировать матрицу А=(а] )ч,1хУ2 .
14. Задать число е>0 (точность решения).
15. Положить X0 = 0, У0 = 0.
16. Положить а=1.
44
17. Вычислить к(а) = г, максимизирующее 2
^ X “-х “ 1 |+| у “-у “ ^ <6 , идти к п. 23.
Здесь 11 Х| — евклидова норма вектора х.
21. Положить а = а +1
22. Идти к п. 17.
23. Конец (х“, у“ — оптимальные стратегии).
В заключение следует отметить, что если в конфликте участвуют подвижные противоборствующие системы, то задача оптимального управления усложняется и для ее решения могут быть использованы методы и приемы, изложенные в [7, 8].
Библиографический список
1. Гермейер, Ю. Б. Введение в теорию исследования операций / Ю. Б. Гермейер. — М. : Наука, 1971. — 383 с.
2. Оуэн, Н. Г. Теория игр / Н. Г. Оуэн. — М. : Мир, 1971. — 226 с.
3. Дюбин, Г. Н. Введение в прикладную теорию игр /
Г. Н. Дюбин, В. Г. Суздаль. — М. : Наука, 1981. — 336 с.
4. Потапов, В. И. Новые задачи оптимизации резервированных систем / В. И. Потапов, С. Г. Братцев. — Иркутск : Изд-во Иркут. ун-та, 1986. — 112 с.
5. Сачков, В. Н. Комбинаторные методы дискретной математики / В. Н. Сачков. — М. : Наука, 1977. — 320 с.
6. Оуэн, Н. Г. Теория игр и игровое моделирование / Н. Г. Оуэн // Исследование операций. Методологические основы и математические методы. — М. : Мир, 1981. — Т. 1. — С. 513-549.
7. Потапов, В. И. Дифференциальная игра между подвижными и неподвижными системами / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. — 2012. — № 3 (113). — С. 268 — 271.
8. Потапов, В. И. Разработка математической модели и алгоритма оптимального управления подвижной структурно-пере-страиваемой избыточной системой, управляемой по каналам связи / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. — 2013. — № 3 (123). — С. 13 — 18.
с(а)= 1, минимизирующее 2 а^а 1.
ПОТАПОВ Виктор Ильич, доктор технических наук, профессор (Россия), заведующий кафедрой «Информатика и вычислительная техника», заслуженный деятель науки и техники РФ.
Адрес для переписки: гу! @ omgtu.ru
Статья поступила в редакцию 29.10.2013 г.
© В. И. Потапов
=1
Книжная полка
Новиков, Д. П. Некоторые новые методы конечнозонного интегрирования солитонных уравнений / Д. П. Новиков, Р. К. Романовский, С. Г. Садовничук ; ОмГТУ. - Новосибирск : Наука, 2013. - 251 с. - 1БВЫ 9785-02-019138-9.
Основное содержание книги — изложение результатов проведенных авторами исследований по математической теории солитонов. Предлагаемые методы конечнозонного интегрирования проиллюстрированы на ряде фундаментальных уравнений математической физики. Приведены базовые сведения по алгебраической геометрии и аналитической теории тэта-функций. В Приложении построен класс изомонодромных решений уравнения Белавина— Полякова—Замолодчикова. Для научных работников — математиков, физиков, а также для студентов и аспирантов соответствующих специальностей.
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ