Математическая модель и алгоритм решения задачи противоборства в конфликтной ситуации двух восстанавливаемых после отказов систем

Потапов Виктор Ильич

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014

УДК 519.711.3:004.94

В. И. ПОТАПОВ

Омский государственный технический университет

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И АЛГОРИТМ РЕШЕНИЯ ЗАДАЧИ ПРОТИВОБОРСТВА В КОНФЛИКТНОЙ СИТУАЦИИ ДВУХ ВОССТАНАВЛИВАЕМЫХ ПОСЛЕ ОТКАЗОВ СИСТЕМ____________________________

Поставлена задача и разработана математическая модель противоборства двух, восстанавливаемых после отказов, избыточных технических систем, участвующих в конфликтной ситуации. Разработан алгоритм решения поставленной задачи, которая сведена к дифференциальной игре между двумя конфликтующими системами. Ключевые слова: математическая модель, конфликтная ситуация, противоборство, дифференциальная игра, стратегия игрока, функция выигрыша.

Работа выполнена в соответствии с заявкой на грант РФФИ, проект №14-08-00555.

Введение. Конфликтные ситуации обычно возникают тогда, когда сталкиваются интересы двух или более враждующих сторон, преследующих различные цели, и между ними возникает противоборство за достижение собственных целей вопреки враждебным действием противоборствующей стороны. Подобные ситуации чаще всего имеют место в военном деле и в области экономики, да и другие области деятельности не являются исключением.

В данной работе в качестве конфликтующих сторон будем рассматривать две идентичные по структуре избыточные технические системы, содержащие основные и резервные компоненты (блоки), подключаемые вместо отказавших основных, для восстановления функциональных возможностей соответствующей системы, участвующей в противоборстве. Каждая из участвующих в конфликте сторон в процессе противоборства систем стремится ослабить противодействующую систему, уменьшая вероятность ее безотказной работы, путем целенаправленного воздействия (атаками) на ее компоненты, увеличивая интенсивность их отказов в течение времени взаимодействия.

В задачу каждой из противоборствующих сторон входит выбор оптимальной стратегии поведения в конфликтной ситуации с целью максимизации соответствующей функции выигрыша за счет оптимального использования резервных компонентов.

Математическая модель противоборствующих систем. Будем полагать, что каждая из двух участвующих в конфликте систем Б9(п, т, в),9=1, 2 состоит из п (п = п1+п2+...+пд) основных и т (т = в1 + в2+... ...+вд) резервных блоков, разбитых на д групп, в каждой из которых возможна замена отказавших основных только резервными блоками из этой группы. При этом целочисленный вектор в = ^1, S2,..., вд), соответствующий распределению резервных блоков в д группах каждой из систем, будем называть вектором резервирования. В процессе противоборства вектор резервирования каждой из Б9 (п, т, в) систем может целенаправленно изменяться в соответству-

ющие моменты времени т1 с целью перераспределения (настройки) резервных т блоков между д группами для максимизации вероятности безотказной работы соответствующей системы последовательно в моменты настройки и к моменту окончания противоборства. Вектор т = (т0, т1, т2, • , х1), элементы которого соответствуют моментам перераспределения резервных блоков в соответствующей системе, будем в дальнейшем называть вектором настройки системы и считать, что перераспределение резервных блоков в системе, то есть восстановление работоспособности ^-системы после отказов основных блоков в соответствующей д группе и замена их резервными блоками из числа т происходит с интенсивностью №?(£).

Постановка задачи. При постановке и решении задачи противоборства двух конфликтующих динамических систем Б9 (п9, т9, в9), д=1,2 будем пользоваться в дальнейшем терминологией и понятиями теории игр [1^3]. __

Пусть системой Б 1(п1, т1, в1) располагает и управляет игрок 1, а системой Б2(п2, т2, в2) располагает и управляет игрок 2. Как указано выше, системы

-,9 т9 7я

Б (п9 , шд , в9 j, <7=1,2 являются восстанавливаемыми

после отказов с интенсивностями восстановления №7(ї), одинаковыми для всех д блоков соответствующей системы. Игрок 1 располагает множеством

стратегий Ш1 = {в1 ,12, т1}, а игрок 2 располагает множеством стратегий Ш2 = {в2, I1, т2}, где в9 — вектор резервирования д-го игрока; I9 = (190^), 19(0.19ч М) —

вектор интенсивностей отказов в д группах системы

Б9 (п9, т9, в9) (в дальнейшем с целью упрощения систему Б9 (п9, т9, в9) иногда будем обозначать 5д).

В [4] показано, что поведение восстанавливаемой системы Б9 (п9, т9, в9) может быть описано векторным уравнением вида

— Pg(t) = Dg(mg(t))Pg(t),

(1)

с начальными условиями

Pg

(2)

K(Zl, Z2)=P‘(tf)-P2(tf),

где хдеШд — стратегия д-го игрока (д= 1,2) из множества возможных стратегий Ш7.

Решение задачи противоборства двух & систем.

Для решения поставленной задачи воспользуемся методом дискретизации. Будем полагать, что каждому моменту настройки т^ (0 < ст < I) системы Бд со-

gg а1' аа2'

q).

ответствует вектор резервирования ssg = (s Введем интервалы настройки Dtg =[tg, x^+j], причем xL+1=tf. Функции интенсивности отказов 1s(t) и интенсивности восстановления ms(t) будем считать кусочно-постоянными с возможными точками разрыва первого рода в моментах настройки. Обозначим для t е Ax1, I2 (t) = (i2„0, , • , i2) и m1 (t) = m,,

а для t е Ат, 1(t) = ^) и m (0 = mS.

Таким образом, игрок 1, управляющий систе-

C1

,:,Lq

(L + 1)х q

Л2 — матрица, составленная из координат векторов 12s:

где Pg(t) — вероятность безотказной работы системы Бд в течение времени t,

а т9 (£) = (т9 (f), т 9 (О т9 (0) — вектор интенсивности

восстановления после отказов в д группах системы Бд , то есть векторное управление, а матрица Dg(llg(t)) определена в [4].

Будем считать, что число д групп для игроков 1

и 2 одинаково, то есть векторы в1 и в2 имеют одинаковую размерность д. В процессе противоборства (игры) рассматриваемых систем положим, что игрок 1 старается максимизировать величину P1(t[)— P2(t[), где t[ — время окончания игры, а игрок 2 старается минимизировать эту величину. Обозначим через Рк9({), 1<к<тд вероятность того, что в б9(п9, т9, в9) системе к моменту времени t произошло к отказов.

Будем считать, что за время игры t[ игрок д (д= 1,2) имеет право не более чем Ь (Ь>1) раз изменять свой вектор резервирования в9 , не считая момента t=0, управляемой им динамической системы

Б9(п9, т9, в9). Наконец, вектор т9 = (т9, т9, •••, т9), т9 = 0 назовем вектором настройки д-го игрока. Очевидно,что т9 < tf.

Итак, для исследования задачи противоборства

двух систем БЯ (п9, т9, в9) получена игра двух лиц с нулевой суммой с функцией выигрыша

)2 ^oo l2o1 • 12oq

Л2 = i2o 122 • ^q

iLo 12L1 * iLq (L + 1)x(q + 1)

т1 — вектор интенсивности восстановления: ц1 =

= (т0 - т1- • - ) .

Для игрока 2, управляющего системой 52, множество стратегий Ш2 ={т2, С2, Л1, ц2} строится аналогично.

Введем теперь последовательность {^, t1,..., ^+1}, которая получается объединением последовательностей {т0 , т1 т!+1} и {т2 , т2 т!+1}, элементы

в которой расположены в порядке возрастания. Ясно,

что ^0 = 0, а ^2i+l = ^f .

Обозначим Дt =[t , t , ,].

у 1 у у+1-1

Таким образом, исходя из уравнений (1) и (2), получим дифференциальную игру между двумя системами Б9 (п9, т9, в9), описываемую уравнениями

— = D1 Is1 dt

- = d1 [s1, i1(t), m1(t)]p1,

)]P

(З)

£ = D2 [s2, 12(t), m (t)JP2

с начальными условиями

P ‘(o) =

1 1

o o

o , p2(o)= o

M M

o (m1 +1) o

(4)

(m2 +1)

где Pg (t) =

Pog (t)

P! (t)

P!g t)

(mg +1)

вектор — столбец размерности (тд+ 1); Бд — матрица размерности (тд +1)х(тд +1), определенная

г— т9

мой 51, получает множество стратегий Ш1 ={т1, С \ в [4]. Очевидно, что Р9 (() = X р9П(д=1,2).

Л2, ц1} , где т1 — вектор настройки игрока 1, С1 —

матрица, составленная из координат векторов резервирования sS ;

Решение уравнений, подобных (3), для оптимального восстановления работоспособности противоборствующей системы после отказов, обеспечивающего оптимизацию вероятности безотказной работы 5д-системы дано в [4].

Управления игроков систем 5д, участвующих в игре, подчиним следующим ограничениям.

s

o1

s

11

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014

18

тах тах

19 £ M

0<а^ 0</<я М9 ■

(5)

Данное условие показывает, что ресурсы нападения игроков ограничены.

2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

тт

0<ст^ (Т"+1 -Т") “а9

(6)

3. ті + 2 ^ = Ь1»; ті + 2 = Ь2і ! 0 < СТ < L . (7)

/= 0

4.

где ф9

я

2

І=1

-фі, 0<а<L,

(8)

т9+1

2 кР9«)

а число 1 и величина РЛ9? +1# (ті) находятся из условий:

т9

Рт>+,- (Ті) = 1 “і Рк. (Ті),

Это условие запрещает каждому игроку делать две последовательные настройки «слишком быстро».

Данное условие отражает тот факт, что в любой момент времени невозможно превосходить соперника и в нападении и в защите и что сумма своих ресурсов нападения и защиты каждому игроку в любой момент времени известна.

стратегий, где <1 (ф?) — число целых неотрицательных решений уравнения (8).

/ \ (а + т9 -ф?-1^

Известно [5], что 1(ф?) = I I.

I т-ф? 0

Итак, рассматриваемая дифференциальная игра двух систем Б9 (п9, т9, в9) свелась к матричной игре (К(~1;., ~2])) размерности у1ху2, где е ШИ1 — г-я

стратегия игрока 1, г2]- е ИИ2 — /-я стратегия игрока 2. Более того, обозначив “] = К (~1г, ~2].), получим нормальную форму матричной игры А=(а/) без ограничений на стратегии игроков, так как все ограничения (5) — (8) учтены при построении матрицы А и множеств И\ И2. Как известно [6], нормальная форма матричной игры всегда имеет решение если не в чистых, то в смешанных стратегиях.

Будем искать решение матричной игры А в смешанных стратегиях, так как выяснить существование седловой точки в матрице А практически невозможно даже для небольших чисел ю, Ь и достаточно малых е1, е2.

Для решения применим метод фиктивного разыгрывания [6], который, по существу, является имитацией многократного повторения игры. В соответствии с этим методом определяются две последовательности векторов {х“ }, {у“ } следующим образом.

Первоначально

=ті •

Четвертое условие (8) указывает, что к моменту настройки ті количество резервных элементов игрока д уменьшается на величину фі , представляющую собой математическое ожидание числа отказавших элементов в Бд системе.

~ я ~

Из формулы (7) вытекает, что ті = Ь9 - 2 ,

і=0

~ [1, если 9=2,

0<а<L , где 9=!

[0, если 9=1.

Теперь множество стратегий игроков, управляющих системами Бд , можно сузить так, что для д-го

игрока V/9 ={т9, п 9, 19}.

Покажем, что рассматриваемая дифференциальная игра между двумя системами Б9 (п9, т9, в9) сводится к матричной игре.

Пусть а = тіп {а1, а2} . На интервале [0, t[[ введем множество % = {0, а, 2а, 3а, ..., ша|, где ю = [^/а — 1]. Далее, пусть точность определения управления 19 ()

равна ед. Тогда каждая координата вектора 19 () может принимать [ Мд/ ед ] + 1 значений. Последовательность моментов настроек {т9 , т2, ..., тI} на

Ы

точках множества % можно распределить І I способами.

Таким образом, для д-го игрока существует

У9 =

М.

Г

+1

П 4рі)'

(д=1, 2)

Х° =0, і=1, 2, ..., т, У° =0, ;=1, 2, ..., п.

Далее, действуя по индукции, полагают, что X “ 1 и У “_1 выбраны и найдены такие г и / , что

У 2

к(а)=1, максимизирует 2

]-1

У1 1

и с (а )=/, минимизирует 2 “ ] Х .

1-1

Если существует набор решений, при которых указанные выше выражения достигают максимума или минимума, то любую из этих стратегий (максимизирующую или минимизирующую) можно взять в качестве решения [6].

При этом

Xа 1, если і Ф к(а)

1 | тла-1

(9)

4 Ї Г“-1 +1, } = с(а) . (10)

Две последовательности векторов определяют стратегии ха и уа :

ха 1 +1, если і = к(а),

7а =]7/Х1, если 1 Ф с(а)

х а= - Xа, у а= - У а .

а а

Очевидно, что при а>1 стратегии х“ и у“ будут смешанными.

Как отмечено в [6], не существует никаких гарантий, что последовательность {х“ } или { у“ } схо-

1

I=0

У

т

к=0

СО

L

є

і=1

у

дится, но поскольку она лежит в компактном множестве стратегий, то она должна содержать сходящуюся последовательность. Предел любой сходящейся последовательности { х“ } и { у“ } является оптимальной стратегией.

Данный метод требует большого числа итераций, но итерации достаточно простые и удобны для программирования.

Численный алгоритм решения задачи противо-

(п9, т9, в9).

18. Вычислить Xа, Уа по формулам (9) и (10).

і=1

19. Вычислить ха=—Xа , уа=—Уа

аа

считая, что

хи = Xи, у1

20. Если

= У0.

борства двух систем Б п9, т9, в9). На основании

изложенного предлагается следующий алгоритм решения поставленной задачи противоборства двух технических восстанавливаемых после отказов Бд-систем, который нетрудно реализовать на современных профессиональных персональных ЭВМ.

Алгоритм.

1. Задать е1, е2, а1, а2, М1, М2, ^ Ь, {Ь1о}, {Ь2о}, 0<о<Ь.

2. Вычислить а = шт {а1, а2,} и ю=[tf /а—1].

3. Сформировать множество % = {0, а, 2а, ..., юа}.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Задать вектор тд = (тд, тд, тЬ), д=1 2, где т? е с.

5. Задать матрицуЛ9 =(19) <7=1, 2,0<ст<1, 0<г<д, где

I9,. = У9а169, а <е{э, 1, 2. [М9]}.

6. Вычислить т9, 9=1, 2, по формулам (7).

7. Вычислить целочисленное неотрицательное решение в9 , д=1,2, уравнения (8).

8. Вычислить Pg(tf), д= 1,2, по рекуррентной процедуре, данной в [4] формулами (2.7) и (2.8).

P1(tf); P2(tf) — решения системы уравнений (3) с начальными условиями (4).

9. Вычислить а/=Р1^[) — Р2(у.

10. Выполнить процедуру пп. 7 — 8 для всех целых

неотрицательных я1,Я 2 решений уравнения (8).

11. Выполнить процедуру пп. 5— 10 для всевозможных комбинаций уд е {0, 1, 2, ..., [ Мд ]}, д = 1, 2.

12. Выполнить процедуру пп. 4—11 для всевозможных т9,9=1, 2, где т? е с, 0 < ст < I .

13. Сформировать матрицу А=(а] )ч,1хУ2 .

14. Задать число е>0 (точность решения).

15. Положить X0 = 0, У0 = 0.

16. Положить а=1.

44

17. Вычислить к(а) = г, максимизирующее 2

^ X “-х “ 1 |+| у “-у “ ^ <6 , идти к п. 23.

Здесь 11 Х| — евклидова норма вектора х.

21. Положить а = а +1

22. Идти к п. 17.

23. Конец (х“, у“ — оптимальные стратегии).

В заключение следует отметить, что если в конфликте участвуют подвижные противоборствующие системы, то задача оптимального управления усложняется и для ее решения могут быть использованы методы и приемы, изложенные в [7, 8].

Библиографический список

1. Гермейер, Ю. Б. Введение в теорию исследования операций / Ю. Б. Гермейер. — М. : Наука, 1971. — 383 с.

2. Оуэн, Н. Г. Теория игр / Н. Г. Оуэн. — М. : Мир, 1971. — 226 с.

3. Дюбин, Г. Н. Введение в прикладную теорию игр /

Г. Н. Дюбин, В. Г. Суздаль. — М. : Наука, 1981. — 336 с.

4. Потапов, В. И. Новые задачи оптимизации резервированных систем / В. И. Потапов, С. Г. Братцев. — Иркутск : Изд-во Иркут. ун-та, 1986. — 112 с.

5. Сачков, В. Н. Комбинаторные методы дискретной математики / В. Н. Сачков. — М. : Наука, 1977. — 320 с.

6. Оуэн, Н. Г. Теория игр и игровое моделирование / Н. Г. Оуэн // Исследование операций. Методологические основы и математические методы. — М. : Мир, 1981. — Т. 1. — С. 513-549.

7. Потапов, В. И. Дифференциальная игра между подвижными и неподвижными системами / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. — 2012. — № 3 (113). — С. 268 — 271.

8. Потапов, В. И. Разработка математической модели и алгоритма оптимального управления подвижной структурно-пере-страиваемой избыточной системой, управляемой по каналам связи / В. И. Потапов // Омский научный вестник. Сер. Приборы, машины и технологии. — 2013. — № 3 (123). — С. 13 — 18.

с(а)= 1, минимизирующее 2 а^а 1.

ПОТАПОВ Виктор Ильич, доктор технических наук, профессор (Россия), заведующий кафедрой «Информатика и вычислительная техника», заслуженный деятель науки и техники РФ.

Адрес для переписки: гу! @ omgtu.ru

Статья поступила в редакцию 29.10.2013 г.

=1

Книжная полка

Новиков, Д. П. Некоторые новые методы конечнозонного интегрирования солитонных уравнений / Д. П. Новиков, Р. К. Романовский, С. Г. Садовничук ; ОмГТУ. - Новосибирск : Наука, 2013. - 251 с. - 1БВЫ 9785-02-019138-9.

Основное содержание книги — изложение результатов проведенных авторами исследований по математической теории солитонов. Предлагаемые методы конечнозонного интегрирования проиллюстрированы на ряде фундаментальных уравнений математической физики. Приведены базовые сведения по алгебраической геометрии и аналитической теории тэта-функций. В Приложении построен класс изомонодромных решений уравнения Белавина— Полякова—Замолодчикова. Для научных работников — математиков, физиков, а также для студентов и аспирантов соответствующих специальностей.

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (127) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

Аннотация научной статьи по математике, автор научной работы — Потапов Виктор Ильич

Похожие темы научных работ по математике , автор научной работы — Потапов Виктор Ильич

Mathematical model and algorithm of solving problem of counteraction in conflict situation of two restored systems after failure