Труды Карельского научного центра РАН № 10. 2015. С. 28-33 DOI: 10.17076/mat145
УДК 519.8
СИТУАЦИЯ РАВНОВЕСИЯ В ИГРЕ ПАТРУЛИРОВАНИЯ С КАМЕРОЙ СЛЕЖЕНИЯ
В. В. Гусев
Институт прикладных математических исследовании Карельского научного центра РАН
С помощью методов теории игр получены ситуации равновесия в задаче патрулирования на графе. В статье найдено решение игры для графа, который является моделью потока информации от источника к приемнику данных. Сделано предположение, что в каждой вершине графа установлена камера слежения. При таком предположении найдено равновесие в игре для неориентированного связного и ориентированного деревьев.
Ключевые слова: антагонистическая игра, патрулирующий, атакующий, граф, равновесие, стратегия, камера слежения.
V. V. Gusev. AN EQUILIBRIUM SITUATION IN A PATROLLING GAME WITH A TRACKING CAMERA
Equilibrium situations in a problem of patrolling on a graph were obtained using game theory methods. The solution of the game was found for a graph modeling the flux of information from data source to sink. It is assumed that there is a tracking camera in each graph vertex. Under this assumption, equilibrium was found in the game for an undirected connected tree and a directed tree.
Key words: antagonistic game, patrolling, attacking, graph, equilibrium, strategy, tracking camera.
Введение
В данной статье рассматривается антагонистическая игра патрулирования с двумя игроками. Первый игрок - это патрулирующий, второй - атакующий. Цель патрулирующего -поймать атакующего. Игра проходит на некоторой местности, моделью которой является граф. В зависимости от разных видов графов в статье найдены ситуации равновесия. В некоторых случаях предполагается, что в каждой вершине установлена камера слежения, т. е. как только атакующий появится на местности, об этом сразу же узнает патрулирующий и направляется к месту атаки. В насто-
ящей работе проводится сравнение выигрыша патрулирующего в игре без установленных камер слежения с выигрышем патрулирующего в игре, когда камеры установлены. Об играх патрулирования можно ознакомиться в [3, 4].
Постановка задачи
Рассмотрим игру патрулирования С = < Р, А; (; 51,Б2; Н >, в которой Р - патрулирующий; А - атакующий; ( = < V, Е > -неориентированный граф, где V - множество вершин, Е - множество ребер, п = IV| - количество вершин в графе. ( может быть как ориентированным, так и нет. Вершины графа ( будем обозначать vj,] = 1, ...,п, запись
0 означает, что не является верши- Теорема 1. Значение игры О(Вп,Т,т) равно
ной. Две разные вершины графа могут соединяться только одним ребром, может существовать ребро вида (ук,ук). Заметим, что граф ( может быть несвязным. В примерах вершины графа обозначаются натуральными числами.
Множество стратегий патрулирующего представляет пути патрулирования и = ук1 — Уи2 — ... — Уит, где Шз = 1, ...,Т : у^ € V, 1 ^ к3 < п,Т > 1; Ш = 1, ...,Т — 1 : (укь ,укь+1) € Е. Элементы множества 52 стратегии атакующего, которые будем называть атаками, представим в виде 0 — .. — 0 — — 0 — ... — 0
Ь т
Ь = 0,...,Т — т, или более кратко w = (Ь,у), где Ь - момент посещения вершины у.
Функцией выигрыша Н(и,'ш),и € Б\,'ш € 52 является вероятность поимки атакующего игрока патрулирующим игроком:
H (u,w) =
0, Vj = 1,..., m : Vkt+j = v;
1, 3j = 1,..., m : vkt+j = v.
Рис. 1. Графы B15
Рассматриваемый граф Bn является моделью перехода информации от некоторого источника к некоторому приемнику данных.
Н = 1П,Т > 2т — 1 \ 1 ,Т< 2т — 1,
где г - минимальное число подграфов из двух вершин, на которые можно разбить граф Вп.
Доказательство. Предположим, что Т ^ 2т — 1. Пусть х - смешанная стратегия патрулирующего, при которой игрок равновероятно выбирает пути из множества 51 = [у.п — ... — у-п — у\ — ... — у\,ур — ... — ур —
T—m+1
Vk - ... - Vk\n = 1,
m— 1
\N\, k = 1,
m— 1
.,\K\ Vn
Если Н(и',,'ш) = 1, то будем говорить, что путь и ловит атаку w.
Игру О = < Р,А; (; 51,52; Н > для краткости запишем как О ((, Т, т), где т - время, которое необходимо атакующему для проведения атаки; Т - длина пути (т ^ Т). Нас будут интересовать в данной игре ситуация равновесия и значение игры.
Значение игры О((, Т, т) при ( = Вп
Пусть Вп - ориентированный граф из п вершин, в котором каждая вершина является либо начальной вершиной, либо конечной. Обозначим за N - множество начальных вершин, за К - множество конечных вершин. ^|, |К| - количество начальных и конечных вершин соответственно. Например, два графа В15 изображены на рис. 1.
Т-т+1
N, ук € К ух ,ур € V, (у-, У{), (ур, У к) € Е}, у - смешанная стратегия атакующего, при которой игрок равновероятно выбирает атаки из множества 52 = {0 —... — 0—уп — ...—уп,ук — ...— ук — 0 — ... — 0|п = 1,..., N|, к = 1,..., |К|,уп € N, у к € К}. Докажем, что стратегии х,у - ситуация равновесия. Для того чтобы х, у являлись ситуацией равновесия, достаточно доказать, что для любых чистых стратегий и € € 52 выполняются неравенства Н(и, у) ^ Н(х,у) ^ Н(х^) [1],Н(х,у) = п. Докажем первое неравенство Н(и, у) ^ Н(х,у)Ши € 51 методом от противного. Предположим, что существует такой путь и', для которого выполняется Н(и',у) > Н(х,у). Тогда путь и' должен поймать не менее двух атак из множества 52. Так как атаки на конечные вершины начинаются в первый момент времени, а атаки на начальные вершины заканчиваются в момент времени Т, то путь и' может поймать не менее одной атаки только тогда, когда Т < 2т — 1. Но, по предположению, Т ^ 2т — 1. Получаем противоречие, следовательно Н(и,у) ^ Н(х,у)Ши € 51. Докажем второе неравенство Н(х,у) ^ Н(х^). Предположим, что существует такая атака w' € 52, что Н(х, у) > Н(х, w'). Так как платежная матрица для путей и атак из множеств 51, 52 - единичная, то w' - это такая атака из 52, которая не ловится ни разу путями из 51. Но пути из 51 подобраны так, что любая атака из 52 ловится хотя бы одним путем из 51. Получаем противоречие, следовательно Н(х,у) ^ Н(х^). Значит х, у - ситуация равновесия.
Пусть Т < 2т — 1. Разобьем граф Вп на орграфы В^,В22,...,В2 (орграфы из двух вершин) так, чтобы Вп = тт\}к=1 Вк. Если одна и та же вершина принадлежит двум разным графам В2 и В2, то объединение происходит путем наложения одинаковых вершин. Если между двумя разными вершинами графов В2
29
V
G
и Бj существует ребро, то объединение графов происходит за счет этого ребра. Предположим, что граф Бп разбит на г орграфов. Пусть у -смешанная стратегия атакующего, при которой игрок равновероятно выбирает атаки из множества £2 = {0 — ... — 0 — V — ... — г^}. Опишем, какие вершины выбирает атакующий для атаки (т. е. г^): если существуют два графа Б2 и Б^, которые имеют общую вершину, то гi - это такая вершина, которая принадлежит только одному из графов Б2 и Б^; если при разбиении существует такой граф Б2, который не имеет общих вершин с другими графами, то г,, - это крайняя вершина графа Б2. Обозначим множество вершин, на которые нападает атакующий, буквой Ь. Пусть х - смешанная стратегия патрулирующего, при которой игрок выбирает пути из множества £1 = {г» — ... — г» — гi — ... — гi ,г^ — ... — г^ —
т— 1
гк — ... — гк\г»,гк е Ь,г» е М,гк е K,гi,гj е
т— 1
V, (гп,гi), (гj ,гк) е Е}. Докажем, что стратегии х, у являются ситуацией равновесия. Для того чтобы х, у являлись ситуацией равновесия, достаточно доказать, что для любых чистых стратегий и е е £2 выполняются неравенства Н(и, у) ^ Н(х,у) ^ Н(х,ы). Число путей и атак в множествах £1,^2 равно г, и любой путь из £1 ловит только одну атаку из £2, так же, как любая атака из £2 ловится только одним путем из £1. Значит, Н(х,у) = 1. Путь и е £1 не может поймать более двух атак из £2, так же, как и атака ад е £2 ловится хотя бы одним из путей множества £1. Поэтому х,у - ситуация равновесия. □
Пример 1. Рассмотрим игру С(Б15, 7, 3), где Б15 изображен на рис. 1 слева. Составим платежную матрицу для путей и атак из множеств ,£2 (табл. 1).
Таблица 1. Платежная матрица для путей и атак из множеств Б1,Б2 в игре С(Б15, 7, 3)
о о 2 о о
1 - о 1 - о 1 - о
1 - о - о - о - ю - о - ь- - о - о - о 1 - о 2 1 - о 1 - о
1 о о о ю о ь- о о - о - о - сч - о - - о
^ч о о о ю о ь- о о ^ч 1 ^ч со ^ч ю
О о о о о о о о о о 1 - о 1 - о 1 -
О -2- 00 ^ о со о 00 сл о 1 1 о со 1 о ю 1
о -2- 00 о со о 00 СЛ о - 1 о - о -
о 2- СО ^ о со о 00 СЛ о 1 о 1 о 1
1 —1—1—1— 1— 4— 4 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 —1—2—2— 2— 2— 2 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
1 —1—3—3— 3— 3— 3 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
7 —7—4—4— 4— 4— 4 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
5 —5—5—5— 5— 6— 6 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
5 — 5 — 6 — 6 — 6— 6— 6 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
7 — 7—7—7— 7— 15 — 15 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
7 — 7 — 8 — 8 — 8— 8— 8 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
10 — 10 — 9 — 9 —9 —9 —9 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
10 — -10 —10 — 10 — 10— 11— 11 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
14 — 14—11—11— 11— 11— 11 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
12 — -12 —12 — 12 — -12" -13 — 13 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
12 — -12 —13 — 13 — 13 —13 — 13 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
14 — -14 —14 — 14 — 14— 11— 11 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
7 — 7—15—15— 15— 15— 15 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
Игроки выбирают пути и атаки с вероятностью » = 115, значение игры Н = » = 115.
Пример 2. Рассмотрим игру С(Б15, 5, 4), где (рис. 2). Составим платежную матрицу для Б15 изображен на рис. 1 слева. Так как Т < путей и атак из множеств БьБ2 (табл. 2). 2т — 1, то нужно разбить Б15 на орграфы Б2
Таблица 2. Платежная матрица для путей и атак из множеств 51, 52 в игре О(В15, 7, 3)
о 1 3 1 1 ю 1
CN 3 СО 00 CD 1 31 1 ю 1
СЧ -3 СО ао о 1 СО 1 1 ю 1
СЧ -3- СО 0(0 - - 3 1 - 1 - ю 1
СЧ -3- СО 0(0 1
CD CD CD CD CD CD CD CD CD
1 —1 —2— 2— 2 1 0 0 0 0 0 0 0 0
1 —1 — 3 — 3— 3 0 1 0 0 0 0 0 0 0
7 —7 — 7 — 4— 4 0 0 1 0 0 0 0 0 0
5 —5 — 6 — 6— 6 0 0 0 1 0 0 0 0 0
7 —7 — 8 — 8— 8 0 0 0 0 1 0 0 0 0
10 10 — 10 — 9 —9 0 0 0 0 0 1 0 0 0
12 — 12 — 13 — 13 — 13 0 0 0 0 0 0 1 0 0
14 — 14 — - 14 — 11 — 11 0 0 0 0 0 0 0 1 0
7 — 7— 15 — 15 — 15 0 0 0 0 0 0 0 0 1
Рис. 2. Разбиение графа L1s
Игроки выбирают пути и атаки с вероятностью ^ = 9, значение игры H = 1 = 9.
Игра патрулирования с камерой слежения
Введем обозначения: u(x, y) - путь в графе, который начинается в вершине x Е V и заканчивается в вершине y Е V, причем каждая вершина в пути встречается только один раз; \(u(x,y)) - число вершин в пути u(x,y), считая x и y; d = max\(u(x, y)) - диаметр, мак-x,y€V
симальное количество вершин, которое может находиться между двумя произвольными вершинами x,y Е V. Центром графа Q назовем такую вершину vc Е V : Vv Е VIX(u(vc,v))l ^ [ 2 ] + 1.
Определение 1. Пусть атакующий выбирает атаку (t,v). Тогда динамический путь vkl — vk2 — ... — vkT - это путь, у которого vk1 = vk2 = ... = vkt-1 = vi, где vi - начало пути патрулирующего, а vkt — vkt+i — ... — vkT - кратчайший путь патрулирующего из вершины vi до v. Если патрулирующий пришел в вершину v в момент времени l < T, то
vkt = vkl+i
vkT
Разобьем граф ( на графы (1,(2,...(г г ^ 1 так, чтобы выполнялись два условия:
(1). ^ 2т + 1 в ((г, 1 ^ г ^ г, где -диаметр графа (;
(п). Разбиваем граф ( так, чтобы для любого другого разбиения (1,(2,...([ выполнялось г ^ I.
Теорема 2. Пусть в каждой вершине графа ( (связный неориентированный граф) установлена камера слежения. Тогда значение игры О((,Т,т) 'равно 1.
Доказательство. Разбиваем граф ( на г графов так, чтобы выполнялись условия (1) и (п). Пусть х - смешанная стратегия патрулирующего, при которой игрок выбирает динамический путь, который равновероятно начинается в вершине из множества М = {у^,уС2,...,угс}, где угс - центр графа (г, у - смешанная стратегия атакующего, при которой игрок равновероятно выбирает атаки на вершины из множества М в первый момент времени. Докажем, что х,у - ситуация равновесия. Для того чтобы смешанные стратегии х, у являлись ситуацией равновесия, достаточно доказать, что для любых чистых стратегий и € € 52 выполнялись неравенства Н(и, у) ^ Н(х,у) ^ Н(х,^). Докажем, что выполняется Н(и, у) ^ Н(х,у). Предположим, что Зи € 51 : Н(и, у) > Н(х,у). Тогда путь и должен ловить как минимум две атаки на центры графов (1,(2,...,(с. Но это невозможно, потому что из-за условий 1. и 2. расстояние между центрами превышает значение т и патрулирующему не хватает времени, чтобы поймать хотя бы две атаки, следовательно, первое неравенство выполняется. Докажем второе неравенство ^ Н(х,у) ^ Н(х^). Предположим, что Зw € 52 : Н(х^) < Н(х,у). Но тогда атака w не ловится ни одним путем из 51, что
31
v
невозможно. Значит, х,у - ситуация равновесия. □
В [4] найдено значение игры патрулирования на линейном графе - 2(П—1) при больших Т, для цикла - тп, для звезды - 2(П—1) • Если предположить, что в каждой вершине графа установлена камера слежения, то значение игры на линейном графе будет составлять [ п1 ]+1, где I = 1, если дробная часть частно
2„П+1 не равна 0, и I = 0 иначе. Для звезды значение игры равно 1.
Пример 3. Рассмотрим игру С((,Т, т). Пусть ( изображен на рис. 3, а т = 3, Т -любое (только Т ^ т). Разбиваем граф таким образом, чтобы выполнялись условия (1) и (п). Патрулирующий равновероятно выбирает начало движения среди вершин а атакующий в любой момнт времени нападает на эти же вершины. Как только происходит атака атакующего, патрулирующий направляется к месту атаки. Значение игры равно Н = 3•
Рис. 3. Граф (
Значение игры С(<(,Т,т) для ориентированного дерева
Пусть ( - ориентированное дерево, причем всегда существует путь из корня дерева до любой вершины графа.
Определение 2. Концевой узел - вершина в графе (, в которую идет только одна дуга и не исходит ни одной дуги [2].
Определение 3. Уровень вершины V - число вершин в пути u(vkor , v), где Vkor - корневая вершина ( [2].
Разобьем граф ( на графы следующим образом:
Шаг 1. Находим в графе концевой узел, который имеет наибольший уровень в графе (• Обозначим эту вершину Vй, а уровень вершины va как иа •
Шаг 2. Для вершины va определяем местоположение вершины vb, такое, что путь и^, va) существует, и уровень вершины vb равен иа — т (если иа — т < 0, то vb - корень дерева ( ).
Шаг 3. Удаляем из графа ( ориентированный граф с корневой вершиной vb• Удаленный граф является одним из графов, на которые разбивается граф (•
Шаг 4. Продолжаем выполнять операции 1-3 до тех пор, пока вершина vb не совпадет с корнем дерева графа (•
Теорема 3. Значение игры С((, Т, т) равно
1
г
Доказательство. Выполняя шаги 1-4, разбиваем граф ((• Пусть ( разбился на г графов. Обозначим х - смешанная стратегия патрулирующего, при которой игрок выбирает динамические пути, которые начинаются в вершинах ^^•••^'Т}, где vгk, 1 ^ г ^ г корень г-го дерева, на которые разбили (• Пусть у - смешанная стратегия атакующего, при которой игрок равновероятно выбирает напасть на вершины {и^,•••,1^} в первый момент времени, где vгh, 1 ^ г ^ г — 1 - концевой узел г-го дерева и имеет уровень, равный т + 1 А ^ - концевой узел с наибольшим уровнем, причем дерево, которому принадлежит и'к, содержит корень графа ( . Докажем, что х, у -ситуация равновесия. Для того чтобы смешанные стратегии х, у являлись ситуацией равновесия, достаточно доказать, что для любых чистых стратегий и € Б1,ш € £2 выполнялись неравенства Н(и,у) ^ Н(х,у) ^ Н(х,ш). Докажем, что выполняется Н(и, у) ^ Н(х,у)• Предположим, что Зи € : Н(и, у) > Н(х, y)• Тогда путь и должен ловить как минимум две атаки на концевые узлы двух разных графов. Но это невозможно, потому что из-за условий 1. и 2. расстояние между концевыми узлами превышает значение т и патрулирующему не хватает времени, чтобы поймать хотя бы две атаки, следовательно, первое неравенство выполняется. Докажем второе неравенство Н(х,у) ^ Н(х,ш) Предположим, что Зш € £2 : Н(х,ш) < Н(х,у)• Но тогда атака ш не ловится ни одним путем из £1, что невозможно. Значит, х, у - ситуация равновесия. □
Пример 4. Рассмотрим игру С((, 3,2), где ( изображен на рис. 4. По теореме, граф ( удалось разбить на 8 частей. Патрулирующий равновероятно выбирает в качестве начала пути корень дерева из разбиения ( , а атакующий равновероятно в каждом подграфе выбирает концевую вершину, которая наиболее удалена от корня г-го графа, которому она принадлежит. Получаем, что значение игры равно
г = 8 •
Рис. 4- Граф Q
Заключение
Подводя итоги, можно сказать, что допущение предположения о камере слежения существенно меняет решение задачи. Граф разбивается на подграфы, патрулирующий не начинает движения до тех пор, пока не начнется атака атакующего.
По мнению автора, полученные результаты могут применяться на практике для анализа полезности камер слежения.
Литература
1. Мазалов В. В. Математическая теория игр и приложения: учеб. пособие. СПб.: Лань, 2010. 448 с.
2. Носов В. И., Бернштейн Т. В., Носкова Н. В., Храмова Т. В. Элементы теории графов. Учебное пособие. Новосибирск: СибГУТИ, 2008. 107 с.
3. Alpern S., Gal. S. The theory of search games and rendezvous. Boston: Kluwer Academic Publishers, 2003.
4. Alpern S., Morton A., Papadaki K. Optimizing randomized patrols // Operational Research Group. 2009. P. 392-419.
Поступила в редакцию 04.04.2015
References
1. Mazalov V. V. Matematicheskaya teoriya igr i prilozheniya: ucheb. posobie [Mathematical game theory and applications: textbook]. St. Petersburg: Lan', 2010. 448 p.
2. Nosov V. I., Bernshteyn T. V., Noskova N. V., Hramova T. V. Elementy teorii grafov. Uchebnoe
posobie [Elements of graph theory: textbook]. Novosibirsk: SibGUTI, 2008. 107 p.
3. Alpern S., Gal. S. The theory of search games and rendezvous. Boston: Kluwer Academic Publishers, 2003.
4. Alpern S., Morton A., Papadaki K. Optimizing randomized patrols. Operational Research Group. 2009. P. 392-419.
Received April 04, 2015
СВЕДЕНИЯ ОБ АВТОРЕ:
Гусев Василий Васильевич
аспирант
Институт прикладных математических исследований
Карельского научного центра РАН
ул. Пушкинская, 11, Петрозаводск,
Республика Карелия, Россия, 185910
эл. почта: [email protected]
тел.: (8142) 766312
CONTRIBUTOR:
Vasily, Gusev
Institute of Applied Mathematical Research,
Karelian Research Centre, Russian Academy of Science
11 Pushkinskaya St., 185910 Petrozavodsk,
Karelia, Russia
e-mail: [email protected]
tel.: (8142) 766312