УДК 519.833.3
ОБОБЩЕНИЕ ИГРЫ ПОИСКА НА ПРЯМОЙ С «БУНКЕРОМ»
А. А. Егорова, М, Г, Александрова
Теория игр занимается изучением математических моделей принятия оптимальных решений в условиях конфликтов. Для построения формальной математической модели принятия решений в условиях конфликта необходимо математически описать все возможные действия участников конфликта и результаты этих действий [1].
В данной работе рассмотрены антагонистические игры поиска с «бункером». Под «бункером» понимается область необнаружения игрока Н игроком Б. Антагонистическую игру можно интерпретировать следующим образом. Игроки одновременно выбирают стратегии х, у. После этого игрок Б (игрок Н) получает выигрыш К ( —К), а игрок Н (игрок Б) — выигрыш —К (К). Каждый из игроков стремится максимизировать свой выигрыш, а следовательно, минимизировать выигрыш противника [2].
1. Игры на прямой с «бункером»
Исследована следующая антагонистическая игра поиска. Имеют-Б Н Н
0,1,...,г,... оси Ох Если в некоторый момент времени игрок Н находится в точке г, то через единицу времени он может перейти в точку г — 1 либо в точку г +1, либо остаться на месте в точке г. Игрок Б может произвести к попыток поиска игрока Н. За каждую свою попытку он
Ох О
Н
@ 2007 Егорова А. А., Александрова М. Г.
игрока й. Игрок й обладает полной информацией о местоположении игрока Н с запаздыванием та единицу времени, т. е. игрок й знает, где находиться игрок Н, то та знает, куда он пошел. Игрок Н знает, сколько неиспользованных попыток поиска осталось у игрока й, но не знает, в каких точках игрок й ведет поиск. Если игрок й производит поиск
Н
равна ст, где 0 < ст < 1. В противном случае она равна нулю. Целью йН до того, как он достигнет «бункера». Символом Г(г, к) обозначим ис-
Н
точке г, а игрок й имел к неиспользованных попыток поиска. Символом у(%, к) обозначим значение игры Г(г, к). Из определения Г(г,к) имеем у(г, 0) = 0, г € N у(1, к) = 0, к € N На первом шаге игры Г(г, к) игрок Н имеет три чистые стратегии: перейти в точку г — 1, остаться в точке г, перейти в точку г = 1. Игрок й имеет четыре чистые стратегии (на самом деле больше, но остальные стратегии неэффективны): осу-
г — г г й г, к
" ст + ( 1— стУи(г — 1, к — 1) у(г,к — 1) у(г+1,к — 1)
у(г — 1, к — 1) ст+( 1— ст)гу(г, к — 1) у(г+1,к — 1) у(г — 1, к — 1) у (г, к — 1) ст + ( 1— а)у(г + 1,к — 1) '
у(г — 1,к) у{г,к) у(г+1,к)
Символами ц = (^1,^2,^3,^4)) V = обозначим вероят-
ностные векторы. Тогда
4 з
= 1, ^ > о, 3 е 1,4; ^гл,- = у0 ^ °> з 6
3=1 3=1
2. Обобщение игры поиска на прямой с «бункером»
Рассмотрим обобщение антагонистической игры с «бункером».
Нй
к
игроков обладает полной информацией о противнике с запаздыванием
Нг ницу времени перейдет в точку £(г) (останется та месте в точке г), а игрок Б будет производить поиск в точке £(г) (соответственно г), то вероятность обнаружения игрока Н считается равной а^ (а^), где £ € 1,3, \(г) = г — 1, 2(г) = г, 3(г) = г + 1.
Символами Г(г;к), у(г;к) обозначим исследуемую игру и ее зна-
Нг игрок Б имел к неиспользованных попыток поиска. Игроки Б и Н
гк
Б
игры Г((г,^;к) имеет вид
<71 + (1— <1)у(г — 1, к — 1) у(г,к — 1) у(г + 1,к — 1)
у(г — 1, к — 1) 72 + (1— <2)го{г,к — 1) у(г + 1,к — 1) у(г — 1, к — 1) у(г, к — 1) <3 + (1— а3)у(г+1,к — 1)
у (г — 1,к) у{г,к) у{г + \,к)
т. е. {а5л(г;к)}5е1д1?)е1^, где ап„(цк) = ап + (1 - ап)у(г](г),к - 1), Г] е 1,3, а^(цк) = у(£(г),к - 1) € 1,3, а4?(г;к) = у(£,к),
£ € 1,3. Символами /х = V = (г/1, г/2, г/3) обозначим веро-
ятностные векторы. Тогда необходимым и достаточным условием того, что вероятностные векторы ц(г\к), ^(цк) являются оптимальными па первом шаге стратегиями игроков Б и Н, а, у (г; к) — значением игры гк
4
^^ к)хп(г; к) ^ у{г\к), £е1,3,
'Т _ (1.1)
^а^5(г;к)у5(г;к) < у(цк), г] е 1,4.
«=1
Введем обозначения:
= 1-ТПЛ' -/ТТТТТ' £еТД
1— у(г,к) !— у{£{1),к)
Тогда г;(г, к) = 1 — -щщ и в Н0ВЬ1Х обозначениях неравенства (4.1) примут вид
4 I _
£ € 1,3, (1.2)
3 ! _
пе 1,4, (1.3)
где к) ^-^Ш^-Ч-^МЛ^^) = V Ф £> чЛ € 1,3, Ь^(цк) = 1/У(£(г),к), £ € 1,3. Заметим, что в новых обозначениях граничные условия
«(г; 0) = 0, г е М, ф; к) = 0, к е М,
примут вид
У(г; 0) = 1, г € М, У(1; к) = 1, к е N. (1.4)
Символами итп, 7 € 1,С™, то € 1,3, обозначим такие подмножества множества 1,3, что
а) если 7 ^ то ит,7 ф
б) для любых т, 7 множество ит,7 является выборкой т элемен-
,
Теорема 1.1. (а) Значение игры у(цк) определяется формулой V(г, к) = 1 — у^-щ, где У(ц к) является решением рекуррентного уравнения
Е --1
1 I ееЬ:
= шах Д : .... : 7 € 1, С?, то € 1,3 } (1.5)
У(г,к) ) у- УШЛ-,к-1)
I П С
пс
с граничными условиями (1.4).
(б) Предположим, что тп* € 1, 3, 7* € 1, С™ такие, что
Е --1
Пс
У(г,к) | у-
I П с
(1.6)
Тогда
Г j_fl _ n№));fc-m есди£€и .k)=\ ^ h есдп^еи^^, (L7)
[О, если С & Umt ,
(_vm*-р/ч__, v
vi\Цк)= < (1.8)
I 0, если С & ■
Ниже приводится лемма, в которой сформулированы некоторые свойства двойной последовательности V(i; к).
Лемма 1.1. Предположим, что V(i;k) определяется рекуррентным уравнением (1.5) с граничными условиями (1.4). Тогда для любых i & N k & Z+ справедливы соотношения
V{v,k) < V(i;k+1), (1.9)
V{v, k + 1) < V{v, k + 1) < 9V(i; k), (1.10)
где
0= 1
1 -
Е
£=1
УШ;к -1) > У(цк), если£ е ит,а,, г,к е N (1.11)
УШ;к -1) < У(цк), если£ е ^, г,к е М, (1.12)
У(цк) = 0к, еслн'г > к+\,г е М, к е Z+. (1.13)
Доказательство. Первоначально заметим, что из рекуррентного уравнения (1.5) и граничных условий (1.4) имеем
Е
1 I
1 *
v(i 1) = max i —J2—~ : 7 6 т 6 3
Е
^ = 1 (1-14)
V — 3 6
(Те 1
teu3,i
здесь учитывается, что функция ^у- возрастает при £ > 0, поэтому для любых 7 € 1, С™, то € 1,2, справедливо неравенство
Докажем неравенство (1.9) методом математической индукции по к. База индукции при к = 0 следует из граничных условий (1.4) и равенства (1.15). Предположим, что неравенство (1.9) справедливо при некотором к = K. Докажем, что тогда неравенство (1.9) остается справедливым и при к = K+1. Действительно, из рекуррентного уравнения (1.5) и индукционного предположения имеем
Следовательно, V((i,j)\ K + 1) < V((i,j)\K + 2), что завершает доказательство неравенства (1.9).
Докажем неравенство (1-Ю) методом математической индукции по кк
равенства (1.15). Предположим, что неравенство (1-Ю) справедливо при некотором к = K. Докажем, что тогда неравенство (1-Ю) остается справедливым и при к = K + 1. Действительно, из рекуррентного
Тогда
если i > 1, если i = 1.
(1.15)
уравнения (1.5) и индукционного предположения следует
1 íeu,
Е --i
= тах Л ^ vw.-vir-m : 7 е 1, С3"\ те 1,3
V((i,j),K+ 2) ) у- v(ttihK+1)
I ^ a с
Е --i
> тах < ' : 7 € 1, С™, то G 1, 3 > =
в Т ШИШ. ' ' ' 3 ' ' [ 0У(г;К+1)'
a? I
Следовательно, V(i; K + 2) < 0V(i; K + 1), что завершает доказательство неравенства (1.10).
Докажем неравенство (1.11) методом от противного. Предположим, что неравенство (1.11) неверно. Тогда существует такое £ $ Um*,Y*i чт0 V(i; к) > V(£(i); к — 1) или, что равносильно,
1 1 V(m;k- i)) > У(Щ-
Из последнего неравенства и условия (1.6) имеем
Е - -i
1 сТТ an
1 __1fi4
> ^ T/ííníilVfc-11 • (Д.-IOJ
У((е(г)); к - I) У У((г1а));к-1) ■
С другой стороны, из условия £ $ следует, что ф Щд, т. е. ш* < 3. Поэтому из рекуррентного уравнения (1.5) и условия (1.6) имеем
Е —" 1 £ — " 1
> ""__(1 17)
^ ^ У11г,И))-к-1) ' К1-11)
у- У((ф))-к-1) -- у- У((ф))-к-1)
neu™*,j* neum*+ i,y*
где 7* такое, что Umt+1л * = Um* U {£}.
Неравенство (1.17) равносильно последовательности неравенств
1 an an
(х- 1 ^ 1 Л v^ ПШ);к-1)
n s t^-1 S
\eum*,Y* n « 7 neum
a
n
Е - -1
^ ill— (у т . —,.
1 '—' a
1 „ veumt
V((£(i)y,k - 1) ^ у- УЩгЩ-1) '
rr an
что противоречит неравенству (1.16). Полученное противоречие доказывает неравенство (1.11).
Докажем неравенство (1-12) методом от противного. Предположим, что неравенство (1-12) неверно. Тогда существует такое £ G Um*,7* j что У{ц к) < V(£(i); к — 1) или, что равносильно,
1 1 , < ... (1.18)
— i) v&ky
Рассмотрим два случая: m* = 1 и m* > 1. Пусть m* = 1. Тогда
из условия (1.6) и неравенства (1.18) имеем
>_1_
V(rn);k — 1 V(rn);k -1)
или, что равносильно, 1 — a^ > 1. Но то условию а^ > 0. Полученное
m*
m* >
Е - -1
neumt:Jt 1
У^ У(Щ);к-1) - V(JFUX)- h - 1)
или, что равносильно,
( Е f-iW(0);A-D> Е (1.19)
С другой стороны, из рекуррентного уравнения (1.5) и условия (1.6) имеем
V J- -1 Е — -1
У((ф))'к-1) -- у^ у((ф))-к-1)
1 ^тт ai
J2 у ((ri(l))-,K-L) J2
neUm*,Y* neu _
где 7" такое, что ит^= ит^_1и {£}. Последнее неравенство равносильно последовательности неравенств
что противоречит неравенству (1.19). Полученное противоречие завершает доказательство неравенства (1.12).
Докажем неравенство (1-13) методом математической индукции по к. База индукции при к = О следует из граничных условий (1.4). Предположим, что неравенство (1-13) справедливо при некотором к = К. Докажем, что тогда неравенство (1.13) остается справедливым и при кК
положения имеем
Следовательно, V(i; K + 1) = 0K+1, что завершает доказательство равенства (1.13) и леммы 1.1.
Доказательство теоремы 1.1. Первоначально докажем, что векторы n(i;k), v(i;k), определенные в (1.7), (1.8), являются вероятностными. Вероятностность вектора v(i; k) непосредственно следует
0K+i-
1
из (1.8). Из (1.6), (1.7) вытекает, что
Н у{цк) ) у{цк)
х{у(г;А0+( ]Г 1-Лу(цк)
v У(т);к- 1)| = У(цк) =
Неотрицательность £-й компоненты вектора /л(ц к) при £ € 1,4 \ ит*,7* следует из (1.7), а при £ € ит*,7* — из (1.7) и (1.12).
Докажем неравенство (1.2). Рассмотрим два случая: £ € ит*, и £ € ит* г/*- Пусть £ € ит*г/*. Тогда из (1.6) и (1.7) имеем
п=1
^ )_/_У('П-к- 1)
У(£;к -1) ^ аЛ УН; к) 1 ^ ^_Г_У(тк-1)\ 1
У£к -1) ^^ ап\ У (ц к) ) У£к -1)
Е
У(г);к-1)
а
V
* >7*
У (г, к) У(цк) У£к -1)
/ Е N
-I
" 1
^ У(гПк-1) У(цк- 1) \пеит*п* а" )
У(цк)'
что и доказывает (1.2) при £ € ит*г7*. Докажем (1.2) при £ € и„
Из (1.6), (1.7) и (1.11) следует, что
п=1 пеит *,
^ У(тк- 1)= 1 ^ 1
Пеит*„* ап -1) У(ц к)'
что и завершает доказательство неравенства (1.2). Заметим, что
и^! ¿г1 с-»'
Неравенство (1.20) вытекает из следующей последовательности неравенств:
3 1 1
— ^ 0 (в силу того, что <Т£ ^ 1) ^ 1 — ^^ —,
«=1 ае ееит*„* а«
Е --1
Е Е "
■г * *
5=1 ^
Е -
^ ае
> V 1-1.
1 - 1/ Е £
Докажем неравенство (1.3). Рассмотрим два случая: ц = 6 и ц < 6.
Пусть п = 6. Из (1.6), (1.8) и (1.10) имеем
з УЩк-1)
1 ^ 1 1)
2
> ^ Кил-г А Е > (в силу (1.20))
эеит*„*
Е --1
¿—¡ас
_ 1
у- У(г;Л)'
ас
что и доказывает (1.3) при п = 6.
Рассмотрим случай п < 6. Исследуем отдельно два подслучая: п € итИ п & ит *,7*' ПуСТЬ п € ит*
*■ Тогда из (1.6) и (1.8)
получим
с 1\ с 1\ 1 1 У{'П'1к~ 1)
а=1
+ Е
У(г]; к - 1) ап £ У(з,к-1) *,у * а
1 1 У(е,к -1)
к — 1) у-
*п*
1
Е --1
¿—'ас Л
у- ПЫ*-1) У(цкУ
ас
что и доказывает (1.3) при п € ит*п*. Рассмотрим подслучай п €
Um*,Из (1.6), (1.8) находим
1 1 V(e,k -1)
1*, "J* '
з
цк)= Y^
i
У — У —-1
' ас ас
^ v(ftfc-i) - £ V(ftfc-I) У(г;Л)'
«eUm* ас eeum*Y* ас
что и завершает доказательство как неравенства (1.3), так и теоремы 1.1.
Заключение
В данной работе рассмотрено обобщение антагонистической игры поиска на прямой с «бункером». Доказаны теорема о значении и об оптимальных стратегиях данной игры, и в лемме доказываются свойства рекуррентного уравнения.
ЛИТЕРАТУРА
1. Петросян Л. А., Зенкевич П. А., Семина, Е. А. Теория игр. М.: Высш. школа, 1998.
2. Петросян Л. А., Гарнаев А. Ю. Игры поиска. СПб.: Изд-во СПбГУ, 1992.
3. Петросян Л. А., Томский Г. В. Дифференциальные игры с неполной информацией. Иркутск: Изд-во Иркутск, ун-та, 1984.
4. Егорова А. А., Жукова И. Е. Одновременные биматричные игры поиска второго и третьего видов // Вести. ЯГУ. 2005. Т. 2, вып. 2. С. 70-77.
5. Serov V. P. Optimal feedback strategy in the game variant of generalized travelling salesman problem // Zakharov V. Control applications of optimization (Оптимизация в задачах управления). Saint-Petersburg, 2000. V. 2. С. 183-185.
6. Sbagalova L. G., Ushacov V. N. On the problem of an approach to a non-cylindrical target // Zakharov V. Control applications of optimization (Оптимизация в задачах управления). Saint-Petersburg, 2000. V. 2. С. 189-193.
г. Мирный
27 февраля 2007 г.