Научная статья на тему 'Операторы значения в теории дифференциальных игр'

Операторы значения в теории дифференциальных игр Текст научной статьи по специальности «Математика»

CC BY
89
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Операторы значения в теории дифференциальных игр»

ТЕОРИЯ УПРАВЛЕНИЯ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

УДК 517.934 © С. В. Чистяков

ОПЕРАТОРЫ ЗНАЧЕНИЯ В ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ ИГР

При исследования нерегулярных дифференциальных игр [1-4] возникли функциональные уравнения [5-9], которые обобщают основное уравнение Айзекса [10,11] на случай негладкой функции значения игры (функции Беллмана или потенциала игры). На их основе в компактной форме может быть построена теория дифференциальных игр [12-14], охватывающая исследование вопросов существования и структуры решения антагонистических и бескоалиционных дифференциальных игр, обоснования уравнения Айзекса и известных условий регулярности. Элементы этой теории для позиционной дифференциальной игры сближения в заданный момент времени и освещаются ниже.

Рассмотрим следующую позиционную дифференциальную игру [2]:

Предполагается, что в ней 1-ый игрок распоряжается управлением V , а 2-ой — управлением и, при этом в каждый момент времени оба игрока знают текущую позицию (¿, ж(£)) . Относительно правой части системы (1) считаются выполненными условия, включая и условие седловой точки в маленькой игре, сформулированные в [2].

Пусть О(£*,ж*,Т) С Я х Яп — отрезок интегральной воронки системы (1) на сегменте [¿*,Т] , исходящей из позиции (¿*,ж*) , О С (—го,Т] х Яп — произвольное непустое ограниченное множество такое, что ((¿*,ж*) € О) ^ (О(£*,ж*,Т) С О) , а М(О) — пространство ограниченных функций и> : О ^ Я, наделенное равномерной метрикой р : р(ад/(-),ад//(■)) = ^(¿, ж) — эд^(£, ж)| , и отношением частичного порядка ^: ^(-) ^ ад/;(-) , если и>'(¿, ж) ^ эд/;(£, ж), У(£, ж) € О (здесь и>'(•),-ш//(■) € М(О)). Указанное выше множество О будем называть пространством позиций.

Определим операторы Ф_, Ф+ : М(О) ^ М(О) , полагая, что для любой функции -ш(-) € М(О) значения Ф_ о эд(£*, ж*) и Ф+ о эд(£*,ж*), (¿*, ж*) € О , ее образов Ф_ о -ш(-) и Ф+ о -ш(-) при отображениях Ф_ и Ф+ находятся, соответственно по следующим правилам:

где внутренние операции inf и sup берутся, соответственно, по всем допустимым измеримым по Лебегу программным управлениям u(-) и v(-) . Нетрудно убедиться, что операторы Ф- и Ф+ определены корректно, в частности, отображают пространство M(D) в себя.

Лемма 1. Для любой функции w(-) € M(D)

Ж = f (t, ж, u, v)

(t € R, ж € Rn, u € P € CompRk, v € Q € CompR1),

(1)

x(t*) = ж*,

(2)

H(x(T)) ^ maxmin / minmax V 7 (v) (u) (u) (v)

(H € C(Rn), T ^ t*)

(3)

sup

,T] ~'V /

и

inf

i€[i* ,Т]г. —

Ф- o w(-) ^ w(-), а Ф+ о w(-) ^ w(-).

Лемма 2. Операторы Ф_ и Ф+ сохраняют порядок, то есть Ф_ о ь'(-) ^ Ф_ о ь/;(-) и Ф+ о ь'(-) ^ Ф+ о ь/;(-), если ь'(-) ^ ь"(■) (ь'(•),ад//(■) Є М(В)) .

Пусть иС(В) и Ьір(В) — подпространства пространства М(В) , образованные, соответственно, всеми равномерно непрерывными и липшицевыми на множестве В функциями ь(-) Є М(В) .

Теорема 1. Подпространства иС (В) и Ьір(В) инвариантны относительно операторов Ф_ и Ф+ .

Теорема 2. Операторы Ф_ и Ф+ непрервны на пространстве иС (В) . Более того, на нем они удовлетворяют условию Липшица с постоянной Ь = 1 и не являются сжимающими.

Теорема 3. При любом начальном приближении из подпространства иС (В) последовательные приближения решения уравнения

Ф_ о ь(-) = ь(-) (4)

и, аналогично, уравнения

Ф+ о ь(-) = ь(-) (5)

сходятся равномерно на множестве В к решению этого уравнения, причем соответствующее решение принадлежит подпространству VС (В), а если начальное приближение принадлежит подпространству Ьір(В), то это решение также принадлежит подпространству Ьір(В) .

Теорема 4. На пространстве иС (В) система из двух уравнений (4) и (5) равносильна уравнению

Ф_ о ь(-) = Ф+ о ь(-). (6)

Теорема 5. На подпространстве С 1(В) П иС (В) уравнение (6) 'равносильно урав-

нению Айзекса

/ дь, . ,. . \ дь, .

тахтш ( —— (і, х), ти,х,и,у) } + — (і, ж) = 0.

vєQ и&р\дху 7 >7 ^ 7 7 7 1 / т К !

Рассмотрим последовательные приближения

ь(™)(.) = Ф_ о ь(п_1) (■) (7)

Ч")(-)=Ф+ о ь+"_1)(■) (8)

(п=1,2,...), соответственно решений уравнений (4) и (5) с начальными приближениями

ь(0) (¿*,ж*) = шахіМ #Гж(Т,£*,ж* ,«(•), -и)) (9)

ієО «(•) V у 7 У

ь(0) (¿*,ж*) = тіпіпґ Я^ж(Т, ¿*,ж*,и, -и(-)) ^. (10)

«ЄР і(^)

(0) (0)

Л е м м а 3. ь_) (■),ь+) (■) Є иС (В).

и

и

Лемма 4. Для любого n = 0,1, 2,...

Ф+ о w(n)( ■ )= ■ ), а Ф— о w+n)( ■ )= w+n)( ■ ).

Теорема 6. На подпространстве UC (D) уравнение (6) имеет единственное решение, удовлетворяющее краевому условию

w(t,x) |t=T = H(ж). (11)

Следствие. Единственным решением уравнения (6) с краевым условием (11) является функция значения семейства игр (1)—(3), (t*,x*) € D, при этом и последовательные приближения (7), (9), и последовательные приближения (8), (10), сходятся 'равномерно на множестве D к этой функции.

При выполнении известного условия регулярности в линейной игре сближения в заданный момент времени [2] легко проверить, что функция программного максимина, очевидно, удовлетворяющая условию (11), является неподвижной точкой каждого из операторов Ф- и Ф+ . Поэтому в этой игре она является функцией значения.

Опишем возможную структуру решения игры (1)—(3) в классе позиционных стратегий за одного из игроков. Для определенности опишем ее за 1-го игрока. Учитывая определение оператора Ф- , лемму 3 и теорему 1 запишем равенство (7) в явном виде:

w—)(t*,x*)= max maxinfw—'-1)ft,x(t,t*,x*,«(•),v)^ (12)

te[t*,T] veQ о V 4 ’)

((t*, ж*) € D)

Рассмотрим последовательность {Vn}^Lo позиционных стратегий 1-го игрока, считая, что в ней стратегия V0 каждой позиции (t*, ж*) € D ставит в соответствие один из векторов, реализующих максимум по v € Q правой части (9), а каждая из стратегий Vn, n € N , всякой такой позиции ставит в соответствие один из векторов, реализующих максимум по v € Q в правой части (12).

Пусть a > 0, n € N, k € N U {0}, n > k ,

Dnk(a) = {(t,x) € D|w(n)(t,x) ^ wik)(t,x) + a(n — k)},

cDnk(a) D \ Dnk (a),

и далее пусть

Sn(a) = {Bnn(a) Bnn— 1 (a), • • • , Bn0 (a) },

где

n—1

Bnn(a) = Dnl(a)

l=0

Bnk(a) = ^

n

Bno(a) = P| cDio(a). i=i

Лемма 5. При любых a > 0 и n € N система множеств Xn(a) образует разбиение пространства позиций D .

n \ /k—1 \

П cDik(a) п п Dkl(a) 1, 0 ^ k ^ n — 1, =k+1 / \l=0 /

Таким образом, для любых a > 0 и n € N на множестве D можно определить позиционную стратегию 1-го игрока Vna , считая, что если (t*,x*) € Bnk(a) , то

Vna(t,x) = Vk(t, ж).

Будем говорить ниже, что семейство игр (1)—(3), (^,ж* € D) , имеет универсальное решение, если при любом е > 0 каждый из игроков имеет на пространстве позиций D универсальную е -оптимальную стратегию.

Теорема 7. Каково бы ни было ограниченное пространство позиций D семейство игр (1)—(3), (t*, ж*) € D , имеет универсальное решение, при этом,, в частности, если е > 0 , то при любых n € N и a > 0 таких, что р^^ (•),w+l)) < е/2 и a < e/2n, стратегия Vna является универсальной на множестве D е -оптимальной стратегией 1-го игрока.

Аналогично конструируются универсальные е -оптимальные позиционные стратегии 2-го игрока.

Основы теории бескоалиционных дифференциальных игр, опирающейся на описанные выше результаты, кратко изложены в [12].

Список литературы

1. Красовский Н. Н. Игровые задачи о встрече движений. М.: Наука. 1970. 420 с.

2. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.:Наука. 1974. 456 с.

3. Ченцов А. Г. Об одном примере нерегулярной дифференциальной игры // ПММ. 1976. Т. 40. № 6. С. 1113-1116.

4. Чистяков С. В. Одна дифференциальная игра при фазовых ограничениях // Всесоюзная конференция по оптимальному управлению в механических системах. Тезисы докладов. М. 1974. C. 70-71.

5. Ченцов А. Г. О структуре одной игровой задачи сближения // Докл. АН СССР. 1975. Т. 224. № 6. C. 1272-1275.

6. Ченцов А. Г. Об игровой задаче сближения в заданный момент времени // Мат. сб. 1976. Т. 99. № 3. C. 394-420.

7. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. М.: Наука. 1981. 287 с.

8. Чистяков С. В., Петросян Л. А. Об одном подходе к решению игр преследования // Вестник ЛГУ (сер. мат., мех., астр.). 1977. № 1. вып. 1. C. 77-82.

9. Чистяков С. В. К решению игровых задач преследования // ПММ. 1977. Т. 41. № 5. C. 825832.

10. Чистяков С. В. О функциональных уравнениях в играх сближения в заданный момент времени // ПММ. 1982. Т. 46. № 5. C. 874-877.

11. Айзекс Р. Дифференциальные игры. М.: Мир. 1967. 479 с.

12. Чистяков С. В. О бескоалиционных дифференциальных играх // Докл. АН СССР. 1981. T. 259. № 5. C. 1052-1055.

13. Чистяков С. В. Программные итерации и универсальные е -оптимальные стратегии в позиционной дифференциальной игре // Докл. АН СССР. 1991. T. 319. № 6. C. 1333-1336.

14. Чистяков С. В. Операторы значения антагонистических дифференциальных игр. СПб.: НИИ Химии СПбГУ. 1999. 62 с.

Чистяков Сергей Владимирович Санкт-Петербургский государственный ун-т,

Россия, Санкт-Петербург e-mail: [email protected]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.