Научная статья на тему 'Синтез управления в однотипных дифференциальных играх с фиксированным временем'

Синтез управления в однотипных дифференциальных играх с фиксированным временем Текст научной статьи по специальности «Математика»

CC BY
70
24
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Ухоботов В. И.

Линейная дифференциальная игра с фиксированным моментом окон чания с помощью замены переменных может быть [1] записана в виде игры с простым движением, в которой вектограммы игроков зависят от времени. Рассматриваются однотипные игры,в которых вектограммы игроков описываются одним и тем же выпуклым симметрическим компактом, который может быть в каждый момент времени гомотетично растянут Платой [2] является значение функции Минковского [3] этого компакта. В работе [4] рассматривается конкретный пример однотипной игры, в которой до определенного момента времени первому игроку все равно, какое выбирать управление. В работе [5] для некоторых классов игр вычислена цена игры, которая принимает постоянное значение в некоторой области пространства позиций В работе [7] для однотипных игр удержания осуществлен синтез управлений игроков.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Ухоботов В. И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Синтез управления в однотипных дифференциальных играх с фиксированным временем»

СИНТЕЗ УПРАВЛЕНИЯ В ОДНОТИПНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ С ФИКСИРОВАННЫМ ВРЕМЕНЕМ

В. И. У хоботов

Челябинский государственный университет

Линейная дифференциальная игра с фиксированным моментом окон чания с помощью замены переменных может быть [1] записана в виде игры с простым движением, в которой вектограммы игроков зависят от времени

Рассматриваются однотипные игры,в которых вектограммы игроков описываются одним и тем же выпуклым симметрическим компактом, который может быть в каждый момент времени гомотетично растянут Платой [2] является значение функции Минковского [3] этого компакта

В работе [4] рассматривается конкретный пример однотипной игры, в которой до определенного момента времени первому игроку все равно, какое выбирать управление В работе [5] для некоторых классов игр вычислена цена игры, которая принимает постоянное значение в некоторой области пространства позиций В работе [7] для однотипных игр удержания осуществлен синтез управлений игроков

Задано линейное нормированное пространство Е Фиксирован момент времени р и при I < р определены неотрицательные скалярные функции а(<) и 6(£), которые суммируемы на каждом конечном отрезке

СИНТЕЗ УПРАВЛЕНИЯ

179

Рассмотрим дифференциальную игру

г = -a(i)u + b(t)v, z £ Е, и г € S (1)

Относительно множества S предполагаем, что оно является выпуклым, замкну 1ым и удовлетворяет условию уравновешенности

eSeS, Vst [-1,1]

и noi лощения

(J(eS) = Е,е> О

Отсюда следует что его функция Минковского

A(z) = mf{e > 0 2 е eS}

удовлетворяет следующим условиям [3]

A(ez) =| е | A(z), 0 < А(г) <+оо, (2)

М-) ~ А(у) < A (z + х)< Х(х) + A (z)

При определении страте! ий игроков будем использовать подход, предложенный в [1]

Рассмотрим произвольные управления игроков

u(t z) £ S, v(t,z) £ S, t < p, t £ E (3)

Зафиксируем начальный момент времени ¿о < Р и возьмем разбиение

¿о < U < < tk < h+! -Р (4)

Для начального состояния z(tо) = zq построим ломаную

c(i) = z(t,) - ( I a(j )dr)u(i„ *(*,)) + (J b(r)dr)v(t, z(tt)), tz<t< t,+l

(5)

Используя свойства (2) функции Минковскою, можно показа!ь что

|A(z(i))-A(*(r))| < J (a(r) + /(r))dr, r<t<p Щ

Из этого неравенства следует, что семейство функций A(z(t)) на отрезке [fo,p] является равномерно ограниченным и равностепенно непрерывным По теореме Арцела [3] из любой сходящейся подпоследовательности A(zn(t)) можно выделить подшк ледовательность, равномерно сходящуюся на отрезке [to,p]

Если пространство Е конечномерно, а множество S является компактом, то сами ломаные (5) удовлетворяют условиям теоремы Арцела Тогда под движением z(t) можно [1] понимать равномерный предел последовательности zn{t) ломаных (5) с диаметром разбиения

m = max (i,+1 ~ t,), (7)

0<t<<:

стремящимся к нулю

180

В. И. УХОБОТОВ

В общем случае под реализацией значений функции Минковского на движении, порожденном управлениями (3), понимаем любую функцию А(t) > 0, которая является равномерным пределом на отрезке [¿о,р] последовательности функций A(z„(£)), где zn(t) — последовательность ломаных (5) с диаметром разбиения, стремящимся к нулю.

Цель первого игрока заключается в минимизации величины A(z(p)). Второй игрок эту величину максимизирует.

Покажем, что ценой игры является функция [5]

G(t, z) = max{F(<); A(z) + /(<)}, (8)

f(t) - (6(r) - a(r))dr, F{1) = max/(?•), t <r <p (9)

Можно показать, что для любого числа е > 0 найдется число а > 0 такое, что для всех разбиений (4) с диаметром разбиения (7) а > m выполнено неравенство

тах /(£, ) < F{t0) < тах /(<, ) + е (10)

В пространстве переменных t,z рассмотрим следующие множества.

yi={(t,z):\(z) + f(t)>F(t)}, 'A0 = {(t,z):X(z) + f(t) = F(t)}, (11)

Al={(i,z):\(z) + f(t)<F(t)}.

Зафиксируем следующее управление первого игрока-

u(t,z) = г/ Х(г); (t,z)eA; u(t,z) = s, Vs g 5, (M)€v4<>LMi (12)

Отметим, что из определения функции F (9) следует неравенство A (z) > 0 при (<, z) G А.

Зафиксируем произвольное управление второго игрока (3). Возьмем начальное состояние z(íq) — Zq и любую реализацию A(í) функции Минковского на движении, порожденном управлением (12).

ТЕОРЕМА 1. Управление (12) обеспечивает выполнение неравенства

A(p)<G(í0,*o). (13)

Доказательство. Если А(р) = 0, то неравенство (13) выполнено Пусть А(р) > 0 Покажем, что существует число ¿о < t* < Р такое, что

\(tt)<G(t0,z0)-f(t,), (14)

X{t) + f(t) > F(t), U < t <p. (15)

Из определения функции (8) следует, что неравенство (14) выполнено при Í* = <о- Если неравенство (15) выполнено при всех to < t < р, то искомым числом t, является íq-

СИНТЕЗ УПРАВЛЕНИЯ

181

Пусть неравенство (15) нарушается для некоторых чисел t 6 (¿o, р]- Обозначим через /« верхнюю грань этих чисел. Поскольку f(p) = F(p) = 0 и \(р) > 0, то íq < < р. Далее , неравенство (15) выполнено при всех /» < t < р, а при t = 1„ в нем стоит равенство. Отсюда, учитывая неравенства F{U) < F(to) < G{to,zo), получим требуемое условие (14).

Рассмотрим последовательность ломаных zn(t) с диаметром разбиения тп 0, для которых X(zn(t)) —* X(t) равномерно на [¿о,р] Пусть ¿o < t\n) < ... < t< р точки разбиения ломаной z„(t)

Зафиксируем число í* < г < р. Тогда из неравенства (15) и из равномерной сходимости X(zn(t)) следует, что существует номер N такой.что

M^n(t)) + f(t) > F{t), Vf е (r,p], Vn > N.

Следовательно, управление (12) в точках > г равняется

«('„*„(*•)) = ^п{и)/Х(гп{и)), tln) >г,п> N. (16)

Покажем, что, начиная с некоторого номера Ni > N, ломаные удовлетворяют неравенству

от A (zn{t)) - J a(r)dr >0, r<t<s<t + m„, s < р. (17)

Допустим противное. Тогда существует последовательность точек г < tn < sn < tn + тп, sn < р, в которых нарушается неравенство (17). Переходя к сходящимся подпоследовательностям, получим A(t*) < 0 в некоторой точке t* € [г, р] Это противоречит неравенству (15)

Зафиксируем ломаную zn{t) с п > Ni. Пусть t[Z\ < г < t[nK Покажем, что

л<п> ям «*•<» —

A{zn(t\n))) < 4zn{t(;i))) + Г (6(г) - a(r))dr, j > г. (18)

Jt^

Доказательство случая j — i 4 1 и проверку индукционного шага проведем одновременно

Из формул (5) и (16), используя свойства (2), получим

Í I г*{п)

4zn(t{n>))< \X(zn(t{l\)) - / ' a(r)dr + / ' b(r)dr.

j I

Отсюда и из неравенства (17) получим неравенство (18) при i — j — 1

Стало быть, если неравенство (18j выполнено при j - 1, то оно выполнено н при j.

i i

Положим в (18) i = р. Будем иметь

А(^(Р))< A(2„(íín))) + /(íin)).

Перейдем в этом неравенстве к пределу при п —> +оо. Тогда

г, A(*„(í<n>))-*A(r). Следовательно, А(р) < А(г) + /(г).

182

В И УХОБОТОВ

Устремим в этом неравенстве ?—■>£„ и учгем неравенство (14) Получим требуемое условие (13)

Рассмотрим следующее управление второго игрока

v(t,z) = z/\{z), {t,z)£A[jAQ,

x;(t,z) = s,VseS, A(«) = 1, (t,z)€ A0, A(z) = 0, (19)

v(t,z) = «,Vs6S, (l,z)6 40

Возьмем любое управление (3) первого игрока и рассмотрим любую ломаную (5), порожденную этим управлением и управлением (19)

Лемма 1 Пусть

(*,,*&)) е ЛLMo (20)

при некотором 0 < J < к Тогда при всех j < г < к -f 1 выполнены условия

(U,z(tt))€A{jAo, Gfa.zfcVZGitj.zCtj)) (21)

Доказательство При г = j соотношения (21) выполнены допустим, что они выполнены для некоторого номера г > j

Из свойств (2) функции Минковскою для ломаной (5) следует, что

A(2(i,+i))>A (z(t,) + £ + b(r)drv(t„z(t,)))- a(r)dr

Подставим сюда управление (19) Тогда, используя определение функции (9) получим

A(z(i,+1)) + /(*,+1) > A(z(£,)) + f(t,) (22)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из включения (21) и из вида множеств (11) получим G{tt,z(tt)) = X{z{i,)) + f{t,)>F{U)

Отсюда, используя неравенство (22), вид функции (8) и монотонность функции (9), получим неравенства

G(t,+Uz(t,+Ï)) > A(*(iI+1)) + /(i1+1) > G(t„z(t,)) > F(t,) > F(t,+1) Отсюда следует, что условия (21) выполнены и при г + 1

Теорема 2 Для начального z{to) — zq, управления (19) вюрого игрока и любого управления (3) первого игрока существует такая реализация A(t) функции Минковского, что

X(p)>G(t0,z0) (23)

Доказательство Возьмем пока произвольную ломаную (5), порожденную этими управлениями

Если при j = 0 выполнено включение (20), то, полагая в (21) i = к + 1, получим неравенство G(p,z(p)) > G(t0,z0) Отсюда и из формулы (8) будем иметь, что для любой ломаной (5) выполнено неравенство

X(z(p))>G(t0,z0) (24)

Следовательно, для любой реализации функции Минковского будет выполнено неравенство (23)

СИНТЕЗ УПРАВЛЕНИЯ

183

Пусть (t0, zq) £ А\. Тогда из формул (11) и (8) будем иметь, что G(t0,z0) = F(t0)> f(l0).

Обозначим

U = sup{i £[t0,p) F(t) — F(t0)}. (25)

Из непрерывности функции F следует, что

F{t.) = F(to) = G(to,zo). (26)

Если <* = р, то из (26) будем иметь, что G(to,zo) = 0. Следовательно, неравенство (23) будет выполнено.

Пусть tt < р. Тогда из (25) и из монотонности функции F получим, что

F(U)> F(t)nVuU<t<p. (27)

Используя формулы (9) можно показать, что существует последовательность гп > <„, гп —► такая, что

F{rn) = /(»'„). (28)

Возьмем ломаную г„(<) так, чтобы в ее разбиении содержалась точка гп, а ее диаметр разбиения равнялся 1 /п. Тогда из (2) следует, что А(г„(гп)) + /(?•„) > F(rn). Следовательно, (rn, zn(rn)) удовлетворяет включению (20). Из леммы 1 будем иметь

А(*„(р)) =G(p,zrl(p)) > G(r„,zn(r„)) > F(rn)

Переходя в этом неравенстве к пределу, получим А(р) > F(tt) Отсюда и из (26) получим требуемое неравенство (23).

теорема 3 Пусть функция (9) удовлетворяет следующему условию: если число t* < р удовлетворяет неравенству (27), то существуют последовательности чисел t, < s, < гг, г, —+ t, такие, что

F(t) = m,Vt£[si,rl) (29)

Тогда управление (19) обеспечивает выполнение неравенства (23) для любой реализации функции Минковского

Доказательство. Пусть А(<) является равномерным пределом последовательности X(zn(t)) с диаметром разбиения, стремящимся к нулю.

Рассмотрим случай, когда число (25) < р. Зафиксируем число i > 1. Тогда, начиная с некоторого номера щ, на отрезке [s,, г,] найдется точка гп

184

В. Е ФЁДОРОВ

разбиения ломаной £„(<). Из условия (29) получим равенство (28). Как и в

предыдущей теореме, получим неравенство (23).

СПИСОК ЛИТЕРАТУРЫ

[1] Красовский Н Н , Субботин А.И. Позиционные дифференциальные игры М . Наука, 1974. 456 с.

[2] айзекс Р. Дифференциальные игры М : Мир, 1976. 480 <

[3] Колмогоров А.Н., Фомин С.В Элементы функционального анализа М.:Наука, 1972. 496 с.

[4] Субботин А.И., Ченцов А.Г Оптимизация гарантии в задачах управления М. Наука, 1981 289 с

[5] У хоботов В.И. Построение цены игры в некоторых дифференциальных играх с фиксированным временем // Прикл. мат и мех. 1981. Т. 45, вып. 6. С. 994-1000.

[6] Ухоботов В И К построению стабильного моста в играх удержания // Прикл. мат и мех. 1981. Т 45, вып 2. С. 236 240.

[7] Ухоботов В И. Область безразличия в однотипных дифференциальных играх удержания на ограниченном промежутке времени // Прикл. мат и мех 1994 Т. 58, вып. 6 С. 56-62

i Надоели баннеры? Вы всегда можете отключить рекламу.