ТЕОРИЯ УПРАВЛЕНИЯ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
УДК 517.97 © С. В. Лутманов
КОМПРОМИССНОЕ УПРАВЛЕНИЕ В ЛИНЕЙНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ НЕСКОЛЬКИХ ЛИЦ
Рассматривается линейная конфликтно-управляемая динамическая система, математической моделью которой служит позиционная дифференциальная игра нескольких лиц. В качестве принципа рационального поведения игроков в игре предлагается принцип компромисса. Смысл его состоит в том, что для заданных значений компромиссных оценок строится набор стратегий всех игроков, который обеспечивает результат игры для каждого игрока не «хуже» его верхней компромиссной оценки, а любому «игроку-уклонисту» не позволяет получить значение платы «лучше» его нижней компромиссной оценки. Указанный принцип компромисса является в некотором смысле обобщением принципа равновесия Нэша. Данная работа является продолжением цикла статей [1],[2]. Для игры в нормальной форме Г = {K, {Ui}igK, {h}ieK} введем понятие компромиссного набора стратегий.
Определение 1. Пусть
S* = (Si*,..., Sfc*), S * = (Si,..., S*), Si* < S*, i € K.
Ситуация W = (Ui,...,U) € П ieK Ui называется компромиссной относительно векторов S*,S* € Rk , если для всех i € K выполняются неравенства
Si* < min Ji(Ub ...,Ui,...,Ufc) < Ii(f7i, ...,Ui,...,Uk) < S*.
Ui
Построение компромиссного управления в классе позиционных стратегий осуществим для дифференциальной игры следующего вида. Динамика игры описывается обыкновенным векторным линейным дифференциальным уравнением
k
x = A(t)x + B(t) ^ ui.
i=i
Здесь t € R1 — текущее время, x € Rn — фазовый вектор, щ — вектор управляющих параметров i -го игрока, i € K. На векторы управляющих параметров игроков наложены геометрические ограничения в форме включений Ui € Pi, где Pi С Rn, i € K выпуклые и компактные множества. Момент T окончания игры фиксирован, а функция платы игрока имеет вид
1i(Ui ,...,Uk) = ^i(x(T)),
где функции <f>i : Rn ^ R1 являются достаточно гладкими. Дополнительно предполагается,
что для любого вектора s € Rn и всех номеров i € K справедливо неравенство
min < s,u1 > +----+ min < s,ui > +---+ min < s,uk 0.
Vl£pl Vi£pi Vfc^Pfc
Пусть M С Rn — выпуклое и компактное множество. Полагаем
Si = max wi(x), si = min wi(x), i € K, (1)
e(t, x) = ma^0, — гпах(< P, l > + < X(T, t)x, l >)}, (2)
W = {(t,x)|e(t,x) ^ 0, t ^ T}, W£ = {(t,x)|e(t,x) > 0, t ^ T}.
Здесь X(t, T) — фундаментальная матрица Коши для однородного уравнения x = A(t)x. Справедливы следующие утверждения.
Лемма 1. Для всех (¿,ж) Є ^ максимум в (2) достигается на единственном векторе /0(і, ж).
Лемма 2. Функция е является непрерывно дифференцируемой функцией в области W£, и ее частные производные вычисляются по формулам
де де
—~(t,x) = X(T,t)l°(t,x) = s(t,x), —(t,x) = — < X(T,t)A(t)x,l°(t,x) > .
dx д t
Набор стратегий Ui,..., U определим следующим образом
Ui i <(t,x) (t,x) € (3)
1 произвольный вектор из Pi, (t, x) € W£,
где вектор u|(t,x) удовлетворяет условию
< s(t, x), B(t)< (t, x) >= min < s(t, x),B(t)ui >, i € K, (t, x) € W£.
Vi€Pi
Т еорема 1. Набор стратегий (3) является компромиссным относительно оценок (1) для любой начальной позиции из множества W.
В качестве модельного примера в работе исследована дифференциальная игра трех лиц T = 1,u, v,w € S(0,1) = {z € R2, |z| ^ 1},
x i = (cos t)xi + tx2 + ui + vi + wi, ж2 = T^TT^I + (sini^2 + u2 + v2 + w2, t + 1
^1(Ж1,Ж2) = ^/ж| + (ж2 - 2)2, ^>2(Ж1, ж2) = \/(Ж1 + ж2)2 + (ж2 - л/З)2, ^з(Ж1,Ж2) = \/(Ж1 - \/з)2 + (ж2 - I)2.
Построены компромиссные оценки игроков и компромиссный, относительно этих оценок, набор позиционных стратегий.
Список литературы
1. Лутманов С. В. Компромиссное позиционное управление в нелинейных дифференциальных играх нескольких лиц// Проблемы механики и управления. Пермь. Изд-во Пермского ун-та. 2005. С. 35- 52
2. Лутманов С. В. Компромиссное управление в дифференциальных играх нескольких лиц// Известия Института математики и информатики. Ижевск. Изд-во Удмуртс. ун-та. 2005. №2(32). С. 83-102.
Лутманов Сергей Викторович Пермский государственный университет, Россия, Пермь e-mail: [email protected]