УДК 517.97
Л. Н. Лукьянова
ЗАДАЧА УКЛОНЕНИЯ ОТ СТОЛКНОВЕНИЯ ДЛЯ ЛИНЕЙНОЙ УПРАВЛЯЕМОЙ СИСТЕМЫ1
(кафедра математической физики факультета ВМиК)
Рассматривается задача уклонения от столкновения с препятствием для линейной динамической системы с геометрическими ограничениями на управления, при движении системы к терминальному множеству. Получены достаточные условия разрешимости задачи и предложен способ построения управления, решающего задачу уклонения от столкновения. Приведен расчет модельного примера.
1. Постановка задачи. Рассмотрим динамическую систему, описываемую дифференциальным уравнением:
х(£) = Ах (г) + Ви(г), х(0) = х°, (1)
где £ 6 [0,0], х 6 Еп, и 6 Р С Ер, Е" — га-мерное евклидово пространство, Р — выпуклый компакт, МР ф 0, и — параметр управления, А, В — постоянные матрицы размерности га X га, га X р соответственно. Под допустимым управлением будем понимать измеримые по Лебегу функции с значениями в множестве Р. В пространстве Е" заданы целевое множество М\ и препятствие М2. Предполагается, что они имеют вид М{ = М1 + М?, г = 1,2, где М1 — линейное подпространство из Еп, М? — выпуклые компакты из Ь1, Ь1 — ортогональное дополнение к М1 в Еп. Скажем, что для начальной позиции х° существует решение задачи уклонения от столкновения с препятствием для линейной динамической системы (1), если найдется допустимое управление и конечный момент времени Т такие, что х(Т) Е М\, Т ^ в и ^ М2, £ Е [О, Т]. Рассматривается задача [1-8] о нахождении достаточных условий на параметры системы (1), при которых для начальной позиции х° существует решение задачи уклонения от столкновения с множеством М2 при движении к множеству М\.
2. Вспомогательные построения. Пусть 7Г — оператор ортогонального проектирования из Е" на подпространство Ь1, сЦт Ь1 = д, д ^ 1.
Предположение 1. Существует такое целое число к ^ 0, что ранг матрицы ттАкВ равен д, а матрицы 7ГАгВ = 0 при I = 0,..., к — 1, если к ^ 1 [1-3].
Отметим, что в силу предположения 1
тг е*АВ = гктгА(г)В, (2)
оо
где А(Ь) = ^ Аг, причем ряд сходится для любого действительного числа Ь в смысле произвольной
фиксированной матричной нормы.
Положим Р = Р1 + Р2, Int.Pi ф 0, IШР2 Ф 0, рх 6 МРЬ и = щ + и2 + р\, щ £ (Р1 - рг), и2 6 Р2,
1 Работа выполнена при поддержке РФФИ 04-01-08085.
а(4, 5,7ГТО1, ж0) = <
Р1, Р2 — выпуклые компакты. Определим для 4 > 0, 5 Е [0,4], т\ Е М\ функции [8]:
тах|а : а ^ 0, -а^тгемх° + / Врг г1з - пт,^ Е В{Рг - рг) |,
(
если тгемх° + / Врх ¿в ф тттх,
о
(
1/4, если тгемх° + / Врх ¿в = 7ГТО1;
о
(3)
(
ЯМ«, = (4)
Предположение 2. Для позиции ж0 системы (1) существуют вектор 6 М1 и множество Р1 С Р, для которых функция /3(4, ж0) имеет положительный корень Т.
Замечание. Отметим, что Г = Г(Р1,Ш1). Множество Р1 и вектор далее считаются параметрами способа управления.
(
Пусть £(4) = ттемх° + f тгеА^~^ Вр\ ¿з — ттгпх ф 0 для всех 4 6 [О, Г]. Выберем управление
о
^1(4) 6 (А — Р1) для 4 6 [О, Г] как решение уравнения
т
(5)
Если при некотором 41 справедливо равенство тгеМ1х° + J тгеА^~^ Вр\ ¿з = 7гто1, то из определения
о
функции /3(4, ж0) следует, что 41 ^ Г. В этом случае управление ^(4) = £>1 Е Р\,Ь Е [О, Г].
В силу предположения 2 существует одно или много решений уравнения (5). Функция а(Т, 4,7гто1, ж0) — измеримая функция 4 при фиксированных Г, ттгпх, ж0. Следовательно, в силу теоремы Филиппова уравнение (5) разрешимо в классе измеримых функций. Траектория системы (1) при управлении, являющемся решением уравнения (5), или при ^(4) = р\ может быть представлена в следующем виде:
(
тгж(4) = у(4)+ J тгеА{г~8) Ви2(з) ¿в, (6)
о
где
( ( у(1)= тгемх° + I пе^-^В^з) -Р1)йз+ J тгел^ Врх йз = (7)
о о
( (
= Z(T)(l-J (^{Т^з^тг^х0)^^ + J тг(еА* - еАТ)е~АвВ(и1 (в) - Р1) с1з + £(*) - £(Г) + жтх. (8) о о
Из (8) следует, что функция у(4) обладает следующими свойствами: у(4) Е Ь1, 4 Е [О, Г]; у(0) = 7гжо, у(Т) = игах Е М1. Далее траекторию у(4), 4 Е [О, Г], назовем опорной траекторией.
Лемма 1. Функция у(4) к + 1 раз дифференцируема по 4 при 4 Е [О, Г].
Доказательство. В силу предположения 1 для матрицы ттсправедливо представление (2), откуда из соотношения (7) следует дифференцируемость к + 1 раз функции у(4).
Введем множество
ф = { и }■
(е[о,т]
Отметим, что характеристики движения точки у{£) по множеству Ф задаются управлением щ(1;). Выбор множества Р\ позволяет выбирать величину Т в некотором диапазоне. Для параметрически заданной вектор-функции у{£) может выполняться один из двух случаев. Случай 1. ФП М| = 0. Случай 2. Ф П М$ ф 0.
В случае 1 можно положить и2(Ь) = 0 и управление щ(1;) решает задачу уклонения от столкновения с множеством М2 при движении системы (1) к множеству М\.
Рассмотрим случай 2. Введем множество М2 £ Ь1: М2 = М| + 5|(0), 5*1(0) — д-мерная сфера в Ь1 радиуса е.
Характер пересечения "опорной" траектории и множества М2 может быть разным. Введем понятие кратности пересечения параметрической кривой ?/(£), £ £ [О, Г], множества М2.
Определение. Для параметрической кривой ?/(£), £ £ [О, Г], и множества М2 имеет место /-кратное пересечение, если существуют моменты времени 0 < ¿ц ^ ¿12 < ¿21 ^ ¿22 < • • • < ¿¿1 ^ ¿¿2 < ■ ■ ■ < Т
I _ I
такие, что для £ £ и [£¿1,^2] справедливо включение у{£) £ М2, для t ^ [£¿1,^2] выполнено условие ¿=1 ¿=1
У(*) £ м2.
Предположение 3. Для кривой Ф и множества М2 имеет место однократное пересечение.
Для построения маневра обхода используем функцию Минковского выпуклого множества, содержащего начало координат.
Пусть А £ Int Mi, А £ Ф, //(£,М2 - А) — функция Минковского множества (М2 — А) [9-10], £ £ L1. Приведем некоторые свойства функции Минковского, которые используются в дальнейшем изложении.
1. Поскольку множество М2 — А ограничено, замкнуто и 0 £ М2 — А, то //(£, М2 — А) > 0 для всех
о, д(о,м2 — А) = о.
2. ц{А£, М2 - А) = А/х(£, М2 - А), VA > 0, £ £ L1.
3. М2 - А = {е £ L1 : М2-А)<: 1}.
4. £ <£ М2 - А, если //(£, М2 - А) > 1, £ £ М2 - А, если //(£, М2 - А) ^ 1.
Определим функцию А(t) = , t £ [ii,i2]- Поскольку А £ Ф, то fi(y(t) - А, М2 - А) ф О,
t £ [О, Г]. Отметим, что из определения функции Минковского следует неравенство A(i) ^ 1, t £ [t\,t2]. Положим
. ГО, если t <£ [ti,t2],
Л[Т> ~ \\{t) - 1, если t £ [ii,i2]; l j
y(t)=y(t) + \(t)(y(t)-A), t £ [О, Т].
Лемма 2. Кривая у{£) удовлетворяет условию у{£) = 0, £ £ [0,Т].
Доказательство. Пусть А ^ Ф, А £ М2, £ £ [0,Г]. Воспользуемся эквивалентностью утверждений у(г) П М2 = 0 и (?/(£) - А) П(^2 - А) = 0 и покажем, что //(?/(£) - А, М2 - А) ^ 1 для £ £ [0, Г]. Имеем:
/х(у(*) - А, М2 - А) = - А + ЩШ - А), М2 - А) = + 1)(у(*) - А), М2 - А) =
= {Щ + 1)^{уЦ)- А,М2- А).
Если t £ [0, ¿1) и(^2, Г], то, согласно (9), А(£) = 0, и так как //(?/(£) - А, М2 - А) ^ 1, то /х(у(*) - А, М2-А) > 1, т.е. у(*) ^ ММ2.
Если 4 6 [¿1,42]) то согласно (9) А(4) + 1 = А(4), и
д(у(4) - А, М2 - А) = д(у(4) - А + А(4)(у(4) - А), М2 - А) = А(4)д(у(4) - А, М2 - А) = 1 в силу выбора А(4). Таким образом, /¿(у(4) — А, М2 — А) ^ 1, т.е. у(4) ^ ¡г^Мг-
Предположение 4. Существуют положительные параметры к, V такие, что
= >*(*)> *е(о,т). (ю)
Положим у(4) = у(4) + ¥>(*)(у(*) - А), 4 £ [О, Г].
Лемма 3. Кривая у(4) удовлетворяет условию у(4) Р|М2 = 0, 4 6 [О, Г], у(0) = у(0), у(Т) £ М|. Доказательство. Покажем, что /¿(у (4) — А, М2 — А) ^ 1 для 4 6 [О, Г]. Имеем:
ц(у(4) - А, М2 - А) = ц(у(4) - А + ^(4) (у(4) - А), М2 - А) =
= д(И4) + 1)(у(4) - А), М2 - А) = И4) + 1)д(у(4) - А, М2 - А).
Если 4 [0,41) и(^2,Г], то согласно (9), (10) <¿>(4) + 1 ^ 1, и так как д(у(4) - А, М2 - А) ^ 1, то ц(у(Ь)-А,М2-А) > 1, т.е. у(4) ^ М2.
Если 4 6 [4ь42], то согласно (9), (10) <¿>(4) + 1 ^ А(4) + 1 = А(4), и
/X(у(4) - А, М2 - А) = /х(у(¿) - А + ^(4) (у(4) - А), М2 - А) = + 1)/х(у(4) - А, М2 - А) ^ 1 в силу выбора А(4). Таким образом, /х(у(4) — А, М2 — А) ^ 1, т.е. у(4) ^ М2.
Функция </?(4)(у(4) — А) /г + 1 раз дифференцируема на отрезке [0,Т]. Ее значение и значения ее к + 1 производных обращаются в 0 при 4 = 0. Рассмотрим на отрезке [0,Т] следующее интегральное уравнение 1-го рода типа Вольтерра относительно и2(-) 6 II:
£
J тге^"5' Ви2 (в) ¿з = <р(Ь) (у(4) - А) (11)
о
в классе измеримых функций и2(4) 6 С/, где II — класс р-мерных измеримых по Лебегу векторных функций, ограниченных по модулю на [0,Т] [3, 4, 11].
Лемма 4. Для функции </?(4)(у(4) — А) уравнение (11) разрешимо на [0,Т] в классе II. Доказательство. Продифференцируем обе части равенства (11) к +1 раз по 4. В силу условий
ОО к
леммы 1 и формулы 7Ге*АВ = ^ АкВ получим эквивалентное (11) интегральное уравнение
к=о
г
тгАкВи2 (4) + I тгАк+1е^-^АВи2{з)йз={^(1){у(1)-А))^1^. (12)
о
Из условий предположения 1 вытекает неравенство р ^ д и то, что в матрице кАКВ можно выделить невырожденную квадратную подматрицу С порядка д. Обозначим через N множество номеров столбцов матрицы 7ГАкВ, не вошедших в подматрицу С. Для I £ N положим компоненты ^¿(4) искомой функции и(4) в (12) равными нулю при 4 6/. Далее, используя невырожденность матрицы С, легко построить эквивалентное векторное линейное интегральное уравнение 2-го рода типа Вольтерра для остальных компонент искомой функции и(4). Полученное уравнение можно решить методом последовательных приближений при произвольной измеримой, ограниченной по модулю (</?(4)(у(4) — А))'с+1. Так, построенное решение уравнения (12) будет принадлежать классу С/. Лемма 4 доказана.
Для решения Cu2(t) уравнения (12) имеет место соотношение [11]:
t
Cu2(i) = f(i) +j T(t,s)f(s)ds, (13)
о
где
f(t) = Mi) (y(t) - A))'fc+1', T(t, s) = K(t, s) + K™ (t,s) + ... + K^ (t,s) + ..., (14)
t
K(t,s) = irAk+1e^ABDC-1, K(2]{t,y) = J K(t,s)K(s,y)ds, ...,
у
t
K^ (t, y) = J K(t, s)Kn~l (s, y)ds, n = 2,3,....
У
Здесь D — p X g-матрица, строки которой с компонентами i £ N — нулевые, остальные — строки матрицы С.
Пусть Айв — два положительных числа, ограничивающие нормы Ак+1е(г~^л В DC-11| и ||/(i)|| соответственно на отрезке [О, Г]. Пусть ||Г(£, s)|| ^ ii, O^s^i^T.
Л е м м а 5. \\Си2 (t) || iC h = 0eAi; \\Си2 (t) || ^ l2 = 0(1 + Ш).
Доказательство леммы 5 непосредственно следует из (13), (14).
При заданных функциях (p(t), y(t) мы получаем величину ограничения на управление u2(t), t £ [О, Г], при котором можно реализовать маневр обхода, соответствующий этим функциям:
Рг 5 5,(0). (15)
Здесь 5/(0) — сфера радиуса I с центром О, I = min(/i, 12).
Предположение 5. Множество Р2 удовлетворяет включению (15).
3. Основное утверждение. Сформулируем достаточные условия существования решения в задаче уклонения от столкновения.
Теорема. Если для системы (1) е позиции х° выполнены предположения 1-5, то для позиции х° существует решение задачи уклонения от столкновения.
Доказательство. Пусть для начальной позиции х° существуют вектор т\ £ М\, множества Р\, Р2 и положительные параметры то, v такие, что выполнены предположения 1-5.
Пусть для начальной позиции ж0 справедливо условие £(i) ^ 0, t £ [О, Г]. При управлении u\(t), выбранном как решение уравнения (2), и управлении u2(t), выбранном как решение уравнения (7), согласно (4), (5) и предположению 2, леммам 3, 4, 5, соотношениям (12), (13) для траектории системы (1) выполнены соотношения ж (Г) £ М\, x(t) М2, t £ [О, Г], т.е. разрешима задача уклонения от столкновения.
Пусть для начальной позиции х° справедливо условие: существует момент t\, для которого £(ii) = 0. При управлении u\(t), выбранном в виде u\(t) = р\, и управлении u2(t), выбранном из соотношений (12), (13), согласно (4), (5) и предположению 2, для траектории системы (1) выполнены соотношения ж (Г) £ М\, x(t) ^ М2, t £ [О, Г], т.е. также разрешима задача уклонения от столкновения. Теорема доказана.
4. Пример. Приведем расчет приведенной выше конструкции для конкретного примера управляемой системы. Пусть уравнение движения системы (1) имеет вид [5]
J¿1 = х2, жх(0) = ( — 5,5), ( ,
\i2=u(t), ж2(0) = (1,1),
где Х\, х2 £ R2, ||и(£)|| ^ р. Пусть целевое множество имеет вид М\ = {(xi,x2) : х\ = (5,0)}, а множество-препятствие — вид М2 = {(xi,x2) : 11жi — (0,5)|| ^ 1,5}.
Обозначим через Е квадратную единичную матрицу размерности 2, тттпх = (5,0), Pi = {«i : ||«i|| ^ pi}, Р2 = {и2 : ||и2|| ^ р2}, pi + р2 ^ р, z(t) = ®i(0) + x2(0)t - nmi. Имеем
(О М At _ (Е Et\ _ (Е О О,/' 6 -\0 Е J ' ""-^0 О
тгем = (Е Et) , ттВ = (0 0) , тгАВ = (О Е) .
Следовательно, к = 1. Функции (3) и (4) имеют вид
= = (17)
Уравнение для времени окончания процесса управления Т:
Plt4 = 2(</i + 2g2t + g3t2)1 (18)
где д1 = 11ж 1 (0) — 7ttoi ||2, д2 = {х\ (0) — 7ttoi , х2 (0)), ¿(3 = \\х2 (0) ||2. Управление и\ (i), t G [0, Г], являющееся решением уравнения (5), и опорная траектория y(t), t G [0,Г], имеют вид
Pi^(T) , n ^ Piz(T)t2 , N
Ml(i) = "]Rr)|' = *(*) +~ 2||г(Г)||- (19)
Для заданных параметров £i(0), ж2(0), М|, М\ игры (16) кривая Ф удовлетворяет предположению 2. Положим pi = 1. Тогда из (18) время Т = 4, 7.
Из (19) находим y(i) f|M22 ф 0 для t G [¿i,i2]; ii = 2,2674; t2 = 3,2181. Положим A = (0,5). Тогда функции
p(Y(t)-A,M2-A) = 2-\\y(t)-A\\, X(t) = 1,5 , если i G ii!' ^
3 L||y(t)-A|| -1' если t t [ii, i2\-
Неравенство (10) выполнено при h = 2,2, v = 0,04. Интегральное уравнение (11) имеет вид t
J(t — s)u2(s) ds = ip(t)(y(t) — А). Его решение u2(t) = {<~p{t) (y (t) —А))" следующее (константы приведены о
с точностью до пятого знака):
и21 (t) = -22 sin(2,9530i1/25) + 13,2 sin(2,9530i1/25)i + 6,3292i2 sin(2,9530i1/25) - 3,95i1/25 cos(2,953i1/25) +
+ l,3097i26/25 cos(2,953i1/25) + 0,43860i51/25 cos(2,9530i1/25) + 0,15348i2/25 sin(2,9530i1/25)-
- 0,030695i27/25 sin(2,9530i1/25) - 0,0073590i52/25 sin(2,9530i1/25);
и22 (i) = 4,4sin(2,9530i°'04) (i - 0,43877i2) + 0,78999i°'04 cos(2,9530i°'04)(t - 0,43877t2) +
+ 8,8i sin(2,9530i°'04)(1 - 0,87755i) - 0,030696i°'°8 sin(2,9530i°'04)(t - 0,43877t2) +
+ 0,51975^0,04 cos(2,9530i°'04)(l - 0,87755i) - l,9306i2 sin(2,9530i°'04).
При используемых параметрах маневра обхода управление u2(t), t G [0,Г], удовлетворяет ограничению -13 ^ «21 (i) ^ 3,2; 2,4 ^ «22 (i) ^ 12,8.
СПИСОК ЛИТЕРАТУРЫ
1. Понтрягин Л. С. Мищенко Е.Ф. Задача об уклонении от встречи в линейных дифференциальных играх // Диф. ур-ния. 1971. 7. № 3. С. 436-445.
2. Никольский М. С. О линейной задаче осуществления заданного движения / / ДАН СССР. 1992. 322. № 5. С. 193-197.
3. Никольский М.С. Об одной задаче осуществления заданного движения. Гибкие системы // Докл. РАН. 1996. 350. № 6. С. 739-741.
4. N i к о 1 s к i i М. S. Method of factorization applicable to the solution of convolution equations // Integral Transformation and Special Functions. 1994. 2. N 1. P. 51-64.
5. Понтрягин Л. С., Б о л т я н с к и й В. Г., Г ам к р е л и д зе Р.В.,Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.
6. Красовский H.H. Управление динамической системой. М.: Наука, 1985.
7. БлагодатскихВ.И. Введение в оптимальное управление. М.: Высшая школа, 2001.
8. ГригоренкоН.Л. Математические методы управления несколькими динамическими процессами. М.: Изд-во МГУ, 1990.
9. Васильев Ф. П. Методы оптимизации. М.: Факториал Пресс, 2002.
10. Половинкин Е.С., Балашов М.В. Элементы выпуклого анализа. М.: Физматлит, 2004.
11. Гурса Э. Курс математического анализа. Т. 3. Ч. 2. М.: ОНТИ, 1933.
Поступила в редакцию 01.03.05
УДК 519.248:[33+301]
H. Л. Иванова, Ю. С. Хохлов
МНОГОМЕРНАЯ МОДЕЛЬ КОЛЛЕКТИВНОГО РИСКА1
(кафедра математической статистики факультета ВМиК)
I. Мотивация и постановка проблемы. Целью данной работы является обобщение на многомерный случай известной одномерной модели коллективного риска Андерсена-Крамера, в которой полный иск на момент времени t может быть записан в следующем виде:
N(t)
s(t) = '£xj, (i)
3 = 1
где
1) {N(t), t ^ 0} — случайный процесс, описывающий динамику поступивших исков;
2) {Xj} — последовательность независимых одинаково распределенных (н.о.р.) случайных величин (с.в.), которые описывают величины поступивших исков;
3) случайный процесс {N(t), t ^ 0} и последовательность {Xj} независимы.
В классической модели коллективного риска предполагается, что N(t) есть однородный процесс Пуассона с параметром Л.
Существенной чертой этой модели является то, что мы рассматриваем так называемый однородный портфель исков, т.е. портфель, содержащий иски только одного типа. Более точно это означает, что {Xj} имеют одно и то же распределение. На самом деле страховая компания заключает договоры страхования, имеющие отношение к различным типам страхования.
Существуют различные варианты классификаций отраслей страхования, например пожаров, кредитов, автомобилей, недвижимости, ответственности третьих лиц, путешествий, перевозок, техники, жизни, рабочих компенсаций, морских перевозок и т.д. Обычно при продаже полисов страхования, относящихся к разным типам, возможная зависимость между ними игнорируется, т.е. используются отдельные одномерные модели для каждого из типов контрактов, которые предполагаются независимыми. В результате мы приходим к следующему вырожденному варианту многомерной модели, где отдельные компоненты независимы:
,iVi(t) Nm(t) ,
S(i) = (Sl(i)1...1Sm(i))=[Y,X}1...1 Y.X?)- (2)
V 3=1 3=1 7
Здесь
1) m есть число различных типов страховых договоров;
1 Работа поддержана РФФИ, проекты 04-01-00671, 05-01-00535 и MON, ММ-1103.