УДК 517.977 ББК 22.16
© О. В. Моржин
Россия, г. Улан-Удэ, Бурятский государственный университет Россия, г. Переславль-Залесский, Институт программных систем РАН E-mail: [email protected]
ПОСТРОЕНИЕ МИНИМИЗИРУЮЩИХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ В СИСТЕМАХ С НЕОГРАНИЧЕННЫМИ УПРАВЛЕНИЯМИ1
Статья посвящена изучению возможности построения минимизирующих последовательностей в задачах оптимального управления для систем с неограниченными линейными управлениями без выполнения условия корректности: коммутативности их базисных полей. Рассматриваются иллюстративные примеры.
Ключевые слова: оптимальное управление, вырожденные задачи, минимизирующие последовательности.
© O. V. Morzhin
Russia, Ulan-Ude, Buryat State University Russia, Pereslavl-Zalesskiy, Program Systems Institute E-mail: [email protected]
THE MINIMIZING SEQUENCES CONSTRUCTION IN THE SYSTEMS WITH UNRESTRICTED CONTROLS
The article is devoted to the minimizing sequences construction in optimal control problems for systems with unrestricted linear controls, where the commutativity of basis fields condition isn’t satisfied. Demonstrative examples are given.
Key words: optimal control, degenerated problems, minimizing sequences.
Введение
Многие прикладные задачи оптимального управления являются вырожденными [1 - 10], так что известные общие методы оптимального управления и классические вариационные методы для них оказываются неэффективными, либо вообще неприменимыми.
Типичный класс вырожденных задач представляют задачи c линейными неограниченными управлениями:
I (u(), х() ) = F (x(tF )) ® inf, T = [tj, tF ], (0.1)
x(t) = g(x(t), t) + (h(x(t), t), u(t)), x(tI) = xI, x(t) e Rn, u(t) e Rr, (0.2)
x(t) e X(t). (0.3)
В отличие от классических задач, где предполагается существование оптимального реше-
ния, доставляющего минимум функционала, здесь под решением задачи понимают минимизирующую последовательность {us (•), xs (•)], на которой I (us (•), xs (•)) ® inf I (u(), x(-))
при s . Управление us (•) будем считать кусочно-непрерывным, траекторию xs (•) -
непрерывной кусочно-дифференцируемой функцией. Такие последовательности представляются посредством обобщенных решений типа импульсных режимов управления.
Во многих работах по оптимальному импульсному управлению при исследовании задач вида (0.1) - (0.3) постулировалось выполнение условия коммутативности (корректности):
— dhq dhp
[hp, hq ] = 0, p, q = 1, k, где [hp, hq ] = —- hp- hq - коммутатор (скобка Ли) гладких
дх Эх
функций hp, hq, и (h )х - матрица Якоби.
1 Работа выполнена при финансовой поддержке РФФИ (проекты 08-01-00945-а, 09-01-90203-Монг-а), РГНФ (проект 09-02-00493-а).
В статьях [11 - 13] показано, что условие Фробениуса не является необходимым условием для метода преобразований и позволяет преобразовать исходную систему к производной системе, менее сложной, чем его выполнение в системах того же порядка.
В работе [13] предложен подход к построению траекторий импульсных режимов управляемых систем, основанный на представлении предельной системы как управляемой с неограниченными линейными управлениями и ее последовательном преобразовании к эквивалентным системам понижающегося порядка, называемых производными системами.
Цель исследования состоит в том, чтобы, опираясь на известный метод преобразования к производной задаче [4, 6, 7] и предложенную в [13] схему построения траекторий предельной системы на ее орбите, разработать процедуру построения минимизирующей последовательности в общем случае, без упомянутого предположения о корректности и с учетом возникающих при этом особенностей.
1. Преобразование к производной системе, орбита предельной системы
В работах В.И. Гурмана [4, 6, 7] предложен метод преобразования вырожденных задач к производным задачам с переходом к производной системе меньшего, чем n, порядка так, что траектория хЕ (•) (E означает «extension» - расширение), фигурирующая в производной системе в роли управления, аппроксимируется по мере последовательностью {xs (•)]
допустимых траекторий исходной системы.
Производная система, безотносительно какой-либо оптимизационной задаче, имеет вид:
y (t) = (), g(x(t Xt Л+), y= )(t, ^ (12)
где y = )(t, x) - m -мерное интегральное многообразие (m < n) предельной системы, которая строится следующим образом. Система (0.2) представляется в виде
*« = (т,t)fy^, t(t) = ¡¡-Цй- 1(0) = 0, re[0tF], (1.3)
u (t) j=1 u (*) u(t)
где t - вспомогательный аргумент. При достаточно больших управляющих воздействиях в системе (1.3) ее динамика главным образом определяется слагаемыми в правой части уравнений, зависящими от управления. В пределе при u ® ¥ она переходит в систему, назы-
ваемую предельной:
x(t) = ^hp(x(t),t)lp, ||l| = 1, te [0,tF], t = const. (1.4)
p p=1
Правая часть системы (1.4) задает линейную оболочку размерности k. Функция ) (t, х) будет называться первым интегралом системы (1.4), если на любой траектории x(t) этой системы она постоянна, т.е. ) (t, x(t)) = const, где i < k. Совокупность независимых первых интегралов системы (1.4) - интегральный базис: y = )(t, х).
Были сформулированы достаточные условия, обеспечивающие указанное преобразование, основное - полная управляемость системы (1.4) на интегральном многообразии y =)(t, х) [4, 6, 7].
Понятие орбиты [14] напомним в терминах алгебры Ли семейства векторов hl, .... hk. Пусть Lie(hl, ..., hk) - алгебра Ли, генерируемая добавлением к семейству hl, .... hk всех скобок Ли [hi,hj], [[h,hj],ht], ... (i, j, l = 1,k) и их линейных комбинаций. Пусть L(х) -линейная оболочка алгебры Lie(h1, ..., hk) в точке хe En. Если dimL(х) = m < n, то предельная система вполне управляема на некотором связном m -мерном многообразии
O с Rn - орбите семейства hj, .... hk :
Oy ={(х): y = )(t, х)], (15)
где t является параметром. Размерность орбиты равна размерности линейной оболочки ал-
40
гебры Ли. Конечно, явно выписать уравнение орбиты системы (1.5) в общем случае невозможно, тогда необходимо неявное описание [7].
В производной системе функции y(t) - играют роль кусочно-гладких фазовых траекторий, а функции х^) - роль кусочно-непрерывных управлений, связанных с фазовыми координатами конечными соотношениями (1.5) так, что разрывы происходят вдоль траекторий предельной системы, соединяющих левый и правый пределы в точке разрыва. Таким образом, в некоторый момент t возникает задача построения траектории предельной системы (1.4), соединяющей некоторые точки
х(0) = ^ х(Ь) = хТр , (16)
удовлетворяющей уравнению орбиты (1.5). Вектор y определяется начальным условием.
В общем случае решение такой задачи для управляемой системы неединственно, и эту неединственность можно использовать для построения наиболее простых траекторий, что важно для их последующей аппроксимации допустимыми решениями исходной системы при построении минимизирующей последовательности.
Пример 1. Рассматривается система
х' = g'W + х2 = g2(x) + ^ \ (1 7)
х& = g3^) + (х1)2u2/2, х4 = g4^)-2х1ы1, te T = [0, 1], х1_4(0) = 0 и задача оптимального управления с целевым критерием
I (u(), х() ) = ( х:(1)) + х4(1) ® inf, (1.8)
при дополнительном поточечном фазовом ограничении —1 < х1^) < 1, t e T.
Системе (1.7) соответствует предельная система:
х\т) = ¡\ х2(т) = х\т)/2, х3(т) = (х1)2/72, х4(г) = —2х1(г)/1, te [0, tF], (1.9)
в которой не выполнено условие коммутативности:
h1 (х) = (1,0,0, —2х1)т, h2 = (0, х:,(х:)72,0)т , h3 = [h1, h2] = ^ hl—^hL h2 = (0,1, х\0)т ф 0.
Эх Эх
По первому и четвертому уравнениям системы (1.9) находится их первый интеграл:
дх4 = —2х1дх1, )(х) = (х1 )2 + х4 = const. который, как легко убедиться, задает орбиту системы:
) h + )h2 + )х3¿3 = 0, Oy = {(х) : y = (х1)2 + х4] .
Перейдем в системе (1.7) к новым переменным х1"3 и y = (х1)2 + х4:
х1(т) = /\ х2(т) = х1/2, х3(т) = (х1)2/2/2, y(t) = 0, te [0, tF]. (110)
Имеем y0 = (х^, )2 + х04. Предельная система не вполне управляемая в R4, но вполне управляемая на связном 3-мерном многообразии Oy, проходящем через начальную точку х1_4(0) = х^4. Положим g(х) = (1,0,0,0)т . Производная система (1.2) имеет вид:
y(t) = 2 ^(t), y(0) = 0. (1.11)
Система (1.11) - первого порядка, в ней шесть переменных: y, х1_3, п1~2. Все переменные, кроме y , являются управляющими и могут быть заданы произвольно как кусочнонепрерывные функции iE—3, u^E—2, определяющие некоторый импульсный режим. Критерий оптимальности (1.8) с учетом уравнения орбиты Oy представляется в виде
I = y(1) ® inf. (1.12)
Имеем регулярную задачу оптимального управления, решение которой y:1E(t) °—1. Тогда y(t, XlE) = —2t, JcE(t) = —2t — 1, t e T. Функции 4(t) не удовлетворяют начальным ус-
ловиям. Этим функциям при t e (0,1] отвечает управление ûlE (t) ° — 1, но для иллюстрации возможности решения задачи при произвольном выборе функций x2E 3, ûl~2 полагаем Ц—2 = 0 на всем отрезке T. Таким образом, имеем jcE(t) °—1, x2E 3(t) °0, xE(t) = —2t — 1, y(t, xE) = —2t, ûE—2 ° 0 на T, min y(1) = —2. Нужно построить последовательность {xs(•)} для приближения траектории XE (•) по мере на отрезке T. □
2. Управляемость предельной системы на орбите
Краевые условия означают требование перевода системы (1.4) из заданного начального состояния х0 в фиксированное конечное состояние xt . Рассмотрим, как перейти из на-
F
чального состояния в конечное по траектории системы (1.4), лежащей на орбите.
Для исследования системы (1.4) перейдем к вспомогательной системе
к
X(t) = S hp (x(t), t )ûp (t), te [0,tF ], t = const. (2.1)
p=1
В соответствии со схемой, предложенной в [13], система (2.1), линейная по неограниченным управлениям, представляется в виде
_ m r
X(t) = h (x, t)û + h(x, t)û = ^ hi (x, t)û + ^ hj (x, t)û , t e [0, tF ], t = const,
i=r +1 j=1
где при управлениях û = 0 получаем корректную систему (это заведомо верно, если число управлений û равно 1). Находится ( n — r )-мерный интеграл y = h(x, t) корректной системы и рассматривается система, производная по отношению к (2.1):
y (t) = h h ( x, t )û, y = h( x, t ), T]xh( x, t ) = 0, t = const.
Переменные производной системы можно назвать «активными», а остальные - «пассивными». Множество «активных» переменных обозначим как NonPas, «пассивных» - Pas.
Тем самым вводится множество Ех кусочно-непрерывных функций x(t), таких что функции y(t) = h( x(t)) кусочно-гладкие и удовлетворяют производной системе.
Для системы вида (2.1) существует преобразование ( x) □ (y, z), где z = ç( x) - вектор
криволинейных координат на интегральном многообразии. Обратное преобразование x = X(y, z ). Исходная система (2.1) преобразуется к системе
y (t) = hxh ( x, t )û, y = h( x, t ), hxh( x, t ) = 0, t = const, z(t) = çx (hz(x,t)û + h(x,t)û), x = X(y,z).
По аналогии с системой (1.7) может оказаться, что уравнения системы изначально разделены на «активные» и «пассивные». Изучим этот случай подробно. Для получения производной системы достаточно записать систему без «пассивных» уравнений. Получим расширенную предельную систему:
xJ (t)
= S hp (x(t), t)vp (t), t e [0, tF ], t = const, j e NonPas. (2.2)
P
«Управляющие» функции x1 (t) ( i e Pas) могут быть разрывными, в том числе на концах отрезка [0, tF ]. Функции x1 (t) ( j e NonPas) будем строить непрерывными и удовлетворяющими соответствующим краевым условиям из (1.6). Управления û'(t), ..., ûk (t) и x1 (t) ( i e Pas) в системе (2.2) надо задать таким образом, чтобы вычислялись решения x1 (t) ( j e NonPas), удовлетворяющие орбите. Рассмотрим функции û'(t), ..., ûk (t) постоянными на всем отрезке [0, tF ], а функции x1 (t) ( i e Pas) - постоянными на интервале (t, tF ) и принимающими на концах отрезка значения, равные граничным состояниям:
ur (t) = ûr, r є 1, к, x' (t) =
t = tr
x',
tî (tj ,tF ), і є Pas.
(2.3)
і, F -
t = t
Заметим, что в расширенную систему (2.2) могут быть подставлены вместо определенных по формуле (2.3) функций X (т) константы Xі на [0, тр ], так как в интегральном
смысле все равно траектории Xі (т) не изменятся. Представление функций X (т) в виде (2.3) нужно для выполнения соответствующих номерам і краевых условий из (1.6).
Теперь правая часть системы (2.2) зависит не от неизвестных функций, а от параметров. Система стала проще. Например, если правая часть системы не зависит от Xі, то решение находится непосредственным интегрированием:
TF к
xJ(tF) = x0 + j 2h1rvrdt := .
tj r=1
F
(2.4)
В результате решения системы алгебраических уравнений вычисляются управляющие параметры Û1, ..., ûk и x1 (iî Pas) и, значит, может быть построена траектория x(t) предельной системы (2.1), удовлетворяющая в каждый момент t орбите, в том числе краевым условиям (1.6). Траектория x(t) получается непрерывной по «активным» координатам и разрывной по остальным.
Необходимое условие для выполнения такой процедуры - равенство числа искомых параметров в правой части (2.4) числу уравнений, т.е. числу «пассивных» координат. Если оно не выполняется, то можно идти двумя путями. Первый путь - увеличивать число параметров за счет применения кусочно-постоянных управлений или другого параметрического семейства управлений. Второй путь - уменьшать далее порядок системы путем итеративных переходов к новой производной (относительно предшествующей) системе, что всегда возможно при наличии линейных управлений, которые вместе с новым управлением x î Oy (t, y) задают некоторый пучок гиперплоскостей (в простейшем случае - прямых)
[13]. Построив его линейную оболочку, получим систему канонического вида, аналогичную исходной (0.2). При этом базис можно задавать неоднозначно, отправляясь, например, от некоторого поля h1(X(y, Z)), где z - постоянный вектор криволинейных координат на
орбите. При следующем переходе будем иметь семейство производных систем с параметром z , который будет играть роль постоянного по времени управления.
Пример 2. Пусть x,
,1-4
:1, xt
-1, xt
: 2, xt = —12, xt = 1 для предельной систе-
мы (1.9). Здесь NonPas = {2,3}, Pas = {1,4}, y = 2 . Так как xj Ф xJF, j = 2,3, полагаем:
x'(t) =
xn
x1 = const, tî (0,tF); x4(t) =
t-
'■t
x,r
t = tf ;
x
x4 = y — (x‘)2, tî (0, tF);
t = 0;
/^14 2
(2.5)
x
t = t f .
Определив х'Д) по формуле (2.3), получаем й'(т) = 0, те [0,тр]. По второму и третьему уравнениям системы (1.10) и с учетом краевых условий имеем:
тр тр 1
х2(тр) = х02 + Г х'й2 := хД , х3(тр) = х0 + Г— (х1)2 й2 := хД ,
3 р ^ О р
0 0 ^
х1й2 = а, (х1)2й2/2 = Ь, а = (хД -х2)Др , Ь = (хД -х0)Др .
Разрешаем систему алгебраических уравнений относительно х1 и й2:
x
х1 = 2Ь/а, й2 = а2/2Ь. (2.6)
Таким образом, для расширенной предельной системы (вида (2.2))
х2(т) = х1(т)й2, х3(т) = (х1)2 й2 ¡2 функции х'(т) = х'(т) и й2(т) = й2(т) найдены. Тогда точка (х', х4) лежит на параболе х4 = у — (х1)2 при данном у . Из точки (х0, х^) попадаем в точку (х', х4) скачком, затем также скачком переходим в точку (хТ , хТ ), что иллюстрирует рис. 1 при тр = 1.
р Р
Получены непрерывные линейные функции
х2 (т) = хД + х1й2 (т — т1), х3 (т) = х3^ + (х1 )2И2 (т — т1)/2, удовлетворяющие краевым условиям.
При тр = 1 имеем а = 1, Ь = — 3/2, х1 = —3 , й2 = -1/ 3 , х4 = —7 . На рис. 1 показаны графики проекций траектории х(т). Пунктирные линии означают разрывы траектории. □
Рис. 1
к
Если оказывается х0 = х]т (у е NonPas), то, например в (2.4) получаем ^ И]гйГ = 0. Это
Р
Г=1
«особый» случай, и формулы для х(т), которые получены ранее в предположении, что х]0 Ф х]т (] е NonPas), нельзя применить. Нужно задать каждую константу х1, равной одному из значений х0 или хгт .
3. Аппроксимация траектории предельной системы непрерывными траекториями исходной
Рассматривается система, эквивалентная системе (1.3) при Ь = ||й|| и управлениях
/} = й1 ¡\й\, таких, что /} е {0, ± 1} , ||/|| = 1, у = 1, к:
х(т) = g(х(тХ&VЬ+¿И(x(т),&)/], &(т) = VЬ, &(т) = т, те т,тр^ (3.1)
1=1
где L - достаточно большое число.
Т
Решая задачу Коши t(t) = 1/L, te[0, tF ], t(0) = 0, находим t(t) = J (1/L)d£ = t/L ,
0
t(t) = t/L , t(tF ) = tF ¡L, где момент tF априори не известен.
При L ® ¥ имеем g(x, t)/L ® 0 на [0, tF ], но в этом случае значение t(tF ) ® 0.
Схема аппроксимации траектории X(t) предельной системы следующая. Задается произвольно достаточно большое значение tF и вводится равномерная сетка на отрезке [0,tF]. Далее система (3.1) интегрируется численно на [0,tF] с управлениями V є {0, ± 1} , ЦП = 1, j = 1,к , и константой L, которые задаются таким образом, чтобы траектория X(t) системы (3.1), исходящая из начального состояния x0, была непрерывной по всем аргументам и в момент tF выполнялось условие X(tF ) » X(tF ) в смысле критерия
error
x(tf)-хТр <є. (3.2)
На отрезке [0, tF ] рассматриваются точки г*, г*, в которых происходит смена значений управлений l1, ..., lk. Эти точки вместе с моментом tF определяются при достижении «пассивными» и «непассивными» решениями тех или иных значений. Например, если х0 > х! (і є NonPas), то управления будут заданы такими, чтобы на отрезке [0, г*] функция
Xі (г) убывала до значения Xі.
Пример 3. Продолжим исследование, начатое в примерах 1, 2, заменив при этом вектор g (х) = (1,0,0,0)г на вектор g (х) = (sin х1, 1, cos х2, - 1)г.
Начальное приближение tF = 7. Интегрируем систему (1.7) с управлениями Iі =—1, l2 = 0 до тех пор, пока функция Х'(г) не достигнет значения х1 с некоторой точностью єх по критерию Х'г*) — X11 < єх □ 1.
Затем на полуотрезке (Г,г2] интегрируем систему (1.7) с управлениями Iі = 0, l2 = —1, пока функции X^ 3 (г) не достигнут постоянных значений xt 3 с точностью єх соответственно, тем самым определяя точку г* . Далее, на полусегменте (г*2, tF ] интегрирование системы проводится при Iі = 1, l2 = 0, пока аппроксимирующая траектория Х(г) не достигнет заданного конечного состояния с точностью є по критерию (3.2). На рис. 2 представлены соответствующие графики. □
4. Построение последовательности кусочно-непрерывных функций х,(t)
для исходной системы
На отрезке [0, tF ] вводится сетка
0 = t0 < tj = t0 +Dt < ... < tj = jDt < ... < qDt = tF, At = tF/q, (4.1)
где q - достаточно большое число.
Функции xq (t) выступают в роли «промежуточного звена» при аппроксимации разрывной траектории XE (t) с помощью непрерывных траекторий xs (t) исходной системы, где s
- номер члена последовательности, аппроксимирующей XE (t) по мере.
Укажем свойства функции xq (t) при фиксированном q. На интервалах (tj, tj+1)
(j = 0, q) функция xq (t) непрерывная и кусочно-дифференцируемая, является решением
исходной системы (0.2) при начальном состоянии хч (^. + 0) е Q(tj, уч )), которое задается из значения хд ) = хч — 0) е Q(tj, уд )) , где Q(tj, уд )) - орбита предельной системы, порожденная начальным состоянием хд (^. — 0). Функция хд ^) подразумевается непрерывной слева на [70, tq) . Запись хд (t0) = хд ^0 — 0) означает хд (^) = x(t0) = х0. В момент tq = tF предел слева хд (tq — 0) порождает уд (tq), а значение хд (tq), формально равное хч (tq + 0), находится, исходя из орбиты Q(tq, уч (tq)). Точки хч + 0) берутся на орбитах Q(tj, Уч)) такими, чтобы величина ||хд + 0) — хсЕ+ 0)|| была наименьшей.
Пример 4. Для задачи, поставленной в примере 1, при g (х) = (1,0,0,0)г продемонстрируем процесс построения функции хч ^) , положив сначала ч = 5 .
В момент t0 = 0 функция хч ^) принимает заданное значение хч (0) = 0. Орбита
Уч(а = {(х) : Уч(to) = (хЧ(to))2 + хч4(0 = 0} . Значение хч(to + 0) принадлежит аппр°к-симируемой траектории хсЕ в момент ^0 + 0). На промежутке ^0, t1] = (0,0.2], поставляя управления й1Е 2(t) = 0 в исходную систему, находим х^^) = t — 1, х^’ 3(t) = 0, х4^) = —1. Имеем х1ч(t1 — 0) = —0.8, х4ч(^ — 0) = —1, уч(t1) = —0.36 Ф (х1Е(^))2 + -хЕЕ(t1) = —0.4,
Уч(t1) — (-хЕ(О)2 = —1.36 >у(^) = —1.4. В качестве начального состояния для интегрирования исходной системы на следующем частичном промежутке - начиная с (^ + 0) - берем
точку (^ уч (^ ) — (хЕ (tl + 0))2) = (—1,0,0, —136).
Рис. 2
Далее по аналогии. Получаем хч (^ + 0) = (—1,0,0, —2.8), уч (^ ) — у(^ ) = At = 0.2. В таблице 1 приведены интересующие нас значения по каждому из пяти промежутков.
Таким образом, х^) = t — (1 + jAt), х£4 ) = уч ) — (х1Е (^. + 0))2 при t е , ^+1],
у = 0, д -1, и х^ 3(/) = 0 при t е [¿0,]. Эти формулы справедливы для любого числа д > 0 . Образуется последовательность {хд (I)}, сходящаяся к ХЕ (I) равномерно на ^0,], причем 1 (и'ч 2) = Уч(^) ® У(?я) =1пГ 1 (и). □
Таблица 1
t1 (хЕ X хЕ^} ) ) у(^) х . + ) х . + ) уд )
0 (-1, -1) 0 (-1, -1) 0
0.2 (-1, -1.4) -0.4 (-1, -1.36) -0.36
0.4 (-1, -1.8) -0.8 (-1, -1.72) -0.72
0.6 .2) 2. 1 ^7 -1.2 (-1, -2.08) -1.08
0.8 .6) 2. 1 ^7 -1.6 (-1, -2.44) -1.44
1 (-1, -3) -2 .8) 2. 1 ^7 -1.8
5. Построение минимизирующей последовательности {и5 (^), х5 ^)}
Заключительным этапом является построение последовательности кусочнонепрерывных управлений и5 (^) и непрерывных кусочно-дифференцируемых траекторий
х5 (^), на которой функционал стремится к инфимуму [6, 7].
Сначала при заданном д построим управление и^8 (^) и траекторию х^8 ^). Затем укажем зависимость д(^) и тем самым получим формулы для задания минимизирующей последовательности {и5(^), х5(^)}. Построение функций и^5(^), х^5^) производится с использованием рассмотренных в п. 2, 3 процедур. В узлах сетки (4.1) функция хд (^) имеет разрывы по построению, причем на промежутках непрерывности функция посчитана при и = иЕ. Для аппроксимации кусочно-непрерывной траектории хд (^) рассматривается в моменты tJ (у = 0, д) предельная система (1.4) с краевыми условиями
х(Т = 0) = \ =0 = х (*у - 0) , х(Т ) = хТр = хд (0 + 0) , (5.1)
причем хд ^0 - 0) и хд (^ + 0) означают х0 и хд (^).
Итак, в каждой точке разрыва функции хд (^) рассматривается предельная система с условиями (5.1) и строится аппроксимация х(т) ее разрывной траектории х(т) в соответствии с описанными выше процедурами с той лишь разницей, что момент тр заранее не известен (раньше мы задавали его равным 1) и граничные состояния не задаются (как в таблице 1), а определяются исходя из значений пределов слева и справа для хд (^) в точках разрыва.
Пример 5. Используя полученные в примере 4 формулы для задания {хд (^) }, построим аппроксимацию х5 (^) для хд (^), указав зависимость д = д^).
Для всех узлов по типу краевых условий имеем «особый» случай (п. 2.4). Управление и2(т) = 0, те [0,тр]. Функция х'(г) задается по формуле (2.3), где константа х1 полагается произвольной - возьмем ее равной х1 (¿;. + 0) = х'(^.) = —1, у = 0, д. По начальным данным х1 4(т ) = х1 4 (¿. - 0) вычисляется число уд (¿;.), которое, вообще говоря, не равно значению у(^.), где у(1.) = —2t. Поэтому в формуле (2.5) константа х4 определяется исходя из °рбиты Q(t], уд (^.)): х4 = уд ) - (х 1 )2 = х1р .
і хт = Х1 (і- - 0), 7 = 0,
Имеем: Х'Т) = \ 1 -Х4(т) =
Х1 = -1, те (0,тр],
-V, (і-) - (Хт1 )2, т = 0
уч (і-) - те (0, тр]
х2, 3(т) = 0, те [0,тр].
Для аппроксимации разрывной траектории х(т) предельной системы в каждый момент tj рассматривается система вида (3.1).
Из условий х1 (т) = 1Ь. + Iх, х1 (0) = хгд ^. - 0) , х1 (тр ) = х1 = х1Е + 0) = -1 имеем при
Iх =-1 на [0,тр] решение х'(т) = хд-0) + (1/Ь. - 1)т, те[0,тр], где тр определяется как момент достижения этой функцией заданного значения х1т = -1. Отсюда получаем
р
тр = ((хгд - 0) +1)Ь. )/(Ь. -1) . Решая задачу Коши t(т) = 1/Ь. , t(0) = 0 и используя найденную формулу для тр, находим формулу для длины 1 промежутков, на которых применяются большие по абсолютной величине управляющие воздействия:
т*.
(К (і- - 0)+1)А- х1(ґі - 0)+1
і(тр) = — = ——і----------------- = —^---- ------® 0 при А ® ¥ .
^ А (А - 1)Ь] А -1 р -
Аі Аі х1(іі - 0) +1 г (х1 (і- -0) +1)
Формула для А : 1 := — (г > 2), — = --------- ^ А = 1 +-------------------, где г -
г г А -1 - Аі
доля длины шага Аі = ір /,, задающая длину 1 промежутков, на которых применяется (сравнительно) большое по абсолютной величине управление.
На первом отрезке [і0, і1] точку, в которой происходит достижение функцией Х^ (і)
значения Х1Р °-1, будем обозначать і0б,. Длина промежутка [і0, і0б, ] равна 1. Далее, на интервале (і0 ж, і1:,) функция х,5 (і) находится интегрированием исходной системы с управлениями г/р: 2(і) ° 0. На отрезке [іи, і1] функция х,5 (і) вычисляется как решение начальной задачи для исходной системы с начальным условием х(іи) = х,х (і1г,), определяющим начальное состояние для предельной системы, рассматриваемой в момент і1. Итак, в предельной системе краевые условия следующие: х(т1 = 0) = х (і1г,), х(тр ) = х (і1 + 0) .
На последующих частичных отрезках предельная система рассматривается только для правых концов і(частичных отрезков. На промежутках [і(-+1)ж, і-+1] интегрируется одна и та же система, но с разными начальными данными. По теореме о непрерывной зависимости решений от начальных данных заключаем, что значение х (і-+1) не должно существенно отличаться от х (і-+1 + 0).
В момент і0 = 0 имеем у (0) = 0. На отрезке [і0, і1] применяется управление:
-(1 + г/Аі), і є[0, ^]
йР(і) = 0, іє (і0,, ^X (5.2)
- (1 + (г(х^ (іи) + 1))ІАі) =1 - г, і є [іи, і1],
2Аі
где х^ (іи) = Аі-1. Интегрируя систему при й = й^ (і) (рис. 6), находим
xl(t ) =
-rt/Dt, t e [0, t0s],
t-Dt - 1, t Î (t0 s , t1s ), ^ (t0s ) =
r
(2 - r)t + rDt - 2Dt -1, t î [t1s, t1 ],
Пусть, например, q = 5, r = 4. Тогда 1 = 0.05, xjs (t0s ) = -1
(t1s ) =-09, x'qs (tl) = -1 (рис. 7).
На последующих частичных отрезках [tj, tj+1] ( j = 1, q -1):
UE (t) ° 0, > Î [tj, ’( j+1)s X
Dt + r
< (t» s ) = -1.05
1 +
r (X'qs (t( ,+1)s ) + 0
qsK ( j+1) s
Dt
r t Î [t( j+1)s , t1],
(5.3)
ГДе Xp (t( j+1) s ) = Dt
Dt
1
При r ® ¥ имеем X\s (t(j+1)s ) ® X\ (t1) = Dt - 1 и xis (t( j+1)s ) ® XE ° -1 при Dt ® 0 . Пусть q(s) = s + 4 . Тогда
Dt =
_ F
s+4
X1(t1s )
F
s+4
1
2
1 Xl(tU+1)s )
F
t1s = Dt
Dt
V r y
Г 1 Л
r s + 4
V r J
Dt tF
t. = jDt + — = —
js r s + 4
s+4
1
1
Dt
1, t0 s = ~ =
t
V r J
О
( j+1) s
s+4
r r(s + 4)
( • ! 1 1 j + 1 +- .
V r J
Рис. 3
Рис. 4
r
r
t
t
1
При фиксированном r (например, r = 4) и s ® ¥ имеем:
w ч -1 At tFj tF (j +1)
Xs (t( j +1)s ) ® = -1, j - t( j+1)s = — ® 0, tjs ® S+4 = tj , t( j+1)s ® s + 4 = j •
Используя формулы (5.2), (5.3), задающие явно управление ulqs(t), построим численно аппроксимирующую траекторию xqs (t) и найдем соответствующее значение функционала
I (U-2(0, xq-4(-)}. Положим r = 4 и s = 1, тогда q(s) = 5, At = 0.2, l = 0.05 . В этом случае получаются функции ulqs (t) и x1-4(t), где q = q(s) = 5, графики которых изображены на рис. 3, 4. Значение функционала I(u1-2(),xq-4(-)) =-1.81816»inf I(u,x) = -2.
Таблица 2
s q I (us“2, xs“4) s q I (u1-2, x1-4)
2 6 -1.8475 13 17 -1.9505
3 7 -1.8691 15 19 -1.9574
4 8 -1.8852 20 24 -1.9702
5 9 -1.8984 25 29 -1.9795
7 11 -1.9175 30 34 -1.9865
9 13 -1.9315 40 44 -1.9975
11 15 -1.9421
Считаем q = q(s) = s + 4 и r = 4. Проведем численные расчеты с использованием формул (5.2) и (5.3), увеличивая номер s . В таблице 2 представлены результаты вычислений.
Вычислительный эксперимент иллюстрирует, что I (wS_2( ), XS_4 ( )) —— inf I(u, x) = -2 при s — ¥ . □
Заключение
Основным результатом данной статьи является демонстрация возможности построения минимизирующих последовательностей и их специфики в системах, где условие Фробе-ниуса не выполняется. Исследование основано на известном методе расширения исходной задачи до производной задачи [7], а также на предложенном в работах [11 - 13] подходе к построению допустимых в исходной системе траекторий предельной системы общего типа.
В статье рассмотрена ситуация, когда интеграл предельной системы выписывается в явном виде, что не всегда возможно. Перспективным является исследование ситуации с неявным описанием орбиты по аналогии с [7, 14]. В общем случае решение производной задачи будет находиться итерационно некоторым методом, работающим в невырожденных задачах. Поэтому в перспективе разработка итерационного метода улучшения управлений в терминах исходной задачи.
Литература
1. Кротов В.Ф. Разрывные решения вариационных задач // Изв. вузов. Математика. - 1961. - № 1. -С. 86 - 98.
2. Кротов В.Ф., Букреев В.З., Гурман В.И. Новые методы вариационного исчисления в динамике полета. - М.: Машиностроение, 1969.
3. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. - М.: Наука, 1973.
4. Гурман В.И. Об оптимальных процессах с неограниченными производными // Автоматика и Телемеханика. - 1972. - № 12. - С. 14 - 21.
5. Габасов Р., Кириллова Ф.М. Особые оптимальные управления - М.: Наука, 1973.
6. Гурман В.И. Вырожденные задачи оптимального управления. - М., Наука, 1977.
7. Гурман В.И. Принцип расширения в задачах управления. - М.: Наука, Физматлит, 1985, 1997.
8. Батурин В.А., Урбанович Д.Е. Приближенные методы оптимального управления, основанные на принципе расширения. Новосибирск: Наука, 1997.
9. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление. - М.: Физматлит, 2000, 2003.
10. Миллер Б. М., Рубинович Е. Я. Оптимизация динамических систем с импульсными управлениями.
- М.: Наука, 2005.
11. Гурман В.И., Сачков Ю.Л. Представление и реализация обобщенных решений управляемых систем с неограниченным годографом // Автоматика и телемеханика. - 2008. - № 4. - С. 72-80.
12. Гурман В.И. Преобразования управляемых систем для исследования импульсных режимов // Автоматика и телемеханика. - 2009. - № 4.
13. Гурман В .И. Траектории импульсных режимов управляемых систем // Известия Иркутск. гос. унта. Сер. матем. - 2009. - Т. 2. № 1. (URL: http://isu.ru/izvestia).
14. Аграчев А.А., Сачков Ю.Л. Геометрическая теория управления. - М.: Физматлит, 2005.
References
1. Krotov V.F. Discontinuous solutions of variation problems // Izvestiya vuzov. Ser. Math. - 1961. - No. 1. - P. 86 - 98. (In Russian).
2. Krotov V.F., Bukreev V.Z., Gurman V.I. New methods in calculus of variations for flight dynamics. -М.: Mashinostroenie, 1969. (In Russian.)
3. Krotov V.F., Gurman V.I. Methods in problems of optimal control. - М.: Nauka, 1973. (In Russian).
4. Gurman V.I. On the optimal processes with unrestricted derivatives // Avtomatika i Telemekhanika. -1972. - No. 12. - P. 14 - 21. (In Russian).
5. Gabasov R.F., Kirillova F.M. Particular optimal controls. - М.: Nauka, 1973. (In Russian).
6. Gurman V.I. Degenerate optimal control problems. - М., Nauka, 1977. (In Russian).
7. Gurman V.I. The extension principle in control problems. - M., Nauka, Fizmatlit, 1997. (In Russian).
8. Baturin V.A., Urbanovich D.E. Approximate methods of optimal control, based on the extension principle. Novosibirsk: Nauka, 1997. (In Russian).
9. Dykhta V.A., Samsonyuk O.N. Optimal impulse control. - М.: Fizmatlit, 2000, 2003. (In Russian).
10. Miller B.M., Rubinovich E.Ya. Optimization of dynamic systems with impulse controls. - М.: Nauka, 2005. (In Russian).
11. Gurman V.I., Sachkov Yu.L. Presentation and realization of generalized solutions of control systems with unrestricted hodograph // Avtomatika i Telemekhanika. - 2008. - No. 4. - P. 72-80. (In Russian).
12. Gurman V.I. Transformation of control systems for investigation of impulse rates // Avtomatika i Tele-mekhanika. - 2009. - No. 4. (In Russian).
13. Gurman V.I., Ni Ming Kang. Trajectories of impulse rates of control systems // Izvestia of Irkutsk State Univ. Ser. Math. - 2009. - Vol. 2. No. 1. (URL: http://isu.ru/izvestia). (In Russian).
14. Agrachev A.A., Sachkov Yu.L. Geometric theory of control. - М.: Fizmatlit, 2005. (In Russian).