Серия «Математика»
Том 2 (2009), №1, С. 83-93
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 518.517
Метод слабого улучшения первого порядка для задач оптимального управления логико-динамическими системами *
В. А. Батурин
Институт динамики систем и теории управления
Н. С. Малтугуева
Институт динамики систем и теории управления
Аннотация. В статье рассматривается задача оптимального управления логикодинамическими системами. Для поставленной задачи получен алгоритм слабого улучшения первого порядка, доказана теорема о неулучшаемом элементе.
Ключевые слова: оптимальное управление, логико-динамические системы, достаточные условия оптимальности.
Логико-динамические системы представляют собой особый класс дискретно-непрерывных по времени управляемых систем. В этих системах дискретная компонента это целочисленная функция, имеющая конечное число точек разрыва. Таким образом, задачи оптимального управления логико-динамическими системами имеют ряд существенных отличий от обычных задач оптимального управления. Во-первых, в правых частях дифференциальных уравнений и функционале имеются целочисленные переменные, во-вторых, дискретные переменные могут изменять свое значение в конечном числе точек по времени, и это число может быть зафиксировано.
В данной статье выводится метод слабого улучшения первого порядка для решения задач оптимального управления логико-динамическими системами. Построение этого метода ведется на основе достаточных условий оптимальности [1], [2], аналогичных условиям оптимальности
* Работа выполнена при финансовой поддержке РФФИ, грант 08-01-00156а.
1. Введение
В.Ф. Кротова для классических задач оптимального управления [3], [4]. У полученного алгоритма исследовано свойство релаксационности.
Во втором и третьем разделах данной работы приведена постановка задачи оптимального управления логико-динамическими системами и достаточные условия оптимальности. Метод слабого улучшения первого порядка выводится в четвертом разделе, а теорема о неулучшаемом элементе рассматривается в пятом разделе статьи. Далее приведен модифицированный алгоритм и пример, иллюстрирующий работу этого алгоритма.
2. Постановка задачи
Рассмотрим фиксированный отрезок времени Т = [¿о,^]- На Т заданы кусочно непрерывная функция и(£), непрерывная и кусочно дифференцируемая функция ж(£), целочисленная кусочно постоянная и непрерывная справа функция у(£) с конечным числом точек разрыва. Будем считать, что в данный момент времени у(£) имеет только один скачок. Функции подчиняются следующей динамической системе
— = / (i,x(i),y(i),u(i)), (2.1)
y(t) € Y(t,x(t),y(t - 0)), (2.2)
u(t) € U, t € T, (2.3)
x(to) = Xo, y(to - 0) = yo, (2.4)
где x(t) € Rn, y(t) € Q С Zn, x0 € Rn и y0 € Q. Здесь множество Q
- конечное множество состояний логической части системы, Y : T х Rn х Q ^ 2П - соотношение описывающее логику перехода дискретной компоненты, U С Rm - компактное множество, функция / кусочно непрерывна по t, непрерывна по x и u вместе с частными производными для каждого y € Q. Процесс (x(t), y(t), u(t)) называется допустимым, если он удовлетворяет условиям (2.1)-(2.4), множество таких процессов назовем множеством допустимых и обозначим через D, предполагается, что D = 0. Рассмотрим следующую задачу оптимального управления:
¿1
I (x(-),y(-),u(-)) = F (x(ti),y(ti))+У / 0(t,x(t),y(t),u(t))dt+
¿0
+ ^g0(t,x(t),y(r),y(r - 0)) ^ min, (2.5)
T
при ограничениях (2.1)-(2.4). Здесь F : Rn х Q ^ R непрерывна по x, /0 : T х Rn х Q х Rm ^ R кусочно непрерывна по t, непрерывна по x и u, g0 - ограничена, т пробегает по множеству точек переключения.
МЕТОД СЛАБОГО УЛУЧШЕНИЯ 3. Достаточные условия оптимальности
Пусть Ф - класс функций <^(t, ж, у) непрерывных в (t, ж) вместе со своими частными производными по t и ж. Введем следующие конструкции:
R(t, ж, у, u) = ^X(t, ж, y)f (t, ж, у, u) — f 0(t, ж, у, u) + <^t(t, ж, у),
G(x, z) = F (ж, z) + ^(ti, ж, z) — <^(to, жо, уо),
Q(t, ж, у, v) = <^(t, ж, у) — <^(t — 0, ж, v) — g0(t, ж, у, v), u(t) = supmax max max Я(^ж,у,и),
x veY- yeM(t,x,v) «eU
q(t) = sup max max Q(t, ж,у, v), ж veY- yeY(t,x,v)
m = inf min С(ж, z), x zeYf- V
где M (t, ж, v ) = < у : у = arg max Q(t^,y,v)>; Y_ = Y (т, ж(т ),у(т — [ yeY (t,x,v) J
0)); т это точка разрыва функции у( ■ ); Yf- = Y(ti, ж(^), y(t1 — 0)); ^( ■ ) -
кусочно непрерывная, а q( ■ ) - кусочно постоянная функция на отрезке
T; z = у(t 1), у = y(t), v = y(t — 0), t € [to, ti].
Рассмотрим функционал Лагранжа
ti
Дж(■ ),у( ■ ),u( ■ )) = С(ж(^),y(ti)) — J R(t,ж(^,у(^,и(^)^—
to
ti
— J Q(t^(t),y(t),y(t — 0))d6»(t), (3.1)
to
где 0(t) - монотонная функция скачков в конечном числе точек разрыва функции y(t). В каждой точке т величина скачка равна 1: 0(£) = 0(£ — 0) + 1. Заметим, что на множестве допустимых выполняется равенство
I = L.
Теорема 1. Пусть имеется последовательность {(ж.,, ys, us)} С D и функция <^(t, ж, у) такие, что: ti
1. J (R(t, ж8(t),ys(t),Us) — ^(t)) dt ^ 0,
to
ti ti
2^Q(t, жД^у.,(t),ys(t — 0))d6>(t) — У q(t)dt ^ 0;
to to
3. С(ж8(^), ys(t1)) ^ m, при s ^ то.
Тогда последовательность {(ж8, у8,и8)} - минимизирующая, и всякая минимизирующая последовательность удовлетворяет условиям 1-3.
Следствие 1. Пусть (ж*(£), у*(£), и*(£)) Є Если существует функция ^(¿, ж, у) Є Ф такая, что:
1. ^(¿, ж*(£), у*(£), и*(£)) = ^(¿) для всех £ Є [¿о, ¿і];
2. ^(¿, ж*(/), у*(/), у*(£ — 0)) = д(£) для всех £ Є [£0, £1];
3. с(ж*(іі),у*(іі)) = т;
тогда процесс (ж*(£), у*(£), и*(¿)) доставляет минимум функционалу I на
4. Метод слабого улучшения первого порядка
Относительно постановки задачи сделаем предположение, что U = Rm. Пусть и1 = (x1 (t),y7(t),u7(t)) - заданный допустимый процесс, и = (x(t), y(t), u(t)) - процесс, который совпадает с и1 на временном подин-тервале [t0,£], £ € [t0,t1).
Пусть
ti
L5’*1 (x(■ )),y( ■ ),u( ■ ) = G(x(ti),y(ti)) - J R(t,x(t),y(t),u(t))dt-
5
ti
-J Q(t,x(t),y(t),y(t - 0))d9(t),
H(t,x,y,p,u) = p'/(t,x,y,u) - /0(t,x,y,u), p € Rn.
Рассмотрим разложение функций G(x(ti), y(ti)), Q(t, x(t),y7(t),y(t-0)) в ряд Тейлора по x, а функции R(t,x(t),y(t),u(t)) по x и u до слагаемых первого порядка:
G(x(ti),y(ti)) = G(xJ(ti),y(ti)) + Gx(xJ(ti),y(ti))'Ax + oi(| Ax|), (4.1)
Q(t, x(t), y(t), y1 (t - 0)) = Q(t, x1 (t), y(t), y(t - 0))+
+Qx(t,x1 (t), y(t), y(t - 0))'Ax + 02(|Ax|), (4.2)
R(t, x(t), y(t), u1 (t)) = R(t,x7 (t),y(t),u7 (t))+
+Rx(t, x1 (t), y(t), u1 (t))'Ax + Ru(t, x1 (t), y(t), u1 (t))' Au + o3(|Ax, Au|)
(4.3)
Потребуем, чтобы выражения (4.1)-(4.3) не зависели от Ax, т.е.
Gx(xJ(ti), y(ti)) = 0, Qx(t, x1 (t), y(t), y(t - 0)) = 0,
(¿),у(^),и/ (¿)) = 0,
получим
Н^ж1 (¿), у(^), р, и1 (¿)) + (¿,ж/ (¿),у(£)) =0, (4.4)
(ж1 (¿1),у(^1)) + ^х(^1,ж/ (¿1),у(^1)) =0, (4.5)
^х(^,ж/(¿),у(£)) - <£*(* - 0, ж1 (¿),у(£ - 0)) - £0(¿,ж/(*),у(^),у(^ - 0)) = 0,
(4.6)
где р = ^х(^,ж/(¿), у(^))-
Функцию ^(¿, ж, у) будем искать в классе линейных, т.е. ^(¿, ж, у) = ^'(¿,у)(ж - ж1 (¿)), где ^(¿, у) - вектор-функция размерности п, кусочно дифференцируемая по ¿. Тогда соотношения (4.4)-(4.6) примут вид
^(¿, У(^)) = -Нж(^, ж1 (¿), у(£),^(£, у(£)), и1 (¿)), (4.7)
^(¿1,У(^1)) = (ж1 (¿1), у(*1>), (4.8)
^ у(^)) - ^- ° у(^- 0)) = #0 (^ ж/ (^ у(^ у(^- 0)). (4.9)
Заметим, что Яи(£, ж, у, и) = Ни(£, ж, у, ^(¿, у), и), тогда пусть
й(£, у(£)) = и1 (¿) + аАи, где Аи = Яад(£, ж1 (¿), у(£), ^(¿, у(£)), и1 (¿)).
(4.10)
Для определения нового состояния логической части системы на [£, ¿1] решим задачу:
у(£,ж(£)) = а^ тах Ж^^у^й^)). (4.11)
у€У (*,ж(*),у(*-0))
Причем, в точках разрыва максимум функции Я(£, ж(^), у(¿), -й.(^)) ищется при дополнительном условии:
^(¿, ж(^),у(^, ж(£)), у(£ - 0, ж(£ - 0))) > ^(¿, ж(£), у1 (¿), у1 (£ - 0)), (4.12)
А в точке ¿1 требуется выполнение неравенства:
С(ж(^), у(^1, ж(^))) < С(ж(^), у1 (¿1)). (4.13)
Итак, сформулируем полученный алгоритм.
Алгоритм 1. 1. Задаются и1 (¿),у7(¿) и из системы (2.1) с началь-
ным условием ж (¿о) = жо находится ж1 (¿). Тогда и1 (¿) = (ж1 (¿), у1 (¿),
и/ с^.
2. На интервале [£,¿1] для всех у интегрируется система (4.7)-(4.9), где £ € [¿о, ¿1].
3. Задается и(£,у(£)) по формуле (4.10), £ € [£, ¿1]
4. Функция у(^, ж(^)) ищется из решения задачи (4.11)—(4.13), тогда пусть й(г,ж(г)) = -й.(^, ¿/(¿, ж(^))).
5. Интегрируется система
= /(t,ж(t),jj(t,ж(t)),й(t,ж(t)), ж(£) = ж1 (£ - 0), г € [£,¿1].
6. Параметр а ищется из решения задачи минимизации функционала I(ж(£),у(£),и(£)), при £ € [£, ¿1].
7. Новый процесс и11 (¿) = (ж11 (¿),у11 (¿),и11 (¿)) задается как
т//(/) = Г ж/^ £ € ^о^ г/(/) = Г у1 £ € [£о,£)
() \ ж(«), * € [£,¿1], () \ у^ж^)), * € [£, ¿1 ],
и11 ф = { и/Ю, * є [¿о,£),
ж(£)), і є [£,¿і].
8. Начальный процесс задается как и1 (¿) = и11 (¿) и процедура повторяется со второго шага.
5. Теорема о релаксационности
Для алгоритма первого порядка неулучшаемым процессом является процесс, удовлетворяющий условию стационарности, т.е. процесс (Х(і), у(і),и(і)) неулучшаемый, если Ни(ж(£),у(£),^(¿,у(£)),й(£)) = 0.
Для алгоритма слабого улучшения доказана теорема о неулучшае-мом элементе.
Теорема 2. Пусть и1 (¿) = (ж1 (¿),у7(¿),и7(¿)) - допустимый управляемый процесс, ^(ж, у) - непрерывна и дифференцируема по ж, функция Н(¿,ж,у,р, и) - непрерывна и непрерывно-дифференцируема по ж и не выполняется условие стационарности, тогда алгоритм, определяет новый допустимый процесс и11 (¿) = (ж11 (¿),у17(¿),и17(¿)) такой, что I(и11) < I(и1).
Доказательство. Если условие стационарности не выполняется, то алгоритм всегда определяет новый допустимый процесс и11 (¿) = (ж11 (¿), у11 (¿),и7/(¿)). Докажем неравенство I(и11) < I(и1).
Рассмотрим приращение функционала (2.5). Учитывая, что на В функционалы I и В равны, приращение имеет вид:
Д!(ж(і),у(і),и(і)) = I(ж11 (¿),у17(¿),и7/(¿)) - I(ж1 (¿)У (¿),и7(¿)) = = ¿(ж11 (¿),у11 (г),и7/ (¿)) - ¿(ж1 (¿),у1 (¿),и1 (¿)) =
^(ж11 (¿і), у11 (¿і)) - ^(ж1 (¿і), у1 (¿і))-
Л(£, ж11 (¿), у11 (¿), и11 (¿)) - ^(¿, ж1 (¿), у1 (¿), и1 (¿))
- / ф(*, ж11 (¿), у11 (¿), у11 (* - 0)) - ф(*, ж1 (¿), у1 (¿), у1 (* - 0)) ^(¿)
..II
1п\ Iс
На отрезке [£,¿1] функция у11 (¿) ищется из решения задачи (4.11), а значит, имеет место неравенство: Я^ж11 (¿),у11 (¿),и11 (¿)) > Я^ж11(¿), у1 (¿^и11(¿)), тогда
А1 (ж^у^),«^)) < ^ж11(¿1), у77 (¿1)) - С(ж7 (¿1),у7 (¿1))-
II с
*1
Я^, жII(¿), yI(¿), и11(¿)) - Я(^ ж1 (¿), у1 (¿), и1 (¿))
*1
£(*, жII(¿), у11(¿), yII(* - 0)) - ф(*, ж1 (¿), у1 (¿), у1 (* - 0)) ^(¿).
1^\ „.I/
А в точках скачка дополнительно требовалось выполнение неравенства (4.12), таким образом О^, ж11(¿^у11(¿^у11^ - 0)) > О^ж11(¿^у1(¿), yI ^ - 0)), откуда следует, что
Д1 (ж^у^),«^)) < ^ж11(¿^у11(¿1)) - ^ж1(¿^у1(¿1))-*1
Я^, ж11(¿), у1 (¿), и11 (¿)) - Я^, ж1 (¿), у1 (¿), и1 (¿))
.II
*1
-/ О^ж11(¿^у1(¿^у1(* - 0)) - О^ж1 (¿), у1 (¿), у1 (* - 0)) ^(¿).
И при t = ¿1 выполняется неравенство (4.13), т.е. ^ж11(¿^у11(¿1)) < С (ж11(¿^у1(¿1)), и значит выполняется:
Д1 (ж^у^),«^)) < ^ж11(¿^у1 (¿1)) - б^ж1 (¿^у1 (¿1))-
*1
- / Я^, ж11^), у1^), и11 (¿)) - Я^ж1 (¿^у1 (¿^и1 (¿)) ^-
.II
*1
J д^ж11 (¿),у1 (¿),у1 (*- 0)) - о^ж1 (¿),у1 (¿),у1 (* - 0)) ^(¿)
Воспользуемся разложениями (4.1)—(4.3) и условиями на Сх(ж1 (¿1), у1 (¿1)), Ях(¿,ж1 (¿),у1 (¿),и1 (¿)), Ох^ж1 (¿),у1 (¿),у1 ^ - 0)). Тогда получим следующую оценку:
*1
Д1 (ж^у^),«^)) < 01(1 Аж|) - J 02(|Дж!)^^)-
*1
я„(*, ж1 (¿), у1 (¿), ^(¿, у1 (¿)), и1 (¿))'Ди + оз(| Дж, Ди|)
*1 *1
= оі(|Дж|) - J о^ДжІ)^^) - J о3(|Дж, Ди|)^-
*1
- I Н^, ж1 (¿), у1 (¿), ^(¿, у1 (¿)), и1 < 0.
А значит верное неравенство: I(и11) < I(и1). □
6. Модифицированный алгоритм
Рассмотрим случай, когда функция Кротова р не зависит от у(£). Это возможно, когда функции /, /0, ^ и д0 не содержат слагаемых, в которых есть произведение вида жга(£)ут(£). Тогда система (4.7)—(4.9) примет вид:
■0*(£) = -Яж(і,ж/ (^у^),^),^ (¿)), (6.1)
^(¿і) = -^(ж1 (¿і)), (6.2)
^(¿)- ^- 0) = дХ& ж1 (^ у(^ у^- 0))- (6.3)
Алгоритм 2. 1. Задаются и1 (¿),у7(¿) и из системы (2.1) с началь-
ным условием ж (¿о) = жо находится ж1 (¿). Тогда и1 (¿) = (ж1 (¿), у1 (¿), и1 (^.
2. На интервале [£,¿1] интегрируется система (6.1)-(6.3), где £ Є [¿о, ¿і].
3. Задается й(і,у(і)) по формуле (4.10), £ Є [£, ¿1]
4. Функция у(і,ж(і)) ищется из решения задачи (4.11)-(4.13), тогда пусть й(і,ж(і)) = й(і, у(і, ж(і))).
5. Интегрируется система
^ = /(¿,ж(і),у(і,ж(і)),й(і,ж(і)), ж(£) = ж1 (£ - 0), і Є [£,¿1].
6. Параметр а ищется из решения задачи минимизации функционала I(ж^), у(^, и(^), при t Є [£, ¿1].
7. Новый процесс и11 (¿) = (ж11 (¿),у17(¿^и11(¿)) задается как
ж//(/) = / ж1 ^ Є ^о^ г/(/) = І у1 (^ і Є [І0,£)
() \ ж(г), г Є [£,¿1], () \ уС*,ж(*)), * Є [£,¿1 ],
(/) = / иї(^ Є [^£),
( ) \ и(^ ж(^), t Є [£, ¿1].
8. Начальный процесс задается как и1 (¿) = и11 (¿) и процедура повторяется со второго шага.
7. Пример
Требуется минимизировать функционал:
1 (ж( ■ ),у( ■ ),u( ■ )) = 2 x2(l)
при следующих ограничениях
x = u + y, t Є T = [0,1], (7.1)
x(0) = 4.5, |u| < 1,
y(t) Є Y(t,x(t),y(t - 0)), y(-0) = 0,
Y(tx(t)0) = í {0, -1}, X(t) > 4,
( , X(t) , 0) \ {0 , -1 , -3} , x(t) < 4 ,
Y(t,x(t), -1) = {-1}, Y(t,x(t), -3) = {-3}.
Для того, чтобы снять ограничения на u(t), перепишем систему (7.1) в следующем виде:
x = sinv + y, t Є T = [0,1],
Для решения применим Алгоритм 2. В качестве начального приближения выберем y1 (t) = 0, v1 (t) = 0, тогда соответствующая траектория
непрерывной части системы — x1 (t) = 4.5. На первом шаге возьмем
£ = 4, далее на каждой итерации £ уменьшается на 4. После трех
итераций получим:
v'V(t)={-п,t Є Si’ y1V(t)={°-1,t Є S’ü
XIV(() = /4'5’ * е 1 >■
Х (1) = \ -2* + 5, * € [4,1].
На четвертой итерации (при £ = 0) имеем ■?;(*) = —3а. Решая на этой итерации задачу максимизации К по у получим две точки локального максимума:
у~1(*) = {—3, * € [^дь гДе **: х(*+) =4
и у2(*) = —1,* € [0,1].
Найдем соответствующие траектории:
4.5 — t sin3a, t Є [0, t*), ,* _ 1
4.5 + 2s¡3за — (sin3a + 3)t, t Є [t*, 1], Д 2 sin3a’
x2(t) = -(sin 3a + 1)t + 4.5, t € [0,1].
Далее найдем значения функционалов для каждого процесса:
3
i (xi’y'i’v ) _ 2
— sin 3a + 1.5 +
2 sin 3a
12
I(x2,y2,v ) = 2 [- sin3a + 3.5]
Решив задачу минимизации каждого функционала по a получим, что и для того и для другого случая a = 6, таким образом I(Xi,yi,i)) = 2, I(Х2, y2, v) = 3.125. Итак, получили следующий процесс:
(t)=*(t)={6-í I | 1); (t)=*w={-з, í І [0,1[’
vV(í) = v(í) = -2, t є [0,1].
Как показано в [5], данный управляемый процесс является оптимальным.
Список литературы
1. Бортаковский А. С. Достаточные условия оптимальности управления непрерывно-дискретными системами / А. С. Бортаковский, А. В. Пантелеев // Автоматика и телемеханика. — 1987. — № 7. — C. 47-52.
2. Бортаковский А. С. Достаточные условия оптимальности управления детерминированными логико-динамическими системами / А. С. Бортаковский // Информатика, сер. Автоматизация проектирования. — 1992. — вып. 2-3. — C. 16-22.
3. Krotov V. F. Global Methods in Optimal Control Theory / V. F. Krotov. — Monographs and Textbooks in Pure and Applied Mathematics, Marcel Dekker Inc., New York, 1996.
4. Батурин В. А. Приближенные методы оптимального управления, основанные на принципе расширения / В. А. Батурин, Д. Е. Урбанович. — Новосибирск: Наука, 1997. — 175 с.
5. Пантелеев А. В. Теория управления в примерах и задачах / А. В. Пантелеев, А. С. Бортаковский. — М.: Высшая школа, 2003.
V. A. Baturin, N. S. Maltugueva
A first order method of weak improvement for optimal control problems in logic-dynamic systems
Abstract. In this paper, an optimal control problem in logic-dynamic systems is considered. A first order algorithm of weak improvement has been obtained, a theorem on unimprovable element has been proved.
Keywords: optimal control, logical-dynamic systems, sufficient optimality conditions.
Батурин Владимир Александрович, доктор физико-математических наук, профессор, Институт динамики систем и теории управления СО РАН, 664033, г. Иркутск, ул. Лермонтова, 134, ([email protected])
Малтугуева Надежда Станиславовна, Институт динамики систем и теории управления СО РАН, 664033, г. Иркутск, ул. Лермонтова, 134, ([email protected])
Baturin Vladimir, Institute of System Dynamics and Control Theory, 134, Lermontov St., Irkutsk, 664033 professor, ([email protected])
Maltugueva Nadezhda, Institute of System Dynamics and Control Theory, 134, Lermontov St., Irkutsk, 664033, ([email protected])