УДК 517.977
Е. А. Трушкова
Улучшение управления в одном классе систем с линейным неограниченным управлением
Аннотация. Описан класс задач улучшения управления, преобразуемых явно к аналогичной задаче меньшего порядка с ограниченным управлением (производной задаче), что позволяет осуществить аналитически или с помощью итерационных методов поиск эффективного начального приближения для исходной задачи улучшения. Предложен численный алгоритм на основе общего метода Кротова глобального улучшения управления. Рассмотрено его приложение к управляемым квантовым системам о примерами.
Ключевые слова и фразы: оптимальное управление, улучшение управления.
Введение. Постановка задачи
Различные итерационные методы улучшения управляемых процессов— обширная область исследований и разработок в теории оптимального управления, нацеленных на эффективное решение практических задач. Исторически развитие этих методов началось одновременно с созданием современной теории оптимального управления.
Метод глобального последовательного улучшения управления был предложен и получил дальнейшее развитие в [1-4] и ряде других работ. Этот метод обладает рядом преимуществ перед широко применяемыми методами локального улучшения процессов (например, отсутствием настроечных коэффициентов, меньшей зависимостью от начального приближения, реализацией посредством единственной пары прогонок и др.).
В работе рассматривается применение метода глобального улучшения к решению класса задач оптимального управления
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 09-01-00170-а).
© Е. А. Трушкова, 2011
© Программные системы: теория и приложения, 2011
(1)
(2) x(to) = xo,
(3) F (x(tp)) ^ min,
где D — диагональная невырожденная n х n матрица с элементами d1,... ,dn € М1 на главной диагонали. Здесь x(t) € М2п — непрерывная, кусочно-гладкая фазовая траектория, u(t) € R1 — кусочнонепрерывное неограниченное управление.
Задача улучшения управления в задаче (1)—(3) состоит в следующем. Пусть задана допустимая пара (x1 (t),uT(t)). Требуется найти допустимую пару (x11 (t),u11 (t)), для которой справедливо неравенство F(x11 (tp)) < F(x1 (tp)). Решая эту задачу итерационно, можно получить улучшающую, в частности, минимизирующую последовательность {xs(t),us(t)}. Однако, применение численных итерационных методов улучшения (например, метода глобального улучшения Кротова) затрудняют отсутствие ограничений на управление и проблема выбора начального управления u(t). На практике приходится ставить и затем варьировать в многочисленных вычислительных экспериментах принудительное ограничение на управление (например, в виде |u(t)| < const) и начальное управление.
Особенностью класса задач (1)-(3) является возможность явного преобразования исходной задачи улучшения к задаче улучшения управления для системы меньшей размерности с ограниченным управлением, что позволяет осуществить аналитически или с помощью итерационных методов улучшения управления поиск качественного начального приближения для исходной задачи улучшения.
1. Преобразование к системе с ограниченным управлением
Воспользуемся методом преобразования исходной системы к производной [5,6], который позволяет свести задачу улучшения начального управления для системы (1) к производной задаче меньшего порядка. Для этого найдем y = n(t, x) = (г/1,..., r/2n-1) — совокупность независимых первых интегралов системы дифференциальных уравнений
dx ( 0 D \
dr у — D 0 )
Имеем
y = rf(x) = (xi)2 + (xn+t)2, i = 1, n,
, 1 xj + 1 1 x1 ________
yn+j = arccos y+ñ — arccos yl, j = 1,n — 1
Тогда с помощью замены переменных x1 = x1(y, в) = /y1 cos(d1e), xn+1 = xn+1(y, в) = /y1 sin(d10),
xl = xl(y, в) = /y cos (dl(e + yn+i-1)) , в € [—п, п],
xn+i = xn+i(y, в) = /y sin (di(e + yn+i-1)) , i = 2~n, исходная задача (1)—(3) переходит в задачу для производной системы
y = g(t,y,e), t € [to,tF],
y € R2n-1, в € [—п,п],
(4) y(to) = n(x(to)),
F (y(tF)) = min F (x(y(tF),в)) ^ min,
ве[-п,п]
где в(Ь) — кусочно-непрерывное управление,
91(t,y^) = 2/у1 (f 1(t,x(y,в))cos(d1в) + fn+1(t,x(y,в))sin(d1в)) ,
gj+1(t, y, в) = 2/yj+1^fj+1(t, x(y, в)) cos (dj+1(в + yn+j)) +
+fn+j+1(t, x(y, в))sin (dj+1(в + yn+j))
fn+j+1(t, x(y, в)) cos (dj+1 (в + yn+j))
'f'+’ (^в)-
—fj+1(t, x(y, в)) sin (dj+1(e + yn+j))
dj+1 \J yj+1
fn+1(t, x(y, в)) cos(d1e) — f 1(t, x(y, в)) sin(d1e)
i = l,n — 1.
^л/у1
Если присоединить уравнение
ь ¡п+1(г,х(у,в))со&(^1в) - / 1(г,х(у,в))ат^1в)
(5) в=----------------------------¿177---------------------
с начальным условием в(Ьо) = во(хо), то получится представление исходной системы в новых фазовых переменных у1,..., у2п-1, в вместо
1 2п
прежних х ,. .. ,х .
Для решения полученной задачи улучшения управления можно воспользоваться методом глобального улучшения [7]. А именно, для
начального допустимого процесса (y1 (t),0I(t)) найдем <p°(t,y) из соотношений
g(t, У, О1 (t)) + <ft = 0, v(tF, y) = F(y).
Найдем функцию 0(t,y) согласно формуле
0(t,y) = arg max (<p°yTg(t,y,0) + <p°t ).
вЄ[-п,п] y
Замкнув полученной функцией управляемую систему (4), найдем улучшенный допустимый процесс (y11 (t),0I1 (t)). Повторим шаги алгоритма.
Для задачи улучшения (1)—(3) в качестве начального приближения можно выбрать аппроксимацию полученного процесса (y11 (t),
О11 (t)) с помощью допустимых процессов исходной задачи (1)—(3) [6]. При этом может оказаться весьма полезным ранее отброшенное уравнение (5), выражающее связь управления u(t) в исходной системе и управления 0(t) в производной системе.
2. Улучшение управления для квантовых систем
К рассматриваемому классу задач относятся актуальные квантовые системы с управлением [3,4]. Для них система (1) имеет компактное представление в виде комплексного уравнения, представляющего собой конечномерный аналог основного уравнения квантовой механики (уравнения Шредингера в частных производных)
Ш = IHw,
где I — мнимая единица, H = Hi + IH2 — комплексный линейный самосопряженный оператор, ш = а + Ip — комплексный вектор фазовых переменных, а, в Є К”. Выделяя в этом уравнении вещественную и мнимую часть, получаем систему
а = —H2a — H\p, в = H\a. — H2P.
При Hi = —Pa — uPb, где Pa, Pb — произвольные симметричные матрицы, u(t) Є К1, H2 = 0 эта система имеет вид управляемой гамильтоновой системы
(6) а = (Рa + uPb )P, P= —(Pa + uPb )а.
Система (6) имеет динамический инвариант
f (ш) = ||ш||2 = ||а||2 + ЦРУ2 = ат а + pT p = const,
т. е. все траектрии системы (6), независимо от выбора управления и(і), расположены на сфере с центром в начале координат (для любого допустимого и(і) справедливо )|| = ІІ^(іо)Ц).
Поставим задачу улучшения управления для гамильтоновой системы (6), обозначив г = (г1, .. ., г2п) = (а1,. .., ап, в1, .. ., @п),
(7)
0
Ра
-Ра 0
+ и
0
Рв
-Рв 0
г, і Є [¿о, ¿р],
(8)
г(іо) = го,
(9)
Бо(г(іР)) ^ тіп .
Так как для симметрической матрицы Рв существует невырожденная матрица М, приводящая ее к диагональному виду
М -1Рв М = Б,
то система (7) может быть приведена к системе (1) с помощью линейного невырожденного преобразования г = Мх = ^ М 0 ^ х.
Тем самым показано, что задача улучшения управления (7)—(9) эквивалентна задаче улучшения управления (10) _ _
. ( О М-1РлМ \ ( 0 Б \ и !
х = \ ~ ~ х + ~ их t € 1гпЛр
I -М-1РлМ 0 I -Б 0 Ь
(11)
х(іо) = хо,
(12)
Б (х(іР)) = Бо(Мх(іР)) ^ тіп,
или, что тоже самое, эквивалентна задаче улучшения управления
(1)-(3) при /(і,х) =
0
М-1РаМ
х. Без ограничения
ч -М-1РлМ 0
общности можем считать, что матрица Б невырождена (в противном случае рассматривали бы систему меньшего порядка).
3. Примеры
Пример 1. Рассмотрим задачу оптимального управления (10)
( 0 0 ... 0 ь \
0 0 ... ь 0
(12) при Рв = Еп, т. е. ¿г = 1, г = 1,п, Рл =
0 b ... 0 0
\ b 0 ... 0 0 )
be R1.
C помощью замены переменных x1 = x1 (y, в), i = 1, 2n, предложенной в п. 2, с учетом справедливости равенств
fi(t, x) = bx2n-i+1, fn+i(t, x) = -bxn-i+1, i = T~n,
рассматриваемая задача оптимального управления переходит в задачу оптимального управления для производной системы (4), где
g1(t,y,e) = 2b^y1yn sin y2n-1, gi+1(t, y, в) = 2b^yi+1yn-i sin(y2n-i-1 - yn+i), i = l,n - 2, gn(t,y,e) = -2b^y1yn siny2n-1,
/ У/П і yin
gn+i(t, y, в) = -bJ L cos(y2n-i-1 - yn+i) + bJZj cos y2n-1,
V yi+1 V y
g2n-1(t, y, в) = b (Ж - M) cos y2n-1.
yl y1 V yn )
Поскольку выражения для g фактически не зависят от в, то производная система становится неуправляемой, и исходная задача вырождается в задачу минимизации функции одной переменной
F (x(y(tF),в)) ^ min ,
9Є[ — 7Т,7г}
где y(t) — решение задачи Коши
y = g(y), y(to) = n(x(to)), t Є [to,tF].
Обозначим вр = arg min F (x(y(tP), в)), тогда исходная задача оп-
ве[-п,п]
тимального управления сводится к поиску функции u(t), обеспечивающей существование функции в(Ь), которая подчинена системе ра-
e(t) = —b\ ynjtlcos:y2n 1 — u(t), t Є [to,tF], y1(t)
в (¿о) = во = во(хо), в(ір) = вр, в (¿) Є [-п, п].
Таких функций и(і) очевидно бесконечно много. Выберем одну из них посредством выбора функции в(і), а именно, положим
п/.\ вр - во во<р - вр ¿о т~ -іі-к < + ір - <0 •
Тогда функцию и(<), доставляющую минимум функционалу Б(х(<р)), можно взять в виде
лл I, yn(t) ~2n — 1 вF - в0
u(t) = -b\ cos ТУ - ---7- •
У У (t) tF — to
Например, решим задачу оптимального управления при n = 2, b = 1, to = 0, x(t0) = (1,1, 0,0)T, F (x(tF)) = x1(tF)x2(tF) ^ min. В этом случае для определения функции y(t) следует решить задачу
Коши ____
y1 = 2у7y1y2 sin y3, y2 = -2\Jy1 y2 sin y3,
у3 = - 'fyP) cos у3,
y(0) = (1,1,0)T •
Получим y1(t) = 1, íy2(t) = 1, y¡3(t) = 0. Найдем в0 = 0 и вр<:
вF = arg min F (x(¡y(tF),в)) =
ве[—п,п]
= arg min \J7y1(tF) cos в^/У (tF) sin^ + y3(tF)) = ве[—п,п]
2 П
= arg min cos2 в = ± —.
9^[—п,п] 2
Положим для определенности вF = п, тогда функцию u(t), доставляющую минимум функционалу F(x(tF)) равный 0, можно взять в виде
u(t) =- -1
венств
Пример 2. Рассмотрим задачу (10)—(12) при 3} = —1, ¿г = 1, г =
рассматриваемая задача оптимального управления переходит в задачу оптимального управления для производной системы (4), где
которое может оказаться полезным при восстановлении управления и(Ь) для исходной задачи оптимального управления по найденному решению задачи оптимального управления для производной системы.
Например, решим задачу улучшения начального управления и1 (Ь) = 0 при п = 3, Ь = 1, Ь0 = 0, Ьр = 0.25,
т. е. задачу минимизации расстояния до заданной точки х*. Преобразуем функционал с учетом инварианта рассматриваемой системы:
Б (х(Ьр)) = хт(Ьр)х(Ьр) + х^х* — 2хт(Ьр)х* = 6 — 2хт(Ьр)х*.
/ 0 0 ... 0 Ь \
0 0 ... Ь 0
\ Ь 0 ... 0 0 /
С помощью замены переменных хг = хг(у, в), г = 1, 2п, предложенной в п. 2, с учетом справедливости равенств
Г(Ь, х) = Ьх2п-{+1, р+1(Ь, х) = —Ьхп-1+1, г = 1, п,
д}(Ь,У,в) = 2Ьл/у1уп вт(2в + у2п ^
д1+1(Ь, у, в) = 2Ь\/у'1+1уп— ат(у2п-'1-1 — уп+1), г = 1,п — 2,
дп(Ь, у, в) = —2Ъ\/у1 уп вт(2в + у2п ^
д
2п-1
(Ь, у, в)
Ь
сов(2в + у2п ^.
Здесь отброшено уравнение с начальным условием
х(Ь0) = (1,1,1,0,0, 0)т, х* = (0,1,1,1, 0,0)т,
Б (х(Ьр)) = (х(Ьр) — х*)т (х(Ьр) — х* (Ьр)) ^ шт,
Попробуем решить задачу улучшения численно с помощью глобального алгоритма улучшения Кротова [7] двумя различными способами.
Способ 1. Применим алгоритм глобального улучшения непосредственно к исходной задаче, поставив принудительно ограничения на управления, например в виде u(t) Є [-10; 10], при приближении разрешающей функции ф°(Ь,х) с помощью полиномов первого порядка.
Способ 2. Применим алгоритм глобального улучшения к производной задаче, соответствующей исходной задаче,
y1 = 2^y1y3 sin(2e + y5), t Є [0,tF], y2 =0, в Є [—п, п], y13 = —2v/y1y3 sin(2e + y5), гі4 = —1 — cos(2e + y5),
y5 = — cos(2e + y5) ,
y(0) = (1,1,1,0,0)T,
F (y(tF)) = min F (x(y(tF),в)) ^ min,
вЄ[-п,п]
при приближении разрешающей функции 4>°(t, y) с помощью полиномов второго порядка. Начальному управлению u1 (t) = 0 здесь соответствует начальное управление в1 (t) = t. На улучшенном управлении в11 (t) значение функционала составило F (y11 (2.5)) = —2.94465. Далее с помощью ранее отброшенного уравнения •
в = \ —Т cos(2e + y5) — u, y1
а точнее, с помощью его разностного аналога
■<» = -^+h{ - m v"m
построим начальное управление и1 (t) для итерационной процедуры улучшения в исходной задаче, поставив ограничения на управления,
например в виде u(t) G min и1 (t), max и1 (t) (в нашем случае
t£[to,tp ] t£[to,tp ]
u(t) G [0;30]), при приближении разрещающей функции 4>°(t,x) с помощью полиномов первого порядка.
Полученные значения функционала на первых девяти итерациях алгоритма представлены в следующей таблице:
Номер итерации Значение Б(х(Ьр)) (способ 1) Значение Б(х(Ьр)) (способ 2)
0 5.20076 5.96956
1 0.72426 0.01352
3 0.32999 0.00943
5 0.18185 0.00876
7 0.10929 0.00845
9 0.08214 0.00826
Из таблицы видно, что второй способ решения позволил уже на первой итерации алгортма глобального улучшения получить значение функционала меньшее, чем при первом способе решения, и существенно улучшить значение функционала на последующих итерациях. На рис. 1 представлены графики улучшенного управления (на девятой итерации алгоритма глобального улучшения) при расчете по способу 1 (черная линия) и по способу 2 (красная линия). Соответствующие траектории представлены на рис. 2 и 3 соответственно для способа 1 и способа 2.
-
-
-
- ■ 1 п"' 1 1 1
О 0.5 1 1.5 2 2.5
1
Заключение
На основании полученных результатов можно заключить, что предложенный алгоритм, построенный на основе общего метода Кротова глобального улучшения управления, служит хорошим инструментом для численного решения задач улучшения рассматриваемого класса. При этом переход к производной системе обеспечивает высокую эффективность поиска оптимального управления, когда оно не ограничено, либо хорошее приближение к оптимуму в случае ограниченного управления для последующего итерационного улучшения в исходной задаче.
Список литературы
[1] Кротов В. Ф., Фельдман И. Н. Итерационный метод решения задач оптимального управления // Изв. АН СССР. Техн. киберн., 1983, № 2, с. 160—168. ?[]
[2] Krotov V. F. Global methods in optimal control theory. New York : Marcel Dekker, 1996.— 385 p. ?
[3] Кротов В. Ф. Об оптимизации управления квантовыми системами // Доклады РАН, 2008, № 3, с. 316-319. ?2
[4] Кротов В. Ф. Управление квантовыми системами и некоторые идеи теории оптимального управления // Автоматика и телемеханика, 2009, № 3, с. 15-23. ?[], 2
[5] Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. М. : Наука, 1973.— 448 с. ?1
[6] Гурман В. И. Принцип расширения в задачах управления. М. : Наука. Физ-матлит, 1997. -- 288 с. ?1, 1
[7] Гурман В. И., Трушкова Е. А. Приближенные методы оптимизации управляемых процессов // Программные системы: теория и приложения, 2010, № 4, с. 85-104. ?1, 3
E. A. Trushkova. СйиЬт^ improvement in a class of systems with unbounded linear control.
Abstract. A class of problems of control improvement for which transformable explicetly to a problem of lesser order with bounded control (derived problem) is described. This allows one to find analytically or through iterations effective initial approximation for the original improvement problem. A numerical algorithm based on the general Krotov method of global improvement is proposed. Its application to controllable quantum systems with examples is considered.
Key Words and Phrases: optimal control, control improvement.
Образец ссылки на статью:
Е. А. Трушкова. Улучшение управления в одном классе систем с линейным неограниченным управлением // Программные системы: теория и приложения : электрон. научн. журн. 2011. № 1(5), с. 39-50. URL: http://psta.psiras .ru/read/psta2011_1_39-50.pdf