Научная статья на тему 'Алгоритмы нелокального улучшения управлений в классах нелинейных дифференциальных систем'

Алгоритмы нелокального улучшения управлений в классах нелинейных дифференциальных систем Текст научной статьи по специальности «Математика»

CC BY
58
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЯЕМЫЕ СИСТЕМЫ / АЛГОРИТМЫ УЛУЧШЕНИЯ / ВЫЧИСЛИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ / CONTROL SYSTEMS / IMPROVEMENT ALGORITHMS / COMPUTER EXPERIMENTS

Аннотация научной статьи по математике, автор научной работы — Батурина Ольга Владимировна, Булатов Александр Вячеславович, Моржин Олег Васильевич

Статья посвящена алгоритмам нелокального улучшения управлений в нелинейных системах, включая билинейные системы в контексте проблем оптимального управления квантовыми (спиновыми) системами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Algorithms for nonlocal improvement of controls in classes of nonlinear differential systems

The article is devoted to algorithms for nonlocal improvement in nonlinear systems, including bilinear systems according to optimal control problems for quantum (spin) systems.

Текст научной работы на тему «Алгоритмы нелокального улучшения управлений в классах нелинейных дифференциальных систем»

УДК 517.977

О. В. Батурина, А. В. Булатов, О. В. Моржин

Алгоритмы нелокального улучшения управлений в классах нелинейных дифференциальных систем

Аннотация. Статья посвящена алгоритмам нелокального улучшения управлений в нелинейных системах, включая билинейные системы в контексте проблем оптимального управления квантовыми (спиновыми) системами.

Ключевые слова и фразы: управляемые системы, алгоритмы улучшения, вычислительные эксперименты.

Введение

Задачи улучшения и оптимизации управлений в динамических системах представляют одно из основных направлений системного анализа. Объект исследования в данной статье представлен нелинейными детерминированными задачами оптимального управления дифференциальными системами со свободным правым концом траектории. В качестве управлений выступают управляющие функции и параметры. Идеи, на которых основана работа, происходят из трудов В.Ф. Кротова, В.И. Гурмана [1,2], О.В. Васильева, О.В. Срочко [3,4],

А.С. Булдаева [5] и других по методам улучшения управлений.

Рассмотрим следующий достаточно общий класс оптимизационных задач [6]:

(2) х(Ь) = /^,х^),и^),т), х(Ь0) = а,, £ € Т =

(3) и(г) € и С Ет, Ь € Т, ю € W С Е7-, а € А С Еп,

где а = (х(-), и(-), IV, а) —управляемый процесс, который будем называть допустимым, если управляющая функция и(Ь), Ь € Т, — кусочно-

Работа выполнена при финансовой поддержке РФФИ (проекты 10-08-90030-Бел_а, 11-01-90718-моб_ст).

© О. В. Батурина, А. В. Булатов, О. В. Моржин, 2011 © Программные системы: теория и приложения, 2011

непрерывная, удовлетворяет поточечному ограничению u(t) G U на Т из (3), при этом траектория x(t), t G Т, системы (2)—непрерывная и кусочно-дифференцируемая, а управляющие векторные параметры w, а удовлетворяют включениям w G W, a G А из (3). Отрезок Т считается фиксированным, множества U, A, W полагаются выпуклыми и замкнутыми. Обозначим множество допустимых процессов через D, допустимых управляющих функций — через V.

На функции F(х, w), f °(t, х, и, w), f (t, x, и, w) вводятся стандартные теоретико-функциональные условия следующего вида:

а) функция F(x,w) — непрерывно-дифференцируемая по (x,w) на Еп х W;

б) функции f0(t, х, и, w), f (t, x, и, w) и их производные по x,u,w — непрерывные по совокупности аргументов (t, х, и, w) на Т х Еп х U х W;

в) функция f (t, х, и, w) удовлетворяет условию Липшица по х G Еп на Т х Еп х U х W с общей константой L > 0.

В общем случае решением задачи (1)—(3) считается минимизирующая последовательность {<rs} G D, s = 0,1, 2,..., на которой целевой функционал I(а) стремится к inf I(а) (вообще говоря, к глобальному). Задача улучшения заданного процесса и1 G D состоит в следующем: найти процесс a11 G D с условием AI(ст11) = I(ff11) — I(ff1) < 0. Отметим, что к задаче с параметром сводится задача с нефиксированным моментом окончания процесса управления через замену переменной времени.

Улучшение состоит в вычислении процесса, на котором функционал уменьшается. Основная цель исследования состоит в разработке нелокальных алгоритмов улучшения. Под нелокальным понимаем улучшение управления без осуществления трудоемкой операции (параметрического) варьирования в достаточно малой окрестности улучшаемого управления (в отличие, например, от метода условного градиента). В локальных методах с помощью варьирования ищется в такой окрестности тот элемент, который нам дает улучшение (так в методе условного градиента). Конструктивной основой нелокального улучшения в задаче (1)—(3) выступает получение точной формулы приращения целевого функционала.

В результате получается улучшающая последовательность, которая может быть минимизирующей последовательностью. Таким образом, при помощи последовательных улучшений можно построить

приближенное решение оптимизационной задачи. Кроме того, отдельные нелокальные методы [7] позволяют улучшать неоптимальные управления, удовлетворяющие принципу максимума Л.С. Понтрягина, включая особые управления.

Наряду с задачей (1)—(3) рассмотрим класс задач, ориентированных на исследования по оптимизации квантовых систем, включая спиновые системы [8—11]:

где х € Кп, управление скалярное, и(Ь) € Е, Ь € [0, ^ 1 ], момент может быть не фиксированным; (п х п)-мерные матрицы Q, А, В — числовые. Заметим, что матрица Q может оказаться отрицательно определенной. В работе [11] при заданном ^ применяется нелокальный метод, предложенный в [10].

1. Нелокальные вычисления в задачах (1)—(3) и (4)

Следуя работам [6,7], образуем конструкции алгоритмов улучшения сначала для задачи (1)—(3). Вводится обобщенный лагранжиан [2] в следующем виде:

С(х(їі), IV, а) = Е(х(їі), іл) + ^(Ьі, х(їі)) — ір(їо, а,), к(г, х, и, чл) = {^х(г, х), / (г, х, и, чл)) — / 0(г, х, и, чл) + ^г(г, х). Пусть АЬ(а) —приращение целевого функционала на улучшае-

Предполагаем существование такой непрерывной кусочно-дифференцируемой функции р(Ь) на Т, что ір(ї,х) = {р(Ь),х) и на допустимом процессе (х(Ь), и(Ь), w, а), і Є Т, справедлива дифференциально-алгебраическая сопряженная система [6]

(4)

I(а) = (х(гі), Qx(t^)) ^ ІМ, х(і) = (А + Ви(і))х(і), ж(0) = х0,

Ь(а) = С(х(іі), IV, а) — К(і, х(і), и(і), w)dt,

мом процессе о1 Є В и некотором допустимом процессе а.

(7)

(5)

(6)

р(г) = —нх(ь,р(ь), х1(г), и1^),™1) — г (г), р(*і) = —Рх(х1(іі),ю1) — д,

Е(х(іі), -ш1) — Е(х1 (і1), ю1) =

= {Ех(х1(гі),^л1), Ах(гі)) + {д, Ах(гі)),

Е(х(і\), w) — Е(х(іі), ^л1) = {Е-ш(х(іі), ^л1) + 1, Аїл),

(о) Н(Ь,р(Ь), х(Ь), ь}(Ь), їй1) — Н(Ь,р(Ь), х1(і),и1(і), т1) =

= {Нх(і,р(ї), х1 (ї), и1(Ь), w1), Ах(Ь)) + {г(і), Ах(ї)),

(9) Н(Ь,р(Ь), х(ї), и(Ь), ад1 ) — Н(Ь,р(Ь), х(Ь),у}(Ь), ад1) =

= {Ни(і,р(і), х(€), и1(г), т1) + ^і), Аи(і)),

(10) Н(Ь,р(Ь), х(Ь), и(Ь), ад) — Н(Ь,р(Ь), х(Ь),и(Ь), ад1) =

= {Нш(і,р(і), х(г), и(і), ад1) + Ь, Аад),

связанная с формулой приращения

АІ (а) = (^ (ж(іі),ад1)+

£і

(11) +1 — J(Нт(і,р(і),х(і),и(і),т]) + Ь)&, Аад^ —

£о

£і

— J {Ни(Ь,р(Ь), х(г), и1 (і), ад1) + ^і), Аи(Ь))сИ — {р(Ьо), Аа),

£о

где «добавки» І Є Ег, д Є Еп, Ь Є Ег, (1(і) Є Ет, г(і) Є Еп, Ах(ї) = = х(Ь) — х1(Ь), Ат = ад — и)1, Аи(Ь) = и(Ь) — и1(Ь), і Є Т; функция Понтрягина Н(Ь,р, х, и, ад) = {р, /(Ь, х, и, ад)) — /0(і, х, и, ад).

Точная (без остаточных членов разложений) формула приращений (11), нестандартная дифференциально-алгебраическая сопряженная система (5)—(10) являются основой для новых методов нелокального улучшения — в дополнение к известному глобальному методу

В.Ф. Кротова [2]. Сопряженная система учитывает нелинейный характер изучаемого класса задач оптимального управления.

Алгебраические уравнения (6)—(10) разрешаются в общем случае неоднозначно: например, уравнение (8) связывает п неизвестных гі(Ь), ..., гп(Ь). Введенные добавки к градиентам, посчитанным с учетом улучшаемого процесса а1, определяются совместно с решением р(Ь) сопряженной системы. Сформулируем практическое правило разрешения алгебраических уравнений на примере уравнения (8): для определения компоненты rj (і), отвечающей компоненте X2, по которой функция Н(Ь,р,х,ад) нелинейная, через некоторую зависимость rj(Ь,р,х,ад) можно занулить компоненты 7і(і,р,х, ад), і = 1,п, г = і, отвечающие таким хі, по которым функция Н(Ь,р,х,ад) нелинейная, а затем выразить rj(Ь,р,х,ад) при условии, что Ах^ = 0. Функции г(і), с!(і) будем полагать кусочно-дифференцируемыми.

В плане вывода конструкций, позволяющих улучшать управления на основе точной формулы приращения (11), связанной с сопряженной системой (5)—(10), проведем последовательно оценки для А1 (а):

^1

А1 (а) < -Р^ад1 + (Нт(г,р(г),х(г),и(г),ад1) + Ъ)А-

£о

£1

- (х^1), ад1) - 1)^ - ад1, Аад^ - 1 I (Рц (и1(г)+

+ а(Ни(Ь,р(Ь), х(Ь),у}(Ь), ад1) + й^))) - и1^), Аи(1)^(И-

- -1 ^ Ра (а1 + МР(^о)) - а\ Аа^,

где алгоритмические параметры а, /3, ц положительны. В связи с сопряженной системой (5)—(10) рассмотрим проекционные зависимости

£1

адр = Р^ (ад1 + Р^(Нт(Ь,р(Ь),х(Ь), и(Ь), ад1) + Ъ)& -

£о

(12) -Р,ш(х{11),ад1) - ,

иа(I) = Ри^и1^) + о-(Ни(Ь,р(Ь),х(Ь), и1(1),ад1) + й^))^ ,

ам = Р^ (а1 + ^р(Ьо)) , а > 0, @ > 0, ^ > 0, Ь € Т.

В терминах зависимостей (12) получаем мажорирующую оценку

£1

1 1 С

(13) А1 ((Уаф,^) <- — \\ад@ - ад1 у2 - —J У«а(^) - у}(1)\2(И-

---\\аи - а1\\2 < 0, а > 0, Р > 0, ^ > 0,

И

на приращение функционала, положив и = иа, ад = адр, а = ам (процесс &а,^,^ (Xaф,|JJ,Ua, адр, и^) ).

В соответствии с (11)—(13) рассматривается условие улучшения заданного процесса и1 в форме векторного операторного уравнения

(14) (и,ад,а)= Аа,!3,^(и,ад,а), Аа,@^ :(и,ад,а)^ (иа,адр,а^).

Оператор (и, ад, а) ^ (иа,адр,а^) можно считать однозначным (если, в частности, указан конкретный способ разрешения алгебраических уравнений в сопряженной системе).

Для улучшения заданного процесса и1 € О достаточно решить

(14) при фиксированных а > 0, Р > 0, ц > 0. Предлагается итерационный процесс типа метода простой итерации:

(15) (и(к+1),ад(к+1), а(к+1)) = Аа’^’^(и(к),ад(к), а(к)),

и(к) € У, ад(к) € Ж, а(к) € А, к > 0.

В качестве начального приближения можно взять и(0) = и1, ад(0) = ад1, а(0) = а1.

Построим модификацию предложенного проекционного метода нелокального улучшения, базирующуюся на дополнительном параметре регулировки сходимости итерационного процесса. Имеем

А1 (а) < ------т [(Р^(ад + тр(адр — ад)), Аад) — (ад, Аад) + тр|| Дад||2] —

тр Р

(Р^(и() + та(иа(1) — и())), Аи(1)) —

*0

, I А „.1+ ИI 2 ______1

— (и(Ь), Аи(Ь)) + таЦАи^)Ц2 <И — ^— (Рл(а + т^(а^ — а)), Да)—

— (а, Аа) + т^ЦАаЦ2

Вводятся проекционные зависимости

иа,Та ^) = Ру (и(г) + та(иа(€) — и(€))), та = 0, г € Т, ад^,т^ = Рш (ад + тр (адр — ад)), тр = 0, аи,т^ = Ра(я + Т^(а^ — а)), =0.

Справедлива мажорирующая оценка типа (13):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

£1

1 1 Г

А1 (/Уа,р,^,та,т^ ,Тц ) < — 1Р, адтр — ад 1 — ||ма,т„ () — и ИУ ^Ь —

---Иа^,т^ — а11|2 < 0, а > 0, Р > 0, ^ > 0,

М

где процесс ^а,р,^,та,т^ ,Тц = (ха,р,^,та,т^ ,Тц ,ио,та , адР,т^ , ац,т^ ).

Для улучшения предлагается решить параметризованное векторное уравнение

{u,w,a) = Aa,Ta,l3,Tl3’^,т^ {u,w,a) с определенными значениями а > 0, ft > 0, ц > 0, та = 0, = О,

= °.

В данных алгоритмах улучшения параметры проектирования считаются фиксированными.

Для реализации подхода применительно к задаче (4) предлагается введение управляющего параметра w с заменой переменной времени: t = ti6, в Є [0,1], dt = w6, w = ti. В результате приходим к вспомогательной задаче

I {а) = — (x{1),Qx{1)) ^ inf, х{6) = w{A + Ви{0))х{0), ж{0) = хо,

где в Є [0,1], w > 0. Функция Н{t,p, х, и, w) = pTw{A+Bu)x. Рассматривается дифференциально-алгебраическая сопряженная система

р{0) = —wl{AT + BTu1 {6))р{6), р{1) = 2Qxl{1) — q,

-(ж{1), Qx{1)) + (xl{1), Qxl{1)) = — (2Qxl{1), Дж{1)) + (q, Дж{1)).

Следуя (12), записываем проекционные зависимости

иа{в) = и1 {в) + apT{6)wlВх{в), а > 0, i

= P[№,w]{wl + ft JPT{9){A + Bu{6))x{6)d6), ft> 0,

о

где w, w — некоторые положительные значения.

Далее составляется итерационный процесс, аналогичный (15):

u(k+i){e) = и1 {в) + a{p(k))T{e)wlBx(k){e), а > 0,

i

w(k+i) = P[^,^]{wl + ft J{р(к))т{в){А + Ви(к){в))х(к){в)сЮ),

о

ft> 0, к > 0.

2. Нелокальные улучшения в билинейной системе с учетом специфики задачи

В данном разделе, следуя публикациям [10,11], опишем и применим алгоритм улучшения, который базируется не на получении точной формулы приращения целевого функционала, а на учете специфики класса задач (4), причем далее момент ti будем считать фиксированным. На основе конструктивных результатов статьи [10] проиллюстрируем важное актуальное направление приложения теории и методов оптимального управления к проблемам проектирования оптимальных квантовых систем.

Рассматривается квантовая система [В, 11,12]

(16) Шф{г) = н[u{t)]^{t), ф{0) = £,

где h — постоянная Планка, Н[«{£)] —гамильтониан, t Є [0,Т]. Функция u{t), t Є [0, Т],—кусочно-непрерывная, характеризует воздействие внешним полем. В рамках статьи функция и действительная и скалярная.

Вводится целевой критерий с вещественнозначным функционалом:

(17) I {ф,и) = 1 — \(фа,ф{т ))\2 =

1 — (ф{Т), фа)(фа, ф{Т)) ^ inf, \ф0\2 = 1,

где фа —заданный вектор, \ • \2 —модуль комплексного числа.

Будем исследовать случай п = 2. Рассматривается гамильтониан в форме Ландау-Зинера, использованный также в работе [12]: Н =

. Система (16) в покомпонентной форме имеет вид:

(18) ШФі = uфl + шф2, іНф2 = шФі — иф2,

ФЛО) = Ci, Ф2{0) = &.

Запишем целевой критерий (17) в двумерном случае:

(19) I{ф,и) = 1 — \{Фо)іФі{Т) + {фа)2ф2{Т)\2 ^ inf.

Проведем замену фі = + іхз, фі = Z2 + ІХ4, тогда управляемая

система представится в виде

= 1 (иг3 + шгА), І2 = 1 (шг3 - иг4), п п

(20) £3 = 1 (-ті - шг2), г4 = 1 (-шгі + иг2),

пп

г(0) = = (Иефі(0), Иеф2(0), ІтФі(0), 1т^2(0))Т .

а-1 \ ■ І Ьі

Полагаем в (19) фа = + М , где а^, bi, а2, Ъ2 —дей-

\ а2 J \Ь2 J

ствительные числа, удовлетворяющие условию а2 + Ъ\ + а2 + b2 = 1. Целевой критерий принимает следующий вид:

I(z, и) = 1 — [(af + b\)z\(T) + 2(aia2 + bib2)zi(Т)z2(T) +

+ 2(aib2 — bia2)zi (T )z^(T) + (af + b2)z2(T)+

(21) + 2(a2bi — b2ai)z2(T )z^(T) + (b2 + a^)z‘2(T^

+ 2(bib2 + aia2)Z3(T )zA(T) + (b2 + a^)z‘l(T)] =

= 1 — (z(tp), Lz(T)) ^ inf,

где матрица коэффициентов

L

( {af + b2) {aia2 + b^) 0 {aib2 — bia2) \

{aia2 + bib^) {a2 + b2) {a.2bi — b2ai) 0

0 {a,2bi — b2ai) {b\ + aj) {bib2 + a^)

V {aib2 — bia2) 0 {bib2 + a^) {b\ + a,2) J

Запишем функцию Понтрягина:

H {p,z,u) =1 \pi{uzs + UZ4) + Р2{шгз — UZ4)+ h

+ ps{—UZl — UZ2) + P4{—WZl + uz3)]. Стандартная сопряженная система по Л.С. Понтрягину:

Pi = \ {ups + UP4) , P2 = \ {шрз — UP4) ,

(22) h1 h1

P3 = —7 {upi + UP2) , P4 = T {up2 — upi) , hh

Pi(T) = 2(а2 + b1)zi(T) + 2(aia2 + bib2)z2 (Т)+

+2(aib2 — bia,2 )z±(T),

P2(T) = 2(ai a2 + bib2~)zi(T) + 2(a‘2 + b"2)z2 (T)+

+2(a,2bi — b2ai )z3 (T),

Рз (T) = 2(a2 bi — b2ai)z2(T) + 2(b1 + ai)z3 (T)+

+2(bib2 + a,ia,2 )z±(T), p^(T) = 2(aib2 — bia2)zi(T) + 2(Ьф2 + aia2)z3 (T)+

+2(b2 + a^2)zi(T).

Для линейной по и задачи (20), (21) условно вводится ограничение

(23) u(t) G [—v,v\, t G [0,T], v > 0,

в плане построения зависимости u(t,z) = v sign K,(jp(t),z), t G [0,T\, где функция переключения K.(p(t),z) = Hu(p(t), z,u).

Максимизирующее отображение u(t, z) [ ] записывается в форме

{—v, K,(p(t),z) < 0,

любое из [—v, v\, K.(p(t), z) = 0,

v, K.(p(t),z) > 0.

В случае K.(p(t),z) = 0 можно полагать м равным —v или v, при этом частые переключения управления с —v на v на особом режиме могут означать практическую нереализуемость расчетного управления. Поэтому вместо реализации таких переключений будем использовать специальную формулу для управления, предложенную в статьях [9,10].

С вычислительной точки зрения равенство нулю понимается в смысле принадлежности некоторой достаточно малой е-окрестности нуля.

Представим алгоритм улучшения приближения u(k)(t), t G [0,Т\, к > 0, где к — это номер элемента улучшающей последовательности для оптимизационной задачи (20), (21), (23). Выполняются следующие шаги:

(1) интегрирование системы (20) при управлении и(к) для расчета траектории z(k);

(2) вычисление решения р(к) сопряженной системы (22) на процессе (z(k),u(k));

(3) интегрирование системы (20) с отображением u(k\t, z), t G [0,T], в плане расчета траектории z(k+1);

(4) построение нового приближения u(k+1)(t) = u(k)(t, z(k+1)(t)), t G G [0,T].

В алгоритме изучается поведение знака производной функции переключения, следуя формулам из статьи [10].

Линейность задачи по и является положительным моментом для разрешения операции максимизации функции Понтрягина. С другой стороны, интегрирование системы (20) с зависимостью (24) имеет известные особенности [10]. В этой связи на практике известен подход с регуляризацией целевого функционала. Вводится в рассмотрение вспомогательный целевой критерий

т

(25) J^(z,u) = I(z,u) + fij u2(t)dt ^ inf, fi> 0.

0

Функция Понтрягина H@ (t,p, z,u) = H(t,p,z,u) — fiu2. Дифференцируя эту функцию по и и рассматривая p(k)(t), приходим к зависимости

(26) иР{t,z) = 2fiK,(t,p(k)(t),z), t G [0,T], fi> 0.

Проведена программная реализация глобального метода (на языках Matlab, Fortran). Расчеты проведены для различных условных значений фа, £. Представим сравнительные результаты расчетов с условным набором

zs = (1/V2,1/V2,0,0)T, ai = 0.6, bi = —0.3, a2 = 0.1, Ъ2 = л/0.54, ш = h = 1, Т =1.5.

Приближение u(0\t), t G [0,T], представляет собой решение краевой задачи [12]:

v(0)(t) = 4-у(ш2 + u2(t)),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Формирование начального приближения таким образом исходит из адиабатического приближения в квантовой механике. Общее решение

юсц (їШ ) =47Ш, + С,

частное решение

(27) и(0)(і) = wtg (2^ш(2і — Т)), і Є [0,Т].

Функция и(0\і), і Є [0,Т], формируется численно по формуле (27) в компьютерной программе.

Полагаем є = 0.001. Интегрирование систем осуществлялось методом Рунге-Кутта 4-го порядка.

1. Глобальный метод с применением формулы для управления при особом реж.име [10]. Считаем и(0\0) = —30 в формуле (27) для 7. Задаем V = 30 в условии (23).

На начальном приближении и(0) имеем значение I(0) = 0.7681. В таблице 1 приведены результаты последовательных улучшений по первым итерациям (ГлМ — глобальный метод, ГрМ — градиентный метод). Рис. 1 иллюстрирует высокую сравнительную эффективность глобального метода. В отличие от градиентного метода, глобальный метод не зависит от алгоритмического параметра. Глобальный метод обеспечивает быструю релаксацию: на 9-й итерации получено значение I = 0.000952, что составляет 0.124% от I(0). Сравнение графиков управлений и(1\ и(9\ полученных за первую итерацию и в результате серии итераций соответственно, показывает, что участок [0, і і), на котором управление принимает значение —V, важен в плане реализации выхода на особый режим.

Таблица 1. Сравнение результатов глобального и градиентного методов по итерациям

Номер к I(г(к),и(к)) по ГлМ I(г(к),и(к)) по ГрМ

0 0.7681 0.7681

1 0.1401 0.6911

2 0.0040 0.6107

3 0.0021 0.5421

4 0.0015 0.4913

На рис. 2 приведены графики управлений и(0) и и точ-

ке = 0.0667 происходит переключение с граничного управления

Алгоритмы нелокального улучшения /(*<*), ы(*0)

Рис. 1. Сравнение результатов глобального и градиентного методов по итерациям

30

20

10

0

-10

-20

-30

1 1 1 1

і

1 л\ \\ м м її

/ И(0)(і)

/ / г

1

0 . 0.25 0.5 0.75 1 1.25 1.5

Г1

Рис. 2. Начальное приближение и(0) и расчетное управление и(9), полученное на 9-й итерации

и(9)^) = -30 на внутреннее и(9)^) = и (9)(г), где функция и(9) ^) определяется согласно теории [10]. Участку [0, ^ 1) соответствуют достаточно большие по модулю отрицательные значения функции переключения к(9)(Ь) = К.(р(8) (Ь), г(9) (£)).

На рис. 3 показаны графики функций г^^), j = 1, 4, соответствующих управлению 9)(£). Графики иллюстрируют достаточно быстрое изменение траектории на участке [0,^), где применяется управление, равное —V. Это необходимо для выхода на особый режим при заданном начальном состоянии.

Рис. 3. Графики функций ] = 1,4, соответствую-

щих управлению м*9'(£)

Сравнительные эксперименты с привлечением градиентного метода [ ] показывают, что глобальный метод надежнее, так как, во-первых, учитывает специфику особого оптимального управления и, во-вторых, не требует настройки алгоритмического параметра (в нере-гуляризованной, исходной формулировке).

2. Глобальный метод с регуляризацией по управлению. Полагаем значение и(°\0) = —30 в формуле для 7 в (27). Рассматриваемая модификация глобального метода не требует условного ограничения (23); тем не менее, в контексте с с изложенными выше результатами расчетов полагаем V = 30 в ограничении (23).

Рассматриваем сначала /3 = 0.0055. В таблице 2 показаны последовательные улучшения по итерациям, а на рис. 4 — график управления

Регуляризация требует настройки параметра в (25), (26), причем проигрывает стандартному глобальному методу и по шагам уменьшения функционала /, что обусловлено влиянием добавочного слагаемого в функционале /13. Положительной чертой модификации является непрерывность функции й^)(#, г) по z.

'3°0 0.25 0.5 0.75 1 1.25 1.5 г

Рис. 4. Начальное приближение м*0) и расчетное управление м*9\ полученное на 9-й итерации при /3 = 0.0055

Таблица 2. Результаты глобального метода по итерациям при /3 = 0.0055

Номер к Значение Д.#),^)) Номер к Значение 1{г(-к\и(-к'>)

0 0.7681 5 0.0027

1 0.0614 6 0.0017

2 0.0242 7 0.0014

3 0.0119 8 0.0013

4 0.0057 9 0.0012

Далее, рассматриваем меньшее значение /3 = 0.002. В таблице 3 показаны последовательные улучшения по итерациям. Рис. 5 иллюстрирует учет ограничения (23) при данном значении )3.

Рис. 5. Начальное приближение м*0) и расчетное управление м*9', полученное на 9-й итерации при [3 = 0.002

Таблица 3. Результаты глобального метода по итерациям при /3 = 0.002

Номер к Значение I(z^k\u^) Номер к Значение I(z('^, )

0 0.7681 5 0.0027

1 0.0876 6 0.0019

2 0.0122 7 0.0015

3 0.0068 8 0.0013

4 0.0042 9 0.0012

Рис. 4, 5 показывают наличие участка управления с достаточно быстрым изменением в некоторой полуокрестности [0, f 1), что обусловлено учетом начального условия г(0) = zs-

Заключение

Изложенные в данной статье результаты применительно к разным классам нелинейных управляемых систем объединяет задание линейной по переменной состояния функции ip(t, х) в задачах улучшения управлений. Вопрос о сходимости улучшающей последовательности к оптимальному процессу в нелинейных задачах оптимального управления нами не рассматривался. Предположим, что заданы некоторое допустимое управление и соответствующее значение целевого функционала, тогда решение серии задач улучшения может дать

с практической точки зрения ощутимый результат. Как показывают расчеты по ряду модельных задач оптимального управления, в результате последовательных улучшений можем получить существенно меньшее значение целевого функционала, а не просто «сдвинуться» на некоторую малую величину. Если исходить с этой позиции, а также из того, что математические модели только приближенно отражают реальный мир, то вычисление такого допустимого управления, на котором целевой функционал принимает ощутимо меньшее значение по сравнению с тем значением, которое было на начальном приближении, — может быть очень серьезным результатом для практики.

Разработка новых, более эффективных алгоритмов улучшения управлений остается актуальной проблемой, поскольку требования к эффективности вычислений постоянно возрастают с развитием прикладных проблем. В частности, такие исследования выступают очень важной основой для квантовых вычислений, поскольку для эффективной передачи квантовой информации (технологии будущего) нужны соответствующие математические оптимальные алгоритмы.

Список литературы

[1] Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. М.

: Наука, 1973.— 448 c. t[]

[2] Krotov V. F. Global methods in optimal control theory. New York : Marcel Dekker, 1996.— 408 p. t[], 1, 1

[3] Васильев О. В. Лекции по методам оптимизации. Иркутск : Изд-во Иркутск. ун-та, 1994. — 344 c. t[]

[4] Срочко В. А. Итерационные методы решения задач оптимального управления. М. : Физматлит, 2000.— 108 c. t[]

[5] Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ : Изд-во Бурятского гос. ун-та, 2008.— 256 c.

tu

[6] Моржин О. В. Проекционные методы нелокального улучшения управляющих функций и параметров // Математика и информатика. Вестник Бурятского государственного университета, 2011 Т. 9, c. 31—35 t[], 1

[7] Моржин О. В. Нелокальное улучшение нелинейных управляемых процессов на основе достаточных условий оптимальности // Автоматика и телемеханика, 2010, № 8, c. 24-37 t[], 1

[8] Кротов В. Ф. Об оптимизации управления квантовыми системами // ДАН, 2008. 423, № 3, c.316-319 t[], 2

[9] Кротов В. Ф. Управление квантовыми системами и некоторые идеи теории оптимального управления // Автоматика и телемеханика, 2009, № 3, c. 15-23 t2, 2

[10] Батурина О. В., Булатов А. В., Кротов В. Ф. К оптимизации линейных систем с управляемыми коэффициентами // Автоматика и телемеханика, 2011, № 6, c. 64-78 t[], 2, 2, 2, 2, 2, 2

[11] Батурина О. В., Моржин О. В. Оптимальное управление системой спинов на основе метода глобального улучшения // Автоматика и телемеханика, 2011, № 6, c. 79-86 t[], 2

[12] Caneva T., Murphy M., Calarco T., etc. Optimal control at the quantum speed limit // Physical Review Lett., 2009. 103 t2, 2, 2

O. V. Baturina, A. V. Bulatov, O. V. Morzhin. Algorithms for nonlocal improvement of controls in classes of nonlinear differential systems.

Abstract. The article is devoted to algorithms for nonlocal improvement in nonlinear systems, including bilinear systems according to optimal control problems for quantum (spin) systems.

Key Words and Phrases: control systems, improvement algorithms, computer experiments.

Образец ссылки на статью:

О. В. Батурина, А. В. Булатов, О. В. Моржин. Алгоритмы нелокального улучшения управлений в классах нелинейных дифференциальных систем // Программные системы: теория и приложения : электрон. на-учн. журн. 2011. №5(9), с. 31-48.

URL: http://psta.psiras.ru/read/psta2011_5_31-48.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.