УДК 517.977
О.В. Моржин
ПРОЕКЦИОННЫЕ МЕТОДЫ НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ УПРАВЛЯЮЩИХ ФУНКЦИЙ И ПАРАМЕТРОВ*
Предложены новые проекционные методы нелокального улучшения в общем классе нелинейных задач оптимизации дифференциальных систем по управляющим вектор-функции и векторным параметрам. Методы основаны на специальной дифференциально-алгебраической сопряженной системе и точной (без остаточных членов разложений) формуле приращения целевого функционала, заключаются в разрешении систем операторных уравнений.
Ключевые слова: управляемые системы, нелокальные улучшения, проекционные методы.
O.V. Morzhin
PROJECTION METHODS FOR NONLOCAL IMPROVEMENT OF CONTROL FUNCTIONS AND PARAMETERS
New projection nonlocal improvement methods are suggested in one general class of nonlinear problems for optimization of differential systems with respect to control vector function and vector parameters. These methods are based on a special differential-algebraic conjugate system and exact (without residual terms of the expansions) formula for the cost functional’s increment. The methods consist in solving systems of operator equations.
Keywords: control systems, nonlocal improvement, projection methods.
1. Постановка задачи
Во многих приложениях изучаются задачи оптимального управления, содержащие одновременно управляющие функции и параметры [1, с. 119-128], [2, с. 230-235]. Например, задача оптимального управления с нефиксированным моментом окончания процесса управления может быть заменой переменной времени приведена к задаче с параметром.
Изучается класс задач оптимального управления с параметрами:
t1
I (а) = F (x(t1), w) + j f 0(t, x(t), u(t), w)dt ^ inf, (1)
t0
x(t) = f (t, x(t), u(t), w), x(t0) = a, (2)
u(t) eU с Rm, t eT = [t0, tj], weW с Rz, a e A с Rn, (3)
где x(t) = (x1(t),..., xn(t)) - вектор состояния системы, u(t) = (u1(t),...,um (t)) - значение управляющей
функции в момент t eT ; w = (w1,..., wz), a = (a1,..., an) - векторы управляющих параметров; T - задан-
ный отрезок; а = (x(), u(), w, a) - управляемый процесс.
Предполагаются выполненными условия: a) функция F(x, w), непрерывно-дифференцируемая по (x, w) на Rn XW ; функции f 0(t,x,u, w), f (t,x,u, w) и их производные по x,u,w, непрерывные по совокупности аргументов (t, x,u, w) на TX Rn X U X W ; b) функция f (t,x,u, w) удовлетворяет условию Липшица по xe Rn на T X Rn X U X W с общей константой L > 0; c) множества U с Rm, W с Rz, A с Rn замкнутые и выпуклые.
Под допустимыми управлениями в задаче (1) - (3) понимаем кусочно-непрерывную вектор-функцию u (t), t e T и векторы параметров w, a , удовлетворяющие условиям (3) и обеспечивающие непрерывную кусочно-дифференцируемую (ограниченную) траекторию x(t), t e T, системы (2). Обозначим D -множество допустимых процессов, V - допустимых управлений u .
В задаче улучшения заданного процесса а1 e D требуется найти процесс аП e D с условием AI (а”) = I (а”) -1 (а‘) < 0.
Цель статьи - разработать проекционный метод нелокального улучшения и его модификацию в классе задач (1) - (3) в развитие дифференциально-алгебраического подхода, предложенного А.С. Булдае-вым в работе [3] и получившего развитие в публикациях [4 - 6] (включая распространение на дискрет-
*
Работа выполнена при финансовой поддержке РФФИ (проект № 09-01-00170-а).
ные управляемые системы, интерпретацию в терминах теории В.Ф. Кротова [7]).
2. Проекционный метод
Для задачи (1) - (3) вводится обобщенный лагранжиан [7] с параметром:
г1
Ь(а) = G( х(г1), w, а) -1 Я(г, х(г), и (г), w)йг, G( х(г1), w, а) = F (х(г^, w) + р(г1, х(г1)) -р(г0, а),
*0
Я(г, х, и, м>) = рх (г, х), / (г, х, и, - / 0(г, х, и, w) + <р{ (г, х).
Имеем Ь(а) = I(а) на О [7]. Рассматривается приращение
г1
ЛЬ(а) = АО (х(г1), w, а) -1 ЛЯ(г, х(г), и (г), w)йг
го
лагранжиана Ь на улучшаемом процессе а1 е О и некотором допустимом процессе ае О, где предполагаем существование непрерывной кусочно-дифференцируемой функции р(г) на Т , такой, что
р(г, х) = ( р(г), х) [4] и справедливы представления
ЛО( х(г1), w, а) = F (х(г1), w) - F (х1 (г1), wI) + ( р(г1), Лх(г^) -(р(г0), Ла) =
= ^ ( х(*1 ), w) - F ( х(^), wI)] + [F ( х(*1 ), wI) - F (х1 (г1), wI) + ( р(^ ), Лх(^ ))] -
-( р(*о), Ла) =
= ( Fw ( х(*1 ), ^) +1, Л^ + ( Рх (х1 (г1), wI) + q + р(*1 ), Лх^)) - ( рОо), Ла),
АК(г, х(г), и (г), w) = Я (г, р(г), х(г), и(г), w) - Н (г, р(г), х1 (г), и! (г), wI) + (р (г), Лх(г)) =
= [ Н (г, р(г), х(г), и (г), w) - Н (г, р(г), х(г), и(г), wI)] +
+[Н(г, р(г), х(г),и(г), wI) - Н(г, р(г), х(г),и (г), wI)] +
+[Н(г, р(г), х(г), и (г), wI) - Н(г, р(г), х1 (г), uI (г), wI) + (р(г), Ах(г))] =
= ^Hw (г, р(г), х(г), и(г), wI) + Ь, Лw^ + ^Ни (г, р(г), х(г), и1 (г), w!) + й(г), Ли(г)^ +
+^ Нх (г, р(г), х! (г), и1 (г), wI) + г(г) + р (г), Лх(г)^, дифференциально-алгебраическая сопряженная система
р(г) = -Нх (г, р(г), xI (г), и1 (г), wI) - г(г), р(*1) = -¥х (х1 (^), wI) - q, (4)
F(х(г1), wI) - F(xI (г1), wI) = ^¥х (х1 (г1), wI), Ах(г1^ + (q, Лх(г^) , (5)
F ( х(^), w) - F ( х(*1 ), wI) = ( Fw ( х(*1 ), wI) +1, Л^, (6)
Н (г, р(г), х(г), и1 (г), wI) - Н (г, р(г), х! (г), и1 (г), wI) =
(7)
= ^ Нх (г, р(г), xI (г), uI (г), wI), Лх(г )) + (г (г), Лх(г)),
Н (г, р(г), х(г), и(г), wI) - Н (г, р(г), х(г), uI (г), wI) =
(8)
= ^ Hw (г, р(г), х(г), uI (г), wI) + й (г), Ли(г )),
Н (г, р(г), х(г), и (г), w) - Н (г, р(г), х(г), и(г), wI) =
(9)
= (Hw (г, р(г), х(г), и(г), ^) + Ь, Лw) на допустимом процессе (х(г), и(г), w, а), г е Т, где добавки I е , q е Я", Ь е , й (г) е ,
г (г) е Я"; приращения Лх(г) = х(г) - х1 (г), Ли(г) = и(г) - и1 (г), Лw = w - wI;
Н (г, р, х, и, w) = (р, / (г, х, и, ™)) - / 0(г, х, и, w) - функция Понтрягина. Получаем формулу приращения
М(а) = / ^ (х(ґг), ^ ) +1 -| (Нк (ґ, р(ґ), х(ґ), и(ґ), ^ ) + Ь)Л, Аж
ж 4
ґ0
ґ1
-| ( Ни (ґ , Р(ґ), х(ґ), и‘ (ґ ), ж1) + й (ґ ), Аи (ґ )) йґ - ( р(ґо), Аа),
(10)
, и
ґ0
где р(г) - решение сопряженной системы (4) - (9).
Проведем последовательно оценки для ЛI (а) на основе (10):
ЛI (а) <
в^(ж' + в(I(Нк(ґ, р(ґ), м>(ґ), и(ґ), ж1) + Ь)йґ - ^ (х(ґі), ж1) -1)) - ж1, А^ -
1 ґі
----Ри (и' + а(Ни (ґ, р(ґ), х(ґ),и' (ґ), ж') + й(ґ)) - и' (ґ), Аи(ґ)) йґ -
ґ0
----(РА (а' +МР(ґо)) - а‘, Аа),
, А
№
где а> 0, в> 0, ц> 0. Соответственно вводятся проекционные зависимости
( ґі ^
ж' + в(I(Нк (ґ, р(ґ), х(ґ), и(ґ), ж') + Ь)йґ - ^(х(ґі), ж') -1)
иа(ґ) = Р^ (и +а(Ни(ґ,р(ґ),х(ґ),и' (ґ),ж') + й(ґ)), ґє Т, (11)
а№ = РА (а' +^р(ґ0)), а> 0, в> 0, №> 0, при которых получаем мажорирующую оценку
1м , 112 1 11| , ||2 1 || , 112
А(а«,в.А) -—віїжв - ж I---------1 ||иа(ґ) - и (Ґлі йґ-1|ам - а | , (12)
в а ґ0 №
где а > 0, в> 0, №> 0.
В соответствии с (11), (12) рассматриваются операторы
Аа :и ^иа, Ав :ж^ , А№ :а ^ам , :(и,ж,а) ^(иа,м>р,ам)
и система операторных уравнений
и = А“(и), и єУ , ж = Ав (ж), ж е¥, а = А№(а), а є А, (13)
которую через оператор запишем в виде уравнения
(и, ж, а) = №“’в”"(и, ж, а), (и, ж, а) є У х ^ х А. (14)
Для нелокального улучшения заданного процесса а' є Б в задаче (1) - (3) достаточно решить систему уравнений (13) (или уравнение (14)) при определенных фиксированных а> 0, в > 0, ц> 0.
В плане разрешения операторного уравнения (14) будем рассматривать управления и в полном нор-
мированном пространстве измеримых функций Ьх(Т,Ят) [8]. В пространстве элементов (и,ж,а) определим нормы
11(и, ж,а)|| = (11 и \\к ,11 ж іідг ,11 а 1!д„),
||К“’в’>,ж,а)\\ =(!! А“(и) \\А,!! Ав(ж) \\дг,!! А№(а) \\д„).
Образуем итерационный процесс
(и(к+1),ж(к+1),а(к+1)) = Гв№(и{к),ж{к),а{к)), к >0. (15)
При дополнительных условиях (условие Липшица на разность градиентов функции Понтрягина и др.) можно показать сходимость итерационного процесса (15) в некотором шаре, центром которого является точка (и(0), ж(0), а(0)), в пространстве элементов (и, ж, а) при достаточно малых а> 0, в> 0, №> 0, опираясь на принцип сжимающих отображений [8] применительно к оператору в А .
3. т -модификация проекционного метода
о
Отправляясь от формулы приращения (10), проведем последовательные оценки приращения А/(о): А/(о) ^-------------^РЩ(w + тр(^р — w)),А^ - (^,А^ + тр II А-^II ^ -
1 г
таа
Вводятся проекционные зависимости
| [(Ри (и (ґ) + т а(иа(ґ) - и (ґ))), Ли (ґ)) - (и (ґ), Ли (Г)) + т а II Ли (ґ) II2 -
-------^Рл (а + тц (а и — а)),Ла) — ^а,Ла) + т II Ла II ^,
Тв * 0, та * 0, Ти * 0-
^ а(ґ) = Ри (и (ґ) + Та(иа(ґ) - и(ґ))), таф 0,
Н’тв,в= Р ^ + Т/Ив- ^ Т^^ 0,
ати,и = РА (а + ти(аи - а)), т и * 0
В результате приходим к аналогичной (12) мажорирующей оценке
г
в 0
а > 0, в> 0, и> 0.
В соответствии с (16), (17) рассматриваются модифицированные операторы
(16)
Л/ (а
« ) <-------------------
а,р,^,та,тр,т^-’ г,
2 1 ГІ,
— I ||ит
а
ҐІІ / ||2 1
I \\ит а(ґ) - и (ґ) йґ--------------------------
І " и
ат^- а
(17)
А“'а : и ^ ит а, Атв’в : w ^ м>т в, АиФ : а ^ ат и
таа тв'в т и'и
и в качестве условия улучшения заданного процесса а1 є D в задаче (1) - (3) предлагается модифицированная система операторных уравнений
и = Ата,а (и), w = Атв ’р^), а = Ати’и (а), (18)
где и єУ, w єW, а є А, фиксированы тр * 0, та* 0, ти* 0, а > 0, в > 0, и > 0.
Для системы (18) можно построить аналогичный (15) итерационный процесс.
4. Пример улучшения в непрерывной задаче с параметром
Рассматривается нелинейная задача
I(х, и, ґ1) = ґ1 + х2(ґ1) ^ шіп , х = и , х(0) = 1, I и(ґ)!< 2, ґ є [0, ґ1], ґ1 є (0,1].
Данная задача не соответствует классу (1) - (3), поэтому заменяем ґ = ґ%, %є[0,1], йґ = wd%,
w = ґ1. Получаем задачу вида (1) - (3):
I(х, и, w) = w + х2(1) ^ шіп ,
X = wu , х(0) = 1, I и(ґ)К 2, ґ є [0,1], wє (0,1].
Имеем Н = pwu , Ни = pw, Нж = ри . Дифференциально-алгебраическая сопряженная система: р = 0, р(1) = -2(х1 (1))2 - 4, х2(1) - (х1 (1))2 = 2х1 (1)Лх(1) + ^Лх(1).
Находим 4(х(1)) = Лх(1), откуда р(%) = -2(х1 (1))2 -Лх(1). Пусть и1 (%) = -1, ^ = 1. При этом х1 (%) = 1 -%, х1 (1) = 0, I (а1) = 1, р(%) = - х(1).
Образуем проекционные зависимости
( 1
+ У
V 0 у
иа(ї) = Р- 2,2](и/(%) + ap(#)w), а> 0, % є [0,1].
Образуем итерационный процесс
( 1 Л
wв=
wI +в(|р(%)и(%)й%-1) , є>0, в>0,
(к+1) тл
w ) = Р
[е,1]
1 Л
wI +в(| р(к)(%)и(к)(#)й#-1) , ^> 0, в> 0,
+
V 0
2
м(к+1)(#} = Р[_22](ы1 (#) + ар(к)(#^(к)), а> 0, [0,1].
Если положить и(0) = и1, то получим р(0) (£) = 0. Полагаем и(0) (^) = —1 — 8, w(0) = ^ = 1, 0 <\ 81< 1 — £ . Вычисляем соответствующие паре (и(0), w(0)) траекторию х(0)(^) = 1 — (1 + 8)£ и решение р(0)(^) = 8. Новые приближения определяются формулами
^ = Р[е,1](1 + Д—8(8 +1) — 1)), £> 0, в> 0,
и (1)(£) = р—2,2](—1 + а8), а> 0, £е[0,1].
5 1 —
Пусть в = —, 8 = — , а> 2. Тогда получаем и(1)(^) = —2, w(1) = —, х(1)(£) = —2^ +1,
6 2 8
I(а(1)) = 7/16 < I(а1) = 1. Таким образом, найден улучшающий процесс <ГП = ст(1).
X
8 2
Рис. 1. Геометрическая интерпретация
В исходной задаче получаем улучшенные момент t" = 3/8 и управление u!!(t) = -2, tе [0,t1]. Рассмотренная задача имеет простую геометрическую интерпретацию, показанную на рис. 1.
Заключение
В работе впервые построены проекционные методы нелокального улучшения для данного класса задач. Важной положительной чертой является нелокальность улучшения, т.е. отсутствие (трудоемких) операций варьирования управлений (в отличие, например, от известного метода условного градиента). Конструктивной основой выступают специальные дифференциально-алгебраическая сопряженная система и точная формула приращения целевого функционала.
В частности, при отсутствии управляющих функций изучается задача параметрической идентификации [2]. Отметим, что зависимость начального условия в (2) от параметра имеет большое значение в приложениях, например, в задаче о понижении порядка системы дифференциальных уравнений [2], где нужно идентифицировать не только параметры в правых частях уравнений системы пониженного порядка, но и начальное состояние новой системы.
В качестве условия улучшения выступает система операторных уравнений, для разрешения которой рассматривается итерационный процесс типа метода простой итерации. Приведен иллюстративный пример, где на аналитическом уровне показана работа метода улучшения в задаче оптимального управления с параметром.
Литература
1. Батурин В.А., Урбанович Д.Е. Приближенные методы оптимального управления, основанные на принципе расширения. Новосибирск: Наука, 1997.
2. Габасов Р., Кириллова Ф.М. Качественная теория оптимальных процессов. М.: Наука, 1971.
3. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркутского гос. ун-та. Математика. 2009. Т. 2, № 1. С. 94-107.
4. Моржин О.В. Нелокальное улучшение нелинейных управляемых процессов на основе достаточных условий оптимальности // Автоматика и телемеханика. 2010. № 8. С. 27-34.
5. Булдаев А.С., Моржин О.В. Модификация метода проекций для улучшения нелинейных управлений // Вестник Бурятского гос. ун-та. Вып. 9. Математика и информатика. 2010. С. 10-17.
6. Моржин О.В. Методы нелокального улучшения управлений дифференциальными и дискретными системами // Управление, информация и оптимизация: сб. тр. II Всерос. традиционной молодежной летней школы. М.: ИПУ РАН, 2010. С. 81-87.
7. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973.
8. Канторович Л.В., Акилов Г.П. Функциональный анализ. 3-е изд. М.: Наука, 1984.
Моржин Олег Васильевич, ассистент кафедры прикладной математики Бурятского государственного университета (Улан-Удэ); e-mail: [email protected].
Morzhin Oleg Vasilievich, assistant at the chair of applied mathematics in the Buryat State University (Ulan-Ude)