Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2011, № 3 (2), с. 115-120
УДК 517.95
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ДЛЯ ТЕРМИНАЛЬНОЙ ЗАДАЧИ ОПТИМИЗАЦИИ СИСТЕМЫ ГУРСА-ДАРБУ В КЛАССЕ ФУНКЦИЙ С СУММИРУЕМОЙ СМЕШАННОЙ ПРОИЗВОДНОЙ
© 2011 г. И.В. Лисаченко
Нижегородский государственный технический университет им. Р.Е. Алексеева
Поступила в редакцию 16.05.2011
Доказывается принцип максимума для терминальной задачи оптимизации нелинейной управляемой системы Гурса-Дарбу с полной каратеодориевской правой частью уравнения при общих условиях, позволяющих искать решения системы в классе функций с суммируемой в некоторой степени смешанной производной.
Ключевые слова: нелинейная управляемая система Гурса-Дарбу, решения с суммируемой смешанной производной, терминальная задача оптимизации, принцип максимума.
Управляемая система Гурса-Дарбу - одна из тех управляемых систем, с обстоятельного изучения оптимизационных задач для которых начиналось в свое время создание математической теории оптимального управления распределенными системами. Для задачи оптимизации системы Гурса-Дарбу А.И. Егоровым (см., например, [1]) была получена одна из первых в классе распределенных систем достаточно общих формулировок необходимых условий оптимальности типа принципа максимума (см. [2, с. 333-345, с. 449-450], [3, с. 442-450]). Впоследствии вопросы вывода и анализа принципа максимума для задач оптимального управления системой Гурса-Дарбу, являющейся своего рода пробным камнем теории оптимизации распределенных систем, рассматривали многие авторы (см., например, краткие обзоры [4, с. 5], [5, с. 5-6], [6], а также работу [7]).
В последнее время наблюдается устойчивый интерес (см., например, [8-11]) к задачам оптимизации систем типа Гурса-Дарбу, рассматриваемых в классах абсолютно непрерывных функций с суммируемой в некоторой степени р смешанной производной (такие классы будем обозначать АС). Этот случай в отличие от
преимущественно изучавшегося до недавнего времени случая решений с ограниченными производными, многовариантен - он допускает различные естественные варианты условий на нелинейную управляемую систему, отличающиеся друг от друга используемой в них априорной информацией о предполагаемом решении. В [12, 13] рассматривались грубые вариан-
ты таких условий - в них учитывается лишь вытекающая непосредственно из определения класса АСр принадлежность смешанной и первых производных решения этого класса пространству Ьр. Однако первые производные такого решения принадлежат существенно более узким чем Ьр «лебеговым пространствам со
смешанной нормой» [14]. Принцип максимума для задачи оптимизации систем Гурса-Дарбу с решениями из класса АСр исследован еще мало, по сравнению с преимущественно изучавшимся до недавнего времени случаем решений с ограниченной смешанной производной (см., например, [4, 15-19] и др.). В работе [20] доказан поточечный принцип максимума для терминальной задачи оптимизации нелинейной управляемой системы Гурса-Дарбу с решениями из класса АСр, р > 1 при достаточно грубых условиях на правую часть уравнения.
В данной статье сформулирован поточечный принцип максимума для терминальной задачи оптимизации нелинейной управляемой системы Гурса-Дарбу с полной каратеодориевской правой частью уравнения при достаточно общих условиях, позволяющих искать решения системы в классе АСр, р > 1 (видимо, при столь
общих условиях принцип максимума для задачи оптимизации системы Гурса-Дарбу, рассматриваемой в классе функций с суммируемой в некоторой степени смешанной производной, ранее доказан не был). Приведенные ниже необходимые условия оптимальности оптимизаци-
онной задачи найдены с учетом полной априорной информации о предполагаемом решении системы и обобщают ранее опубликованный результат из работы [20], так как применимы к более широкому классу управляемых систем типа Гурса-Дарбу. Например, к управляемой системе с правой частью вида
ё(*, х(*),X (0>Х'2 (0М0) = X (0хг2 ()и(?), и е 4, формулируемый ниже принцип максимума применим, а результат из [20] не применим.
Для вывода принципа максимума применялось традиционное игольчатое варьирование. При вычислении вариаций функционалов существенно использовалась эквивалентная запись управляемой системы Гурса-Дарбу в виде воль-террова функционального уравнения второго рода в лебеговом пространстве [21-23]. Нетривиальное отличие этой процедуры от подобной, относящейся к случаю решений с ограниченной смешанной производной (см., например, [17, 24]) связано с тем, что здесь семейство линейных операторов правых частей линеаризованных функциональных уравнений при разных параметрах варьирования не обладает, вообще говоря, общей квазинильпотентной мажорантой. Поэтому при вычислении вариаций функционалов использовалось введенное в [22] понятие равностепенно квазинильпотентного семейства операторов.
Примем следующие соглашения: векторы, если не оговорено противное, считаются столбцами; Яп - пространство п-векторов-столбцов а = {о1,к,ап}; если а1,...ак еЯп, то
{а1 ж, ак } = {а }к=1 =
- {а!,...,<,...,а1капк} е Якп; модуль вектора равен сумме модулей его компонент; если X, У - нормированные пространства, то Ь(X,У) - класс линейных ограниченных операторов из X в У, а норма в прямом произведении X х У определяется формулой ||{х,у}||Хх¥ =|х||х +\\у\\г; если х -
функциональное пространство, то X ” - пространство п-вектор-функций, а Xппп - (п х п)
- матриц-функций, составленных из функций пространства X; I - тождественный оператор; производная скалярной функции по векторному аргументу есть вектор-строка; * - знак транспонирования (для векторов и матриц) и сопряжения (для пространств и операторов); р е (1, да) -заданное число, q = р /(р -1).
Простейшая терминальная задача. Теорема о вариации
Рассмотрим управляемую задачу Гурса-Дарбу
ху2 (о=g(t> x(o> x (o> x't2 (о> иШ с1)
t = {, t2 }ёПе [0,1]2
x(tx ,0) = ф! (tx ),tx e[0,1], x(0, ) = ф2{f2),t2 e [0,1],
(2)
где
g(t, l0, lx, l2, v) = g (t, l, v): Пх R3n x R m ^ R n (/ = {/0,A,l2}) и ф1 (t,), ф2(t2) : [0,1] ^ Rn заданы, u(t): П ^ Rm - управление. Считаем: g(t, l, v) дифференцируема по l при каждом v для почти всех t и вместе с gl (t, l, v) измерима по t для всех {/, v} и непрерывна по {/, v} для почти всех t; ф' е lLp ([0,1]), фг- (0) = 0, i е{1,2}; допустимы управления ы(-), принимающие значения из ограниченного множества V с Rm (класс допустимых управлений обозначим D).
Чтобы сформулировать необходимые нам дополнительные требования к функции g, положим
f (t, l0, li, /2, v) = f (t, /, v) = g (t, l0 + ф1 (tx) +
+ Ф2 (t2 )»А +Ф1 (t1)»h + ф2 (t2 )»
t еП, l = {l0, /j,l2} e R3n.
Обозначим через лебегово простран-
ство Lq ([0,1]) функций переменной tj, j = 1,2,
1 < q < да, а через Lqfj) ^ (П) - банахово пространство функций z(t), t еП со смешанной нормой (см., например, [25, с. 401])
<4>?2 )|[
(г, j е {1,2},
i ф j; q, r е [1, да]).
В частности, jp(j) (п) нормой
пространство с
\V р
II 11^ (У), р(/),п
а Lp( j)Mi)(п) - с нормой
11 vraisup | z(tj,t2)
о V ‘j e[0-j]
\p
z
L
r (i)
у/р
I ^, ?2 )| р .
)
Легко проверяется, что1:
(I) р( у) ограниченно вложено в
(;)>”(');
(II) если 7 € £„(1.Р(]), у є Ьр(і)мл, то
2'-У Є И “IN1 «(<)>^0"^У ^(0>да(У) ’
(III) А(г-) г(]) = А., Г є [1, да). Для сокращения записи положим
М0 - , М1 “ ^»(2),р(1), М2 — То(1),р(2),
М = М0 X М1 X М2,
N = ТпУп N = ТпУп М — ТпУп
Л0 = 4 ’ N1 _ 4(2),ю(1) , М 2 — 4(1),0(2),
N = N0 х N х N2 (элементы М - 3п -вектор-функции, элементы N - (п х 3п) -матрицы-функции. Пусть функция g такова, что выполняются следующие условия а), Ь) и с).
a) Формула Б[у,и](ґ) = /(?,у(),и()) определяет ограниченный оператор
¥[■,■]: М х В ^ Ьпр.
b) Формула Ф[ у, и](7) = //(?, у(ґ), и(ґ)) определяет ограниченный оператор
Ф[,]: М х Б ^ N.
c) Для любого и є О оператор Ф[-,и]: М ^ N непрерывен.
Условия а), Ь) означают существование функции «(•): Я+ ^ Я+ такой, что для любого т > 0
||Б[у, и]||£„, ||ф[у, м]||N < п(т)
при ||у||м < т, и є Б.
Функцию п() без ограничения общности будем считать неубывающей.
Обозначим через АСр множество абсолютно непрерывных на П функций с суммируемыми в степени р смешанной и первыми про-
1 Значок П в обозначениях, как правило, опускаем;
в скалярном случае опускаем значок, обозначающий размерность. Например, вместо АЄ”р(П), 4(П),
і} (П) - пишем соответственно АСп Ш
РУ Ь ННр(1),м(2),П Р ’ Р ’
^Р ’ IIIр(1),«,(2)'
2 Если z Є Ь ,Л , л, у є Ь,л то, вообще
р(‘)М]) ’ * р().«О) ’
говоря, не обязательно ту є Ьр.
изводными. При сформулированных выше условиях естественно рассматривать решения задачи (1)-(2) из класса Ж = Ж(П) функций
х(-) е АС”, удовлетворяющих условиям (2).
Функцию хназовем отвечающим управлению и € О глобальным решением задачи (1)
- (2), если пара х, и обращает (1) в тождество почти всюду на П . Как показано в [14], управлению и € О не может отвечать более одного такого решения. Множество тех и е О, каждому из которых отвечает глобальное решение хзадачи (1) - (2), обозначим О.
Рассмотрим следующую задачу оптимизации: найти управление, дающее на О максимум функционалу
3 [V] = в( хг (1,1)),
где С(-): Яп ^ Я - непрерывно дифференцируемая функция, хи (•) - решение задачи (1)-
(2), отвечающее управлению и ей. Выведем для этой задачи необходимые условия оптимальности в виде принципа максимума. С этой целью применим игольчатое варьирование управления. Пусть { : е > 0} - игольчатая варианта некоторого управления и0 е О, зависящая от параметров (т,V)еИх V и определяемая формулой
% (*) = {V, г епЕ (т);и0 (^), I еп \пЕ (т)},
t еП, где к = {т, V, в),
пЕ = п 1 {хг- -б < < XI, г = 1,2}.
Формулой
Е[х\() = {х(),х' О,х'к (?)}, х е АСр, t еП определим на АС” оператор Е. Очевидно,
Е[АСпр] с М. Справедливо следующее свойство замкнутости О относительно игольчатых возмущений управления, вытекающее непосредственно из [14].
Теорема 1. Пусть и0 - некоторый элемент П, а х0 - отвечающее ему решение (1)-(2). Существует такое С > 0 и для каждой пары (т,V)еПх V найдется такое е0 = е0(т,V)>0, что любое управление пь, задаваемое набором параметров Н = {т, V, е|, ее [0, е0 ], также принадлежит О и справедлива оценка ||Е[хй - хо |м ^ С\{Щ, где хИ еЖ - отвечающее пь глобальное решение (1)-(2),
\
2
0
¥<Ч = 1А " *1 Г, (П, „)) ■
Д VЯ = АV ё() = ё(Л хо ()> -4, ()> х0г2 (), V) -
- ё(, х0 ({)»-4, (?)> -42 (?)»«0 (?))•
Первую вариацию 87 функционала 3 на варианте { : е > 0}, задаваемой набором параметров (т,V) еПх V, как мы убедимся, естественно определить равенством
53 = 53(т, V) = Ііт є 2 (3[ий ] - 3[и0 ]). (3)
8—— 0
Чтобы сформулировать теорему о вариации 53, введем обозначения для интегральных опе-
где є 3” - решение сопряженного уравнения
пп х п
X Тп
Х ТЬ
1 х 1(2),^(1) х 1(1),^(2) деляется формулой
А*№) - А* [г0 ](і) + А*[г1 ](/) + А*[г2 ](і),
7 еп, г = {г , г, г } е Х1 х З^^ц х А(і),?(2), где
1 1
А*[г0](ґ) - \\г0(^,^)а^2,
^1 ^2
1
А*[ ^ ](/) -1 ^ (^
і
А2[г2](ґ) -1г2 &і2№
)- а*{; ( х0,
) }) = Хо, (5)
А0 [) = Ц %2 2 >
0 0
^2
Аі[ *](0 = | г(?!,
0
*1
А2 [ 2 ](0 = | г(£, ?2 )<я^,
0
А[ г ](?) = { А0 [ г](Г>, АД г](Г), А2 [ г ](*)}, t еП. Очевидно, А є 3(3”, М), а сопряженный
А *
к нему оператор А на подпространстве
пространства М опре-
^1
Для каждого V е V обозначим через П v множество точек хеП, являющихся точками Лебега функций ( (•), Агg(•)) и |Дгg(-)|.
Теорема 2. Предел (3) для каждого V еГ при всех те Пу имеет вид
t еП, в котором Х0 = 0’(х0 (1,1)) .
Из формулы (4) получаем следующие необходимые условия оптимальности в виде принципа максимума.
Теорема 3. Если и0 - оптимальное управление, а х0 - соответствующее ему решение
(1) - (2), то для почти всех теП
К (т)> я(т> х0 (тХ х0(1 (тХ х0гг (тХ «0 СО)) =
= ^о (тХ ё (т х0 СО. х'о(1 СО. х0/2 СО. V)]!
где е Ь” - решение сопряженного уравне-
ния (5).
Чтобы вывести из теоремы 2 теорему 3, выделим в множестве V некоторое счетное всюду плотное подмножество и. Множество П = П п ^ имеет полную меру в П и для
w€U
любых теп, Vеи справедливо (4). Из оптимальности управления и0 следует, что 53 (т, V) < 0 при теп, V е и. В силу непрерывности функции g(, х0 (), х0^ (), х0г (?), V) по переменной V из формулы (4) получаем: (0 (т), АVg(Т))^ 0 при теп, V е V. Последнее эквивалентно условию максимума теоремы 3.
Терминальная задача общего вида
Пусть г > 1 и 5 е {0, к, г} - целые числа, Ок : Яп ^ Я (к = 0, г) - непрерывно дифференцируемые функции, Зк [и] = Ок (хи (1,1))
(к = 0, г) - набор функционалов, определенных на множестве О. Рассмотрим для системы Гур-са-Дарбу (1)-(2) терминальную задачу оптимизации общего вида: в множестве управлений и е Б, удовлетворяющих условиям
и е В, Зк [м] > 0 (к = 0, s),
53 (т, V) = ((0 (т), А V g (т)),
(4)
Зк [м] = 0 (к = s +1, г),
найти управление, дающее максимум функционалу 30[и]. Для этой задачи оптимизации справедливы следующие необходимые условия оптимальности в виде принципа максимума.
Теорема 4. Если и0 - оптимальное управление, а х0 є Ж - соответствующее ему решение (1)-(2), то существует нетривиальный набор чисел X о, 4,..., X г, среди которых числа
Xо,4X^ неотрицательны, такой, что для почти всех те П
К СО» я(т хо (0» х0ь (т)» х0г2 СО» «о СО))=
max
veV
где % є LI
К g(Т Xo -4, x0t2 v))i
решение сопряженного уравне-
ния т(?) - А*{ (, (, х'0ч, х'0(2,и0 )}*}}) = х, t еП, в котором
Г ___
х = X, Хк - в'к (х0 (1,1))* (к = 0, г).
к=0
При этом Xк3к \ы0 ] = 0 (к = 1, л).
Для доказательства теоремы 4 применялась схема вывода необходимых условий оптимальности в оптимизационных задачах с ограничениями, предложенной В.И. Плотниковым [26, 27] (в [15] схема [26, 27] была применена при получении принципа максимума для терминальной задачи оптимизации системы Гурса-Дарбу, дифференциальное уравнение которой имеет каратеодориевскую правую часть, с ограничениями типа неравенства; вывод принципа максимума по схеме В.И. Плотникова для задачи оптимизации системы Гурса-Дарбу, дифференциальное уравнение которой имеет непрерывную правую часть, с интегро-терминаль-ными функциональными ограничениями типа неравенства подробно описан в [28, §2 раздела 3]. Как в [15], так и в [28] система Гурса-Дарбу рассматривалась в классе функций с ограниченной смешанной производной). В данном случае она опирается на многоточечное игольчатое варьирование управлений, соответствующая формула вариации терминального функционала
- простой аналог формулы из теоремы 2.
Работа выполнена при финансовой поддержке ФЦП «Научные и научно-педагогические кадры инновационной России» (2009-2013 годы) (проект НК-13П-13) и АЦВП «Развитие потенциала высшей школы (2009-2011 годы)» Минобрнауки РФ (проект 2.1.1/3927).
Список литературы
1. Егоров А.И. Оптимальные процессы в системах с распределенными параметрами и некоторые задачи теории инвариантности // Изв. АН СССР. Сер. Матем. 1965. Т. 29. № 6. С. 1205-1260.
2. Лурье К.А. Оптимальное управление в задачах математической физики. М.: Наука, 1975. 478 с.
3. Егоров А.И. Основы теории управления. М.: Физматлит, 2004. 504 с.
4. Срочко В.А. Вариационный принцип максимума и методы линеаризации в задачах оптимального управления. Иркутск: Изд-во Иркутского ун-та, 1989. 160 с.
5. Васильев О.В., Срочко В.А., Терлецкий В.А. Методы оптимизации и их приложения. Часть 2. Оптимальное управление. Новосибирск: Наука, 1990. 151 с.
6. Tuan H.D. On solution sets of nonconvex Darboux problems and applications to optimal control with endpoint constraints // J. Austral. Math. Soc. Ser. B. 1996. V. 37. P. 354-391.
7. Сумин В.И. Об особых управлениях поточечного принципа максимума в распределенных задачах оптимизации // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. 2010. Вып. 3. С. 70-80.
8. Толстоногов А. А. Теорема существования оптимального управления в задаче Гурса-Дарбу без предположения выпуклости // Изв. РАН. Сер. Матем. 2000. Т. 64. № 4. С. 163-182.
9. Idczak D., Majewski M., Walczak S. Stability analysis of solutions to an optimal control problem associated with a Goursat Darboux problem // Int. J. Appl. Math. Comput. Sci. 2003. V. 13. № 1. P. 29-44.
10. Idczak D. The bang-bang principle for the Goursat Darboux problem // Int. J. Contr. 2003. V. 76. № 11. P. 1089-1904.
11. Погодаев Н.И. О решениях системы Гурса-Дарбу с граничными и распределенными управлениями // Дифференц. уравнения. 2007. Т. 43. № 8. С. 1116-1126.
12. Лисаченко И.В., Сумин В.И. Об условиях устойчивости существования глобальных решений управляемой задачи Гурса-Дарбу // Вестник Нижегородского университета. Математическое моделирование и оптимальное управление. Н. Новгород: Изд-во ННГУ, 2006. Вып. 2 (31). С. 64-81.
13. Лисаченко И.В., Сумин В.И. Условия сохранения глобальной разрешимости задачи Гурса-Дарбу при возмущении управления / Деп. в ВИНИТИ 06.02.2008. № 85 - В2008.
14. Лисаченко И.В., Сумин В.И. Нелинейная управляемая задача Гурса-Дарбу: условия сохранения глобальной разрешимости // Дифференц. уравнения. 2011. Т. 47. № 6. С. 858-870.
15. Плотников В.И., Сумин В.И. Оптимизация объектов с распределенными параметрами, описываемых системами Гурса-Дарбу // Ж. вычисл. матем. и матем. физ. 1972. Т. 12. № 1. С. 61-77.
16. Suryanarayana M.B. Necessary conditions for optimization problems with hyperbolic partial differential equations // SIAM J. Control. 1973. V. 11. № 1. P. 130-147.
17. Плотников В.И., Сумин В.И. Оптимизация распределенных систем в лебеговом пространстве // Сиб. матем. журнал. 1981. Т. 22. № 6. С. 142-161.
18. Матвеев А.С., Якубович В. А. Оптимальное управление некоторыми системами с распределенными параметрами // Сиб. матем. журнал. 1978. Т. 19. № 5. С. 1109-1140.
19. Гаврилов В.С., Сумин М.И. Параметрическая оптимизация нелинейных систем Гурса-Дарбу с фазовыми ограничениями // Ж. вычисл. матем. и матем. физ. 2004. Т. 44. № 6. С. 1002-1022.
20. Лисаченко И.В., Сумин В.И. Принцип максимума для терминальной задачи оптимизации системы Гурса-Дарбу в классе функций с суммируемой смешанной производной // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. Ижевск: Изд-во УдГУ, 2011. Вып. 2.
21. Сумин В.И. Функциональные вольтерровы
уравнения в теории оптимального управления распределенными системами. Н. Новгород: Изд-во
ННГУ, 1992. 110 с.
22. Сумин В.И. Управляемые функциональные вольтерровы уравнения в лебеговых пространствах // Вестник Нижегородского университета. Математическое моделирование и оптимальное управление. Н. Новгород: Изд-во ННГУ. 1998. Вып. 2(19). С. 138-151.
23. Сумин В.И. Об управляемых функциональных вольтерровых уравнениях в лебеговых пространствах. Н. Новгород: ННГУ, 1998. 96 с. Деп. в ВИНИТИ 03.09.98. № 2742-В98.
24. Сумин В.И. Вольтерровы функциональные уравнения и принцип максимума для распределенных оптимизационных задач // Вестник Нижегородского университета. Математика. Н. Новгород: Изд-во ННГУ, 2004. Вып. 1(2). С. 178-191.
25. Канторович Л.В., Акилов Г.П. Функциональный анализ. М.: Наука, 1977.
26. Плотников В.И. Необходимые условия оптимальности для управляемых систем общего вида // Докл. АН СССР. 1971. Т. 199. № 2. С. 275-278.
27. Плотников В.И. Необходимые и достаточные условия оптимальности и условия единственности оптимизирующих функций для управляемых систем общего вида // Изв. АН СССР. Сер. Матем. 1972. Т. 36. № 3. С. 652-679.
28. Новоженов М.М., Сумин В.И., Сумин М.И. Методы оптимального управления системами математической физики. Учебное пособие / Горький: Изд-во ГГУ, 1986. 87 с.
NECESSARY OPTIMALITY CONDITIONS FOR THE TERMINAL OPTIMIZATION PROBLEM OF A GOURSAT-DARBOUX SYSTEM IN THE CLASS OF FUNCTIONS WITH SUMMABLE
MIXED DERIVATIVES
I.V. Lisachenko
The maximum principle for the terminal optimization problem of a Goursat-Darboux nonlinear controlled system is proved. The right-hand side of the differential equation is a Caratheodory function. The system solutions are sought in the class of functions with summable mixed derivative.
Keywords: Goursat-Darboux nonlinear controlled system, function with summable mixed derivative, terminal optimization problem, maximum principle.