Серия «Математика»
2010. Т. 3, № 3. С. 105-117
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 517.977
Вариационный принцип максимума в задаче оптимального управления нелинейными волновыми процессами *
В. А. Терлецкий
Иркутский государственный университет Е. А. Лутковская
Иркутский государственный университет
Аннотация. В статье для задачи оптимального управления нелинейным волновым уравнением с нелинейными граничными условиями получено необходимое условие оптимальности в виде вариационного принципа максимума.
Ключевые слова: оптимальное управление; вариационный принцип максимума; волновое уравнение; характеристики.
Исследование задач оптимального управления, в которых фазовая траектория подчинена дифференциальным уравнениям с производными порядка выше первого, может осуществляться как непосредственно в терминах этих исходных уравнений, так и с помощью их предварительного сведения к некоторой системе дифференциальных уравнений первого порядка. Второй подход, безусловно, доминирует, когда речь идет об обыкновенных дифференциальных уравнениях. Уравнение п-го порядка переписывается в форме некоторой системы из п обыкновенных дифференциальных уравнений первого порядка. Главное достоинство данного приема заключается не только и не столько в большей компактности и унифицированности последующих выкладок и результатов. Существенно более важным обстоятельством, по-видимому, является простая и симметричная по отношению к управляемой системе
* Работа выполнена при частичной финансовой поддержке Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг. и РФФИ, проекты 08-01-00709-а, 08-01-98007-р_сибирь_а.
Введение
запись сопряженной задачи: она также имеет вид системы из п обыкновенных дифференциальных уравнений первого порядка. Напротив, попытка построения сопряженного уравнения в той же форме дифференциального уравнения п-го порядка, что и описывающее управляемый процесс исходное уравнение, как правило, за исключением, пожалуй лишь линейных уравнений с независящими от управления коэффициентами, заканчивается неудачей. Действительно, соответствующее сопряженное уравнение корректным образом можно записать, вообще говоря, только в форме интегрального уравнения Вольтерра п-го порядка. Понятно, что такая сопряженная задача существенно сложнее дифференциальной и менее удобна при построении как теории, так и численных методов решения задач оптимального управления.
Описанная дилемма имеет место и при изучении задач оптимального управления системами уравнений с частными производными. Разумеется, отмеченные выше проблемы с формой записи сопряженной задачи в них те же самые. Наиболее простым и исторически, по-видимому, первым примером этого служат задачи оптимального управления системой Гурса-Дарбу [1, 2, 3, 5]. Полученная в [3] сопряженная задача в дифференциальной форме некорректна. Это отмечалось и в [5], где она записана уже в интегральной форме (несколько подробнее см. в [2, с. 13]).
На наш взгляд, более эффективные и глубокие результаты можно получить, если по аналогии с обыкновенными дифференциальными уравнениями осуществлять, если, разумеется, это возможно, предварительное сведение уравнений с частными производными высокого порядка к системам уравнений первого порядка. Именно такой подход применяется в настоящей работе для вывода вариационного принципа максимума в задачах оптимального управления нелинейным волновым уравнением с различными типами граничных условий. Благодаря сведению волнового уравнения к эквивалентной ему гиперболической системе из четырех дифференциальных уравнений первого порядка удается получить корректную сопряженную систему, представляющую собой также гиперболическую систему из четырех дифференциальных уравнений первого порядка. Более того, необходимое условие оптимальности - вариационный принцип максимума - выводится именно и только в терминах решений этих систем.
1. Постановка задачи
Рассмотрим прямоугольник П = 5 х Т, 5 = («0,51), Т = (¿о,¿1) в плоскости переменных (в,Ь). Определим в нем связь между управлением и = п(в, ¿), п(в, ¿) € Е, и состоянием х = х(з,1),х(з,1) € Е, дифферен-
циальным уравнением с частными производными второго порядка
хы - а2(в)х3в = I(х, хг, х3,и, в, ¿) (1.1)
с начальными условиями
х(в,Ь0) = х0(в), хг(в,Ь0) = х1(в), в € Б. (1.2)
На боковых границах в = 50 и в = в1 прямоугольника П решение уравнения (1.1) с начальными условиями (1.2), как правило, подчиняется условиям первого, второго или третьего рода. С физической точки зрения принципиально отличаются друг от друга именно условия первого рода (они регламентируют величину смещений, например, концов колеблющейся струны), с одной стороны, и условия второго и третьего рода (они моделируют величину упругих сил на концах, например, струны или стержня), с другой стороны. Естественное желание наиболее полного охвата различных вариантов постановок задач оптимального управления на основе уравнения (1.1) с начальными данными
(1.2) диктует необходимость записи граничных условий в виде, аккумулирующем все возможные случаи. Размышления в этом направлении с учетом подсказки, идущей от физического смысла граничных условий, приводят к их формализации в форме
хг(в0,£) = д°(х(в0,1),у°,£), х3(в1,£) = д1(х(в1,1),у1,1), £ € Т. (1.3)
Здесь функции vг = ьг(Ь), г = 0,1, служат управлениями. Функция
V0 = у0(Ь) определяет программу смещений по времени левого конца струны, а функция V1 = v1(t) формирует упругую силу на правом ее конце. Отметим, что первое равенство в (1.3) есть по своей сути условие первого рода, хотя и отличается внешне от соответствующего классического равенства. Дело в том, что являясь обыкновенным дифференциальным уравнением относительно следа х(в0, ■) решения х, оно в совокупности с условием Коши х(в0, ¿) = х0(50) при вполне естественных предположениях на функцию д0 однозначно определяет все значения х(в0, •)■ В свою очередь второе равенство в (1.3) служит условием второго рода, когда функция д1 не зависит от следа х(в1 ,£), и, в общем случае, когда такая зависимость есть - условием третьего рода. Результаты, полученные в данной статье, могут быть переписаны без особого труда для любого из четырех вариантов постановок граничных условий. Однако для определенности они выводятся именно для случая, зафиксированного равенствами (1.3).
Допустимыми управлениями будем считать измеримые и существенно ограниченные функции и = и(в,£) и V1 = иг(£),г = 0,1, стесненные ограничениями
и(в, ¿) € и, иг(£) € Уг, г = 0,1, (1.4)
для почти всех (s, t) € П, t € T.
Требуется найти такие допустимые управления u,v0 и v1, которые доставляют минимум целевому функционалу
J (u,v) = / p(x,xt,xs,v, s,t)du + // ^(x,xt,xs,u, s,t)dsdt (1.5)
Jan ш
на решениях смешанной задачи (1.1)—(1.3). В функционале (1.5) первое слагаемое является интегралом первого рода по границе дП прямоугольника П, du = Vds2 + dt2. В нем естественно считать p = 0 на нижней границе прямоугольника П, т. е. при s € S, t = to.
Исследование поставленной задачи оптимального управления (1.1)—
(1.5) будем вести, считая выполненными следующие предположения:
— функция а = a(s) абсолютно непрерывна на замкнутом отрезке [so,Si], отделима от нуля числом ао и ограничена сверху числом а<х : 0 < а0 < a(s) < а< +го, s € S = [s0,s1];
— функции f = f (x, xt, xs ,u, s, t), q% = q%(x, vl, t), i = 0,1, p = p(x, xt, xs,v, s, t), Ф = Q(x, xt, xs, u, s, t) непрерывны по совокупности своих аргументов и непрерывно дифференцируемы по фазовым переменным x,xt,xs всюду в области своего определения;
— функция x0 = x0(s) абсолютно непрерывна на S, функция x1 = x1(s) измерима и существенно ограничена на S;
— для любого набора допустимых управлений u,v0, v1 существует ограниченное решение x, имеющее ограниченные производные xt,xs почти всюду в П.
2. Эквивалентная задача
Построим систему дифференциальных уравнений первого порядка, эквивалентную уравнению (1.1) на его классических (гладких) решениях. Для этого введем в рассмотрение две новые функции r± = r±(s,t), положив по определению r± = xt ^ аxs. Тогда с помощью непосредственной проверки нетрудно убедиться в том, что, во-первых, xt = (r- + r+)/2, xs = (r- — r+)/2a, а, во-вторых, D±r± = g, где через D± обозначены производные по направлениям (1, ±а). Иначе говоря, для любой дифференцируемой в П функции z = z(s,t) справедливы равенства D±z = zt ± azs. Функция g(x,r ,r+,u,s,t) определена соотношением g = f (x, (r- + r+)/2, (r- — r+)/2a, u, s, t) — a'(r- — r+)/2. Справедливо и обратное утверждение: если функции x, r± удовлетворяют системе уравнений
D±x = rT, D±r± = g(x,r-,r+ ,u,s,t), (2.1)
то функция x является решением уравнения (1.1).
Отметим, что система (2.1) записана в инвариантах Римана [6, с. 28]. Другие инвариантные системы, интерпретирующие уравнение (1.1),
могут отличаться от нее лишь первыми двумя уравнениями. В частности, в работе [8] эти уравнения представляют собой интегралы по переменной £ от двух заключительных уравнений. Далее доминирующая роль инвариантов г± проявится и при выводе необходимых условий оптимальности.
Результаты работы [8] обосновывают существование и единственность обобщенного решения начально-краевой задачи (1.1)—(1.3) для произвольных допустимых управлений (1.4) в классе функций ^¿^(П) С £те(П), обладающих конечной нормой
где, как обычно, норма пространства £те(П) определена равенством
где через х0/(в) обозначена обыкновенная производная функции х0, а граничные условия определены равенствами
Уточним некоторые особенности смешанной задачи (2.1)—(2.3). В ней функция х подчинена двум различным уравнениям. Обозначим через функцию х+ функцию х, обращающую в тождество уравнение В+х = г-, а через х- — функцию х, удовлетворяющую уравнению Б-х = г+. На самом деле понятно, что х+ = х-. Данное тождество справедливо для любого из возможных вариантов смешанной задачи, что легко устанавливается методом характеристик [6, с. 50]. Однако, ввиду громоздкости этого доказательства, приводить его не будем. В данный момент важным является лишь следствие из него. Вне зависимости от выбора конкретного варианта граничных условий на левой и правой границах прямоугольника П, граничные (а точнее смешанные [6, с. 94] условия для функций х- и х+ остаются неизменными: х+ (в0,£) =
х|| = Є88 8ИР |х(в,і)|.
"ь^(П) Ы)еп
Понятно, что функции г± принадлежат более широким пространствам, которые обозначим символами Ш± (П) и определим норму в них по правилу
Начальные условия для системы (2.1) в силу (1.2) имеют вид
х(в,і0) = х0(в), г±(в,і0) = х1(в) ^ а(8)х0,(в), в Є Б, (2.2)
г+(в0,і) = —г (в0, і) + 2д°(х(в0,і),у° ,і), г-(в1,і) = г+(в1,і) + 2а(ві)д1 (х(в1,і),у1 ,і), і Є Т.
(2.3)
х-(в0,£), х-(в1,£) = х+(в1,£). Но ввиду их тавтологичности (в смысле тождества х-(в, ¿) = х+(в, ¿), (в, ¿) € П) в смешанных условиях (2.3) они упущены. Хотя, конечно, возможен и другой подход, в котором решение х трактуется одновременно, либо как х- (для уравнения В-х = г+), либо как х+ (для уравнения В+х = г-).
Для завершения постановки эквивалентной задачи оптимального управления остается отметить, что в ней запас допустимых управлений тот же, что и в множествах (1.4), а целевой функционал (1.5) сохраняется с точностью до линейной взаимно однозначной замены функций хг и х3 на функции г- и г+ по формулам хг = (г-+г+)/2, х3 = (г-—г+)/2а. С тем, чтобы не вводить в рассмотрение новых обозначений, оставим те же символы р и Ф, фигурирующие в терминальной и интегральной частях функционала (1.5), считая, что они теперь зависят от переменных х,г- и г+. Поэтому эквивалентную задачу оптимального управления будем нумеровать (2.1)—(2.3), (1.4)—(1.5).
3. Сопряженная задача
Конструирование условий экстремума в самых различных задачах осуществляется, как правило, путем анализа приращения целевого функционала на некоторых специальных вариациях допустимых управлений. При этом можно целевой функционал или, что чаще, его приращение вначале преобразовать к виду, в котором терминальная и интегральная части «лишены» зависимости от линейных по состоянию слагаемых. Как известно, сделать это удается за счет решения так называемой сопряженной задачи, построенной для соответствующего допустимого процесса, в окрестности которого и рассматривается приращение целевого функционала. Проделаем такие выкладки в эквивалентной задаче (2.1)—(2.3), (1.4)—(1.5).
Пусть {их,г-,г+} и {и = и + Аи, V = V + Av; х = х + Ах, V- = г- + Аг-, г+ = г+ + Аг+} — некоторые допустимые процессы. Первый из них естественно считать базовым, а второй — проварьированным. Применим формулу интегрирования по частям в «очевидных» нулях
ф±(В±Ах — Агт)йвй£ = (±(В±Аг± — Ад)йвд£ = 0.
Получим тождества
I ф±Ахйв ^ аф±Ахй£ — ¡[\(В±ф± ± а'ф±)Ах + Агт]йвд£ = 0,
.щ
[ (±Аг±йв^а(±Аг±й£ — [[[(В±(±±а'С,±)Аг±+(±Ад]йвМ = 0. (3.1)
.щ
Равенства (3.1) корректны (см., например, [7],[9]) для любых односвязных областей Q С П с кусочно-гладкой границей дП и произвольных функций ф±, (± Ш±(П).
Введем в рассмотрение функцию Понтрягина Н = Н(ф-,ф+, (-,(+, х, г-, г+,и, в, ¿), положив по определению
Н = ф+Аг- + ф- Аг+ + ((- + (+)д(х, г-,г+, и, в, ¿, ) —
—Ф(х, г-,г+, и, в, ¿).
Тогда приращение целевого функционала АЗ(и^) = 3(и,г) — 3(и^), воспользовавшись тождествами (3.1) при Q = П и подчинив функции ф±,(± сопряженной задаче
В±ф± ± а! ф± = —Нх±; В±(± ± а'(± = —Нг±, (в, ¿) € П, ф±(в, ¿1) = —рх± [в, ¿1]; £±(в, ¿1) = —рг± [в, ¿1], в € Б,
ф-(в0, ¿) = ф+(в0,£) —
— (рх[в0,£] + 2д% [в0,£](рг+ [в0,£] — а(в0)(+(в0 ,£)))/а(в0),
(-(в0,£) = —(+(в0,$ — (<рг- [в0,£] — Рг+ [в0,£)/а(в0),
ф+(в\, ¿) = ф-(в1,£) —
—(рх[в1,£]/а(в1) — 2дХ[в1,£]((рг- [в1,£] — а(в1)(-(в1,£)),
(+(в1,£) = (-(в1,£) — (рг- [в1,£] + рг+ [в1,£])/а(в1), £ € Т, представим в виде
(3.2)
АЗ (и, у) = / (Ар — рхАх — рг- Ат- — рг+ Ат+)йш+
дП
+//(АН — НхАх — Нг- Ат- — Нг+ Ат+)йвйі.
П
(3.3)
Поясним. В (3.2) частные производные по переменным х± вычисляются по правилу д/дх± = к±д/дх, где вещественные числа к± удовлетворяют равенству к- + к+ = 1. В квадратных скобках указаны значения независимых переменных, в которых вычисляется соответствующая функция, зависящая от других функций, подсчитанных в той же точке.
4. Характеристические вариации и вариационный принцип
максимума
Хорошо известно (см., например, [6]), что скачкообразные возмущения решений гиперболических систем распространяются вдоль их характеристик. К таким разрывам решения приводят разрывы во входных данных, т. е. в смешанных условиях или в правой части гиперболической системы, если в ней функция рвется вдоль характеристики системы.
Система (2.1) (впрочем, как и уравнение (1.1)) имеет два семейства характеристик, которые являются семействами интегральных кривых обыкновенных дифференциальных уравнений
I = ***
Решения этих уравнений будем обозначать функциями в = в±(£,т; і). Здесь (£,т) Є П - точка, через которую проходит характеристика в момент і = т. При сделанных предположениях на функцию а через каждую точку (£,т) Є П проходит одна и только одна характеристика каждого семейства.
Воспользовавшись результатами работы [8], можно установить следующие оценки для приращений Ах, Ат± :
\Ах(в,і)\< К{ / \А~д[т\\йт + / \А~/ [(,т}\d(dт},
тпда(з,г) о(з,г)
\Ат±(в,і)\< К{\А~д[і±(в,і)}\ + } \А~/[в±(в,і; т),т)}\с!т + (4.1)
+ I \А^[т Рт + 1 \Аи/[£,т }\^т}.
тпда(з,г) о(з,г)
Здесь К - положительная константа, не зависящая от выбора допустимых процессов; С(в,і) = {(£, т) Є П : шах{в0, в+(в, і; т)} <
£ < шіп{ві, в-(в, і; т)}, т < і}, дС(в,і) - ее граница; А~/[£, т} =
/ (х, т-,т+, и, £, т) — /(х, т-,т+, и, £, т) - частное приращение функции
і
/ по управлению и, вычисленное в точке (£, т); А~д[т} = ^ (дг(х, Vі, т) —
і=0
дг(х,уг,т)) - частное приращение одной из функций дг по управлению
Vі, вычисленное в момент т на соответствующей границе; і±(в,і) - момент начала характеристики в±(в,і; ■), проходящей через точку (в,і), причем ^(в, і) < і.
Ориентируясь на оценки (4.1), приступим к построению характеристических вариаций управлений. Через П±(£,т) будем обозначать характеристические полоски, построенные для произвольной точки (£,т) Є П и числа є > 0 либо вдоль характеристики в+(£,т; ■), либо вдоль характеристики в-(£,т; ■). Формальное их определение может быть следующим:
П±(£, т) = {(в, і) Є П : в±(£ — є,т; і) <в < в±(£, т; і)}.
Для этого достаточно функцию а доопределить вне отрезка Б, например, так: а(в) = а(в0), в < в0, а(в) = а(в1), в > в1.
При достаточно малых є > 0 полоска П+(£,т) (П-(£,т)) начинается либо на нижней і = іо, либо на левой в = во (правой в = ві) границе прямоугольника П. Примем обозначения:
Т+(£,т) = (і+ (£,т ),і+(£ — є,т)), Т- (£, т) = (і-(£ — є,т ),і-(£,т)).
Тогда характеристические вариации А±и распределенного управления и определим соотношениями
\±и(я г) = 1 и(г) - г е п±((,т),
А ) \ о, г е и\п±(£,т).
В случае, если Т±(£,т) = 0, положим
Д+<0(1) = {-0;°^ г ^ ыт = 0,г е т
*-*'Ю = { 51 -Т‘\Ж^ ^) = о,г е т.
Очевидно, построенные вариации управлений будут допустимыми, если и е Ь^(Т), и(г) е и для почти всех г е Т и уг е Уг, г = 0,1.
Приступим к анализу приращения целевого функционала (3.3) на каждой из построенных характеристических вариаций.
Вначале, с тем, чтобы максимально упростить и сократить запись промежуточных выкладок и итоговых результатов, наложим условие
- [ йв и < г = г0 +
so
a(s)'
С геометрической точки зрения оно означает, что при произвольном выборе точки (£, т) Є П либо сама характеристика s+(£, т; ■) (s-(£, т; ■)) доходит в момент времени t = ti до верхней границы П, либо таким свойством обладает «отраженная» от правой s = si (левой s = so) боковой границы П характеристика s-(si,i+(£,T); ■) (s+(s0,t-(£,т); ■). Здесь £+(£,т) ^-(£,т)) - момент прихода характеристики s+^т; ■) ^-(£,т; ■)) на правую s = si (левую s = s0) границу прямоугольника П.
Обсудим степень влияния параметра є > 0 на приращения Ах, Ar± траекторий x,r±. В силу оценок (4.1) приращение Ах для любой из рассматриваемых вариаций имеет порядок є, т. е.
lim |Ax(s,t)| = 0 y(s,t) Є П.
£^0
По-другому ведут себя приращения Ar±. Для формального описания качества этих приращений потребуется ввести «отраженные» полоски
П+((,т) = {(s,t) Є П : s+^oj-^^); t) <s < s+(so,t-(( - є,т); t)}, П-(£,т) = {(s,t) Є П : s-(sl,i+((,т); t) <s < s-(si,t+(( - є,т); t)}
и области П±(£,т), объединяющие «порождающую» и «отраженную» полоски: П±(£, т) = П±(£,т) и П^(£,т). Разумеется, полоска П+(£, т) (П-(£,т)) при достаточно малых е > 0 исчезает, т. е. П+(£,т) = 0 (П-(£,т) = 0), если точка (£,т) лежит левее (правее) характеристики
в+(в1 ,г1; ■) (в-(в0Л; ■)).
На основании оценок (4.1) можно утверждать, что для вариаций А+и, А+у (А-и, А-у) приращение Аг+ (Ат~) не зависит от величины е > 0 внутри областей П+ ((,т), П-(£,т) (П-(£,т), П+(£,т)) и имеет порядок е в оставшейся части области П. С учетом сказанного и е-малости мер множеств П±(£,т), Т+((,т) = (г+((,т),г+(( — е,т)), Т-(€,т) = (г-(£ — е,т), Ь-(С,т)), Б± = Щ(£,Ь1), формула приращения
(3.3) целевого функционала на соответствующих вариациях А±и, А±у принимает вид
A±J (u,v) = f (Ар — pr± Ar±)dt+
T±(t,r)
+ f (Ар — pr- Ar-)ds — ff (AH — Hr± Ar±)dsdt— (4 2)
S±(t,T) П±(£,г) ( ' )
— ff (AH — HrT ArT)dsdt + o(e). П f(t,r)
Здесь o(e) : lim o(e)/e = 0.
£^0
Заметим, что линейные по Ar± слагаемые в (4.2) являются «неудобными». Имеется в виду следующее обстоятельство. Приращения функций Ap, AH в указанных областях не могут быть линеаризованы по приращениям своих аргументов Ar± ввиду их независимости от e. По этой же причине линейные по Ar± слагаемые нельзя и просто проигнорировать. Однако от них нетрудно избавиться, воспользовавшись тождествами (3.1), а также соответствующими уравнениями и начальнограничными условиями сопряженной задачи (3.2), условно говоря, в обратном порядке. Для сокращения записей формул введем в рассмотрение функции p±,H± с усеченным числом аргументов, положив по определению
р-(y, s, t) = p(x, y, r+ ,v, s, t), p+(y, s, t) = p(x, r-,y, v, s, t), H-(y,u,s,t) = H(0,ф+, 0,Z +,x,y,r+,u,s,t),
H +(y, u, s, t) = H(ф-, 0, Z-, 0, x, r-,y, u, s, t).
С учетом сделанных замечаний и обозначений формула приращения целевого функционала (4.2) для соответствующих вариаций А±и, А±у
управлений u, v примет вид:
A±J (u,v) = f Д~± p±(r±,s,t)dt+
T±(S,r )
T Л_. ТГ±(„±
(4.3)
+ / Д~тpT(rT,s,t)ds — Л A~±uH±(r±,u,s,t)dsdt—
S±(.t,T ) П ±(С,г )
— Ц Д~т HT(rT,u,s,t)dsdt + о(є). n±(t,T )
Сделаем следующий шаг для упрощения формул приращения целевого функционала, заменив в (4.3) интегралы по интервалам, зависящим от є, на произведение длин этих интервалов и значений подынтегральных функций на характеристиках, проходящих через точку (£,т). Как известно, [4, с. 236], такая операция справедлива для произвольной точки Лебега подынтегральной функции. Предварительно заметим, что mes T±(Ç,r) = є/а(0 + о(є)1 mes S+(Ç,t) = s-(si,t+(Ç — є,т); ti) — s-(si,ї+(£,т); ti) = a(s-(si,t+((,T); Ь))є/а(() + о(є), mes S-(Ç,t) = s+(so,t-(Ç — є, т); ti) — s+(so,t-((,T); ti) = a(s+(so,t- (Ç,t); Ь)є/а(() + о(є), s±(£,т; t) — s±(£ — є; т; t) = a(s±(£,т; і))є/а(£) + о(є). Данные соотношения получены тем же способом, что и в [2] с учетом правила нахождения производной s±(£,T; t), выведенного в [8]. Заменим теперь функции r± на решения обыкновенных дифференциальных задач, построенных вдоль характеристик s+(£,T; ■), s-(si,t+(£,T); ■) и s-(Ç,T; ■), s+(so,t-(^,т); ■). Понятно, что в общем случае они состоят из двух составных (т. е. интегрируемых последовательно) дифференциальных уравнений. В точке их стыковки пересчет условий Коши зависит от рода граничного условия. Решения этих задач совпадают с функциями r± с точностью до величины порядка є. Таким образом, в итоге, относительно точки (^, т) Є П получим следующие два семейства
задач оптимального управления обыкновенными дифференциальными уравнениями:
У = g(x,r-,y,ü,s+(£,T ; t),t), t Є (t+(Ç,T ),ї+(£,т )),
ш+(£ т)) = i r+(s+(^,T;to),to) ^(^,т) = to,
У( I —r-(soЛ+(£,т)) + 2q0(x,v0,t+(Ç,T)), і+(£,т) > to,
z = g(x, z, r+, u, s-(so, î+(Ç, т); t),t), t Є (î+(Ç, т),ti), z(t+(£,T )) = y(î+((,T ) +2a(sl)ql(x,vl,і+(Z,т )),
u(t) Є U, t Є $+(£,, т),t+(£,T)), vo Є Vo, (4.4)
I+(u, vo) = —p+(y, si,î+(£, т))a — ip-(z, s-(si,î+(£, т); ti),ti)fî+
t+(C,T ) _
+ I H +(y,u,s,t)a(s))\a=a+(îtT ;t)dt+
t+(tT )
tl
+ f H-(z,u,s,t)a(s)\s=s-{suî+{tT);t)dt ------► ma^
t+(i,T )
У = g(x,y,r+,ü,s-(Ç,T; t),t), t Є (і-(£,т),і-(£,т)), у(і-(р )) = \ r-(s-(§,т; to),to) і-((,т) = ^ _
І r+(si,it-(Z,T)) + 2a(si)qi(x,vi,:t-(Z,T)), ї-(£,т) > to, z = g(x, r-,z, u, s+ (so, t-(Z, т); t),t), t Є (t-(C, т),ti), z(î-((,T )) = —y(t-(Ç,T ) +2qo(x,vo,t((,T )),
u(t) Є U, t Є (Г(£,т),ї-(С,т)), vi Є Vi, (4.5)
I -(u,vi) = —p-(y,so,î-(i,T ))a — p-(z,s+(so ,t-(Ç,T ); ti),ti)fî+ t~(î,T ) _
+ I H -(y,%s,t)a(s))\s=s-(i,T ;t)dt+ t-(i,T )
tl
+ f H-(z,u,s,t)a(s)\s=s+(so,t-(tT);t)dt-------> max,
t-(tT )
a \ 0, mes Тє-(^т) = 0,
[1, mes f-(Ç,T) = 0,
0, mes S-((, т) = 0, a(s+(so, t-(Ç, т); ti), mes S-((, т) = 0.
Итоговый результат формулирует
в =
Теорема 1. Пусть управления и* и V* оптимальны в задаче (1.1)-
(1.5). Тогда для почти всех (£,т) € П след й(Ь) = и*(в+(£,т;Ь),Ь) и число V0 = v0*(i+(Z, т)) доставляют максимум функционалу I + в задаче оптимального управления (4.4), а следй(Ь) = и*(в-(£,т; Ь),Ь) и число
V1 = vl*(i-(Z,т)) доставляют максимум функционалу I- в задаче оптимального управления (4.5).
Доказательство теоремы основано на посылке A±J(и*^*) > 0 и равенствах А+.І(и*^*) = -єі + (й,7Ц°) + о(є), A-J(и*^*) = -єі-(и,Vі) + о (є), справедливость которых фактически установлена для почти всех (¿т) € П-
Список литературы
1. Ахмедов К. Т. Необходимые условия оптимальности для некоторых задач теории оптимального управления / К. Т. Ахмедов, С. С. Ахиев //Докл. АН АзССР. - 1972. - Т. 28, № 5. - С. 12-16.
2. Васильев О. В. Методы оптимизации и их приложения. Ч. 2 : Оптимальное управление / О. В. Васильев, В. А. Срочко, В. А. Терлецкий. — Новосибирск : Наука, 1990. - 151 с.
3. Егоров А. И. Об оптимальном управлении в некоторых системах с распределенными параметрами / А. И. Егоров // Автоматика и телемеханика. - 1964. -Т. 25, № 5. - С. 613-623.
4. Натансон И. П. Теория функций вещественной переменной / И. П. Натансон. -М. : Наука, 1974. - 480 с.
5. Плотников В. И. Оптимизация объектов с распределенными параметрами, описываемых системами Гурса-Дарбу / В. И. Плотников, В. И. Сумин // Журн. вычисл. математики и мат. физики. - 1972. - Т. 12, № 1. - С. 61-77.
6. Рождественский Б. Л. Системы квазилинейных уравнений и их приложения к газовой динамике / Б. Л. Рождественский, Н. А. Яненко. - М. : Наука, 1978. -688 с.
7. Терлецкий В. А. Вариационный принцип максимума в управляемых системах одномерных гиперболических уравнений / В. А. Терлецкий // Изв. вузов. Математика. - 1999. - № 12. - С. 82-90.
8. Терлецкий В. А. Обобщенное решение нелинейного волнового уравнения с нелинейными граничными условиями первого, второго и третьего родов / В. А. Терлецкий, Е. А. Лутковская // Дифференц. уравнения. - 2009. - Т. 45, №
3. - С. 403-415.
9. Терлецкий В. А. Обобщенное решение одномерных полулинейных гиперболических систем со смешанными условиями / В. А. Терлецкий // Изв. вузов. Математика. - 2004. - № 12. - С. 75-83.
V. A. Terletsky, E. A. Lutkovskaya
Variational maximum principle in the problem of optimal control of nonlinear wave processes
Abstract. We present necessary optimality condition in form of variational maximum principle for the problem of optimal control of nonlinear wave equation with nonlinear boundary conditions of first, second and third types.
Keywords: optimal control, wave equation, variational maximum principle
Терлецкий Виктор Анатольевич, кандидат физико-математических наук, доцент, Институт математики, экономики и информатики, Иркутский государственный университет, 664000, Иркутск, ул. К. Маркса, 1, тел.: (3952)242216 ([email protected])
Лутковская Екатерина Александровна, старший преподаватель, Институт математики, экономики и информатики, Иркутский государственный университет, 664000, Иркутск, ул. К. Маркса, 1, тел.: (3952)242216 ([email protected])
Terletsky Viktor, Ph.D., Irkutsk State University, 1, K. Marks St., Irkutsk, 664003. Phone: (3952)242216 ([email protected])
Lutkovskaya Ekaterina, Irkutsk State University, 1, K. Marks St., Irkutsk, 664003. Phone: (3952)242216 ([email protected])
Правила оформления статей, представляемых в журнал «Известия Иркутского государственного университета».
Серия «Математика»
1. Рукопись статьи (далее — статья) представляется в редакцию журнала (на русском или английском языке) в электронной форме по адресу [email protected] и распечатанной в 2-х экземплярах с подписью автора по адресу: Иркутск, 664003, б. Гагарина, 20, Институт математики, экономики и информатики, журнал «Известия Иркутского государственного университета». Серия «Математика».
2. К статье необходимо приложить анкету авторов, в которой указываются для автора или каждого из авторов: фамилия, полные имя и отчество, место работы, ученая степень и звание, электронный адрес и номера телефонов - служебный, домашний, сотовый. В анкете должен быть приведен список литературы на английском языке в алфавитном порядке. Кроме того, нужно приложить экспертное заключение (2 экз.) о возможности опубликования статьи в открытой печати и авторский договор (следует выбрать форму договора для одного автора или для коллектива авторов на странице сайта www.isu.ru/izvestia/regulations. html).
3. Представляемая в журнал статья должна быть законченным научным исследованием и содержать новые научные результаты.
4. Не допускается направление в редакцию статей, уже публиковавшихся или посланных на публикацию в другие журналы.
5. Автор принимает на себя обязательства в том, что текст статьи является окончательным вариантом, содержит достоверные сведения, касающиеся результатов исследования и не требует доработок.
6. Рецензирование статей осуществляется редколлегией серии с привлечением ведущих специалистов в соответствующей области знаний. Решение об опубликовании принимается редколлегией журнала на основании рецензий.
7. Редакция предоставляет рецензии по письменным запросам авторов без подписи и указания фамилии, должности, места работы рецензента.
8. В случае отклонения статьи, редакция направляет автору мотивированный отказ в публикации. Не принятые к опубликованию рукописи не возвращаются.
9. Автор полностью несет ответственность за содержание и стиль работы, качество перевода аннотации.
10. Статьи аспирантов публикуются бесплатно при наличии официального письма, подтверждающего факт обучения в аспирантуре.
11. Объем статьи не должен превышать 15 страниц.
12. Статья готовится в 2^, класс документа isuimei.cls с подключением isu.sty. Файлы со стилями размещены на электронной стра-
нице журнала «Известия Иркутского государственного университета» «Правила для авторов, серия «Математика» (www.isu.ru/izvestia /regulationmath.html) сайта Иркутского государственного университета. Образец оформления статьи - файл test1.tex, размещен там же.
13. В каждой научной статье журнала должны быть указаны следующие данные:
- фамилия, имя, отчество авторов (полностью);
- место работы каждого автора (если таковое имеется) в именительном падеже. Если все авторы статьи работают или учатся в одном учреждении, можно не указывать место работы каждого автора отдельно;
- контактная информация (почтовый адрес, e-mail) при ее наличии;
- название статьи;
- аннотация (не более 500 знаков, формулы и ссылки на литературу в ней не допускаются);
- ключевые слова (не более 5 слов или словосочетаний). Каждое ключевое слово или словосочетание отделяется от другого точкой с запятой;
- код УДК.
Все данные должны приводиться на русском и английском языках (образец оформления в файле test1.tex).
14. В конце рукописи помещается список литературы или библиографические ссылки. В списке и библиографических ссылках приводятся только источники, на которые автор ссылается в тексте.
Список литературы оформляется в соответствии с ГОСТ 7.1-2003 «Библиографическая запись. Библиографическое описание. Общие требования и правила составления», составляется в алфавитном порядке, все указанные источники нумеруются. Ссылки на цитируемые источники в тексте статьи приводятся в виде цифр, соответствующих номеру работы в списке литературы, заключенных в квадратные скобки.
Библиографические ссылки оформляются в соответствии с ГОСТ 7.0.5-2008 «Библиографическая ссылка. Общие требования и правила составления», располагаются в порядке их цитирования в тексте и также нумеруются. В тексте библиографические ссылки оформляются соответствующими цифрами, заключенными в квадратные скобки.
Для списка литературы и библиографических ссылок также применяются: ГОСТ 7.80-2001 «Библиографическая запись. Библиографическое описание электронных ресурсов. Общие требования и правила составления», ГОСТ 7.12-93 «Библиографическая запись. Сокращение слов на русском языке. Общие требования и правила», ГОСТ 7.112004 «Библиографическая запись. Сокращение слов и словосочетаний на иностранных европейских языках».
15. Наиболее предпочтительной формой представления иллюстраций являются файлы в формате eps, jpg с разрешением 300 dpi.
16. Подача статьи в редакцию журнала «Известия Иркутского государственного университета». Серия «Математика» означает согласие авторов с изложенными правилами и согласие на размещение полной версии статьи в сети Интернет на официальном сайте (www.elibrary.ru) Научной электронной библиотеки и в разделе сайта Иркутского государственного университета (www.isu.ru) «Известия Иркутского государственного университета» (www.isu.ru/izvestia/index.html) в свободном доступе, а также с использованием личных данных в открытой печати.
17. Редакция оставляет за собой право не принимать работы, оформленные с отступлениями от настоящих правил.
Электронная версия правил для авторов, порядка рецензирования рукописей статей, бланки анкеты авторов, экспертного заключения о возможности опубликования статьи в открытой печати (для сотрудников ИГУ) и авторского договора, а также пример оформленной в соответствии с требованиями серии статьи и все файлы стилей и примеров (архив RAR) размещены в разделе сайта Иркутского государственного университета (www.isu.ru) «Известия Иркутского государственного университета» (www.isu.ru/izvestia/index.html).