Серия «Математика»
2014. Т. 8. С. 115—124
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 517.977.56 МБС 49К20
Тождественность условий оптимальности управления упругими колебаниями для различных вспомогательных интерпретаций волновой задачи *
Н. В. Курганова
Иркутский государственный университет Е. А. Лутковская
Иркутский государственный университет В. А. Терлецкий
Иркутский государственный университет
Аннотация. Рассматривается задача оптимального управления, в которой управляемый процесс подчинен нелинейному волновому уравнению. Состояние процесса описывается решением волнового уравнения и его первыми частными производными по независимым переменным. Набор управляющих воздействий включает распределенное и граничные управления. Постановка задачи допускает произвольную комбинацию условий первого, второго и третьего рода на левой и правой границе области определения. Для исходной задачи оптимального управления строятся две эквивалентные ей вспомогательные задачи оптимального управления, отличающиеся друг от друга и от исходной задачи различными способами описания управляемого процесса. Первая эквивалентная задача фиксирует управляемый процесс с помощью гиперболической системы из четырех уравнений первого порядка. Вторая эквивалентная задача для описания управляемого процесса использует одно дифференциальное уравнение второго порядка и два дифференциальных уравнения первого порядка того же вида, что и в первой эквивалентной задаче. Необходимость перехода от исходного волнового уравнения к соответствующим эквивалентным системам требуется как для получения удобного понятия обобщенного решения, так и для построения необходимых условий оптимальности. Доказывается, что не смотря на различные с формальной точки зрения функции Понтрягина в соответствующих эквивалентных задачах оптимального управления, специфика решений сопряженных задач позволяет установить совпадение значений функций Понтрягина в области независимых переменных для одних и тех же управлений. Данное свойство обосновывает тождественность как вариационного, так и конечномерного принципов максимума, полученных на основе каждой из эквивалентных задач оптимального управления.
Ключевые слова: оптимальное управление, вариационный и конечномерный принцип максимума, волновое уравнение, сопряженная задача.
1. Постановка задачи
Рассмотрим прямоугольник П = Б х Т, Б = (в0,в1), Т = (¿0,г1) в плоскости переменных (в,Ь). Определим в нем связь между управлением и = и(в,г),и(в,г) € К и состоянием х = х(в,г),х(в,г) € К, дифференциальным уравнением с частными производными второго порядка
хи - а2(в)х33 = f (х, хг, Xs, и, в, г) (1.1)
с начальными условиями
х(в,г0) = х0(в), хг(в,г0) = х1(в), в € Б. (1.2)
На боковых границах в = во и в = в1 прямоугольника П решение уравнения (1.1) с начальными условиями (1.2), как правило, подчиняется условиям первого, второго или третьего рода. С физической точки зрения принципиально отличаются друг от друга именно условия первого рода (они регламентируют величину смещений по времени, например, концов колеблющейся струны), с одной стороны, и условия второго и третьего рода (они моделируют величину упругих сил на концах, например, струны или стержня), с другой стороны. Естественное желание наиболее полного охвата различных вариантов постановок задач оптимального управления на основе уравнения (1.1) с начальными данными (1.2) диктует необходимость записи граничных условий в виде, аккумулирующем все возможные случаи. Размышления в этом направлении с учетом подсказки, идущей от физического смысла граничных условий, приводят к их формализации в виде равенств
хг(в0,г) = ц°(х(во,1),У°,г), Xs(вl,t) = д1(х(в1 ,г),у1,г), г € Т. (1.3)
Здесь функции уг = V1(¿), г = 0,1, служат управлениями. Функция V0 = у0(г) определяет программу смещений по времени левого конца струны, а функция V1 = v1(t) формирует упругую силу на правом ее конце. Отметим, что первое равенство в (1.3) есть по своей сути условие первого рода, хотя и отличается внешне от соответствующего классического равенства. Дело в том, что являясь обыкновенным дифференциальным уравнением относительно следа х(в0, •) решения х, оно в совокупности с условием Коши х(в0,г) = х0(в0) при вполне естественных предположениях на функцию д0 однозначно определяет все значения х(в0, •). А, как известно [1,5], именно закрепление следа
* Работа выполнена при финансовой поддержке РФФИ, проект N 14-01-00564.
решения х на боковых границах области П и является сутью условий первого рода.
В свою очередь, второе равенство в (1.3) служит условием второго рода, когда функция д1 не зависит от следа х(в1,Ь), и, в общем случае, когда такая зависимость есть — условием третьего рода.
Результаты, полученные в данной работе, могут быть переписаны без особого труда для любого варианта постановок граничных условий. То есть возможны условия первого рода на левой и правой границах, условия первого рода на правой, второго-третьего — на левой границе, условия второго-третьего родов и на левой и на правой границах, или, как в данной работе, условия первого рода - на левой, а второго-третьего родов — на правой границе. Далее можно любое условие второго-третьего рода заменить на его частный случай (условие только второго или только третьего рода), итого получится девять вариантов граничных условий.
Допустимыми управлениями будем считать измеримые и существенно ограниченные функции и = и(в, Ь) и уг = уг(Ь), г = 0,1, удовлетворяющие условиям
и(в,г) е и, Уг(г) е Уг,г = 0,1, (1.4)
для почти всех (в, г) е П, г е т.
Требуется найти такие допустимые управления и,у° и V1, которые доставляют минимум целевому функционалу
■] (и,и) = / р(х,хг ,х3,и,в,Ь)(1ш + Ф(х,х1,х3,и,в,г)йвйЬ (1.5) ]дП Лп
на решениях смешанной задачи (1.1)-(1.3).
В функционале (1.5) первое слагаемое является интегралом первого рода по границе сШ прямоугольника П, с1ш = V(1в2 + (Й2. В нем естественно считать р = 0 на нижней границе прямоугольника П, т.е. в точках (в, г) е 9П : Ь = Ьо. Понятно, что запись терминального слагаемого в функционале (1.5) в виде интеграла первого рода от функции р преследует единственную цель - ее компактность.
Поставленную задачу оптимального управления (1.1)-(1.5) будем рассматривать, считая выполненными следующие предположения: функция а = а{в) абсолютно непрерывна на замкнутом отрезке Б = [80,81], отделима от нуля числом а0 и ограничена сверху числом аж : 0 < а0 < а(в) < аж < функции / = /(х,хг,х3,и,в,Ь), дг = дг(х^г,Ь),г = 0,1, р = р(х,хг,х3^,в,Ь), Ф = Ф(х,хг,х3,и,в,Ь) непрерывны по совокупности своих аргументов и непрерывно дифференцируемы по фазовым переменным х, х^ х3 всюду в области своего определения; функция х° = ж0^) абсолютно непрерывна на 5, функция х1 = ж1^) измерима и существенно ограничена на 5; для любого набора допустимых управлений , V1 существует ограниченное в П решение х, имеющее ограниченные почти всюду в П производные хг,х3.
Н. В. КУРГАНОВА, Е. А. ЛУТКОВСКАЯ, В. А. ТЕРЛЕЦКИЙ 2. Эквивалентные задачи
Построим систему дифференциальных уравнений первого порядка, эквивалентную уравнению (1.1) на его классических (гладких) решениях. Для этого введем в рассмотрение две новые функции r± = r±(s,t), положив по определению r± = xt Т axs. Тогда с помощью непосредственной проверки нетрудно убедиться в том, что, во-первых, xt = (r- + r+)/2, xs = (r- — r+)/2a, а, во-вторых, D±r± = g, где через D± обозначены производные по направлениям (1, ±a), то есть для любой дифференцируемой в П функции y = y(s, t) справедливы равенства D±y = yt ± ays, а функция g = g(x,r-,r+,u,s,t) определена соотношением
g = f (x, (r- + r+)/2, (r- — r+)/2a, u, s, t) — a'(r- — r+)/2.
Справедливо и обратное утверждение: если функции x, r± удовлетворяют системе уравнений
D±x = rT, D±r± = g(x,r-,r+,u,s,t), (2.1)
то функция x является решением уравнения (1.1).
Отметим, что система записана в инвариантах Римана [2], поэтому другие инвариантные системы, интерпретирующие уравнение (1.1), могут отличаться от нее лишь первыми двумя уравнениями. В частности, в [4] использовался другой вид инвариантной системы. Но она оказалась неудобной для исследования задачи оптимального управления волновым уравнением, так как для нее не удалось построить сопряженную систему в дифференциальной форме.
Тем ни менее, в работе [4] доказано существование и единственность обобщенного решения начально-краевой задачи (1.1)-(1.3) для произвольных допустимых управлений (1.4) в классе функций W^,1^) С L^ (П), обладающих конечной нормой
l|x|L 1 1 = llxll + llxtll + ||xs|l +
Wi1 (П) Li (П) Li (П) Li (П)
+llD+(xt — axs)|l n + llD-(xt — axs)ll / n
Li (П) ,nLi (П)
где, как обычно, норма пространства L^(n) определена равенством ||x|| = ess sup lx(s,t)l
Li(П) (s,t)en
В [4] доказано также, что функции r± принадлежат более широким пространствам W±(П) с нормами
l|r±|l = ||r± lL + llD±r±ll .
W± (П) Li (П) Li (П)
Начальные условия для системы (2.1) в силу (1.2) имеют вид
х(в, Ьо) = х0(в), г±(в, Ьо) = х1 (в) т а(в)х0'(в), в е Б, (2.2)
где через х01(в) обозначена обыкновенная производная функции х0, а граничные условия определены равенствами
г+ (во, Ь) = -г-(во ,Ь) + 2д0(х(во,Ь)^0 ,Ь),
г-(в1,Ь) = г+ (в1,Ь) + 2а(в1 )д1(х(в1,Ь)^1 ,Ь), Ь е Т. (2.3)
Уточним некоторые особенности смешанной задачи (2.1)-(2.3). В ней функция х подчинена двум различным уравнениям. Обозначим через функцию х+ функцию х, обращающую в тождество уравнение Б+х = г-, а через х- - функцию х, удовлетворяющую уравнению Б-х = г+. На самом деле понятно, что х+ = х-. Данное тождество можно установить методом характеристик [2]. Однако, ввиду громоздкости этого доказательства, приводить его не будем. В данный момент важным является лишь следствие из него. Вне зависимости от выбора конкретного варианта граничных условий на левой и правой границах прямоугольника П, граничные (а точнее смешанные [2]) условия для функций х- и х+ остаются неизменными: х+(во,Ь) = х-(во,Ь), х-(в1,Ь) = х+ (в1,Ь). Но ввиду их тавтологичности (в смысле тождества х-(в,Ь) = х+(,в,1), (вуЬ) £ П), в смешанных условиях (2.3) они упущены.
Для завершения постановки первой эквивалентной задачи оптимального управления остается отметить, что в ней запас допустимых управлений тот же, что и в множествах (1.4), а целевой функционал (1.5) сохраняется с точностью до линейной взаимно однозначной замены функций хг и х3 на функции г- и г+ по формулам хг = (г- + г+)/2, х3 = (г- — г+)/2а. С тем, чтобы не вводить в рассмотрение новых обозначений, оставим те же символы р и Ф, фигурирующие в терминальной и интегральной частях функционала (1.5), считая, что они теперь зависят от переменных х,г- и г+. Поэтому первую эквивалентную задачу оптимального управления будем нумеровать (2.1)-(2.3), (1.4)-(1.5).
Единственное отличие второй эквивалентной задачи оптимального управления заключается в замене первых двух дифференциальных уравнений в системе (2.1) на уравнение второго порядка, которое почти совпадает с исходным волновым уравнением. А именно, вместо системы (2.1) здесь рассматривается система
Бх = д(х,г-,г+,и,в,Ь), Б±г± = д(х,г-,г+,и,в,Ь). (2.4)
В ней дифференциальный оператор Б определяется по правилу
Бх = Б±Бтх.
В [4] доказана корректность использования такого дифференциального оператора второго порядка для функций х е
3. Сопряженные задачи
Конструирование условий экстремума в самых различных задачах оптимального управления осуществляется, как правило, путем анализа приращения целевого функционала на некоторых специальных вариациях допустимых управлений. При этом можно целевой функционал или его приращение вначале преобразовать к виду, в котором терминальная и интегральная части «лишены» зависимости от линейных по состоянию слагаемых. Как известно, сделать это удается за счет решения так называемой сопряженной задачи, построенной для соответствующего допустимого процесса, в окрестности которого и рассматривается приращение целевого функционала.
Для первой эквивалентной задачи оптимального управления (2.1)-(2.3), (1.4)-(1.5) сопряженная система получена в [3]. Она имеет вид
в±*ф± = -Н(±). в±*(± = , (в, г) € п, ф±(в,ь) = -<рх±[в,г1]; (±(в,ь) = -уг±[в,ь],в € Б,
(3.1)
ф (в0,г) = ф+(в0,г)-
-(ух[в0,г +2дХ[в0,г](уг+ [в0,г] - а(в0)(+(в0,г)))/а(в0), (-(в0,г) = -(+(в0,г) - (уг- [в0,г] - уг+ [в0,г])/а(в0),
ф+(в1,г)= ф-(в1,г)-
-Ух[в1,г]/а(в1) - 2дХ[в1,г](уг- [в,] - а(в^С (в1,г)),
(+(в1,г) = (-(в1 ,г) - (уг-[в1 ,г] + уг+ [в1,г])/а(в1), г € т,
где сопряженные операторы В+* и В-* на гладких функциях ф определены по правилу [4]
В±*ф = фг ± (аф)8.
Здесь функция Понтрягина Н(1) = Н(1) (ф-,ф+, , х-,х+ ,т-,т+,
и, в, г) определена равенством
Н(1) = ф+т- + ф-т+ + ((- + (+)д(х-,х+, т-,т+,и, в, г, )--Ф(х-,х+, т-,г+,и,в,г),
а производные по х- и х+ вычисляются по формулам
Н(1- = аНХ1, НХЦ = (1 - аН\
которое справедливо в силу замены
х = ах- + (1 - а)х+, где а - произвольное вещественное число.
Аналогичным образом может быть построена и сопряженная задача для второй эквивалентной задачи оптимального управления (2.4), (2.2),(2.3), (1.4),(1.5). Здесь функция Понтрягина Н(2) = Н(2)(ф,9-,9+, х,г-,г+,и,в,Ь), строится по правилу
Н(2) = (ф + 9- + 9+)д(х, г-,г+,и,в,Ь,) — —Ф(х, г-,г+ ,и, в, Ь),
а сама сопряженная задача имеет следующий вид:
Б*ф = Н(2); Б*±9± = —Н(2, (в,Ь) е П,
фг (в,и) = рх [в, ¿1];
(в,и) = -рг-[8,и], ^(в, ¿1) + ¿1) = ~(рг+ [8, ¿1], 5",
= (рх[во,Ь] + 2д0х[во,Ь]рг+ [во,Ь])/а(во),
(а(во)ф(во ,Ь))з — до[во,Ь (ф(во ,Ь) — 29+(во,Ь)) = (3.2)
ф(во,Ь) + 9+(во,Ь) + 9 (во,Ь) = —(рг- [во,Ь] — рг+ [во,Ь\)/а(во),
(а(в1)ф(в1,Ь))э — а(в1)ф(в1 ,Ь)д1[в1,Ь} — 2а(в1)9-(в1,Ь)д1 [в1,Ь] = = —рх[в1,Ь}/а(в1) — 2д\рг- [в1,Ь], 9+ (в1,Ь) = 9-(в1,Ь) — (рг- [в1,Ь] + рг+ [в1,Ь])/а(в1), Ь е Т,
При выводе задачи (3.2) существенно используется полученная в [4] формула интегрирования по частям
ЛфБхйвйЬ = ¡[ф(в,Ь)хг(в, Ь) — фг(в,Ь)х(в,Ь)]\tztlйв— п 5
— / [а2фх3 — а(аф)3 х] ^^ йЬ +/[хБ*фйвйЬ. т п
Здесь сопряженный оператор Б* определяется [4] равенствами
Б*ф = В±*Б^*ф.
4. Сравнение необходимых условий оптимальности
Необходимые условия оптимальности в форме вариационного и конечномерного принципов максимума для задачи (1.1)-(1.5) получены в [3] на основе эквивалентной задачи (2.1)-(2.3), (1.4)-(1.5). По той же схеме удалось построить аналогичные условия оптимальности и на основе эквивалентной задачи (2.4), (2.2), (2.3), (1.4), (1.5). В силу структуры функций Понтрягина Н(1) и Н (2) для доказательства тождественности этих условий оптимальности достаточно установить, что решения (-,(+ сопряженной задачи (3.1) и решения ф,9-,9+ сопряженной задачи (3.2), соответствующие одному и тому же набору допустимых
управлений u,v0,vi, удовлетворяют почти всюду в области П и на ее границах равенству
с- (s, t) + Z+(s, t) = ф, t) + 9-(s, t) + 9+(s, t). (4.1)
Справедливость соотношения (4.1) на верхней t = ti и левой s = so (условия первого рода) границах легко устанавливаются непосредственной проверкой. К сожалению, на правой границе s = si (условия второго или третьего рода) и в области П доказательство равенства (4.1) использует метод характеристик и ввиду его громоздкости не приводится.
Список литературы
1. Петровский И. Г. Лекции об уравнениях с частными производными / И. Г. Петровский - М. : Наука, 1961. - 401 с.
2. Рождественский Б. Л. Системы квазилинейных уравнений и их приложения к газовой динамике / Б. Л. Рождественский, Н. А. Яненко. - М. : Наука, 1978. -689 с.
3. Терлецкий В. А. Вариационный принцип максимума в задаче оптимального управления нелинейными волновыми процессами / В. А. Терлецкий, Е. А. Лутковская // Изв. Иркут. гос. ун-та. Сер. Математика. - 2010. - Т. 3, № 3. - С. 105-117.
4. Терлецкий В. А. Обобщенное решение нелинейного волнового уравнения с нелинейными граничными условиями первого, второго и третьего родов / В. А. Терлецкий, Е. А. Лутковская // Дифференц. уравнения. - 2009. - Т. 45, № 3. -C. 403-415.
5. Тихонов А. Н. Уравнения математической физики / А. Н. Тихонов, А. А. Самарский. - М. : Наука, 1977. - 742 с.
Курганова Наталья Викторовна, магистрант, Институт математики, экономики и информатики, Иркутский государственный университет, 664000, Иркутск, ул. К. Маркса, 1 тел.: (3952)521282 (e-mail: [email protected])
Лутковская Екатерина Александровна, кандидат физико-математических наук, старший преподаватель, Институт математики, экономики и информатики, Иркутский государственный университет, 664000, Иркутск, ул. К. Маркса, 1 тел.: (3952)521282 (e-mail: [email protected])
Терлецкий Виктор Анатольевич, кандидат физико-математических наук, доцент, Институт математики, экономики и информатики, Иркутский государственный университет, 664000, Иркутск, ул. К. Маркса, 1 тел.: (3952)521282 (e-mail: [email protected])
N. V. Kurganova, E. A. Lutkovskaya, V. A. Terletsky Identity of Optimality Conditions for Elastic Vibrations in Different Auxiliary Interpretations of Wave Problem
Abstract. In this paper an optimal control problem is considered, where the controlled process is described by a non-linear wave equation. The state vector consists of the solution for the non-linear wave equation and its first-order partial derivatives with respect to the independent variables. The vector of controls includes distributed and boundary controls. The statement of the problem allows any combinations of boundary conditions of the first, second, and third kinds on both left and right borders of the domain. For the initial optimal control problem two types of equivalent auxiliary optimal control problems are constructed. They differ by the ways of describing the controlled process. The first approach describes the controlled process by a hyperbolic system of four differential equations of the first order. The second approach uses one differential equation of the second order and two DE of the first order, identical to the ones used at the first equivalent problem. It is necessary to reduce the initial wave equation to the corresponding equivalent systems in order not only to construct a convenient concept of a generalized solution, but to obtain the necessary optimality conditions as well. In spite of formally different Pontryagin's functions used for the two equivalent control problems, it was proved that the corresponding conjugate problems take such forms that for the same set of controls the values of the Pontryagin's functions coincide throughout the domain. This property justifies identity of optimality conditions in forms of variational and Pontryagin's maximum principles, obtained for the both equivalent optimal control problems.
Keywords: optimal control, variational and Pontryagin's maximum principles, wave equation, conjugate problem.
References
1. Petrovsky I. G. Lectures on Partial Differential Equations. Dover Publ., New York, 1991.
2. Rozhdestvenskii B. L. and Yanenko N. N. Systems of Quasilinear Equations and Their Applications to Gas Dynamics. Amer. Math. Soc., New York, 1983.
3. Terletsky V.A., Lutkovskaya E.A. Variational Maximum Principle in the Problem of Optimal Control of Nonlinear Wave Processes (in Russian) Izvestiya Irkutskogo gosudarstvennogo universiteta. Seriya: Matematika [The Bulletin of Irkutsk State University. Series: Mathematics], 2010, vol. 3, no. 3, pp.105-117.
4. Terletskii V. A. and Lutkovskaya E. A. Generalized Solution of a Nonlinear Wave Equation with Nonlinear Boundary Conditions of the First, Second, and Third Kinds. Differential Equations, 2009, Vol. 45, No. 3, pp. 416-428. Pleiades Publishing, Ltd., 2009.
5. Tikhonov A.N., Samarskii A.A., Equations of Mathematical Physics. Courier Dover Publications, New York, 1990.
Kurganova Natalia Viktorovna, Master Student, Irkutsk State University, 1, K. Marx st., Irkutsk, 664003 tel.: +7(3952)521282 (e-mail: [email protected])
Lutkovskaya Ekaterina Alexandrovna, Candidate of Sciences (Physics and Mathematics), Irkutsk State University, 1, K. Marx st., Irkutsk, 664003 professor, tel.: +7(3952)521282 (e-mail: [email protected])
Terletsky Viktor Anatolievich, Candidate of Sciences (Physics and Mathematics), Irkutsk State University, 1, K. Marx st., Irkutsk, 664003 professor, tel.: +7(3952)521282 (e-mail: [email protected])