Серия «Математика»
2014. Т. 8. С. 7—28
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 517.97
О краевой задаче терминального управления с квадратичным критерием качества *
А. С. Антипин
Вычислительный центр им. А. А. Дородницына РАН, Москва Е. В. Хорошилова
Московский государственный университет им. М. В. Ломоносова
Аннотация. В гильбертовом пространстве рассматривается задача терминального управления с линейной динамикой, фиксированным левым и подвижным правым концом траектории. Целевой функционал представляет собой сумму интегральной и терминальной компонент квадратичного вида. В отличие от традиционного подхода, задача оптимального управления рассматривается не как задача оптимизации, а как седловая задача. Ее решением является седловая точка лагранжиана с компонентами: управление, прямая и сопряженная траектории, терминальные переменные. Для решения задачи предлагается седловой метод, доказывается его сходимость по всем компонентам седлового решения.
Ключевые слова: оптимальное управление, прямая и сопряженная траектории, функция Лагранжа, седловой метод, сходимость.
Данная статья написана под влиянием исследований, выполненных в [15], где решается линейно-квадратичная задача оптимального управления. В [15] задача интерпретируется как задача оптимизации, ее решение, соответственно, как экстремальная точка; приводится обоснование сходимости по функционалу нелокального метода решения. В настоящей работе мы также рассматриваем линейно-квадратичную задачу, которая, однако, теперь трактуется как седловая задача, и для этого есть серьезные основания. Динамика, т. е. ограничения типа равенств, в постановке задачи являются наиболее важной компонентой, которая
1. Введение
* Работа выполнена при финансовой поддержке РФФИ, грант 12-01-00783 и Программы государственной поддержки ведущих научных школ, НШ-4640.2014.1.
порождает прямую и сопряженную (двойственную) траектории. Сопряженную траекторию здесь можно понимать как нормаль опорного (линейного) функционала к ограничениям-равенствам в функциональном пространстве. Эти рассуждения приводят нас к мысли скаляризо-вать задачу и ввести функцию Лагранжа. Поскольку исходная задача линейно-выпуклая, то приходим к задаче вычисления седловой точки выпукло-вогнутой функции Лагранжа. Как известно [9, кн. 2, с. 653], в регулярном случае седловая точка всегда существует, и для вычисления этой точки необходимо использовать седловые методы. Седловая точка содержит целый набор компонент, это — управление, фазовая траектория, сопряженная траектория, а также конечномерные прямые и двойственные решения терминальных задач, если таковые имеются. В работе предлагается седловой итеративный процесс, который сходится по всем компонетам седлового решения.
2. Постановка задачи
Рассмотрим задачу терминального управления на конечном отрезке времени с линейной динамикой
й
—хН) = шът + в(г)и(г), ¿0 < £ < и, аЬ
где В(),Б() - пхи,пхт непрерывные матрицы, левый конец х(Ь0) = х0 фазовой переменной х(Ь) задан, а правый конец х(Ь\) = XI подвижен в пределах выпуклого многогранника М = {х1 € И"" : А1х1 < 01}, где А1 -постоянная матрица размерности тхп, т < п, вектор а1 фиксирован. Управления п(-) € и будем считать ограниченными в норме Ь2[Ьо,Ь1] (г < п):
и = е Ц^О,^] | < С5
Для любых управлений из И и заданного х(Ь0) система дифференциальных уравнений порождает траектории х(-), правые концы которых описывают множество достижимости Х1 = X(¿1) С И". В нашем линейном случае множество достижимости является, вообще говоря, подпространством, которое может совпадать с пространством И".
Минимизируемый функционал представлен суммой терминальной и интегральной компонент:
1 1 Г*1
-{Бхих 1> + - / ((д1(1)х(1),х(1)) + (д2(1)и(1),и(1)))ги,
2 2
где 5 - фиксированная положительно полуопределенная симметричная п х п матрица; Я1(),Я2(■) - непрерывные положительно полуопреде-
ленные симметричные матрицы размерностей п х п, г х г соответственно. Линеаризовав целевой функционал в точке (х*,х*(),п*(■)), сведем задачу его минимизации к вариационному неравенству
Г
(Бх*1,х1 - х*) + (Я1(г)х*(г),х(г) - х*(г))+ Ло
+(Я2(г)п*(г),п(г) - п*(г))(И > о.
Под решением дифференциальной системы будем понимать любую пару (х(-),п(-)) Е Ц1"[г0,г1] х и, удовлетворяющую условию
х(г) = х(г0) + [ (Б(т)х(т) + В(т)п(т))(т, ¿о < г < ¿1.
В [9, кн. 1, с. 443] показано, что любому управлению п(-) Е И в линейной дифференциальной системе отвечает единственная траектория х(-), и эта пара удовлетворяет вышеуказанному тождеству. Траектория х(-) в условиях данного тождества является абсолютно непрерывной функцией [14]. Класс абсолютно непрерывных функций представляет собой линейное многообразие, всюду плотное в Ь"[г0,г1]. Этот класс будем обозначать как АСп[г0, ¿г]. Для любой пары функций (х(-),п(-)) Е АОп[Ьо,г1 ] х И выполняется формула Ньютона-Лейбница и, соответственно, формула интегрирования по частям.1
С учетом сказанного запишем задачу в компактном виде:
(х1 ,х*( ),п*(■)) Е А^шт { (Бх*1,х1) +
С *1
+ ((ЯЛ^х*(г),х(г)) + (Я2(г)п*(г),п(г)))(г | Ах < аь ■Ьо
(
—х(Ь) = + х(Ьо) = хо, х(Ь\) = х\,
х1 Е И", х(^) Е АСп[го,Ь1], п(^) Е И} .
(2.1)
Таким образом, требуется найти управление п (■) Е И такое, что отвечающая ему траектория х (■) соединяет начальную точку х0 с точкой минимума х\ Е М целевого функционала на правом конце. Предполагается, что если множество достижимости является подпространством И"", оно имеет непустое пересечение с многогранником М Е И"".
В [9, кн. 2, с. 653] доказано, что решение (х\,х*( ),п*(■)) Е И" х Ь'1"[г0,г1] х И данной задачи существует.
Скалярные произведения и нормы определяются, соответственно, как (х(-),у(-)) = £Ш,у(г))м, ||*(.)||2 = //; \х(г)\Чг,
где (х(г),у(г)) = £х^г)у(), \х(г)\2 = £х2(г), го < г < ¿1. 11
и
п
3. Прямая и двойственная формы лагранжиана как связующие элементы прямой и двойственной задач
Задача (2.1) представляет собой задачу выпуклого программирования, сформулированную в гильбертовом пространстве. Проводя параллели между постановками задач в конечномерном и бесконечномерном пространствах, введем для (2.1) функцию Лагранжа
С(р1,ф(-); х1, х( ), и()) = (Бх*,х{) + (р1,А1х1 - 01)+ + Г ((Я1(Ь)х*(Ь),х(Ь)) + @2(Ь)п*(Ь),пЬ))аь+
■По
г а
Л0
при всех (Р1,ф(-)) € И^ х Ф"[Ьо,Ь1], (х1,х(-),п(-)) € И" х АС"[Ьо,Ь1] х И. Здесь ^"[Ьо, ¿1] — линейное многообразие абсолютно непрерывных функций из сопряженного пространства. Это множество всюду плотно в Ьо,Ь1], т. е. замыкание многообразия ^"[^,1-]]
по норме Ъ"[Ьо, ¿1] совпадает с Ь"[Ьо,Ь1]. В регулярном случае [10, с. 90] для линейно-выпуклой задачи (2.1) всегда существует седловая точка.
Седловая точка (р\,ф* (■); х\, х* (■), и* (■)) функции Лагранжа образована прямыми (х**,х*(^),и*(■)) и двойственными (р\,ф*() переменными, первые из которых являются решением задачи (2.1). По определению, седловая точка удовлетворяет системе неравенств
С(р1 ,ф(■); х1,х* (■),и* (■)) < С(р\,ф* (■); х* ,х* (■),и*(^)) <
< С(р1,ф* (■); х1 ,х(^),и(У, или, в развернутом виде,
(5х1 ,х\) + (р1,А1х*1 - а{) +
г
По
г а
+ / {ф(г), + - —<
Ло
< (Бх*^!) + (р*,А1 х*1 - а{) +
+ I ((Я1(Ь)х*(Ь),х*(Ь)) + ^2(Ь)и*(Ь),и*(Ь))) йЬ+
I
г*1 а
Но
Г*1
+ (Шь)х*(г),х* (ь)) + (Я2(ь)и*(ь),и*(ь))) аь+
По
г*1 а
+ / {ф*(*), + - —<
■П о
Но
О КРАЕВОЙ ЗАДАЧЕ С КВАДРАТИЧНЫМ КРИТЕРИЕМ КАЧЕСТВА 11 < (Бх*,х1) + (р^ЛгХг - а{) +
С11
+ (Шг)х*(г),х(г)) + Шг)п*(г),п(г))) Ло
г Ь1 (
+ / + - —хУ))<И (3.2)
Л0 ш
для всех (рьф(-)) е Щ х ], (хъх(-),п(•)) е И" X АС^о,^ х и.
Несложными преобразованиями от системы (3.2) можно вернуться к задаче (2.1).
Введем понятие двойственного лагранжиана и покажем, что он порождает двойственную задачу. Переходя к сопряженным линейным операторам и используя интегрирование по частям, выпишем сопряженную (двойственную) по отношению к (3.1) функцию Лагранжа:
С7(р1,ф(-); х\,х(-),п(-)) = (Бх* + Л^р! - ф1,х{) + (р1, -а{) + (фо,хо) + г ¿1 в
+ / + £>т(*ж*) + -гМ),х(г))м+
г ¿1
+ (Я2(г)п* (¿) + в т(г)ф(г),п(г))(г, (3.3)
Ло
У(р1,ф(-)) е Щ X Щго,Ь], (хъх(-),п(-)) е Ип х АСП^Ь] х И, где фо = ф(1о), ф1 = ф(^\). Множество седловых точек (р*,ф*(); х** ,х*(-), п*()) у обеих форм (3.1) и (3.3) лагранжиана одно и то же. Седловая система (3.2) в сопряженном варианте имеет вид
(Бх*1 + Лтр1 - ф1,х1) + (р1, -а^ + (фо,хо)+
+ / (Яг(г)х*(г) + от(г)ф(г) + -ф(г),х*(г))м+ г ¿1
+ (Я2(¿)п*(г) + вт(г)ф(г),п*(г))м < Ло
т
< (Бх* + Л{р\ - ф**,х1) + (р*, -а1) + (фо,хо)+
Г ¿1 (
+ / (д1(1)х*(1) + вт(1)ф*(1) + -ф*(1),х*(1))си+ Г ¿1
+ (Я2^)п*(г) + вт(г)ф*(г),п*(г))йг <
< (Бх* + Л^р* - ф*,х\) + (р*, -а{) + (фо,хо)+
+ / (Яг(г)х*(г) + вт(г)ф*(г) + -ф*(г),х(г))(И+ Ь 0 (
г 11
+ (Я2(ь)и*(г) + вТ(ь)ф*(ь),и(ь)}йь (3.4)
Ло
при всех (Р1,ф(-)) е И^ X Щ[¿0,¿1], (хг,х(-),и(■)) е И" х АСп[Ьо,Ь1] х и.
Из правого неравенства системы (3.4) с учетом того, что члены (фо,хо} взаимно уничтожаются, имеем
г а
(,8х\ + Ат1р*1-ф*1,х*1) + / {1)х*(1)+Вт(1)ф*(1) + -ф*{1),х*(1))(М+
Но
с*1
+ ®2(ь)и*(ь) + вт (ь)ф*(ь), и*(ь)}йь < Ло
г*1 й
<{Бх\+Ат1р*1-ф*1,х1) + / {Я1{1)х*(1) + Вт{1)ф*(1) + -ф*(1),х{1))(11+
Г11
+ (Я2^)и*(г) + вТ(ь)ф*(ь),и(ь)}йь Ло
при всех (х1 ,х(^),и(^)) е Ип х АСп[Ь0,Ь]_] х И.
В силу независимого изменения переменных XI, х(^) и и(^) в пределах своих допустимых подпространств (множеств), можно положить в последнем неравенстве, например, х( ) = х*(^), и(^) = и*(■) и получить (Бх\+ЛТр*-ф*,х*} < (Бх1+АТр\-ф**,х1}. Таким образом, неравенство распадается на три независимых вариационных неравенства
(Бх1 + ЛТр1 - ф1 ,х* - х1 }<0, х1 е Ип, (3.5)
Г *1
По
Шь)х* (ь) + оТ(ь)ф*(ь)+
й
+—ф*и),х*и)-хи))(и < 0, х(-) е АСпко,Ь}, (3.6)
аЬ
¡■Ь1
/ (Я2(Ь)и*(Ь) + вТ(Ь)ф*(Ь),и*(Ь) - и(ь)}аь < 0, и(^) е И. (3.7) Ло
(Ц2(Ь)и (Ь) + вТ/
>Ьо
В (3.5) линейная функция достигает конечного экстремума на всем пространстве И", что возможно лишь в случае, когда ее градиент обращается в нуль:
ф1 = Бх1 + ЛТ р1 (3.8)
(условие трансверсальности). Аналогично, в неравенстве (3.7) дифференцируемый функционал достигает конечного минимума при х(^) = х*(^) на всем линейном многообразии АСп[Ьо,Ь1 ], что возможно лишь в
случае, когда его градиент в этой точке равен нулю:
й
Яг^х*^) + + = 0 (3-9)
(система дифференциальных уравнений для сопряженной траектории в двойственной задаче).
Левое неравенство (3.4) с учетом (3.8),(3.9) принимает вид
(Бх1 + Лтр1 - ф1,х1) + (р1, -а1)+
П1 (
Н0 (
<"¿1 ( /¿0 М
г ¿1
+ (Я2(¿)п*(г) + вт(г)ф(г),п*(¿))м <
Г ¿1
< (р*, -ах) + Г (Я2(ь)п*(ь) + вт(г)ф*(г),п*(¿)(. ¿¿0
(Ч2(Ь)п
'¿0
Рассматривая это неравенство при скалярных ограничениях
т
(Бх* + Л{р1 - ф1,х\) = 0,
г ¿1 в
/ (Я1(г)х*(г) + вт(гЖг) + -М),х*(г))(И = о, (з.ю)
Л0 &
получим задачу максимизации
(р>1 - р1, -а1) + Г(вт(г)(ф(г) - ф*(г)),п*(г))м < о
для всех (р1 ,ф()) е Ир х Щ[Ьо,Ь1]. Но из (3.8),(3.9) следует, что решение ('p*,ф*(■)) одновременно принадлежит более узкому множеству, чем (3.10). Поэтому указанная точка остается минимумом и на подмножестве решений системы (3.10).
Объединяя последнее неравенство с условиями (3.7)-(3.9), получаем систему:
(р*,ф* (•)) е А^шах {(р1, -а1) + £ (ф(1),в(1)п*(1))(1 \ в
-ф(1) + ЯТ(*Ж*) = -адкед, Фх = Бх*! + АЪъ (3 п)
р1 е шр, ф(-) е Щго,Ь]},
гН
Г1
/ (Я2^)п*(г) + вт(г)ф*(г),п*(г) - п(г))(г < о, п(-) е и.
Это — двойственная задача по отношению к задаче (2.1). Исследование прямых и двойственных задач в совокупности порождает новые — седловые — подходы к их решению [2; 3; 4; 6; 16; 18].
4. Краевая дифференциальная система и метод седлового
типа для ее решения
В данном пункте предложен итеративный процесс для решения краевой дифференциальной системы. Рассматривая вместе левое неравенство седловой системы (3.2) и правое неравенство седловой системы (3.4), выпишем полученные из них условия и придем к следующей краевой задаче:
й
—= (¿) + ж*(¿о) = хо, (4.1)
(Р1 - р1, Лх - а1}<0, Р1 е И™, (4.2)
й
-ф*(1) + Вт(1)ф*(1) = -¿М^т Ф1 = 8х*1+А^р*1, (4.3)
Г11
/ (Я2(Ь)и*(Ь) + вТ(Ь)ф*(Ь),и*(Ь) - и(ь)}аь < 0, и(^) е И. (4.4) Ло
Решение системы (4.1)-(4.4) представляет собой седловую точку. Это значит, что если известно хо и управление и*(■), то можно решить дифференциальное уравнение (4.1) и найти траекторию х*(-). Затем, вычислив ее значение на правом конце х1 = х*(Ь)\г=г1, из (4.2) найти Р1. Сформировав условие трансверсальности, мы можем тогда решить сопряженную дифференциальную систему (4.3) и, найдя сопряженную траекторию ф*(■), убедиться в том, что заданное выше управление и*(^) является решением вариационного неравенства (4.4).
Отметим, что вариационные неравенства (4.2),(4.4) можно записать в эквивалентной форме уравнений с оператором проектирования на соответствующие выпуклые замкнутые множества [9, кн. 1, с. 215]:
р1 = п+(р1 + а(Л1х\ - а1)), (4.5)
и*(Ь) = пи(и*(Ь) - а(Я2(Ь)и*(Ь) + вТ(Ь)ф*(Ь))), (4.6)
где п+(^),пи(■) - операторы проектирования на положительный ортант пространства И™ и на множество управлений И, а > 0.
Используя (4.5)-(4.6), выпишем для решения системы (4.1)-(4.4) метод простой итерации: й
= + = хо, (4.7)
р1+1 = п+р + а(Л1 х'к - а1)), (4.8)
й
+ = -Яг^х^г), фк = вх\ + АЪ\, (4-9)
ик+1(Ь) = пи (ик (Ь) - а(Я2(Ь)ик (Ь) + вТ(Ь)фк (Ь))), к = 0,1,2,... (4.10)
В таком виде метод простой итерации не предназначен для вычисления седловых точек. Однако на его основе можно построить управляемый метод простой итерации, уже обладающий сходимостью к седловым точкам [12; 1]. В предлагаемом методе каждая итерация распадается на два полушага, за счет чего реализуется принцип обратной связи и обеспечивается сходимость. Общая концепция подхода изложена в [5; 6]. Другие подходы градиентного типа рассматривались многими авторами, в основном, применительно к методам решения вариационных
неравенств, в частности, отметим [17; 11] и [7; 8]. Формулы этого итеративного метода имеют вид:
1) прогнозный полушаг
а
-р-хки) = оа)хка) + ва)ика), хки0) = х0, и.п) аЬ
р\ = п+(ркх + а(Л1хк1 - аг)), (4.12)
а
^фк{1) + От(1)фк(1) = -ад)^), фк = Бхк + АЪ\, (4.13)
ик(Ь) = пи(ик(Ь) - а(Я2(Ь)ик(Ь) + Бт(Ь)фк(Ь))); (4.14)
2) основной полушаг
а
■^хки) = оа)хка) + вшка), хки0) = х0, (4.15)
аЬ
рк+к = п+(рк + а(Акхк - аг)), (4.16)
а
^фк(1) + Вт{1)фк{1) = -Я^1)хк{1), = Бх\ + АЪ\, (4.17) ик+к(Ь) = пи (ик (Ь) - а^2(Ь)ик (Ь) + Бт(Ь)фк (Ь))), к = 0,1,2,... (4.18)
Из формул этого процесса видно, что дифференциальные уравнения (4.11), (4.15) и (4.13), (4.17) используются только для вычисления функций хк(Ь) и Хк(Ь), фк (Ь) и фк (Ь), поэтому процесс можно записать в более
компактном виде
Рк = п+(рк + а(Агхк - аг)), (4.19)
рк+1 = п+(рк + а(А\хк - аг)), (4.20)
ик(Ь) = пи(ик(Ь) - а(Я2(Ь)ик(Ь) + Бт(Ь)фк(Ь))); (4.21)
ик+1(Ь)= пи(ик(Ь) - а(Я2(Ь)ик(Ь) + Бт(Ь)фк(Ь))), Ь <Е [Ь„,Ьг], (4.22) где хк(■), хк(■), фк(■) и фк(■) вычисляются в (4.11),(4.15),(4.13) и (4.17).
Для получения вспомогательных оценок, необходимых для доказательства теоремы о сходимости метода, представим операторные уравнения (4.19)—(4.22) в форме вариационных неравенств
{рк - рк - а(Агхк - аг),рг - рк) > 0, (4.23)
{Pki+1 - Vi - aAX - ai),pi - pk+1) > 0, (4.24)
Гll
/ {uk(t) - uk (t) + a(Q2(t)uk (t)+BT(t^k (t)),u(t) - uk (t))dt > 0, (4.25)
Jto
rtl
/ {uk+1(t) - uk(t) + a(Q2(t)uk(t) + BT(t)ÍJk(t)),u(t) - uk+1(t))dt > 0, Jto
(4.26)
выполняемых при всех p1 E R™, u(-) E U. Аналогично тому, как это делалось, например, в работах [4], [6], используя лемму Гронуолла [9, кн. 1, с. 472], можно получить следующие оценки:
\р\ - vk+1\< a\\A1\\\xk - xk\, (4.27)
\\uk(■) -uk+1(-)\\ < aQ2max\\uk(t) -uk(t)\\ + aBmaxф(■) -(0\\, (4.28)
\xk(t) - xk(t)\2 < e2Dmax(tl-to)B2maX(t1 - to)\\uk(■) - uk(-)\\2, (4.29)
\xk - xkk \2 < e2Dmax(tl-t0)B^ax(tk - to)\\uk(■) - uk(-)\\2, (4.30)
\xk(t) - x*(t)\2 < e2Dmax(tl-to)B2maX(t1 - to)\\uk(■) - u* (-)\\2, (4.31)
где Q2max = max\\Q2(t)\\, Bmax = max\\B(t)\\, Dmax = max\\D(t)\\, t E [to, 11 ]. Последняя из оценок, например, означает, что ограниченное множество управлений линейный оператор переводит в ограниченное множество траекторий.
Так же получаются оценки отклонений сопряженных траекторий:
Ф(t) - фk(t)\2 < e2Dmax(tl-t)\^k - ^k\2. (4.32)
Ф - ^\2 < e2Dmax(tl-t°)\^k - фk\2, (4.33)
Ф - ^k\2 < (\\S\\\xk - xk\ + \\AT\\\v1 - Vk\)2, (4.34)
ф - ф^\2 < 2e2Dmax(tl-t0)(\\S\\2\xk - x k\2 + \\AT\\2\pk - Pk\2), (4.35)
Ф(■) - фk(-)\\2 <
< ^2Dmax(tl-to) - l) /(2Dmax)(\\S\\\xk - x 1\ + \\AT\\\pk1 - pk\)2 < < (e2Dmax(tl-t°) - ^ /Dmax (\\S\\2\xk1 - xk\2 + \\AT\\2\pk - pk\2) , (4.36)
Ф(■) - Ф*()\2 < < ^e2Dmax(tl-to) - l) /(2Dmax)(\\S\\\xk - x\\ + \\AT\\\pk - V1\)2. (4.37)
5. Краткая схема доказательства сходимости метода
Покажем, что процесс (4.11)—(4.18) сходится к одному из решений исходной задачи.
Теорема (о сходимости метода). Если множество решений (р*,ф*(■); xl,x*(-),u*(-)) задачи (4.1)-(4.4) не пусто и принадлежит пространству R™ х ^[to,tl] х Rn х L'n[to,ti] x U, то последовательность {(pk,фк(■); xk,xk(),uk(•))}, порожденная методом (4.11)-(4.18) с длиной шага а, выбранной из условия 0 < а < min < / } . , / 1, к 7 1 у I V71 +73+7о VY2+Y4 )'
где Yi находятся в (5.13) — (5.15)1, сходится к решению задачи. При этом:
1) сходимость по управлениям - слабая, по фазовым и сопряженным траекториям, а также по переменной р1 - сильная;
2) последовательность ||р^ — pl\2 + \\uk(■) — u*(ОЩг j монотонно убывает на декартовом произведении R™ х L22[t0,tl].
Доказательство. Основные усилия в теореме направлены на получение оценок \uk(t) — u*(t)\2 и \pk — р*\2.
1. Запишем уравнение (4.17) в виде вариационного неравенства
{Sxk + AJ pk — фk, x** — x k)+
С ti d
+ / {Qi(t)xk(t)+DT(t)^k(t) + ^ijk(t),x*(t)-xk(t))dt > 0. Jt0 dt
Аналогично поступим с уравнением (4.3):
— {Sx** + Ajp* — ф*,x* — xk) — г ti d
/ iQi(t)x*(t) + DT(t№(t) + ^*(t),x*(t) - xk(t))dt > 0. Jt0 dt
Сложим полученные неравенства
{S (x k — x*) + Aj(pk — p*) — ф — ф**)^** — x k)+
+ f{Qi(t)(xk (t)—x*(t))+DTmk (t)—ф*^))+
J to
d
+Jt(^k(t) - ф*(1)),х*(1) - xk(t))dt > 0. (5.1)
Используя формулу интегрирования по частям и учитывая, что x0 = x!k = x0, преобразуем дифференциальный член левой части (5.1) (это преобразование означает переход к сопряженному дифференциальному оператору). Сокращая затем подобные члены, получим неравенство
{S (xk — xl),x* — xk) + {AJ(pk — p*),xl — xk)+
r ti
+ {Qi(t)(xk (t) — x*(t)),x* (t) — xk(t))dt+ J to
1 См. доказательство теоремы далее.
С*1 И
Ло
В силу симметричности и положительной полуопределенности матриц Б и Ql(t) имеем
Г *1
(Б(хк - х1),х1 - хк)<0, / ^1(г)(хк(г) - х*(г)),х*(г) - хк(г))иг < о,
Ло
поэтому, отбрасывая эти члены и усиливая оценку, получим
(Ат(рк - р1),х\ - х к)+
+ / - ОД(^) - хк(1)) - - хктм > о. (5.2)
Jt0
2. Получим неравенство относительно переменной р1. Для этого положим р1 = рк+1 в (4.23):
(рк - Рк1 - а(А1хк - а1),рк+1 - р1) >0.
Добавим и вычтем а(Акхк - ак,рк+1 - рк):
(рк - рк1,рк1+1 - рк\) + а ((А х - а к) - (А к х I - а к ),рк+1 - ■рк1)-
-а(Акхк - ак,рк+1 - 'рк) > 0, Используя (4.27), оценим второе слагаемое
(рк - рк,рк+1 - рк) + а2\\АI\\2\хк - хк\2 - а(А^ - аърк+1 - рк) > 0.
Положим рк = рк в (4.24):
(рк+к - рк,рк - рк+к)-а(АкХк - ак,рк - рк+к) > 0.
Сложим полученные неравенства
(рк- р к,р к+к - рк) + р+к - рк,р * - рк+к)+
+а2\\А к\\2\хк - хк\2 - а(Акх1 - ак,р*к - рк) > 0, Полагая рк = рк в неравенстве (4.2), имеем
а(р* - рк, Акхк - ак) > 0. Суммируем два последних неравенства
(рк- Л,рк+к - рк) + (рк+к - рЬр* - р1 + к) +
+а2\\А к\\2\хк - хк\2 - а(Ак(хкк - х *к),рк - рк) >0. (5.3)
3. Продолжим получение оценок. Рассмотрим неравенства относительно управлений. Положим u( ) = uk+1( ) в (4.25)
г tl
/ {uk(t) - uk(t) + a(Q2(t)uk(t) + BT(t^k(t)),vk+1(t) - uk(t))dt > 0.
Jto
Разобьем левую часть на три отдельных слагаемых Г {uk(t) -uk(t),uk+1(t) -uk(t))dt+a í* {Q2(t)uk(t),uk+1(t) -uk(t))dt+
to to
f tl
+a {BT(t^k(t),uk+1 (t) - uk(t))dt > 0,
to
добавим и вычтем uk(t) под знаком второго скалярного произведения, и аналогично добавим и вычтем фk (t) под знаком третьего скалярного произведения:
í l{uk(t) - uk(t),uk+1 (t) - uk(t))dt+
to
r tl
+a {Q2(t)(uk(t) - uk(t)),uk+1 (t) - uk(t))dt+
to
f tl
+a {Q2(t)uk(t),uk+1(t) - uk(t))dt+
to
+a í11 {BT(t)^k(t) - фk(t)),uk+1 (t) - uk(t))dt+
to
rtl
+a í l {BT(t^k(t),uk+1 (t) - uk(t))dt > 0. (5.4)
to
BTn\J,ku\ „,k+1n\ ¡r.k(
to
Положим u = u* (■) в (4.26)
rtl
/ {uk+1(t) - uk(t) + a(Q2(t)uk(t) + BT(t^k(t)),u*(t) - uk+1(t))dt > 0.
to
Сложим (5.4) и (5.5), тогда r tl
(5.5)
í l{uk(t) - uk(t),uk+1 (t) - uk(t))dt+
to
f tl
+ / {uk+1(t) - uk(t),u*(t) - uk+1(t))dt+
to
Г tl
+a {Q2(t)(uk(t) - uk(t)),uk+1 (t) - uk(t))dt+
to
Г11
+а (Я2^)ик(г),и*(г) - ик(г))сг+
Ло
+а (вт(г)(фк(г) - фк(г)),ик+1 (г) - ик(г))сг+ Ло
+а (вт(г)фк(г),и*(г) - ик(г))сг > о. (5.6)
Ло
Подставляя и(г) = ик(г) в вариационное неравенство (4.4), имеем
г н
-а (Я2(г)и*(г) + вт(г)ф*(г),и*(г) - ик(г))сг > о. (5.7)
Л го
(Ц2(г)и (г) + В
По
Суммируем (5.6) и (5.7)
Г *1
[ 1 (ик(г) - ик(г),ик+1 (г) - ик(г))сг+ Ьо
г гл
+ (ик+1(г) - ик(г),и*(г) - ик+1(г))сг+ Ьо г гл
+а (Я2(г)(ик(г) - ик(г)),ик+1 (г) - ик(г))сг+
^го
Г г1
+а (Я2(г)(ик(г) - и*(г)),и*(г) - ик(г))сг+ Ьо
сП
+а (вт(г)(фк(г) - Фк(г)),ик+1 (г) - ик(г))сг+
Ло
По
¡■г1
+а (фк(г) - ф*(г),в(г)(и*(г) - ик(г)))сг > о. (5.8) Ло
Умножим (5.2) на а и сложим с (5.8)
а(АТ(Рк -р*),х1 - хк) + а [^(Фк(г) - ф*(г),Б(г)(х*(г) - хк(г))+
'го
с
(■г1
кк
+ [1 (ик(г) - ик(г),ик+1(г) - ик(г))сг+
о
г гл
+ (ик+1(г) - ик(г),и*(г) - ик+1(г))сг+
о
г гл
+а (Я2(г)(ик(г) - ик(г)),ик+1 (г) - ик(г))сг+
о
о
Г
+а ^2(г)(ик(г) - и*(г)),и*(г) - ик(г))иг+ Ло
+а (Бт(г)(фк(г) - фк(г)),ик+к(г) - ик(г))иг > 0. (5.9) Ло
В силу (4.1) и (4.15) первый из интегралов обнуляется и, отбрасывая отрицательный член а ^2(г)(ик(г) - и*(г)),и*(г) - ик(г))Иг, имеем
а(Ат(рк - рХ),х\ - хк)+
Г
+ (ик (г) - ик (г), ик+к (г) - ик (г)) Иг+ Ло
+ 111 (ик+к(г) - ик (г),и * (г) - ик+к(г))иг+ Ло
Г
+а ^2(г)(ик(г) - ик(г)),ик+к(г) - ик(г))иг+ Ло
+а (Бт(г)(фк(г) - фк(г)),ик+к(г) - ик(г))иг > 0. (5.10) Ло
Сложим (5.3) и (5.10)
(рк - рк ,рк+к - рк) + (рк+к - рк, р * - рк+к) + а2\\А к\\2\х1 - хк\2 +
+ (11 (и1 (г) - ик(г),ик+к(г) - и 1 (г))иг+ Ло
Г
+ (ик+к (г) - ик (г),и * (г) - ик+к (г))иг+ Ло
Г
+а ^2(г)(ик(г) - ик(г)),ик+к(г) - ик(г))иг+ Ло
+а (Бт(г)(фк(г) - фк(г)),ик+к(г) - ик(г))иг > 0. (5.11)
Ло
4. Умножив неравенство (5.11) на 2 и используя тождество 2(ук -Уз,Уз - У 2) = \у к - У 2 \2 - \у к - Уз\2 - \уз - У2\2, разложим первые четыре скалярных произведения в сумму квадратов. Сократив затем подобные члены и умножив на минус единицу, перепишем неравенство в виде
\рк+к - рк\2 + \рк - рк\2 + \рк+к - рк\2 - 2а2\\Ак\\2\хк - хк\2+
+ \\ик+к(•) - и*(-)\\2 + \\ик(•) - ик+к(-)\\2 + \\ик(•) - ик(-)\\2+ г
+2а ^2(г)(ик(г) - ик(г)),ик+к(г) - ик(г))иг+ Ло
rti
+2a Î 1 (БT(Щфk(t) - фк(t)),uk+k (t) - uk(t))dt <
Jto
Б T
'to
„*|2 i î\„.k(\ „.*( Ml2
<\pf - р\\2 + \\uk(■) - U(■)
Используя неравенство Коши - Буняковского, оценим оставшиеся слагаемые в форме скалярных произведений:
\p\+i - рк\2 + \рк - pk\2 + \pk+1 - рk\2 - 2а2\\А42\хк - xk\2+
+ \\uk+(-) - u*(0\\2 + \\Uk(■) - uk+k(-)\\2 + \\uk(■) - Uk(0\\2-2aQ2max\\uk (t) - uk (t))\\\\uk+k (t) - uk (t)\\-
-2aBmaxUk (■) - фk (-)\\uk+ k (■) - uk (■)\\<\pk - P*\2 + \\uk (■) - u* (-)\\2.
(5.12)
а) Используя (4.28) и неравенство 2ab < a2 + b2, получим
2аБтах\\Фk(■) - фk(-)\\uk+k(■) - uk(.)\\<
< a2BmaX(Qmmax + 2Bm*x) \\фk (■) - фk(■) \!2 + a2BmaxQmmax \\uk (t) - uk(t) \!2. В силу (4.36) и (4.30)
\\фk(■) -Фk(-)H2 <
< ^Dmax(tl-to) - 1) /Dmax ) x
x\\S\\2e2Dmax(tl-to)B2max (t k - to)\\uk (■) - uk (.)\\2 +
+ {{e2Dmax(tl-to) - l) /Dmax) \\AT\2\pk - Pk\2 =
= Xk\\uk)■) - uk(0\\2 + \m\pk - pk\2, где X k = ((e2Dmax(ti-to) - i) /Dm*,) \\S\\2e2D—(ti-to)B2maX(tk - to), Xm = ((e2Dmax(tl-to) - l) /Dm*x) \\AT\\2, поэтому имеем
2aBm*xUk(■) - фk(-)\\uk+k(■) - uk(.)\\<
< a2 Bm*x((Qmm*x + 2Bm*x)X k + Qmmax )\\uk (t) - uk (t)f + +a2Bm*x(Qmmax + 2Bm*x)Xm\pk - Pk\2 = = a2 Y k \\uk (t) - uk (t)\\2 + a2Y2\pk - р k \2,
где Yk = Bm*x((Q2m*x + 2Bm*x)Xk + Q2m*x), Y2 = Bm*x(Q2m*x + 2Bm*x)X2.
(5.13)
б) Аналогично
2aQmm*x\\uk(t) - uk(t))\\\\uk+k(t) - uk(t)\\ < < a2Y3\\uk(■) - uk(-)\\2 + a2Y4\pk - Pi\2,
О КРАЕВОЙ ЗАДАЧЕ С КВАДРАТИЧНЫМ КРИТЕРИЕМ КАЧЕСТВА 23 где Y3 = Q2 max (2Q2 max + B max + B max A^ Y4 = Q2 max BmaxA2. (5.14)
в) В силу (4.30)
2a2\\А1\\2\х\ -xi\2 < 2a2||Ai||2e2Dmax(tl-to) B^h -to)\\uk(■) -uk(0\\2 =
= a2To\\uk (■) - Uk (.)\\2, где 75 = 2\\Ai\\2e2D— (tl-to) B^h - to). (5.15) C учетом полученных оценок неравенство (5.12) примет вид
\pk+1 - Pi\2 + \Uk+1(-) - u* (.)\\2 + \pk+1 - pk\2 + (1-a2(Y2 + ъШ - pi\2+
+ \\Uk(■) - uk+1(-)\\2 + (1 - a2(j1 + Y3 + Y5))\\uk(■) - Uk(.)\\2 <
<\p! - P1\2 + \\uk (■) - u* (.)\\2. (5.16)
Выбирая значение параметра a из условия
0 < а < min I . 1 , —1 1 , (5.17)
I \/7i + 73 + 75 V72 + 74 J
можно обеспечить положительность всех слагаемых в левой части (5.16). Отбрасывая в (5.16) часть положительных членов, получим
\pk+1 - p1\2 + \\uk+1 (■) - u*(.)\\2 < \pk - p1 \2 + \\uk(■) - u*(.)\2. (5.18)
что означает монотонное убывание {\pk - p 1 \2 + \\uk(■) - u*(-)\\2}. 5. Просуммируем неравенство (5.16) от k = 0 до k = N:
\pN+1 - p*\2 + \\uN+1(0 - u*(-)\\2 +
N N
+ Е \ pk+1 - pk\2 + (1 - a2(Y2 + Y4))J2 \Pk - pi\2+ k=0 k=0 NN
+ E \\uk(■) - uk+1(■) \\2 + (1 - a2(Y1 + Y3 + Y5)) E \\uk(■) - uk(-)\\2 <
k=o k=o
< \ p°1 - p1 \2 + \\uo(0 - u*(-)\\2. (5.19)
Из неравенства (5.19) следует ограниченность при любом N
\pN+1 - p1 \2 + \\uN+1(0 - u*(0\\2 < \ p°1 - p1 \2 + \\uo(0 - u*(0\\2, (5.20) а также сходимость рядов
Е\pki+1 -p1 \2<ж, Е\pki-pki\2<ж
k=o k=o
£ \\uk(■) - uk+l()\\2 < ж, Е \\uk(■) - u%)\\2 < ™
k=o k=o
\ p1+1 - pk \ -0, \\uk+1 {■) - uk (■)\\-0. (5.22)
и, следовательно, стремление к нулю величин
\ pk+1 - Pki \ -0, p - p1 \ -0, \\uk (■) - uk+1()\-0, \\uk (■) - uk (■)!—0,
1 1 1 1 (5.21) откуда по неравенству треугольника получим
u
Из (4.29), (4.30), (4.36) тогда следует, что
\ xk(t) - xk(t)\ - 0, \ xk - xk\ - 0, \\фк(■) - ф1(■)! - 0. (5.23) Кроме того, из (5.22) следует ограниченность последовательностей
\ pk - p1 \ < const, \\uk(■) - u*(-)\\ < const, (5.24) а из (4.31) и (4.37) — ограниченность последовательностей
\\xk (■) - x* (■)!< const, \ xk - x1 \ <const, \\фk (■) - ф * (■)!< const. (5.25)
6. Поскольку последовательность {p ,фk (■); xi,xk (),uk (■))} ограничена на декартовом произведении пространств R™ х Ф2n[t0,t1] х Rnx ACn[t0,t1] х U, то она слабо компактна [13]. Это означает, что существует подпоследовательность {(p1 ,фki(■);x1 ,xki(),uki(■))} и точка (p1,ф (■); x1,x (■),u (■)), которая является ее слабым пределом. Теперь нам надо показать, что слабый предел этой последовательности является решением задачи (4.1)-(4.4).
Заметим, что все линейные дифференциальные операторы системы (4.28)-(4.36) являются слабо непрерывными [13], и потому допускают переход к слабому пределу. Перейдем в базовом полушаге (4.15)-(4.18) к слабому пределу при ki -ж с учетом (5.21)-(5.25) и учетом того факта, что x1 £ Rn, получим
d / i ii —x'(t) = D(t)x\t) + B(t)u (t), x\to) = xq,
p1 = n+(p1 + a(A1x'1 - a1)),
d
—ф\г) + DT(t)i/(t) = -Qi{t)x!{t), ф[ = Sxi + Ajp[. (5.26)
Остается показать, что переход к слабому пределу возможен и для функционального операторного уравнения (4.18) (или (4.14)). В силу ограниченности печатного пространства приведем краткую схему рассуждений, соответствующие детали можно посмотреть в [4; 5; 6]. Уравнение (4.18) эквивалентно задаче минимизации квадратичной функции на шаре. Эта задача относится к задачам выпуклого программирования и, в свою очередь, может быть сведена к задаче вычисления
седловой точки функции Лагранжа на всем пространстве. Необходимые (и достаточные в нашем случае) условия экстремальных задач из седловой системы приведут нас к системе двух линейных уравнений, определенных безо всяких ограничений, и для которых возможен слабый переход. В результате этого перехода мы получим уравнение
и (г) = пи (и' (г) - а^(г)и (г) + вт(г)ф' (г))). (5.27)
Таким образом показано, что (4.18) допускает переход к слабому пределу в форме (5.27) по подпоследовательности {ик}, г — ж. Если уравнение (5.27) добавить к системе (5.26), то получим полную систему, которая является предельной для (4.11)—(4.18) при ^ — ж. В этом случае можно считать, что
(Ръф'(■); Х 1, х (-),и (■)) = (р1,ф *(■); х 1,х * (-),и* (■)). Теорема доказана. □
Система (4.1)-(4.4) представляет собой необходимое (а в выпуклом случае и достаточное) условие решения задачи в форме принципа Лаг-ранжа (седлового принципа). Осталось отметить, что по переменным (р\,и(-)) процесс сходится монотонно по норме прямого произведения пространств этих переменных. В [9, кн. 2, с. 910] показано, что по переменным (х(-), ф(-)) - сходимость сильная, т.е. по норме пространства ЬП[го,г 1 ]. В пространстве конечномерных переменных сходимость также сильная.
6. Заключение
В работе краевая задача оптимального управления трактуется как седловая задача. Получены необходимые и достаточные седловые условия в форме дифференциальной системы, близкой к принципу максимума Понтрягина. Сформулирован седловой процесс, доказана его слабая сходимость по управлениям, сильная — по траекториям (фазовой и сопряженной) и по конечномерным переменным.
Список литературы
1. Антипин А. С. Об одном методе отыскания седловой точки модифицированной функции Лагранжа / А. С. Антипин // Экономика и мат. методы. - 1977. -Т. 13, вып. 3. - С. 560-565.
2. Антипин А. С. О методах экстраградиентного типа для решения задачи оптимального управления с линейными ограничениями / А. С. Антипин, Е. В. Хорошилова // Изв. Иркут. гос. ун-та. Сер. Математика. - 2010. - Т. 3, № 3. - С. 2-20.
3. Антипин А. С. Метод модифицированной функции Лагранжа для задач оптимального управления со свободным правым концом / А. С. Антипин // Изв. Иркут. гос. ун-та. Сер. Математика. - 2011. - Т. 4, № 2. - С. 27-44.
4. Антипин А. С. Терминальное управление краевыми задачами выпуклого программирования / А. С. Антипин, Е. В. Хорошилова // Оптимизация и приложения. - 2013. - Вып. 3. - С. 17-55.
5. Антипин А. С. Терминальное управление краевыми моделями / А. С. Антипин // Журн. вычисл. математики и мат. физики. - 2014. - Т. 54, № 2. - С. 257-285.
6. Антипин А. С. Оптимальное управление со связанными начальными и терминальными условиями / А. С. Антипин, Е. В. Хорошилова // Тр. Ин-та математики и механики УРО РАН. - 2014. - Т. 20, № 2. - С. 7-22.
7. Васильев Ф. П. Экстраградиентный метод поиска седловой точки в задаче оптимального управления / Ф. П. Васильев, Е. В. Хорошилова // Вестн. Моск. ун-та. Сер. 15, Вычисл. математики и кибернетики. - 2010. - № 3. - С. 18-23.
8. Васильев Ф. П. Регуляризованный экстраградиентный метод поиска седловой точки в задаче оптимального управления / Ф. П. Васильев, Е. В. Хорошилова, А. С. Антипин // Тр. Ин-та математики и механики УрО РАН. - 2011. - Т. 17, № 1. - С. 27-37.
9. Васильев Ф. П. Методы оптимизации : в 2 кн. / Ф. П. Васильев. - М. : МЦНМО, 2011.
10. Иоффе А. Д. Теория экстремальных задач / А. Д. Иоффе, В. М. Тихомиров. - М. : Наука, 1974. - 479 с.
11. Коннов И. В. Нелинейная оптимизация и вариационные неравенства / И. В. Коннов. - Казань : Казан. ун-т, 2013. - 508 с.
12. Корпелевич Г. М. Экстраградиентный метод для отыскания седловых точек и других задач / Г. М. Корпелевич // Экономика и мат. методы. — 1976. - Т. 12, вып. 6. - С. 747-756.
13. Люстерник Л. А. Элементы функционального анализа / Л. А. Люстерник, В. И. Соболев. - М. : Наука, 1965. - 520 с.
14. Натансон И. П. Теория функций вещественной переменной / И. П. Натансон. -М. : Гос. изд-во техн.-теорет. лит., 1957. - 552 с.
15. Срочко В. А. Линейно-квадратичная задача оптимального управления: обоснование и сходимость нелокальных методов решения / В. А. Срочко, Е. В. Ак-сенюшкина // Изв. Иркут. гос. ун-та. Сер. Математика. - 2013. - Т. 6, № 1. -С. 89-100.
16. Хорошилова Е. В. Экстраградиентный метод в задаче оптимального управления с терминальными ограничениями / Е. В. Хорошилова // Автоматика и телемеханика. - 2012. - Вып. 3. - С. 117-133.
17. Facchinei F. Finite-Dimensional Variational Inequalities and Complementarity Problems / F. Facchinei, J.-S. Pang. - Springer-Verlag, 2003. - Vol. 1.
18. Khoroshilova E. V. Extragradient-type method for optimal control problem with linear constraints and convex objective function / E. V. Khoroshilova // Optim. Lett. - 2013. - Vol. 7, № 6. - P. 1193-1214.
Антипин Анатолий Сергеевич, доктор физико-математических наук, профессор, Вычислительный центр имени А. А. Дородницына РАН, 119333, Москва, ул. Вавилова, 40, тел.: (499) 1356161 (e-mail: [email protected])
Хорошилова Елена Владимировна, кандидат физико-математических наук, доцент, Московский государственный университет
им. М. В. Ломоносова, 119333, Москва, 1-52, Ленинские горы, тел.: (495) 9393010 (e-mail: [email protected])
A. S. Antipin, E. V. Khoroshilova
A Boundary Value Problem of Terminal Control with a Quadratic Criterion of Quality
Abstract. In a Hilbert space, we consider the problem of terminal control with linear dynamics, fixed left end and moving right end of the trajectories. On the reachability set (under additional linear constraints) the objective functional as the sum of integral and terminal components of the quadratic form is minimized. To solve the problem, we do not use the classical approach based on the consideration of the optimal control problem as an optimization problem. Instead, the saddle-point method for solving the problem is proposed. We prove its convergence.
Keywords: terminal programmed control, method of saddle-point type, Lagrange function, quadratic objective functional, convergence.
References
1. Antipin A. S. One method of finding a saddle point of a modified Lagrange function (in Russian). Economics and Mathematical Methods, 1977, vol. XIII, issue 3, pp. 560-565.
2. Antipin A. S., Khoroshilova E. V. On extragradient type methods for solving optimal control problem with linear constraints (in Russian). Proceedings of ISU. Mathematics, 2010, vol. 3, № 3, pp. 2-20.
3. Antipin A. S. Modified Lagrange function method for optimal control problems with free right end (in Russian). Proceedings of ISU. Mathematics, 2011, vol. 4, № 2, pp. 27-44.
4. Antipin A. S., Khoroshilova E. V. Terminal control boundary value problems of convex programming (in Russian). Optimization and application, 2013, issue 3, pp. 17-55.
5. Antipin A. S. Terminal control boundary models (in Russian). Computational Mathematics and Mathematical Physics, 2014, vol. 54, № 2, pp. 257-285.
6. Antipin A. S., Khoroshilova E. V. Optimal control related initial and terminal conditions (in Russian). Proceedings of the Institute of Mathematics and Mechanics UB RAS, 2014, vol. 20, № 2, pp. 7-22.
7. Vasil'ev F. P., Khoroshilova E. V. Extra-gradient method for finding a saddle point in the optimal control (in Russian). Bulletin of Lomonosov Moscow State University. Series 15. Computational Mathematics and Cybernetics, 2010, № 3, pp. 18-23.
8. Vasil'ev F. P., Khoroshilova E. V., Antipin A. S. Extragradient regularized method for finding a saddle point in the optimal control problem (in Russian). Proceedings of Institute of Mathematics and Mechanics, UB RAS, 2011, vol. 17, № 1, pp. 27-37.
9. Vasil'ev F. P. Optimization Methods. In 2 books (in Russian). Moscow, 2011.
10. Ioffe A. D., Tikhomirov V. M. Theory of extremal problems (in Russian). Moscow, 1974, 479 p.
11. Konnov I. V. Nonlinear optimization and variational inequalities (in Russian). Kazan, 2013, 508 p.
12. Korpelevich G. M. Extragradient method for finding saddle points and other problems (in Russian) Economics and Mathematical Methods, 1976, vol. XII, issue 6, pp. 747-756.
13. Lyusternik L. A., Sobolev V. I. Elements of functional analysis (in Russian). Moscow, Nauka, 1965.
14. Natanson I. P. Theory of functions of a real variable (in Russian). Moscow, 1957, 552 p.
15. Srochko V. A., Aksenyushkina E. V. Linear-quadratic optimal control problem: rationale and convergence of nonlocal methods for solving (in Russian). Proceedings of ISU. Mathematics, 2013, vol. 6, № 1, pp. 89-100.
16. Khoroshilova E. V. Extragradient method in optimal control problem with terminal constraints (in Russian). Automation and Remote Control, 2012, issue 3, pp. 117133.
17. Facchinei F., Pang J.-S. Finite-Dimensional Variational Inequalities and Complementarity Problems. Springer-Verlag, 2003, Vol. 1.
18. Khoroshilova E. V. Extragradient-type method for optimal control problem with linear constraints and convex objective function. Optim. Lett., 2013, vol. 7, № 6, pp. 1193-1214.
Antipin Anatoly Sergeevich, Doctor of Sciences (Physics and Mathematics), Professor, Computing Center of Russian Acafemy of Sciences, 40, Vavilova St., Moscow, 119333, (499) 1356161 (e-mail: [email protected]) Khoroshilova Elena Vladimirovna, Candidate of Sciences (Physics and Mathematics), Associate Professor, Lomonosov Moscow State University, Faculty of Computational Mathematics and Cybernetics, 1-52, Lenins-kiye Gory, Moscow, 119991, tel.: (495) 9393010 (e-mail: [email protected])