Владикавказский математический журнал Октябрь-декабрь, 2004, Том 6, Выпуск 4
УДК 517.5
ОБОБЩЕННАЯ ТЕОРЕМА ОБ ОБРАТНОЙ ФУНКЦИИ И ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ С ОГРАНИЧЕНИЯМИ1
Г. Г. Магарил-Ильяев
Дорогому Владимиру Михайловичу с благодарностью за дружбу
Используя метод Ньютона, доказывается некоторый вариант теоремы об обратной функции для функций, определенных на конусе. В качестве следствия выводится теорема о необходимых условия экстремума в задаче с ограничениями типа равенств, неравенств и включений.
Основная мотивировка получения необходимых условиях экстремума в конечномерной задаче с ограничениями типа равенств и неравенств для функций, определенных на выпуклом конусе, связана с необходимыми условиями экстремума в задаче оптимального управления, доказательство которых сводится именно к такой задаче (см. [1]). Ее бесконечномерный аналог доказан (при схожих предположениях) в работе [2], как следствие других, более общих утверждений. Приводимое здесь доказательство непосредственно и вполне элементарно: оно использует лишь классический метод Ньютона последовательных приближений и стандартную теорему отделимости для выпуклых множеств. Отметим, что доказанное утверждение приспособлено для получения необходимых условий экстремума в задаче оптимального управления в классе кусочно-непрерывных управлений. Для измеримых управлений требуется аналогичный результат, но при несколько более слабых предположениях. Он доказан, используя теорему Брауэра о неподвижной точке, в работе [3].
Для формулировки результатов и их доказательств необходимы некоторые определения. Мы будем иметь дело с функциями многих переменных, т. е. с функциями, определенными на подмножествах пространства И", которое рассматриваем как совокупность
( Х1 \
вектор-столбцов х =
T
n)
. Ради экономии места будем писать так: х = (х1,..., хп)
\ Хп }
где Т означает транспонирование. Наряду с пространством Нп будем также рассматривать пространство (К")', элементы которого суть вектор-строки (т. е. те же наборы из п действительных чисел, но расположенные в строку). Пусть а = (й1,... ,ап) £ (К")' и х = (х1,..., хп)т £ Нп. Обозначим а • х = ^1 т. е. — это матричное произведение
© 2004 Магарил-Ильяев Г. Г.
1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (гранты №02-01-39012 и №02-01-00386), программ государственной поддержки ведущих научных школ Российской Федерации (НШ-304.2003.1) и «Университеты России» (УР.04.03.067), а также при поддержке U.S. CRDF-R.F. Ministry of Education Award VZ-0100-0.
вектор-строки a на вектор-столбец ж. Для каждого a £ (К"")' отображение ж ^ a ■ ж, очевидно, есть линейная функция (функционал) на Ж".
Пусть ж = (xi,...,X")T £ Ж". Величина |x| = \/ж2 + ... + ж" (или короче, |x| = VxT ■ x) — это длина (или модуль, или евклидова норма) вектора x. Пусть ж £ Ж" и 6 > 0. Открытый шар и замкнутый шар с центром в точке ж радиуса 6 обозначаем соответственно U(ж; Ж") = {x £ Ж" : |x — ж| <6} и B(ж; Ж") = {x £ Ж" : |x — ж| ^ 6}. Множество в Ж" открыто, если с каждой своей точкой оно содержит и некоторый шар с центром в этой точке. Окрестность точки — любое открытое множество, содержащее данную точку.
Пусть Л: Ж" ^ Ж5 — линейный оператор. Мы будем отождествлять его с его матрицей в стандартных базисах Ж" и Ж5, так что если ж £ Ж", то Лж — произведение матрицы Л на вектор ж. В частности, если s = 1, т. е. Л = l — линейный функционал, то l(x) = a ■ ж, где a = (l(ei),..., 1(в")) и ei,..., в" — стандартный базис в Ж".
Норма оператора Л определяется обычным образом: ||Л|| = max|x|^i |Лж|.
Пусть M — подмножество Ж" и ж £ M. Будем говорить, что отображение F: M ^ Жs строго дифференцируемо в ж относительно M, если найдется такой оператор Л: Ж" ^ Ж5, что для любого е > 0 существует 6 > 0 такое, что всех ж', ж'' £ U(ж; Ж") П M выполняется неравенство
|F(ж') — F(ж'') — Л(ж' — ж'')| < е|ж' — ж''|. (1)
Оператор Л будем обозначать _F'(x) и называть производной отображения F в точке x относительно множества M. В частности, если s = 1, т. е. если задана функция f: M ^ Ж, то говорим о строгой дифференцируемости f в ж относительно M и соответствующий линейный функционал (элемент (Ж")') обозначаем /'(ж).
Если M — окрестность точки ж, то (1) — стандартное определение строгой дифференцируемости отображения F в точке ж (см. [1], стр. 139). В этом случае, как легко видеть, F дифференцируемо в ж и Л = F'(ж) — производная F в точке ж. В частности, если s = 1 (т. е. имеем дело с функцией f), то ее производную обозначаем f'(x). Из дифференцируемости отображения F в точке ж не следует, вообще говоря, его строгая дифференцируемость в этой точке, но если F непрерывно дифференцируемо в некоторой окрестности ж, то оно строго дифференцируемо в ж (см. там же).
Покажем, что если отображение F: M ^ Жs строго дифференцируемо в ж относительно M, то существует такая окрестность Uo точки ж, что F непрерывно на Uo П M. Действительно, пусть 6 > 0 такое, что (1) выполняется с е = 1. Положим Uo = ^^(ж; Ж") и пусть x £ U0 П M. Для е > 0 возьмем 60 = min{6/2, е/2, e/2||F'(x) ||}. Тогда, если ж £ U5o (ж; Ж") П M, то
|F (ж) — F (x)| = |F (ж) — F (x) — F (ж)(ж — x) + F (ж)(ж — x)| ^ |x — x| + ||^'(ж)|||ж — x| < е/2 + е/2 = е,
т. е. F непрерывно в x и тем самым на Uo П M.
Пусть C — выпуклый конус в Ж". Множество C* = {y £ (Ж")' | y ■ ж ^ 0, Vж £ C} называется сопряженным конусом к C. Легко видеть, что C* — выпуклый замкнутый конус.
Формулировка основных результатов
Мы начинаем с формулировки обобщенной теоремы об обратной функции
Теорема 1. Пусть С — выпуклый замкнутый конус в Жп, и — окрестность точки х £ Жп, отображение ^: и П (ж + С) ^ Ж5 строго дифференцируемо в х относительно и П (х + С) и ^'(ж)(С) = Ж5. Тогда существуют окрестность V точки ^(х), отображение ф: V ^ и П (х + С) и константа К > 0 такие, что ^(ф(у)) = у и |ф(у) — х| ^ К|у — ^(х)| для всех у £ V.
Эту теоремы мы применяем для получения необходимых условий локального экстремума (т. е. минимума или максимума) в следующей экстремальной задаче
/о(х) ^ ех1;г, /(х) ^ 0, i = 1, ...,т', /¿(х) = 0, г = т' + 1,...,т, х £ X+С. (2)
Здесь функции /¿, г = 0,1,..., т, определены на множестве и П (х + С), где и — окрестность точки х £ Жп и С — выпуклый замкнутый конус в Жп.
Свяжем с задачей (2) функцию Лагранжа £(х, А) = ^¿=о Аг/г(х), где А = (Ао, А1,..., Ат) — вектор множителей Лагранжа.
Теорема 2. Пусть в задаче (2) функции /¿, 0 ^ % ^ т, строго дифференцируемы в точке х относительно множества и П (х + С). Тогда, если х — локальный экстремум в этой задаче, то найдется ненулевой вектор множителей Лагранжа А = (Ао, А1,..., Ат) такой, что Ао ^ 0 (Ао ^ 0), если задача на минимум (максимум) и при этом
(а) А» ^ 0, % = 1,..., т';
(б) А/(X) = 0, % = 1,..., т';
(с) А) £ С * ^ £™о А/'(Х) £ С *.
Сформулируем теперь наиболее важные следствия этого результата.
1. Пусть и — окрестность точки х £ Ж и функции /, % = 0,1..., т, определены на и. Рассмотрим задачу
/о (х) ^ ех^, /¿(х) = 0, % = 1,..., т. (3)
Следствие 1. Пусть в задаче (3) функции /¿, 0 ^ % ^ т строго дифференцируемы в точке х. Тогда, если х — локальный экстремум в этой задаче, то найдется ненулевой вектор множителей Лагранжа А = (Ао, А1,..., Ат) такой, что Ао ^ 0 (Ао ^ 0), если задача на минимум (максимум) и
т
(х, А) = 0 ^ Аг/г'(Х) = 0.
¿=о
Это классическое правило множителей Лагранжа, явно сформулированное Лагран-жем в 1797 году, но которым он пользовался, начиная с середины XVIII века.
2. Пусть снова и — окрестность точки х £ Ж и функции /¿, % = 0,1..., т, определены на и. Рассмотрим задачу
/о(х) ^ ех^, /¿(х) ^ 0, % = 1,..., т', /¿(х) = 0, 6 = т' + 1,...,т. (4)
Следствие 2. Пусть в задаче (4) функции /¿, 0 ^ % ^ т, строго дифференцируемы в точке х. Тогда, если х — локальный экстремум в этой задаче, то найдется ненулевой вектор множителей Лагранжа А = (Ао, А1,..., Ат) такой, что Ао ^ 0 (Ао ^ 0), если задача на минимум (максимум) и при этом
(а) Лг ^ 0, i = 1,..., т';
(б) Л/(ж) = 0, i = 1,..., т';
(с) ^Х(ж,Л) = 0.
Эта теорема была доказана в [4].
3. Отметим, наконец, еще одну ситуацию. Пусть и — окрестность точки ж £ Ж" и функции /, i = 0,1,... ,т, определены на множестве и П (ж + Ж+), где Ж+ = {ж = (ж1,..., жп)т £ Ж" : Жг ^ 0, 1 ^ i ^ п}. Рассмотрим задачу
/о(ж) ^ ех^, /г(ж) ^ 0, i = 1,..., т', /¿(ж) = 0,
i = т' + 1,..., т, ж £ и П (ж + Ж+). (5)
Следствие 3. Пусть в задаче (5) функции /¿, 0 ^ i ^ т, строго дифференцируемы в ж относительно множества и П (ж + Ж+). Тогда, если ж — локальный экстремум в этой задаче, то найдется ненулевой вектор множителей Лагранжа Л = (Ло, Л1,..., Лт) такой, что Ло ^ 0 (Ло ^ 0), если задача на минимум (максимум) и
(а) Лг ^ 0, i = 1,..., т';
(б) Лг/(ж) = 0, i = 1,..., т';
(с) ^Ж(ж + 0, Л) ^ 0 ^ £™о Лг/(Ж + 0) ^ 0,
где /(ж + 0) — производная справа функции / в точке ж, 0 ^ i ^ т, и неравенство между векторами понимается покоординатно.
Именно к такого сорта задаче сводится доказательство необходимых условий экстремума в задаче оптимального управления (в классе кусочно-непрерывных управлений), стандартные требования к которой гарантируют выполнение условий следствия.
Доказательства
< [Доказательство теоремы 1] Как уже было сказано, доказательство основано на методе Ньютона, где роль обратного оператора к ^'(Ж) играет правый обратный к -Р'(Ж), существование и нужные свойства которого вытекают из следующей леммы.
Лемма. Пусть С — выпуклый конус в Ж" и Л: Ж" ^ Ж5 — линейный оператор такой, что Л(С) = Ж5. Тогда существуют отображение К: Ж5 ^ С и константа 7 > 0 такие, что Л(К(у)) = у и |К(у)| ^ 7|у| для всех у £ Ж5.
< Пусть Б — 5-мерный симплекс в Ж5, т. е. Б — выпуклая оболочка некоторого набора аффинно независимых векторов в1,..., е5+1. Тогда любой вектор у £ Б однозначно представляется в виде у = ^5+1 агег, где аг ^ 0, 1 ^ i ^ з + 1 и ^5+1 аг = 1 (числа аг называют барицентрическими координатами у) и внутренность Б не пуста (см. [5, стр. 27-29]). Можно считать, что нуль принадлежит внутренности Б. Тогда для некоторого г > 0 шар Вг(0;Ж5) также принадлежит внутренности Б. Так как Л(С) = Жто найдутся такие /г £ С, 1 ^ i ^ з + 1, что Л/ = ег, 1 ^ i ^ з + 1. Для каждого у £ Ж5, у = 0, положим К(у) = (|у|/г)£ 1+1 а(г|у|-1 у)/г, где а(г|у|-1у), 1 ^ i ^ з + 1, — барицентрические координаты вектора г|у| 1 у, и пусть К(0) = 0. Ясно, что К(у) £ С для любого у £ ЖДалее имеем:
5 + 1
Л(К(у)) = (Ы/г)Е аг(г|у|—1у)ег = (|у|/г)г|у|-1у = у
5 + 1 5 + 1
№)1 < (М/г) 1 1пах+1 «¿(гМ^у) £ |/| < (|у|/г) £ |/| = 7|у|,
¿=1 ¿=1
где 7 = г-1 Е5+11 1/г|. >
Приступим теперь непосредственно к доказательству теоремы. Оператор —"(ж) удовлетворяет условиям леммы. Возьмем соответствующие ему отображение К и число 7 из этой леммы. Для е = 1/27 найдется (согласно определению строгой дифференци-руемости — в ж относительно множества и П (ж + С) и непрерывности — в некоторой окрестности ж, пересеченной с ж + С) такое 5 > 0, что и(ж; К"") С и, отображение — непрерывно на В5/2(ж; К") П (ж + С) и если ж',ж// £ и(ж; К") П (ж + С), то
| —(ж') - —(ж'') - -Р'(ж)(ж' - ж'')| < — |ж' - ж''|. (6)
27
Положим V = и^/47(—(ж); К5) и пусть у £ V. Рассмотрим последовательность (итеративный процесс Ньютона)
ж» = ж»_1 + К(у - — (жг-1)), г £М, жо = ж. (7)
Покажем, что ж» £ ^^(ж; К") П (ж + С) (г = 0,1, 2,...). Доказываем по индукции. Ясно, что ж0 £ Д5/2(ж;К") П (ж + С) и допустим ж» £ В5/2(ж;К") П (ж + С), г = 0,1,... ,т. Из (7) следует, что
Л(ж» - ж»_1) = у - — (ж»_1), г = 0,1,..., т. (8)
Воспользовавшись последовательно (7) с оценкой для отображения К, (8), (6) и затем итерируя процедуру, будем иметь
|жт+1 - ж™| ^ 7|у - — (жт)| = т| —(жт_1) - — (ж™) + Л(ж™ - жт_1)|
^ 1 |жт - жт_1| ^ 1 |жт_1 - ж™_2| ^ ... ^ 2т|ж1 - ж|. (9)
Теперь по неравенству треугольника, (9) и (7)
|жт+1 ж| ^ |жт+1 жт| + |жт жт_1| + ... + |ж1 ж|
< ( 2т + ^ + ... + 1) |ж1 - 27 |у - — (ж)| < 2Т ^ = 2'
т. е. ж™+1 £ В5/2(ж^").
По предположению жт £ ж + С. Отсюда и из (7): жт+1 £ жт + С С ж + С + С = ж + С (в силу выпуклости С). Таким образом, жт+1 £ В^^К") П (ж + С) и тем самым это включение выполняется для всех г = 0,1, 2,...
Так как для любых г и ] (по неравенству треугольника и (9))
|жг+^ жг| ^ |жг+^ жг+^_1| + ... + |ж»+1 жг|
< ( +...+2») |ж1- ж| < 2 |ж1- ж| ^0 при г ^ то, то последовательность {ж»} фундаментальна и значит, сходится.
и
Обозначим ^>(y) = lim¿^„ Ясно, что ^>(y) £ £5/2 (ж; R") П (ж + C). Далее в силу непрерывности F на £5/2(ж; И") П (ж + C) и (8) имеем
|F(p(y)) - y| = lim |F(жг) - y| = lim |^'(ж)(жг+1 - x¿)| = 0
и, следовательно, F(^>(y)) = y.
Поскольку (по неравенству треугольника и (7))
|xi - ж| ^ |xi - Xi-i| + ... + |xi - ж| ^ 2y|y - F(ж)|,
то переходя здесь к пределу при i ^ то и обозначая K = 2y, получаем, что |^>(y) - ж| ^ K|y - F(ж)|. > _ ^
Заметим, что если в теореме C = Ж", s = n, то _F'(í) — обратимый оператор и в этом случае ^: V ^ F-1 (V) — обратное отображение к F. Действительно, обозначим Л = F'(í), тогда R = Л-1. Пусть y £ V и F(ж) = y. Имеем
|ж - p(y)| = |Л-1Л(ж - p(y))| < 7|Л(ж - p(y))|
= y|F(ж) - F(p(y)) - Л(ж - p(y))| < Y2^|ж - p(y)| = 1 |ж - p(y)|, (10)
т. е. ж = ^(y).
< [Доказательство теоремы 2] Пусть ж — локальный экстремум в задаче (2). Можно считать, что /¿(ж) =0, 1 ^ i ^ m' + 1 (и тем самым утверждение (b) теоремы выполнено). Действительно, отбросим те ограничения, для которых /¿(ж) < 0. Легко понять, что ж — локальный экстремум и в новой задаче. Если для нее будут доказаны условия (а) и (с), то (b) будет выполняется автоматически. Дополнив найденный набор множителей Лагранжа нулевыми компонентами (соответствующие тем номерам, где /¿(ж) < 0), получим утверждения (а), (b), (с) для исходной задачи.
Пусть, для определенности, ж — локальный минимум. Рассмотрим отображение F: (U П (ж + C)) х К^'+1 ^ Km+1,
определенное по правилу: F(ж, u) = (/о(ж) + ио,Л(ж) + U1,... ,/m(ж) + um,/m+1 (ж),... ,/т(ж))т. Ясно, что F(ж, 0) = (/о(ж), 0). Из строгой диф-ференцируемости функций /¿, 0 ^ i ^ m, в точке ж относительно множества U П (ж + C) следует строгая дифференцируемость отображения F в точке (ж, 0) относительно множества (UП (ж + C)) х +1, где F'(í, 0) — матрица, строки которой суть (/0(ж), 1, 0,..., 0), (/1 (ж), 0,1, 0,..., 0),..., (/! (ж), 0,..., 0,1), (/!+1(ж), 0,..., 0),..., (/m (ж), 0,..., 0).
Покажем, что
F'(a, 0)(C xRm+1) = Rm+1. Если это не так, то по теореме 1 (условия которой, очевидно, выполнены) найдутся окрестность V точки (/о(ж), 0), отображение : V ^ (U П^+C)) хК^41 и константа K > 0 такие, что |<p(y)- (ж, 0)| ^ K |y - (/о (ж), 0)| для всех y £ V .В частности, для всех достаточно малых е > 0 вектор ye = (/о (ж) - е, 0) принадлежит V и |^>(ye) - (ж, 0)| ^ Ke. Отсюда следует, что какова бы ни была окрестность ио точки ж найдутся такие же £ ио П (ж + C) и ue = (иое,..., um,e)T £ Н^ +1, что /о(же) + иое = /о(ж) -е, /1 (же) + U1£ = 0,... ,/m (же) + um'e = 0,/т'+1(же) = 0,... ,/т(же) = 0. Таким образом, точка же допустима в задаче (2), но /о(же) ^ /о(же) + иое = /о(ж) - е < /о(ж) в противоречии с тем, что ж — локальный минимум. Итак, _F'(í, 0)(C х Н^ +1) = Km+1.
Множество Q = F'(ж, 0)(C х R!?'+1)
есть выпуклый конус в Hm+1 как образ выпуклого конуса при линейном отображении. Множество Q \ {0} также выпуклый конус. По теореме отделимости (см., например, [5, стр. 37]) его можно отделить от точки 0, т. е.
существует такой ненулевой вектор А = (Ао, А1,..., Ат), что для всех у £ Q \ {0} справедливо неравенство А ■ у ^ 0, которое, очевидно, справедливо и для всех у £ Q. Но У = / (ж) ■ ж + по, 71 (ж) ■ X + П1, . . . ,(ж) ■ ж + Ит' ,/т'+1(ж) ■ Ж, . . . ,(ж) ■ ж)Т и поэтому мы имеем
■ ж + AiUi ^ 0 V (x,u) G C xRm'+1, (11)
?т'+1
О V (Ж, П) £ С ^ Ж
¿=0 ¿=0
где п = (по, П1, . . . , Пт').
Полагая ж = 0, получаем утверждение (а) теоремы, а полагая п = 0, получаем утверждение (с). Если ж — локальный максимум, то в качестве первой компоненты ^(ж, п) надо взять /о(ж) — по. Все рассуждения остаются прежними, но и из (11) будет следовать, что Ао ^ 0. >
< [Доказательство следствия 1] В силу предположений /¿(ж) = /¿(ж), 0 ^ % ^ т. Отсутствие ограничения типа включения можно трактовать так: С = Ж". Тогда утверждение (с) теоремы означает, что линейный функционал неотрицателен на всем Ж" и, следовательно, он равен нулю. >
Отметим, что если не заботиться о знаке Ао, то следствие 1 сразу вытекает из теоремы 1. Действительно, рассмотрим отображение ^: и ^ Жт+1, ^(ж) = (7о(ж)/1 (ж),..., /т(ж))Т. Также как при доказательстве теоремы 2 проверяется, что F'(ж)(Ж") = Жт+1, т. е. строки матрицы ^'(ж) линейно зависимы, а это и есть утверждение следствия 1.
< [Доказательство следствия 2] Поскольку здесь также /¿(ж) = (ж), 0 ^ % ^ т, и С = Ж", то те же аргументы, что и выше приводят к требуемому утверждению. >
< [Доказательство следствия 3] Легко видеть, что /¿(ж) = (ж + 0), 0 ^ % ^ т, и ясно, что сопряженный конус к Ж+ совпадает с Ж+. >
Литература
1. Алесеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление.—М.: Наука, 1979.—429 с.
2. Дмитрук А. В., Милютин А. А., Осмоловский Н. П. Теорема Люстерника и теория экстремума // Успехи мат. наук.—1980.—Т. 35, вып. 6.—С. 11-40.
3. Арутюнов А. В., Винтер Р. Б. Метод конечномерной аппроксимации в теории оптимального управления // Диф. уравнения.—2003.—Т. 39, № 11.—С. 1443-1451.
4. John F. Extreme problems with inequalities as subsidery conditions // Studies and essays presented to R. Courant on his 60th birthday, January 8.—New York: Intersociety, 1948.—P. 187-204.
5. Магарил-Ильяев Г. Г., Тихомиров В. М. Выпуклый анализ и его приложения.—М.: Эдиториал УРСС, 2003.—176 с.
Статья поступила 15 ноября 2004 г-
Магарил-Ильяев Георгий Георгиевич, д. ф.-м. н. г. Москва, Московский государственный институт радиотехники, электроники и автоматики (Технический университет) E-mail: [email protected]