Научная статья на тему 'Принцип Лагранжа для гладких задач с ограничениями на конусе'

Принцип Лагранжа для гладких задач с ограничениями на конусе Текст научной статьи по специальности «Математика»

CC BY
193
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Магарил-ильяев Георгий Георгиевич

Доказывается принцип Лагранжа для экстремальных задач в банаховых пространствах с ограничениями типа равенств, неравенств и включений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Принцип Лагранжа для гладких задач с ограничениями на конусе»

Владикавказский математический журнал Октябрь-декабрь, 2005, Том 7, Выпуск 4

УДК 517.5

ПРИНЦИП ЛАГРАНЖА ДЛЯ ГЛАДКИХ ЗАДАЧ С ОГРАНИЧЕНИЯМИ НА КОНУСЕ

Г. Г. Магарил-Ильяев

Дорогому Семену Самсоновичу Кутателадзе к его шестидесятилетию

Доказывается принцип Лагранжа для экстремальных задач в банаховых пространствах с ограничениями типа равенств, неравенств и включений.

В работе доказаны необходимые условия экстремума в задаче

/(ж) ^ ех^, Р(ж) = 0, С(ж) £ Со, ж £ С, (Р)

где Со и С — выпуклые конусы в нормированных пространствах 2 и X, функция / определена на иП(ж+С), где и — окрестность точки ж £ X, Р и С отображают иП(ж+С) соответственно в нормированные пространства У и 2. Полученные условия находятся в полном соответствии с принципом Лагранжа снятия ограничений (см. замечание после формулировки теоремы 1).

Необходимые условия экстремума в (Р) для случая, когда 2 = Ж" и Со = Ж— = {ж = (ж1,...,жп) £ Ж" : ж» ^ 0, 1 ^ % ^ п} доказаны в [1] как следствие других, более общих утверждений. Предлагаемое здесь доказательство вполне непосредственно и помимо стандартных теорем отделимости для выпуклых множеств, использует, по существу, лишь метод Ньютона последовательных приближений. Оно состоит из трех этапов. Сначала мы доказываем (используя, как основной инструмент, метод Ньютона) теорему об обратном операторе для отображений, заданных на конусе (из которой, в частности, немедленно следуют теоремы Банаха об обратном операторе и открытом отображении), затем, снова используя метод Ньютона, доказываем так называемую теорему о поправке и опираясь на эти теоремы и теорему отделимости, получаем необходимые условия экстремума в задаче (Р).

Сначала несколько определений.

Пусть X и У — нормированные пространства, М — подмножество X и ж £ М. Будем говорить, что отображение Р: М ^ У дифференцируемо в ж относительно множества М, если найдется такой линейный непрерывный оператор Л: X ^ У, что для всех ж, для которых ж + ж £ М справедливо представление

Р (ж + ж) = Р (ж) + Лж + г (ж), где ||г(ж)||у/||ж||х ^ 0 при ж ^ 0, ж £ М.

© 2005 Магарил-Ильяев Г. Г.

Оператор Л будем обозначать F'(ж) и называть производной отображения F в точке ж относительно множества M (зависимость от множества M не отмечаем, так как всегда будет ясно относительно какого множества берется производная). Если M — открытое множество, то это обычное определение производной F в точке ж и она определена однозначно. В общем случае это, очевидно, не так.

Будем говорить, что отображение F: M ^ Y строго дифференцируемо в точке ж относительно множества M, если найдется линейный непрерывный оператор Л: X ^ Y такой, что для любого е > 0 существует такая окрестность U точки ж, что для всех ж', ж'' £ U П M выполняется соотношение

||F(ж') - F(ж'') - Л(ж' - ж'')||у < е||ж' - ж''||х.

Легко видеть, что из строгой дифференцируемости F в точке ж относительно множества M следует дифференцируемость F в ж относительно этого множества и тем самым Л = F' (ж).

Нетрудно показать, что если F строго дифференцируемо в ж относительно M, то найдется такая окрестность Uo С U точки ж, что F непрерывно на Uo П M.

Если X — нормированное пространство, то сопряженное к X обозначаем X* и (ж*, ж) — значение линейного функционала ж* £ X* на элементе ж £ X. Если Y — другое нормированное пространство и Л: X ^ Y — линейный непрерывный оператор, то Л*: Y* ^ X* обозначает оператор, сопряженный к Л.

Если C — конус в X, то C* = {ж* £ X* : (ж*, ж) ^ 0, ж £ C} называется сопряженным конусом к C. Ясно, что C* — замкнутый выпуклый конус в X*.

Замыкание множества A обозначается cl A.

Теорема 1 (Принцип Лагранжа для задачи (P)). Пусть в задаче (P) X, Y, Z —

банаховы пространства, Co и C — выпуклые замкнутые конусы в Z и X соответственно и int Co = 0, U — окрестность точки ж £ X, функция f: U П (ж + C) ^ R и отображение G: U П (ж + C) ^ Z дифференцируемы в ж относительно множества U П (ж + C), отображение F: U П (ж + C) ^ Y строго дифференцируемо в ж относительно множества U П (ж + C) и либо cl F'(i)(C) = Y, либо F' (i)(C) — замкнутое множество. Тогда, если ж — локальный экстремум в задаче (P), то найдутся множители Лагранжа Ao ^ 0 (Ao ^ 0), если задача на минимум (максимум), y* £ Y* и z* £ -C**, не все равные нулю, такие, что

Ao/(ж) + (F'(£))*y* + (G'(£))*z* £ C*. (*)

Если F'(i)(C) = Y и существует такое h £ Ker F'(ж), что G'(i)h £ int Co, то Ao = 0.

Покажем, что утверждение теоремы соответствует принципу Лагранжа. Перепишем задачу (P) в виде

f (ж) ^ extr, F(ж) = 0, G^) - z = 0, (ж,г) £ C х Co. (P')

Функция Лагранжа определяется обычным образом:

¿(ж, Ao, y*, z*) = Aof (ж) + (y*, F(ж)) + (z*, G^) - z),

где Ao, y* и z* — множители Лагранжа. Если ж — решение задачи (P) и ж = G(i), то, очевидно, (ж, ж) — решение (P').

Принцип Лагранжа утверждает, что если (ж, ж) — решение задачи (P'), то найдутся такие множители Лагранжа, что функция Лагранжа (с данными множителями) удовлетворяет необходимым условиям минимума на множестве тех ограничений, которые

в нее не включены. Функция Лагранжа, как функция ж, дифференцируема в ж относительно множества и П (ж + С). Простая проверка показывает, что необходимые условия минимума — это неотрицательность производной данной функции на элементах из С, что есть (*). Неотрицательность производной функции Лагранжа на Со, как функции г, означает, что г * £ -Со.

Приведем два следствия из теоремы 1. Первое из них — отмеченное выше утверждение из [1], доказанное там при близких предположениях. Рассмотрим задачу

/о(ж) ^ ех-г, Р(ж) = 0, /¿(ж) ^ 0 (1 ^ г ^ т), ж £ С. (Р1)

Следствие 1. Пусть в задаче (Р1) X, У — банаховы пространства, С — выпуклый замкнутый конус в X, и — окрестность точки ж £ X, функции /: и П (ж + С) ^ Ж, г = 0,1,..., т, дифференцируемы в ж относительно множества и П (ж + С), отображение Р: и П (ж + С) ^ У строго дифференцируемо в ж относительно множества и П (ж + С) и либо с1 Р'(ж)(С) = У, либо Р' (ж)(С) — замкнутое множество. Тогда, если ж — локальный экстремум в задаче (Р1), то найдутся множители Лагранжа Ао ^ 0 (Ао ^ 0), если задача на минимум (максимум), у* £ У * и Аг ^ 0, 1 ^ г ^ т, не все равные нулю, такие, что

т

Ао/о(ж) + (Р'(ж))*у* + ^ /(ж) £ С*.

г=1

Если Р'(ж)(С) = У и существует такое Ь £ Кег Р'(ж), что (ж), Ь) < 0, 1 ^ г ^ т, то Ао = 0.

Отметим еще важный частный случай, когда С = X, т. е. рассмотрим задачу

/о(ж) ^ ех-г, Р(ж) = 0, /¿(ж) ^ 0, 1 ^ г ^ т. (Р2)

Следствие 2. Пусть в задаче (Р2) X, У — банаховы пространства, и — окрестность точки ж £ X, функции /г: и ^ Ж, г = 0,1,..., т, дифференцируемы в ж, отображение Р: и ^ У строго дифференцируемо в ж и либо с11т Р'(ж) = У, либо 1т Р'(ж) — замкнутое подпространство. Тогда, если ж — локальный экстремум в задаче (Р1), то найдутся множители Лагранжа Ао ^ 0 (Ао ^ 0), если задача на минимум (максимум), у * £ У * и Аг ^ 0, 1 ^ г ^ т, не все равные нулю, такие, что

т

Ао/о (ж) + (Р '(ж))*у* + ^ / (ж) = 0.

г=1

Если 1тР'(ж) = У и существует такое Ь £ Кег Р'(ж), что /'(ж), Ь) < 0, 1 ^ г ^ т, то Ао = 0.

Обычно это утверждение доказывается в предположении строгой дифференцируемо-сти функций /, г = 0,1,..., т (см., например, [2]), что, как мы видим, является лишним.

Теперь мы сформулируем и докажем теорему о правом обратном и теорему о поправке, а затем уже докажем теорему 1.

Будем пользоваться следующими обозначениями. Если X — номированное пространство, ж £ X и 5 > 0, то и§(ж; X) и (ж; X) — соответственно открытый и замкнутый шары в X с центром в ж и радиусом 5.

Теорема 2 (о правом обратном). Пусть X, У — банаховы пространства, С — выпуклый замкнутый конус в X, Л: X ^ У — линейный непрерывный оператор и Л(С) = У.

Тогда существуют такое отображение К: У ^ X и константа 7 > 0, что Л(К(у)) = у и 1|К(у)||х ^ 7||у||г для всех у £ У.

< Сначала, используя теорему Бэра (см. [3, с. 70]), построим «почти» правый обратный к Л. Так как Л(С) = У, то иПбМ Л(С П ЦП(0; X)) = У. По теореме Бэра существуют такие N £ Н, у0 £ У и г > 0, что Вг(у0; У) С с1(Л(С П (0; X))). Если у £ Вг(у0; У), то найдется ж (у) £ С П (0; X), для которого

- Лж(у)||у < г/2.

(1)

Пусть теперь у £ У, у = 0, и жо £ С такой, что Лжо = —уо. Положим

К1(у) = (ж (уо + И + жо

и К1(0) = 0. Ясно, что К1(у) £ С для всех у £ У. Если у = 0, то с учетом (1) имеем

— ЛК1

уо +

у = г

у

|у- Лж ( уо + й-^у I +

У

-уо

У

И — Лж уо +

<

г

|у г

У

у

У

г2

(2)

и, кроме того,

||К1 (у)||х ^^ (N + ||жо||х )= 71 ||у|у.

(3)

Для построения правого обратного к Л воспользуемся методом Ньютона. Пусть у £ У. Рассмотрим последовательность

ж„ = ж„_1 + К1(у — Лж„-1), п £ Н, жо = 0.

(4)

Покажем, что эта последовательность фундаментальна. Действительно, используя последовательно (4) (после применения к обеим частям этого равенства оператора Л) и (3), будем иметь

||у — Лж„||у = ||у — Лж„_1 — ЛК1(у — Лж„_1)||у < 2||у — Лжга_1 ||у < ... < 2ПНуНу. (5) Тогда в силу (4), (3) и (5) будет

||ж„+1 — ж„||х = ||К1 (у — Лж„)||х ^ 71 Ну — Лж„|у ^

71НуНу

(6)

и, следовательно, для любых п, т £ N выводим

1|х + ... + ||жп+1 — жп НХ

<

Ц + ^ + ^ тНуНг < » - 0

2«+т

при п ^ то, т. е. последовательность {жп} фундаментальна. Из (4) вытекает, что эта последовательность принадлежит С вследствие выпуклости этого конуса.

г

у

2

г

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

П

Положим К(у) = жп. Тогда К(у) € С в силу замкнутости С. Переходя к

пределу в (5), получаем, что Л(К(у)) = у. Далее, используя (6), имеем

1Ы|х < ||ж„ - Жп-1Ух + • •• + ||ж1||х ^ —-1 + ••• + ^ 71УуУу < 271УуУу .

Переходя здесь к пределу, получаем, что ||К(у)||х ^ 7|М|у, где 7 = 271. >

Если С = X, то мы получаем соответствующее утверждение (см. лемму о правом обратном) из Приложения к статье В. М. Тихомирова в данном номере. Эта лемма равносильна теореме Банаха об открытом отображении или об обратном операторе.

Теорема 3 (о поправке). Пусть X, У — банаховы пространства, С — выпуклый замкнутый конус в X, и — окрестность точки ж € X, отображение ^: и П (ж + С) ^ У строго дифференцируемо в ж относительно множества ж + С и ^'(ж)(С) = У. Тогда найдутся окрестности ио и Ро точки ж и нуля в X соответственно, для которых ио + Ро С и, отображение ^: ио П (ж + С) ^ У0 П С и константа К > 0 такие, что ^(ж + ^>(ж)) = ^(ж) и ||^(ж)||х ^ К(ж) - ^(ж)||у для всех ж € ио П (ж + С).

< Оператор Л = ^'(ж) удовлетворяет условиям теоремы 1. Пусть (согласно этой теореме) К — правый обратный к Л с соответствующей константой 7. Так как ^ строго дифференцируемо в ж относительно ж + С, то для е = 1/27 найдутся такие окрестности и и У точки ж и нуля в X соответственно, что и + У С и и для всех ж € и П (ж + С) и у', у'' € У П С справедливо соотношение

(ж + у') - ^(ж + у'') - Л(у' - у'') ||у < 2-||у' - у''||х• (7)

Пусть 5 > 0 такое, что и(0; X) С У. Положим У = и(0; X) и ио С и — окрестность ж такая, что (ж) - ^(ж)||у < 5/47 для всех ж € ио П (ж + С). Возьмем ж € ио. Рассмотрим последовательность

уп = уп-1 + К(^(ж) - ^(ж + у„-1)), п € Н, уо = 0^ (8)

Покажем по индукции, что уп € В§/2(0; X) П С для всех п. Для уо это включение очевидно. Предположим, что уп € Д$/2(0; X) П С, п = 0, . Докажем, что и ум+1 принадлежит этому множеству. Из (8) следует, что

Л(ум - ум-1) = F(ж) - ^(ж + ум-1)- (9)

Используя последовательно (8) (с оценкой для правого обратного), (9) и (7) и затем итерируя процедуру, будем иметь

||ум+1 - ум||х < т||^(ж) - ^(ж + ум)||у = 7||^(ж + ум) - ^(ж + ум-1)

1 1 (10) -Л(ум - ум -1 )|х < 2 Пум - ум—1 Ух < ••• < 2м ||у1|х •

Теперь по неравенству треугольника, (10) и (8) (снова с оценкой для правого обратного) получаем

Уум+1Ух < У ум+1 - ум Ух + ••• + Цу1 - < ( 2м + ••• + 1) ||у1 Ух

55

< 27(ж) - ^(ж)||у < 27 — = 2,

т. е. ум+1 € В5/2(0; X).

По предположению индукции yn G C. Тогда из (8) вытекает, что Vn+1 G VN + C С C + C = C в силу выпуклости C. Таким образом, yn G Bs/2(0; X) ПC для всех n = 0,1,...

Последовательность {yn} фундаментальна. Действительно, по неравенству треугольника и (10) для любых натуральных n и m имеют место соотношения

IlVn+m - Vn\\y ^ IlVn+m - Vn+m-1 ||у + • • • + ||Vn+1 - Vn||У

^ (+ ••• + \\yi\y ^ \\yi\y ^ 0

при n ^ то. Положим ^>(ж) = limn—(^ yn. Ясно, что ^>(ж) G Bs/2(0; X) П C (в силу замкнутости C). Далее, так как F непрерывно на Uo П (ж + C), то с учетом (8), получаем

||F(ж) - F(ж + ¥>(ж))||у = lim ||F(ж) - F(ж + yn)\\y = lim ||Л(уп+1 - Vn)||y = 0,

n—n—

т. е. F(ж + ^>(ж)) = F(ж).

Далее по неравенству треугольника, (10) и (8)

IlVnllx < |\Vn - Vn-1 ||x + • • • + 11V1 ||x < 27||F(ж) - F(ж)||у•

Переходя здесь к пределу, получаем, что ||^>(ж)||х ^ K||F(ж) - F(ж)||у, где K = 27. >

< Доказательство теоремы 1. Сначала отметим тривиальные случаи выполнения соотношения (*). Если /'(ж) = 0, то полагая, например, Ao = 1, а у* = 0 и z* = 0, получаем (*).

Если С(ж) = 0, то снова получаем (*), беря в качестве z* любой ненулевой функционал и полагая Ao = 0 и y* = 0.

Пусть cl F'(i)(C) = Y. Легко видеть, что cl F'(i)(C) — выпуклый замкнутый конус и так как он не совпадает со всем пространством, то его можно отделить от точки, ему не принадлежащей. Отсюда следует, что существует такой ненулевой функционал y* G Y*, что inf{(y*, y) : y G cl F'(i)(C)} > -то. Легко понять, что данная нижняя грань есть нуль и значит, (y*, F^i^) ^ 0 для всех ж G C. Полагая Ao =0 и z* = 0, получаем (*).

Если множество F'(i)(C) замкнуто и не совпадает с Y, то повторяя предыдущее рассуждение, снова получаем (*).

Итак, осталось доказать соотношение (*) для случая, когда /'(ж) = 0, С(ж) =0 и F'(i)(C) = Y. Предположим сначала, что ж — локальный минимум. Рассмотрим отображение F: U П (ж + C) х R+ х Co ^ R х Y х Z, определенное по правилу F(ж, а, z) = (/(ж) + а, F(ж), С(ж) -z). Из дифференцируемости /, F и G в точке ж относительно соответствующих множеств следует, что линейный оператор F'(i, 0, 0): X xRxZ ^ Rx Y xZ, F'(i, 0, 0)(ж, а, z) = ((/'(ж), ж) + а, F'^^, G^S^ - z) есть производная отображения F в точке (ж, 0, 0) относительно множества (ж + C) х R+ х Co. Покажем, что замыкание множества F'(i, 0, 0)(C х R+ х Co) не совпадает с R х Y х Z.

Пусть zo G int Co. Тогда существует 6 > 0 такое, что Us(zo; Z) С Co. Докажем, что множество F(ж, 0, 0)(C х R+ х Co) не пересекается с шаром Us0 ((-1, 0, zo); R х Y х Z), где 6o = (1/2) min(6, 6/y|G'(ж)|, 1, 1/y\|/'(ж)||). Предположим, что это не так и существует точка (ж, а, z) G C х R+ х Co такая, что

|(/'(ж), ж) + а + 1| + ||F'(ж)ж||у + |^'(ж)ж - z - zo||z < 6o.

Пусть y G Y и ||y||y < 6o. Поскольку F'(i)(C) = Y, то по теореме 1 найдется ж G U7s0 (0; X) П C такое, что F'(ж)ж = -у. Положим ж = ж + ж и покажем, что ж G C,

Р'(ж)ж = 0, С'(ж)ж G int Co и (/'(ж), ж) < 0. Действительно, первые два соотношения проверяются элементарно. Далее

||С'(ж)ж - z - zollz ^ ||С'(ж)ж - z - Zo^Z + ус(ж)жЦ^ < ¿0 + ||С(ж)УУжУх

< ¿0 + ||С'(ж)||7£о < ¿/2 + ||с'(ж)||7(¿/2||С'(ж)||7) = ¿,

т. е. С'(ж)ж - z G int C0 и значит, С'(ж)ж G int C0. Наконец,

|(/'(ж),ж) + а + 1| < |(/'(ж),ж) + а + 1| + |(/'(ж),Ж)| < ¿0 + |/'(ж)||Ж|х

< ¿0 + ||/'(i)|№ < 1/2+ ||//(ж)|7(1/2|/'(ж)|7) = 1,

т. е. (/'(ж), ж) < 0.

Теперь покажем, что существование точки ж с установленными свойствами противоречит тому, что ж — локальный минимум. Для этого воспользуемся теоремой 3. Отображение F удовлетворяет ее условиям. Пусть отображение < из этой теоремы. Тогда для всех достаточно малых t ^ 0 имеем F(ж + ¿ж + <(ж + ¿ж)) = F(ж) = 0 и ||<(ж + ¿ж)||х < K||F(ж + ¿ж)||у = K||tF'(ж)ж + o(t)||у = ||o(t)||y, т. е. <(ж + ¿ж) = o(t) при t | 0. Обозначим £(t) = <(ж + ¿ж). Ясно, что ж + ¿ж + £(t) G C при данных t. Далее, из дифференцируемости С в ж и того, что С'(ж)ж G int C0 следует включение

С(ж + ¿ж + f(t)) = С (ж) + ¿С'(ж)ж + o(t) = С (ж) + ¿(С'(ж)ж + o(t)/t) G C0,

а из дифференцируемости / в ж и неравенства (/'(ж), ж) < 0 следует, что

/(ж + ¿ж + £(t)) = /(ж) + ¿(/'(ж), ж) + o(t) = /(ж) + t((/'(ж),ж) + o(t)/t) < /(ж).

Таким образом, в любой окрестности ж есть допустимые в задаче (P) точки, на которых значение / меньше, чем /(ж). Это противоречит тому, что ж — локальный минимум.

Итак, множество clF'(i, 0, 0)(C х х C0), которое есть, очевидно, выпуклый замкнутый конус, не совпадает с R х Y х Z. Тогда, точно по тем же соображениям, что и в начале доказательства, следует существование такого ненулевого линейного функционала (Л0, y*, z*) G R х Y* х Z*, что

А0((/'(ж),ж) + а) + (у*,^(ж)ж) + (z*, С'(ж)ж - z) ^ 0 V (ж,а,z) G C х R+ х C0.

Полагая ж = 0 и z = 0, получаем, что Л0 ^ 0. Полагая а = 0 и ж = 0, получаем, что (z*, z) ^ 0 для всех z G C0, т. е. z* G -C0. Наконец, полагая а = 0 и z = 0, приходим к соотношению (*).

Если ж — локальный максимум, то в определении отображения F надо взять (/'(ж), ж) -а вместо (/'(ж), ж)+а и тогда совершенно аналогичные рассуждения приводят к тому, что А0 ^ 0.

Докажем последнее утверждение теоремы. Допустим, что А0 = 0. Так как h G KerF'(i), то из (*) вытекает, что (z*,C(i)h) ^ 0. Но по условию С'(ж)Л- G C0 и по доказанному z* G -C*, следовательно, (z*,C(i)h) ^ 0, т. е. (z*,C(i)h) = 0. Пусть z G Z. Поскольку С'(ж)Л- G int C0, то для достаточно малого е = 0 справедливо включение C(i)h ± ez G C0 и тем самым (z*,C(i)h ± ez) = ±(z*,z) ^ 0, т. е. (z*,z) = 0 и значит, z* = 0. Тогда из соотношения (*) получаем, что (y*,F'(ж)ж) ^ 0 для любого ж G C. Но F' (i)(C) = Y и тогда последнее неравенство означает, что линейный функционал неотрицателен на всем пространстве и тем самым он нулевой. Мы пришли к тому, что все множители Лагранжа нулевые, что невозможно и таким образом, А0 = 0. >

Литература

1. Дмитрук А. В., Милютин А. А., Осмоловский Н. П. Теорема Люстерника и теория экстремума // Успехи мат. наук.—1980.—Т. 35, вып. 6.—С. 11-40.

2. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление.—М.: Наука, 1979.—429 с.

3. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа.—М.: Наука, 1976.—542 с.

Статья поступила 20 сентября 2005 г.

Магарил-Ильяев Георгий Георгиевич, д. ф.-м. н. г. Москва, Московский государственный институт радиотехники, электроники и автоматики (Технический университет) E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.