УДК 519.853
Вестник СИоГУ. Сер. 10, 2005, вып. 3
С. Е. Михеев /
СУЩЕСТВОВАНИЕ И ОЦЕНКА РЕШЕНИЯ НЕЛИНЕЙНОГО УРАВНЕНИЯ В БАНАХОВОМ ПРОСТРАНСТВЕ
Введение. Рассмотрим нелинейное уравнение
д(х) = 0, xeDcU, д: D —* W, (1)
где U,W - банаховы пространства (jS-пространства). Для вынесения какого-либо суждения о существовании решения и об оценке его удаленности от некоторой заданной точки необходима дополнительная информация об отображении д и области задания D. Такие суждения как часть результатов по обоснованию метода Ньютона для (1) в работах Л.В.Канторовича и И.П.Мысовских (см., например, [1, 2]) получены, когда скорость изменения производной Фреше J := д' в некотором замкнутом шаре По •= S(xq,R) := {х\\\х — Хо|| ^ Щ — начальная точка метода), принадлежащем открытой области задания D, была стеснена либо условием
\ sup (2)
4 хепо
либо условием || J'(a:)|| ^ L Va; € По- Во втором варианте непосредственно из доказал тельств в указанных трудах была видна возможность легкого расширения результатов и на случай, когда J всего лишь липшицева:
|| J(x + Д) - J(a)|| ^ £||Д|| Vx,ж + Д € П0, (3)
что и было вскоре сделано другими авторами (см., например, [3]).
Дополнительное ограничение вида ||*7~1(ж)|| ^ Уж 6 По в теореме И. П. Мысовских (ТМ) о методе Ньютона [2] (теорема 1) приводит к несколько иным результатам, которые и в оценке удаленности отличаются от теоремы Канторовича (ТК) (теорема 6, § 1, гл. XVIII [1]). С этим же ограничением, исследуя непрерывный метод Ньютона, М. К.Гавурин получил точную оценку удаленности [4], которая, когда тм совпадает с известной оценкой т*о ^ И^-1^)!!) строго меньше оценки в ТМ.
В настоящей работе будут исследованы существование и удаленность решения уравнения (1) при условиях, часть из которых отличается от ранее известных. При существовании J' - производной от J - одно из них принимает вид
IIWIIII^WK* VxeD\dD.
Однотипным образом будет произведено уточнение в приводимой далее теореме 2 (Т2) оценки удаленности в условиях, близких к ТМ. Частный случай Т2, когда г о совпадает с гм, есть небольшое усиление теоремы Гавурина (ТГ) [4] (теорема 1) в части, касающейся существования решения и оценки его удаленности.
Отметим, что в конечномерном ^-пространстве можно после выбора базиса трактовать производную функции д как матрицу Якоби J (отсюда и обозначение).
© С. Е. Михеев, 2005
В конечномерном пространстве для липшицевых 3 гарантию существования и опенку решения уравнения (1) предоставляет ТК о методе» Ньютона с доказательством Ортеги в [5]. Там же приведена обширная библиография по данной тематике.
1. Полу производная и ее свойства. Пусть и, - ¿-пространства, М С I/ и имеется отображение А : М УУ. I
Определение 1. Пусть ж - не изолированная точка множества М и величина
ЬЛ(х) := Шп ||\А(х + Д) - А(х)\\„/\\4и (4)
конечна. Назовем тогда ее полу производной отображения А в точке ж. Здесь предел берется по таким Д, что х + Д 6 М.
Если М не имеет изолированных точек и полупроизводная ЬА(х) существует для всех х € М, то формула (4) определяет на М функцию, которую будем именовать полупроизводной отображения А на множестве М.
Далее индекс нормы, указывающий на пространство, в котором она определена, будет опускаться, поскольку его всегда можно будет выяснить из контекста.
Очевидно, если в точке х существует полупроизводная ЬА(х), то ЦА(аЧ-Д)—-А(ж)|| ^ 1/А(ж)||Д|| + о(||Д||,ж), т. е. А непрерывно в х (о - бесконечно малая относительно первого аргумента). Отсюда же нетрудно установить, что если отображение А дифференцируемо во внутренней точке ж из М, по Фреше, то его полупроизводная есть 1И'(х)||. '
Если А - вещественная функция вещественного аргумента - имеет в точке х конечные производные числа, то ее полу производная ЬА{х) есть максимум из их абсолютных значений. Если отображение А имеет в М - множестве без изолированных точек - константу Липшица I/, то оно имеет в М полу производную, ограниченную сверху числом Ь. Для выпуклого множества верно и обратное.
Лемма 1. Пусть полу производная отображения А ограничена константой Ь в выпуклой области задания М: ЬА(х) ^ Ь Vж € М. Тогда отображение А липшицево в М с константой Ь.
Доказательство. Пусть утверждение леммы неверно. Тогда найдутся ж,у из М и е > 0 такие, что ||А(у) - Л(ж)|| > (Ь + где = \\у - ж||. Параметризуем отрезок, соединяющий х и у: у= х + — ж)/*', £ € [0,£']. Положим N(1) := \\А(Уа))-А(х)\\.
С одной стороны, ЬА{ж) ^ Ь при £ 0, с другой - верно N(£')/*' > Ь+е.
Поэтому в силу непрерывности А(у(£)) по £ существуют момент Т £ [0, \\у—ж||), такой, что Ы(Т) = {Ь + е)Т, и монотонно убывающая до Т последовательность {¿г}?0, на которой верно > (Ь + е)и. Согласно обозначениям, получаем
\\А(у(и))-А(у(Т))\\ 2 =ЩП)-ЩТ) > (£+£)(*,-Т).
Отсюда следует оценка ЬА(у(Т)) ^ Ь + е, противоречащая условию леммы.
Когда значения отображения суть линейные ограниченные операторы из одного баг нахового пространства в другое, будем именовать его семейством операторов. Таким образом, для семейства операторов имеет смысл понятие полупроизводной. Для краткости записи оператора, обратного к оператору А(у) из семейства будет использоваться А"1 (у) вместо более корректного (А(у))~1.
Лемма 2. Пусть Z1U1W - В-пространства и множество М лежит в Если определенное на М семейство линейных ограниченных операторов А(у) : V -> V/,
у 6 М, имеет полупроизводную ЬА{х) в точке х из М и оператор А(х) имеет ограниченный обратный А~1(х) : V, то существует 6 > 0 такое, что для всех у из окрестности V := операторы А(у) имеют обратные, а семейство
обратных операторов А~г(у) : V/ -> £/, у 6 V, равномерно ограничено и в точке х тоже имеет полупроизводную Ьд-\(х) и
ЬА-,{х) < НА-ЧаОИ^лОп). Доказательство. Из существования полупроизводной в точке х следует непрерывность исходного семейства в этой точке. Следовательно, существует число 6 > О такое, что для всех у из окрестности V = 5(а;,<5)Р|М верно ||^4(2/) — ^
А~1(х)||""1/2. А тогда, согласно теореме Банаха и следствий из нее ([1], гл. V, теорема 4.4), существуют обратные операторы А~г (у) в V, которые равномерно ограничены:
^ ^2|И_1(Ж)11 Уг/еУ:
Пусть у € V, тогда, принимая во внимание
А-\у) - А~\х) = А-ЧхНДф - А(у)]А~1(у),
имеем
НЛ-1^) - А~1(х)\\ ^ Хл^ЦЛ-Ч^ЦЦу - «ННА^МН + о(||» - (5)
В силу ограниченности ||Л~*1(2/)|| из оценки (5) следует непрерывность А~г в х.
Поэтому, разделив на \\у — ж|| неравенство (5) и переходя к верхнему пределу при у —> ж, получаем утверждение леммы.
Лемма 3. Пусть для каждой точки з интервала [0,5] имеет место оценка полупроизводной вещественной функции / вещественного аргумента: ¿/(в) ^ и г (в) - конечна, неотрицательна и суммируема по Лебегу. Тогда
1/(*)-/(0)|< '/"*(«)Л Чве[о,в]. (6)
¿0
Лемма 3 есть элементарное следствие леммы 3.8 из [6].
Лемма 4. Пусть отображение А имеет в точке х полупроизводную ЬА(х), а скалярная функция / определена в некоторой окрестности точки у := ||А(а;)|| и существует полупроизводная у). Тогда суперпозиция := /(||А(а;)||) имеет в х полупроизводную, которая удовлетворяет оценке Ьс{х) ^ Ь/(у)ЬА(х).
Доказательство. Оценим приращение суперпозиции (т при изменении аргумента на А, столь малого, что х Н- А принадлежит области задания отображения А, а + А)|| - области задания функции /:
\0(х + Д) - С(х)| = 1Д1И* + Д)||) - /(у)I < ^ Ь}{у) |||Л(х + Д)|| - у\ + о(|||Л(® + Д)|| -у\,у)4
< Ь{{у)\Щх + Д) - А(х)\\ + 01(\\А\\,у) < ^(у)ЬА(х)\\А\\ + о1(||Д||)2/) + о^ДЦ,^*)).
Поделив на ||А|| и перейдя к верхнему пределу, получаем утверждение леммы.
Лемма 5. Пусть С/, ТУ - В-пространства и ограниченное выпуклое множество М лежит в 2. Если определенное на М семейство линейных ограниченных операторов А(х) : и -> У/, х € М, на М имеет полупроизводную ЬА{х) и ограниченные
обратные А~1{х)} такие, что ||-Л_1(а:)|| LA(x) ^ <т Vx G М; то семейство обратных операторов {А~1(х)}х^м ограничено снизу по норме положительной величиной, а семейства операторов {А(х)}х^м и {А~1{х)}х€М липшицевы на М. Доказательство. Согласно условию и лемме 2,
Ьд-^хкил-^РЬлСхКар-Ч*)!! Vx € м.
Принимая во внимание лемму 4, получаем оценку Ь1пц^-1ц(ж) ^ а. Отсюда и на основании леммы 1 |ln ЦА-1^)!! — 1п ||Л~1(ж)||| ^ а\\у — Потенцируя и обозначая через R диаметр множества М, получаем
р-'ЫИ £ р-Ч^Ие-"11»-*11 £ ЦЛ-Ч^Це-"« >0.
Таким образом, доказано первое утверждение леммы 5. Второе следует из леммы 1 и того, что L^^a/ÏÏA^MW^ae'X/ÏÏA-1^ Vy G M.
Наличие константы Липшица для А~1 на M вытекает из лемм 2 и 1.
2. Существование и оценка решения. Всюду далее будем полагать область задания D отображения g представимой в виде объединения открытой области D' и подмножества М' ее границы dDт. е. D = D' U M'.
Обозначим через n(£),<7,xo,^Oj^o)j где до ? г о ~ положительные числа, а хо G D', класс отображений g, удовлетворяющих таким условиям:
1. g непрерывно в D.
2. Линейный оператор J - производная (Фреше ) отображения g - в области D' невырожден и имеет полупроизводную Lj.
3. Для всех х из D' выполняется Lj(x)r(x) ^ а, где г(х) := Ц«/"10*011 •
4. 9о>Мхо)\\, го^г(хо).
Теорема 1 (Т1). Пусть U,W - В-пространства, D С U, g : D W, g принадлежит П(£), <т, жо, ро, ^о) ^ выполняются следующие условия:
1) Ра := г0а90 < 1;
2) шар S(xo,di) принадлежит области D, где d\ := — ^^—.
а
Тогда в шаре S(xo,di) существует корень а уравнения (1), который является правой предельной точкой фазовой траектории решения задачи Коши **)
х = -J-\x)g(x)l ¡J"1 (*)$(*) || =: F(x), х(0) = х0, (7)
а именно, существует Т G (0,di] такое, что решение этой задачи определено на [0,Т); непродолжимо вправо и Ит*_>т-о = Причем монотонно
убывает до 0 на [0,Т).
Доказательство. Известные теоремы о существовании решения задачи Коши для абстрактной функции скалярного аргумента ([7], теорема 1.8.1) требуют хотя бы
Лемма 1 при наличии полупроизводной гарантирует липшицевость J в любой окрестности внутренней точки области задания, следовательно, и непрерывность. Поэтому производные Гато и Фреше совпадают.
**) Интегрирование задачи Коши х = —J~1(x)g(ж), ж(0) = хо, М.К.Гавурин [4] называл непрерывным методом Ньютона. Для него корень достигается при t —> +оо.
локальной липшицевости, т. е. существования у каждой точки области задания функции ^ окрестности такой, что в ней выполняется условие Липшица для -Р. Построим такие окрестности для точек множества М := (5(ж0,^1) \ дв^хо^г)) \ {а\д(а) = 0}.
Обозначим через Бх С М замкнутый шар с центром в точке х положительного радиуса такой, что (Vу € Бх) ||*/_1(2/)0Ы|| ^ у := ||/2 и, согласно лемме 2, величина ||*/~1(2/)|| ограничена равномерно в 8Х.
Проверим липшицевость ^ на Согласно лемме 4, «7 и «7-1 на нем имеют константы Липшица. Следовательно, ||«7(ж)|| на нем ограничена, и поэтому д липшицева. Таким образом, суперпозиция J~1(y)g{y) липшицева в шаре 5®. Поскольку в шаре Бх норма этой суперпозиции ограничена снизу положительным числом 1/, имеется липшицевость ^ на Бх.
Итак, на множестве М функция I*1 локально удовлетворяет условию Липшица. Поэтому, согласно [7] (теорема 1.8.3), существует наибольший интервал [0,Т), на котором существует решение задачи (7). Как известно, норма интеграла от непрерывной абстрактной функции не больше интеграла от нормы этой функции. А производная решения задачи (7) непрерывна и по норме равна 1. Поэтому справедливо
1Ж - хШ = || Г¿(в)<1<|| $уГ||4(в)||<!в| <|т-*| Ут,<€[0,Т). (8)
Следовательно, если Т < оо и и -» Т при г ->• оо, то последовательность {я(£»)}о° фундаментальна и существует Нт^т который, согласно критерию продолжимости ([7], §1.8), не может быть внутренней точкой множества М. Обозначим этот предел через х(Т).
Если Т <й 1, то, положив в (8) < = 0 и устремив г к Т, получаем ||я(Т) — жо|| < с1\ и х(Т) £ с?!.) \95(жо, (¿1). Таким образом, попадание на границу М эквивалентно равенству д(х(Т)) = 0, т.е. теорема справедлива.
Пусть теперь Т ^ й\. Рассмотрим поведение функции ||^(х)|| на решении задачи (7). Пусть £,£ + <$€ (0, Т) и 5 столь»мало, что отрезок, соединяющий х(£) и я(£ + <$), лежит в области задания. Обозначим + — ж(£) через А. Тогда
iie(»(t+m\ - iie(»(t))ii = n*(*w)++?(д.»(*))н - ш*т\ =
- \\яШ)\\ =
-ш*т\*
9{x{t)) ~ + J{x{t))°im+5{AMt))
~ \\J-4*(t))9W)\\ +02(a'*W)-
Поделив на S и перейдя к пределу, получаем
ч*«*»»''=iiJ-n'Si'Uii * ~1/гШ)> (9)
следовательно, суперпозиция монотонно убывает, если х(t) - решение задачи
Коши. Здесь и далее о*, о* - для любого индекса i функции более высокого порядка малости по сравнению со своим первым аргументом; знак в обозначении функции говорит о том, что значения этой функции - элементы банахового пространства.
Оценим приращение функции p(t) := r(x(t)) при изменении времени на S. И пусть t,t + 6e [0,Т):
л + Лемма 2
|p(t + 6) - p(t)I < || J~\x{t + 6)) - J_1(a;(i))|| <
< II J-1 Wi))ll2M*(i))IMi + *)- a(t)ll + 0x(ll«(i + S) - «(Î)ll. *(<)) <
< p2(t)Lj(x(t))\ô\ + 02i) < ap(t)\S\+02(6,t). (10)
Таким образом, полупроизводная функции р удовлетворяет ограничениям
Lp(t) < p2(t)Lj(x(t)) < ap(t). (11)
Используя лемму 4, выясняем, что L\np(t) ^ Lp(t)/p(t). Совместно с (11) это даст L\np(t) ^ о. Отсюда, согласно лемме 3, вытекает
\np(t) -lnp(O) ^ at,
т.е. p(t)^r0eat, te [О, Г).
Усилив неравенство в (9) подстановкой вместо r(x(t)) функции roeat, имеем
(\\g\\Yt < -е-"'/то-
Интегрируем последнее неравенство и используем оценку ||^(ж(0))|| ^ 9о-
lltf(®(t))ll ^ \\дШ)\\ + {e-at - 1) /Ы) Оо + {e~at - 1) /Ы) Vt 6 [О,Г). (12)
Правая часть неравенства (12) стремится к нулю при стремлении t к определенному в условии теоремы d\. Поэтому то же происходит и с левой частью. Как уже говорилось ранее, существует x(d\) := lim*-^ x(t) и x(d\) € S(xo,di). В силу непрерывности g верно g(x(di)) = 0, т.е. в шаре S(xo,di) существует корень отображения д. Ясно, что Т = di, так как при t < T g(x(t)) ф 0.
Замечание 1. Условия 1) и 2) Т1 точны в том смысле, что при их нарушении можно указать функцию из П(-£>,<7,жо><?о>^о)? не имеющую корней в D. Действительно. Рассмотрим скалярную функцию вида
f(x)=9o+{e-"*-l)/(r0cr), (13)
где х е D С Л1; ^о >0; D' Э х0 = 0. Для нее \f"(x)/f'(x)\ = <т для всех х из D. Нетрудно проверить, что выполнены и остальные условия принадлежности / классу П(£),<т,xo,go,ro). Поскольку / монотонно убывает и /(0) = 9 о > 0, из существования корня у нее следует условие 0 > /(+оо) = 9о~ 1/(т*оа) или Ра < 1. Это означает, что условие 1) Т1 не может быть ослаблено.
Вместе с тем корень функции /, расширенной, согласно формуле (13), на все Д1, есть di = — (<т)-11п(1 — Ра), и нарушение условия 2) Т1 такое, что di ^ D, означало бы, что в D нет корней.
Более того, удаленность корня функции / от xq равна d\ - оценке, доставляемой Т1, следовательно, d\ - наименьшая оценка при имеющейся информации об отображении. Поэтому функцию / из (13) будем именовать максимайзером для Т1 независимо от существования у нее корня.
Замечание 2. Пусть множество непрерывных отображений, заданных в £), имеющих липшицеву производную в D' с константой L, оценками в начальной точке: г о ^ IIJ-H^o)!!, % > ||ЗЫ11, обозначается через C1A{D,L,xo,go,ro).
Используя технику доказательства Т1, можно получить для функций из С1'1 жо><?(ьП)) результат, совпадающий с оценкой в одном из вариантов ТК (замечание 1 к теореме 6, § 1, гл. XVIII [1]), когда существует (?", ограниченная по норме константой L (см. также часть ТК, приведенную далее в п. 3 настоящей работы).
Для этого вместо берется величина с?к := (1 — ^Д — 2Ьг%9о)/Ьго. Она совпадает с точностью до обозначений с оценкой упомянутого замечания, кроме константы Липшица Ь, которая там есть оценка нормы второй производной в области задания: Ир" 0е) II ^ Рассуждения Т1 без изменения повторяются до оценок (11).
Далее из LJ(x(t)) ^ Ь и (11) следует оценка ЬР(Ь) ^ Ьр2{Ь).
Согласно лемме 4, получаем £1/р(£) ^ £р(£)/р2(£) ^ Ь. И применение леммы 3 дает
1/^(0)1 ^ т-е- Р(^) ^ т*о/(1 —Усилив (9) подстановкой вместо г(ж(£))
функции -——, имеем (||<?||){ ^ Ы — 1/го, что после интегрирования даст 1 — ьгго
1|р(«(0)Н - < [\ьт - 1/го) <1т = и2/2 - «/го V * е [0,Т). (14)
./о
Следовательно, #(#(£)) станет нулем не позднее, чем правая часть (14) станет равной — 9о, т.е. не позднее момента йк. Поэтому удаленность решения от начальной точки не более йк.
Более интересно применение использованной в Т1 методики оценивания удаленности решения в условиях ТМ о методе Ньютона [2], которые содержат требования \\д"(х)\\ ^ Ь и ||«/-1(ж)И ^ гм для всех х Е В1. Согласно ТМ, справедлива оценка удаленности (в обозначениях, используемых здесь)
ОО к
||®о " «II ^ ¿м '•= г090 £ {гмг0Ь9о/2)2 . (15)
о
Она не является точной в принятых условиях. Это видно, например, из того, что при г к{ > г о вокруг начальной точки существует окрестность, в которой из-за липшице-вости 3 «потолок» гм для У-1 (ж) не достижим. Если эта окрестность достаточно велика, то ситуация в ней адекватно описывается ТК, которая доставляет точную оценку удаленности, не совпадающую с (15). Заметим также, что суждение о существовании корня в ТМ имеет полуглобальный характер, так как она содержит локальное условие Ъ, := ЬтоГм9о < 2.
Получим точную оценку удаленности решения и глобальное суждение о его существовании в условиях ТМ с использованием липшицевости 7 вместо ограниченности его производной.
Введем обозначения: Рь := Ьгп9о> Тм := ——,
Ьгмг0
. = 1 - VI ~ 2Р^ < д ^ ^ ^
Ьг0
(гм/го - I)2 2 г„Ь
(16)
Рь > 1/2 V (Рь < 1/2 Л Тм < с1К).
Теорема 2 (Т2). Пусть £/, IV - В-пространства, Б С и, д - непрерывное отображение В -» и выполняются:
1) до ^ ||р(хо||; 2) 3 липшицева в Б' с константой Ь\
3) ГНжЖгм \fxeD'- 4) Н^ЧяоЖго;
5) шар 5(жо,с?2) принадлежит области D.
Тогда в шаре существует корень а уравнения (1), который является
правой предельной точкой фазовой траектории решения задачи Коши (7), а именно, существует Т € [0,d2] такое, что решение этой задачи Коши x(t) определено на [О,Т); непродолжимо вправо и Ит*_>т-оя(£) = а• Причем суперпозиция ||p(a;(t))|| монотонно убывает до О на (О,Т). Если оценка го огрубляется до гм, то условие 2) можно ослабить до локальной липшицевости J в D'.
Доказательство. В силу липшицевости производной J она будет равномерно ограничена в любой ограниченной области из D'. Это позволяет повторить доказательство Т1 вплоть до цепи (11), из которой извлекается первая оценка, принимающая, в силу условия 2), вид Lp(t) ^ Lp2(t).
Согласно лемме 4, выясняем, что Li/p(t) ^ p~2(t)Lp(t) ^ L. И, в силу леммы 3,
1М0) -1 /p(t) < t, т. е. p(t) ^ V t е [о, г).
Кроме этой оценки, согласно условию 3), должно быть p(t) ^ гм для всех t € [О ,Т). Единственный момент совпадения оценок легко вычисляется из уравнения гм = -—~- относительно t: Тм := ~——. Для более поздних моментов
1 — LtqI LrMr0
лучше априорной оценки гм для р нет.
Таким образом, p(t) < <p(t) Vt € [О,Т), где
?(*):= il^? (17) { гш Тм.
Усилим (9) с помощью (17): (\\g\\)'t ^ -l/<p{t). Отсюда
(18)
Модуль подынтегральной функции ограничен снизу величиной 1/гм > О, т.е. правая часть (18) монотонно стремится к — оо, когда t -» +оо. Поэтому если x(t) не покидает область задания, то ||<7(ж(*))|| обратится в нуль не позднее момента d, когда правая часть станет равной —9q.
Если Тм^ dK и PL ^ 1/2, то d — dK — d2 (т. е. знание оценки гм не дает выигрыша в оценке удаленности сравнительно с ТК, которая не использует гм. Это объясняется тем, что в силу непрерывности ||J-1(^)|| не достигает своего порогового значения в малой окрестности точки жо)-
В остальных случаях d определится из равенства
-9o = (Lt2/2-t/rQ)\7Q
Отсюда
т* d — Тм
d = TM + ru(g0 + ^~>j= гм90 4- Тм-
(- х Ы* , ^ гр-г« тмЬТ2 =
г0 2
= гм90 - гмЬТЦ2 = гм90 - {гм/г0 - 1)2/2тмЬ =
Как и в Т1, показывается, что существует х(сЬ) := и #№) € 5(ж0,^2)- В
силу непрерывности д верно д{х^2)) = 0, т. е. в шаре Б(хо,с^) существует корень отображения д. Ясно, что Т = ¿2? так как при I <Т д(х^)) ф 0.
Как видно из предыдущего, если т*о огрублено до тМу т.е. информация о 3 *(жо) не используется, то ¿2 = тм9о независимо от величины Ь. В этом случае, как явствует из вышеприведенных рассуждений, условие 2) можно ослабить, потребовав лишь локальной липшицевости 3 в V.
Замечание. Т2 точна в том смысле, что для любого набора входных параметров можно указать функцию, на которой достигается оценка удаленности из Т2.
Действительно, пусть имеются конкретные входные параметры - положительные числа 9о,го,Ь,гм (гм^го). Согласно им, вычисляем, как в Т2, параметр Тм. Зададим скалярную функцию / следующим образом:
Очевидно, что в любом сегменте из -R1 функция /' липшицева с константой L и ¡/'(ж)!"1 ^ гм. Несложно найти ближайший к жо = О корень/. Это, как раз, di- Таким образом, для того чтобы / удовлетворяла условиям из Т2, отрезок [—с?2, efe] = 5(0, efe) должен принадлежать области задания D.
Поэтому функцию / из (19) будем именовать максимайзером Т2 (удаленности ближайшего к жо корня).
3. Сравнение с известными результатами. Условия Т1 заметно отличаются не только от условий Т2, но и от условий вышеупомянутых ТК, ТМ, ТГ. Поэтому, не ожидая, что сравнение с ними Т1 принесет какие-то большие откровения, ограничимся лишь сравнением ее с ТК, точнее, только с ее частью (ЧТК), касающейся существования и оценки удаленности решения уравнения (1) от начальной точки.
Для удобства сравнения приведем эту часть, следуя [3], где используется только липшицевость J, и учтем замечание 1 к теореме 6, §1, гл. XVIII [1], в котором отмечена возможность упрощения оценки щ ^ ||</-1(жо)<?(жо)|| за счет некоторого огрубления, а именно, употреблением вместо щ величины ropo-
ЧТК. Пусть область задания D непрерывного отображения g есть замкнутый шар 5(жо, R) цд имеет производную 3 в его внутренних точках, липшицеву с константой Ц Цр(ж0)1| ^ <?о; H^faOH < г0) PL := rlLg0 ^ 1/2; S(x0,R) D 5(ж0,^к),
, 1-уТ^Ж ^
где ак :=---го0о-
Тогда уравнение (1) имеет решение в замкнутом шаре 5(жо,с2к).
Замечание 1. В приведенной формулировке сделано небольшое уточнение сравнительно с [3] (теорема 11.3), где ничего не говорится о замкнутости используемых шаров, хотя далее (теорема 12.2) те же обозначения относятся к открытому шару. Данное уточнение извлечено непосредственно из доказательства теоремы 11.3 в [3]. В работе Канторовича оба шара замкнуты и еще выставлено дополнительное требование существования производной на границе 95(жо, Н). Упомянутое доказательство, однако, в этом не нуждается.
Замечание 2. Приведенная формулировка ЧТК позволяет легко видеть, что упоминание о шаре 5(жо,Я) можно вообще изъять, не усилив и не ослабив теорему. А именно, можно будет говорить, что ТК применяется к С1'1 (£),£, жо,^о?^о) (см- замечание 2 к Т1).
' 9o-x/r0 + Lx2/2,
ж € [-оо, Т„],
х>Тм.
(19)
Рь
Замечание 3. ЧТК точна в том же смысле, что Т1 и Т2 (см. замечания к ним). Оценка удаленности йк в ней реализуется максимайзером Канторовича (§ 1, гл. XVIII
ю
Ьх2
Дж) = 90 + х/г0 + —, х е Л1. (20)
То, что параметр Ра может быть близок к 1, а Рь должен не превосходить 1/2, не означает, что Т1 сильнее ЧТК, поскольку структуры этих параметров различны.
Если у некоторого отображения д известны параметры, являющиеся входными параметрами в Т1 и ЧТК, то очевидно, что оно должно принадлежать пересечению П(£), <т, хо, до? П)) П С1'1 (Р^ 0о > **о) при каких-то значениях параметров <т, Ь.
При фиксации I}, жо, до, г о различным соотношениям параметров а, Ь, которым взаимно однозначно соответствуют параметры Рь, отвечают различные соотношения между суждениями Т1 и ЧТК: 1) обе не дают гарантии существования решения уравнения (1); 2) одна дает - другая нет; 3) обе дают. Причиной отсутствия гарантии может быть как чрезмерная величина характерного параметра (Ра ^ 1, Рь > 1/2), так и невозможность разместить в области задания Б оценочные шары 5(жо,с?1) и
Установим связь между радиусами оценочных шаров в зависимости от соотношений характерных параметров Ра € (0,1), Рь Е (0,1/2]:
1 + у/1-2Рь'
Обозначим — Ра/\п(1 — Ра) через ф, тогда последнее неравенство эквивалентно 2д ^ 1 + у/1 - 2Рь 2Ц - 2С}2 ^ Рь А С} ^ 1/2.
Зависимость Рь = 2д(Ра) - 2д2(Ра), где Ра <Е (0, Р;], а Р; и 0,79681213 есть корень уравнения 1/2 = <2(Р<г), определяет кривую которая разбивает в плоскости (Ра,Рь) прямоугольник (0,1) х (0,1/2] на область I, где < е2к, и область II, где ¿¿1 > йк.
Единственная кривая на рис. 1 - это £.
Итак, первый квадрант плоскости (Ра,Рь) разбивается на 5 связных областей: I, II, III, IV, V.
В I Ра пробегает значения от 0 до Р; и Рь е (2(}(Ра) - 2С}2(Ра),1/2). Там Т1 лучше ЧТК, поскольку если ЧТК дает гарантии существования корня уравнения (1) в некоторой Б, то там же дает их и Т1, причем тогда <¿1 < с1к.
II := {(Р„,Р,) | Рь € (0,20(Р£Г) - 2Я2{Р<7) А рае (0,Р;)} и [Р;,1) х (0,1/2]. Там ТК лучше Т1, поскольку если Т1 дает гарантии в некоторой £), то там же дает их и ТК, причем тогда <1\ > йк.
В III Ра ^ 1, Рь ^ 1/2. Там Т1 не дает гарантий ни при каких областях £), при достаточно больших В ЧТК дает гарантии.
В IV Ра ^ 1, Рь > 1/2. Там ни Т1, ни ЧТК не дают гарантий ни при каких областях И.
В V Ра <1, Рь> 1/2. Там ЧТК не дает гарантий ни при каких областях Б, а Т1 при достаточно больших Б дает.
На кривой I суждения ЧТК и Т1 о существовании корня и оценке его удаленности совпадают.
Обратимся теперь к Т2. Наличие максимайзера удаленности (19) означает, что не существует суждения о ближайшем к хо корне произвольного отображения д, основанного на том же наборе входных параметров 9о,го,гм,Ь, которое давало бы меньшую оценку удаленности от жо, чем б?2 - корень максимайзера. Упомянутые во введении ТК, ТМ и ТГ используют либо те же параметры, либо часть из них и поэтому не могут давать лучших оценок, чем <¿2. Представляет интерес, насколько они хуже, чем (¿2-
Для удобства сравнения с Т2 приведем часть ТМ (ЧТМ) относительно существования и удаленности решения в наших обозначениях.
ЧТМ. Пусть выполнены условия 1)-4) Т2 и, кроме того;
5) Н := гмг0Ьд0 < 2; 6) 5(ж0,4)С Д где йм г09о (Л/2))2*-1. Тогда решение уравнения (1) принадлежит 8(хо,с1м).
Непосредственно в [2] условие 2) сильнее: ||«/'(я) II ^ Ь \/х € Б. Переход к липши-цевости 7, однако, несложен. Его можно найти, например, в версии ТМ у Ортеги и Рейнболдта [5].
Сравним теперь количественно оценки удаленности дъ и <1М при выполнении условий ТМ. Обозначим гм/го через г. Тогда
Ьгм Н
1 - У/1 - 2Рь - - 1-у/1- 2Н/г 2г090 ¿к =-5-г090 = г090г- г-- = --===.
Рь /11 + у/1 - 2/1/2
Отсюда при условиях Рь < 1/2 г >2Н следует
йк ^ Тм <==> у/1 - 2Л/*) <С г ~ 1 гу/1-21г/г ^ 1 <=>
«=> г2-2hz-l^Z0 <=> у/1 + Л2.
4А/
3,0
2,5
2,0
1,5
1,0
0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8
2,0
И
Рис. 2. Зависимость минимизированного по г отношения оценки с1м к от Л.
Последнее условие сильнее двух первых. Таким образом, три условия в переменных Рь, г сводятся к одному в переменных Л, г, и оценка «¿2 предстает в виде
Г 2/(1 + У1-2Л/*),
\[2Иг - (* - 1)2]/(2й), 1 ^ я < Л + у/Т+Ъ?,
г ^ к + л/ГТТ?,
¿2 = #0^0
что в диапазоне И е (0,2) приводит к расчетным формулам
Лм= Г(1 + ~ 2Л/*)Я(А)/2, сг2 \2ЛЯ(/0/[2Л*-(*-1)2],
0 /I + >Л +А2,
1 ^ я < А + уТ+Ж
При фиксированном значении А £ (0,2) величина у/1 - 2Л/г, будучи функцией от гб [Л + л/ТТР.+оо), имеет наименьшее значение при г = Н + х/Г+Т?, равное л/1 + А2 — А, а 2А;г — (г — I)2 как функция от г; € [1, л + УГ+лг) - наибольшее значение при я = А + 1, равное А2 + 2А. Следовательно,
йм > Г (1 - А + л/ГТ7?) Я(А)/2, * > А + АДТА2, (¿2^1 2Я(А)/(А + 2), 1 < * < Л + УГТТ?.
(21)
Нетрудно убедиться, что (1 — А + х/Г+А2) /2 > 2/(А + 2). Следовательно, минимальный выигрыш в использовании оценки ¿2 вместо йм может произойти при г = Л 4-1, что соответствует нижней формуле в (21).
2ЯШ
Зависимость = , < ^ представлена на рис. 2 нижнеи кривои, а зависимость
1-л + >/ГТР
/1 + 2 Я (Л) - верхней.
Интересно, что при г ^ 4 всегда найдется такое Рь ^ 1/2, что ЧТК, использующая меньшее количество информации об отображении д, дает гарантии существования решения, а ЧТМ - нет. Т2 объясняет эту коллизию.
ак/а2
Рис. 3. Зависимость отно- 1>® шения оценки йк к ¿2 от z.
1,4 1,3 1,2 1,1
1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6
2
Произведем количественное сравнение оценок из Т2 и ТК.
В ТК сравнительно с Т2 и ТМ не хватает одного входного параметра: гм. Прочие параметры совпадают. Поэтому оценка в условиях ТК не может быть меньше точной оценки, доставляемой Т2, т. е. <¿2 ^ (1К. Непосредственно же из формул видно, что когда Рь < 1/2 и гм (см. (16)) достаточно велико, имеет место <¿2 = с1к. Это объясняется тем, что в силу непрерывности 3~г{х) в малой окрестности начальной точки величина •7-1(х)|| не достигает своего порогового значения гм.
Когда Рь > 1/2, гарантия существования решения и оценка его удаленности есть в Т2, но нет в ЧТК (при выполнении остальных условий в этих теоремах).
Когда Тм < ¿¿к, а Рь ^ 1/2, оценка в Т2 меньше оценки в ЧТК. Отношение <^/<¿2 в этом случае удобно рассматривать как функцию переменных Рь и я. Имея представления
На рис. 3 представлены графики отношений ¿к/й2 при Рь, принимающем значения 3/7, 3/8, 1/3, 1/4. Чем меньше тем ниже график.
В сравнении с ТГ интерес представляет также содержащийся в формулировке метод достижения решения, поэтому изложим ее полностью, следуя [4] (теорема 1), но с учетом замечания 2 к ЧТК.
ТГ. Пусть выполнены условия 1),3) Т2 и, кроме того,
2) производная Гато «/' ограничена в некоторой окрестности каждой точки х €
4) Б(хо ,с?г) С Б, где йГ = гм9о. Тогда задача Кохии х = #(0) = хо имеет решение х(Ь) для всех
Ь^Ъ и х(1) € 5(а?о,^г); предел Ит^ооЖ^) существует и является решением уравнения (1).
Частный случай Т2, когда го огрубляется до гм, является небольшим усилением ТГ. Действительно, при условии 2) ТГ требуется ограниченность производной Гато от 3 в некоторой окрестности. Однако, согласно формуле конечных приращений, этого достаточно для липшицевости 7 в той же окрестности. Но липшицевость 7 в некоторых окрестностях всех точек из Б только и требуется в Т2.
получаем двупараметрическую зависимость
1, О (1-2Р,Г1/2, -г < (1 — 2Р,)'1'2.
(22)
Рис. 4• Зависимость отношения оценки dr к <¿2 от h.
В случае, когда z € (1,л +VI -f Л2) и известна для J константа Липшица в JD, Т2
/Го _ I)2 _ (z _ 1)2
доставляет лучшую оценку, чем ТГ: dr — d\ = м —--= д0Г0-—> 0.
2rML 2h
Оценка удаленности в ЧТМ отлична от оценки ТГ rM90 = tq9qz заменой H(h) на z. Поэтому расчетные формулы для отношения оценок удаленностей в диапазоне h € (0,-foo) принимают вид
dr = Ul + y/l-2h/z)z/2, z^h + y/l+W, ( ,
d1 (2hz/[2hz — (z — l)2], 1 < z < h + y/T+h?. 1 J
На рис. 4 представлены графики отношений dr/d2 при z, принимающем значения 3,5; 3; 2,5; 2; 1,5; 1. Чем меньше z, тем ниже график. Показана кривая стыковки двух разных случаев расчетной формулы.
Помимо оценок удаленности корня отображения д, Т2 и ТГ указывают возможный способ его нахождения в результате решения некоторой задачи Коши. С практической стороны интегрирование (7) не дольше, чем до конечного момента cfe, выглядит предпочтительней интегрирования задачи Коши из ТГ на полубесконечном промежутке [0,-foo). (Корень д есть ж(+оо).)
Summary
Miheev S. Е. Existence and estimation of nonlinear equation solution in Banach space.
The sufficient conditions of existence for solutions of a nonlinear equation g(x) = 0 in Banach space and an upper estimation of the distance between the solution and some given point is found.
The reflection g was assumed with derivation J := g' constrained for all x by the conditions L(x) = Hm||J(® + A) — J(x)||/||A|| < oo and (||J~1(x)\\Lj(x) < и — const or by the conditions
of Lipschitz with constant L and ||«/~1(ж)|| ^ rM- In both cases the solution can be reached by integration of Cauchy problem x = J-1 (x)g(x)/\\J~1(x)g(x)\\, ж(0) = xq, in finite interval. In the first case it is shown what is the relation between Pa := <тго||<?(жо)|| where ro ^ and PL := Lro\\g(xo)\\ to choose among Kantorovich's theorem about Newton's method and the proved one that guarantees the better estimation. In the second case it is shown that the proved result always outputs the estimation better than Mysovskih's theorem about Newton's method does, moreover this is an extension of Gavurin's theorem about continuous Newton's method when one knows the estimation ro < rM and an extension of the theorem of Kantorovich in the part of estimation and existence of the solution, when one knows the estimation rM.
Литература
1. Канторович JI. В., Акилов Г. П. Функциональный анализ. М.: Наука, 1977. 741 с.
2. Мысовских И. П. О сходимости метода JI. В. Канторовича решения функциональных уравнений и его применениях// Докл. АН СССР. 1950. Т. 70, № 4. С. 565-568.
3. Красносельский М. А. и др. Приближенное решение операторных уравнений. М.: Физматгиз, 1969. 455 с.
4. Гавурин М. К. Нелинейные функциональные уравнения и непрерывные аналоги итераг ционных методов// Изв. вузов. 1956. № 5 (6). С. 18-31.
5. Ортега Дж.} Рейнболдт В. Итерационные методы решения нелинейных систем уравнений со многими неизвестными / Пер. с англ. В. В. Вершкова и др.; Под ред. И. В. Коно-вальцева. М.: Мир, 1975. 558 с.
6. Михеев С. Е. Нелинейные методы в оптимизации. СПб.: Изд-во С.-Петерб. ун-та, 2001. 276 с.
7. Картан А. Дифференциальное исчисление. Дифференциальные формы/ Пер. с фр.; Под ред. Б. А. Фукса. М.: Мир, 1971. 392 с.
Статья поступила в редакцию 13 октября 2005 г.