ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА
Сер. 10. 2009. Вып. 4
УДК 539.85 Л. Н. Полякова
МИНИМИЗАЦИЯ РАЗНОСТИ МАКСИМУМОВ ГЛАДКИХ ФУНКЦИЙ *)
1. Введение. Рассмотрим функцию
р(х) = /(х) — Н(х), х € Яп,
в которой /(х) = тахъе^ /ъ(х), I = !,..., т\, Н(х) = тах^^,] Ц (х), J =!,..., Ш2, и функции /ъ, г € I, Ц, ] € J, непрерывно дифференцируемые на Еп .
Функция р является квазидифференцируемой, и в качестве квазидифференциала этой функции в каждой точке х € Яп можно взять пару множеств Вр(х) = [д/(х), —дН(х)], где д/(х) и дН(х) - субдифференциалы функций / и Н. В нашем случае
д/(х) = со | У /1(х)\ , дН(х) = со | У К(х)\ .
\гЕЯ{х) ) \jeQix) /
Здесь Е(х) = {г € I | /(х) = /ъ(х)}, д(х) = {] € J | Н(х) = Ц(х)}, /', г € I, Ц, г € J, - градиенты функций /ъ, г € I, и Ц, ] € J, в точке х, через со (А) обозначена выпуклая оболочка множества А
В работе [1] было введено понятие гиподифференциала и гиподифференцируемой функции.
Функция / называется гиподифференцируемой в точке х € Яп, если существует такое выпуклое компактное множество / (х) С Яп+1, что справедливо разложение
/(х + Д) = /(х) + тах [а + (у, Д}] + о(х, А), а € Я, V € Яп,
\aMedf (х)
где
о
а а—>0
Множество (I/(х) называется гиподифференциалом функции / в точке х € Яп. Оно определяется неоднозначно. Функция / называется непрерывно гиподифференцируемой в точке х € Яп, если в некоторой окрестности точки х она гиподифференцирума и существует непрерывное в метрике Хаусдорфа гиподифференциальное отображение /(х).
Полякова Людмила Николаевна — доктор физико-математических наук, профессор кафедры математической теории моделирования систем управления факультета прикладной математики-процессов управления Санкт-Петербургского государственного университета. Количество опубликованных работ: 64. Научные направления: выпуклый анализ, недифференцируемая оптимизация. E-mail: [email protected].
*) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 09-01-00360).
© Л. Н. Полякова, 2009
Отметим тот факт, что функции / и Н являются непрерывно гиподифференцируе-мыми на Яп, так как в качестве непрерывных гиподифференциалов могут быть взяты множества ^
/(х)= ' С яп х Я,
dh(x) = UJ |hjJ | C Rn x R.
Данные гиподифференциальные отображения df : Rn —> 2Rn+1, dh : Rn —> 2Rn+1 непрерывны в метрике Хаусдорфа.
Множество d^j(x) является непрерывным гиподифференциалом функции fj(x),j G J, в точке x .
Рассмотрим оптимизационную задачу: найти
inf f(x). (1)
xeRn
Следует отметить, что решение задачи (1) можно получить, если при каждом фиксированном индексе j G J решить методом гиподифференциального спуска задачу минимизации функции fj на Rn, а затем выбрать из всех минимальных значений наименьшее, но, очевидно, что такой подход плох, когда индексное множество J большое.
В п. 3 предлагается метод, позволяющий минимизировать функцию f(x), используя лишь ограниченное число индексов. (Безусловно, может случиться, что и в этом методе придется перебрать все индексы.)
2. Необходимые условия минимума функции ф на Rn. Так как функция ф является квазидифференцируемой, то справедливо такое необходимое условие минимума.
Теорема 1 [2]. Для того чтобы функция ф достигала своего наименьшего на Rn значения в точке x*, необходимо, чтобы в этой точке выполнялось следующее включение:
dh(x*) C dh(x*). (2)
Точка x* называется inf-стационарной точкой функции ф на Rn, если в ней выполнено включение (2).
Обозначим
fj(x) = f (x) - hj (x)> j G J.
Тогда f(x) = min fj (x). Зафиксируем точку x G Rn. Для каждого индекса j G J jeJ
определим множество
(х = С0 { ( /(х)— 1((х)) г € ^
Множество (р^ (х) - непрерывный гиподифференциал функции р^ (х) в точке х.
Используя гиподифференциалы (р^ (х), ] € J, выпишем необходимое условие минимума функции р на Яп.
Теорема 2. Для того чтобы функция р достигала своего наименьшего на Яп значения в точке х*, необходимо, чтобы в этой точке выполнялось следующее включение:
0п+1 € Р| (р^ (х*). (3)
j€Q(x*)
Доказательство непосредственно следует из необходимого условия минимума (2) функции ф, записанного через субдифференциалы функций f и h в точке x*.
Очевидно, что если выполнено включение (3), то точка x* является inf-стационарной на Rn.
Зафиксируем произвольный индекс j G J и спроектируем точку 0n+i на множество dfj (x), т. е. решим оптимизационную задачу
шп |N| = \\zjZj(x) = [tj(x),wj(x)] G R x j G J.
zed^j (x)
Заметим, что если точка 0n+i не принадлежит множеству dfj (x), то вектор Wj (x) не равен 0n. Так как имеем дело с непрерывно гиподифференцируемыми функциями fj (x) для каждого индекса j G J и поскольку их гиподифференциалы dfj(x),j G J, непрерывны в метрике Хаусдорфа, то вектор-функция Zj (x) непрерывна по x для каждого индекса j G J.
Если \\zj(x)|| = 0 для каждого j G Q(x), то точка x есть inf-стационарная точка функции ф на Rn.
Пусть точка x G Rn не inf -стационарная точка функции f на Rn, тогда можно найти такой индекс j(x) G Q(x), что ||zj(x)(x)|| является максимальной, т. е.
max Wzj(x)W = Hzj^tx)! = Hz^x)!, z(x) = [t(x),w(x)] G R x Rn.
jeQ(x)
Положим
p(x) = —
(x)
w(x
(x)U'
Можно показать, что ф'(x,p(x)) ^ — ||z(x)||, где через ф'(x,p(x)) обозначена производная функции ф по направлению p(x) в точке x G Rn. Направление p(x) является направлением спуска функции фj(x) в точке x и соответственно функции ф.
3. Метод минимизации функции ф(x) на Rn. Выберем начальную точку x0. Если оказалось, что точка xo - inf-стационарная, то процесс закончен. Пусть уже найдена точка xk G Rn; если в ней выполнено включение (3), то она является inf-стационарной точкой функции ф.
В противном случае, найдем индекс j(xu) = jk и построим направление p(xu) = pu. Положим
au = arg inf фjк (xu + apu), xu+i = xk + aupu.
a>0
Теорема 3. Если последовательность {xu} конечна, то, по построению, последняя полученная точка является inf - стационарной точкой функции ф на Rn.
Если последовательность {xu} бесконечна и если лебегово множество
L = L(xo) = { x G Rn | ф(x) < ф^о) }
ограничено, то
^ 0.
Доказательство. Предположим противное.
Пусть последовательность {Hz(xu)||} не стремится к 0. Тогда найдутся такие подпоследовательность {xus}, число а > 0 и константа Ki > 0, что для каждого ks > Ki справедливо неравенство ||z(xks)|| ^ а.
Так как множество L компактно и все точки последовательности {xk} лежат в этом множестве, то, не ограничивая общности, можно считать, что подпоследовательность {xus} стремится к точке x*, такой что j(x*) = j* = const. Это возможно, поскольку подпоследовательность {xks} бесконечна, а индексное множество J конечно. Следовательно, ||z(x*)|| ^ а > 0 и
w(x* )
w(xks) —► w(x*), t(xks) ^>t(x*), pks —> p* = - и , ■
Так как
фj* (x* + ap*) = фj* (x*) + a^j* (x*,p*) + Qj* (a, x*,p*),
Oj* (a,x* ,p*)
где —-----------------> 0, то существует такое число a > 0, что
a a|0
Oj* (a,x*,p*) a
< - Уае(0,а*1.
а 2
Таким образом,
ап
^*(х* -\-ар*) ^ ц?^(х*)------— Уск € (0, а*].
Поскольку функция <^* непрерывна, то найдется такая константа К > 0, что справедливо неравенство
ап
(хкв + аркв) < (хкв )-~£ V» € (0, а*}.
Положим K = max{K]_, K2}. Тогда
зк
a* a
<f(xks + 1) < <fj*(xks +aksPks) < <fj*(xks +a*pks) < <f(xks)------------------------------------------------------------------------------------------------------------------------------—.
Следовательно,
<Pj*(xks+J = ¥’(xks+1) < ¥’(xks + i) < <Pj* (xks) ~ —• (4)
Устремляя в неравенстве (4) ks к +то, получим, что функция ф неограничена снизу на компактном множестве L . Это противоречие доказывает теорему.
Замечание 1. Следует отметить тот факт, что если бы для построения направления спуска использовался любой отличный от нуля вектор zj (xk), j G Q(xk), то для каждого индекса, бесконечно содержащегося в последовательности индексов Q(xk), было бы справедливо
llzj^ 0.
К сожалению, в данном методе нельзя утверждать, что предельные точки последовательности {xu } являются inf-стационарными точками функции ф.
Пример 1. Рассмотрим функции
f(x) = 0, Ьл(х) = -]^{Aix,x), h2(x) = ~^(А2х, х) - (6i,x),
x G R2, x0 = (1,0) G R2, bi = (5,0) G R2,
*=d O’ "2=d 5
Тогда
ф(x) = — max{hi(x), h2(x)} = min{-hi(x), -h2(x)} .
Используя данный метод для минимизации функции ф(x), получим последовательность {xu}, стремящуюся к нулевой точке, и Q(xu) = 1. Но точка x* = (0, 0) не является inf-стационарной точкой для функции ф(x) на Rn.
Модифицируем этот метод.
Выберем произвольное е > 0, и по нему определим индексное множество
Qe(x) = {j G J | h(x) — hj(x) < e}. (5)
Найдем zj (x) для каждого индекса, входящего в (5). Положим
Qo(x) = { j G Q(x) | ||zj(x)H =0 }, Qi(x) = QE(x)\Qo(x).
Если множество Q(x) содержится в множестве Qo(x), то точка x является inf-стационарной точкой функции ф на Rn.
Опишем метод минимизации функции ф.
Выберем произвольную начальную точку xo G Rn. Если оказалось, что точка xo есть inf-стационарная точка функции ф на Rn, т. е. 0n+i G df (xo), то процесс закончен.
Пусть уже найдена точка xu G Rn. Если в ней выполнено включение (3), то она является inf-стационарной точкой функции ф. В противном случае, построим для каж-
Wj (xu)
дого индекса j G Qi(Xk) направления pj к = Pj(xk) = — ц— ,—гтг и минимизируем каж-
Ww (xu Л|
дую из функций фj, j G Qi(xu), вдоль соответствующих направлений. Это возможно, поскольку
^j (xu,pj,u) < 11 zj (xu )||, j G Qi(xu).
Положим
аj k = arg rnin p(xk + аjPj,k), j Є Qi(xk), xj,k+i = xj k + аj,kPj,k.
aj >0
Вычислим
шіп <p(xj,k+i) = Pjk (xj,k+i), jk Є Qi(xk), j^Qi (xk)
и положим xk+i = xjk,k+i. Очевидно, что
p(xk+i) < Vjk (xk+i), jk Є Qi(xk).
Предположим, что последовательность {xk} бесконечна и лебегово множество L ограничено, тогда справедлива следующая теорема.
Теорема 4. Любая предельная точка последовательности {xk } является inf-стационарной точкой функции ф на Rn.
Доказательство. От противного.
Выберем сходящуюся подпоследовательность {xks} последовательности {xk }. Пусть x* Є L есть предельная точка этой подпоследовательности. Предположим, что последовательность чисел {\\z(xks )||} не стремится к 0. Тогда найдутся такие индекс j* Є Q(x*) и число a У 0, что \\zj* (x*)|| ^ a.
Так как функция \\zjt (ж)У непрерывна, то существует такая константа К\ > 0, что
\\гз*(хк3)\\ > т2 Укв>К1.
Также найдется константа К2 > 0 такая, что для каждого к8 > К2 индекс ] * будет содержаться в множестве Ql(x|~s) С Qe(хks). Следовательно, будет выполняться следующее неравенство:
Ф(хка + 1) ^ фj* (^* ,ка + 1) = фj* (хк3 + ,ка Pj*,ks ).
Аналогично предыдущему доказательству, найдутся такие число а* > 0 и константа К > тах{К\, К2}, что
^Pj* (xj* гкв +1) ^ ^Pj*(xks) ~ а* ^ ^ К'
Итак, имеем
а* а а*а
¥>(хК+1) < ¥>(^ + 1) < ¥’Г*(хкв)----= ¥’(хкв) + Цхкв) - ]гг*(хкв)-------—.
Устремляя в этом неравенстве к8 к +то, получим
зк
а* а
Полученное противоречие доказывает теорему.
Замечание 2. Несложно заметить, что, используя предлагаемый метод для минимизации функции ф из примера 1 с любым положительным е, получим оптимальную точку для данной функции.
Пример 2. Рассмотрим функции
/(ж) = 0, Ьл(х) = -^{Ахх,х), 1г2(х) = ~^(А2х,х) - {Ъъх) - 2,
х = (х\,х2) € Я2, х0 = (1, 0) € В?, Ъ\ = (5, 0) € В?,
* == (1 о • *=(15
Пусть
ф(х) = — тах{Н\(х), Н2(х)} = тт{—Н\(х), — Н2(х)} .
Если выберем е достаточно малым, то найдем точку локального минимума функции ф (в нашем случае это точка х* = (0,0)). Если выберем е таким, чтобы, начиная с некоторого к, для точек хк выполнялось неравенство Н(хк) — Ь,2(хк) ^ е, то в процессе минимизации будем переключаться с функции —Н\ на функцию — Л-2. Тогда сможем проскочить точку локального минимума ф и найти точку глобального минимума этой функции ф.
Литература
1. Демьянов В. Ф., Рубинов А. М. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. 431 с.
2. Полякова Л. Н. Необходимые условия экстремума квазидифференцируемых функций // Вестн. Ленингр. ун-та. 1980. № 13. С. 57—62.
Статья рекомендована к печати проф. В. Ф. Демьяновым.
Статья принята к печати 28 мая 2009 г.