Научная статья на тему 'Минимизация разности максимумов гладких функций'

Минимизация разности максимумов гладких функций Текст научной статьи по специальности «Математика»

CC BY
132
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КВАЗИДИФФЕРЕНЦИРУЕМЫЕ И КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ / ГИПОДИФФЕРЕНЦИАЛ / НЕОБХОДИМОЕ УСЛОВИЕ МИНИМУМА / QUASIDIFFERENTIABLE AND CODIFFERENTIABLE FUNCTIONS / HYPODIFFERENTIAL / NECESSARY CONDITION OF A MINIMUM

Аннотация научной статьи по математике, автор научной работы — Полякова Л. Н.

В работе рассмотрена задача минимизации одного класса негладких функций функций, представляющих из себя разность функций максимумов гладких функций. Эти функции являются квазидифференцируемыми и также непрерывно кодифференцированными. Понятие кодифференцированности было введено В. Ф. Демьяновым. Сформулировано необходимое условие минимума этой разности с использованием гиподифференциалов некоторых вспомогательных функций максимума. Предложены два алгоритма минимизации функций такого вида. Доказаны теоремы сходимости. Приведены примеры, иллюстрирующие данные алгоритмы. Библиогр. 2 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Minimization of smooth function maxima difference

The problem of minimizing one class of nonsmooth functions namely, the functions representing the difference of smooth function maxima is considered. These functions are quasidifferentiable and also continuously codifferentiable. The notion of codifferentiability was introdused by V. F. Demyanov. A necessary condition of a minimum of this difference in terms of functions of such a type are proposed. Conevergence theorems are proved. The examples illustrating the mentioned algorithms are provided.

Текст научной работы на тему «Минимизация разности максимумов гладких функций»

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

Сер. 10. 2009. Вып. 4

УДК 539.85 Л. Н. Полякова

МИНИМИЗАЦИЯ РАЗНОСТИ МАКСИМУМОВ ГЛАДКИХ ФУНКЦИЙ *)

1. Введение. Рассмотрим функцию

р(х) = /(х) — Н(х), х € Яп,

в которой /(х) = тахъе^ /ъ(х), I = !,..., т\, Н(х) = тах^^,] Ц (х), J =!,..., Ш2, и функции /ъ, г € I, Ц, ] € J, непрерывно дифференцируемые на Еп .

Функция р является квазидифференцируемой, и в качестве квазидифференциала этой функции в каждой точке х € Яп можно взять пару множеств Вр(х) = [д/(х), —дН(х)], где д/(х) и дН(х) - субдифференциалы функций / и Н. В нашем случае

д/(х) = со | У /1(х)\ , дН(х) = со | У К(х)\ .

\гЕЯ{х) ) \jeQix) /

Здесь Е(х) = {г € I | /(х) = /ъ(х)}, д(х) = {] € J | Н(х) = Ц(х)}, /', г € I, Ц, г € J, - градиенты функций /ъ, г € I, и Ц, ] € J, в точке х, через со (А) обозначена выпуклая оболочка множества А

В работе [1] было введено понятие гиподифференциала и гиподифференцируемой функции.

Функция / называется гиподифференцируемой в точке х € Яп, если существует такое выпуклое компактное множество / (х) С Яп+1, что справедливо разложение

/(х + Д) = /(х) + тах [а + (у, Д}] + о(х, А), а € Я, V € Яп,

\aMedf (х)

где

о

а а—>0

Множество (I/(х) называется гиподифференциалом функции / в точке х € Яп. Оно определяется неоднозначно. Функция / называется непрерывно гиподифференцируемой в точке х € Яп, если в некоторой окрестности точки х она гиподифференцирума и существует непрерывное в метрике Хаусдорфа гиподифференциальное отображение /(х).

Полякова Людмила Николаевна — доктор физико-математических наук, профессор кафедры математической теории моделирования систем управления факультета прикладной математики-процессов управления Санкт-Петербургского государственного университета. Количество опубликованных работ: 64. Научные направления: выпуклый анализ, недифференцируемая оптимизация. E-mail: [email protected].

*) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 09-01-00360).

© Л. Н. Полякова, 2009

Отметим тот факт, что функции / и Н являются непрерывно гиподифференцируе-мыми на Яп, так как в качестве непрерывных гиподифференциалов могут быть взяты множества ^

/(х)= ' С яп х Я,

dh(x) = UJ |hjJ | C Rn x R.

Данные гиподифференциальные отображения df : Rn —> 2Rn+1, dh : Rn —> 2Rn+1 непрерывны в метрике Хаусдорфа.

Множество d^j(x) является непрерывным гиподифференциалом функции fj(x),j G J, в точке x .

Рассмотрим оптимизационную задачу: найти

inf f(x). (1)

xeRn

Следует отметить, что решение задачи (1) можно получить, если при каждом фиксированном индексе j G J решить методом гиподифференциального спуска задачу минимизации функции fj на Rn, а затем выбрать из всех минимальных значений наименьшее, но, очевидно, что такой подход плох, когда индексное множество J большое.

В п. 3 предлагается метод, позволяющий минимизировать функцию f(x), используя лишь ограниченное число индексов. (Безусловно, может случиться, что и в этом методе придется перебрать все индексы.)

2. Необходимые условия минимума функции ф на Rn. Так как функция ф является квазидифференцируемой, то справедливо такое необходимое условие минимума.

Теорема 1 [2]. Для того чтобы функция ф достигала своего наименьшего на Rn значения в точке x*, необходимо, чтобы в этой точке выполнялось следующее включение:

dh(x*) C dh(x*). (2)

Точка x* называется inf-стационарной точкой функции ф на Rn, если в ней выполнено включение (2).

Обозначим

fj(x) = f (x) - hj (x)> j G J.

Тогда f(x) = min fj (x). Зафиксируем точку x G Rn. Для каждого индекса j G J jeJ

определим множество

(х = С0 { ( /(х)— 1((х)) г € ^

Множество (р^ (х) - непрерывный гиподифференциал функции р^ (х) в точке х.

Используя гиподифференциалы (р^ (х), ] € J, выпишем необходимое условие минимума функции р на Яп.

Теорема 2. Для того чтобы функция р достигала своего наименьшего на Яп значения в точке х*, необходимо, чтобы в этой точке выполнялось следующее включение:

0п+1 € Р| (р^ (х*). (3)

j€Q(x*)

Доказательство непосредственно следует из необходимого условия минимума (2) функции ф, записанного через субдифференциалы функций f и h в точке x*.

Очевидно, что если выполнено включение (3), то точка x* является inf-стационарной на Rn.

Зафиксируем произвольный индекс j G J и спроектируем точку 0n+i на множество dfj (x), т. е. решим оптимизационную задачу

шп |N| = \\zjZj(x) = [tj(x),wj(x)] G R x j G J.

zed^j (x)

Заметим, что если точка 0n+i не принадлежит множеству dfj (x), то вектор Wj (x) не равен 0n. Так как имеем дело с непрерывно гиподифференцируемыми функциями fj (x) для каждого индекса j G J и поскольку их гиподифференциалы dfj(x),j G J, непрерывны в метрике Хаусдорфа, то вектор-функция Zj (x) непрерывна по x для каждого индекса j G J.

Если \\zj(x)|| = 0 для каждого j G Q(x), то точка x есть inf-стационарная точка функции ф на Rn.

Пусть точка x G Rn не inf -стационарная точка функции f на Rn, тогда можно найти такой индекс j(x) G Q(x), что ||zj(x)(x)|| является максимальной, т. е.

max Wzj(x)W = Hzj^tx)! = Hz^x)!, z(x) = [t(x),w(x)] G R x Rn.

jeQ(x)

Положим

p(x) = —

(x)

w(x

(x)U'

Можно показать, что ф'(x,p(x)) ^ — ||z(x)||, где через ф'(x,p(x)) обозначена производная функции ф по направлению p(x) в точке x G Rn. Направление p(x) является направлением спуска функции фj(x) в точке x и соответственно функции ф.

3. Метод минимизации функции ф(x) на Rn. Выберем начальную точку x0. Если оказалось, что точка xo - inf-стационарная, то процесс закончен. Пусть уже найдена точка xk G Rn; если в ней выполнено включение (3), то она является inf-стационарной точкой функции ф.

В противном случае, найдем индекс j(xu) = jk и построим направление p(xu) = pu. Положим

au = arg inf фjк (xu + apu), xu+i = xk + aupu.

a>0

Теорема 3. Если последовательность {xu} конечна, то, по построению, последняя полученная точка является inf - стационарной точкой функции ф на Rn.

Если последовательность {xu} бесконечна и если лебегово множество

L = L(xo) = { x G Rn | ф(x) < ф^о) }

ограничено, то

^ 0.

Доказательство. Предположим противное.

Пусть последовательность {Hz(xu)||} не стремится к 0. Тогда найдутся такие подпоследовательность {xus}, число а > 0 и константа Ki > 0, что для каждого ks > Ki справедливо неравенство ||z(xks)|| ^ а.

Так как множество L компактно и все точки последовательности {xk} лежат в этом множестве, то, не ограничивая общности, можно считать, что подпоследовательность {xus} стремится к точке x*, такой что j(x*) = j* = const. Это возможно, поскольку подпоследовательность {xks} бесконечна, а индексное множество J конечно. Следовательно, ||z(x*)|| ^ а > 0 и

w(x* )

w(xks) —► w(x*), t(xks) ^>t(x*), pks —> p* = - и , ■

Так как

фj* (x* + ap*) = фj* (x*) + a^j* (x*,p*) + Qj* (a, x*,p*),

Oj* (a,x* ,p*)

где —-----------------> 0, то существует такое число a > 0, что

a a|0

Oj* (a,x*,p*) a

< - Уае(0,а*1.

а 2

Таким образом,

ап

^*(х* -\-ар*) ^ ц?^(х*)------— Уск € (0, а*].

Поскольку функция <^* непрерывна, то найдется такая константа К > 0, что справедливо неравенство

ап

(хкв + аркв) < (хкв )-~£ V» € (0, а*}.

Положим K = max{K]_, K2}. Тогда

зк

a* a

<f(xks + 1) < <fj*(xks +aksPks) < <fj*(xks +a*pks) < <f(xks)------------------------------------------------------------------------------------------------------------------------------—.

Следовательно,

<Pj*(xks+J = ¥’(xks+1) < ¥’(xks + i) < <Pj* (xks) ~ —• (4)

Устремляя в неравенстве (4) ks к +то, получим, что функция ф неограничена снизу на компактном множестве L . Это противоречие доказывает теорему.

Замечание 1. Следует отметить тот факт, что если бы для построения направления спуска использовался любой отличный от нуля вектор zj (xk), j G Q(xk), то для каждого индекса, бесконечно содержащегося в последовательности индексов Q(xk), было бы справедливо

llzj^ 0.

К сожалению, в данном методе нельзя утверждать, что предельные точки последовательности {xu } являются inf-стационарными точками функции ф.

Пример 1. Рассмотрим функции

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

f(x) = 0, Ьл(х) = -]^{Aix,x), h2(x) = ~^(А2х, х) - (6i,x),

x G R2, x0 = (1,0) G R2, bi = (5,0) G R2,

*=d O’ "2=d 5

Тогда

ф(x) = — max{hi(x), h2(x)} = min{-hi(x), -h2(x)} .

Используя данный метод для минимизации функции ф(x), получим последовательность {xu}, стремящуюся к нулевой точке, и Q(xu) = 1. Но точка x* = (0, 0) не является inf-стационарной точкой для функции ф(x) на Rn.

Модифицируем этот метод.

Выберем произвольное е > 0, и по нему определим индексное множество

Qe(x) = {j G J | h(x) — hj(x) < e}. (5)

Найдем zj (x) для каждого индекса, входящего в (5). Положим

Qo(x) = { j G Q(x) | ||zj(x)H =0 }, Qi(x) = QE(x)\Qo(x).

Если множество Q(x) содержится в множестве Qo(x), то точка x является inf-стационарной точкой функции ф на Rn.

Опишем метод минимизации функции ф.

Выберем произвольную начальную точку xo G Rn. Если оказалось, что точка xo есть inf-стационарная точка функции ф на Rn, т. е. 0n+i G df (xo), то процесс закончен.

Пусть уже найдена точка xu G Rn. Если в ней выполнено включение (3), то она является inf-стационарной точкой функции ф. В противном случае, построим для каж-

Wj (xu)

дого индекса j G Qi(Xk) направления pj к = Pj(xk) = — ц— ,—гтг и минимизируем каж-

Ww (xu Л|

дую из функций фj, j G Qi(xu), вдоль соответствующих направлений. Это возможно, поскольку

^j (xu,pj,u) < 11 zj (xu )||, j G Qi(xu).

Положим

аj k = arg rnin p(xk + аjPj,k), j Є Qi(xk), xj,k+i = xj k + аj,kPj,k.

aj >0

Вычислим

шіп <p(xj,k+i) = Pjk (xj,k+i), jk Є Qi(xk), j^Qi (xk)

и положим xk+i = xjk,k+i. Очевидно, что

p(xk+i) < Vjk (xk+i), jk Є Qi(xk).

Предположим, что последовательность {xk} бесконечна и лебегово множество L ограничено, тогда справедлива следующая теорема.

Теорема 4. Любая предельная точка последовательности {xk } является inf-стационарной точкой функции ф на Rn.

Доказательство. От противного.

Выберем сходящуюся подпоследовательность {xks} последовательности {xk }. Пусть x* Є L есть предельная точка этой подпоследовательности. Предположим, что последовательность чисел {\\z(xks )||} не стремится к 0. Тогда найдутся такие индекс j* Є Q(x*) и число a У 0, что \\zj* (x*)|| ^ a.

Так как функция \\zjt (ж)У непрерывна, то существует такая константа К\ > 0, что

\\гз*(хк3)\\ > т2 Укв>К1.

Также найдется константа К2 > 0 такая, что для каждого к8 > К2 индекс ] * будет содержаться в множестве Ql(x|~s) С Qe(хks). Следовательно, будет выполняться следующее неравенство:

Ф(хка + 1) ^ фj* (^* ,ка + 1) = фj* (хк3 + ,ка Pj*,ks ).

Аналогично предыдущему доказательству, найдутся такие число а* > 0 и константа К > тах{К\, К2}, что

^Pj* (xj* гкв +1) ^ ^Pj*(xks) ~ а* ^ ^ К'

Итак, имеем

а* а а*а

¥>(хК+1) < ¥>(^ + 1) < ¥’Г*(хкв)----= ¥’(хкв) + Цхкв) - ]гг*(хкв)-------—.

Устремляя в этом неравенстве к8 к +то, получим

зк

а* а

Полученное противоречие доказывает теорему.

Замечание 2. Несложно заметить, что, используя предлагаемый метод для минимизации функции ф из примера 1 с любым положительным е, получим оптимальную точку для данной функции.

Пример 2. Рассмотрим функции

/(ж) = 0, Ьл(х) = -^{Ахх,х), 1г2(х) = ~^(А2х,х) - {Ъъх) - 2,

х = (х\,х2) € Я2, х0 = (1, 0) € В?, Ъ\ = (5, 0) € В?,

* == (1 о • *=(15

Пусть

ф(х) = — тах{Н\(х), Н2(х)} = тт{—Н\(х), — Н2(х)} .

Если выберем е достаточно малым, то найдем точку локального минимума функции ф (в нашем случае это точка х* = (0,0)). Если выберем е таким, чтобы, начиная с некоторого к, для точек хк выполнялось неравенство Н(хк) — Ь,2(хк) ^ е, то в процессе минимизации будем переключаться с функции —Н\ на функцию — Л-2. Тогда сможем проскочить точку локального минимума ф и найти точку глобального минимума этой функции ф.

Литература

1. Демьянов В. Ф., Рубинов А. М. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. 431 с.

2. Полякова Л. Н. Необходимые условия экстремума квазидифференцируемых функций // Вестн. Ленингр. ун-та. 1980. № 13. С. 57—62.

Статья рекомендована к печати проф. В. Ф. Демьяновым.

Статья принята к печати 28 мая 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.