Научная статья на тему 'Некоторые методы минимизации максимума квадратичных функций'

Некоторые методы минимизации максимума квадратичных функций Текст научной статьи по специальности «Математика»

CC BY
156
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Полякова Людмила Николаевна

В работе рассматривается несколько алгоритмов минимизации функции максимума от квадратичных функций в евклидовом пространстве \Bbb R^n. Показывается, что данную задачу можно свести к нахождению точки с наименьшей евклидовой нормой, принадлежащей пересечению квадрик. Описывается метод минимизации функции максимума на \Bbb R^n с постоянным шагом, аналогичный градиентному методу минимизации с постоянным шагом сильно выпуклой функции. Доказывается геометрическая скорость сходимости генерируемой последовательности к точке минимума.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Некоторые методы минимизации максимума квадратичных функций»

Владикавказский математический журнал октябрь-декабрь, 2006, Том 8, Выпуск 4

УДК 519.3

НЕКОТОРЫЕ МЕТОДЫ МИНИМИЗАЦИИ МАКСИМУМА КВАДРАТИЧНЫХ ФУНКЦИЙ1

Л. Н. Полякова

Светлой памяти Александра Моисеевича посвящается

В работе рассматриваются несколько алгоритмов минимизации функции максимума от квадратичных функций в евклидовом пространстве К". Показывается, что данную задачу можно свести к нахождению точки с наименьшей евклидовой нормой, принадлежащей пересечению квадрик. Описывается метод минимизации функции максимума на К" с постоянным шагом, аналогичный градиентному методу минимизации с постоянным шагом сильно выпуклой функции. Доказывается геометрическая скорость сходимости генерируемой последовательности к точке минимума.

1. Введение

Класс функций максимума от непрерывно дифференцируемых функций является одним из наиболее исследованных среди негладких функций (см., например, [1, 2]). Напомним некоторые свойства таких функций. Пусть

f (x) = max fi(x), fi(x) = 1 (Aix,x) + (bi,x) + Ci, i e I1 =0 U I, I = 1,... ,m, x e rn, ie/i 2

где Ai — симметричные матрицы размера n x n, bi e rn, Ci e r, i e Ii.

В каждой точке x e rn функция f непрерывна и дифференцируема по любому направлению g e rn, при этом ее производная по направлению имеет вид (см, например, [1])

f(x,g) = max,(v,g}, df (x) = co I N (Aix + bi), Rf (x) = {i e Ii | fi(x) = f (x)}.

vedf (x) U-M*)

Здесь через co{X} обозначена выпуклая оболочка множества X. Множество df (x*) называется субдифференциалом функции f в точке x*. Рассмотрим оптимизационную задачу: найти

inf f(x). (1)

© 2006 Полякова Л. Н.

1 Работа выполнена при поддеpжке Российского Фонда фундаментальных Исследований (Гpант РФФИ №06-01-00276).

Для нее сформулируем необходимые условия минимума.

Теорема 1. [1] 1) Для того чтобы точка ж* £ Ж" была точкой минимума функции / на Ж", необходимо, чтобы выполнялось включение

0" £ д/(ж*). (2)

2) Для того чтобы точка ж* £ Ж" была точкой минимума функции / на Ж", необходи

т

мо, чтобы нашлись такие неотрицательные коэффициенты г £ 1\, ^ = 1, чтобы

¿=0

выполнялись условия

тт

^ Аж* = - ^ (3)

¿=0 ¿=0

^ (/¿(ж) - /(ж)) = 0, г £ 1\. (4)

Точка ж* £ ж", для которой выполняется условие (2) или условия (3), (4) называется стационарной точкой функции / на ж". Из условия (4) следует, что если в стационарной точке г £ й/(ж*), то ^ = 0.

Пусть точка ж* £ ж" — стационарная точка функции / на ж" и числа г £ /1, таковы, что для них в ж* выполнены соотношения (3), (4). Введем множество

т

М/(ж*) = = (^,К,...,Кт) £ жт+1 | ^ ^ 0, г £ д = 1}.

¿=0

Если все матрицы А, г £ /, — неотрицательно определенные, то функции /¿, г £ /1, являются выпуклыми, и тогда необходимые условия минимума, сформулированные в теореме 1, являются также достаточными условиями. Если все матрицы А, г £ /1, — положительно определенные, то решение задачи (1) единственно.

Рассмотрим невырожденное преобразование ж = Ду. В результате такого преобразования квадратичные формы (Аж,ж), г £ /1, будут приведены к квадратичным формам (Ау,у), г £ /1. Причем матрицы А, А связаны соотношениями

А = (Дт)-1 АД-1, А = ДтАД г £ /1,

где через обозначена транспонированная матрица. Определим функцию

<(у)=шах<(у), У £ ж", ¿б/

где

<(у) = 2 (Ау,у) + (ь,у) + , Ьг = Дт£ ж", г £ /1. Рассмотрим оптимизационную задачу: найти

1пХ <(у). (5)

Множество д<(у) = со < и (Ау + Ь^ > есть субдифференциал функции < в точ-

^¿бЯ^(у) ]

ке у £ ж". Нетрудно видеть, что при таком преобразовании й/ (ж) = й^(у).

Пусть точка y* £ rn является решением задачи (5), тогда необходимо, чтобы

0n £ co i U (Ay* + 6i) i . [¿еДДг) )

Лемма 1. 1. Если точка x* £ rn является стационарной точкой функции f на rn, то у* = D-1x* есть стационарная точка функции р на rn.

2. Если точка у* £ rn является стационарной точкой функции р на rn, то x* = Dy* есть стационарная точка функции f на rn.

3. В обоих случаях справедливо равенство Mf (x*) = M^(y*).

< Докажем первое утверждение леммы. Пусть x* £ rn — стационарная точка функции f на rn. Тогда выполнено включение (2), т. е.

0n £ co i U (A¿x* + bi) i = co i U (AiDy* + b)

[ieRf (x*) ) [ie-Mr)

= coi U (DT )-1 {Ai y* + bi)| .

Отсюда следует, что 0„ £ co ^ (J (Aiy* + bi) > = dp(y*).

{ieR<p(y*) )

Второе утверждение леммы доказывается аналогично.

Из доказательства также следует справедливость равенства Mf (x*) = Mv(y*). > Из линейной алгебры известно (см., например, [3, 4]), что любую квадратичную форму с положительно определенной матрицей можно привести невырожденным преобразованием к нормальному виду.

В дальнейшем будем предполагать, что матрица Ао — положительно определенная. Тогда инфимум в задаче (1) достигается. Предположим, что невырожденное преобразование x = Dy приводит квадратичную форму (Aox, x) к нормальному виду. В этом случае, Ао = E, где через E обозначена единичная матрица размера [n х п]. Затем рассмотрим преобразование y = z — bo и квадратичные функции

^o(z) = 1 (z,z) + Со, ф (z) = 2 (Aiz,z) + (bi,z) + Ci, i £ I,

где

Co = co — 2 ||bo||2, bi = (bi,z) — 2 (Aiz,bi), Ci = Ci + 1 (Ai bo,6o) — (bi, bo), i £ I.

Обозначим ^(z) = max ^i(z). Рассмотрим оптимизационную задачу: найти ieli

min ^(z).

Если точка z* £ rn является стационарной точкой функции ф на rn, то несложно показать, что y* = z* — bo есть стационарная точка функции р на rn, а x* = D-1 y* — стационарная точка функции f на rn.

Таким образом, для того чтобы решить задачу (1), необходимо уметь минимизировать функцию

¡ (ж) = тах ¡г (ж),

¿6/1

где

¡о(ж) = 2 (ж, ж), ¡г (ж) = 2 (АгЖ,ж) + (Ь»,ж) + С», Ж £ ж",

Аг, — симметричные матрицы размера [п х п], Ьг £ ж", С» £ ж, г £ I.

Если матрицы А», г £ I, — положительно определенные, то решение задачи (1) существует и единственно. В дальнейшем будем предполагать, что в точке минимума ж* функции ¡ на ж" все функции ¡¿, г £ II, активны, т. е. выполнено равенство (ж*) = II. Тогда задача (1) эквивалентна задаче условной оптимизации: найти

тт 1 (ж, ж),

хбХ 2

где

X = |ж £ ж" | 1 (А*ж,ж) + (Ьг, ж) + Сг = 1 (ж, ж), г £ ^ .

Множество X может быть записано в виде

X = {ж £ ж" | ¡г(ж) - ¡о(ж) = 0, г £ I}. Пусть задана квадратичная функция

д(ж) = 1 (Аж, ж) + (Ь, ж) + с, множество X(д) = {ж £ ж" | д(ж) = 0} называется квадрикой. Если обозначить через

9г(ж) = ¡г(ж) - ¡о(ж), г £ I,

то множество X есть пересечение квадрик, определяемых квадратичными функциями дг, г £ I. Поэтому задача минимизации функции ¡ на ж" сводится к нахождению точки из множества X, имеющей наименьшую евклидову норму.

2. Минимизации максимума двух квадратичных функций

Рассмотрим случай минимизации функции максимума от двух квадратичных функций в предположении, что матрица Ао положительно определена. Из линейной алгебры известно, что существует невырожденное преобразование ж = ^у, приводящее квадратичную форму (А1ж, ж) к каноническому виду, а форму (Аож, ж) — к нормальному виду. Таким образом, можно считать, что функции ¡о и ¡1 имеют вид

¡о(ж) = 1 (ж,ж), ¡1(ж) = 2(©ж,ж) + (Ь,ж) + с, ж,Ь £ ж", с £ ж,

где матрица © — диагональная матрица (© = diag {^}, ] £ J = 1..п), полученная в результате соответствующего невырожденного преобразования, и ¡(ж) = тах{^(ж), ¡1 (ж)}.

Отметим тот факт, что если в результате преобразования оказалось, что число с ^ 0, то решение задачи (1) есть нулевая точка. Поэтому будем считать с > 0. Рассмотрим

множество точек ж*, которые являются стационарными для функции /1 на ж", т. е. точки, для которых

©ж* + Ь = 0", (6)

и выполнено неравенство /о(ж*) < Д(ж*). Если все числа 9^- > 0, * £ J, то функция /1 сильно выпукла и точка ж* = —©-1Ь1 будет единственным решением задачи (1). Если среди чисел 9^ есть отрицательные, то может оказаться, что точка ж* = —©-1Ь являющаяся решением системы (6) не есть точка локального минимума функции / на ж".

Предположим, что числа 9j ^ 0 при любом * £ J. Нас будет интересовать случай, когда (ж*) = {0,1}. Тогда если точка ж* £ ж" является решением задачи (1), то необходимо, чтобы нашлось положительное число "*, для которого справедливо равенство

©ж* + Ь = —"*ж*. (7)

Уравнение (7) можно переписать в виде (© + "*Е) ж* = —Ь. Отсюда имеем

ж* = — (© + "*Е)-1 Ь. (8)

ной,

Так как матрица © + "*Е диагональная, то и обратная к ней также будет диагональ-

(© + "*Е)-1 = {¿"Ы • *£

Следовательно, *-ая координата вектора ж* будет равна величине ж* = — 9 +—*, где Ьj

Ь;

*-ая координата вектора Ь. Покажем, что нахождение числа "* сводится к нахождению корня многочлена с действительными коэффициентами степени 2п.

Зафиксируем произвольное число " £ Ж, ж* = — -—j—. Подставляя в выражение (8)

9j + "

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

значение ж*, получим уравнение

Е

j=l

(9j — 1)Ь2 Ь2

+ с = 0. (9)

2(9,- + ")2 9j + "

Если обозначить через pj (") =2" + 9j + 1, * £ J, то уравнение (9) можно записать в виде

™ р (")Ь2 с = 0

^ 2(9^ + ")2 С и'

Пусть

Р (") = £ Р (")Ь? П (9к + ")2 — 2с П (9* + ")2. ^'=1 k=1,k=j к= 1

Очевидно, что многочлен Р(") является многочленом степени 2п, и, в силу нашего предположения, имеет единственный положительный корень "*.

Заметим также, что если точка ж* £ ж" является решением задачи (1), то необходимо и достаточно, чтобы нашлось такое положительное число V*, чтобы выполнялись равенство

V* (©ж* + Ь) = —ж*.

Из этого уравнения следует, что ж* = —V* (V*© + Е)-1 Ь. (В нашем случае, V* = —).

Пусть V £ Ж и ^'-ая координата вектора ж* равна величине ж* =--0- + 1 . Подставляя

в выражение (8) значение ж*, получим уравнение

)

+ с = 0. (10)

п

Е

j=i

(0, - 1)v262 vb2

2(v0, + 1)2 v0, + 1

Если обозначить через в^ (V) = V2(1 + ) + 2v, ] £ то уравнение (10) можно записать в виде

У (V)Ь2 - с = 0

= 2(v0j + 1)2 C

Нахождение нужного нам числа v* также сводится к определению единственного положительного корня многочлена S (v) степени 2n следующего вида

n n n

S(v) = £ Sj (v) П (v0j + 1)2 - 2^(v0fc + 1)2.

j=1 k=1,k=j k=1

Остановимся на одном варианте определения преобразования D (см., например, [3]). Рассмотрим спектральное разложение матрицы A00: Ao = QoЛQT, где Qo — ортогональная матрица, матрица Л — диагональная матрица, на главной диагонали которой стоят собственные числа А, матрицы Ao, расположенные в порядке невозрастания, т. е.

Л = diag {А,}, А1 ^ А2 ^ ... ^ Ап > 0.

Невырожденное преобразование x = S^)Qfу, где S(Л) = (^Л) = diag , при-

водит квадратичную форму (AoX,x) к нормальному виду (y, у), а квадратичную форму (A1X, x) — к виду (AI1 у, у). Заметим, что

A1 = QoS (Л^^Л^Т.

Рассмотрим спектральное разложение матрицы A1: A1 = Q1©QT, где матрица Q1 — ортогональная, а © — диагональная матрица, на главной диагонали которой находятся собственные числа 0,, j £ J, матрицы A1, расположенные в порядке невозрастания, т. е.

© = diag {0,}, 01 ^ 02 ^ ... ^ 0п > °.

Тогда невырожденное преобразование у = Qf z, приводит квадратичную форму (у, у) к виду (z,z), а квадратичную форму (A1 у, у) к виду (©z,z).

Таким образом, невырожденное преобразование у = Dx, где D = S^)Qf Qf приводит к нормальному виду квадратичную форму (Aox, x), а форму (A1x, x) — к каноническому виду.

3. Минимизация функции максимума на плоскости

В двумерном случае при минимизации функции максимума мы сталкиваемся с тремя вариантами:

1) точка минимума функции максимума совпадает с точкой минимума одной из функций;

2) в точке минимума активны две функции;

3) в точке минимума активны три функции.

Если оказалось, что в точке минимума активны более трех функций, то нулевая точка должна содержаться в выпуклом многоугольнике, натянутом на градиенты активных функций в этой точке. Но в двумерном случае, как следует из теоремы Каратеодори, для представления любой точки из выпуклой оболочки, натянутой на конечный набор векторов, в виде выпуклой комбинации этих векторов достаточно не более трех точек. Стало быть, в точке минимума можно рассматривать не более трех активных функций.

Если в точке минимума функции максимума активны две функции, то задача минимизации может быть сведена к нахождению положительного корня многочлена четвертой степени. Рассмотрим Пример 1. Пусть

¡(ж) = тах{^(ж), ¡1 (ж)}, ж = (жьж2) £ ж2,

где

¡о (ж) = 2 (ж, ж), ¡1 (ж) = 2 (©ж, ж) + (Ь, ж) + с.

© = diag {4, 6}, Ь = (-3, -4) £ ж2, с = 2.5.

Найдем точку минимума функции ¡(ж). Так как коэффициент с > 0, то нулевая точка

не является точкой минимума функции ¡ на ж2. Точка ж* - ( 4 , 4 ж2 есть точка

минимума функции ¡1 на ж2. В ней ¡о(ж*) = 2Ц, ¡1(ж*) = 24. Следовательно, точка ж* также не является точкой минимума функции ¡. Таким образом, функция ¡ достигает минимума в точке ж*, для которой (ж*) = {0,1}. Тогда

Р1^) = 2^ + 5, р1(^) = 2^ + 7, Р= 9(2^ + 5)(6 + ^)2 + 16(2д + 7)(4 + ^)2 - 5(4 + ^)2(6 + ^)2 = 5/ + 50^3 + 1П^2 - 196^ - 532 = (^ - 2)(5^3 + 60^2 + 231^ + 266).

Многочлен 5^3 +60^2 + 231д+266 не имеет положительных корней, поэтому число =2 является единственным положительным корнем многочлена Ри точкой минимума функции ¡ на ж2 будет точка ж* = (1,1).

Рассмотрим задачу минимизации на плоскости функции максимума от трех квадратичных функций:

¡о (ж) = 1 (ж, ж), ¡1 (ж) = 2 (Лж, ж) + (Ь1,ж) + с1, ¡2 (ж) = 2 (Аж, ж) + (Ь2 ,ж) + с2,

где матрица Л — диагональная, матрица А — симметричная, ж, Ь1 Ь2 £ ж2, с1, с2 £ ж. Предположим, что в точке минимума ж* активны три функции. Тогда точку минимума следует искать среди решений системы нелинейных уравнений:

{2 (Лж, ж) + (Ь1, ж) + с1 = 1 (ж, ж), 2(Аж,ж) + (Ь2,ж) + с2 = 1 (ж, ж).

Среди этих точек выбирается точка ж*, для которой нулевая точка содержится в треугольнике, натянутом на векторы ж*, Лж* + Ь1, Аж* + Ь2.

Следует отметить тот факт, что если найденная точка минимума не является точкой минимума ни одной из функций ¡р, р = 0,1, 2, то она будет точкой строгого локального минимума функции ¡.

Пусть

4. Минимизация функции максимума квадратичных функций с постоянным шагом

/ (ж) = max /¿(ж), /¿(ж) = 1 (А»ж,ж) + (6», ж) + с», i е I = {1,...,s}, »6/ 2

где матрицы A» — положительнно определенные, ж, 6» е rn, c» е r, i е I. Известно, что

функция / является сильно выпуклой на rn. В качестве константы сильной выпуклости

можно взять константу m = min т, где m» — наименьшее собственное число матрицы A».

¿6/ 2

Т. е.,

/(Аж1 + (1 - Л)ж2) < А/(ж1) + (l - А)/(ж2) - mA(1 - А)||ж1 - ж2||2, V А е [0,1], Vж1,ж2 е rn, i е I.

Рассмотрим задачу: найти

min f(ж). (11)

Решение задачи (11) существует и точка минимума функции / на rn единственна.

Обозначим через M = max{1, max M»}, где M» — наибольшее собственное число мат-

¿6/

рицы A». Тогда справедливо неравенство

(А»ж,ж) < M||ж||2 Vж е rn, Vi е I. (12)

С каждой точкой ж е rn свяжем оптимизационную задачу: найти

min max {(/¿(ж) - /(ж))М + (/(ж), w) + 2IN2) . (13)

w6Rn »6/ ^ 2 J

Этот минимум достигается в единственной точке ад(ж) е rn. Обозначим через

1

р(ж) = max <| (/(ж) - / (ж))М + (/(ж), w(x)) + ^||w(x)||2

гб/ ^ 2

Из необходимых условий минимума задачи (13) следует существование коэффициен-

тов

таких, что

А»(ж) ^ 0, i е I, £А(ж) = 1,

»=1

ад(ж) = А» (ж)/(ж) = £ А»(ж)(А»ж + 6»), =1 =1

s 1

р(х) = £ Аг(ж)(/(ж) - /(ж))М - 2 |Иж)||2 < 0.

¿=1

Несложно доказать утверждения:

Лемма 2. 1) Функция р(ж) тогда и только тогда равна нулю, когда точка ж является точкой минимума функции / на Ж".

2) Если вектор ад (ж) = 0П, то р(ж) = 0.

Таким образом, если точка ж* — точка минимума функции / на Ж", то ад(ж*) = 0П.

В дальнейшем будет показано, что если точка х не есть точка минимума функции / на ж", то направление ю(х) является направлением спуска функции / в точке х.

Опишем метод минимизации функции / на всем пространстве ж".

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выберем произвольную точку хо £ ж". Если точка хо есть точка минимума функции / на ж", то процесс останавливается.

Пусть уже найдена точка хк £ ж". Если точка хк является точкой минимума функции / на ж", то процесс закончен. Предположим, что точка хк не является точкой минимума функции / на ж". Найдем направление спуска ю(хк), т. е., решим оптимизационную задачу (13) при х = хк. Тогда найдутся такие коэффициенты

5

\г(хк) = \к > 0, г £ I, \к = 1,

что справедливо

ю(хк) = - \'к¡¡(хк), ю(хк) = 0",

г=1

5 1 р(хк) = Хг(хк)(Мхк) - ¡'(хк))М - -\\т(хк)||2 < 0.

Положим а = м, хк+1 = хк + аю(хк).

Лемма 3. В каждой точке хк выполняется неравенство

¡(хк+1) - ¡(хк) < МР(хк)' (14)

< В силу свойств функций ¡г справедливо

«2

¡г(х + аю) = ¡г(х) + а{Ц(х),ю) + — {Лгю,ю) vг £ I, vх £ ж", ю £ ж", Vа. Тогда из (12) для любого г £ I имеем

&2

¡г (хк + &т(хк )) - ¡ (хк ) ^ ¡г(хк ) - ¡ (хк ) + &Ц(хк ),ю(хк )) + — М\\ю(хк )\\2

= ¡г(хк) - ¡ (хк ) + М ¡''(хк ),ю(хк)) + -ММ\\ю(хк ^^

Отсюда вытекает неравенство

тах ¡г(хк + аю(хк)) - ¡(хк) = ¡(хк+1) - ¡(хк)

г€I

^ тах{ ¡г (хк) - ¡ (хк) + М {И(хк ),ю(хк)) + 2М\\ю(хк ^^

= Мт!/!^^) - ¡(хк))М + {0>(хк),ю(хк)) + -У^к^2 | = МР(хк) < 0 >

Неравенство (14) показывает, что процесс является релаксационным, следовательно, последовательность ^(хк)} является сходящейся.

Следствие 1. Если последовательность {ж*} бесконечна, то р(ж*) ^ 0 при А ^

Так как для любой сильно выпуклой функции множество

Джо) = {х £ Ж" | / (ж) < / (же)}

компактно, то последовательность {ж*}, генерируемая этим методом принадлежит лебегову множеству Джо).

Лемма 4. Для данного метода в каждой точке ж* справедливо неравенство

р(ж*) < т (1 (ж*) - 1 (ж*)). (15)

< Для точек ж*, ж* и для каждого индекса г £ I верно неравенство

/¿(ж*) - /¿(ж*) ^ (/(ж*),ж* - ж^) + — Уж* - ж^У2, г £ I. Тогда, умножая это неравенство на т, получим

2

(/•(ж*),т(ж* - ж^)) ^ т(/(ж*) - /¿(ж*)) - — Уж* - ж^||2, г £ I. Положим в (13) ш = т(ж* - ж*). Тогда имеем

) ^ шах| (/¿(ж*) - /(ж*))М + (/• (ж*), т(ж* - ж^)) ¿6/

1 Г

+ "ГТ Уж* - ж*^ ша^ (/¿(ж*) - /(ж*))т + т(/(ж*) - /¿(ж*))

— J ¿6/

^ тшах/(ж*) - /(ж*)} ^ т(/(ж*) - /(ж*)). > ¿6/

Следствие 2. Из формул (14) и (15) вытекает неравенство

т

/(ж*+1) - /(ж*) < м(/(ж*) - /(ж*)). (16)

Следовательно, последовательность {ж*} является сходящейся и ее предельной точкой является точка минимума функции / на Ж".

Теорема 2. В данном методе при произвольной начальной точке жо £ Ж" последовательность {ж*} сходится к точке минимума ж* функции / со скоростью геометрической прогрессии:

/(ж*+1) - /(ж*) < д(/(ж*) - /(ж*)),

т

где д = 1 - м, и существует положительное число Ц, что справедливо неравенство

Уж* - ж*У < .

< Из (16) получим

т

/(ж*+1) - /(ж*) < /(ж*) - /(ж*) + м(/(ж*) - /(ж*))

= (1 - т) (/(ж*) - /(ж*)) = 9(/(ж*) - /(ж*)).

Следовательно, для каждого фиксированного к > 0 имеем

/(ж*) - /(ж*) < д*(/Ы - /(ж*)). Поскольку точка ж* есть точка минимума функции / на ж", то

\ m IU ™*И2

Поэтому Обозначим через

f (жк) - f (Ж*) ^ — ||Xfc - ж

о

||жк - Ж*||2 < -(f (xfc) - f (x*))qk.

m

q=\/ m(f (жо) - f (ж*)),

тогда

l|xfc - ж*| ^m2(f(ж^) - f(x*))qk < Q(Vq)fc. >

2

m

Рассмотрим более подробно вычислительный аспект решения задачи (13). Для того чтобы найти направление ), необходимо решить задачу квадратичного программирования

min |(G(xfc)А,А) + M(q(xk),А)|, АеЛ

где

s

Л = {А = (Ai,..., As) g rs | ^ А = 1, А ^ 0, i g I},

¿=1

G(xk) — матрица Грама векторов /¿(xk), т. е.,

/(Л(xk),/1 Ы) ... (/1 G(xk) = I

\(/S(xfc),/i (xk)) ... (/s (Xk),/S(xfc))/

и

q(xk) = (qi (xk),..., qs(xk)) G rs, q»(xk ) = / (xk) - /i(xk), i g I. Таким образом, необходимо определить коэффициенты Ai, i G I, и выразить через них

s

вектор w(xk) по формуле w(xk) = - Ak/¿(xk).

¿=1

Пример 2. В качестве тестовой функции была рассмотрена функция максимума [5]

»10

f (ж) = max f¿ (ж), ж G Ri0, I = 1,..., 5, ¿е/

где

/¿(ж) = (Аж,ж) + (Дж), G R10, i G I, a¿(j, k) = ej/k cos(j ■ k) sin i, j < k, a¿(j,k) = a¿(k,j), j > k, | sin i | ■ i . . ,..

bi(j) = ej/i sin (i ■ j), j, k G 1 : 10.

Матрицы i G I, являются положительно определенными и в таблице 1 приведены, соответственно, максимальное (Amax) и минимальное (Amin) собственные числа матриц

2 А», значение каждой из функций /», г £ I, в точке минимума и норма градиента этих функций в точке минимума.

Для данной функции М = 36.32, т = 0.67. Точка ж* = (-0.0546, -0.0241, -0.0057, 0.0231, 0.0558, -0.2434, 0.0685, 0.1321, 0.0772, 0.0336)т £ ж10 — точка минимума функции /(ж) на , /(ж*) = -0.72576 — решение задачи, ||ш(ж*)|| = 0.000092, й(ж*) = {2, 3,4, 5}, где

Д(ж*) = {г £ I | /(ж*) = /(ж*)}.

Таблица 1

i 1 2 3 4 5

^max 53.947 59.585 9.470 55.017 72.613

^min 14.301 16.661 2.754 19.337 25.919

/i(x*) -311.19750 -0.725756 -0.725756 -0.725756 -0.725756

11/(ж*)|| 12805.888 155.679 37.765 14.479 5.934

Из таблицы видно, что первая функция не является активной в оптимальной точке, но поскольку ее градиент в ж* достаточно большой, то в точке ж*+а/ (ж*) при небольших а она становится активной.

Очевидно, что в большинстве случаях заранее не известно число M. Поэтому можно использовать данный алгоритм при различных M, начиная с заведомо большого. Для данного примера оптимальная точка ж* была получена при M = 145.28 за 85 шагов, при M = 72.64 за 38 шагов, при M = 36.32 за 19 шагов, при M = 18.16 за 11 шагов. При M = 9 и меньше алгоритм не сходился. Задача считалась решенной, если выполнялось условие ||w(xk)|| < 10-4.

Литература

1. Демьянов В. Ф., Малоземов В. Н. Введение в минимакс.—М.: Наука, 1972.—368 с.

2. Пшеничный Б. Н. Метод линеаризации.—М.: Наука, 1983.—136 с.

3. Гантмахер Ф. Р. Теория матриц.—М.: Наука, 1967.—552 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Мишина А. П., Проскуряков И. В. Высшая алгебра. СМБ.—М.: Физматгиз, 1962.—300 с.

5. Lemarechal C. An extension of Davidon methods to nondifferentiable problems // Mathematical programming.—1975.—Study 3.—P. 95-100.

Статья поступила 18 декабря 2006 г. Полякова Людмила Николаевна

Санкт-Петербург, Санкт-Петербургский государственный университет E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.