УДК 519.855
Е. А. Умное, А.Е. Умное
Московский физико-технический институт (государственный университет)
Параметрическое сглаживание в минимаксных задачах
В работе рассматривается применение методов штрафных функций и функций обратных связей для решения минимаксных задач. Приводятся описания алгоритмов, основанных на сглаживающем свойстве этих методов, а также демонстрационные примеры.
Ключевые слова: минимаксная оптимизационная задача, метод штрафных функций, функции обратных связей, свойство сглаживания.
Е. A. Umnov, А.Е. Umnov Moscow Institute of Physics and Technology (State University)
Parametric smoothing in minimax problems
A scheme of using methods of penalty and feedback functions is concidered. These schemes are based on the smoothing property of methods. Some numerical examples of procedures are given.
Key words: minumax optimizational problem, penalty functijns method, feedback functions, smoothing property.
Введение
Минимаксные (или максиминные) оптимизационные задачи являются важной составляющей инструментария методов принятия решений, таких как: теория игр или исследование операций. При этом их практическое применение ограничивается принципиальной негладкостью функций максимума от минимума (или наоборот).
Один из возможных подходов, позволяющих преодолевать затруднения такого рода, может быть основан на использовании гладких асимптотических оценок зависимостей решения оптимизационных задач от некоторого вспомогательного инструментального параметра.
Продемонстрируем особенности применения данного подхода вначале на примере достаточно широко используемого в вычислительной практике метода гладких штрафных функций.
Пусть требуется решить следующую минимаксную задачу: найти минимум u(x) при условии x Е Q, где Q С En - компакт, а
u(x)= max {fk(x)} , (1)
Щ1,М ]
причем функции fk(x) Ук Е [1, N], непрерывно дифференцируемые на множестве Q.
В случае, когда множество Q задается системой неравенств вида yi(x) ^ 0, i = [1,ш], задача (1), как показано в [1], равносильна задаче математического программирования: максимизировать по {x, u} — u, при условиях
fk(x) — u < 0 Ук = [1,N] и (2)
@ Умнов E. А., Умнов A. E., 2018
(с) Федеральное государственное автономное образовательное учреждение высшего образования «Московский физико-технический институт (государственный университет)», 2018
уг(х) ^ 0 Уг = [1, т].
Здесь мы также предполагаем, что функции уг(х) У г € [1,т], непрерывно дифференцируемые на множестве О.
Функция и(х) в сделанных предположениях непрерывна, но не является дифференцируемой. Поэтому для решения задачи (2) применим метод гладких штрафных функций [2] с вспомогательной функцией
N m
A(t, x, u) = -u P{j,fk (x) - U -Y1 Р(Т>У^Х)) •
(3)
k=1
i=1
Условия стационарности для функции (3) можно записать в виде системы
' n дР (
N дР ( _ _д _ m дР ( _ \ _
^ ~^~\T,fk(x) - u • grad fk(x) + Е [T,yi(x)) • gradyi(x) = o
k=1 ds V / x i=1 ds V / x
n дР ( \
.-1+Nl (x) - u)=0 •
(4)
Ее решения и(т) и x(t), как показано в [3], будут являться непрерывно дифференцируемыми функциями от параметра т, поскольку к условиям (4) применима стандартная теорема о системе неявно заданных функций (см., например, [4]).
Здесь следует также отметить, что решениями системы (4) будут оценки не только минимаксных точек задачи (1) - (2), но и оценки всех других стационарных точек функции (3). Это может потребовать дополнительного исследования при решении именно минимаксной задачи.
Здесь и далее мы будем предполагать, что штрафная функция Р(т, s) дважды непрерывно дифференцируема Vs и Vt > 0, а также удовлетворяет условиям
Р(т, s) ^ 0 Vs, Vt> 0 и lim Р(т, s) =' ° !
т4 ' ' [ 0, в < 0,
причем этот предельный переход монотонен. Кроме того, Ут > 0 и У в должны быть выполнены неравенства
дР д2Р
— > 0 , — > 0 . (5)
дs
дв2
Заметим, что для конкретной штрафной функции Р(т, в) вид системы (4) может упро-
в
ститься. Покажем это на примере Р(т, в) = т акр I — I . В этом случае
дР s
-gs = exp Т = exp
fk(x) - u\ fk(x)\ ( u
= exp — • exp - T
Поэтому система (4) принимает вид
' ( й\ N (Д(х)\ _ т (уг(х)\ _
ехР I -т) ' (х) + ' Уг(х) = 0 ,
Ц й\ N Ц /к (х)\
ехр - = Е ехр - ,
V) к=1 \ т )
где из первого (векторного) равенства можно исключить й, получив
(6)
N fk (x)\ _ & fk (x)
E exp - • grad fk (x) + E exp -
k=i v T / x \k=i \ T ,
E exp f УЩ • grad yi(x)\ = o ,
а последнее (скалярное) равенство упрощается до и(т) = т 1п | N ехр | ) ] ] .
\ т ))
В качестве примера использования соотношений (6) - (7) рассмотрим две следующие задачи.
Задача 1. Найти минимальные значения функции максимума u(x)
u(x) ^ x2, u(x) ^ sin4x
на отрезке [—2,1].
Решение
Условия (2) в данном случае имеют вид максимизировать по {—, и} — и,
при условиях: —2 — и ^ 0 , 8т4— — и ^ 0 , — 1 — — ^ 0 , —1+ — ^ 0 . Вспомогательная функция (3) имеет вид
1
A(r,x,u) = —u—т exp
2
x2 u
i —
/ sin4x — u\ т exp - —т exp
---x
2
— 1 + x
т exp
/
В то время как уравнение (7) будет выглядеть так
( x2 — u\ _ ( sin4x — u\ _
— exp - • 2x — exp -| • 4 cos 4x—
т
т
1
т exp
---x
2
+ т exp
— 1 + x
V V
Л
ex^ — 1 + exp
sin4x
= 0 . (8)
Наконец, сглаженная аппроксимация функции максимума определяется формулой
sin 4ж\ \
x2
u(т) = т ln I exp I — I + exp
Уравнение (8) на промежутке [—2, 1] имеет три корня, являющихся приближением к
точкам
п
xi =0, x2 = - = 0.392699082 и xa = 0.669283188, 8
последняя из которых есть корень уравнения x2 = sin4x.
Решение получено.
Результаты решения уравнения (8) для разных значений т приведены в табл. 1, а графическое представление задачи 1 показано на рис. 1.
Таблица 1
т —1(т) —2(т ) —з(т)
0.50 —0.166596357 0.413732397 0.723794952
0.25 —0.124388280 0.398475953 0.704617207
0.10 —0.077449382 0.392845484 0.688202392
0.05 —0.046509302 0.392699415 0.679216477
Точное решение 0 0.392699082 0.669283188
Задача 2. Найти минимальное значение функции максимума и(—,у)
( и(—) ^ —2 + у2 , \ и(—) ^ 10 — (— + 1)2 — (у — 2))2 ,
зависящей от двух переменных.
Решение
В данной задаче на независимые переменные явных ограничений нет, поэтому постановка задачи (2) в данном случае имеет более простой вид: максимизировать по {—, у, и} — и, при условиях
—2 + У2 — и ^ 0 ,
10 — (— + 1)2 — (у — 2)2 — и ^ 0 .
Вспомогательная функция (3) будет иметь вид А(т, —, у, и) = —и — т ехр
—2 + у2 — и
/10 — (— + 1)2 — (у — 2)2 — и \
—т ехр I -т-) . (9)
и
' _ (—2 + у2 — й\ /10 — (— + 1)2 — (у — 2)2 — и
—— ехр [ -1 + (— + 1) ехр I -1=0 ,
. —2 + у2 — Щ /10 — (— + 1)2 — (у — 2)2 — й\ —у ех^ -у-1 + (у — 2)ехр( -(--)-I =0 , (10)
(й\ (—2 + у2 — й\ (10 — (— + 1)2 — (у — 2)2 — и^ ехЫ = ехр I -т- + ехр I -т-
Качественный анализ (см. рис. 2) в этом случае показывает, что система (10) имеет три решения - точки А, В и С.
Точка В - очевидный максимум, имеет координаты — = —1 ж у = 2. Точки А и С
являются стационарными точками задачи на условный экстремум вида
максимизировать по {х, у} х2 + у2,
при условии 10 — (х + 1)2 — (у — 2)2 = х2 + у2 ,
, ( ^3 + 1 1 — 1
имеющей два решения: А <--2— : л/3 + 1 > и С < —2— : 1 — V 3 > , при этом
точка А является седловой для сглаженной функции максимума, а точка С является приближением точки минимума функции максимума решения задачи 2.
Решение получено.
В табл. 2 приведено численное решение задачи (9) (10), дающее оценки минимакса для
т.
Таблица 2
т х(т) у(т) и(т)
0.50 0.401395490 —0.802790980 0.931525443
0.25 0.384328458 —0.768656917 0.799793144
0.10 0.373511177 —0.747022355 0.721607245
0.05 0.369797284 —0.739594568 0.695699622
Точное решение 0.366025404 —0.732050806 0.669872981
Рис. 1. Графическое представление задачи 1
А У
-3 -2 -1 I) 1 2 3
Рис. 2. Система изолиний функции максимума в задаче 2
Рассмотрим теперь процедуру построения сглаженной аппроксимации функции максимума (или минимума), которая может быть выполнена по схеме, альтернативной методу штрафных функций, а именно путем использования функций обратных связей, описание и обоснование которого приводится в [5], [6] и [7].
Введем дополнительно к определенной ранее функции Р(т, в) функцпи Q(т, в) и Я(т, в)
дР(т, в)
такие, что Q(т, в) есть обратная по в к строго монотонной по в функции ---, а для
дв
. . дЯ(т, в) функции К(т, в) верно —д-= Q(т, в) .
Вначале кратко опишем основные свойства функции Р(т, в) (а также связанных с ней функций), следующие только из их определения. Р(т, в),
производные по всем своим аргументам до второго порядка включительно для всех т > 0 Ув
Тогда для любого фиксированного в < 0
дР д2Р
Нш —— = 0 и Пш = 0,
тдв тдв2
а для любого фиксированного в > 0
дР д 2 Р
Нш —— =и Нш —=. (11)
т^+о дв т^+о дв2
дР, \
К основным свойствам функции Q(т, в), как обратной к -т—\т, в), можно отнести следу-
дв
ющие: она определена и непрерывно дифференцируема при Ут > 0, У в > 0, а область ее значений есть множество всех вещественных чисел.
Кроме того, она строго выпукла вверх и монотонно возрастает по s при любом фик-
дР. ,
сированном т > 0, поскольку функция ——(t,s ) определена, положительна, непрерывно
ds х '
дифференцируема Уs и монотонно возрастает, и строго выпукла вниз по s.
Также вполне очевидными свойствами функции Q(t, s) являются: наличие v нее вертикальной асимптоты вида lim Q(t,s) = —те при любом фиксированном т > 0, равно как
s^+0
и выполнение равенства lim Q(t, s) = 0 при любом фнксированном s > 0 ,
т ^+0
Важное для дальнейшего свойство функции R(t, s) описывает Теорема 1. Для любого фиксированного s > 0 lim R(t, s) = 0 .
т ^+0
Доказательство
Согласно определению ^-функции R(t, s), при любом фиксиров анном a > 0 имеем
s
R(t, s) = J Q(t, t) dt.
a
Проинтегрировав правую часть этого равенства по частям, получим
s
R(t, s) = s Q(t, s) — a Q(t, a) — j t Q't(т, t) dt.
a
Непосредственно из свойств функции Q(t, s) следует, что при любых фиксированных s > 0 и a> 0
lim sQ(t, s) = 0 и lim aQ(T,a)=0.
т^+0 т ^+0
Для слагаемого с интегралом, в силу правила дифференцирования обратной функции
" дР. . . дР ( "
взаимной обратности функций Q(t, sW -^—(т, s), будет верно при —— ( T,w(s)) = s
ds ds V J
s s s
tdt (' t dt
I = JtQt(T,t) dt = I
дР ( ,Л\' J д2Р ( x
pT,w(t))) t a -w(T,w(t))
Затем, применив интегральную теорему о среднем [8], получим, что найдется такое фиксированное положительное д € [а, в], для которого
s
I =-^- dt =-q-(s — a) .
д2Р J д2Р l(т, q) a 7Г2(t, q)
д в2 ' д в2 Последнее выражение стремится к нулю при т ^ +0 в силу соотношения (11). Теорема доказана.
Суть рассматриваемого подхода заключается в том, что для исходной задачи математического программирования вида
максимизировать по У—У = У ^1,^2, ...,£,пУТ достаточно гладкую функцию Е(—)
при условиях: ^ ^ 0 У] = [1,п], ¡г(—) ^ 0 Уг = [1,ш],
где функции ¡г(—) Уг = [1,ш] также достаточно гладкие,
a
a
строится вспомогательная функция
т т п
и(т, х, Л) = Е(х) — ^ Аг/г(х) + ^ Я(т, Аг) — ^ Я(т, &),
г=1 г=1 3=1
или
тп
и(т, х, Л) = Ь(х, Л) + ^ Я(т, Аг) — ^ Я(т, &) ,
г=1 3=1
т
где Ь(х, Л) = Е(х) — Е Аг/г(х) - стандартная функция Лагранжа.
г=1
Условия стационарности этой вспомогательной функции имеют вид
дЬ - -
—(х, Л) = — Q(т,Аi) Уг = [1,т],
дЬ, _
(12)
—(x, Л) = Q(T,Cj) Vj = [1,n],
причем для регулярных задач, как показано в [5], [6] и [7],
lim x(t) = x*, и lim Л(т) = Л* ,
т^+0 т ^+0
x* Л*
Конкретно, в случае минимаксной задачи (2) функция Лагранжа будет
N m
L(x, u, Q, Л) = -u fk(x) - u) - ^ Xiyi(x),
k=1 i=1
а условия стационарности (12) соответственно имеют вид:
( дь _____
—(x,u, Q, Л) = Q(T,ij) Vj = [1,n], д
дЬ _______
—(x,u, Q, Л) = Q(t,u) ,
дЬ ____ _
—(x,u, Q, Л) = - Q(T,Xi) Vi = [1,m],
дЛi
дЬ __
(x,u, Q, Л) = - Q(T,ük) Vk = [1,W]-
(13)
дшк
Совместно вектор-функция х(т) и скалярная функция и(т) образуют непрет
Непосредственное использование системы условий (13) продемонстрируем на примере сле-
Р(т, в)
- в).
Задача 3. Найти минимальное значение функции и(х, у) = шах{ 2 — 2х ; х } при усло-
1
виях х ^ 0; х ^ р для р = ^ и р = 1.
Решение
Запишем условие задачи в виде
максимизировать 0 • — + (—1) • и при условиях — ^ 0 , и ^ 0 ,
—2 ,
0,
р.
Нетрудно убедиться, что решением этой минимаксной задачи при р и* = —* = 1, а при р = 1 - и* = —* = 3.
Система уравнений (13) в этом случае имеет вид:
2 будет
—2 — 2А1 + Л2 + Аз 1 — А1 — А2 2 — 2— — и
— — и —р + —
Результаты расчетов приведены в табл. 3.
— —--
2 \ —
— 21 и — =
т 2 т 2 т 2
А1 А2 Аз
1 и 1
АГ, 1
А2, 1
Аз,
Таблица 3
1
т и для р = 2 и для р =1
0.1 0.912994245 0.741263714
0.01 0.985411722 0.673919921
0.001 0.998503843 0.667389209
0.0001 0.999850038 0.666738892
0.00001 0.999985000 0.666673889
0.000001 0.999998500 0.666667389
0.0000001 0.999999850 0.666666739
0.00000001 0.999999985 0.666666674
Точное решение 1 2 3
Решение получено.
Применим метод функций обратных связей в нелинейной задаче, имеющей решение, совпадающее с одним из решений задачи 1.
Задача 4. Найти на промежутке [^; 1] минимум функции максимума u(x)
u(x) ^ x2, u(x) ^ sin4x.
Решение
Запишем условия задачи в виде
максимизировать по {x, u} — u, при условиях x2 — u ^ 0 , sin 4x — u ^ 0 , В данной задаче функция Лагранжа будет
L(x, u, Ai, А2) = —u — Ai(x2 — u) — A2(sin4x — u).
Соответствующая ей система уравнений (13)
—2 Aix — 4 А2 cos4x =
— 1 + Ai + A2 =
2
ux
u sin 4x =
— x--
2 \ x
— u--
2 \ u.
t f- 1
- Ai — =-
2 V 1 Ai,
HA2—
(14)
Эта система на промежутке [2, 1] имеет решение — (т) - приближение к — = 0.669283188, являющемуся корнем уравнения —2 = 8т4—.
Решения системы уравнений (14) для разных значений г приведены в табл. 4.
Таблица 4
1
1
г x(T ) u(T ) AI(T ) A2(T )
0.1 0.644421822 0.391810461 0.792480392 0.315541808
0.01 0.666512412 0.441084537 0.733141487 0.275988786
0.001 0.669003439 0.447243056 0.728185244 0.272709094
0.0001 0.669255187 0.447870180 0.727700682 0.272388564
0.00001 0.669280387 0.447933004 0.727652337 0.272356586
0.000001 0.669282908 0.447939287 0.727647504 0.272353388
0.0000001 0.669283160 0.447939916 0.727647021 0.272353069
0.00000001 0.669283185 0.447939978 0.727646972 0.272353037
Точное решение 0.669283188 0.447939985 0.727646967 0.272353033
Решение получено.
В заключение рассмотрим случай задачи поиска максимина следующего вида:
на произведении компактов X С En и Y С Em для непрерывной функции F(x, у) найти F* = max min F(x,y) .
xEX yEY
Эта задача, как показано в [1] и в [9], может быть сформулирована в виде задачи математического программирования с неограниченным числом ограничений:
найти F* = max u при условиях {x,u}
x <Е X,
F(x, у) ^ u Vy е Y.
В монографии [9] (гл. 1, § 5) показано, что метод штрафных функций допускает свое использование для решения задач подобных классов, причем в качестве штрафующей суммы
в (2), применяя интегрирование по Лебегу, можно взять S(r, x) = f P(r,u — F(x,y) I dy .
Y
Вспомогательная функция при этом будет
A(r, x,u) = u — J P^r,u — F(x,y)j dy . (15)
Y
Кроме того, если F(x, y) выпукла вверх no x, то и A(r, x, u) будет выпукла вверх по x, а если F(x, y) непрерывно дифференцируема по x, то и A(r, x, u) будет непрерывно дифференцируемой, и в этом случае условие стационарности функции (16) есть система равенств
" М г-дРт F( л dF(x,y) d 0
du = 1 — Y — F (x, dy = 0,
dA y дРт ч dF(x,y) ( )
w, =— Yds(r-u—Fxy>)-¿rdy=0 V-> = [1-n|•
Вывод формул (15) и (16) приведен в [9] для штрафных функций внешнего типа, однако эта схема оказывается применимой и для гладких штрафных функций, удовлетворяющих условиям (5). Строгое доказательство этого факта выходит за рамки данной статьи, однако его можно проиллюстрировать следующим примером.
Рассмотрим задачу отыскания глобального экстремума непрерывной на некотором отрезке [a, b] функции $(x). При поиске максимума эта задача сводится к задаче математического программирования:
минимизировать F(x,u) = u при условиях $(x) ^ u Vx = [a, b] . Если взять Р(r, s) = r exp ( — ) , то подлежащая максимизации вспомогательная функ-
W
ь ( $(x) — u\
ция будет A(r, u) = —u — r J exp - dx, а ее условие стационарности по перемен-
a \ r J
u
ь f .
— 1 + y exp i $(x)— j dx = 0. (17)
a
/u\ b f $(x)\ , ь ($(x)\
Откуда exp — = exp - dx , что дает u(r) = r ln / exp - dx . Нетрудно
r a r a r
убедиться, что оценка дл^ ^дабального минимума представляется формулой аналогичного
* ( ) l Ь ( ®(x)\ d
вида: u(r) = —r ln J exp--dx .
В заключение применение этих формул продемонстрируем на примере следующей простой задачи.
Задача 5. Найти максимальное и минимальное значения функции Ф(х) = 2 — \х\ на отрезке [-1,3].
Решение
Для использования формулы (17) предварительно необходимо вычислить
3 / \
Г 2 — \х\ 2 Л ехр-йх = 2т ехр--еЬ — .
- т \ т V
( 2 1\
Понятно, что величина выражения т 1п 2т ехр--еЬ — не очень наглядно представ-
V т V
ляет максимальное значение исследуемой функции на отрезке [—1, 3]. Поэтому найдем также и _
21
и* = Нш и(т) = Иш т 1п
т —^-+0 т—+0
2т ехр--еЬ -
\ т т,
= 2 .
Аналогично для оценки величины и* предварительно находим
3 ( 2 — \х\\ / 1 /2^ ехр--йх = 2т еЬ--2 ехр —
Л V т ) \ т V ту
и окончательно: и* = Иш и(т) = — Иш т 1п
т —^-+0 т—+0
2т ( еь1 — 2ехр | — 2
= -1 .
Нетрудно проверить, что глобальный максимум достигается в точке х = 0, а глобальный минимум в точке х = 3.
Решение получено.
Литература
1. Демьянов В.Ф., Малоземов В.Н. Введение в минимакс. М.: Наука, 1971. 368 с.
2. Фиакко А., Мак-Кормик Е. Нелинейное программирование. Методы последовательной безусловной минимизации. М. : Мир, 1972. 240 с.
3. Умное А.Е. Многошаговая линейная экстраполяция в методе штрафных функций // ЖВМ-МФ. 1974. Т. 14, № 6. С. 1 151 1 103.
4. Кудрявцев Л.Д. Курс математического анализа (в двух томах). Т. 2. М. : Высшая школа, 1981. 584 с.
5. Ум,нов Е.А., Ум,нов А.Е. Метод параметрической линеаризации, использующий штрафные функции со всюду обратимой производной для решения пар двойственных задач // Труды МФТИ. 2011. Т. 3, № 1. С. 146-152.
6. Ум,нов Е.А., Ум,нов А.Е. Параметрический анализ в задачах математического программирования. // Труды МФТИ. 2014. Т. 6, № 3. С. 73-83.
7. Ум,нов Е.А., Ум,нов А.Е. Задача параметрического программирования для комплекса математических моделей // Труды МФТИ. 2017. Т. 9, № 4. С. 149-160.
8. Кудрявцев Л.Д. Курс математического анализа (в двух томах). Т. 1. М.: Высшая школа, 1981. 687 с.
9. Федоров В.В. Численные методы максимина. М. : Наука, 1979. 280 с.
References
1. Demjanov V.F., Malozemov V.N. Introduction into minimax. M.: Nauka, 1971. 368 p. (in Russian).
2. Fiacco A. V., McCormick G.P. Nonlinear Programming: Sequential Unconstrained Minimization Techniques. M.: Mir, 1972. 240 p. (in Russian).
3. Umnov A.E. Multistage linear extrapolation in penalty functions. J. Computational Mathematics and Mathematical Physics . 1974. V. 14, N 6. P. 1451-1463. (in Russian)
4. Kudryavtsev L.D. A course in mathematical analysis (V. 1-2.) M.: Vvsshaja shcola, 1981. V. 2. P. 584. (in Russian)
5. Umnov E.A., Umnov A.E. Parametric linearization method using penalty functions with everywhere invertable derivation. Proceedings of MIPT. 2011. V. 3, N 1. P. 146-152. (in Russian).
6. Umnov E.A., Umnov A.E. Parametric analysis in mathematical programming problems. Proceedings of MIPT. 2014. V. 6, N 2. P. 73-83. (in Russian).
7. Umnov E.A., Umnov A.E. Mathematical programming problem for a complex of mathematical models. Proceedings of MIPT. 2017. V. 9, N 4. P. 149-160. (in Russian).
8. Kudryavtsev L.D. A course in mathematical analysis (V. 1-2.) M.: Vvsshaja shcola, 1981. V. 1. P. 687. (in Russian).
9. Fedorov V.V. Numerical methods of maximin. M.: Nauka, 1979. 280 p. (in Russian).
Поступим в редакцию 04-02.2018