Научная статья на тему 'Построение кусочно-линейных оценок для функций одной переменной'

Построение кусочно-линейных оценок для функций одной переменной Текст научной статьи по специальности «Математика»

CC BY
288
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ОДНОМЕРНАЯ ГЛОБАЛЬНАЯ ОПТИМИЗАЦИЯ / КУСОЧНО-ЛИНЕЙНЫЕ ФУНКЦИИ / ОЦЕНКИ / ДЕТЕРМИНИРОВАННЫЕ МЕТОДЫ ГЛОБАЛЬНОЙ ОПТИМИЗАЦИИ / UNIVARIATE GLOBAL OPTIMIZATION / PIECEWISE LINEAR FUNCTIONS / ESTIMATORS / DETERMINISTIC METHODS

Аннотация научной статьи по математике, автор научной работы — Усов А. Л.

В данной статье рассматривается проблема построения нижних и верхних ограничивающих функций для функций одной переменной. Эта проблема имеет решающее значение в глобальной оптимизации, где такие оценки используются детерминированными методами для уменьшения области поиска. Как показывает практика существующие подходы в глобальной оптимизации не всегда показывают высокую точность ограничивающих функций. В тоже время следует отметить, что для ограничивающих функций должны существовать относительно простые способы построения и манипулирования. Для этого предлагается использовать кусочно-линейные границы в качестве оценки одномерных функций. В статье дано определение кусочно-линейной функции, рассмотрены их основные свойства, а также основные арифметические операции применимые к ним. На примере элементарных математических функций предложен алгоритм построения нижних и верхних кусочно-линейных оценок с использованием свойств выпуклости и вогнутости. Кроме того, в статье рассматриваются необходимые теоретические утверждения с доказательствами, которые позволяют автоматизировать синтез нижних и верхних оценок по выражению функции, представленной в алгебраической форме. Численные примеры, представленные в статье, сравнивают предложенный подход с техникой использования интервального анализа и арифметикой скосов. Предложенный подход демонстрируют высокую точность предлагаемых оценок.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Piecewise Linear Bounding Functions in Univariate Global Optimization

The paper addresses the problem of constructing lower and upper bounding functions for univariate functions. This problem is of a crucial importance in global optimization where such bounds are used by deterministic methods to reduce the search area. Existing approaches do not always show the high accuracy of limiting functions in global optimization. It should be noted that bounding functions are expected to be relatively easy to construct and manipulate with. To solve this problem, it is proposed to use piecewise linear estimators for bounding univariate functions. The article gives a definition of a piecewise linear function, discusses their basic properties, as well as the basic arithmetic operations applicable to them. Using an example of elementary mathematical functions, an algorithm is proposed for constructing lower and upper piecewise linear estimates. For this purpose, the properties of convexity and concavity of elementary functions are applied. The rules proposed in the paper enable an automated synthesis of lower and upper bounds from the function’s expression in an algebraic form. The numerical examples presented in the article compare the proposed approach with the technique of using interval analysis and slope arithmetic. The proposed approach demonstrates the high accuracy piecewise linear bounds.

Текст научной работы на тему «Построение кусочно-линейных оценок для функций одной переменной»

Построение кусочно-линейных оценок для функций одной переменной

А.Л. Усов1

Аннотация—В данной статье рассматривается проблема построения нижних и верхних ограничивающих функций для функций одной переменной. Эта проблема имеет решающее значение в глобальной оптимизации, где такие оценки используются детерминированными методами для уменьшения области поиска. Как показывает практика существующие подходы в глобальной оптимизации не всегда показывают высокую точность ограничивающих функций. В тоже время следует отметить, что для ограничивающих функций должны существовать относительно простые способы построения и манипулирования. Для этого предлагается использовать кусочно-линейные границы в качестве оценки одномерных функций. В статье дано определение кусочно-линейной функции, рассмотрены их основные свойства, а также основные арифметические операции применимые к ним. На примере элементарных математических функций предложен алгоритм построения нижних и верхних кусочно-линейных оценок с использованием свойств выпуклости и вогнутости. Кроме того, в статье рассматриваются необходимые теоретические утверждения с доказательствами, которые позволяют автоматизировать синтез нижних и верхних оценок по выражению функции, представленной в алгебраической форме. Численные примеры, представленные в статье, сравнивают предложенный подход с техникой использования интервального анализа и арифметикой скосов. Предложенный подход демонстрируют высокую точность предлагаемых оценок.

Ключевые слова—одномерная глобальная оптимизация, кусочно-линейные функции, оценки, детерминированные методы глобальной оптимизации.

I. ВВЕДЕНИЕ

Данная статья посвящена разработке теоретических основ для построения верхней и нижней ограничивающей кусочно-линейной функции для целевой одномерной функции. Предлагаемый подход развивает результаты, представленные в [1], детализируя алгоритм построения кусочно-линейных оценок, на основе которого возможна разработка программного комплекса.

Функция ф(х) называется нижней(верхней) ограничивающей функцией для целевой функции /(х) на интервале [а, Ь] если /(х) > ф(х) (/(х) < ф(х)) для любого х € [а, Ь]. Такие оценки для целевых функций и ограничений играют важную роль в глобальной оптимизации. Предположим, что мы знаем нижнюю ограничивающую функцию ф(х) для целевой функции /(х). Тогда можно исключить из дальнейшего рассмотрения множество, определенного следующим неравенством:

Ф(х) > /г - е, (1)

*Работа выполнена при поддержке РФФИ, проект 17-07-00510

ХА.Л. Усов — аспирант Федерального исследовательского центра «Информатика и управление» Российской академии наук. [email protected]

где /г является рекордом (лучшее найденное решение), а е является заданной точностью решения [2], [3].

Неравенство 1 может быть решено эффективно только когда функция ф(х) имеет простую структуру. В данной работе исследуется один тип функций подобного типа: кусочно-линейная (или сокращенно КСЛ функция). Предлагается метод получения КСЛ оценок из алгебраического представлении функции (формулы). Алгоритм определяется правилами, которые последовательно применяются начиная с нижней части дерева выражения (листьев) до его корня. КСЛ оценки, построенные с помощью предложенного подхода, как правило намного точнее оценок, вычисленных с помощью интервального анализа [4], [5] или арифметики скосов [6].

Вогнутые нижние и выпуклые верхние КСЛ оценки, состоящие из двух отрезков, рассматривались в работе [7], [8]. Авторы предложили правила автоматического синтеза оценок на основе алгебраического представления выражения.

Следует отметить, что предложенный в данной работе подход отличается от выпуклых оценок и других техник на основе выпуклых методов, разработанных в работах [9], [10], [11], [12]. Основное различие между подходами заключается в том, что в данной работе рассматривается произвольная КСЛ функция, не ограничиваясь только выпуклым или вогнутым случаем.

Статья организована следующим образом: в разделе II приводятся определение, основные свойства КСЛ функций, а также арифметические операции над КСЛ функциями. Раздел III посвящен теории и основным свойствам КСЛ оценок, а также базовым арифметическим операциям над КСЛ оценками. Вычислительный эксперимент, состоящий из двух примеров построения КСЛ оценок, приводится в разделе IV. Там же дано сравнение оценок функций одной переменной, полученных при помощи разных подходов.

II. Определение и основные свойства КСЛ функций

Кусочно-линейная функция на интервале [а, Ь] определяется как последовательность сегментов г^ соединенных точками (хг,уг) и (х1+1,у1+\). Более формально:

ф(х) = уг+-х(х-х{), х € [х^,хг+1],г = 1, ..,П-1.

хг+1 хг

где п > 2, а = х1 < ■ ■ ■ < хп = Ь.

КСЛ функция однозначно задается последовательностью точек, которые являются концами составляющих ее сегментов:

{(х1,У\),(хп,уп)}.

Эти точки в дальнейшем будем называть вершинами. Рассмотрим основные операции над КСЛ функциями.

А. Арифметические операции

Рассмотрим две КСЛ функции ф(х) и ф(х) на заданном интервале х € [а, Ь].

ф(х) =

ф(х) =

'ф\(х), х g [х\ = a, ф2(х), х g [х'2, хХ?3\,

,фт(х), х g [х'т, х'т+1 = Ч-

ф\(х), х g [х'1 = a, х'2], фэ(х), х g [х'2, х'3\,

ш(х)

Ш1(х) = а ■ ф1(х), х g [х1 = a, х'2], Ш2(х) = а ■ ф2(х), х g [х2, х'3],

, шт(х) — а ■ фm(x), х G [x'm, х'т+1

= ь].

/Фи(х), х € [хП, хП+1 =Ь]■

Множество X' = {х1, х'2, ■■■ , х'т+1] состоит из упорядоченных по возрастанию абсцисс, соответствующих вершинам КСЛ функции ф(х), а множество X" = {х'[, х'2, ■■■ , х'П+1} состоит из упорядоченных по возрастанию абсцисс, соответствующих вершинам ф(х). Обозначим объединение этих двух множеств через множество X = (X' и X'') = {х1, х2, ■■■ , хк+1}.

Сумма двух КСЛ функций ф(х) и ф(х) является КСЛ функцией следующего вида:

ш\(х) = ф\(х) + ф\(х), х € [х\ = а, х2], ш(х) = < шг(х) = фи (х) + ф^ (х), х € [хг, х1+\],

шк(х) = фт(х) + фп(х), х € [хк, хк+\ = Ь],

где, сегменты ф^ (х) и (х) соответствую интервалу х € [хг, хг+\].

Разность двух КСЛ функций ф(х) и Ф(х) также является КСЛ функцией, определяемой следющим образом:

ш\(х) = ф\(х) — ф\(х), х € [х\ = а, х2],

ш(х) = < шг(х) = фк (х) - ф^ (х), х g [хг, хг+i],

Шк (х) = фт(х) — фп(х), х € [хк, хк+1 = Ь]

Индексы '¡>г и j¡ имеют такой же смысл как описано выше.

Произведение КСЛ функции ф(х) и числа а € Я также является КСЛ функцией:

Рис. 1: Максимум ш(х) КСЛ функций

ф(х),ф(х), /л(х),а(х) на интервале х g [0,20].

1) объединить абсциссы вершин КСЛ функций

ф1(х), ■■,фт(х) на интервале х € [а,Ь], получив в результате множество X:

X = {х1

= Ь};

,d = х1+1],'1 =

B. Максимум и минимум КСЛ функций

Функция, получаемая в результате взятия максимума нескольких КСЛ функций также является КСЛ функцией (Рис. 1).

Приведем описание алгоритма вычисления максимума

ш(х) = max ф^х)

нескольких КСЛ функций:

2) для каждого интервала [с =

1,..,п — 1:

a) выбрать сегмент с максимальной ординатой ут в точке х = с; в случае если имеется несколько таких сегментов, выбрать сегмент с максимальным углом наклона, назовем данный сегмент текущим; Если точка (с,ут) является левым концом текущего сегмента, то добавить ее в множество вершин функции ш(х);

b) найти точки пересечения текущего сегмента со всеми другими оставшимися сегментами на интервале [с, 3];

ф выбрать точку с наименьшей абсциссой ха € [с, 3] из точек, полученных на шаге 2Ь и соответственно выбрать новый текущий сегмент; добавить данную точку как новую вершину функции ш(х); Если точек пересечения не найдено, то положить ха = 3

d) повторить шаги начиная с 2Ь до 2d на интервале [с = ха, 3] пока с = 3.

3) выбрать точку с максимальной ординатой в точке хп и добавить ее в множество вершин функции ш( х) ;

Алгоритм для вычисления минимума из нескольких КСЛ функций описывается подобным образом.

Проведенный анализ позволяет сформулировать следующее утверждение.

Утверждение 1: Пусть ф(х) и ф(х) являются КСЛ функциями на интервале [а, Ь]. Тогда выражения

\ф(х),\ € М

\Ф(х)\,

ф(х) ± ф(х), max(ф(x), ф(х)), ш1п(Ф(х), ф(х))

х

n

являются КСЛ функциями на [а, b].

Справедливо следующее утверждение.

Утверждение 2: Пусть ф(х) и ф(х) являются КСЛ функциями на интервалах [a, b] и [с, d] соответственно,

где c = minxe[a,b] ф(х), d = шахх€[а,ъ]Ф(х). Тогда композиция функции ш(х) = ф(ф(х)) является КСЛ функцией

на [a, b].

Доказательство этого утверждения несложно, но достаточно громоздко и поэтому не приводится.

III. Основные свойства КСЛ оценок

Нижней КСЛ оценкой функции f (х) на интервале [а, b] называется такая КСЛ-функция ф(х), что f (х) > ф(х) при х £ [а, b].

Аналогично определяется верхняя КСЛ оценка. Рассмотрим свойства КСЛ оценок.

A. Построение КСЛ оценок для элементарных функций

Основой для построения нижней и верхней КСЛ оценки является использование свойств выпуклости и вогнутости элементарной функции на рассматриваемом интервале х £ [а, b]. Под элементарными функциями подразумеваются тригонометрические функции например: вт(х),соз(х),Ьд(х),с1д(х); обратные тригонометрические функции: а8т(х),асоз(х),аЬд(х),асЬд(х)\ логарифмические функции, степенные функции и показательные функции. В случае, если элементарная функция определена на интервале [а, b], то весь интервал может быть разбит на промежутки где функция выпукла или вогнута.

Например функция вт(х) на интервале х £ [—2п, 2п] (Рис. 4) является выпуклой на интервалах [—п, 0], [п, 2п] и вогнутой на интервалах [—2п, — п], [0, п]. Для синтеза нижней КСЛ оценки для выпуклой функции, необходимо построить серию касательных в некоторых точках, расположенных на отрезке [а, b]. Соответственно, для вогнутой функции необходимо построить секущие, также используя заранее выбранный набор точек на интервале. При этом, чем меньше выбранный интервал между соседними точками, тем точнее будет КСЛ оценка функции. Рассуждения для синтеза верхней КСЛ оценки для выпуклой или вогнутой элементарной функции аналогичны. Пример построения касательных и секущих для синтеза нижней КСЛ оценки описан в секции IV-A.

B. Суперпозиция функций

Рассмотрим композицию функции Н(х) = f (д(х)) на интервале [а,Ъ]. Пусть функции рд(х) и рд(х) являются нижней и верхней КСЛ оценками для внутренней функции д(х) на интервале [а,Ь]:

Ид(x) < g(x) < ¡ig(x), x £ [a, b].

(2)

Обозначим с = тхпхе^ад рд(х), й = 'таххе[адрд(х). Пусть функции ру (х) и ру(х) являются нижней и верхней КСЛ оценкой для внешней функции /(х) на интервале х € [с, й]:

ру(рд(х)) является нижней КСЛ оценкой для функции

Н(х) на [а, Ь].

Доказательство: В соответствии с утверждением 2 ру(рд(х)) является КСЛ функцией. Остается доказать,

что ру(рд(х)) < Н(х) на [а,Ь]. Рассмотрим х € [а,Ь]. Из неравенства (2) следует, что рд (х) < д(х). Так как рд(х),д(х) € [с,й] и ру(х) монотонно не убывает на интервале [с, й], то

у(рд(х)) < у(д(х))■

Из неравенства (3) следует, что ру(д(х)) < /(д(х)) = Н(х). Таким образом, ру(рд(х)) < Н(х) при х € [а,Ь].

Утверждение 4: Если функция ру (х) монотонно не возрастает на интервале [с, й], то композиция функций ру (рд (х)) является нижней КСЛ оценкой для функции Н(х) на [а, Ь].

Доказательство: В соответствии с утверждением 2 ру (рд (х)) является КСЛ функцией. Остается доказать, что ру (рд(х)) < Н(х) на интервале [а,Ь]. Рассмотрим х € [а,Ь]. Из неравенства (2) следует, что д(х) < рд(х). Так как рд(х), д(х) € [с, й] и ру (х) монотонно не возрастает на [с, й], то

у(рд(х)) < у(д(х)).

Из неравенства (3) следует, что ру(д(х)) < /(д(х)) = Н(х). Таким образом ру (рд (х)) < Н(х) для х € [а, Ь].

Точно так же можно доказать следующие два утверждения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Утверждение 5: Если функция ру (х) монотонно не убывает на интервале [с, й], то композиция функций ру (рд(х)) является верхней КСЛ оценкой для функции

Н(х) на [а, Ь].

Утверждение 6: Если функция ру (х) монотонно не возрастает на интервале [с, й], то композиция функций ру(рд(х)) является верхней КСЛ оценкой для функции

Н(х) на [а, Ь].

С. Операции линейной комбинации и взятия максимума

Утверждение 7: Пусть ру (х) и ру (х) являются соответственно нижними и верхними КСЛ оценками для функции /(х) на интервале [а,Ь]. Кроме того, пусть рд(х), рд(х) являются соответственно нижними и верхними КСЛ оценками для функции д(х) на том же интервале. Тогда следующие свойства имеют место:

Ару (x) < Xf (x) < Хру (x),X > 0, Xpf (x) < Xf (x) < Хру (x),X < 0, ру (x) + pg (x) < f (x) + g(x) < pf (x) + pg(x),

(4)

Ру (x) < f (x) < ру (x),x £ [c,d].

(3)

Утверждение 3: Если функция ру (х) монотонно не убывает на интервале [с, й], то композиция функций

ру (x) - рд (x) < f (x) - g(x) < ру (x) - рд(x), тш(ру(x)^g(x)) < min(f (x),g(x)) < тт(ру (x),!g (x)),

тах(ру(x)^g(x)) < max(f (x),g(x)) < тах(ру (x),ïg (x)).

Доказательство утверждения 7 несложно и поэтому не приводится.

D. Операция умножения

Пусть функции ¡у (х) и ¡у(х) являются нижней и верхней КСЛ оценками для функции /(х), а функции 1д (х) и ¡д(х) являются нижней и верхней КСЛ оценками для функции д(х) на интервале [а, Ь]:

{¡у(х) < /(х) < 1у(х), х £ [а, Ь], 1д(х) < д(х) < ¡д(х), х £ [а, Ь].

Пусть оценки ¡у (х), ¡у(х), рд (х), рд(х) не меняют знак на отрезке [а, Ь]. Тогда, нижняя и верхняя оценки для произведения функций /(х) • д(х) на интервале [а, Ь] вычисляются в соответствии со следующими утверждениями.

Утверждение 8: Если ¡у (х) > 0 и рд (х) > 0, то: у(х) • ¡¡д (х) < /(х) • д(х) < ¡у(х) • рд(х).

Утверждение 9: Если ¡у (х) > 0 и рд(х) < 0, то: ру(х) • ¡¡д(х) < /(х) • д(х) < ¡у(х) • ¡д(х).

Утверждение 10: Если ¡у (х) > 0 и ¡д (х) < 0 <

¡д(х), то:

шт^у(х) • ¡д(х), ¡у(х) • ¡д(х)) < /(х) • д(х) <

тах(и(х) • ¡д(х), ¡у(х) • ¡д(х)).

Утверждение 11: Если ¡у (х) < 0 и ¡д (х) > 0, то этот случай идентичен Утверждению 8.

Утверждение 12: Если ¡у(х) < 0 и ¡д(х) < 0, то:

¡у(х) • ¡д(х) < /(х) • д(х) < ¡у(х) • ¡д(х).

Утверждение 13: Если ¡у (х) < 0 и ¡д (х) < 0 <

¡д(х), то:

тт(и(х) • ¡д(х), ¡у(х) • ¡д(х)) < /(х) • д(х) <

тах(^у(х) • ¡д(х), ¡у(х) • ¡д(х)).

Утверждение 14: Если ¡у (х) < 0 < ¡у (х) и ¡д (х) > 0, то этот случай идентичен Утверждению 10.

Утверждение 15: Если ¡у (х) < 0 < ¡у (х) и ¡д(х) < 0, то этот случай идентичен Утверждению 13.

Утверждение 16: Если ¡у (х) < 0 < ¡у (х) и ¡д (х) < 0 < ¡д(х) то:

мп(щ(х) • ¡¡д(х), ¡у(х) • ¡д(х)) < /(х) • д(х) <

тах(^у(х) • ¡д(х), ¡у(х) • ¡д(х))

Заметим, что полученная нижняя и верхняя оценки для произведения двух функций /(х) • д(х) являются кусочно-квадратичными функциями. Так как свойства выпуклости квадратичных функций хорошо известны, то всегда можно построить КСЛ оценку на основе кусочно-квадратичной. Пример построения построения нижней КСЛ оценки для операции умножения рассмотрен в секции ГУ-А.

Кроме рассмотренных случаев возможен вариант когда КСЛ функция (верхняя и/или нижняя оценка) принимает как положительное, так и отрицательное значение на интервале [а,Ь]. В этом случае график КСЛ функции пересекается с осью абсцисс в точках, разбивающих интервал [а, Ь] на несколько отрезков знакопостоянства функции. После этого каждый из полученных интервалов рассматривается отдельно в соответствии с приведенными выше утверждениями.

E. Операция деления

Пусть функции ¡у (х) и ¡у (х) являются нижней и верхней КСЛ оценками для функции /(х), а функции ¡д (х) и ¡д(х) являются нижней и верхней КСЛ оценками для функции д(х) на интервале [а, Ь]:

{¡у (х) < /(х) < ¡у(х), х £ [а, Ь], ¡д(х) < д(х) < ¡д(х), х £ [а, Ь].

Предположим также, что оценки ¡у (х), ¡у(х), ¡д(х), ¡д(х) не меняют знак на отрезке [а,Ь]. Чтобы избежать деления на 0, ограничимся рассмотрением случаев ¡д (х) > 0 и ¡д(х) < 0.

При сделанных предположениях, нижняя и верхняя оценка для частного функций дХ на интервале [а, Ь] вычисляются в соответствии со следующими утверждениями.

Утверждение 17: Если ¡у (х) > 0 и ¡д(х) > 0, то:

f(x) f (x)

<

¡f (

цд (x) g(x) ¡g (x Утверждение 18: Если ¡if (x) > 0 и

Vff(x) < fix)< f(x

¡g (x) g(x) ig(x) Утверждение 19: Если ~pf (x) < 0 и цg (x) > 0 то: ¡g(x) < f(x)< ¡g(x

f(x) g(x) if (x) Утверждение 20: Если ¡f (x) < 0 и ¡g(x) < 0, то:

if (x

¡g(x) < 0, то:

if(x) < f(x) ¡g(x) ~ g(x) ~ ¡g(Q

Утверждение 21: Если ¡f (x) < 0 и ¡g (x) < 0 < ¡g(x), то оценки не определены.

Утверждение 22: Если ¡f (x) < 0 < ¡f (x) и ¡g (x) > 0, то:

/ ¡f (x) fx)\ y^g(x) ¡g(x) J - g(x)

f(x) < 4-4 < max

i ¡f(x) fx)] \N(x) ' ¡g(x) ) '

Утверждение 23: Если ¡f (x) < 0 < ¡f (x) и ¡g (x) < 0, то:

¡f (x) ¡y (x) f (x) f(x) f (x))

mm(, ) < < max(———, , , ).

>g(xУ ¡g(x) g(x)

>g (x) ¡g (x)'

Утверждение 24: Если ¡у (х) < 0 < ¡у (х) и ¡д (х) < 0 < ¡д(х), то оценки не определены.

Заметим, что полученная нижняя и верхняя оценки для ух являются дробно-линейными функциями. Так как свойства и, в частности, интервалы выпуклости/вогнутости дробно-линейных функций хорошо известны, то в случае если функция определена на рассматриваемом интервале, всегда можно построить КСЛ оценку на основе дробно-линейной. Пример построения нижней оценки для частного двух функций рассмотрен в секции ГУ-В.

Кроме рассмотренных случаев возможен вариант когда КСЛ оценки принимают как положительные, так и отрицательные значения на интервале [а, Ь]. В этом случае график КСЛ функции пересекается с осью абсцисс в

точках, разбивающих интервал [а, b] на отрезки знакопо-стоянства функции. После этого каждый из полученных интервалов рассматривается отдельно в соответствии с приведенными выше утверждениями.

IV. Вычислительные эксперименты Приведем примеры построения КСЛ оценок для конкретных функций.

A. Вычислить нижнюю КСЛ оценку для функции:

Н(х) = sin^) • (—х2 + х),х £ [1, 3].

Данная функция является произведением двух функций f (х) = ягп(х) и д(х) = —х2 + х. Заметим, что pf (х) > 0, а ~рд(х) < 0 для х £ [1,3] (Рис. 2). В соответствии с правилом (9) (Секция III-D) для произведения функций можно сделать вывод, что нижняя оценка Иь(х) = ~р^(х)рд(х). Две касательные 0.54х + 0.3 и —0.99х + 3.11, образуя верхнюю оценку для sin^), пересекаются в точке с абсциссой х = 1.83. Для простоты здесь выбрано такое же значение х для построения хорд — 1.83х + 1.83 и —3.83х + 5.50 составляющих нижнюю оценку для д(х).

Рис. 2: Шаги для синтеза нижней КСЛ оценки для функции вт(х)(-х2 + х)

Умножая полученные оценки, получим:

'ф(х) = (0.54х + 0.3) —1.83х + 1.83), при х € [1,1.83], —3.83х + 5.50)— 0.99х + 3.11), при х € [1.83, 3].

ру(x)Рg(x) =

Рис. 3: Нижняя КСЛ оценка для функции sin(x)(-x2 +x)

h([l, 3]) с sin([1, 3]) . (-[1,3]2 + [1,3]) = [0.14,1] . ([-9,-1] + [1, 3]) = [0.14,1] • [-8, 2] = [-8, 2]

Полученная нижняя оценка h(x) составляет -8. Оценим функцию h(x) при помощи техники использования скосов [13]. Во первых вычислим границы скоса

Ya для sh(c, A) при A = [1; 3] и c =2:

h((A, c, 1)) = sin((A, c, 1)) • (-(A, c, 1)2 + (A, c, 1)) = sin(([1, 3], 1,1)) • (-([1, 3], 1,1)2 + ([1,3], 1,1))

= ([0.14,1], 0.84, [-0.99,0.54])

• (-([1, 9], 1, [2, 4]) + ([1, 3], 1,1)) = ([0.14,1], 0.84, [-0.99,0.54])

• (([-8, 2], 0, [-3, -1]))

= ([-8, 2], 0, [-3, -0.14]) = (Yx,Yc,Ya).

Оценка функции на основе вычисленного скоса дает следующий результат:

h([1,3]) с h(c) + Ya(A - c)

= 0+ [-3, -0.14] • ([1, 3] - 1) = [-6,0].

Полученная нижняя оценка составляет -6.

B. Пример построения нижней оценки для частного функций:

Заметим, что ф(х) не является кусочно-линейной функцией, следовательно необходимо построить ее КСЛ оценку. Заметим, что на отрезке [1,1.83] оценка вогнута, а на отрезке [1,1.83] выпукла. Используя правила построения КСЛ оценок для вогнутых и выпуклых функций получим нижнюю КСЛ оценку для для ф(х) (и, следовательно, для /(х)). Эта оценка показана красной линией на Рис. 3. Ломаная состоит из пяти следующих сегментов: {(1.0,0.0), (1.76,-1.76), (2.03, -2.8), (2.64, —2.8), (3, -0.91)} . Минимум нижней КСЛ оценки для функции / (х) равен В соответствии с правилами для операции деления -2.8. 17 и 19 (Секция Ш-Е) необходимо построить нижнюю

Применение интервального анализа дает следующий КСЛ оценку функции /(х) = ягп(х) на интервале х € результат: -2п, 2п] (Рис. 4):

h(x) =

sin(x) x2 + V

x £ [-2п, 2п]

Обозначим a = п 2П. Тогда:

Pg (X)

4—2п'

—2xn — п2 + 1, x g [—п, a] —4x — 3, x g [a, —1.5] —2x, x g [—1.5, —0.5] 1, x g [—0.5, 0]

1 + x, x g [0,1]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Pg (x) = \ 3x — 1, x g [1, 2]

Pg(x)

5+ п-4(x — 2), x g [2,п]

п2 + 2n(x — п) + 1, x g [п, §п] 4п2 + 4n(x — 2п) + 1, x g [§п, 2п]

Рис. 4: Нижняя КСЛ оценка функции sin(x) на интервале

x G —2п, 2п]

Таким образом, нижняя оценка w(x)(Pnc. 6) для функ-

7 i \ sin(x)

ции h(x) = x2+1 равна:

Pf(x)

' п(x + 2п), x g [- -2п, — 2 п

П(x + п), x g [— 2 п, —п]

—x — п, x g [—п —п + 1]

— 1, x g [—п + 1, —1]

x, x g [—1, 0]

2x, x G [0, 2п]

— - (x — п), x g [2п,п] п — x, x g [п,п + 1]

— 1, x g [п + 1, 2п — 1] x — 2п, x g [2п — 1, 2п]

_ »лМ -

- J(x)

V

6 4 \ - 2 I t—'

Также необходимо построить верхнюю КСЛ оценку функции /(х) = х2 + 1 для х £ [—2п, —п] и [0, п] и нижнюю КСЛ оценку для х £ [—п, 0] и [п, 2п]. (Рис. 5):

Рис. 6: Нижняя оценка для функции Sx^f! [—2п, 2п]

для x g

Рис. 5: Нижняя и верхняя КСЛ оценки функции f (x)

x2 + 1 для x g [—2п, 2п]

pg(x) =п2 — 3n(x + п) + 1, x g [—2п, —п]

2x/n+4 п2 — 3n(x+n)+1

2x/n+2 п2 — 3n(x+n)+1

, x G [—2п, — f п] , x g [—3п, —п]

— 2xn— п2 + 1

x — п

x

g [—п, a]

—4x—3 1

4x+3 , 1

, x g [a, —п + 1] x g [—п + 1, —1.5]

(x) =

2x, x G [—1.5, — 1

— 2, x G [—1, —0.5] x — 2п, x g [—0.5, 0]

ТО, x G [0 11 ni—Г), x g [1, 2п]

— 2x/n+2 3x —1 ,

— 2x/n+2

x

G [2п, 2]

5 +

2

4) (

п — x

g [2,п]

(x—2)

n2+2n(x—п)+1, x G [п,п +1]

1 , x g [п + 1, 2 п]

n2+2n(x—п)+1

_—1_

4n2+4n(x—2п)+1,

_x — 2n_

4n2+4n(x—2п) + 1,

Нижняя оценка функции h(x) равна —0. 5.

■ g [ 2 п, 2п — 1] : G [2п — 1, 2п]

x^+r Для x g [—2п, 2п]

x—п

Таблица I: Сравнение нижних оценок полученных разными подходами

Функция КСЛ оценка Интерв. оценка Скосы

sin(x) • (-x2 + x) -2.8 -8 -6

sin(x) X2+Ï -0.5 -1 -6.28

С помощью техники интервального анализа [4], [5] получаются следующий оценки:

h([-2n, 2п]) с

Оценим функцию h(x)

sin([-2n, 2п]) [-2п, 2п]2 + 1 [-1,1] [1, + 1]

sin(x)

[-1,1].

x2 + l

при помощи техники

использования скосов [13], [6]. Во первых вычислим границы скоса Ys для sh(c, A) при A = [-2п, 2п] и c = 0:

h((A,c, 1)) =

вт((А, с, 1)) (А, с, 1)2 + 1 _ вт(([-2п, 2п], 0,1))

_ ([-1,1], 0,сов([-2п, 2п]))

_ (1МП2]707[-2ПТ2П]УТ1М70)

([1,+ 1], 1, [-2п, 2п]) _ [-1,1] - 0 • [-2п 2п\

1], 0, [1,4п2 + 1] У _([-1,1], 0, [-1,1]) _ (Ух,Уо,Уэ).

Оценка функции на основе вычисленного скоса дает следующий результат:

Ч[А]) с Н(с) + У3(А - с) _ 0 + [—1,1] • ([-2п, 2п] - 0) _ [-2п, 2п].

Таблица Г резюмирует результаты полученные при помощи различных подходов. Во всех рассмотренных случаев наблюдается превосходство предлагаемого подхода.

V. ЗАКЛЮЧЕНИЕ

В статье предложена методика автоматического построения кусочно-линейных оценок для функции одной переменной, заданной в виде выражения над элементарными функциями. Разработаны базовые правила для алгебраических операций над КСЛ оценками. Предложенный подход эксперементально сравнен с методом интервального анализа [4], [5] и арифметикой скосов [13], [6]. Эксперементы продемонстировали, что для некоторых функций предложенный подход может значительно превосходить известные стандартные подходы.

В качестве практического применения описанного подхода, планируется использование его в методах глобальной оптимизации. Применение кусочно-линейных оценок позволяет эффективно делать редукцию области поиска глобального экстремума.

Другое возможное применение кусочно-линейных оценок возможно для нахождения корней функции от одной

переменной. Здесь также применяется редукция области поиска корней целевой функции.

Еще одно возможное направление дальнейших исследований — это применение данного подхода в се-парабельном программировании. В сепарабельном программировании рассматривается специальный класс многомерных функций которые представлены в виде суммы функций, каждая из которых зависит только от одной переменной т.е F(xi,Х2,... ,xn) = Fi(xi) + F2(x2)+,..., +Fn(xn) (сепарабельная функция). В задачах сепарабельного программирования также требуется нахождение глобальных экстремумов функций, которые могут быть получены при помощи предложенных кусочно-линейных оценок.

Очевидно, что применение кусочно-линейных оценок в различных практических задачах потребует дополнительного исследования, проведения вычислительных экспериментов и сравнения с другими техниками в отношении времени выполнения и использования вычислительных ресурсов. Это позволит сделать окончательные выводы об эффективности предложенного подхода.

В начале данной статьи отмечалось, что для построения оценок функции одной переменной будет рассматриваться функция с простой структурой. Для этих целей была детально рассмотрена кусочно-линейная функция, но предварительные эксперименты показывают, что использование кусочно-квадратичной функции вместо кусочно-линейной может дать еще более точные оценки рассматриваемой целевой функции. Это может являться дальнейшим направлением развития данного подхода.

Список литературы

[1] Khamisov Oleg, Posypkin Mikhail, Usov Alexander. Piecewise linear bounding functions for univariate global optimization // Optimization and Applications / Ed. by Yury Evtushenko, Milojica Jacimovic, Michael Khachay et al. — Cham : Springer International Publishing, 2019. —P. 170-185.

[2] Evtushenko Yurii Gavrilovich. A numerical method of search for the global extremum of functions (scan on a nonuniform net) // Zhur-nal Vychislitel'noi Matematiki i Matematicheskoi Fiziki. — 1971. — Vol. 11, no. 6. — P. 1390-1403.

[3] Evtushenko Yury, Posypkin Mikhail. A deterministic approach to global box-constrained optimization // Optimization Letters. — 2013. — Vol. 7, no. 4. — P. 819-829.

[4] Shary S.P. Finite-dimensional interval analysis. institute of compuna-tional technologies, sb ras, novosibirsk. — 2016.

[5] Hansen Eldon, Walster G William. Global optimization using interval analysis: revised and expanded. — CRC Press, 2003.

[6] Ratz Dietmar. An optimized interval slope arithmetic and its application. — Inst. ffir Angewandte Mathematik, 1996.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[7] Ershov AR, Khamisov Oleg Valerievich. Automatic global optimization // Diskretnyi Analiz i Issledovanie Operatsii. — 2004. — Vol. 11, no. 2. — P. 45-68.

[8] Khamisov Oleg. Explicit univariate global optimization with piecewise linear support functions. — Proc. DOOR 2016, CEUR-WS.org, Vol. 1623. P. 218-255, online http://ceur-ws.org/Vol-1623/papermp19.pdf.

[9] Bompadre A., Mitsos A. Convergence rate of McCormick relaxations // Journal of Global Optimization. — 2012. — Vol. 52, no. 1. — P. 1-28.

[10] Floudas C.A., Gounaris C.E. A review of recent advances in global optimization // Journal of Global Optimization. — 2009. — Vol. 45, no. 1. —P. 3-38.

[11] Khajavirad Anita, Sahinidis Nikolaos. Convex envelopes of products of convex and component-wise concave functions // Journal of Global Optimization. — 2012. — Vol. 52, no. 3. — P. 3911-409.

[12] Khamisov Oleg. Optimization with quadratic support functions in non-convex smooth optimization. — AIP Conference Proceedings 1776, 050010 (2016); doi: 10.1063/1.4965331.

[13] Ratz Dietmar. A nonsmooth global optimization technique using slopes: the one-dimensional case // Journal of Global Optimization. — 1999. — Vol. 14, no. 4. — P. 365-393.

Piecewise Linear Bounding Functions in Univariate Global Optimization

Alexander L. Usov

Abstract—The paper addresses the problem of constructing lower and upper bounding functions for univariate functions. This problem is of a crucial importance in global optimization where such bounds are used by deterministic methods to reduce the search area. Existing approaches do not always show the high accuracy of limiting functions in global optimization. It should be noted that bounding functions are expected to be relatively easy to construct and manipulate with. To solve this problem, it is proposed to use piecewise linear estimators for bounding univariate functions. The article gives a definition of a piecewise linear function, discusses their basic properties, as well as the basic arithmetic operations applicable to them. Using an example of elementary mathematical functions, an algorithm is proposed for constructing lower and upper piecewise linear estimates. For this purpose, the properties of convexity and concavity of elementary functions are applied. The rules proposed in the paper enable an automated synthesis of lower and upper bounds from the function's expression in an algebraic form. The numerical examples presented in the article compare the proposed approach with the technique of using interval analysis and slope arithmetic. The proposed approach demonstrates the high accuracy piecewise linear bounds.

Keywords—univariate global optimization, piecewise linear functions, estimators, deterministic methods.

[13] Ratz Dietmar. A nonsmooth global optimization technique using slopes: the one-dimensional case // Journal of Global Optimization. — 1999. — Vol. 14, no. 4. — P. 365-393.

References

[1] Khamisov Oleg, Posypkin Mikhail, Usov Alexander. Piecewise linear bounding functions for univariate global optimization // Optimization and Applications / Ed. by Yury Evtushenko, Milojica Jacimovic, Michael Khachay et al. — Cham : Springer International Publishing, 2019.—P. 170-185.

[2] Evtushenko Yurii Gavrilovich. A numerical method of search for the global extremum of functions (scan on a nonuniform net) // Zhur-nal Vychislitel'noi Matematiki i Matematicheskoi Fiziki.— 1971.— Vol. 11, no. 6. — P. 1390-1403.

[3] Evtushenko Yury, Posypkin Mikhail. A deterministic approach to global box-constrained optimization // Optimization Letters. — 2013. — Vol. 7, no. 4. — P. 819-829.

[4] Shary S.P. Finite-dimensional interval analysis. institute of compuna-tional technologies, sb ras, novosibirsk. — 2016.

[5] Hansen Eldon, Walster G William. Global optimization using interval analysis: revised and expanded. — CRC Press, 2003.

[6] Ratz Dietmar. An optimized interval slope arithmetic and its application. — Inst. fur Angewandte Mathematik, 1996.

[7] Ershov AR, Khamisov Oleg Valerievich. Automatic global optimization // Diskretnyi Analiz i Issledovanie Operatsii. — 2004. — Vol. 11, no. 2. — P. 45-68.

[8] Khamisov Oleg. Explicit univariate global optimization with piecewise linear support functions. — Proc. DOOR 2016, CEUR-WS.org, Vol. 1623. P. 218-255, online http://ceur-ws.org/Vol-1623/papermp19.pdf.

[9] Bompadre A., Mitsos A. Convergence rate of McCormick relaxations // Journal of Global Optimization. — 2012. — Vol. 52, no. 1. — P. 1-28.

[10] Floudas C.A., Gounaris C.E. A review of recent advances in global optimization // Journal of Global Optimization. — 2009. — Vol. 45, no. 1. —P. 3-38.

[11] Khajavirad Anita, Sahinidis Nikolaos. Convex envelopes of products of convex and component-wise concave functions // Journal of Global Optimization. — 2012. — Vol. 52, no. 3. — P. 3911-409.

[12] Khamisov Oleg. Optimization with quadratic support functions in non-convex smooth optimization. — AIP Conference Proceedings 1776, 050010 (2016); doi: 10.1063/1.4965331.

i Надоели баннеры? Вы всегда можете отключить рекламу.