Научная статья на тему 'Локализация точек минимума в некоторых экстремальных задачах c булевыми переменными'

Локализация точек минимума в некоторых экстремальных задачах c булевыми переменными Текст научной статьи по специальности «Математика»

CC BY
103
27
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Гребенник Игорь Валериевич

Рассматривается задача дискретной оптимизации на множестве булевых переменных в евклидовом пространстве. Проводится декомпозиция множества допустимых решений по семействам параллельных гиперплоскостей. На основе декомпозиции осуществляется локализация решений исходной задачи оптимизации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гребенник Игорь Валериевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Minimum points localization in the some extreme problems with boolean variables

The class of extreme problems with Boolean variables is considered. The decomposition of the admissible solutions set on the parallel hyperplanes family and extreme properties of the objective functions on the hyperplanes are used. On that basis the solutions localization of considered optimisation problems which puts into reducing of the primary admissible solutions set is fulfilled.

Текст научной работы на тему «Локализация точек минимума в некоторых экстремальных задачах c булевыми переменными»

(3)

КОМПЬЮТЕРНЫЕ^

УДК 519.85

ЛОКАЛИЗАЦИЯ ТОЧЕК МИНИМУМА В НЕКОТОРЫХ ЭКСТРЕМАЛЬНЫХ ЗАДАЧАХ C БУЛЕВЫМИ ПЕРЕМЕННЫМИ

ГРЕБЕННИК И.В.

Рассматривается задача дискретной оптимизации на множестве булевых переменных в евклидовом пространстве. Проводится декомпозиция множества допустимых решений по семействам параллельных гиперплоскостей. На основе декомпозиции осуществляется локализация решений исходной задачи оптимизации.

Рассмотрим задачу дискретной оптимизации следующего вида:

ф(х) ^ min, (1)

х є Bk c Rk; Bk = (x|xi є {0,i}, i є Jk, Jk = {i,2,...,k}.

Отметим, что множество Bk , его свойства и некоторые задачи оптимизации на множестве Bk исследованы в [1,2].

Осуществим выпуклое (сильно выпуклое с параметром р > 0) дифференцируемое продолжение j функции (p(x) на выпуклое замкнутое множество X 3 Qk = conv Bk которое может быть получено, например, способом, описанным в [2]. Учтем, что точки множества Bk и только они удовлетворяют системе

0 < X; < 1, І Є Jk ,

k

Z(x;

I i = 1

l»2

k

4 '

Тогда задаче (1) можно поставить в соответствие эквивалентную задачу оптимизации:

ф(x)

^ min,

x є Rk,||x -c||2 = Ё,0 < x; < 1,i є Jk, (2)

Д 1,

c = (—,...,—) < 22

R

k

В работе [3] был рассмотрен способ декомпозиции множества Bk с помощью семейств гиперплоскостей. На основе сформулированного определения n-смежности элементов множества Bk строятся гиперплоскости a(n), n-смежные с данной точкой x(0) є Bk . При этом уравнение гиперплоскости a(n) имеет вид:

c1x1 + c2x2 +... + ckxk + dn - 0,

где с i =

1, если X0 = 1, . т

! 0 0, iЄJk ,

- 1, если Xi = 0,

dkn) = dk + n -1, dk получается подстановкой в (3) произвольной вершины q2,1 — смежной с x0 .

Используем полученные в [3] результаты для локализации решения задачи (2) в некотором подмножестве множества Bk.

Учтем, что множество Bk является пересечением k — мерного гиперкуба Qk и гиперсферы Sk и удовлетворяет соотношениям:

0 < x; < 1, i = 1,...,k ,

< k

Z (xi

li=1

і'2

k

4 .

(4)

Рассмотрим множества 5k_1 = Sk n a(n) (x0) и Qk_1(n) = q2 na(n)(x0), где a(n)(x0) - гиперплоскость вида (3) в R k, проходящая через вершины Qk , n — смежные с точкой х0.

Очевидно, что множество, лежащее на пересечении гиперсферы Sk и гиперплоскости a(n)(x°), представляет собой гиперсферу ?k-1 в пространстве Rk . Получим ее уравнение. Выражая из (3) переменную xk, подставим ее в уравнение гиперсферы S k :

k-1

Z (xi

i=1

ї>2

+ (-dk

1

2

1 k^1 )2

Zcixi)

ck i=1

k

4 .

Имеем:

k-1 2 k-1k-1

Z xi + Z Z cicjxixj + i=1 i=1 j=1

k-1

+ Z (

(2dn + 1)ci

1)xi + (dn)2 + dk = 0

i=1 ck

Введем следующие обозначения:

(5)

C = hi

ij J(k-1)x(k-1)

cij =

ci • cj, i * j , cicj +1, i = j

i,j є Jk-1;

D = (d1,...,dk_1); di = (2dk+ 1)ci _ ^ i є Jk4 ;

ck

P = (dk)2 + dn .

Тогда соотношение (5) может быть представлено в виде

(Cx, x) + (D, x) + P = 0 , (6)

где x є Rk 1.

РИ, 2002, № 4

99

Приведем квадратичную форму в левой части (6) к каноническому виду. Для этого найдем ее представление в базисе собственных векторов матрицы С.

Пусть ХЬХ2,..., — собственные числа матрицы

С, а e1,e2,...,ek_i — соответствующие им ортонормированные собственные векторы.

Рассмотрим матрицу T = |тД , столбцами

L 4Jk—1 х k-1

которой служат собственные векторы матрицы С. Пользуясь приемами линейной алгебры, получим искомое представление соотношения (6):

(Wx,x) + (0,x) + P = 0 ,

где

W=T 1CT=

Х1 0

0 ^ k-1

0 = TD.

Уравнение (7) можно переписать в виде

(7)

k-1 2 k-1

Е Лхг' + ^&ixi + P = 0 .

i=1 i=1

Поскольку матрица С вещественна и симметрична, то ее спектр X 2,..., ^k-1 является вещественным

k-1 Q. 2 k-1 Q2 P

[4]. Тогда Z(xi 4^ - 1<^т-

)-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

урав-

нение гиперсферы Sk_1 = Sk na(n)(x0).

Получим теперь соотношения, описывающие многогранник q2_1 (n) = Qk n a(n) (x0). Выразив из (5)

переменную xk, подставим ее в систему неравенств из (4). Имеем:

0 < xi < 1> і є Jk_1 ,

1 k

dk *----E c.x. < 1 + dk .

ck i=1

Справедливо следующее утверждение.

Лемма. Точки множества X(n)(x0) и только они удовлетворяют системе соотношений

0 < x. < 1, i є Jk_1;

1 k

dk ^------1c.x. < 1 + dk;

ck і=1

k-1 a. 2 k-1 a. p

E (x. + -Ч2 = E (-y - гг ду), і=1 2X і і=1 4X:2 (k - 1)7, і

т.е. лежат на пересечении многогранника Qk 1(n) и сферы Sk_1.

Доказательство утверждения следует из цепочки соотношений, использующей закон ассоциативности и свойства идемпотентности алгебры множеств:

Sk-1 n Qk“1(n) = Sk-1 n (Ql na(n)(x0)) =

= (Sk-1 n Qk) na (n)(x0) =

= ((Sk n a(n)(x0)) n Qk) n a(n)(x0) =

= ((Sk nQ2)na(n)(x0))na(n)(x0) =

= (Sk ^ Q2) ^ (a(n) (x0) n a(n) (x0)) _

= (Sk nQ2)na(n)(x0) =

= Bk na(n) (x0) = X(n)(x0).

Рассмотрим задачу оптимизации (2). Используя представление множества X(n)(x0) в виде пересечения многогранника и гиперсферы, получаем оценку минимума функции цели <p(x) на множестве X(n)(x0). Для этого спроектируем 9(x) на подпространство Rk-1, задаваемое гиперплоскостью a(n)(x0) вида (3). Выражая из уравнения гиперплоскости a(n)(x0) переменную xk, получаем

9(x) = 9(x1,x2,...,xk) = 9(x1,...,xk_1,

1 k-1

-dk-----Ecixi) = ep(x1,x2,.. ,xk-1) .

ck i=1

Очевидно, Ep(x) — выпуклая функция, так как она является проекцией выпуклой функции <p(x). В качестве оценки минимума функции ф (а значит и ф ) на множестве X(n)(x0) рассмотрим решение задачи оптимизации функции ~(x1,x2,...,xk_1) на многограннике Qk_1 (n). Легко показать, что множество вершин многогранника q2_1(n) совпадает с множеством X(n)(x0). В связи с этим поставленная задача эффективно может быть решена одним из известных методов, основанных на линеаризации, например, методом условного градиента (Франка — Вульфа) или проекции градиента. Эффективность решения достигается благодаря простоте решения вспомогательной задачи оптимизации линейной функции на многограннике (Qk_1 (n), основанного на утверждении леммы 1 из [3].

Решение описанной задачи на многограннике Qk _1(n) является оценкой минимума функции Ep(x1,x2,...,xk_1) на множестве X(n)(x0). Однако в случае, если глобальный минимум функции ~ —

внутренняя точка многогранника Qk_1 (n), эта

оценка недостаточно эффективна. Более эффективной оценкой при этом может служить решение

задачи оптимизации функции Ep(x1,x2,...,xk) на

гиперсфере Sk _1. Но получение такой оценки для

100

РИ, 2002, № 4

Ф(х) общего вида является сложной задачей, для решения которой требуется разработка специальных методов. Для случая, когда ф(х) — квадратичная функция, методы решения этой задачи рассмотрены в работах [ 1, 2].

Предположим теперь, что функция цели в задаче (2) сильно выпукла с параметром р > 0 . Опираясь на полученные оценки минимума ф(х) на множествах X(n)(x0), попытаемся локализовать решение поставленной задачи. Рассмотрим вначале случай, когда

y = arg min ф(х) g Q2 = convBk

xeR1'

(8)

Определим точку х* области допустимых решений задачи (2), ближайшую к у . Легко показать [1], что точка х* є Bk определяется как

0, если у: < —;

1 - 1

1, если у. >—.

: 2

(9)

Очевидно, что значение ф(х*) является верхней оценкой решения задачи (2).

Построим систему множеств Х(п)(х*), n=1, 2,, k, и проведем через них гиперплоскости а(п) вида(3), n=1, 2, ..., k. Из выпуклости функции ф(х) и того факта, что глобальный минимум ф(х) не принадлежит многограннику q2 , а также способа построения семейства параллельных гиперплоскостей а(п) следует, что

ф(у) < minф(х) < minф(х) <... < minф(х)

хє^2-1(п) . (10)

х^ 1(1) xєQk 1(2)

хі =

Обозначим y(i) = arg min ф(х), i = 1,...,2.

xєQ2-1(i)

Тогда, если выполняется неравенство

ф(х*) <ф(у(j)) (11)

для какого-либо (p&Jk, то в соответствии с (10) решение задачи (2) принадлежит множеству

j-1

уО-1)(х*) = у Х(:)(х*). i=1

Покажем, при каких условиях для ф(х) будет выполнено условие (11).

Так как ф(х) сильно выпукла с параметром р > 0 , то для нее справедливы следующие соотношения [5]:

ф(х*) -ф(у) >р|| х* --|2; (12)

9(-(j)) - Ф(У) ^ p||y(j) --f . (13)

Оценим норму ||у(j) - -| . Так как точка -(j) є то оценкой нормы может быть квадрат расстояния от точки у до плоскости a(j) вида (3). Имеем

|L(j) _-I2 > (c1y1 + c2y2 + ••• + ckyk + d2)2 _

i2

(j) ^ ™(j)

(j) - -

2 2 2 cl + c2 +... + ck

1 k j = y( E ci-i + dk)2. k i=1

Используя эту оценку, а также то, что ||х * -у||2 > 0 , сложим неравенства (12) и (13):

ф(х*) +ф(уа)) - 2ф(у) >Р- у( Е ci—i + dk)2

k i=1

ф(у(j)) - ф(х*) > 2(ф(у) - ф(х*)) +

+р-т(Еci—і + dk)2. k і=1

Определим значение r, при котором ф(у(j)) -ф(х*) > 0. Имеем:

ф(х*) -ф(у)

р > 2k-

(Е ci—i + dk)2

(14)

i=1

Таким образом, если функция цели задачи (2) ф(х) является сильно выпуклой и удовлетворяет условию (14), то решение задачи принадлежит множеству y(j_1) (х*).

Итак, справедлива следующая теорема.

Теорема 1. Пусть в задаче оптимизации (2) функция цели ф(х) сильно выпукла с параметром р > 0, а

семейство параллельных гиперплоскостей a(n) вида (3) проведено через точки множеств X(n) (х*),

n є Jk, где х* удовлетворяет соотношению (9). Тогда для того, чтобы решение задачи (2) было

- j-1 .

локализовано внутри множества y(J_1) = у Х(:)(х*),

i=1

достаточно, чтобы выполнялось условие ф(х*) -ф(у)

р > 2k-

(Е ci—і + dik)2

i=1

где у удовлетворяет (8).

Следствие. Пусть в задаче оптимизации (2) функция цели ф(х) сильно выпукла с параметром

р > 0 , а гиперплоскость а(1) вида (3) проведена

через точки множества Х(1)(х*), где х* удовлетворяет соотношению (9). Для того чтобы х* была точкой минимума ф(х) на множестве Bk, достаточно, чтобы выполнялось условие

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

РИ, 2002, № 4

101

р

> 2k

Ф(х*) -ф(у)

k і 2 ’

(Z сіУі + dk)2

i=1

_ k(V9(x*),x* -y(1))

Pг k k ,

k * 12 (Ё cixi + dk)2

i=1

где у определяется соотношением (8).

Рассмотрим теперь случай, когда ф(х) — сильно выпуклая с параметром р > 0 дифференцируемая функция. Опираясь на предыдущие построения, докажем следующую теорему.

Теорема 2. Пусть в задаче оптимизации (2) функция цели ф(х) сильно выпукла с параметром р > 0 и дифференцируема, а семейство параллельных гиперплоскостей a(n) вида (3) проведено через точки множеств X(n)(x*), n є Jk, где х* удовлетворяет соотношению (9). Тогда для того, чтобы решение задачи (2) было локализовано внутри множества . j-і .

Y(j 1) = U x(i)(x*), достаточно, чтобы выполня-i—1

лось условие

^, (Vф(x*),x* —y(j)) р -k k ,

(Ё cixi + dk)2

i=1

где y(j) = arg min ф(x).

xeQk _1(j)

Доказательство. Так как фф) сильно выпукла и дифференцируема на Rk, то для любых x,y є Rk справедливо соотношение [5]:

Ф(у) - 9(x) > (Vф(x), y - x) + р||x - y2 .

Подставляя в это соотношение точки х* и y( j), где

y6) _ arg mijj) ф(x), а х* удовлетворяет (9), получаем условие, когда ф(у(^) > ф(x*). Учитывая, что 2

x - Г

(j)

можно оценить квадратом расстояния от

(j)

точки х * до гиперплоскости a(J), имеем

x - y

(j)|2 1 k * j 2

-y(j1 ^-(Ёc.x. + djk)2 .

k i=1

k

Тогда ^(x*),y(j) - x*) +£ (^ c.x* + dk)2 > 0 ,

k i=1

_ k(V9(x*),x* - y(i)) p-k k : .

(^ cix*+dk)2

i=1

Следствие. Пусть в задаче оптимизации (2) функция цели ф^) сильно выпукла с параметром р > 0 и дифференцируема, а гиперплоскость а(1) вида (3) проведена через точки множества X(1)(x*), где х * удовлетворяет соотношению (9). Для того чтобы х * была точкой минимума ф^) на множестве Bk, достаточно, чтобы

где у(1) = arg min ф^)

x.Qk-1(1)

Рассмотренный случай, когда безусловный минимум у сильно выпуклой функции ф^) не принадлежит многограннику Qk = conv Bk , является более благоприятным для локализации решения задачи (2) описанным способом. При этом точка x* є Bk, ближайшая к у и полученная по формуле (9), является естественным приближением к решению задачи (2). В силу выпуклости фф), ф^*) во многих случаях будет хорошей верхней оценкой решения задачи. Гиперплоскости a(n) отсекают точки множества Bk или его подмножеств от безусловного минимума ф^) — точки у . А после выполнения условия (11) для какого-либо j можно исключить из рассмотрения все точки множества Bk, отсеченные гиперплоскостью a(j). При выполнении условий следствий из теорем 1 и 2 точка x* становится решением задачи.

В случае же, когда у является внутренней точкой

многогранника Qk, применение описанной схемы локализации менее эффективно. В этой ситуации невозможно отсечь одной гиперплоскостью у от

точек множества Bk. Кроме того, при этом трудно указать удачное приближение к решению задачи. Одним из подходов к локализации решения задачи (2) может быть следующий. Исходя только из свойства выпуклости функции ф^) и не оценивая ее скорости роста в различных направлениях, выберем в качестве приближения к решению точку x *, ближайшую к у . Для этого воспользуемся соотношением (9). Как и в первом случае, построим систему множеств X(n)(x*), n = 1,2,...,k . При этом точка у є Q| окажется между двумя гиперплоскостями семейства a(n), например, a(s) и a(s+1). Тогда в силу выпуклости ф^), способа построения семейства гиперплоскостей a(n) и положения точки у внутри многогранника Qk относительно гиперплоскостей семейства a(n) выполняются условия:

Ф^*) > min ф^) > min ф^) >... > min ф^) > ф(у),

xeQk-1(1) xeQk_1(2) xeQk-1(s)

ф(у) < min ф^) < minф^) <... < min ф^)

xeQk_1(s+1) xeQ|_1(s+2) xeQ|_1(n) .

Если для какого-либо j є {s +1,n} выполнится неравенство (11), то в соответствии с приведенными условиями решение задачи (2) будет принадле-j j-1 .

жать множеству Y(j_1)(x*) = U X(i)(x*).

i=1

102

РИ, 2002, № 4

Отметим, что для дальнейшей локализации решения задачи (2) в случае у є q| можно воспользоваться следующим приемом. Выберем вершину Qk , смежную с x *, обозначим ее х1. Построим

систему множеств X(n)(x1), n = 1,2,...,k и воспользуемся приведенной выше схемой. Получим другое множество, содержащее решение задачи (2):

Y(t-1)(х1) = tU1X(l)(x1). i=1

Тогда решение задачи (2) принадлежит множеству Y = Y(j-1)(x*)П Y(t_1)(x1) .

Выбирая новые вершины многогранника Qk и

проводя аналогичные построения, можно продолжить процесс локализации решения исходной задачи (2).

Литература: 1. СтоянЮ.Г., Яковлев С.В., Гребенник ИВ. Экстремальные задачи на множестве размещений. X., 1991. 37с. (Препринт АН УССР/Ин-т пробл. машиностроения; 347). 2. Яковлев С.В., Гребенник И.В. О некоторых классах задач оптимизации на множествах размещений и их свойствах//Изв. вузов. Математика. 1991. №11. С.74-86. 3. Гребенник И.В. Декомпозиция множества допустимых решений и экстремальные свойства целевых функций в задачах оптимизации с булевыми переменными // Радиоэлектроника и информатика. 2001. №3. С. 93-99. 4. Кострикин А И., Манин Ю.И. Линейная алгебра и геометрия. М.: Наука, 1986. 304 с. 5. Васильев Ф.П. Численные методы решения экстремальных задач. М.: Наука, 1988. 588 с.

Поступила в редколлегию 29.04.2002

Рецензент: д-р физ.-мат. наук Новожилова М.В.

Гребенник Игорь Валериевич, канд. физ.- мат. наук, доцент кафедры системотехники ХНУРЭ. Научные интересы: дискретная оптимизация, вычислительные методы. Увлечение: волейбол. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-93-06.

УДК 621.327

РАЗРАБОТКА СТРУКТУРНОЙ ОРГАНИЗАЦИИ ПРОЦЕССА ОБРАБОТКИ ВИДЕОДАННЫХ

КОРОЛЕВ А.В.____________________________

Излагается структурная организация процесса обработки видеоданных, включающая организацию выявления длин серий и формирование из них массивов, кодирование длин одноцветных областей по числу двоичных серий, формирование полиадических кодов с учетом ограниченного числа двоичных серий в длинах одноцветных областей.

Введение

В работе [1] показано, что на основе последовательного выявления особенностей изображений по признакам: длина области (количество элементов в области), закрашенная одним цветом, число двоичных серий, значение динамического диапазона осуществляется сокращение избыточности. Однако конкретная организация обработки изображений не указывается. В то же время организация обработки значительно влияет на результирующее значение степени сжатия видеоинформации [2]. Поэтому для исключения избыточности изображений на основе предложенной совокупности информативных, структурных признаков требуется:

1) обеспечить наличие кодовых конструкций для сокращения избыточности по каждому признаку;

2) разработать структурную организацию обрабатываемых данных.

Первое условие (необходимое) обеспечивает устранение избыточности по каждому признаку в отдельности за счет наличия соответствующих процессов формирования кодовых комбинаций. Однако, чтобы осуществить последовательное устране-

ние избыточности различных видов, необходимо организовать соответствие для смежных матриц информативности между обрабатываемыми данными и особенностями формируемых кодов. При этом должны дополнительно учитываться особенности аппаратной реализации процессов обработки [3, 4].

1. Разработка структурной организации обработки видеоданных

Структурная организация данных должна строиться так, чтобы обеспечить наибольший коэффициент сжатия и исключить неконтролируемые потери информации. Поэтому второе условие является достаточным для обеспечения наибольшей степени компактного представления видеоданных при минимальном количестве операций и исключения неконтролируемых потерь информации.

Структурная организация обработки данных определяется следующими параметрами: числом признаков; количеством элементов, для которых присваивается код (поэлементное или блочное); видом машинного представления (равномерный или неравномерный); размером массивов данных (постоянные или переменные); типом динамического диапазона данных (регулируемый или нерегулируемый).

Определим параметры структурной организации процесса обработки для предложенной совокупности признаков, состоящей из следующих матриц информативности: << исходное изображение; длины серий; коды по числу двоичных серий; полиадические коды >>.

При выборе вида машинного представления необходимо учитывать особенности аппаратной реализации процессов обработки данных. Эти особенности состоят в том, что:

РИ, 2002, № 4

103

i Надоели баннеры? Вы всегда можете отключить рекламу.