УДК 681.5:519.6
Г. Б. Диго, Н. Б. Диго
ГЛОБАЛЬНАЯ ОПТИМИЗАЦИЯ В ЗАДАЧАХ ПАРАМЕТРИЧЕСКОГО СИНТЕЗА НА ОСНОВЕ НЕРАВНОМЕРНЫХ ПОКРЫТИЙ*
Аннотация. Анализируется возможность использования методов глобальной оптимизации на основе неравномерных покрытий допустимого множества для задач автоматизированного проектирования в случае алгоритмически заданной целевой функции. Обоснован выбор метода половинных делений при оптимальном параметрическом синтезе и предложен алгоритм его распараллеливания.
Ключевые слова: автомобильная дорога, модель, твердая пластина, стационарные колебания, импульсные возмущения.
Abstract. Possibility of use of methods of global optimization on the basis of nonuniform coverings of admissible set for problems of the automated designing in case of algorithmically given objective function is analyzed. The choice of bisection method at problems of optimal parametrical synthesis is justified and algorithm of its parallelizing is offered.
Keywords: optimization, objective function, computer-aided design, parametric synthesis algorithm parallelization method of half of the tick marks.
Введение
Одна из проблем параметрического синтеза технических систем сводится к поиску оптимальных номинальных значений параметров проектируемых объектов. Это задача многомерной глобальной оптимизации многоэкстремальной целевой функции неразрешима в общем случае, поскольку не гарантируется получение решения за конечное число шагов. Сложность ее численного решения вызвана большой размерностью пространства параметров, отсутствием достаточной априорной информации о характере целевой функции, вероятностным характером критерия оптимальности и дефицитом информации о случайных закономерностях процессов изменения параметров проектируемых технических систем. Экстремум целевой функции приходится искать в условиях нелинейности ее и ограничений на управляемые параметры, недоступности или отсутствия дополнительной информации об объекте исследования. Так, в задачах параметрического синтеза для алгоритмически заданной целевой функции доступными являются лишь ее значения, получение которых требует значительных вычислительных ресурсов.
В методах глобальной оптимизации алгоритмы решения являются итеративным процессом, порождающим последовательность точек в соответствии с предписанным набором правил, включающим критерий окончания счета [1]. Глобальный экстремум ищется среди всех найденных локальных решений, но возможен перебор только части локальных решений, если оставшиеся локальные решения не влияют на окончательный результат. Поэтому все используемые методы сводятся к оценке значения целевой функции на
* Работа выполнена при частичной финансовой поддержке гранта ДВО РАН 09-!-П2-03 (Программа фундаментальных исследований Президиума РАН № 2).
подмножестве точек из допустимого множества и отличаются способами выбора этих точек. При выборе метода решения конкретной задачи основной упор делается на учет свойств целевой функции и допустимого множества оптимизируемых параметров.
В области работоспособности произвольной конфигурации поиск экстремума, целевой функции заданной алгоритмически, эффективно осуществляется путем распараллеливания таких методов, как случайный поиск или метод сканирования [2, 3]. Процедуры случайного поиска имеют простую структуру, легко реализуются, малочувствительны к росту размерности пространства поиска и обладают потенциальным параллелизмом [2]. В методе сканирования допустимая область пространства параметров разбивается на элементарные ячейки, в каждой из них по определенному алгоритму выбирается точка, вычисляются значения целевой функции и среди них находится экстремум. При достаточно густом расположении точек он всегда гарантирует отыскание глобального экстремума [4], но с увеличением размерности пространства поиска число узлов сетки растет экспоненциально.
Применение алгоритмов глобального поиска, отличных от переборных, требует априорных предположений о свойствах рассматриваемой целевой функции, например ее липшицевости или дифференцируемости. Так, при удовлетворении целевой функции условию Липшица поиск ее экстремальных значений можно осуществлять методами покрытий, гарантирующими получение решения с заданной точностью за конечное число шагов [1]. В задачах оптимального параметрического синтеза выполнение условия Липшица для целевой функции очевидно, но значение ограничивающей константы (константы Липшица), как правило, неизвестно. Поэтому для методов, основанных на идее неравномерных покрытий, необходим переход к ее оценкам. Проведение расчетов на высокопроизводительных ЭВМ обеспечивает применение методов глобальной оптимизации, допускающих для ускорения расчетов использование локальной оптимизации, параллельные и распределенные вычисления. К ним относится направление, основанное на идее неравномерных покрытий допустимого множества [5-7], в частности, метод половинных делений.
В статье исследуется возможность использования методов, основанных на идее неравномерных покрытий, для нахождения глобального экстремума алгоритмически заданной многомерной функции, удовлетворяющей условию Липшица в области поиска, на примере метода половинных делений.
1. Проблемы, возникающие при использовании метода
половинных делений для алгоритмически заданных функций
Пусть на «-мерном параллелепипеде Р с Я11 алгоритмически задана многоэкстремальная функция ф (х), удовлетворяющая в области поиска условию Липшица с неизвестной константой Ь. Под алгоритмически заданной функцией понимается функция, для которой существует алгоритм нахождения ее значения при любом допустимом значении аргумента, и в качестве дополнительной информации могут использоваться лишь ее значения, вычисление которых в точках допустимой области требует значительных вычислительных ресурсов.
Задача минимизации
ф* = шт ф (х), Р = {х е Яп : а < х < Ь} , (1)
хеР
где неравенство х < г означает, что х1 < z1,1 < / < п , не имеет аналитического решения.
Предположим, что существует оценка минимума целевой функции в многомерной области поиска, обозначим X* - множество решений задачи (1), введем в рассмотрение множество ее е -оптимальных (приближенных) решений:
Xе = {х е Р : ф(х) < ф* + е}; (2)
очевидно, что X* с Xе с Р. Решение задачи (1) с заданной точностью е подразумевает определение величины глобального минимума функции ф(х) и нахождение хотя бы одной точки хг, где это приближенное значение достигается.
Методы, использующие неравномерные покрытия, и, в частности, метод половинных делений, предусматривают разбиение пространства поиска на меньшие подобласти и вычисление в них нижней границы целевой функции на основе интервального анализа либо с учетом значения константы Липшица или ее оценки. Поскольку техника интервального анализа применима к дважды непрерывно дифференцируемым целевым функциям, у которых первые и вторые производные имеют конечное число нулей [1], в рассматриваемом случае, когда функция цели (1) задана алгоритмически, и в ходе решения задачи доступны лишь ее значения (т.е. целевая функция недифференцируемая), необходимо оценивать неизвестную константу Липшица. Это достаточно сложная оптимизационная задача [8], и подходы к ее решению зависят как от имеющейся априорной информации о целевой функции, так и от сложности алгоритма ее вычисления.
В методе половинных делений в достаточно малых подобластях на работу алгоритмов основное влияние оказывает локальная информация о поведении целевой функции, и, наоборот, в больших подобластях повышается роль глобальной информации о ней из-за возможной ненадежности в этом случае локальной информации. Поэтому необходимо достигать разумного равновесия между использованием локальной и глобальной информации для обеспечения нахождения глобального минимума и ускорения работы алгоритма поиска [9, 10].
Таким образом, для успешного применения метода половинных делений к алгоритмически заданным целевым функциям необходимо решение следующих важных задач:
- выбор способа оценки константы Липшица, необходимой для получения нижних границ целевой функции в каждой из подобластей области допусков;
- балансирование между использованием локальной и глобальной информации;
- ускорение процесса необходимых вычислений.
2. Оценка константы Липшица
Для использования оценки неизвестной константы Липшица в методе половинных делений среди известных алгоритмов выбрано адаптивное оценивание [6, 8-10] глобальной константы L, определяемой для всей допустимой области, и локальных констант L,, действующих в подобластях P, с P . Способ нахождения глобальной оценки K константы Липшица L для всего пространства поиска и локальных оценок Ki констант Липшица Li для его отдельных подобластей [8] основан на применении информационностатистического алгоритма глобальной оптимизации, предложенного в [11] и обобщенного в [6] на многомерный случай, и позволяет получить глобальную оценку K по формуле
K = K(k) = (r + C / k) max(A(k), £), (3)
r > 1, C > 0, £> 0 - малая константа; X(k) - текущая оценка константы Липшица на k-й (k > 1) итерации алгоритма, ее начальное значение А(1) = |ф(а)-ф(Ь)|/||а-b||, а текущее значение A(k) на k-й (k> 1) итерации алгоритма уточняется по формуле
Щ +1) = max{A(k), max (|ф(х) -ф(у)|/||x - У|)}. (4)
x,yep-, X ^у
Параметры r, C и £ из (3) выбираются на основе априорной информации о характере целевой функции и управляют оценкой K, влияя на скорость сходимости алгоритма. С уменьшением r и C увеличивается скорость поиска, но возрастает вероятность сходимости метода к точке, не являющейся точкой глобального минимума функции ф (х) .
Полученная по (3) оценка K = K(k + 1) заменяет константу L при вычислении нижних границ g (P,) целевой функции на наборе многомерных подобластей
g (Pj) = ф(е,-) -(L /2) max
1< J <n
bj - a,
В ходе разбиения пространства поиска Р на более мелкие подобласти Р, полученная оценка К может оказаться сильно завышенной и не достигаться на некоторых из параллелепипедов Р, (аналогичная ситуация возможна и
при априори известном для исходного параллелепипеда Р с Яп точном значении Ь, что потребует перехода к ее оценке). Этим обоснован переход к локальным оценкам констант Липшица, позволяющий более точно оценивать характер поведения ф (х) на каждом из Р, с Р и избегать их сильного завышения. Оценка К, локальной константы Ь в каждом из многомерных параллелепипедов Р, с Р находится по одной из формул [8]:
К, = К (к) = (г + С / к)шах{А,- (к), у,, ^}; (5)
К- = К( (к) = шах{(г + С / к)(уц + (1 - у)А,- (к)2 / ц), ^} . (6)
В формулах (5), (6) величины r > 1, C > 0, £>0 аналогичны одноименным параметрам из (3) и управляют оценкой K,, оказывая значительное
влияние на скорость сходимости алгоритма, 0 <v< 1, а X, (k) - текущая оценка константы Липшица на k-й (k > 1) итерации алгоритма
X, (k) = |ф(а,-) - ф(Ь, )|/||а, - Ь, ||; (7)
Yj = ц||а,- - Ь,||/ max ||аj - Ь Л; (8)
1< j <т'' 11
ц = max (|ф(а,-)-ф(Ь,)|/||а,- -Ь,||). (9)
1<,<т
В отличие от алгоритма, представленного (5), в (6) комбинируется глобальная и локальная информация, полученная ранее. Параметр v обеспечивает баланс между глобальной информацией ц и локальной информацией 2
((k)/ ц). В обоих выражениях локальная информация о целевой функции используется вблизи локального минимума и во всей области поиска.
Локальная оценка K, из (5) является результатом баланса между локальной и глобальной информацией, представленной значениями X, и Y, соответственно. Локальная информация, представленная X,, оказывает решающее влияние на K,, когда параллелепипед P, имеет маленькую главную диагональ (в сравнении с текущей максимальной диагональю на всех параллелепипедах в P), и Y, из (8), (9) также мало. Когда величина диагонали
||а,- - Ь, || параллелепипеда P, близка к максимальной, локальная информация не надежна и используется глобальная информация, представленная Y,. При совпадении ||а,- - Ь, || с максимальной диагональю из набора параллелепипедов P, имеем Y, =Ц . Значения r , C и е влияют на K, как глобальные параметры.
3. Выбор параллельного аналога метода половинных делений
Ускорения процесса необходимых вычислений и уменьшения временных затрат при применении метода половинных делений можно достичь за счет распараллеливания вычислительного процесса по данным, а при оценке локальных констант Липшица и по потокам. Среди возможных вариантов распараллеливания по данным выбран простейший, не требующий в ходе решения обмена информацией между процессорами. При этом исходный параллелепипед P делится по одной из координат, например по первой, на l равных частей, где l - число доступных процессоров. На каждом из процессоров, следуя описанному в [12] последовательному алгоритму половинного деления, осуществляется поиск минимума целевой функции по своему исходному параллелепипеду P(J), J = 1,...,l. Затем полученные результаты передаются одному из процессоров, назначенному главным, для последующего окончательного выбора из них наилучшего. Такая технология распараллеливания, отличающаяся от прочих возможных вариантов своей алгоритмиче-
ской простотой, выбрана, несмотря на перечисленные в [13] ее недостатки (невозможность подключать простаивающие процессоры и разгружать занятые при асинхронном времени расчета из-за автономного владения информацией и отсутствия обмена ею). Это связано с тем, что при алгоритмическом способе расчета значений целевой функции отсутствие передачи данных от одного процессора к другому ускоряет ход вычислений больше, чем пошаговый обмен информацией между ними.
Путем организации параллельных вычислительных потоков при оценке локальных констант Липшица одновременно на разных процессорах проводятся расчеты по формулам (5) и (6) для одинаковых наборов данных. Полученные величины используются при поиске минимума целевой функции на одном и том же параллелепипеде. Результаты передаются главному процессору для их сравнения и выбора наилучшего значения целевой функции.
Одновременное распараллеливание вычислительного процесса по потокам и по данным должно предусматривать использование четного числа процессоров, т.е. исходный параллелепипед Р должен делиться на [//2] параллелепипедов Р( ■>'), чтобы каждая пара процессоров обеспечивала поиск минимального значения целевой функции ф (х) при разных вариантах оценки локальной константы Липшица (выражение [/ / 2] означает целую часть числа //2).
Заключение
Анализ возможности применения метода половинных делений в задачах оптимального параметрического синтеза для нахождения глобального минимума алгоритмически заданной целевой функции, удовлетворяющей в области поиска условию Липшица с неизвестной константой, позволяет сделать следующие выводы:
1. Для вычисления нижней границы алгоритмически заданной целевой функции в многомерных подобластях приходится решать глобальную оптимизационную задачу оценки константы Липшица. При этом учитывается имеющаяся априорная информация о целевой функции и сложности алгоритма ее вычисления.
2. Целесообразен переход к локальным оценкам констант Липшица для более точного оценивания характера поведения целевой функции на каждом из параллелепипедов и недопущения их сильного завышения для ускорения сходимости вычислительного процесса.
3. Параметры, входящие в формулы для оценки констант Липшица, требуют обоснованного выбора с учетом размерности и особенностей целевой функции.
4. Уменьшение временных затрат достигается за счет распараллеливания вычислительного процесса по данным, а при оценке локальных констант Липшица - и по потокам.
5. Выбранный вариант распараллеливания по данным не требует в ходе решения обмена информацией между процессорами и для алгоритмически заданной функции ускоряет ход вычислений больше, чем пошаговый обмен между ними.
6. Проведенные исследования позволяют утверждать, что выбранный способ распараллеливания вычислений предпочтительнее, несмотря на такие
его недостатки, как невозможность подключать простаивающие процессоры
и разгружать занятые при асинхронном времени расчета из-за автономного
владения информацией и отсутствия обмена ею.
Список литературы
1. Орлянская, И. В. Современные подходы к построению методов глобальной оптимизации / И. В. Орлянская // Исследовано в России [Электронный журнал]. -2002. - № 5. - URL: http://zhumal.ape.relam.ru/articles/2002/189.pdf. - С. 2097-2108.
2. Абрамов, О. В. Использование технологии параллельных вычислений в задачах анализа и оптимизации / О. В. Абрамов, Я. В. Катуева // Проблемы управления. - 2003. - № 4. - С. 11-15.
3. Абрамов, О. В. Параллельные алгоритмы построения области работоспособности / О. В. Абрамов, Г. Б. Диго, Н. Б. Диго, Я. В. Катуева // Информатика и системы управления. - 2004. - № 2 (8). - С. 121-133.
4. Абрамов, О. В. Параметрический синтез стохастических систем с учетом требований надежности / О. В. Абрамов. - М. : Наука, 1992.
5. Евтушенко, Ю. Г. Метод половинных делений для глобальной оптимизации функций многих переменных / Ю. Г. Евтушенко, В. А. Ратькин // Известия Академии наук СССР. Техническая кибернетика. - 1987. - № 1. - С. 119-127.
6. Квасов, Д. Е. Многомерный алгоритм глобальной оптимизации на основе адаптивных диагональных кривых / Д. Е. Квасов, Я. Д Сергеев // Журнал вычислительной математики и математической физики. - 2003. - Т. 43. - № 1. -С. 42-59.
7. Евтушенко, Ю. Г. Численный метод поиска глобального экстремума функций (перебор на неравномерной сетке) / Ю. Г. Евтушенко // Журнал вычислительной математики и математической физики. - 1971. - Т. 11. - № 6. -С. 1394-1403.
8. Molinaro, A. Acceleration tools for diagonal information global optimization algorithms / A. Molinaro, C. Pizzuti, Ya.D. Sergeyev // Computational Optimization and Applications. - 2001. - V. 18. - № 1. - P. 5-26.
9. Sergeyev, Y. D. Global Search Based on Efficient Diagonal Partitions and a Set of Lipschitz Constants / Yaroslav D. Sergeyev and Dmitri E. Kvasov // SIAM: Journal of Optimization. - 2006. - V. 16. - № 3. - P. 910-937.
10. Jones, D. R. Lipschitzian optimization without the Lipschitz constant / D. R. Jones, C. D. Perttunen, and B. E. Stuckman // Journal of Optimization Theory and Applications. - 1993. - V. 79. - № 1. - P. 157-181.
11. Стронгин, Р. Г. Численные методы в многоэкстремальных задачах (информационно-статистические алгоритмы) / Р. Г. Стронгин. - М. : Наука, 1978. - 240 с.
12. Диго, Г. Б. Анализ эффективности поиска глобального экстремума алгоритмически заданной функции на основе методов половинных делений и перебора на неравномерной сетке / Г. Б. Диго, Н. Б. Диго // Идентификация систем и задачи управления : труды VII Междунар. конф. SICPRO-08. - М. : Институт проблем управления им. В. А. Трапезникова РАН, 2008. - С. 512-525.
13. Евтушенко, Ю . Г. Распараллеливание процесса поиска глобального экстремума / Ю. Г. Евтушенко, В. У. Малкова, А. А. Станевичюс // Автоматика и телемеханика. - 2007. - № 5. - С. 46-58.
Диго Галина Борисовна
научный сотрудник, Институт автоматики и процессов управления ДВО РАН (Владивосток)
E-mail: [email protected]
Digo Galina Borisovna Researcher, Institute of automation and controlling processes of the Russian Academy of Sciences (Vladivostok)
Диго Наталья Борисовна
научный сотрудник, Институт автоматики и процессов управления ДВО РАН (Владивосток)
Digo Natalya Borisovna Researcher, Institute of automation and controlling processes of the Russian Academy of Sciences (Vladivostok)
E-mail: [email protected]
УДК 681.5:519.6 Диго, Г. Б.
Глобальная оптимизация в задачах параметрического синтеза на основе неравномерных покрытий / Г. Б. Диго, Н. Б. Диго // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2010. -№ 4 (16). - С. 30-37