Научная статья на тему 'Схема метода ветвей и границ для задач условной оптимизации с алгоритмически заданными псевдобулевыми функциями'

Схема метода ветвей и границ для задач условной оптимизации с алгоритмически заданными псевдобулевыми функциями Текст научной статьи по специальности «Математика»

CC BY
216
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
МЕТОД ВЕТВЕЙ И ГРАНИЦ / BRANCH AND BOUND METHOD / ПСЕВДОБУЛЕВЫЕ ФУНКЦИИ / PSEUDO-BOOLEAN FUNCTIONS

Аннотация научной статьи по математике, автор научной работы — Масич И. С.

Рассматриваются задачи псевдобулевой оптимизации, в которых функции предполагаются заданными алгоритмически. Выделяются классы часто встречаемых на практике задач. Исследуется алгоритм нахождения точного решения задачи, основанный на схеме метода ветвей и границ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A SCHEME of branch and bound method for constrained optimization problem with algorithmically given pseudo-Boolean functions

We consider problems of pseudo-Boolean optimization, in which the functions are assumed given algorithmically. The classes are distinguished that often encountered in practice problems. We study an algorithm for finding the exact solution of the problem, based on the schema of the branch-and-bound method.

Текст научной работы на тему «Схема метода ветвей и границ для задач условной оптимизации с алгоритмически заданными псевдобулевыми функциями»

непараметрические оценки качественных зависимостей по наблюдениям вектора состояний процесса;

(■■■) - уравнения, найденные на основе известных

фундаментальных законов, определенные с точностью до набора параметров а] ; /Ы]- ( ■ )- параметризованные компоненты соответствующих вектор-функций, определенные с точностью до набора параметров р] ; Х3\ ^ - векторы, составленные из различных компонент соответствующих векторов входных и выходных переменных, участвующих в описании интересующей нас связи [2]; Ф(-) - колоколооб-разные функции, параметры размытости С удовлетворяют условиям сходимости [2].

Безусловно, предлагаемые ^-модели имеют достаточно сложную форму, но вместе с тем более точно отражают свойства реально протекающего процесса на том или ином объекте.

Они принципиально отличаются от общеизвестных моделей тем, что объединяют уравнения, полученные на основе фундаментальных законов, технические, конструктивные особенности процесса и его параметрическую и непараметрическую составляющие в единое целое.

Для описания многих процессов, скажем, механических или электрических, которые достаточно хорошо контролируются, применение ^-моделей не требуется - там «справляются» классические модели.

Однако в реальности приходится сталкиваться с ситуациями, в которых требуемого для адекватного применения подобных моделей контроля не удается получить. В таких случаях упрощение модели дискретно-непрерывного процесса неизбежно приведет к ухудшению ее качества, и может оказаться, что упрощенные модели, в отличие от моделей типа (1), уже

не пригодны для получения качественного прогноза или создания систем автоматического управления в силу своей грубости.

Подобная ситуация наблюдается в попытках построения модели геофильтрации нефти в пористой среде [3], когда принимаемые допущения (неучет ряда важных факторов, характера протекания процесса и пр.) оказываются слишком «грубыми», в результате чего классические модели плохо описывают реальность и оказываются неприменимыми с практической точки зрения.

Библиографические ссылки

1. Мальцева Т. В., Медведев А. В. О компьютерном исследовании К-моделей // Вестник СибГАУ. Красноярск, 2013. Вып. 3 (49).

2. Медведев А. В. Теория непараметрических систем. Моделирование // Вестник СибГАУ. Красноярск, 2010. Вып. 4. С. 4-9.

3. Molokova N. V., Konnykh M. A. Modeling of the Dynamics of Spreading of Spilled Hydrocarbons Taking into Account the Gravity-Capillary Interaction // Журнал СФУ. Красноярск, 2012. Вып. 5(4). С. 462-470.

References

1. Mal'ceva T. V., Medvedev A. V. O komp'juternom issledovanii K-modelej // Vestnik SibGAU. Krasnojarsk, 2013. Vyp. 3 (49).

2. Medvedev A. V. Teorija neparametricheskih sistem. Modelirovanie // Vestnik SibGAU. Krasnojarsk, 2010. Vyp. 4. S. 4-9.

3. Molokova N. V., Konnykh M. A. Modeling of the Dynamics of Spreading of Spilled Hydrocarbons Taking into Account the Gravity-Capillary Interaction // Zhurnal SFU. Krasnojarsk, 2012. Vyp. 5(4), S. 462-470.

© Мальцева Т. В., 2013

УДК 519.854.33

СХЕМА МЕТОДА ВЕТВЕЙ И ГРАНИЦ ДЛЯ ЗАДАЧ УСЛОВНОЙ ОПТИМИЗАЦИИ С АЛГОРИТМИЧЕСКИ ЗАДАННЫМИ ПСЕВДОБУЛЕВЫМИ ФУНКЦИЯМИ

И. С. Масич

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: [email protected]

Рассматриваются задачи псевдобулевой оптимизации, в которых функции предполагаются заданными алгоритмически. Выделяются классы часто встречаемых на практике задач. Исследуется алгоритм нахождения точного решения задачи, основанный на схеме метода ветвей и границ.

Ключевые слова: метод ветвей и границ, псевдобулевые функции.

Математические методы моделирования, управления и анализа данных

A SCHEME OF BRANCH AND BOUND METHOD FOR CONSTRAINED OPTIMIZATION PROBLEM WITH ALGORITHMICALLY GIVEN PSEUDO-BOOLEAN FUNCTIONS

I. S. Masich

Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: [email protected]

We consider problems of pseudo-Boolean optimization, in which the functions are assumed given algorithmically. The classes are distinguished that often encountered in practice problems. We study an algorithm for finding the exact solution of the problem, based on the schema of the branch-and-bound method.

Keywords: branch and bound method, pseudo-Boolean functions.

При построении оптимизационных моделей многие задачи естественным образом формализуются в виде задач псевдобулевой оптимизации. Рассмотрим типичную постановку задачи псведобулевой оптимизации. Дано множество п независимых бинарных переменных X = (х1,..., хп ) и действительная функция АХ), которую необходимо оптимизировать: f:S^R, где S с {0, 1}п - подобласть пространства булевых

переменных, определяемая заданной системой ограничений, накладываемых на значения переменных X.

Если S = {0,1}п , т. е. на выбор переменных x1,...,хп не накладываются какие-либо ограничения, то такая задача называется задачей безусловной псевдобулевой оптимизации. Для ее решения разработаны точные алгоритмы, основанные на выявлении в оптимизируемой функции особенностей ее поведения в пространстве бинарных переменных. Эти особенности были использованы для построения и обоснования эффективных точных алгоритмов. В частности, для строго монотонной псевдобулевой функции разработан точный алгоритм оптимизации, требующий п+1 вычислений функции.

Особенностью этих алгоритмов является то, что они не требуют алгебраического задания целевой функции. Требуется лишь возможность вычисления значения функции при заданных аргументах, т. е. в точках {0, 1}п . Такие алгоритмы часто называют поисковыми, и именно о них пойдет речь в данной работе.

Наиболее «примитивный» способ найти точное решение задачи псевдобулевой оптимизации - это перебрать все возможные комбинации значений бинарных переменных. Число таких комбинаций равно 2". Для многих реальных задач это неприемлемо. Чтобы снизить число вычислений, следует убрать из рассмотрения неперспективные комбинации значений переменных (образующие подобласти исходного пространства бинарных переменных). А для того, чтобы их выявить, нужно знать свойства функции, т. е. поведение этой функции на точках (комбинации переменных). На исключении наборов неперспективных альтернатив основаны такие подходы, как метод динамического программирования и метод ветвей и границ.

Многие практические задачи выбора формализуются в виде задач псевдобулевой оптимизации с ограничениями на переменные, при этом в поведении целевой функции и ограничений наблюдаются особен-

ности, которые позволяют строить приемлемые алгоритмы для нахождения точного решения. Вопрос построения таких алгоритмов и рассматривается в этой работе для распространенного класса задач.

Рассмотрим задачу вида

\C(X) ^ max,

X gB"

Aj ( x ) < нj, j=im,

где В1" = {0,1}" - пространство бинарных переменных; C(X и Aj(X - псевдобулевые функции (действительные функции бинарных переменных), в общем случае заданные неявно (алгоритмически). Рассмотрим класс задач, в котором эти функции являются монотонными.

Главная особенность рассматриваемого класса задач состоит в том, что целевая функция и функции ограничений предполагаются заданными неявно, т. е. возможны лишь вычисления функций в точках, но не известна их алгебраическая запись. С одной стороны, такие задачи часто встречаются на практике, например, когда для вычисления функции необходимо обратиться к массиву данных. С другой стороны, даже для тех задач, для которых возможна алгебраическая запись функций, эти функции можно рассматривать как заданные алгоритмически, что значительно упрощает работу с имеющейся оптимизационной моделью.

Такой класс задач ограничивает перечень доступных для применения алгоритмов оптимизации. Конечно, всегда можно применить алгоритм локального поиска или алгоритмы генетического типа, но они не гарантируют нахождения точного решения, и нельзя сказать, насколько найденное решение близко к оптимальному.

При этом во многих практических задачах целевые функции и ограничения обладают одними и теми же свойствами, такими как унимодальность и монотонность. И эти свойства не учитываются при применении универсальных алгоритмов.

Исследуемый в этой работе подход направлен на получение точного решения задачи оптимизации. Реализованный способ ветвления делит ветвь, представляющую собой подкуб пространства бинарных переменных, на большое число ветвей, значительная часть которых сразу же подлежит исключению. Это позволяет быстро уменьшать область, в которой еще может находиться оптимальное решение.

Разработанный алгоритм может применяться и для решения задач больших размерностей. При этом, конечно, не будет доказано, что найденное решение является оптимальным, если еще остаются непросмотренные открытые ветви.

В таком случае этот алгоритм можно рассматривать как улучшение приближенных алгоритмов поиска граничных точек, таких как гриди-алгоритм и случайный поиск граничных точек. И такое улучшение даже на небольшом числе итераций (ветвлений) по-

зволяет значительно улучшить найденное допустимое решение.

В дальнейшем планируется провести исследование работы алгоритма на практических задачах, например, на задаче планирования загрузки производственных мощностей, задаче поиска закономерностей в данных в логических алгоритмах классификации. Интересно сравнение с популярными поисковыми алгоритмами, такими как локальный поиск с мультистар-том и алгоритмы генетического типа.

© Масич И. С., 2013

УДК 519.87

ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ ГИБРИДНЫХ СХЕМ НА БАЗЕ PSO (PARTICLE SWARM OPTIMIZATION) ДЛЯ ОБУЧЕНИЯ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

Е. А. Матвеева, Л. В. Липинский

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Проведено исследование эффективности различных схем гибридизации методов PSO и градиентного метода для обучения ИНС.

Ключевые слова: искусственные нейронные сети (ИНС), PSO, обучение ИНС.

STUDY OF THE EFFECTIVENESS OF HYBRID SCHEMES BASED ON PSO (PARTICLE SWARM OPTIMIZATION) TRAINING ARTIFICIAL NEURAL NETWORKS

E. A. Matveeva, L. V. Lipinski

Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia

A study of the effectiveness of different methods of hybridization PSO and gradient method for training the ANN. Keywords: artificial neural network, PSO, training the ANN.

Метод роя частиц (PSO) [1] принадлежит к семей- - задача выявления заболевания печени (5 призна-ству эволюционных алгоритмов глобальной оптими- ков, 2 класса, выборка объемом 345); зации и является стохастическим, не требующим вы- - задача классификации ирисов (4 признака, числения градиента. Кроме того, этот метод доста- 3 класса, выборка объемом 149).

точно прост в реализации. Поэтому было решено ис- Тестирование осуществлялось стократным прогоном

пользовать его для обучения ИНС. Для улучшения каждого ^ретш. ^ущ^эт™ жгаетет усредненная

сходимости метода было предложено соединить два по всем запускам ошибка юигс^шшцт, т. е. ^фажш-

метода для обучения ИНС: алгоритм глобальной оп- ное в процентах соотношение неправильн° классифици-

тимизации PSO и алгоритм локальной оптимизации - рованных объектов к объему выборки. На каждую схему

выделялось одинаковое количество вычислительных метод наискорейшего спуска (МНС) [2]. Сравнива- „ „„„ „ „ ,

ресурсов - 5 000 вычислений целевой функции, но лись различные схемы гибридизации, которые отли- „с,-. лдтт/^ D

в разных соотношениях для методов PSO и МНС. Все

чались соотношением вычислительных ресурсов, вы- результаты исследования сведены в таблицу.

делятьк га ^ьш метод. Метод PSO1 показал себя лучше, чем PSO2, сле-

В качестве тестовых заДач для проверки работо- довательно, в данном методе важнее увеличивать

способности и производительности алгоритма ис- число частиц, чем итераций алгоритма.

пользовались задачи из репозитория MLDB, данные по результатам исследования, полученный «гиб-

которых подвергались минимальной обработке. Не- ридный» метод оказался эффективнее каждого из ме-

числовые данные заменялись целочисленными клас- тодов в отдельности. Среди гибридных схем выигры-

сами. Для данного исследования были выбраны сле- вает та, в которой большее количество вычислений

дующие задачи: приходится на градиентный метод.

i Надоели баннеры? Вы всегда можете отключить рекламу.