Серия «Математика»
Том 1 (2007), № 1, С. 118-131
Онлайн-доступ к журналу: http://isu.ru/izvestia
ш
УДК 517.977.58, 519.853.4.
Применение нелокальных методов поиска в задачах оптимального управления с приложением в энергетике *
Т. С. Зароднюк ([email protected])
Институт систем энергетики им. Л.А. Мелентьева СО РАН, Иркутск
Аннотация. Предложен подход к решению невыпуклых задач оптимального управления. Приведены результаты тестирования применяемой технологии и ее использования для решения модельной энергетической задачи.
Ключевые слова: оптимальное управление, эвристические алгоритмы, глобальный поиск.
Задачи оптимизации встречаются во многих сферах человеческой деятельности. Из множества возможных вариантов зачастую необходимо выбрать наилучший, поэтому в экономике, управлении, энергетике постоянно возникает потребность в решении подобных задач.
Существует множество публикаций, в которых рассматриваются различные классы оптимизационных задач и методы их решения. Практически все известные алгоритмы поиска оптимального управления в нелинейных системах предназначены для нахождения одного экстремума целевого функционала. В направлении разработки методов исследования невыпуклых задач определенные результаты получены В.Ф. Кротовым [1], В.А. Срочко [2], А.С. Стрекаловским [3], C.A. Floudas [4], I.L. Lopez-Cruz [5] и др. На основе доступных опубликованных материалов можно утверждать, что разработанные к настоящему времени методы поиска глобального экстремума в задаче оптимального управления (ЗОУ) пока недостаточно развиты и не могут служить основой для эф-
Введение
* Работа выполнена при финансовой поддержке грантов РФФИ 06-01-00247, 0607-89215, 07-07-00265а и РГНФ 07-02-12112в.
фективного решения практических задач. Проблема создания методов невыпуклой оптимизации динамических систем продолжает оставаться актуальной. В данной работе предложен подход к численному решению невыпуклых ЗОУ.
1. Постановка задачи
В качестве эталонной выбрана следующая постановка ЗОУ. Динамический процесс описывается системой обыкновенных дифференциальных уравнений с начальными условиями:
х = / (х,и,г), х (¿0) = х0, (1.1)
где г — время из интервала Т = [¿0,^1], х = (х\,х2, ■■■,хп) — вектор-функция фазовых координат, и — управляющее воздействие. Вектор-функция / (х, и, ¿) предполагается непрерывно дифференцируемой по всем аргументам. Допустимыми будем называть кусочно-непрерывные управляющие функции и = и (¿), для любых значений времени принадлежащие множеству и, где
и = {и е К : иг < и < ид}■ (1.2)
Стандартная ЗОУ состоит в поиске допустимого управления и*, доставляющего минимум терминальному функционалу
I (и) = <Р (х (г1)). (1.3)
Функция ф (х) предполагается непрерывно дифференцируемой по х.
2. Технология поиска глобального экстремума в ЗОУ
Технология решения ЗОУ состоит из двух этапов. На первом этапе выполняется редукция ЗОУ к конечномерной задаче безусловной минимизации (БМ) с прямыми ограничениями на оптимизируемые переменные. При этом искомое управление грубо аппроксимируется с помощью кусочно-линейных функций с большим шагом дискретизации. Далее ищется глобальный минимум в поставленной конечномерной задаче с небольшим числом переменных, что позволяет найти грубое приближение к оптимальному управлению. На втором этапе решения строится уточненная аппроксимация управления с использованием полученного на первом этапе приближения в качестве начального. Далее управление уточняется с применением алгоритмов золотого сечения и параболической интерполяции. Общая схема предлагаемого подхода отражена на рис. 1.
ЗОУ
*
Редукция к БМ
i
БМ
Грубая аппроксимация ЗОУ
*
Поиск глобального экстремума
Уточненная аппроксимация ЗОУ
*
Локальный метод
*
Визуализация решения ЗОУ
1
Рис. 1. Подход к решению невыпуклых ЗОУ
Предложенная технология, конечно, не может гарантировать нахождение глобального экстремума в любой задаче, однако в рамках рассматриваемого подхода представляется перспективной для быстрого нахождения управлений из области притяжения глобального экстремума в ЗОУ.
3. Общая схема глобального алгоритма парабол
Вспомогательная задача БМ заключается в поиске минимума невыпуклой функции нескольких переменных g (y) по всем y из множества Y, где Y — m-мерный параллелепипед
ming (y) ,Y = {y € Rm : а < yi < ß,i = 1~m} , (3.1)
V&Y
здесь под y = (yi,y2, ■■■,ym) понимается вектор-функция, координаты которой получены путем дискретизации на равномерной сетке управляющих воздействий u в задаче (1.1)-(1.3), а = щ, ß = ug.
Предлагаемая методика решения рассматриваемой конечномерной задачи основана на комбинации методов парабол для вспомогательной задачи одномерного поиска и метода покоординатного спуска для многомерного поиска. Приведем описание глобального алгоритма парабол [6], [7] для решения задачи БМ, лежащего в основе используемой методики.
Алгоритм 1. На k-м шаге:
1. Фиксируются все координаты функции g (yi, V2, ■■■,Vk, ■■■,Vm), кроме k-ой, где k = 1, m.
2. Генерируется случайная сетка C = {Ci}i=YM такая, что ci = а и
См = ß.
3. В узлах сетки вычисляются значения функции g (yi,V2, ■ ■■, Ci, ■■■,ym).
4. Производится поиск «выпуклых троек» (ci-i, Ci, Ci+i):
Ci-i < Ci < Ci+i =>
g (Vi,V2, ■■;Ci-i, ■■■,Vm) > g (Vi,V2, ■■■,Ci, ■■■,Vm) < g (Vi,V2, ■■■,Ci+i, ■■■,Vm)
5. На отрезках [Ci-i,Ci+i] с помощью локального метода одномерного поиска находится min g (v). Все коордитаны функции g (v),
Vk&[ci-i,ci+i] кроме k-ой, фиксированы.
6. Запоминается наименьшее значение целевой функции, из найденных в каждой «выпуклой тройке» ■
7. Полученная точка (yi,V2, ■■■,V%, ■■■,Vm) выбирается в качестве начального приближения на следующем шаге.
Итерация завершена.
4. Описание основного алгоритма
Технологическая постановка ЗОУ включает, кроме математической постановки, алгоритмические параметры, управляющие работой алгоритмов. Задаются размерность задачи п, отрезок изменения времени Т = ], значение траектории в начальный момент времени Хг (¿о), г = 1,п, прямые ограничения на управление щ < и < ид, система дифференциальных уравнений и вид минимизируемого функционала.
В задаче 4.1 [8] технологическая постановка будет выглядеть следующим образом: п = 2,Т = [0,1.5] Х (0) = 0,Х2 (0) = 0, |и (¿)\< 1,
I X1 = Х2
\ X2 = (2 + XI — Х1Х2 + х2х2)и
I (и) = Х2 (1.5) ^ тгп.
Алгоритмические параметры: количество узлов локальной сетки I = 101, количество узлов глобальной сетки к = 5.
Для получения грубого приближения к оптимальному управлению генерируется сетка {а}^^ из к = 5 узлов (возможно большее число) с постоянным шагом Ьк = (¿1 — ¿о)/(к — 1), такая, что аг = ¿о + Ьк (г — 1), г = 1,к. В качестве начального значения управления выбираются середины допустимого интервала (рис. 2).
Рис. 2. Пошаговое получение грубой аппроксимации оптимального управления в задаче 4.1
В каждом узле сетки {ai}i=Yk осуществляется поиск управления, доставляющего рекордное значение (наименьшее из найденных) исходному функционалу. Таким образом, ЗОУ сводится к задаче БМ (3.1). Пошаговое получение грубого приближения к оптимальному управлению отражено на рис. 2. Для нахождения траекторий, соответствующих управлениям, использовалась программная реализация явного метода Рунге-Кутты, основанная на формулах Дормана-Принса с автоматическим регулированием длины шага [9].
На первом этапе решения рассматриваемой задачи полученное управление ug (t) (рис. 3) доставляет функционалу значение, равное —3.43867. Для численного решения задачи понадобилось менее 1 сек, количество задач Коши — 140. На втором этапе производится локальное уточнение, найденного на первом этапе управления. Генерируется сетка {@i}i=Yl из l = 101 узлов (возможно большее число) с постоянным шагом hi =
(ti — to)/(l — 1) такая, что в = to + hi (i — 1), i = 1, l. Найденная грубая
Ul(t)
1 1 1 1 1 1 Ug(t/ / 1 1 1
у 1 1 1 \ I \ I Х2©\ | \ I \j l l I I I -h
— 1 1 -ч 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 -1-1-
0.00 0.38 0.75 1.13 1.50
Рис. 3. Грубая и уточненная аппроксимации оптимального управления в задаче 4.1.
аппроксимация оптимального управления выбирается в качестве начального приближения, на следующем этапе осуществляется его уточнение (щ (Ь) на рис.3) с помощью локального метода, основанного на комбинации методов золотого сечения и параболической интерполяции. С помощью рассматриваемого подхода удалось получить следующее минимальное значение функционала — I (и*) = —4.04143. Количество задач Коши — 4612, время II этапа решения — 4 сек.
5. Тестирование метода решения ЗОУ
Невыпуклые ЗОУ собраны с учетом требований к тестовым задачам, сформулированных в [10, с. 382]: 1) тесты должны быть унифицированы и общепризнанны; 2) тесты должны моделировать типовые трудности для данного класса задач; 3) решение в тестовой задаче должно быть известно; 4) задачи должны быть достаточно компактными; 5) в качестве тестовых не годятся задачи, дающие преимущества тому или иному методу. Расчеты проводились с помощью программной реализации описанного выше подхода и с использованием программного комплекса OPTCON-I (Горнов А.Ю., Диваков А.О., 1990г., IBM-PC, MS-DOS) [8], основанного на методе мультистарта. Фиксировалось число задач Коши и время, затраченное на решение. Для каждой задачи на общем графике приводились оптимальное управление (пунктирной линией — грубая
аппроксимация, сплошной — уточненная аппроксимация, полученная с использованием локального метода) и соответствующие ему оптимальные траектории (рис.4—рис.9, рис.11). В модельной энергетической задаче дополнительно построены проекции множества достижимости (рис. 10).
Задача 5.1 (SIN-CLASSIC, [8]).
X1 = x2
X2 = u — sin X1
Х1 (0) = 5, Х2 (0) = 0, \и (г) \< 1, г € [0, 5] ,
I (и) = Х2 (5) + х2 (5) ^ тгп.
Решение, полученное с помощью программного комплекса 0РТС0^1 I (и*) = 11.90817 близко к решению рассматриваемого метода I (и*) = 11.91422. Время I этапа решения — менее 1 сек, количество задач Коши — 1929; II этапа — 12 сек, количество задач Коши — 13130.
Рис. 4- Оптимальные траектории и управление в задаче 5.1
Задача 5.2 [11].
х 1 = Х2
Х 2 = и
Х1 (0) = 2, Х2 (0) = —1, \и (г) \< 1, г € [0, 2] ,
I (и) = 0.5 \\х (2) у2 ^ таХ.
Данная задача сводится к эталонной ЗОУ (1.1)-(1.3) путем изменения знака функционала. Известное минимальное значение I (и*) = 6.5
полностью совпало с результатом, полученным с помощью предлагаемого подхода и программного комплекса ОРТСО^Р
Время I этапа решения — менее 1 сек, количество задач Коши — 140; II этапа — 2 сек, количество задач Коши — 2261.
Рис. 5. Оптимальные траектории и управление в задаче 5.2
Задача 5.3.
x 1 = sin x2 + cos t x 2 = (u + t)2
X1 (0) = X2 (0) = 1, \u (t) \< 1, t £ [0, 3] , I (u) = x1 (3) + x2 (3) — min.
Минимальные значения функционалов, найденные разными способами равны: I (и*) = 7.15602. Время I этапа решения — менее 1 сек, количество задач Коши — 855; II этапа — 25 сек, количество задач Коши — 25774.
Задача 5.4 [12].
( x 1 = 3x1 + 2x2 \ x 2 = и
x1 (0) = x2 (0) = 0, \u (t) \< 1, t £ [0,1] , I (u) = x1 (1) • x2 (1) min.
Значение функционала, полученное с помощью OPTCON-I I (u*) = —0.54292 близко к значению, найденному рассматриваемым методом I (u*) = —0.54299. Время I этапа решения — менее 1 сек, количество задач Коши 1955; II этапа — 11 сек, количество задач Коши 13087.
Рис. 6. Оптимальные траектории и управление в задаче 5.3
Рис. 7. Оптимальные траектории и управление в задаче 5.4
Задача 5.5 [2].
Ф (и) = / х (г) (и (г) — 1) (г ^ тгп, о
х = и (г), х (0) = 1, \и (г) \< 1, г € [0,1].
В стандартной форме задача будет иметь вид:
х 1 = и
Х 2 = х1 (и — 1)
Х1 (0) = 1, Х2 (0) = 0, \и (г) \< 1, г € [0,1]
I (u) = x2 (1) ^ min.
Предложенным методом удалось получить следующее рекордное значение функционала: I (и*) = —1.33332 Применение программного комплекса вЕХОС^! привело к результату I (и*) = —1.33333. Время I этапа решения — менее 1 сек, количество задач Коши 218; II этапа — 9 сек, количество задач Коши 8871.
Рис. 8. Оптимальные траектории и управление в задаче 5.5
Задача 5.6 [13].
' X1 = -x2 X 2 = x1 + 2tu X з = u
X1 (0) = X2 (0) = X3 (0) = 0,
-1 < u (t) < 4, t e [0,п] ,
I (u) = x2 (п) + x3 (п) ^ min.
Решение, полученное с помощью программного комплекса OPTCON-I I (u*) = -7.339709 совпадает с точностью до третьего знака с решением рассматриваемого метода I (u*) = -7.339261.
Время I этапа — менее 1 сек, количество задач Коши — 140; II этапа — 4 сек, количество задач Коши — 4145.
иш.х© 4.о
и1(1)
-4.0 -
о.о
-8.0
0.0
1.0
2.0
3.0
Рис. 9. Оптимальные траектории и управление в задаче 5.6
6. Модельная ЗОУ энергетической системой
Одним из традиционных подходов к исследованию энергетических проблем является математическое моделирование с использованием управляемых систем обыкновенных дифференциальных уравнений. Приведем известную модельную энергетическую задачу, рассмотренную в разных источниках [14, с. 204], [15, с.115], [16, стр. 140].
Задача 6.1.
Данная система представляет собой линеаризованную модель простейшей энергосистемы: генератор — шины бесконечной мощности
Х1 (0) = 0.115, Х2 (0) = 1.926, хз (0) = 0.055, \и (г) | < 2.59, г € [0,1.4] ,
Здесь и — ЭДС возбуждения, Х1 — угол ротора генератора по отношению к синхронной оси сдвига фазовой ЭДС и напряжения. В задаче рассматривается возмущенное движение, возникающее во время аварий в электропередаче. Необходимо за время ¿1 = 1.4 привести энергосистему в положение, как можно более близкое к 0. В процессе минимизации рекордное значение функционала 0.002 в [15] получено за время 157 секунд. Решение, найденное средствами вЕХОС^!, на порядок лучше - I (и*) = 0.0005847. В [16] минимальное значение функционала равно
х 1 = х2
Х2 = -6.725x1 - 16.19хз + 0.19394 Хз = -0.066x1 - 0.257хз + 0.19и + 0.017566
I (и) = \\х (1.4)||2 ^ тт.
0.00127. С помощью рассматриваемого подхода удалось получить меньшее значение I (и*) = 0.0005435. Время I этапа решения — менее 1 сек, количество задач Коши — 2010; II этапа — 593 сек, количество задач Коши — 569276.
-г-1-1-1-1-|-1-1-1-1
-4.« -ю -го и .о о.о и
XI
Рис. 10. Проекции множества достижимости в задаче 6.1
7. Заключение
Любой метод поиска глобального экстремума, явно или неявно, включает два этапа: грубый сканирующий поиск экстремума на всем допустимом множестве и точный локальный поиск в тех областях, где вероятнее всего находится глобальный экстремум. Предложенный подход позволяет конструировать вычислительные схемы, вполне удовлетворяющие данным требованиям, и может служить основой для создания эффективных алгоритмов решения невыпуклых задач оптимального управления.
Представленная методика является эвристической и не может дать гарантии нахождения экстремума в любой задаче. Тем не менее, в большинстве решавшихся задач известный из первоисточника глобальный
Рис. 11. Оптимальные траектории и управление в задаче 6.1
экстремум найден. Предложенный подход показал себя работоспособным при решении двадцати невыпуклых ЗОУ, в том числе модельной задачи из области энергетики.
Список литературы
1. Krotov V.F. Global methods in optimal control theory. — N.Y.: Marcel Dekker Inc., 1996. — 348 с.
2. Срочко В.А. Итерационные методы решения задач оптимального управления. — М: ФИЗМАТЛИТ, 2000. — 160 с.
3. Стрекаловский А.С. Элементы невыпуклой оптимизации. — Новосибирск: Наука, 2003. — 356 с.
4. Floudas, C.A. Deterministic Global Optimization: Theory, Methods and Applications; Nonconvex Optimization and its Applications. — Kluwer: Academic Publishers, 2000.
5. I.L. Lopez Cruz, L.G. van Willigenburg, G. van Straten Efficient evolutionary algorithms for multimodal optimal control problems // Journal of Applied Soft Computing. — 2003. — Т. 2, № 3. — С. 97-122.
6. Жилинскас А.Г. Глобальная оптимизация: Аксиоматика статистических моделей, алгоритмы, применения. —Вильнюс: Мокслас, 1986. —168 с.
7. Ершов А.Р., Хамисов О.В. Автоматическая глобальная оптимизация // Журн. Дискретный анализ и исследование операций. — 2004. — Т. 11, № 2. — С. 45-68.
8. Горнов А.Ю., Диваков А.О. Комплекс программ для численного решения задач оптимального управления. Руководство пользователя. —Иркутск, 1990. —27 с.
9. Хайрер Э., Нерсетт С., Ваннер Г. Решение обыкновенных дифференциальных уравнений. Нежесткие задачи: Пер. с англ. —М.: Мир, 1990. —512 с.
10. Поляк Б.Т. Введение в оптимизацию. —М.: Наука, Главная редакция физико-математической литературы, 1983. —384 с.
11. Шаранхаева Е.В., Стрекаловский А.С. О невыпуклой задаче оптимального управления // Сб.трудов Всеросс. Конф. "Оптимизация, управление, интеллект". —2004. — Т. 9, № 2. — С. 10-20.
12. Горнов А.Ю., Данеева А.В. Подход к исследованию невыпуклых задач оптимального управления с параллелепипедными ограничениями. // Вестник Бурятского университета. — Улан-Удэ: Изд-во Бурятского госуниверситета, 2005. — С. 125-131.
13. Васильев О.В., Аргучинцев А.В. Методы оптимизации в задачах и упражнениях. —М: ФИЗМАТЛИТ, 1999. —208 с.
14. Ащепков Л.Т. Оптимальное управление разрывными системами. — Новосибирск: Наука, 1987. —226 с.
15. Тятюшкин А.И. Численные методы и программные средства оптимизации управляемых систем. —Новосибирск: Наука. Сиб. Отд-ние, 1992. —193 с.
16. Батурин В.А., Урбанович Д.Е. Приближенные методы оптимального управления, основанные на принципе расширения. —Новосибирск: Наука. Сиб. предприятие РАН, 1997. —175 с.
T. S. Zarodnyuk
The application of nonlocal search methods to optimal control energetic problems
Abstract. The approach to solution of non-convex optimal control problems has been proposed. The test's collection of the non-convex nonlinear optimal control problems has been created for testing of efficiency the proposed approach. The realized computations confirm an efficiency the proposed algorithm. The approach has been succeeded to find the correct solution of a model power problem.