Научная статья на тему 'Метод разрывной замены времени в задачах оптимального управления гибридными системами с полиномиальными импульсами'

Метод разрывной замены времени в задачах оптимального управления гибридными системами с полиномиальными импульсами Текст научной статьи по специальности «Математика»

CC BY
124
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГИБРИДНЫЕ СИСТЕМЫ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ИМПУЛЬСНОЕ УПРАВЛЕНИЕ / ПОЛИНОМИАЛЬНЫЕ ИМПУЛЬСЫ / СМЕШАННЫЕ ОГРАНИЧЕНИЯ / РАЗРЫВНАЯ ЗАМЕНА ВРЕМЕНИ / OPTIMAL CONTROL / IMPULSIVE CONTROL / POLYNOMIAL IMPULSES / DISCONTINUOUS TIME-REPARAMETERIZATION / MEASURE DIFFERENTIAL EQUATIONS / MIXED CONSTRAINTS

Аннотация научной статьи по математике, автор научной работы — Гончарова Елена Владимировна, Старицын Максим Владимирович

Ставится задача оптимального управления динамической системой с траекториями ограниченной вариации, подчиненной двум типам управляющих воздействий: в динамике участвуют обычное «рассеянное» (измеримое ограниченное) управление и импульсное управление типа борелевской меры, реализующее эффект «полиномиальных импульсов». Модель описывается специального вида дифференциальным уравнением с мерами при ограничениях на односторонние пределы траектории в точках и на интервалах, где сосредоточено импульсное управление (т. н. нестандартные смешанные ограничения [1]). Предложен метод эквивалентного преобразования поставленной задачи к классической вариационной проблеме с абсолютно непрерывными траекториями, что открывает возможности исследования и решения регулярными аналитическими и численными методами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гончарова Елена Владимировна, Старицын Максим Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DISCONTINUOUS TIME-REPARAMETERIZATION TECHNIQUE FOR OPTIMAL CONTROL OF HYBRID SYSTEMS WITH POLYNOMIAL IMPULSES

We formulate a problem of optimal control for a dynamical system with trajectories of bounded variation subject to two types control inputs _ a usual bounded control, and a measure-type impulsive control, whose action results in polynomial impulsive effects. The model is described by a special measure differential equation and is subject to constraints on one-sided limits of a state trajectory, imposed over a set, where an impulsive control measure is concentrated (the so-called nonstandard mixed constraints [1]). We propose a technique for the problem transformation to an equivalent conventional variational problem with absolutely continuous trajectories. The technique can be further used for variational analysis of the original problem by means of regular analytical and numerical methods.

Текст научной работы на тему «Метод разрывной замены времени в задачах оптимального управления гибридными системами с полиномиальными импульсами»

Key words: closed surjective operator; multi-valued contraction mapping; differential equations.

Гельман Борис Данилович, Воронежский государственный университет, г. Воронеж, Российская Федерация, доктор физико-математических наук, профессор кафедры теории функций и геометрии, e-mail: [email protected]

Gel'man Boris Danilovich, Voronezh State University, Voronezh, the Russian Federation, Doctor of Physics and Mathematics, Professor of the Theory of Functions and Geometry Department, e-mail: [email protected]

УДК 519.711

МЕТОД РАЗРЫВНОЙ ЗАМЕНЫ ВРЕМЕНИ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ГИБРИДНЫМИ СИСТЕМАМИ С ПОЛИНОМИАЛЬНЫМИ ИМПУЛЬСАМИ

© Е.В. Гончарова, М.В. Старицын

Ключевые слова: гибридные системы; оптимальное управление; импульсное управление; полиномиальные импульсы; смешанные ограничения, разрывная замена времени. Ставится задача оптимального управления динамической системой с траекториями ограниченной вариации, подчиненной двум типам управляющих воздействий: в динамике участвуют обычное «рассеянное» (измеримое ограниченное) управление и импульсное управление типа борелевской меры, реализующее эффект «полиномиальных импульсов». Модель описывается специального вида дифференциальным уравнением с мерами при ограничениях на односторонние пределы траектории в точках и на интервалах, где сосредоточено импульсное управление (т. н. нестандартные смешанные ограничения [1]). Предложен метод эквивалентного преобразования поставленной задачи к классической вариационной проблеме с абсолютно непрерывными траекториями, что открывает возможности исследования и решения регулярными аналитическими и численными методами.

Настоящая заметка посвящена развитию математического аппарата теории импульсного управления применительно к популярным сегодня моделям «гибридных динамических систем» [2], характеризующимся наличием нескольких вариантов управляемой динамики, переключение между которыми обусловлено текущим фазовым состоянием. Наша цель — распространение метода разрывной замены времени [3] на модели такого типа.

Рассмотрим задачу (Р) оптимального управления дифференциальным уравнением с мерами:

I = ^(х(Т)) ^ Ы,

йх = /0(х,и)М + ^ /я(х,и) Iя М + /р(х, и) х(0-) = хо, (1)

х(г-) еЯ-, х(*) |#|-п.в. * е [0,Т], (2)

И([0,Т]) < м. (3)

В качестве входных данных модели задан следующий набор параметров:

• Т, М > 0 ;

• рациональное число p ^ 1, и конечное множество Q различных рациональных чисел, такое что 0 </ Q , max Q = p , и отображения v ^ vq , q € Q , определены для v < 0 ;

• компактное множество U С Rm ;

• функции fq : Rn х U ^ Rn , q € Q U {0} ,

• начальное состояние xo € Rn , а также

• замкнутые множества С Rn.

Выбор состояния x(t) € Rn системы осуществляется двумя способами — с помощью обычных «ограниченных» управлений и импульсных воздействий. Борелевская функция u : [0, T] ^ U играет роль обычного управления; множество всех таких управлений обозначим Ut . Импульсное управление $ интерпретируется в смысле [4], обобщающем на полиномиальны й случай определение [5], и представляет собой следующий набор функций и мер: $ := (v,^,l, {er,ur}reAv(т)) . Здесь

• v, ^ € C*([0, T], R) суть меры Лебега-Стилтьеса, связанные соотношениями

и < v, Hc = vc, и v([0,T]) < M (4)

(| ■ | означает полную вариацию меры, и |$| = v по определению; непрерывная составляющая vc соответствующей меры есть сумма vac + vsc абсолютно-непрерывной и сингулярной непрерывной компонент разложения Лебега).

• l : [0, T] ^ R — измеримая по Борелю функция со свойством

rt

/ гр(в)^в = ММ), t е [0, т]. (5)

• {ет, ит }т(т) есть (параметризованное атомами меры V) семейство борелевских функций

ет : [0, Тт] м М, ит : [0, Тт] м Мт,

таких что

|ет(в)| = 1, ит(в) е и п.в. в е [0,Тт], (6)

Г Тт

/ ет (в)Йв = ^({г}), (7)

где А^(*) := {т е [0,| V({т}) > 0} и Тт := V({т}).

Отметим, что в данном сейчас определении чётность функции V м vp влечет ^ = V и ет = 1 на [0, Тт] для любого атома т меры V; в то же время из нечётности отображения V м- vp вытекает I = (^ас)1/р , где есть функция распределения меры

Обозначим через Р множество управлений ^ := (и, $) , допустимых в задаче, т.е. удовлетворяющих включению и е Ыт и соотношениям (4)—(7).

Уравнение (1) — не более чем условная формулировка динамической системы с «полиномиальными импульсами» (ниже эта условность будет раскрыта, когда мы введем понятие решения дифференциального уравнения с мерами). В типичном для задач импульсного управления предположении выпуклости годографа системы (1) последняя соответствует

расширению в слабой* топологии пространства функций ограниченной вариации множества решений Каратеодори обыкновенной управляемой системы вида

ж = /о(ж, и) + ^ /я(ж, п)уд, ж(0) = Жо, яеЯ

и € Ыт, V € V,

где V есть множество функций V : [0,Т] ^ М, таких что ^ М1/р.

Смешанные ограничения (2) роднят нашу модель с гибридными системами. Здесь ж(Ь—) обозначает левый односторонний предел функции х в точке Ь € [0, Т] . В литературе по гибридным системам (см., например, [2]) можно встретить трактовку как множеств «переключения» и «назначения». Условие (3) — так называемое ограничение на полный импульс управления.

Модели с аффинной зависимостью от импульсного управления (р = 1) представлены в литературе наиболее широко [3, 6-8]. Случай р = 2 возникает в лагранжевой механике при описании систем с «подвижными ограничениями» [9]. Системы с полиномиальными импульсами — естественное обобщение указанных случаев.

Мы придерживаемся концепции [3] (см. также [5]) решения дифференциального уравнения с мерами в стандартных предположениях липшицевости и подлинейного роста функций /г, входящих в правую часть, а также выпуклости годографа . Траекториями системы (1) называются непрерывные справа функции ж ограниченной вариации на [0, Т] , удовлетворяющие уравнению

х(Ь) = жо + I /о(х(в),и(в)) (в + V [ /а(ж( в), и

(Ь) = жо + / /о(х(в),и(в)) (в + V [ /(ж(в),и(в)) Iя(в) (в +

■]о яеЯ\{р} -]о

+ / /р(ж(в),и(в))^с((в)+ V [Кт(Тт) — ж(т—)].

о

о т еД^ №

Здесь кт , т € Аи(Т) , — решения вспомогательной «предельной» системы

к = /р(К, ит)вт, К(0) = ж(т—).

Существование и единственность решения ж[д] уравнения с мерами (1) при управлении д € Р вытекает из общего результата [3] ввиду сделанных предположений и ограниченности Ь\ -норм функций Ь м- Iя(Ь) , д € \ {р} .

Семейство X = X[д] := {кт}т(т) решений предельной системы назовем пополнением графика траектории ж[д] . Пару а = (ж, д) , где д € Р и ж = ж[д] , будем называть допустимым управляемым процессом. Обозначим через £(Р) множество всех таких пар и предположим, £(Р) = 0 .

Ниже формулируется результат о преобразовании задачи (Р) к стандартной вариационной проблеме с «ограниченными» управлениями и абсолютно непрерывными фазовыми траекториями, обобщающий аналогичный результат из [1] для р = 1. На отрезке времени [0, 5] , 5 ^ Т + 2М , рассмотрим задачу оптимального управления (КР) :

3 = Р(у+(5)) ^ ^,

(

= ар /о(у±,ш)+£ ар-я /3я /я (у±,ш) + 7±вр/р(у±, ш), У±(0) = жо, (8)

яеЯ\{р}

( (

^ = аР, Ъ (П,< )± = ^(вР, 1в|р), С(0)= П±(0) = С±(0) = 0, (9)

у+(5)= у_(5), п+(5) = П_(5), С(5)= Т, (+(5) = С_(5) < М, (10)

С- - С+ < 0, (11)

/ Ф(в)^в = 0, (12)

Jo

и еЩ, (а, в, 7) еА. (13)

Здесь А обозначает множество управлений (а, в, 7) , 7 = (7+,7_) , компоненты которых а, в, 7± : [0, 5] ^ М — измеримые по Борелю функции, отвечающие ограничениям

• (а,в)(в) е К прип.в. § е [0,5] , где К :=со{(а,Ь) е М2| а ^ 0, ар + |Ь|Р = 1} , соА — выпуклая оболочка А;

• 7±($) ^ 0 и 7+(«) + 7_(з) = 1 п.в. на [0,5] .

Вектор состояния преобразованной системы суть (у,С, П, С) , где у = (у+,у_) , п = = (п+, п_) , С = (С+, С_) , причем £(в), п±(в), С±(«) е М+ , у±(в) е Мп (М+ — луч неотрицательных действительных чисел).

Функция Ф в (12) имеет следующий вид

Ф = а{(+ - С_ + ^«}(п+ - п_) + ^«;}(у+ - у_)} + |в|{7+^Г (у_) + 7_^|+(у+)}.

Здесь : X ^ М+ — непрерывная функция, обращающаяся в нуль только на замкнутом подмножестве У конечномерного пространства X.

Заметим, что (ЯР) представляет собой классическую задачу оптимального управления при поточечных фазовых, терминальных и функциональных ограничениях.

По аналогии с задачей (Р) , станем называть набор я = (у, С, П, С, а, в, 7, и; 5) допустимым процессом задачи (ЯР) , если выполнены условия (8)—(13). Множество допустимых процессов обозначим Х(ЯР).

Пусть задан процесс д = («,$) е Р , $ = (V, ^,1, {ет, ит}т(Т)) , задачи (Р) . Определим функцию Т : [0, Т] ^ [0, 5] соотношениями

Т(*) = * + 2v([0,*]), * е [0,Т), Т(Т) = 5,

и обозначим через и : [0, 5] ^ [0, Т] функцию, обратную к Т.

Пусть (а, в, 7) е А такое, что соответствующее решение С задачи Коши (9) удовлетворяет терминальному ограничению (10), а и е . Определим функцию 2 : [0, Т] ^ [0,5] равенствами

з(*) = ы{в е [0,Т]| С(в) > *}, * е [0,Т), Е(Т) = 5.

Операции * ^ Т(*) и * ^ представляют собой разрывную замену времени [3],

соответственно, при прямом « (Р) ^ (ЯР) » и обратном « (ЯР) ^ (Р) » преобразовании задач.

Сформулируем основной результат статьи. Теорема 1. 1) Для любого процесса а е £(Р) существует процесс

я = (у, С, П, С, а, в, 7, и; 5) е Х(ЯР),

у = (у+,у_), п = (п+,п_), С = (С+,С_), 7 = (7+,7_) такой, что выполняются соотношения

и = С на [0, 5]; х = у± о Т, Рм = П± ◦ Т, = С± ◦ Т на [0,Т].

Здесь , Р, есть функции распределения мер; символ « о » используется для обозначения суперпозиции функций.

2) Для любого процесса я е Х(ЯР) найдется процесс а = (х, д) е £(Р), д = (и, $), $ = (V, I, {ет, ит}), удовлетворяющий

у± о 2 = х, п± о 2 = и <± о 2 = Р, на [0, Т].

3) Существование решения одной из задач (Р) и (ЯР) незамедлительно влечет существование решения другой. Для оптимальных процессов а* е а(Р), я * е Х(ЯР) (если они существуют) справедливо

I (а*) = 7 (я *).

Предложенный метод преобразования сводит задачу (P) импульсного управления к классической (не импульсной) проблеме, доступной для регулярного вариационного анализа.

ЛИТЕРАТУРА

1. Goncharova E., Staritsyn М. Optimization of measure-driven hybrid systems //J. Optim. Theory Appl. 2012. V. 153. № 1. P. 139-156.

2. Branicky M., Borkar V., and Mitter S. A unified framework for hybrid control: Model and optimal control theory // IEEE Trans. Automat. Control. 1998. V. 43. № 1. P. 31-45.

3. Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсными управлениями. М.: Наука, 2005.

4. Goncharova E., Staritsyn М. Optimal control of dynamical systems with polynomial impulses // Discr. Cont. Dynam. Syst. 2015. V. 35. № 9. P. 139-156.

5. Arutyunov A., Karamzin D., Pereira F. On constrained impulsive control problems // J. Math. Sci. 2010. V. 165. № 6. P. 654-688.

6. Гурман В.И. Вырожденные задачи оптимального управления. М.: Наука, 1977.

7. Завалищин С.Т., Сесекин А.Н. Импульсные процессы. Модели и приложения. М.: Наука, 1991.

8. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. М.: ФИЗМАТ-ЛИТ, 2000.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Bressan A., Rampazzo F. On systems with quadratic impulses and their application to Lagrangean mechanics // SIAM J. Control Optim. 1993. V. 31. P. 1205-1220.

БЛАГОДАРНОСТИ: Работа выполнена при частичной поддержке РФФИ, проекты № 13-08-00441, 14-08-00606, 14-01-31254.

Поступила в редакцию 26 мая 2015 г.

Goncharova E.V., Staritsyn M.V. DISCONTINUOUS TIME-REPARAMETERIZATION TECHNIQUE FOR OPTIMAL CONTROL OF HYBRID SYSTEMS WITH POLYNOMIAL IMPULSES

We formulate a problem of optimal control for a dynamical system with trajectories of bounded variation subject to two types control inputs — a usual bounded control, and a measure-type impulsive control, whose action results in polynomial impulsive effects. The model is described by a special measure differential equation and is subject to constraints on one-sided limits of a state trajectory, imposed over a set, where an impulsive control measure is concentrated (the so-called nonstandard mixed constraints [1]). We propose a technique for the problem transformation to an equivalent conventional variational problem with absolutely continuous trajectories. The technique can be further used for variational analysis of the original problem by means of regular analytical and numerical methods.

Key words: optimal control; impulsive control; polynomial impulses; discontinuous time-reparameter-ization; measure differential equations; mixed constraints.

Гончарова Елена Владимировна, Институт динамики систем и теории управления им. В.М. Матросова СО РАН, г. Иркутск, Российская Федерация, кандидат физико-математических наук, ведущий научный сотрудник, e-mail: [email protected]

Goncharova Elena Vladimirovna, Matrosov Institute for System Dynamics and Control Theory of SB RAS, Irkutsk, the Russian Federation, Candidate of Physics and Mathematics, Leading Researcher, e-mail: [email protected]

Старицын Максим Владимирович, Институт динамики систем и теории управления им. В.М. Матросова СО РАН, г. Иркутск, Российская Федерация, кандидат физико-математических наук, научный сотрудник, e-mail: [email protected]

Staritsyn Maxim Vladimirovich, Matrosov Institute for System Dynamics and Control Theory of SB RAS, Irkutsk, the Russian Federation, Candidate of Physics and Mathematics, Researcher, e-mail: [email protected]

УДК 517.97

РЕГУЛЯРИЗОВАННЫЙ ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА В ОПТИМАЛЬНОМ УПРАВЛЕНИИ ДЛЯ ПАРАБОЛИЧЕСКОГО УРАВНЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ В ЛЕБЕГОВЫХ

ПРОСТРАНСТВАХ

© А.А. Горшков

Ключевые слова: оптимальное управление; параболическое уравнение; двойственная регуляризация; устойчивость; поточечное фазовое ограничение; лебегово пространство; принцип Лагранжа; принцип максимума Понтрягина.

Рассматриваются устойчивые к ошибкам исходных данных секвенциальные принцип Лагранжа и принцип максимума Понтрягина в выпуклой задаче оптимального управления со строго равномерно выпуклым целевым функционалом, распределенным управлением и поточечными фазовыми ограничениями для параболического уравнения. Распределенные управления считаются принадлежащими лебегову пространству суммируемых с р -той степенью функций при р € (2 + то) . Образы задающих поточечные фазовые ограничения операторов вкладываются в лебегово пространство суммируемых с в-той степенью функций при в € (1, 2).

Введение. Задачам оптимизации и, в частности, условной оптимизации, характерны различные проявления неустойчивости [1]. В случае достаточно сложных реальных задач, когда их исходные данные могут задаваться с погрешностью, а процесс решения задач неразрывно связан с применением приближенных методов, проблемы неустойчивости являются центральными, требующими их обязательного учета. Указанная неустойчивость оптимизационных задач, в свою очередь, порождает и «неустойчивость» классических условий оптимальности, в частности, таких, как принцип Лагранжа, принцип максимума Понтрягина. Это проявляется в выделении классическими условиями оптимальности сколь угодно далеких «возмущенных» оптимальных элементов от их «невозмущенных» аналогов при сколь угодно малых возмущениях исходных данных задач [2]. Указанные проблемы неустойчивости характерны и для рассматриваемой ниже задачи оптимального управления с поточечными фазовыми ограничениями для линейного параболического уравнения, а также для соответствующих классических условий оптимальности для нее — принципу Лагранжа и принципу максимума Понтрягина.

i Надоели баннеры? Вы всегда можете отключить рекламу.