Достаточные условия оптимальности для задач оптимального управления логико-динамическими системами

Малтугуева Надежда Станиславовна

ШБН 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ № 1(5), 2011, с. 63-70 УДК 517.977

Н. С. Малтугуева

Достаточные условия оптимальности для задач оптимального управления логико-динамическими системами

Аннотация. В работе рассматриваются логико-динамические системы — особый класс дискретно-непрерывных управляемых систем. Дискретная компонента в этих системах представляет собой целочисленную функцию, которая имеет конечное число точек разрыва. Для такого рода систем ставится задача оптимального управления. Рассматриваемая задача отличается от классической задачи оптимального управления тем, что в правых частях дифференциальных уравнений и функционале имеются дискретные переменные. В работах А.С. Бортаковского приводятся достаточные условия оптимальности, доказанные для функции Беллмана. Но эта теорема верна для любой функции Кротова, что и доказано автором этой работы. Также в статье описан подход к построению вычислительных процедур для данной задачи.

Ключевые слова и фразы: оптимальное управление, достаточные условия оптимальности.

Введение и постановка задачи

В работе рассматривается особый класс дискретно-непрерывных систем, так называемые логико-динамические системы (ЛДС). В таких системах наряду с непрерывными переменными в правых частях дифференциальных уравнений и целевом функционале присутствуют дискретные переменные — кусочно постоянные функции с конечным числом точек разрыва.

Итак, перейдем к постановке задачи.

На фиксированном отрезке времени Т = [¿0,^1] определены непрерывная и кусочно дифференцируемая вектор-функция х(Ь) € Д”,

Работа выполнена при финансовой поддержке РФФИ (проект 10-01-90720-моб_ст).

кусочно непрерывная вектор-функция п(Ь) € Дт, и кусочно постоянная вектор-функция у(Ь) € О С Zт, непрерывная справа, с конечным числом точек разрыва; х(£) и у(£) называются траекториями динамической и логической частей ЛДС соответственно. Пусть у(£ — 0) —предыдущее состояние логической части ЛДС. Функции х(£), у(£), п(Ь) подчиняются следующим соотношениям: пх

(1) ^ = I (г,х(г),у(г),п(г)),

(2) у(Ь) € У(*,х(*),у(* — 0)),

(3) и(г) € и, t € Т,

(4) х(^) = хо, у (г о — 0) = уо.

Отображение У : Т х Д” х О ^ 2П описывает логику дискретных переходов, О — конечное множество состояний дискретной компоненты, множество и С Д” компактно, функция I(¿, х, у) кусочно непрерывна по ¿, непрерывна по х и и вместе с частными производными при всех значениях у € О. Множество троек (х(£), у(£), и(£)), удовлетворяющих перечисленным условиям, называется множеством допустимых и обозначается Б. Полагается, что Б = 0. На множестве Б определен функционал вида

¿1

I (х(-),у(-),и(-)) = Д (х(*1),у(*1))+ / 1о^,х^),у^),и^))(*+

(5) + ^g0(r,x(r),y(r),y(r - 0)).

Т

Здесь функция F : Д” х П ^ Д непрерывна по x, f0 : T х Д” х П х Дт ^ Д кусочно непрерывна по t, непрерывна по x и u, g0 — ограничена. Функционал (5) требуется минимизировать, т.е. необходимо найти последовательность {(xs(t), ys(t),us(t))} С D такую, что I(xs, ys, us) ^ inf I. Таким образом, ставится задача о поиске последовательности {(xs,ys,us)} С D, на которой I(xs,ys,us) ^ inf I

при s ^ то. Такую последовательность называют минимизирующей. Если существует элемент (x*(t),y*(t),u*(t)) G D такой, что I(x*,y*,u*) = inf I, то его называют оптимальным процессом.

Задачи в такой постановке рассматриваются в работах [1,2].

1. Достаточные условия оптимальности

Введем класс функций y>(t, x, y) непрерывных по x, кусочно непрерывных по t, имеющих непрерывные частные производные по t и x за исключением конечного числа точек t G T, который обозначим Ф. Определим следующие конструкции:

R(t, x, y, u) = ^.(t, x, y)f (t, x, y, u) - f 0(t, x, y, u) + ^ (t, x, y),

G(x, z) = F(x, z) + y>(ti, x, z) - ^(to, xo, yo),

Q(t, x, y, u) = y>(t, x, y) - y>(t - 0, x, v) - go(t, x, y, v), u(t) = sup max max max R(t, x, y, u),

x vEY- yEM(t,x,v) uEU

q(t) = sup max max Q(t,x,y, v),

x vEY- yEY(t,x,v)

m = inf min G(x, z),

x zEYf -

здесь M(t, x, v) = < y : y = arg max Q(t, x, y, v) > ;

[ yEY (t,x,v) J

Y_ = Y(t,x(t),y(r - 0)); т это точка разрыва функции y(-); Yf_ = Y(ti,x(ti),y(ti -0)); ^(-) —кусочно непрерывная, а q(^) —кусочно постоянная функция на отрезке T; z = y(ti), y = y(t), v = y(t - 0),

t G [to, ti].

И определим функционал

tl

L(x(-),y(-),u(-)) = G(x(ti),y(ti)) - J R(t, x(t), y(t), u(t))dt-

to

tl

(6) - J Q(t,x(t),y(t),y(t - 0))d0(t),

to

где 0(t) —монотонная функция скачков в конечном числе точек разрыва функции y(t). В каждой точке разрыва величина скачка равна единице: 0(£) = 0(£ - 0) + 1. Функционал L определен на более широком множестве E, которое получается из D отбрасыванием дифференциальной связи. Отметим, что на множестве D функционалы L и I совпадают. Действительно,

L(x(-),y(-),u(-)) = F(x(ti),y(ti)) + y>(ti,x(ti),y(ti)) - ^(to,xo,yo)-

¿1

- J (у4(4, х у)/(^жу, и) - /0(^жу, и) + <^(г,х у^-

¿0

¿1

- J (^(¿,ж, у) - - 0, х, V) - до(4,ж,у, V))й0(£).

¿0

Так как (ж(4), у(4), м(£)) € Б, то Ж = /(4, ж, у, и).

Для каждого у € О верно следующее:

------^------ = ^ЖЖ + ^ = ^Ж/(4, X У, и) + ^.

Учитывая это равенство и то, что 0(4) —монотонная функция скачков в конечном числе точек разрыва функции у(4), Ь(ж, у, и) можно переписать в виде

Ь(ж,у,м)) = Б(ж^Ду^)) + у>(гь ж^Ду^)) - ^(¿о,жо,уо)-

¿1

-^(¿1,ж(41),у(41)) + ^(¿о,жо,уо)^У /о(4, ж,у, м)^+

¿0

+ 53 до(т,ж(т ),у(т ),у(т - 0)) =1 (ж,у,м).

т

Итак, достаточные условия оптимальности формулируются следующим образом [2]:

Теорема. Пусть имеется последовательность |(жя,уя,мя)} С Б и функция у>(£, ж, у) такие, что:

¿1

1. У (Д(г,ж8(г),у8(г),и8) - ^(¿)) л ^ о,

¿0

¿1 ¿1

2. J ф(г,ж8(г),у8(г),у8(г - о))^0(г) ^д(г)л ^ 0;

¿0 ¿0

3. С(жя(£1 ), ув(41)) ^ т, при в ^ то.

Тогда последовательность |(жя,уя,мя)} — минимизирующая, и всякая минимизирующая последовательность удовлетворяет условиям 1-3.

Доказательство. Доказано, что L(x, y, u) = I(x,y,u) при (x, y,u) € D. Пусть l = inf L. По определению m, q, ^(t)

E

ti ti

l = m — j ^(t)dt — j q(t)dt.

to to

Тогда {(xs(t),ys(t),us(t))} С D — минимизирующая последовательность.

Докажем второе утверждение. Так как доказано, что I = L на D и l = inf I , то L ^ l на любой минимизирующей последовательности

{(xs,ys,us)} С D . Так как L > l, то для этого необходимо выполнение условий 1-3.

Теорема доказана.

2. Подходы к построению вычислительных процедур

В данной работе построение вычислительных процедур основывается на принципе расширения. Принцип состоит в замене исходной задачи (D,I) другой, более простой задачей (A, L), которая и дает решение исходной.

Пусть u1, u — допустимые процессы (u1 € D, и € D). Задача улучшения может быть сведена к задаче оптимизации. Для этого введем в рассмотрение положительно определенный функционал J(и1, и), такой, что J(и1, и1) = 0, J(и1 , u) > 0 при u = и1, тогда

J(и1, u1) = inf J(и1, и).

D

Составим комбинацию

Ia(u) = а1 (и) + (1 — a) J(и1, и), а € [0,1],

и рассмотрим задачу улучшения и минимизации Ia(u). Пусть существует u(a) такое, что u(a) = argminIa(u). Обозначим

¿(a) = I (u(a)), j (a) = J (и1 , u(a)),

ia(a) = Ia(u(a)) = min Ia (u).

Отметим некоторые свойства введенных конструкций:

1) Ia(uJ) = min Ia(u), если I(u1) = min I(u);

2) I(u11) < I(u1), если Ia(u11) < Ia(u1);

3) существует такое а < 1, что /(и(а)) < /(и1), если и1 = argmin/, и функции ¿(а) и j(a) непрерывны.

Первые два свойства очевидны, докажем третье. При а = 1 имеем ¿а(а) = min/ < /а(и7). Из непрерывности ¿(а), j(a) следует, что

функция ¿а(а) также непрерывна. В силу непрерывности ¿а(а) последнее неравенство сохраняется и при некотором а < 1, то есть /а(и(а)) < /а(и7), и последнее утверждение следует из п. 2.

В работе также использована идея, наверное, впервые появившаяся в работе [3]. В них предложены методы, основанные на разложении до второго порядка включительно функции Беллмана и левой части уравнения Беллмана. Для обеспечения близости соседних приближений предлагается применять процедуру не на всем отрезке [to,ti], а на последней его части [£, ti], при этом £ выступает в алгоритме как регулятор.

Итак, введем понятие возмущенного функционала.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть

5

/i0,5(x(-),y(-),u(-)) = J f 0(t,x(t),y(t),u(t))dt+

to

+ ^ д0(т,х(т),у(т),у(т - 0))

T e[to,5]

5

I5,tl (x(-),y(-),u(-)) = F(x(ti),y(ti)) +У f0(t,x(t),y(t),u(t))dt+

to

+ ^ g0(r,x(r),у(т),у(т - 0))

T e[5,ti]

/«’tl (x(-),y(-),u(-)) = а/5’tl (x(-),y(-),u(.)) + (1 - а)7 (и1 ,u), где t0 < £ < ti, а e [0, 1].

Отметим, что /(x, y, u) = /to’5(x, y, u)+/5,tl (x, y, u); I^1 (x, y, u) = /(x,y, u), при а =1; I^1^1 (x,y,u) = а/5^1 (x, y, u). Функционал I^1^1 называется возмущенным функционалом по отношению к /.

Итак, при построении алгоритмов рассматривается возмущенная задача. Для нее строится функционал Лагранжа, функция Кротова задается в классе линейных и линейно-квадратичных по непрерывной компоненте фазового вектора функций с коэффициентами, зависящими от дискретной составляющей. Приращение функционала

Лагранжа в случае линейной функции Кротова разлагается в ряд Тейлора до слагаемых первого порядка, а в случае квадратичной -до второго порядка. В результате получаются системы дифференциальных уравнений на коэффициенты функции Кротова, зависящие от целочисленной переменной. Эти уравнения составляют основу методов последовательного улучшения. Принципиальная схема метода состоит в следующем. Задается начальное приближение, «справа-налево» интегрируется при заданных параметрах алгоритма система для коэффициентов разложения функции Кротова при различных целочисленных переменных. Интегрируется в прямом времени исходная система дифференциальных уравнений, замкнутая синтезом управления. Если улучшения функционала не произошло, то изменяются параметры алгоритма и процесс интегрирования повторяется. Более подробно методы описаны в работах [4-6].

3. Заключение

В работе приведены достаточные условия оптимальности в форме Кротова для задач оптимального управления логико-динамическими системами, описан один из возможных подходов к решению поставленной задачи.

В дальнейшем планируется улучшение полученных алгоритмов и расширение круга задач, для которых данные алгоритмы могут применяться. А также планируется решение прикладных задач.

Список литературы

[1] Бортаковский А. С., Пантелеев А. В. Достаточные условия оптимальности управления непрерывно-дискретными системами // Автоматика и телемеханика, 1987, № 7, с. 47—52. Т[]

[2] Бортаковский А. С. Достаточные условия оптимальности управления детерминированными логико-динамическими системами. — М. : ВНИМИ, 1992, № 2-3, с. 16-22. Т[], 1

[3] Jacobson D. H. New second-order and first-ofder algorithms for determining optimal control. A differential programming approach // Optimization Theory and Applications, 1968. 2, no. 4, p. 411-440. |2

[4] Baturin V., Goncharova E., Maltugueva N. Algorithms for Optimal Control of Logic-Dynamic Systems // Proc. of the European Control Conference 2007 (ECC’07), July 2-5, Kos, Greece, 2007. |2

[5] Батурин В. А., Малтугуева Н. С. Метод слабого улучшения первого порядка для задач оптимального управления логико-динамическими системами // Известия Иркутского гос. университета. Математика. — Иркутск : Изд-во ИГУ, 2009. Т. 2, № 1, c.83-93. Т

[6] Батурин В. А., Гончарова Е. В., Малтугуева Н. С. Итеративные методы решения задач оптимального управления логико-динамическими системами // Изв. РАН. Теория и системы управления, 2010, № 5, c.51—59. |2

N. S. Maltugueva. Sufficient conditions of optimality for optimal control problems of logic-dynamic systems.

Abstract. This article deals with logic-dynamic systems, it’s a special class of discrete-continuous control systems. Discrete component in these systems is an integer-valued function, which has a finite number of discontinuity points. The optimal control problem is formulated for this kind of systems. The problem under consideration differs from the classical optimal control problem that the right-hand sides of differential equations and functional have the discrete variables. In articles of A.S. Bortakovskii sufficient conditions of optimality are proved for the Bellman function. But this theorem is true for any function Krotov, and the author of this work showed this. Also in the article it’s described an approach to the construction of computational procedures for this problem.

Key Words and Phrases: control systems, nonlocal improvement.

Образец ссылки на статью:

Н. С. Малтугуева. Достаточные условия оптимальности для задач оптимального управления

логико-динамическими системами // Программные системы: теория и приложения : электрон. научн. журн. 2011. № 1(5), с. 63-70. URL: http://psta.psiras .ru/read/psta2011_1_63-70.pdf

Достаточные условия оптимальности для задач оптимального управления логико-динамическими системами Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Малтугуева Надежда Станиславовна

Похожие темы научных работ по математике , автор научной работы — Малтугуева Надежда Станиславовна

Sufficient conditions of optimality for optimal control problems of logic-dynamic systems

Текст научной работы на тему «Достаточные условия оптимальности для задач оптимального управления логико-динамическими системами»