Научная статья на тему 'О достаточности принципа максимума Понтрягина в не которых оптимизационных задачах'

О достаточности принципа максимума Понтрягина в не которых оптимизационных задачах Текст научной статьи по специальности «Математика»

CC BY
138
26
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Никольский М. С.

В статье для оптимизационных задач с фиксированным временем рассмотрены два вида краевых условий: 1) левый конец фиксирован, правый конец свободен; 2) на концевые условия наложены ограничения типа равенства и неравенства. Для обоих видов краевых условий получены достаточные условия оптимальности принципа максимума Понтрягина. Основными требованиями являются требования вогнутости и выпуклости функций, участвующих в формулировке принципа максимума Понтрягина. Произведено сравнение двух типов достаточных условий оптимальности, полученных в статье. Рассмотрены некоторые примеры

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Никольский М. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О достаточности принципа максимума Понтрягина в не которых оптимизационных задачах»

но амплитуда осцилляций интенсивности в два раза меньше.

5. Выводы. Приведенные в работе результаты демонстрируют принципиальную роль, которую играет спектральный инвариант при компьютерном моделировании распространения фемтосекунд-ного импульса в оптическом волокне на основе уравнения КНУШ. Отсутствие консервативности разностной схемы по этому инварианту может привести к неограниченному росту сеточного решения рассматриваемой задачи. При этом уменьшение шагов сеток для некоторых условно-консервативных схем не устраняет, а, наоборот, усиливает проявление неустойчивости на частоте возмущения I/7.

Спектральный инвариант описывает изменение в среде спектральной гармоники именно на этой частоте и показывает, что она не должна возрастать в процессе распространения светового импульса. Тем самым он является неотъемлемой частью математической модели, применяемой для адекватного описания распространения фемтосекундного импульса в рамках КНУШ.

Введенное в начальное распределение возмущение может появиться в процессе расчетов непосредственно из-за ошибок округления, в результате чего при определенных шагах сеток будут иметь место описанные выше закономерности на более длинных трассах распространения.

СПИСОК ЛИТЕРАТУРЫ

1. Ахманов С.А., Выслоух В. А., Чирки н А. С. Оптика фемтосекундных лазерных импульсов. М.: Наука, 1988.

2. Агравал Г. Нелинейная волоконная оптика. М.: Мир, 1996.

3. Трофимов В. А. К вопросу об инвариантах нелинейного распространения фемтосекундных импульсов // Изв. вузов. Радиофизика. 1992. 35. № 6-7. С. 618-621.

4. Трофимов В.А. О новом подходе к моделированию нелинейного распространения сверхкоротких лазерных импульсов // ЖВМиМФ. 1998. 38. № 5. С. 835-839.

5. Варенцова С.А., Волков А.Г., Трофимов В.А. Консервативная разностная схема для задачи распространения фемтосекундного лазерного импульса в кубично нелинейной среде // ЖВМиМФ. 2003. 43. № 11. С. 1709-1721.

6. Самарский A.A. Теория разностных схем. М.: Наука, 1989.

7. Выслоух А. В., Иванова И. С., Магницкий С. А., Трофимов В. А. Модуляционная неустойчивость световых пучков и импульсов при их распространении в поглощающих средах // Оптика и спектроскопия. 2000. 88. № 3. С. 456-464.

Поступила в редакцию 24.12.03

УДК 519.6

М. С. Никольский

О ДОСТАТОЧНОСТИ ПРИНЦИПА МАКСИМУМА ПОНТРЯГИНА

В НЕКОТОРЫХ ОПТИМИЗАЦИОННЫХ ЗАДАЧАХ1

(кафедра оптимального управления факультета ВМиК)

В математической теории оптимального управления одним из важных и интересных вопросов является вопрос о достаточности принципа максимума Понтрягина (см., например, [1-12]). В настоящей статье мы рассматриваем этот вопрос для задач с фиксированным временем и с различными концевыми условиями.

1 Работа выполнена при поддержке РФФИ (проекты 02-01-00334, 03-01-00474).

Пусть движение управляемого объекта описывается уравнением вида (см. [1])

x = f(x,u), (1)

где х G Д", и G U С Rr ■ Условимся через Rk обозначать /г-мерное действительное арифметическое пространство, элементами которого являются упорядоченные наборы из к чисел, записываемые в виде столбцов. Скалярное произведение произвольных векторов х, у из Rk определяется формулой

к

(Х'У) = ^2ХгУг, ¿ = 1

где Xi, yi — компоненты векторов х, у соответственно.

В дальнейшем предполагается, что U — непустой компакт из Rr и что векторная функция /(ж, и) определена и непрерывна по совокупности переменных на R" X U, а также непрерывно дифференцируема по компонентам вектора х там же. Фиксирован временной отрезок А = [О, Г], где Т > 0. Движение вектора x(t) (см. (1)) происходит под воздействием измеримых управлений u(t) Е U, t Е А. Соответствующие решения x(t) рассматриваются в классе абсолютно непрерывных функций.

А. Сначала мы рассмотрим более простой тип краевых условий: фиксировано начальное условие

ж(0) = жо, (2)

а правый конец х(Т) свободен. На измеримых управлениях u(t) G С/, t G [О, Г], минимизируется интегральный функционал

т

!«•)) = j f(x(s),u(s))ds, (3)

о

где функция /°(ж,и) определена и непрерывна по совокупности переменных на Rn X U, а также непрерывно дифференцируема по компонентам вектора х там же. Интеграл в (3) понимается в смысле Лебега.

Пусть измеримое управление u(t) G С/, t G А, является оптимальным в рассматриваемой оптимизационной задаче. Обозначим через x(t) соответствующую оптимальную траекторию уравнения (1) с начальным условием (2). Согласно принципу максимума (см. [1]), для оптимальной пары функций и(-), х(-) и соответствующего ей решения ф{£) сопряженного линейного уравнения

ф = -Нх{ф,хЦ),Щ) (4)

с концевым условием

ф(Т) = 0 (5)

почти всюду на А выполняется соотношение максимума

H(ij(t),x(t),u(t)) = maxH(i}(t),x(t),u), (6)

udU

где

Н(ф,х,и)=(фЛх,и))-/°(х,и). (7)

Отметим, что в (4) через Нх(ф,х,и) обозначается градиент функции Н(ф,х,и), вычисляемый по х при данных ф, и.

Рассмотрим теперь следующую ситуацию: измеримое управление u(t) G С/, t G А, и соответствующее ему решение x(t) начальной задачи (1), (2) вместе с функцией ф(Ь), являющейся решением краевой задачи (4), (5), почти всюду на А удовлетворяет соотношению максимума (6) (т.е. u(t) является экстремальным управлением, удовлетворяющим необходимым условиям оптимальности Понтрягина). Мы хотим получить достаточные условия для оптимальности и(-), т.е. хотим, чтобы для произвольного измеримого управления u(t) G С/, t G А, для которого соответствующее решение x(t) начальной задачи (1), (2) продолжимо на весь отрезок А, выполнялось неравенство

т

Д/ = J(f(x(s),u(s))-f(i(s),ti(s)))ds^ 0. (8)

Желая как-то использовать функцию Н(ф,х,и) (см. (7)) для получения достаточных условий оптимальности, различные авторы, исходя из равенства

т

/d

— {(4>{s),x{s) - x{s))) ds = О,

о

получают следующую формулу (см. (7), (8)):

т

-А/ = J(H(jj(s),x(s),u(s)) - H(4>(s),x(s),ü(s)) + (i(s),x(s) - x(s))) ds, (9)

o

верную при любом измеримом управлении u(t) Е U, t Е А, для которого соответствующее решение x(t) начальной задачи (1), (2) продолжимо на весь отрезок А. Теперь можно попытаться обеспечить неравенство (ср. с (8))

-А/ íC 0 (10)

с помощью добавочных условий на функции f(x,u), f°(x,u), H(ip(t),x,u). В теоремах 1, 2 содержатся различные типы таких условий. Эти условия основаны на использовании вогнутости некоторых функций.

Наша приведенная далее теорема 1 вытекает из следствия (см. [12, с. 203, теорема 5.4.2]). Но мы все же докажем ее, так как доказательство упомянутого следствия лишь намечено в [12]. Обозначим

V(t)= IJ x(t,u(-)), (11)

и{-)е 21

где 51 — совокупность измеримых управлений u(t) Е U, t Е А, для которых соответствующее решение x(t,u(-)) начальной задачи (1), (2) продолжимо на весь отрезок А. Обозначим через E(t), t Е (О, Г], некоторое выпуклое открытое множество из R", которое содержит множество T>(t) (см. (11)) при t Е (О, Г], т.е. оценивает его сверху:

V{t)cE{t) Vi G (О, Т].

Отметим, что в качестве E(t) может выступать и все пространство R".

Напомним, что функция h(z), определенная на выпуклом множестве Z из линейного пространства S, называется вогнутой, если функция — h(z) выпукла на Z. Для вогнутых функций имеет место много полезных фактов, которые естественным образом вытекают из результатов выпуклого анализа (см., например, [5, 8, 13, 14]).

Важным свойством выпуклой функции h(z), определенной на открытом выпуклом множестве Z С Rk, является выполнение неравенства

h(z) - h(z0) ^ (a, z - z0), (12)

где zq Е Z — фиксированный вектор из Z, z — произвольный вектор из Z и а — некоторый элемент из субдифференциала dh(zo) (определение и свойства см., например, в [5, 8, 13, 14]). Важным фактом выпуклого анализа является непустота множества dh(zo). Для вогнутой функции k(z) = —h(z) из (12) при тех же z, zq, а вытекает неравенство

k(z) — k(z0) ^ ( — a, z — z0). (13)

Векторы —а образуют супердифференциал dsupk(zo) = —dh(zo). Обозначим (см. (7)) при t Е А, х Е R"

M(t,x) =тахН(ф(г),х,и). (14)

udU

Теорема 1. Пусть: 1) тройка функций ü(t), x(t), ф{£) удовлетворяет условиям принципа максимума при t Е А; 2) U — выпуклое множество; 3) функция Н(ф(Ь),х,и) вогнута по (х,и) на множестве E(t) X U при t Е (О, Г]. Тогда управление ü(t) оптимально.

Доказательство. Фиксируем некоторое t G (О, Г], для которого выполнено условие максимума (6) и равенство (4) для ф{£). Отметим, что такие t образуют множество полной меры на А. При произвольном измеримом управлении и (s) G U, s G A, из множества 51 и соответствующем решении ж (s) начальной задачи (1), (2) с помощью формулы (14) получаем неравенство

H(ï>(t),x(t),u(t)) - H(ï>(t),x(t),û(t)) ^ M(t, x(t)) - M(t, x(t)). (15)

Покажем, что функция M(t,x) (см. (14)) является вогнутой на множестве E(t). Действительно, функция H(ip(t),x,u) вогнута по (ж, и) на E(t) X U. Поэтому (см., например, [14]) ее подграфик G\ С E(t) X U X R1 является выпуклым множеством. Рассмотрим также подграфик функции M(t, х) С?2 С E(t) XR1. Введем оператор проектирования 7Г, который точке (у, и, a) G Rn xUxR1 сопоставляет точку (у, а). Нетрудно видеть, что для подграфиков функций Gi, Gi имеет место равенство Gi = tïG\. Отсюда вытекает выпуклость подграфика Gi и, следовательно (см. [14]), вогнутость функции M(t,x) по ж G E(t) при рассматриваемом t G (О, Г]. Из вогнутости функции M(t, ж) при ж G E(t) вытекает неравенство (см. (13))

M{t, ж) - M{t, ж(£)) ^ (6, ж - x(t)), (16)

где вектор b G R" и является элементом супердифференциала по ж ô®up M (t, ж (t)) в точке x(t). Отметим, что этот же вектор b должен быть элементом супердифференциала

так как выполняется неравенство

H(î)(t), ж, m(î)) - H(ip(t),x(t),û(t)) ^ M{t, ж) - M{t, x(t)). В силу гладкости по ж функции H(ip(t),x,û(t)) имеет место равенство

d™PH(ï>(t),x, û(t)) = ffx(^(t),x(t),û(t)).

Таким образом,

d?*(M(t,x(t))) = Hx(r/>(t),x(t),û(t)). (17)

Из сказанного вытекает (см. (4), (15)—(17)), что

H($(t),x(t),u(t)) - H($(t),x(t),u(t)) ^ (~^(t),x(t) - x(t)). Отсюда и из (9) получаем искомое неравенство (Ю)2.

Замечание. Из доказательства теоремы 1 вытекает (см. (17)), что супердифференциал dxupM(ifi(t), ж) в исследуемой точке ж (t) является одноточечным множеством и, следовательно (см. [8, 13, 14]), функция M(t, ж) дифференцируема в точке ж (t), причем такие t образуют множество полной меры на А.

В формулировке и доказательстве следующей теоремы использованы некоторые соображения и результаты из [10, 11].

Теорема 2. Пусть: 1) тройка функций ù(t), ж (t), ф{£) удовлетворяет условиям принципа максимума при t G А; 2) функция M(t, ж) вогнута по ж G E(t) Vi G (О, Г]; 3) функция M(t, ж) дифференцируема по х в точке ж (t) при почти всех t G (О, Г]. Тогда управление ù(t) оптимально. Доказательство. Из формул (9), (14) следует неравенство

т

« /.мс, m - m)+<&.>.»<.> - *w>» (ад

о

где и (s) G U, s G А, — произвольное управление из множества 51, ж (s) — соответствующее ему решение начальной задачи (1), (2). Отметим, что при сделанных предположениях при данных (t, ж) и

2При доказательстве теоремы 1 большую помощь автору оказал Ю. С. Ледяев.

данном векторе I Е Я" функция М(£, ж) (см. (14)) имеет производную по направлению I М/(£,ж), для которой справедлива формула (см. [15])

М1(Ь,х)= шах (Нх(ф(г),х,и),1), (19)

иеп(ь,х)

где

0(£,ж)=Ащта хН(ф(г),х,и). (20)

иви

Пусть при данном £ Е А функция М(£, ж) дифференцируема в точке по ж и М{Ь,х{£)) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= Н(ф(Ь), (такие t, согласно сделанным предположениям, образуют множество полной меры

на А). Тогда для М/(£, ж(£)) помимо формулы (19) можно записать следующее представление:

М1{11Щ) = {МХ{11Щ)11). (21)

Применяя аппарат опорных функций из выпуклого анализа (см., например, [13]) и формулы (19)—(21), нетрудно показать, что при рассматриваемом 4 Ё А множество

Р{1)= и нх(ф(г),х(г),и) (22)

является одноточечным и совпадает с точкой причем

нх{ф{г),х СО, ¿СО) = мх(м(*))-

Из сказанного и (4) вытекает, что почти всюду на А

¿(*) = -Мх(М(*)). (23)

Используя свойства вогнутых функций (см. неравенство (13)) и формулу (23), при произвольной допустимой функции сравнения х (в) можно утверждать, что подынтегральное выражение в (18) почти всюду на А неположительно. А этого достаточно, чтобы гарантировать неравенство (10), к которому мы стремимся.

Среди требований теоремы 2 мы специально изучим требование 3, считая, что требования 1, 2 выполнены. Дело в том, что в доказательстве теоремы 2, по существу, используется лишь следующее включение, выполняющееся почти всюду на А:

Е 3Х(-М(М(*))), (24)

где в правой части стоит субдифференциал (см. определение и свойства, например, в [5, 8, 13, 14]) по х выпуклой по х функции ( — 1) • М(£, ж) в точке (£, ж(£)). И складывается впечатление, что требование 3 можно заменить на более слабое требование (24). Однако справедлива

Лемма 1. Пусть выполнены требования 1, 2 теоремы 2 и включение (24) почти всюду на А. Тогда функция М(£, ж) почти при всех ( £ Д дифференцируема по х в точке ж(£) и, следовательно, выполнено требование 3 теоремы 2.

Доказательство. Пусть при данном 4 Ё А выполнено включение (24) и (см. (4))

ф(г) = -нх(ф(г),х(г),й(г)). (25)

Отметим, что такие £ составляют множество полной меры на А. В силу теоремы 3 из [13, с. 204] и определения опорной функции V/ Е Я" при рассматриваемом £ выполняется неравенство

<#),/> «с -м,(м(*)),

т.е. (см. (25)) V/ 6 Д"

(Нх(ф(!),х(!),й(!)),1) 2 М,(м(*)). (26)

Рассмотрим теперь выпуклую оболочку (¿(Ь) множества (см. (22)). Нетрудно показать, что (¿(Ь) — непустой выпуклый компакт и что (см. (19)) V/ Е Я"

М,(М(*))= тах <£,/), (27)

т.е. М/(£, ж(£)) является опорной функцией для выпуклого компакта (¿(Ь) в направлении I. Отметим, что левая часть неравенства (26) является опорной функцией одноточечного множества, состоящего из вектора Нх(-ф(Ь), х(Ь), й(Ь)). Таким образом, неравенство (26) можно интерпретировать как неравенство при всех I Е Д™ между опорными функциями выпуклых компактов. Отсюда и из свойств опорных функций (см. [13]) получаем, что множество (см. (22)) одноточечно и состоит из вектора Нх(-ф(Ь), ж(£), и(£)). Учитывая это обстоятельство и исходные предположения относительно гладкости функций /(ж, и), д(х,и) по ж, с помощью формулы (27) получаем искомое.

Приведем некоторые простые условия общего вида, гарантирующие выполнение условий теоремы 2. Эти условия навеяны соображениями из монографии [9] по поводу достаточности соответствующих условий оптимальности.

Лемма 2. Пусть выполнено требование 1 теоремы 2 и при £ Е (О, Г], ж Е Е(Ь), и Е II функция Н(-ф(Ь),х,и) (см. (7)) допускает представление вида

Н{ф{г),х,и) = (£, ж) + Н2Ц,и),

где функция Н\{Ь,х) вогнута по ж Е Е{£) Е (О, Г]. Тогда выполняются и требования 2, 3 теоремы 2.

Доказательство. Из свойств функций /(ж, и), д(х,и) и формулы (7) вытекает, что Е (О, Т] функция Н\{Ь,х) непрерывно дифференцируема по ж при ж Е Е{£), функция Н2^,и) непрерывна по и Е II и (см. (14))

м(г, ж) = #1 (г, ж) + шах н2 (г, и).

иви

Отсюда легко следует искомое.

Отметим, что в простом примере (см. (1), (3))

ж = 0, /°(ж, и) = д(и), II = [—1,1], ж(0) = ж0, ж Е Д1,

где скалярная функция д(и) определена, непрерывна и не выпукла на отрезке [—1,1], для оптимального управления й(Ь) = щ, í £ А, где щ Е Ащттд(и), выполнены условия теоремы 2, но условие 3

иви

теоремы 1 не выполняется.

Заканчивая этот пункт, сравним условия теорем 1, 2.

Лемма 3. Если выполнены условия теоремы 1, то выполняются и условия теоремы 2. Доказательство. Нам нужно доказать, что в предположениях теоремы 1 функция М(£, ж) вогнута по ж Е Е(Ь) Е (О, Т] и дифференцируема по ж в точке ж(£) при почти всех £ Е (О, Т]. Вогнутость М(£, ж) по ж была установлена в доказательстве теоремы 1 с помощью изучения подграфиков функций Н(-ф(Ь), ж, и) и М(£, ж) при фиксированном а нужная дифференцируемость по ж в точке ж(£) функции М(£, ж) при почти всех 4 Ё А обоснована в замечании.

В. В этом пункте мы рассмотрим более общий тип краевых условий и более общий вид минимизируемого функционала, нежели в пункте А. При этом будут использованы известные в литературе функции Лагранжа (см., например, [5, 9]) и функция Понтрягина Н^, а^, ж, и) (см. [1, 8]).

Пусть движение управляемого объекта описывается уравнением вида (1), где ж Е Д", и Е II С Дг, II — компакт, при краевых условиях (см. [8, 9])

дг(х0,х(Т)) <С 0, ¿ = 1 ,...,т, (28)

дг{х0,х(Т)) = 0, ¿ = т + 1,...,д, (29)

где ж(0) = жо, величина Т > 0 фиксирована. Таким образом, по сравнению с пунктом А допускаются некоторые связи между левым и правым концами траектории ж(£). На измеримых управлениях и(Ь) Е и, Ь Е А, минимизируется функционал

т

«7(ж0,и(-),ж(-)) = I ¡0(х(з),и(з))йз + д°(х0,х(Т)), (30)

о

где ж(£) — решение уравнения (1), соответствующее управлению и(Ь) Е II и начальному условию ж(0) = ж0- Относительно функций /(ж, и), /°(ж,и) делаются те же предположения, что и в пункте А. В (28), (29) не исключаются случаи то = 0, или д = то ^ 1, или д = то = 0. Предполагается, что функции дг(х,у), I = 0,..., д, определены и непрерывно дифференцируемы на Я" X Я".

Чтобы сформулировать принцип максимума Понтрягина для рассматриваемой здесь оптимизационной задачи, введем функции

Н(ф, а0, ж, и) = -а0/°(ж, и) + /(ж, и)), (31)

/(ж, у, а) = (а,д{х,у)), (32)

где ф Е Д", Е Я1, а — (д + 1)-мерный вектор с компонентами ао, ах,..., ад, д(х, у) — (д + 1)-мерный вектор с компонентами дг(х,у), г = 0,1,..., д. Функцию /(ж, у, а) называют малым лагранжианом.

Пусть жо, и(£), ж(£), £ Е А, — оптимальная тройка для рассматриваемой задачи оптимизации, где ж0 = ж(0). Соответствующее тройке жо, й(-), ж(-) в силу принципа максимума сопряженное линейное уравнение (ср. с (4)) имеет вид

Ф = -НХ{Ф, а0, х(г), й(г)). (зз)

Принцип максимума Понтрягина для рассматриваемой задачи (см. [8, с. 389, теорема 1]) состоит в следующем: найдутся такие числа йо, а\,..., ад и решение ф{£) уравнения (33), что

ч

|й,| > 0, й0 ^ 0, ¿1 ^ 0, ..., ат ^ 0, (34)

¿=о

почти всюду при 4 £ А справедливо равенство

Н(ф(1), й0, ж(£), и(£)) = тахК(-;/>(£), й0, ж(£), и),

и£(7

выполнены краевые условия для ф{Ь) (условия трансверсальности)

ф(0) = 1х(хо,х(Т),а), (35)

ф(Т) = -1у(х0,х(Т),а) (36)

и условия дополняющей нежесткости

счдг(х0,х(Т)) = 0, 1 = 1,...,т. (37)

Отметим, что в сформулированном принципе максимума вектор а Е Яп+1 с компонентами ао,а\,... ,ад определяется неоднозначно, с точностью до положительного множителя. При а о > О за счет соответствующей нормировки можно считать, что йо = 1. Это обстоятельство будет использовано ниже.

Рассмотрим теперь следующую ситуацию: начальное состояние жо и измеримое управление Е II, £ Е А, порождают решение ж(£), £ Е А, уравнения (1), которое удовлетворяет концевым условиям (28), (29), причем тройке жо, й(-), ж(-) отвечает ненулевой вектор а, удовлетворяющий неравенствам (34), и решение ф{£) сопряженного уравнения (33) такие, что выполнены все условия только что сформулированного принципа максимума Понтрягина. Тройку жо, и(-), ж(-) можно назвать пон-трягинской экстремалью. Мы хотим получить достаточные условия для оптимальности тройки жо,

й(-), ж(-).

Сделаем следующее

Предположение 1. Вектор а таков, что его нулевая компонента йо = 1.

Для дальнейших рассмотрений будет полезен следующий функционал (см. [5, 9]), называемый функцией Лагранжа или лагранжианом:

т т

Ь(ф(-), а, ж(-), и(-)) = У (^(в), ж(в) —/(ж(в), и(в))) +/(ж0, ж(Г), а) + а0 J /°(ж(в), и(в)) ¿в, (38)

где ф{Ь) — некоторая га-мерная непрерывная функция, x(t) — некоторая га-мерная абсолютно непрерывная функция при t Е А, жо = ж(0), u(t) EU — некоторое измеримое управление на А, вектор а Е Rg+1 и имеет координаты ао, ßi,..., aq, функция /(ж, у, а) определяется формулой (32). Из формул (28)—(32), (34), (37), (38) получаем

-АJ = J(x0, ü(-), ж(-)) - J(x0, и(-), ж(-)) ^ Ь(ф(-),а, ж(-), й(-)) - Ь(ф(-),а, ж(-), и(-)), (39)

где u(t) Е U, t Е А, — произвольное измеримое управление, для которого уравнение (1) имеет решение x(t), t Е А, с начальным условием ж(0) = жо, причем выполнены краевые условия (28), (29). Применяя формулу интегрирования по частям, получаем

т т

I(ф(з),х(з)) ds = (ф(Т),х(Т)) - (ф(0), ж(0)> - I(i(s),x(s)) ds. (40)

о о

Сделаем еще одно предположение, которое существенно облегчает оценку приращения, стоящего в правой части неравенства (39).

Предположение 2. Функция 1(х,у,а) (см. (32)) выпукла по переменным (ж, у).

Учитывая формулы (31), (35), (36), (38)-(40) и предположение 2, при рассматриваемых тройках сравнения жо, и(-), ж(-) получаем неравенство

т

-АJ ^ J{H{i){s), 1, x(s), u(s)) - Н{ф{з), 1, i(s), Ü(s)) + (ijj(s),x(s) - x(s))) ds. (41)

0

Мы получили теорему.

Теорема 3. При сделанных в этом пункте предположениях, относящихся к рассматриваемым тройкам сравнения жо, и(-), х(-), для приращения АJ (см. (39)) выполняется неравенство (41).

Теперь можно попытаться обеспечить неравенство

-АJ ^ О

для рассматриваемых троек сравнения жо, и(-), ж(-) с помощью добавочных условий на функции /(ж, и), /°(ж, и), ~Н(ф(1;), 1, ж, и). Отметим, что правая часть неравенства (41) аналогична правой части равенства (9). Этим обстоятельством можно воспользоваться, чтобы получить аналоги теорем 1, 2 для рассматриваемой оптимизационной задачи. При этом только надо множество T>(t) (см. (11)) заменить на множество

Dit) = U x(t,x0,u(-)),

(ха ,«(•))£«

где 05 — совокупность пар жо, и(-) (жо G Rn, u(t) Е U, t Е А, — измеримая функция) таких, что соответствующее решение x(t, xq, и(-)) уравнения (1) с начальным условием ж(0) = жо удовлетворяет концевым условиям (28), (29).

Благодарим Ф.П. Васильева, Ю.С. Ледяева и A.B. Арутюнова за полезные для автора обсуждения.

СПИСОК ЛИТЕРАТУРЫ

1. ПонтрягинЛ.С. и др. Математическая теория оптимальных процессов. М.: ГИФМЛ, 1961.

2. Болтянский В. Г. Математические методы оптимального управления. М.: Наука, 1969.

3. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.

4. Габасов Р.Ф., Кириллова Ф.М. Качественная теория оптимальных процессов. М.: Наука, 1971.

5. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978.

7. Zeidan V. Sufficient conditions for the generalized problem of Bolza // Trans. Amer. Math. Soc. 1983. 275. P. 561-586.

8. Васильев Ф.П. Методы оптимизации. M.: Факториал, 2002.

9. Матвеев A.C., Якубович В.А. Оптимальные системы управления: обыкновенные дифференциальные уравнения. Специальные задачи. С.-Пб.: Изд-во С.-Петербург, ун-та, 2003.

10. Асеев С.М., Кряжимский A.B., Тарасьев A.M. Принцип максимума Понтрягина и условия трансверсальности для одной задачи оптимального управления на бесконечном интервале // Труды Матем. ин-та им. В. А. Стеклова. 2001. 233. С. 71-88.

11. Киселев Ю.Н. Достаточные условия оптимальности в терминах конструкций принципа максимума Понтрягина // Материалы научного семинара "Математические модели в экономике и биологии". М.: МАКС Пресс, 2003. С. 57-67.

12. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.

13. Благодатских В. И. Введение в оптимальное управление. М.: Высшая школа, 2001.

14. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973.

15. Пшеничный Б.Н. Необходимые условия экстремума. М.: Наука, 1982.

Поступила в редакцию 13.04.04

УДК 517.977

А. В. Арутюнов, Б. Маринкович

НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ

ДЛЯ ДИСКРЕТНЫХ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ1

(кафедра системного анализа факультета ВМиК)

В теории оптимизации большое значение имеет исследование дискретных динамических систем (см. [1-4] и т.д.). Дискретные системы интересны как сами по себе, вследствие их многочисленных приложений, так и с чисто теоретической точки зрения, так как они широко используются для аппроксимации при численном решении задач оптимального управления (см. [5]).

1. Постановка задачи. Рассмотрим следующую дискретную задачу оптимального управления с концевыми ограничениями:

ЛГ-1

^-Ы, (1)

¿ = 0

£¿ + 1 = (рг(Хг, Щ), ¿ = 0,^-1, (2)

К1(х0,хм) ^ 0, К2(Х0,Хдг) = 0. (3)

Здесь XI 6 Я" — точки фазового пространства, и; £ — управляющие параметры, N — заданное число шагов. Вектор £ = (жо, жъ • • • > жл0 определяет траекторию, т = (щ, щ,..., идг_1) — управление, жо — начальная точка траектории а ждг — ее концевая точка; К 1(жо,ждг) : Яп X Яп —> Якг и Кг(жо,ждг) : Яп X Яп —> Як2 — заданные вектор-функции, описывающие концевые ограничения (3). Все заданные отображения и функции /¿, К\, предполагаются дважды непрерывно дифференцируемыми по совокупности переменных.

1 Работа выполнена при поддержке гранта РФФИ (проект № 05-01-00193), программы "Университеты России" и программы Президента РФ поддержки ведущих научных школ НШ. 1889. 2003. 1.

i Надоели баннеры? Вы всегда можете отключить рекламу.