Известия Тульского государственного университета Естественные науки. 2015. Вып. 3. С. 81-90 = Математика
УДК 519.6
Оптимальное решение одной задачи распределения ресурсов
Е. Н. Руренко
Аннотация. Решается задача оптимального управления одной нелинейной управляемой системы с терминальным функционалом при помощи принципа максимума Понтрягина.
Ключевые слова: оптимальное управление, нелинейная управляемая система дифференциальных уравнений, принцип максимума Понтрягина, точки переключения.
1. Постановка задачи
На фиксированном отрезке времени 0 ^ Ь ^ Т максимизируем терминальный функционал
Ф(Х(Т)) = 71 • Ж1(Т)+ 72 • Х2(Т) для управляемого процесса
х 1 = и • а1 • х1 — ¡1 • х1 и € [0,1] ,
X2 = (1 — и) • а2 • Х1 — ¡12 • Х2, (1)
х1(0) = х1о > 0, х2(0) = х2о > 0,
где а1, а2, ¡1, ¡2 — положительные параметры, 71 ^ 0, 72 ^ 0,71 + 72 > 0.
При замене переменных х1(£) = • е, х2(£) = ¿2(£) • е-^2'1 из (1) получим систему
6 = и • а1 • и € [0,1] ,
6 = (1 — и) • а2 • 6 • е^ (2)
¿1 (0) = Х10, 6(0)= Х20,
в которой V = ¡2 — ¡1.
Функционал в новых переменных будет
Ф(ё(Т)) = 71 • е-^т6(Т) + 72 • е-^2'т6(Т). (3)
Обозначим а1 = 71 • , в1 = 72 • е-^2'т.
Частный случай 72 = 0 в исходной задаче (1) особенно простой. В этом случае из (3) следует, что надо максимизировать функционал Ф({(Т)) =
= а1£1(Т), в котором из (2) имеем ^(Ь) = х10 • еа1иЬ € [0, Т]. Очевидно, что оптимальным управлением будет и(Ь) = 1, Ь € [0, Т], причем оно единственно. Частный случай 71 =0 в исходной задаче (1) рассмотрен в [1, 2]. В данной работе рассматривается случай 71 > 0,72 > 0, а1 + V = 0.
2. Основной результат
Пусть V = 0. Гамильтониан имеет вид
Н = ф1 • /1 + ф2 • /2, где /1 и /2 — правые части (2), т.е.
Н(£, и,ф,Ь) = и • & • (а1 • Ф1 — а2 • Ф2 • еи4) + ф2 • £1 • а2 • еи4. (4) Для (4) запишем сопряженную систему
%Ь1 = —и • а1 • ф1 — (1 — и) • а2 • ф2 • еи4,
(5)
ф2 =0.
Для функционала (3), взяв фо = 1, в силу условия трансверсальности ф(Т) — — фо • Ф^ = 0 имеем
ф1(Т )= 71 • , ф1(Т)= а1,
^ то есть (6)
ф2(Т)= 72 • е-^т, ф2(Т)= в1.
Из (5), (6) получаем
ф2(Ь)= 72 • е-^т > 0, Ь € [0,Т] . (7)
Подставляя (7) в первое уравнение системы (5), получим уравнение для ф1(Ь) в виде
ф = и • [—а1 • ф1 + а2 • 72 • е-^2•т • — 72 • а2 • е-^2•т • , (8)
причем из (6) ф1(Т) = 71 • е-^1т.
Пусть и(Ь),£(Ь),Ь € [0,Т] — оптимальная пара в задаче (2). Отметим, что управление и(^) будет оптимальным и в исходной задаче (1), и наоборот.
Согласно принципу максимума Понтрягина [3, с. 93] для оптимальных и(^),£(^) и решения ф(Ь) системы (5) почти всюду на [0,Т] выполняется соотношение максимума
Н(аг),и(Ь),ф(Ь),г) = тах Н(£(Ь),и,ф(Ь),Ь). (9)
ие[о,1]
При вычислении максимума по и € [0,1], стоящего в правой части (9), важную роль играет вычисление максимума по и € [0,1] функции
Н(Ь, и) = и • %1(Ь) • [(Ц • ф1(Ь) — а2 • ф2(Ь) • е^] , Ь € [0, Т] , (10)
т.к. гамильтониан (см. (4))
Н(|, и, ф, г) = Н(г, и) + гр2 • 6 • а2 • е^. (11)
Из (2) и положительности ¿1(0) = хю вытекает, что
#1(г) > 0, г € [0,Т].
Отсюда в силу (11), (10) и принципа максимума оптимальное управление и(г) оказывается эквивалентным кусочно-постоянной функции, принимающей значения либо 0, либо 1 с конечным числом точек переключения, если функция
Н1(г) = а1 • ф 1(г) — а2 • ф2(г) • е"* (12)
имеет конечное число нулей на [0, Т].
Из (11), (10), положительности ф2(г) (см. (7)) и ¿1(г) при г € [0,Т] следует, что и(г) = 0 при тех г, где к1(г) < 0, и и(г) = 1 при тех г, где к1(г) ^ 0.
Заметим, что ^(¿)(см. (12)) является абсолютно непрерывной на [0,Т] и имеет на [0, Т] почти всюду суммируемую по Лебегу производную (с учетом
(7)) .
к 1(г) = а1 • ф 1(г) — а2 • 72 • е-^т • V • е*.
Из (8), (12) следует, что выполняется
к 1(г) = —и • (Ц • к1(г) — а2 • 72 • е-^т • (а1 + V) • еиЬ. (13)
Заметим, что из (12), (6) будем иметь концевое условие
к1 (Т) = а1 • 71 • е-^1т — а2 • 72 • е-^т • еиТ. (14)
Пусть в точке г* € [0, Т] к1(г*) = 0. Рассмотрим два возможных варианта.
Вариант 1. а1 + V > 0.Тогда в силу (13) почти всюду на [г* — 5, г* + 5] П П [0,Т] будет выполняться неравенство к 1(г) ^ —е, где числа 5 > 0,е > 0 достаточно малы. Отсюда вытекает, что при г € [г* — 5, г* + 5] П [0, Т] у функции к1 (г) других нулей, кроме г*, нет и к1 (г) строго монотонно убывает на этом множестве. Допустим, что правее точки г* на отрезке [0, Т] есть другой нуль г1 функции к1 (г). Тогда среди нулей функции к1 (г), лежащих правее г*, выделим наиближайший, обозначим его ¿2 (очевидно ¿2 — г* >5). Для точки ¿2 можно провести рассуждения, аналогичные вышеприведенным, и обосновать, что при г € [52 — г2,г2 + 52] П [0, Т], где 52 > 0 достаточно мало, функция к1 (г)строго монотонно убывает. Из сказанного следует, что при некотором € (г*,г2) к1(г3) = 0, что противоречит определению нуля г2 функции к1 (г). Аналогично рассматривается ситуация, когда предполагается, что есть нуль г1 функции к1 (г), лежащий на отрезке [0,Т] левее г*. Таким образом, при выполнении а1 + V > 0 обосновано, что функция к1 (г) имеет на отрезке [0, Т] не более одного нуля. Здесь использованы соображения из [4].
Вариант 2. а1 + V < 0. Здесь можно провести рассуждения, аналогичные как в варианте 1, и обосновать, что к1 (г) имеет на отрезке [0,Т] не более
одного нуля т, причем при Ь € [0, Т] и достаточно близких к т функция Н (Ь) строго монотонно растет.
Из вышеизложенного вытекают следующие четыре случая.
Случай 1. а1 + V > 0, Н1(Т) ^ 0. Условие Н1(Т) ^ 0 в силу (14) равносильно условию для параметров а1 • 71 ^ а2 • 72.
Функция Ь,1(Ь) корней иметь не будет, Н^Ь) не меняет свой знак, т.е. Н1(г) > 0 при Ь € [0,Т). Поэтому и(Ь) = 1 при Ь € [0,Т].
Случай 2. а1 + V > 0, Н1(Т) < 0. Условие Н1(Т) < 0 в силу (14) равносильно условию для параметров а1 • 71 < а2 • 72.
Подслучай 2.1. Если Н1 (Ь) при Ь = Ь* имеет корень, то Н1(Ь) > 0 при Ь € [0,Ь*) и Н1(Ь) < 0 при Ь € (Ь*,Т].
Поэтому{
( 1, Ь € [0,Ь*] , и(Ь) = <
i 0, Ь € (Ь*,Т].
Исследуя на максимум функционал, в этом подслучае получим (см. ниже), что
Ь* = Т_ 1 , а2 • 72 • (а1 + V)
V а1 • (71 • V + 72 • а2)'
Подслучай 2.2. Если Н1(Ь)при Ь € [0,Т] корней не имеет, то Н1(Ь)не меняет свой знак, т.е. Н1(Ь) < 0 при Ь € [0, Т]. Поэтому и(Ь) = 0 при Ь € [0,Т].
Случай 3. а1 + V < 0, Н1(Т) > 0. Условие Н1(Т) ^ 0 в силу (14) дает а1 • 71 > а2 • 72 .
Подслучай 3.1. Если Н1(Ь)при Ь = Ь* имеет корень, то Н1(Ь) < 0 при Ь € [0,Ь*) и Н1(Ь) > 0 при Ь € (Ь*,Т], поэтому
( 0, Ь € [0,Ь*),
и(Ь) = {
\ 1, Ь € [Ь*,Т].
Исследуя на максимум функционал, в этом подслучае получим (см.ниже), что
Ь* = Т • 1п .
а1 + V 71 • а1
Подслучай 3.2. Если Н1 (Ь)при Ь € [0,Т] корней не имеет, то Н1(Ь) не меняет свой знак, т.е. Н1(Ь) > 0 при Ь € [0, Т]. Поэтому и(Ь) = 1 при Ь € [0,Т].
Случай 4. а1 + V < 0, Н1(Т) ^ 0. Условие Н1(Т) ^ 0 в силу (14) дает а1 • 71 ^ а2 • 72-
Функция Н^Ь) при Ь € [0,Т] корней иметь не будет, ^(Ь) не меняет, т.е. Н1(Ь) < 0 при Ь € [0,Т]. Поэтому и(Ь) = 0 при Ь € [0,Т].
Рассмотренным выше случаям будут соответствовать следующие утверждения.
Теорема 1. Если V = ц2 — ц1 = 0, а1 + V > 0, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид
и(г) = 1, г € [0,Т].
Теорема 2.1. Если а1 + V > 0, а1 • 71 < а2 • 72, ¡л1 =
Т> 1 . 1п а1 • а2 • 72 + а2 • 72 • V > 0 V а1 • а2 • 72 + а1 • 71 • V '
то оптимальное управление в задаче (1) и имеет вид
1, г € [0,г*] ,
и
и(г) = ,
1 0, г € (г*,Т],
где точка г* переключения определяется равенством
г* = т _ 1 . 1п а1 • а2 • 72 + а2 • 72 • V V а1 • а2 • 72 + а1 • 71 • V'
Замечание. Если а1 + V > 0, а1 • 71 < а2 • 72, то нетрудно показать существование и положительность выражения с логарифмом, стоящего в условиях этой теоремы и следующей.
Теорема 2.2. Если а1 + V > 0, а1 • 71 < а2 • 72, ц1 =
0 <Т < 1 . 1п а1 • а2 • 72 + а2 • 72 •
^ V а1 • а2 • ъ + а1 • 71 • V'
то оптимальное управление в задаче (1) имеет вид
и(г) = 0, г € [0,Т] .
Теорема 3.1. Если а1 + V < 0, а1 • 71 > а2 • 72, ц1 = ¡л2,
Т > —1— • 1п > 0,
а1 + V а1 • 71
то оптимальное управление в задаче (1) имеет вид
0, г € [0,г*),
с
и(г) =
1, г € [г*,т],
где точка переключения г* определяется равенством
г* = т • 1п.
а1 + V а1 • 71
Замечание. Если а1 + V < 0 и а1 • 71 > а2 • 72, то нетрудно показать существование и положительность выражения с логарифмом, стоящего в условиях этой теоремы и следующей.
Теорема 3.2. Если а1 + V < 0, а1 • 71 > а2 • 72, ц1 = ц2,
0 < Т • 1п ^,
а1 + V а1 • 71
то оптимальное управление в задаче (1) имеет вид
и(Ь) = 1, Ь € [0,Т] .
Теорема 4. Если V = /л2 — /л1 = 0, а1 + V < 0, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид
и(Ь) = 0, Ь € [0,Т] .
3. Приложение
К доказательству теоремы 2.1. Покажем, что в условиях теоремы 2.1
точка переключения Ь* будет давать максимальное значение функционала.
Р (2) т / М € [0,Ь*]
Решая (2) при и(Ь) = < 0 £ € (Ь* Т] , получим
£1(Т)= ж 10 • еа1г*,
Ь(Т) = ж20 + Х10 • а2 • еа1г* • 1 • (еыт — еыг*). В силу (3) будем иметь функционал в виде функции ф(Ь*) = 71 • е-^т • жю • еа1г* + 72 • е-^т
V
(15)
Условие Ф^* = 0 даст единственную подозрительную на локальный экстремум точку
ь* = т — 1 • ,
V а1 • (71 • V + 72 • а2)
которая по условиям теоремы 2.1 находится внутри отрезка [0, Т]. Действительно,
ф'(Ь*) = 71 • е-^т • жю • а1 • еа11* + 72 • е-^2т • жш • а1 • а2 • 1 еа1** • еыт—
—72 • е-^2т • ж10 • (а1 + V) • а2 • V е(а1+ы)г* = 0. Следовательно, 71 • е-^1т • а1 + 72 • е-^2т • а1 • а2 • 1 еыт — 72 • е-^2т • (а1 +
+ V) • а2 • 1 еыг* =0.
Отсюда, так как V — ц2 = —у1, имеем еыг* = 0тО '72 , то есть
vtl = vT + 1п .
1 (ы+а1) а ^2
. ж10 • а2 а11* ( ыт ыг ж20 +--• еа1г • [еы± — еыг
Нетрудно показать, что Ф"(гЦ) < 0 при условиях теоремы, т.е. точка г\ дает локальный максимум функции (15). Действительно,
Ф"(г*) = 71 • е-^т • хю • а2 • еа1Ь* + 72 • е-^т • хю • а2 • а2 • 1 еа1Ь* е"т—
-Y2 • e ^2T • Х10 • (ai + v)2 • • - e
(ai+v )t*
n vtt (7iv+72a2)•e ^iTai / \
С учетом того, что e 1 = (v+ai) e-WJI a2 72 (см- выше), получим, вводя естественную положительную константу,
const • Ф"(¿1) = —Yival — Y2a2 < 0,
так как по условию теоремы 2-1 v + ai > 0, где ai > 0, то есть v > 0.
В силу непрерывности функции (15) и единственности внутри [0,Т] локального максимума точка t = t* будет давать наибольшее значение функции (15) на всем отрезке [0,Т].К доказательству теоремы 3-1- Покажем, что в условиях теоремы 3-1 точка переключения t* будет давать максимальное значение функционала-Решая (2) при
= (0, t & [0,п
u(t) = \i, t & [t*,T],
получим
= Хлп ■ eai(T-t*)
ii(T) = Х10 • e
6(T) = Х20 +
xio•a2
• (e — 1).
В силу (3) будем иметь функционал в виде функции Ф(^) = Yi • e-^iT • xio • eai(T-tt) + 72 • e-^T
. xi0 • a2 vt* a2 • xi0 Х20 +--• e--
Условие Ф^» = 0 даст единственную подозрительную на локальный экстремум точку
ti = T —
i
ln
72 • a2
а1 + V 71 • а1
которая по условиям теоремы 3.1 находится внутри отрезка [0,Т]. Действительно,
Ф'(г*) = —71 • е-^т • хю • аг • еа1(т-» + 72 • е-^т • хю • а2 • е^ = 0.
Отсюда имеем
7i • e
• P-^iT • ai • eaiT • e-ait*l = 72 • p-V2T • a2 • evt
72 • e 2 • a2 • e
7i • e-^iT • ai • eaiT = y2 • e-^2T • a2 • e(ai+v)tl,
;(ai+v)t\ = 7i • ai • e(ai+v)T
" 72 • a2 '
v
(а1 + V)(£1 — Т) =1п .
72 • а2
Нетрудно показывается, что ф''(£Ц) < 0 при условиях данной теоремы. Действительно,
ф''(£*) = 71 • е-^т • жю • а2 • еа1(т-г*) + 72 • V • е-^т • жю • а2 • еыг*, ф''(£*) • еа1г* = 71 • е-^т • жю • а2± • еа1т + 72 • V • е-^т • жю • а2 • е(а1+ы)г*, где
т . а . еа1т
e(ai +v)ti = --^- (см. выше).
Y2 ■ e■ a2
Следовательно,
<b"(t*) ■ eait"ï = yi ■ e(ai-^l)T ■ xio ■ a1 ■ (ai + v),
где по условию теоремы 3.1 ai + v < 0. Далее рассуждаем, как в теореме 2.1.
Пусть v = 0. Из рассмотренных выше четырех случаев в силу ai > 0 остаются два первых случая, а именно:
Случай 1. hi(T) ^ 0, т.е. ai ■ 7i ^ a2 ■ 72. Здесь U(t) = 1 при t e [0,T].
Случай 2. hi(T) < 0, т.е. ai ■ 7i < a2 ■ 72. Здесь либо подслучай 2.1 и
f 1, t e [0,t*], u(t) = <
{ 0, t e (t*,T],
либо подслучай 2.2 и и(Ь) = 0 при Ь € [0, Т].
Этим случаям соответствуют следующие утверждения.
Лемма 1. Если ц1 = ц2, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид
и(Ь) = 1, £ € [0,Т] .
Лемма 2.1. Если ц1 = ц2, а1 • 71 < а2 • 72,
Т > 1 — ^ > 0, а1 72 • а2
то оптимальное управление в задаче (1) имеет вид
1, £ € [0,Ь*],
К:
u(t) =
0, t e (t*,T],
где точка переключения t* определяется равенством
гт 1 71
t* = T--+
ai 72 ■ a2
Замечание. Точка переключения г*в данной лемме найдена аналогично как в теоремах 2.1, 3.1.
Лемма 2.2. Если /л1 = ц2, а1 • 71 < а2 • 72,
„1 71 0 <Т <--д
а1 72 • а2
то оптимальное управление в задаче (1) имеет вид
и(г) = 0, г € [0,т] .
Замечание. По правилу Лопиталя нетрудно показать, что
1 а1 • а2 • 72 + а2 • 72 • V 1 71 11т - 1п
^о V а1 • а2 • 72 + а2 • 71 • V а1 72 • а2
Приношу глубокую признательность М.С. Никольскому за внимание к работе.
Список литературы
1. Построение оптимального решения и множества достижимости в одной задаче распределения ресурсов / Ю.Н. Киселев, В.Ю. Решетов, С.Н. Аввакумов, М.В. Орлов // Проблемы оптимального управления. М.: МАКС Пресс, 2007. Вып. 2. С. 106-120.
2. Киселев Ю.Н, Аввакумов С.Н., Орлов М.В. Построение в аналитической форме оптимального управления и множеств достижимости в одной задаче распределения ресурсов // Прикладная математика и информатика. М.: МАКС Пресс, 2007. № 27. С. 80-99.
3. Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко. М.: Наука, 1983. 392 с.
4. Никольский М.С. Упрощенная игровая модель взаимодействия двух государств // Вестник Моск. ун-та. Сер. 15. Вычислительная математика и кибернетика. 2009. № 2. С. 14-20.
Руренко Елена Николаевна ([email protected]), к.ф.-м.н., доцент, кафедра высшей математики, Вятский государственный университет, Киров.
The optimal solution of a problem of resources distribution
E. N. Rurenko
Abstract. A problem of the optimal control of a nonlinear controlled system with terminal functional is solved using Pontryagin's maximum principle.
Keywords : optimal control, nonlinear controlled system of differential equations, Pontryagin's maximum principle, switch points.
Rurenko Elena ([email protected]), candidate of physical and mathematical sciences, associate professor, department of higher mathematics, Vyatka State University, Kirov.
Поступила 10.05.2015