Научная статья на тему 'Оптимальное решение одной задачи распределения ресурсов'

Оптимальное решение одной задачи распределения ресурсов Текст научной статьи по специальности «Математика»

CC BY
165
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / НЕЛИНЕЙНАЯ УПРАВЛЯЕМАЯ СИСТЕМА ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ / ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА / ТОЧКИ ПЕРЕКЛЮЧЕНИЯ / OPTIMAL CONTROL / NONLINEAR CONTROLLED SYSTEM OF DIFFERENTIAL EQUATIONS / PONTRYAGIN'S MAXIMUM PRINCIPLE / SWITCH POINTS

Аннотация научной статьи по математике, автор научной работы — Руренко Елена Николаевна

Решается задача оптимального управления одной нелинейной управляемой системы с терминальным функционалом при помощи принципа максимума Понтрягина.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A problem of the optimal control of a nonlinear controlled system with terminal functional is solved using Pontryagin's maximum principle.

Текст научной работы на тему «Оптимальное решение одной задачи распределения ресурсов»

Известия Тульского государственного университета Естественные науки. 2015. Вып. 3. С. 81-90 = Математика

УДК 519.6

Оптимальное решение одной задачи распределения ресурсов

Е. Н. Руренко

Аннотация. Решается задача оптимального управления одной нелинейной управляемой системы с терминальным функционалом при помощи принципа максимума Понтрягина.

Ключевые слова: оптимальное управление, нелинейная управляемая система дифференциальных уравнений, принцип максимума Понтрягина, точки переключения.

1. Постановка задачи

На фиксированном отрезке времени 0 ^ Ь ^ Т максимизируем терминальный функционал

Ф(Х(Т)) = 71 • Ж1(Т)+ 72 • Х2(Т) для управляемого процесса

х 1 = и • а1 • х1 — ¡1 • х1 и € [0,1] ,

X2 = (1 — и) • а2 • Х1 — ¡12 • Х2, (1)

х1(0) = х1о > 0, х2(0) = х2о > 0,

где а1, а2, ¡1, ¡2 — положительные параметры, 71 ^ 0, 72 ^ 0,71 + 72 > 0.

При замене переменных х1(£) = • е, х2(£) = ¿2(£) • е-^2'1 из (1) получим систему

6 = и • а1 • и € [0,1] ,

6 = (1 — и) • а2 • 6 • е^ (2)

¿1 (0) = Х10, 6(0)= Х20,

в которой V = ¡2 — ¡1.

Функционал в новых переменных будет

Ф(ё(Т)) = 71 • е-^т6(Т) + 72 • е-^2'т6(Т). (3)

Обозначим а1 = 71 • , в1 = 72 • е-^2'т.

Частный случай 72 = 0 в исходной задаче (1) особенно простой. В этом случае из (3) следует, что надо максимизировать функционал Ф({(Т)) =

= а1£1(Т), в котором из (2) имеем ^(Ь) = х10 • еа1иЬ € [0, Т]. Очевидно, что оптимальным управлением будет и(Ь) = 1, Ь € [0, Т], причем оно единственно. Частный случай 71 =0 в исходной задаче (1) рассмотрен в [1, 2]. В данной работе рассматривается случай 71 > 0,72 > 0, а1 + V = 0.

2. Основной результат

Пусть V = 0. Гамильтониан имеет вид

Н = ф1 • /1 + ф2 • /2, где /1 и /2 — правые части (2), т.е.

Н(£, и,ф,Ь) = и • & • (а1 • Ф1 — а2 • Ф2 • еи4) + ф2 • £1 • а2 • еи4. (4) Для (4) запишем сопряженную систему

%Ь1 = —и • а1 • ф1 — (1 — и) • а2 • ф2 • еи4,

(5)

ф2 =0.

Для функционала (3), взяв фо = 1, в силу условия трансверсальности ф(Т) — — фо • Ф^ = 0 имеем

ф1(Т )= 71 • , ф1(Т)= а1,

^ то есть (6)

ф2(Т)= 72 • е-^т, ф2(Т)= в1.

Из (5), (6) получаем

ф2(Ь)= 72 • е-^т > 0, Ь € [0,Т] . (7)

Подставляя (7) в первое уравнение системы (5), получим уравнение для ф1(Ь) в виде

ф = и • [—а1 • ф1 + а2 • 72 • е-^2•т • — 72 • а2 • е-^2•т • , (8)

причем из (6) ф1(Т) = 71 • е-^1т.

Пусть и(Ь),£(Ь),Ь € [0,Т] — оптимальная пара в задаче (2). Отметим, что управление и(^) будет оптимальным и в исходной задаче (1), и наоборот.

Согласно принципу максимума Понтрягина [3, с. 93] для оптимальных и(^),£(^) и решения ф(Ь) системы (5) почти всюду на [0,Т] выполняется соотношение максимума

Н(аг),и(Ь),ф(Ь),г) = тах Н(£(Ь),и,ф(Ь),Ь). (9)

ие[о,1]

При вычислении максимума по и € [0,1], стоящего в правой части (9), важную роль играет вычисление максимума по и € [0,1] функции

Н(Ь, и) = и • %1(Ь) • [(Ц • ф1(Ь) — а2 • ф2(Ь) • е^] , Ь € [0, Т] , (10)

т.к. гамильтониан (см. (4))

Н(|, и, ф, г) = Н(г, и) + гр2 • 6 • а2 • е^. (11)

Из (2) и положительности ¿1(0) = хю вытекает, что

#1(г) > 0, г € [0,Т].

Отсюда в силу (11), (10) и принципа максимума оптимальное управление и(г) оказывается эквивалентным кусочно-постоянной функции, принимающей значения либо 0, либо 1 с конечным числом точек переключения, если функция

Н1(г) = а1 • ф 1(г) — а2 • ф2(г) • е"* (12)

имеет конечное число нулей на [0, Т].

Из (11), (10), положительности ф2(г) (см. (7)) и ¿1(г) при г € [0,Т] следует, что и(г) = 0 при тех г, где к1(г) < 0, и и(г) = 1 при тех г, где к1(г) ^ 0.

Заметим, что ^(¿)(см. (12)) является абсолютно непрерывной на [0,Т] и имеет на [0, Т] почти всюду суммируемую по Лебегу производную (с учетом

(7)) .

к 1(г) = а1 • ф 1(г) — а2 • 72 • е-^т • V • е*.

Из (8), (12) следует, что выполняется

к 1(г) = —и • (Ц • к1(г) — а2 • 72 • е-^т • (а1 + V) • еиЬ. (13)

Заметим, что из (12), (6) будем иметь концевое условие

к1 (Т) = а1 • 71 • е-^1т — а2 • 72 • е-^т • еиТ. (14)

Пусть в точке г* € [0, Т] к1(г*) = 0. Рассмотрим два возможных варианта.

Вариант 1. а1 + V > 0.Тогда в силу (13) почти всюду на [г* — 5, г* + 5] П П [0,Т] будет выполняться неравенство к 1(г) ^ —е, где числа 5 > 0,е > 0 достаточно малы. Отсюда вытекает, что при г € [г* — 5, г* + 5] П [0, Т] у функции к1 (г) других нулей, кроме г*, нет и к1 (г) строго монотонно убывает на этом множестве. Допустим, что правее точки г* на отрезке [0, Т] есть другой нуль г1 функции к1 (г). Тогда среди нулей функции к1 (г), лежащих правее г*, выделим наиближайший, обозначим его ¿2 (очевидно ¿2 — г* >5). Для точки ¿2 можно провести рассуждения, аналогичные вышеприведенным, и обосновать, что при г € [52 — г2,г2 + 52] П [0, Т], где 52 > 0 достаточно мало, функция к1 (г)строго монотонно убывает. Из сказанного следует, что при некотором € (г*,г2) к1(г3) = 0, что противоречит определению нуля г2 функции к1 (г). Аналогично рассматривается ситуация, когда предполагается, что есть нуль г1 функции к1 (г), лежащий на отрезке [0,Т] левее г*. Таким образом, при выполнении а1 + V > 0 обосновано, что функция к1 (г) имеет на отрезке [0, Т] не более одного нуля. Здесь использованы соображения из [4].

Вариант 2. а1 + V < 0. Здесь можно провести рассуждения, аналогичные как в варианте 1, и обосновать, что к1 (г) имеет на отрезке [0,Т] не более

одного нуля т, причем при Ь € [0, Т] и достаточно близких к т функция Н (Ь) строго монотонно растет.

Из вышеизложенного вытекают следующие четыре случая.

Случай 1. а1 + V > 0, Н1(Т) ^ 0. Условие Н1(Т) ^ 0 в силу (14) равносильно условию для параметров а1 • 71 ^ а2 • 72.

Функция Ь,1(Ь) корней иметь не будет, Н^Ь) не меняет свой знак, т.е. Н1(г) > 0 при Ь € [0,Т). Поэтому и(Ь) = 1 при Ь € [0,Т].

Случай 2. а1 + V > 0, Н1(Т) < 0. Условие Н1(Т) < 0 в силу (14) равносильно условию для параметров а1 • 71 < а2 • 72.

Подслучай 2.1. Если Н1 (Ь) при Ь = Ь* имеет корень, то Н1(Ь) > 0 при Ь € [0,Ь*) и Н1(Ь) < 0 при Ь € (Ь*,Т].

Поэтому{

( 1, Ь € [0,Ь*] , и(Ь) = <

i 0, Ь € (Ь*,Т].

Исследуя на максимум функционал, в этом подслучае получим (см. ниже), что

Ь* = Т_ 1 , а2 • 72 • (а1 + V)

V а1 • (71 • V + 72 • а2)'

Подслучай 2.2. Если Н1(Ь)при Ь € [0,Т] корней не имеет, то Н1(Ь)не меняет свой знак, т.е. Н1(Ь) < 0 при Ь € [0, Т]. Поэтому и(Ь) = 0 при Ь € [0,Т].

Случай 3. а1 + V < 0, Н1(Т) > 0. Условие Н1(Т) ^ 0 в силу (14) дает а1 • 71 > а2 • 72 .

Подслучай 3.1. Если Н1(Ь)при Ь = Ь* имеет корень, то Н1(Ь) < 0 при Ь € [0,Ь*) и Н1(Ь) > 0 при Ь € (Ь*,Т], поэтому

( 0, Ь € [0,Ь*),

и(Ь) = {

\ 1, Ь € [Ь*,Т].

Исследуя на максимум функционал, в этом подслучае получим (см.ниже), что

Ь* = Т • 1п .

а1 + V 71 • а1

Подслучай 3.2. Если Н1 (Ь)при Ь € [0,Т] корней не имеет, то Н1(Ь) не меняет свой знак, т.е. Н1(Ь) > 0 при Ь € [0, Т]. Поэтому и(Ь) = 1 при Ь € [0,Т].

Случай 4. а1 + V < 0, Н1(Т) ^ 0. Условие Н1(Т) ^ 0 в силу (14) дает а1 • 71 ^ а2 • 72-

Функция Н^Ь) при Ь € [0,Т] корней иметь не будет, ^(Ь) не меняет, т.е. Н1(Ь) < 0 при Ь € [0,Т]. Поэтому и(Ь) = 0 при Ь € [0,Т].

Рассмотренным выше случаям будут соответствовать следующие утверждения.

Теорема 1. Если V = ц2 — ц1 = 0, а1 + V > 0, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид

и(г) = 1, г € [0,Т].

Теорема 2.1. Если а1 + V > 0, а1 • 71 < а2 • 72, ¡л1 =

Т> 1 . 1п а1 • а2 • 72 + а2 • 72 • V > 0 V а1 • а2 • 72 + а1 • 71 • V '

то оптимальное управление в задаче (1) и имеет вид

1, г € [0,г*] ,

и

и(г) = ,

1 0, г € (г*,Т],

где точка г* переключения определяется равенством

г* = т _ 1 . 1п а1 • а2 • 72 + а2 • 72 • V V а1 • а2 • 72 + а1 • 71 • V'

Замечание. Если а1 + V > 0, а1 • 71 < а2 • 72, то нетрудно показать существование и положительность выражения с логарифмом, стоящего в условиях этой теоремы и следующей.

Теорема 2.2. Если а1 + V > 0, а1 • 71 < а2 • 72, ц1 =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 <Т < 1 . 1п а1 • а2 • 72 + а2 • 72 •

^ V а1 • а2 • ъ + а1 • 71 • V'

то оптимальное управление в задаче (1) имеет вид

и(г) = 0, г € [0,Т] .

Теорема 3.1. Если а1 + V < 0, а1 • 71 > а2 • 72, ц1 = ¡л2,

Т > —1— • 1п > 0,

а1 + V а1 • 71

то оптимальное управление в задаче (1) имеет вид

0, г € [0,г*),

с

и(г) =

1, г € [г*,т],

где точка переключения г* определяется равенством

г* = т • 1п.

а1 + V а1 • 71

Замечание. Если а1 + V < 0 и а1 • 71 > а2 • 72, то нетрудно показать существование и положительность выражения с логарифмом, стоящего в условиях этой теоремы и следующей.

Теорема 3.2. Если а1 + V < 0, а1 • 71 > а2 • 72, ц1 = ц2,

0 < Т • 1п ^,

а1 + V а1 • 71

то оптимальное управление в задаче (1) имеет вид

и(Ь) = 1, Ь € [0,Т] .

Теорема 4. Если V = /л2 — /л1 = 0, а1 + V < 0, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид

и(Ь) = 0, Ь € [0,Т] .

3. Приложение

К доказательству теоремы 2.1. Покажем, что в условиях теоремы 2.1

точка переключения Ь* будет давать максимальное значение функционала.

Р (2) т / М € [0,Ь*]

Решая (2) при и(Ь) = < 0 £ € (Ь* Т] , получим

£1(Т)= ж 10 • еа1г*,

Ь(Т) = ж20 + Х10 • а2 • еа1г* • 1 • (еыт — еыг*). В силу (3) будем иметь функционал в виде функции ф(Ь*) = 71 • е-^т • жю • еа1г* + 72 • е-^т

V

(15)

Условие Ф^* = 0 даст единственную подозрительную на локальный экстремум точку

ь* = т — 1 • ,

V а1 • (71 • V + 72 • а2)

которая по условиям теоремы 2.1 находится внутри отрезка [0, Т]. Действительно,

ф'(Ь*) = 71 • е-^т • жю • а1 • еа11* + 72 • е-^2т • жш • а1 • а2 • 1 еа1** • еыт—

—72 • е-^2т • ж10 • (а1 + V) • а2 • V е(а1+ы)г* = 0. Следовательно, 71 • е-^1т • а1 + 72 • е-^2т • а1 • а2 • 1 еыт — 72 • е-^2т • (а1 +

+ V) • а2 • 1 еыг* =0.

Отсюда, так как V — ц2 = —у1, имеем еыг* = 0тО '72 , то есть

vtl = vT + 1п .

1 (ы+а1) а ^2

. ж10 • а2 а11* ( ыт ыг ж20 +--• еа1г • [еы± — еыг

Нетрудно показать, что Ф"(гЦ) < 0 при условиях теоремы, т.е. точка г\ дает локальный максимум функции (15). Действительно,

Ф"(г*) = 71 • е-^т • хю • а2 • еа1Ь* + 72 • е-^т • хю • а2 • а2 • 1 еа1Ь* е"т—

-Y2 • e ^2T • Х10 • (ai + v)2 • • - e

(ai+v )t*

n vtt (7iv+72a2)•e ^iTai / \

С учетом того, что e 1 = (v+ai) e-WJI a2 72 (см- выше), получим, вводя естественную положительную константу,

const • Ф"(¿1) = —Yival — Y2a2 < 0,

так как по условию теоремы 2-1 v + ai > 0, где ai > 0, то есть v > 0.

В силу непрерывности функции (15) и единственности внутри [0,Т] локального максимума точка t = t* будет давать наибольшее значение функции (15) на всем отрезке [0,Т].К доказательству теоремы 3-1- Покажем, что в условиях теоремы 3-1 точка переключения t* будет давать максимальное значение функционала-Решая (2) при

= (0, t & [0,п

u(t) = \i, t & [t*,T],

получим

= Хлп ■ eai(T-t*)

ii(T) = Х10 • e

6(T) = Х20 +

xio•a2

• (e — 1).

В силу (3) будем иметь функционал в виде функции Ф(^) = Yi • e-^iT • xio • eai(T-tt) + 72 • e-^T

. xi0 • a2 vt* a2 • xi0 Х20 +--• e--

Условие Ф^» = 0 даст единственную подозрительную на локальный экстремум точку

ti = T —

i

ln

72 • a2

а1 + V 71 • а1

которая по условиям теоремы 3.1 находится внутри отрезка [0,Т]. Действительно,

Ф'(г*) = —71 • е-^т • хю • аг • еа1(т-» + 72 • е-^т • хю • а2 • е^ = 0.

Отсюда имеем

7i • e

• P-^iT • ai • eaiT • e-ait*l = 72 • p-V2T • a2 • evt

72 • e 2 • a2 • e

7i • e-^iT • ai • eaiT = y2 • e-^2T • a2 • e(ai+v)tl,

;(ai+v)t\ = 7i • ai • e(ai+v)T

" 72 • a2 '

v

(а1 + V)(£1 — Т) =1п .

72 • а2

Нетрудно показывается, что ф''(£Ц) < 0 при условиях данной теоремы. Действительно,

ф''(£*) = 71 • е-^т • жю • а2 • еа1(т-г*) + 72 • V • е-^т • жю • а2 • еыг*, ф''(£*) • еа1г* = 71 • е-^т • жю • а2± • еа1т + 72 • V • е-^т • жю • а2 • е(а1+ы)г*, где

т . а . еа1т

e(ai +v)ti = --^- (см. выше).

Y2 ■ e■ a2

Следовательно,

<b"(t*) ■ eait"ï = yi ■ e(ai-^l)T ■ xio ■ a1 ■ (ai + v),

где по условию теоремы 3.1 ai + v < 0. Далее рассуждаем, как в теореме 2.1.

Пусть v = 0. Из рассмотренных выше четырех случаев в силу ai > 0 остаются два первых случая, а именно:

Случай 1. hi(T) ^ 0, т.е. ai ■ 7i ^ a2 ■ 72. Здесь U(t) = 1 при t e [0,T].

Случай 2. hi(T) < 0, т.е. ai ■ 7i < a2 ■ 72. Здесь либо подслучай 2.1 и

f 1, t e [0,t*], u(t) = <

{ 0, t e (t*,T],

либо подслучай 2.2 и и(Ь) = 0 при Ь € [0, Т].

Этим случаям соответствуют следующие утверждения.

Лемма 1. Если ц1 = ц2, а1 • 71 ^ а2 • 72, то оптимальное управление в задаче (1) имеет вид

и(Ь) = 1, £ € [0,Т] .

Лемма 2.1. Если ц1 = ц2, а1 • 71 < а2 • 72,

Т > 1 — ^ > 0, а1 72 • а2

то оптимальное управление в задаче (1) имеет вид

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1, £ € [0,Ь*],

К:

u(t) =

0, t e (t*,T],

где точка переключения t* определяется равенством

гт 1 71

t* = T--+

ai 72 ■ a2

Замечание. Точка переключения г*в данной лемме найдена аналогично как в теоремах 2.1, 3.1.

Лемма 2.2. Если /л1 = ц2, а1 • 71 < а2 • 72,

„1 71 0 <Т <--д

а1 72 • а2

то оптимальное управление в задаче (1) имеет вид

и(г) = 0, г € [0,т] .

Замечание. По правилу Лопиталя нетрудно показать, что

1 а1 • а2 • 72 + а2 • 72 • V 1 71 11т - 1п

^о V а1 • а2 • 72 + а2 • 71 • V а1 72 • а2

Приношу глубокую признательность М.С. Никольскому за внимание к работе.

Список литературы

1. Построение оптимального решения и множества достижимости в одной задаче распределения ресурсов / Ю.Н. Киселев, В.Ю. Решетов, С.Н. Аввакумов, М.В. Орлов // Проблемы оптимального управления. М.: МАКС Пресс, 2007. Вып. 2. С. 106-120.

2. Киселев Ю.Н, Аввакумов С.Н., Орлов М.В. Построение в аналитической форме оптимального управления и множеств достижимости в одной задаче распределения ресурсов // Прикладная математика и информатика. М.: МАКС Пресс, 2007. № 27. С. 80-99.

3. Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко. М.: Наука, 1983. 392 с.

4. Никольский М.С. Упрощенная игровая модель взаимодействия двух государств // Вестник Моск. ун-та. Сер. 15. Вычислительная математика и кибернетика. 2009. № 2. С. 14-20.

Руренко Елена Николаевна ([email protected]), к.ф.-м.н., доцент, кафедра высшей математики, Вятский государственный университет, Киров.

The optimal solution of a problem of resources distribution

E. N. Rurenko

Abstract. A problem of the optimal control of a nonlinear controlled system with terminal functional is solved using Pontryagin's maximum principle.

Keywords : optimal control, nonlinear controlled system of differential equations, Pontryagin's maximum principle, switch points.

Rurenko Elena ([email protected]), candidate of physical and mathematical sciences, associate professor, department of higher mathematics, Vyatka State University, Kirov.

Поступила 10.05.2015

i Надоели баннеры? Вы всегда можете отключить рекламу.