УДК 517.977.5
И.Е. Егоров1
ОЦЕНКА АЛЬТЕРНАТИВНЫХ СТРАТЕГИЙ УПРАВЛЕНИЯ СИСТЕМАМИ С АСИМПТОТИЧЕСКИ УСТОЙЧИВЫМИ ПОЛОЖЕНИЯМИ РАВНОВЕСИЯ
В ряде прикладных задач оптимального управления удается построить управление, руководствуясь лишь анализом свойств динамики системы. Такие управления принято называть альтернативными по отношению к управлениям, удовлетворяющим принципу максимума Понтрягина. В работе рассмотрены автономные системы обыкновенных дифференциальных уравнений с терминальным целевым функционалом, имеющие при каждом фиксированном значении управляющего параметра единственное и асимптотически устойчивое положение равновесия. Показано, что в этом случае задача построения альтернативного управления может быть сведена к конечномерной задаче математического программирования. Получена оценка погрешности альтернативного управления по целевому функционалу. Приведены достаточные условия возможности получения этой оценки. В качестве примера рассмотрена математическая модель терапии лейкоза.
Ключевые слова: альтернативное управление, принцип максимума Понтрягина, асимптотическая устойчивость, функция Ляпунова.
1. Введение. Как известно, отыскание решений многих прикладных задач оптимального управления с помощью принципа максимума Понтрягина и метода динамического программирования затруднительно. Кроме того, применение численных методов оптимального управления [1] часто оказывается чрезвычайно трудоемким процессом и далеко не всегда может быть обосновано той или иной теоремой о сходимости по функционалу. Однако для ряда автономных систем с терминальным целевым функционалом, имеющих при каждом фиксированном значении управляющего параметра единственное и асимптотически устойчивое положение равновесия, удается построить допустимое
1 Факультет ВМК МГУ, асп., e-mail: ivanyegorovQgmail.com
управление, основываясь только на анализе свойств динамики системы. Такие управления принято называть альтернативными [2] по отношению к управлениям, подчиненным принципу максимума Понтрягина. В работе предложен способ априорного оценивания отклонения значения целевого функционала на альтернативном управлении от оптимального значения для указанного класса систем.
2. Математическая модель терапии лейкоза. Прежде чем сформулировать утверждения для общего случая, продемонстрируем возможность построения альтернативного управления и оценки его погрешности по функционалу на конкретном примере.
Рассмотрим математическую модель оптимальной терапии лейкоза [2]
iiIAw'-j-^ jib - fi(h)L,
N = r„N In
Na N
■-ynN-cNL-fn(h)N,
h = + u(t), 0 < u(t) < R, 0 L( 0) = L0, JV(0) = JV0, MO) = h0,
#i(L(T), N(T)) = (L(T))2 + a fiV(T) - N" 2
(1)
inf.
fi (h) = mhe
-bh
fn(h)= anhe
-bh
где Ь{Ь) и N(1) — численность здоровых и зараженных клеток соответственно в момент времени Ц /г(£) — концентрация лекарства в момент Ц , гп, Ьа, 77„, 7^, с, щ, ап, Ь, R, Ьа, N0, а, Й, Т — положительные постоянные; ко — неотрицательная константа. Замена переменных I = п = приводит систему (1) к виду
п = -гпп + 7п + сае 1 + fn(h), h = -jhh + u(t), 0 0
Щ = 1о = Ы^, n(0) = nQ = ln^, h(0) = ho,
ho iV 0
Ф(1(Т),п(Т)) = Li< + aN2a (e"«(T) - e"
(2)
inf,
где са = сЬа, п = Ясно, что для достаточно больших положительных чисел п, к парал-
лелепипед Б = Г, О^п^п, 0 ^ /г ^ /г} сильно инвариантен относительно системы (2), т. е.
(1о,щ,ко) € -С и вектор правой части соответствующей системы уравнений динамики не направлен вне I) на всей границе ¿Ш при любом допустимом значении управляющего параметра. Далее всюду считается, что (/,п, /1) € Б.
А. При и(1) = и € [0, Я] (й — фиксированная точка множества ограничений на управление) система (2) обладает единственным положением равновесия
h*(u) = — G lh
оД
. 7ft,
I (u) =- > 0,
ri
7n + cae-l*^ + fn{h*{u)) ^ n n (и) =- > (J,
(3)
являющимся асимптотически устойчивым (ввиду вещественности и отрицательности собственных значений соответствующей матрицы Якоби).
В. Соответствующую функцию Ляпунова будем искать в виде
(р (I, n, h; и) = ||/(l, n, h; и)\\2 + v (h — h*(u))2
(4)
13 ВМУ, вычислительная математика и кибернетика, № 3
где /(/, п, /г; и) — трехмерный вектор правой части системы (2) при и(1) = и, V — постоянная, которую требуется определить. Предположим, что
R
hQ < —, 7h
hraUT) = ЦТ; 0, ho, u(t) = R) = — - (— - hQ) <hm = \.
7h \7h ) b
(5)
Пусть также
Pi > О, P2 > 0, /3 € (0, 2 mm{ri,rn}),
ca<mm^(2r^/3)^(2^/3)1, \P2 Pi J
Pi(2rt - /3) -p2ca Рг(2гп — P) — pica
p з = mm
1
Щ
(6)
Тогда для
имеем
— (рт +P2an) ~ Zjh, + P > 0. Рз
( — {PlO'l +Р2ЙП) — 2-у/г + /3 2 \Рз
(I, n, h;u)J (I, n, h; u)) < ~P ■ ||f(l,n,h;u)f < ~P ■ (p(l,n,h;u)
(7)
(8)
т. е. (p (I, n, h; й) — искомая функция Ляпунова. Для вывода неравенства (8) при условиях (6), (7) нужно воспользоваться обобщением теоремы Гершгорина о локализации собственных значений [3, п. 8.1.2].
Для отыскания оптимального закона управления системой (2) выпишем соответствующие гамильтониан и сопряженную систему:
H((l,n,h), {'фъ'ф2,'фз),и) = +7i + fi(h)) + ф2(-гпп + пгп + cae~l + fn(h)) нЬф3 + ф3и,
UMp(t) = R при фз{^) > 0, UMp(t) = 0 при фз{Ъ) < 0, Ф1 = ri-фг + сае~1ф2, Ф2 = гпф2,
Фз = fl(h) - fofh(h) + Jhфз = -e~bh(l - bh) (щфi + апф2) + 7ft^з, фг(Т) = 2L2ae~21^ > 0, ф2(Т) = 2„:V;7 "ir> (е~п™ - е"й) ,
Фз(Т) = 0. Отсюда получим
t
Mt) = Ф1^)е-Г'г = Vi(0) + caJ ds,
о
ф2^) = ф2(ЩеГпг = ф2(Т)е t
—rn (T—t)
ф1(г)=ф1(0) + саф2(0) J ds,
i>z(t) = Фз(*)е~
т
-7/11 _ / g-7/is-bh(s)
(1 - bh(s)) (aiipi(s) + anip2(s)) ds.
(9) (10)
На параметры задачи дополнительно наложим следующее ограничение:
rn-ri> -^-ехр \ - max lmax(s) > . (И)
ап [ se[o,T] J
Здесь lmax(s) — точная верхняя грань множества компонент l(s; 0, (Iq, щ, ho),u(-)) фазовых траекторий системы (2) в момент времени s для всех допустимых управлений и(-). Заметим, что [2, лемма 3]
max lmax(s) < max \ l0, — \ +
se[o,T] [ rt J гфе
Убедимся в том, что в данной задаче при сделанных допущениях (5), (11) у фз(-) не более одного нуля на [О,Т) [2, теорема 2], т.е. всякое удовлетворяющее принципу максимума Понтрягина допустимое управление на [О, Т) не имеет особых участков, принимает п. в. значения 0 и R и обладает не более чем одной точкой переключения.
Достаточно показать, что у фз(-) не более одного нуля на [О, Т) (поскольку фз(Т) = фз(Т) = О
и на [О,Т] между двумя нулями фз(-) по теореме Ролля обязательно расположен нуль фз(-))- Для этого в свою очередь с учетом представления (10) и того, что 1 — bhmax(t) > 0 при каждом t € [0,Т] (ввиду второго неравенства в (5)), достаточно установить наличие не более одного нуля на [0,Т] у функции
8(t) = e-rit (o^i(i) + anMt)) = ИМ*) + "nM0)e(r""ri)t. (12)
Если ^2(0) = 0, то, согласно равенству (9), для всех t € [0,Т] i>i(t) = фi(0) > 0 (так как ф\{Т) = ^i(T)e"r'T > 0) и, стало быть, 8{t) = щф^О) > 0.
Пусть ^2(0) ф 0. Тогда на основании соотношений (9), (11), (12) приходим к выводу, что
S'(t) = ф2(0)е^~г^ (,щсае+ ап(гп - г,)) (13)
сохраняет на всем отрезке [0,Т] один и тот же знак, равный знаку ^(О), т.е. б(-) возрастает при ^2(0) > 0 и убывает при ^(О) < 0. Следовательно, б(-) имеет не более одного нуля на [0,Т], что и требовалось доказать. Предположим, что
г
ап > сащ J ds, (14)
о
и докажем, что с увеличением времени функция фз(-) может менять знак только с плюса на минус, т.е. произвольное удовлетворяющее принципу максимума Понтрягина допустимое управление может переключаться лишь с R на 0, но не наоборот. Возможны следующие ситуации:
• если ^2(0) = 0, то из того, что в этом случае S(t) = щфi(0) > 0 при любом t € [0,Т], и из представления (10) вытекает положительность функции фз(-) на [0,Т), а отсюда и отсутствие переключений;
• если ^2(0) ф 0 и 6(Т) = 0, то на [0,Т) функция <5(-), будучи строго монотонной, не обращается в нуль и сохраняет знак, откуда в силу представления (10) следует, что фз(-) тоже не обнуляется и сохраняет знак на [0,Т), т.е. переключений нет;
• если ^2(0) ф 0 и 6(Т) < 0, то ввиду представления (10) функция фз(-), меняющая знак на [0,Т] не более одного раза, вблизи Т принимает отрицательные значения, а потому с увеличением времени переключение ump(') возможно лишь с R на 0;
• если ^2(0) < 0 и 6(Т) > 0, то на [0,Т) функция б(-), будучи убывающей (согласно соотношениям (13), (11)), принимает только положительные значения, что на основании представления (10) влечет за собой положительность функции фз(-) на [0,Т) и тем самым отсутствие переключений;
• если ^2(0) > 0, 6(Т) > 0, ф\{0) ^ 0, то 6(0) > 0 и, значит, на [0,Т) функция б(-), будучи возрастающей (согласно соотношениям (13), (11)), принимает только положительные значения, т.е. переключений нет.
Рассмотрим оставшийся случай ^(О) > О, 6(Т) > О, ^(О) < 0. Из равенства (9) и из ^(О) > О следует, что ф1(-) возрастает на [0,Т]. Поскольку ^(О) < 0, 'ф\{Т) > 0, то найдется единственная точка € (О, Т), в которой т
№) = ФМ + саф2{0) I йз = 0, ^(0) ^ -саф2(0) I ёз.
о о
Поэтому вследствие неравенства (14) т
5(0) = 0,^1(0) + апф2(0) ^ ^(0) - сащ ^ ^ ^ 0.
о
Кроме того, в силу соотношений (13), (11) б(-) возрастает на [0,Т], так как ^(О) > 0. Стало быть, 6(t) > 0 при всех t G (О,Т], поэтому из представления (10) вытекает положительность функции фз(-) на [О,Т) и тем самым отсутствие переключений у ump(')-
Таким образом, установлено, что с увеличением времени фз(-) может менять знак только с плюса на минус, т.е. ump(') может переключаться лишь с R на 0. Примем еще одно ограничение
hmax(T) = h(T; 0, ho,u(t) = R) = --(—-h0) < \ • -, (15)
7h \7h ) 27h
равносильное в принятых допущениях неравенству
1 / JL _ h \
■ (16)
^ \ i /
С. Используя соотношения (2), (4), (15), нетрудно проверить, что
(р (I, п, h, 0) ^ р> (I, п, h, R) (17)
в каждой точке любой допустимой фазовой траектории системы (2) на отрезке времени [0,Т]. Из неравенства (17) следует, что функция Ляпунова p>(l(t),n(t), h(t),u(t)), рассматриваемая на произвольном фиксированном допустимом процессе (/(•), n(-), h(-),u(-)) системы (2), подчиненном принципу максимума Понтрягина, не возрастает при переходе через точки переключения соответствующего управления (которое, как было показано выше, не имеет особых участков, принимает п. в. значения Оийи обладает не более чем одним переключением, причем только с R на 0, но не наоборот).
3. Альтернативное управление, оценка погрешности. Построим допустимое управление, основываясь лишь на анализе свойств динамики системы (2).
Рассмотрим конечномерную задачу нахождения минимального по значению целевого функционала положения равновесия (I* (й), п* (й), h* (й)), задаваемого равенствами (3):
Ф(1*(й),п*(й)) —min . (18)
ие[о,я]
Будем считать, что существует й* € [0, R) — решение задачи (18), тогда
Ф(Г (ü*),n* (и*)) = min Ф (I* (й),п* (й)). ue[o,R]
В соответствии с [2] управление ü(-), альтернативное по отношению к экстремальным управлениям, строится так, чтобы максимально быстро приводить концентрацию лекарства к значению h* (и*) и впоследствии поддерживать ее постоянной до конечного момента времени. Пусть
hQ < h* (ü*), ü* < R.
Тогда
ü(t) = R, 0 < t < r,
h(T) = h*(ü*), Ü(t) = ü*, h(t) = 0, r<t^T,
2 \ _ Ihhp
т = — In-> 0.
7 h 1
и R
Перейдем к разбору общего случая.
Рассмотрим автономную управляемую динамическую систему
x(t) = f(x(t),u(t)), u(t) € Р, t^ О, ж(0) = ж0, (20)
где t ^ 0 — время, ж € Жп — фазовый вектор, а значения управляющей функции u(t) выбираются из заданного компакта Р С Ж™. Начальное состояние системы ж° € Шп.
Пусть D — некоторая компактная область в 1", е D. Будем считать выполненными достаточные условия существования и единственности для произвольной функции и(-) € £ос ([0, +оо), Р) соответствующего решения системы (20) с начальным состоянием ж(0) € D. Предположим, что D сильно инвариантна относительно управляемой системы (20).
Рассмотрим систему (20) на конечном временном отрезке [0,Т] (Т > 0). В качестве допустимых программных управлений возьмем класс Uq^t всех измеримых функций и : [0, Т] —> Р. Качество управления оценивается терминальным функционалом
J(u(-)) = Jt,o,xO («(•)) = Ф(я(Т; 0, ж°, «(•))) —> inf , (21)
u(-)eUo,T
где Ф : D ^ Ш — непрерывно дифференцируемая функция, ж(-; 0, ж°, и(-)) : [0,Т] —> Шп — фазовая траектория системы (20), выходящая из начальной позиции (0, ж0) под воздействием допустимого управления и(-). Обозначим
J* = , inf «/(«(О)-
Далее полагаем, что выполнены достаточные условия существования оптимального управления [4, теорема 3].
Введем следующие предположения.
Предположение А. Пусть для любой точки йеР система
x(t) = f(x(t),u), tz 0, (22)
зависящая от и как от параметра, имеет в D единственное положение равновесия х*(й), являющееся асимптотически устойчивым.
Предположение В. Пусть при каждом и € Р найдется такая непрерывно дифференцируемая в D функция Ляпунова ср(-,й), для которой выполнено условие положительной определенности
(р(х,й) > 0, х € D \ (ж*(й)}, (р (х*(й), й) = 0 (23)
и условие отрицательной определенности производной в силу системы (22) в виде
(Vxip(x, й),/(ж, и)} ^ —/3 ■ <р(х, й), a;GD, ¡3 = const > 0. (24)
Тогда если ж (t; ti, ж1, й), t € [¿1,^2], h > ¿ъ есть фазовая траектория системы (22) при фиксированном и € Р, соответствующая начальной позиции (t\, ж1) € [0, +00) х D, то
ср (ж (t2;tux\u) ,й) < ср (ж\и) ^ ^^ > о.
В силу достаточных условий асимптотической устойчивости в терминах функций Ляпунова ж (¿2? ¿1, ж1, и) —> х*(и) и Ф (ж (¿2? ¿1, ж1, й)) —> Ф(х*(й)) при i2 +оо. Поскольку поверхности уровня {ж € D| (р(х,й) = с}, с > 0, стягиваются в точку х*(й) при с ^ 0+ [5, гл. 1, п. 1.3], то
Дфй(с)= max |Ф(ж) - Ф (ж*(й))| -> 0, й € Р.
x£D:ip(x,u)^c с—>-0+
Очевидно, что A#,«(0) = 0, < ДФ)й(с2), 0 < а < с2, и G Р.
На основе этих рассуждений будем искать точку и* € Р как решение конечномерной задачи математического программирования
Ф (ж* (й*)) = ттФ (х*(й)). (25)
иЕР
Пусть исходя из физического смысла исследуемой задачи или же из применения какой-либо процедуры улучшения управления с начальным приближением u(t) = и* построена управляющая функция й(-), для которой требуется выяснить, насколько велико отклонение значения функционала J (й(-)) от точной нижней грани J*.
Функцию й(-) будем рассматривать в качестве альтернативного управления. Будем считать, что на некотором отрезке [т, Т], где 0 ^ г < Т, примыкающем к концу временного промежутка [О, Т], она принимает постоянное значение и*, определяемое соотношением (25):
u{t) = u*, r^t^T, (26)
(см. (19)).
Определение. Будем говорить, что допустимое управление и(-) удовлетворяет условию С1, если оно начиная с некоторого момента времени i0 € [О, Т) является с точностью до множества нулевой меры Лебега кусочно-постоянным с конечным числом точек переключения, не превышающим *-/ — 1, т. е.
u(t) = иг € Р, t €. [ti-i,ti), i = l,q, и(Т)=и9, 0^tQ<h<...<tq = T,
и для соответствующей фазовой траектории ж(-) системы (20) при переходе через точки переключения выполнены неравенства
ср (x(ti), иг) ^ с • ср (x(ti), иг~1) , i = 2,q, с = const ^ 1, (27)
ограничивающие значения скачков функции Ляпунова, задаваемой условиями (23), (24), по управляющей переменной.
ПредположениеС. Пусть всякое удовлетворяющее принципу максимума Понтрягина в задаче (20), (21) допустимое управление ump(') удовлетворяет условию С1 с параметрами q, ¿¿-ь йг, г = l,q, с, причем to, q, с взяты не зависящими от ump(), а пара (й1, #) принадлежит не зависящему от ump(') множеству С/1'® С Р х Р. Независимость ;/'. / 2. <-/ — 1, и tj, j = 1, g — 1, от ump(-) не предполагается.
Отметим, что предположения А, В, С выполняются для задачи (2), при исследовании которой соответствующие утверждения помечались для удобства теми же буквами.
Пусть также для каждого t € [О, Т) Xt С D есть некоторая внешняя оценка множества достижимости системы (20) в момент времени t (Хо = {ж0}).
Теорема. Пусть для задачи оптимального управления (20), (21) выполнены предположения А, В, С и дано альтернативное управление й(-), удовлетворяющее требованию (26) при фиксированном т € [0,Т) и условию С1 с параметрами to (если не удается подобрать to, меньшее т, то всегда можно положить to = т), q, с, й1 = й (to + 0), йР = й(Т — 0) = й*. Тогда имеют место оценки
|Ф (х(Т)) — Ф (ж* (й*))\ ^ Д# у* { с®-1 • e_,3(T_i"0) • sup ^(ж,«1)],
\ J
J (й(-)) — J"* ^ |Ф (ж(Т)) - Ф (ж* (й*))\ + sup Дф,о« ( С«"1 •е-'3(т-*0) • sup ^(х,!)1) ) . (28)
(а,1,а,«) ей1'« ' \ xexio J
Следствие. Если условия теоремы выполнены для сколь угодно больших Т, параметры to, q, uс можно выбрать не зависящими от Т и соответственно от имр(-) = ump,t{ ), u— конечное множество, to, q, с можно взять не зависящими от Т, то
0^ Jt (йт(-)) - J*,t->0.
Т—f+oo
Приведенная теорема позволяет при выполнении определенных условий вычислить верхнюю оценку отклонения значения целевого функционала на альтернативном управлении от оптимального значения. Ключевым условием является соблюдение для любого удовлетворяющего принципу максимума Понтрягина допустимого управления ограничений (27) на величины скачков функции Ляпунова при переходе соответствующей фазовой траектории через точки переключения. Это довольно жесткое требование, для проверки справедливости которого чрезвычайно сложно отыскать какие-либо простые формальные достаточные условия, поэтому необходимо использовать принцип максимума и проводить исследование характеристической системы, что и было проделано в конкретном примере.
Для задачи (2) имеем
to = to = 0, q = q = 2, с = с = 1, й1 = R, й2 = и*,
U1'2 = {{{),{)), (R,R), (i?,0)}, (29)
|Л-Ф(ж*МТ-0)))| ^ тах Дфй2 {е~рт • <р (х^й1)) (30)
(й1,и2)еи1>2 '
(константа ¡3 определяется согласно допущениям (6), а функция (р задается равенствами (4), (7)).
Несмотря на то что параметры (29) не зависят от Т, оценка (30) получена не для сколь угодно больших Т ввиду наличия ограничений (14), (16), т. е. утверждать сходимость |«7*,т — Ф (ж* (и*,т(Т ~ 0)))| к нулю при Т —ь + оо мы не можем. Вместе с тем представленные ниже результаты численных расчетов показывают относительную малость правой части оценки для достаточно больших допустимых Т.
Отметим еще следующее важное обстоятельство. На первый взгляд может показаться, что к положению ж* (й*) и соответственно к значению функции Ф (ж* (й*)) систему (20) быстрее всего приводит постоянное управление = й*. Однако, как будет показано в следующем пункте, это не всегда так: альтернативное управление с определенными переключениями может оказаться гораздо более предпочтительным и по значению целевого терминального функционала, и по малости правой части оценки вида (28), и по скорости приближения соответствующей фазовой траектории к ж* (й*).
4. Результаты расчетов. В задаче (2) возьмем следующие значения параметров [2]: п = гп = = 0.25, 1г = 1п = 1н = 0.01, са = 3.7 • 10"5, щ = 4, ап = 1.8, Ъ = 0.01, Д = 1, Ьа = = Ю10, Ь0 = 1.8 • 108, Щ = Ю8, к0 = 0, а = 0.75, N = 2.7 • 107, 1 ^ Т ^ 68, Р1 = р2 = 1, /3 = 0.45; р3 определяется из предпоследнего соотношения в (6). Условия (5), (6), (11), (14), (16) здесь выполнены.
Численно решая конечномерную задачу оптимизации (18), получаем й* = 0.008226 < 1 = Я. Находим альтернативное управление
- ¡П = 11 0^£<т = 0.826049, " \й* = 0.008226, £ ^ т.
Функция Ф(/,п) из (2) при указанных значениях параметров имеет крайне большой разброс значений и ограничена снизу положительным числом на В, т. е. 3* > 0. В связи с этим предпочтительнее рассматривать эквивалентную ей с точки зрения отношения порядка функцию 1пФ(/, п). Тогда оценка альтернативного управления преобразуется к виду
1п7(Й(-)) -1пЛ ^ /1(Т) =
1пФ (7(Т),п(Т)) -1пФ(Г (й*),п* (й*))
+
+
тах А1пф й2 (е рт • (р (10, п0, К^и1)) ,
(й1,и2)еи1>2
¿(^ < еМт)
Ниже приведен график зависимости величины /¿(Т) от конечного момента времени Т. Невысокая скорость убывания последней связана с небольшим значением параметра /3 Е (0, 2 тт{гг, гп}). Если Г[ и тп взять больше, то можно будет выбрать большее /3, и в таком случае /¿(Т) будет сильнее убывать с увеличением Т. Также на рис. 1 изображен график зависимости от Т величины
р(Т) = 1пФ (7(Т),п(Т)) - 1пФ (Г (й*) ,п* (й*))
60 т
Рис. 1. Зависимость и(Т) и р(Т) от конечного момента времени Т
У 20
15
10
5
0
Рис. 2. Зависимость ро(Т) и р(Т) от конечного момента времени Т
На рис. 2 приведен график зависимости от Т величины
р0(Т) = InФ ([/, п] (Т; 0, (/0, п0, h0),u(t) =й*))-]пФ (Г (й*), п* (й*)).
Видно, что при Т G (0, 70] р0(Т) > р(Т), т.е. Ф ([/, n] (Т; 0, (/0, n0, MX*) = й*)) > Ф (/(Т),Й(Т)),
и что ро(Т) = |р0(Т)| с увеличением Т приближается к нулю гораздо медленнее р(Т) = \р(Т)\. Это свидетельствует о том, что в данном случае альтернативное управление й(-), обладающее одной точкой переключения, предпочтительнее постоянного управления u(t) = й*.
5. Заключение. В работе изложен подход к нахождению оценок управлений, альтернативных по отношению к экстремальным управлениям, для автономных динамических систем с терминальным целевым функционалом, обладающих при каждом фиксированном значении управляющего параметра единственным и асимптотически устойчивым положением равновесия. Предложенная методика основывается на применении аппарата функций Ляпунова и результатов предварительного исследования систем с помощью принципа максимума Понтрягина. Описанный подход продемонстрирован на примере, в котором рассматривается математическая модель оптимальной терапии лейкоза.
СПИСОК ЛИТЕРАТУРЫ
1. Васильев Ф.П. Методы оптимизации. М.: Факториал Пресс, 2002.
2. Bratus A. S., Fimmel Е., Todorov У., Semenov У. S., Nürnberg F. On strategies on a mathematical model for leukemia therapy // Nonlinear Analysis: Real World Applications. 2012. 13. P. 1044-1059.
3. Цехан O.B. Матричный анализ. М.: Изд. центр ГрГУ им. Янки Купалы, 2010.
4. Субботина H.H., Токманцев Т.Б. Об эффективности сеточного оптимального синтеза в задачах оптимального управления с фиксированным моментом окончания // Дифференц. уравн. 2009. 45. № 11. С. 1651-1662.
5. Горяченко В. Д. Элементы теории колебаний. М.: Высшая школа, 2001.
Поступила в редакцию 19.12.12
EVALUATION OF ALTERNATIVE CONTROL STRATEGIES FOR THE SYSTEMS WITH ASYMPTOTICALLY STABLE EQUILIBRIUM POSITIONS
Egorov I. Ye.
In some applied optimal control problems it is possible to construct a control function only with the help of the analysis of the system dynamics. Such controls are called alternative to the controls satisfying Pontryagin's maximum principle. In this article we consider autonomous systems of ordinary differential equations with a terminal objective functional, which have the unique asymptotically stable equilibrium position for each fixed value of the control parameter. It is shown that in this case the task of the alternative controls' construction can be reduced to some finite dimensional problems of mathematical programming. The evaluation of the constructed alternative control with respect to the objective functional is found. Sufficient conditions for the possibility of obtaining this evaluation are derived. A mathematical model of optimal leukemia therapy is considered as an example.
Keywords: alternative control, Pontryagin's maximum principle, asymptotic stability, Lyapunov function.