minimization and obtaining the necessary and sufficient conditions for the existence of the minimum of functional is set.
Key words: Boundary and initial-boundary value problems on graph; generalized solutions; one-valued solvability; optimal control.
УДК 517.977
ОБ устойчивости одной процедуры управления
С ОПТИМАЛЬНОЙ ГАРАНТИЕЙ РЕЗУЛЬТАТА
© М.И. Гомоюнов, Н.Ю. Лукоянов
Ключевые слова: оптимальное управление; дифференциальные игры; устойчивость. Рассматривается задача о вычислении оптимального гарантированного результата и построении соответствующих оптимальных стратегий обратной связи в линейной динамической системе, управляемой в условиях помех. Оптимизируется евклидова норма совокупности отклонений движения в заданные моменты времени от заданных целей. Исследуется вопрос об устойчивости разрешающей процедуры, основанной на построении выпуклых сверху оболочек вспомогательных функций из метода стохастического программного синтеза.
Рассматривается управляемая динамическая система
(х/(Ь = Л(Ь)х + /(Ь,и^), Ьо ^ Ь<$, х € М™, и € Р С Мг, V € Q С М5, х(Ьо) = хо, при показателе качества
7 = с1Тр.
Здесь Ь — время, х — фазовый вектор, и — вектор управления, V — вектор помехи; ¿о, $ и € [Ь0,^|, г = 1,Ж, зафиксированы, причем $г+1 >$г, г = 1,Ж — 1 и = $; Р и Q
компактны; Л(Ь) и /(Ь,и,и) непрерывны; (рг х п) -матрицы ^ и п -векторы сг заданы, г = 1, N; || • || — евклидова норма; выполнено условие седловой точки для маленькой игры [1, с. 79]; цель управления — минимизация показателя
В рамках теоретико-игрового подхода [1, 2] ставится задача о вычислении оптимального гарантированного результата Г0(Ьо,хо) и построении закона управления по принципу обратной связи, обеспечивающего этот результат. Согласно [2-4], эта задача может быть решена на основе следующей процедуры.
Пусть : т1 = Ьо, Г] <т^+1,] = 1,к, т&+1 = $}, € Д&, г = 1,Ж, и X(Ь,т) — мат-
рица Коши для уравнения (х/(Ь = Л(Ь)х. Для ^ = 1,к + 1 определим множества в± С М™ и функции ф±(т), т € в±. При ^ = к + 1 полагаем в++1 = {0}, ф++1(т) = 0 и
в-+1 = {т € М™ : т = I, I € МРм, ||1|| ^ 1}, ф-+1(т) = — (т,см), где верхний индекс Т означает транспонирование. Для текущего ] определяем
0+ = 0+1, Д*(т)= / шштах(т,Х($,т)/(т,ил,))йт, ф+(т) = {Д* + ф7+1}'с + (т),
° ° J п£Р ° з
2485
где символ {"ф}*с(т) означает выпуклую сверху оболочку функции 'ф(ш) на множестве G, а {■, ■} — скалярное произведение векторов. Далее, если Tj не совпадает ни с одним из §i
из показателя Y, то полагаем G- = G+, ф-(-) = Ф+(^)- Если же Tj = tfh, определяем
Q(m) = {(v,m*,l) е R х G+ х RPfe : т = vm* + XT(§h, $)D-[l, v ^ 0, ||l||2 ^ 1 — v2},
G- = {m : Q(m) = 0}, ф-(т)= max \v^+(m*) — {l,Dhch}].
j j (v,mt.,l)£Q(m)
Пусть множества G± и функции ф±(^), j = 1,k + 1, построены по этой же процедуре, но вместо X($,Tj), X(Tj,$) и A^j(■) использовались их приближения — невырожденные матрицы X(&,Tj), X(Tj,$) и непрерывные неотрицательные функции Atpj(■), такие, что
II*(0,Tj) - X(0,Tj)ll < 6, IIхiTj,0) — XiTj,0)11 < £1, \Mj(m) — Ьф](m)\ < 6, m є R”.
Пусть компакты G± С M” и непрерывные функции ф±(т), т є G±, таковы, что
G± С G± С G± + В[0,{з], \Ф±(т) — ф±(т)\ ^ {4, т є G±,
где B[0, {3] С M” — шар радиуса {3 с центром в нуле. Определим систему величин e±(x) = max[{m,X (0,Tj)x) + <р±(т)], x є M”, j = 1,k + 1.
шєд±
Пусть управление формируется так, что u = Uj, t є [Tj,Tj+1), j = 1,k, причем max{Xj — s°,f(Tj,Xj,v)) ^ minmax(Xj — s°,f(Tj,u,v)) + IIx(Tj) — Xj|| ^ {б,
veQ ueP v&Q
m0 Є arg max
m&G +
-- {є + є(^ - to))XT (ÿ, Tj )m°/^l + pCTiVj^i2,
(m,X(ÿ, Tj )xj ) + ф+(m) - {є + e(Tj - to))^+iXXT(&jm)\2
Теорема. Для любого (> 0 можно указать є(() > 0 и 5((,є) > 0, выбрать какие-либо 0 <є^є(() и разбиение А^ с диаметром ^ 5((,є), а затем указать >0, д = 1, 6, так, что будет справедливо неравенство |Г0(і0,х0) — Є:1-(х0)і ^ С,
а указанный закон управления будет гарантировать неравенство 7 ^ Г0 +
ЛИТЕРАТУРА
1. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985.
2. Krasovskii A.N., Krasovskii N.N. Control under Lack of Information. Berlin etc.: Birkhâuser, 1995.
3. Лукоянов Н.Ю. К вопросу вычисления цены дифференциальной игры для позиционного функционала // Прикладная математика и механика. 1998. Т. 62. Вып. 2. С. 188-198.
4. Корнев Д.В. О численном решении позиционных дифференциальных игр с нетерминальной платой // Автоматика и телемеханика. 2012. № 11. С. 60-75.
БЛАГОДАРНОСТИ: Работа выполнена в рамках программы Президиума РАН «Динамические системы и теория управления», при финансовой поддержке УрО РАН (12-П-1-1002), а также при поддержке РФФИ (12-01-00290-а, 12-01-31300-мола).
Gomoyunov M.I., Lukoyanov N.Y. STABILITY PROPERTIES OF CONTROL PROCEDURE WITH OPTIMAL GUARANTEE OF RESULT
2486
A problem of calculating the optimal guaranteed result and constructing the corresponding op-timal feedback strategies is considered for a linear dynamical system controlled under disturbances is considered. The Euclidian norm of a set of motion deviations at given instants of time from given target points is optimized. Stability properties of a solving procedure based on constructing upper convex hulls of auxiliary functions from the method of stochastic program synthesis are investigated.
Key words: optimal control; differential games; stability.
УДК 519.85, 517.97
ОБ УСТОЙЧИВОЙ СЕКВЕНЦИАЛЬНОЙ ТЕОРЕМЕ КУНА-ТАККЕРА В ВЫПУКЛОМ ПРОГРАММИРОВАНИИ В РАВНОМЕРНО ВЫПУКЛОМ ПРОСТРАНСТВЕ И ЕЕ ПРИЛОЖЕНИИ
© А.А. Горшков
Ключевые слова: выпуклое программирование; секвенциальная оптимизация; параметрическая задача; теорема Куна-Таккера в недифференциальной форме; двойственная регуляризация; оптимальное управление; неустойчивые задачи.
Обсуждаются устойчивая к ошибкам исходных данных секвенциальная теорема Куна-Таккера в недифференциальной форме для параметрической задачи выпуклого программирования в рефлексивном пространстве и возможности ее приложения при решении неустойчивых задач оптимального управления, обратных задач.
Постановка задачи. Рассматриваем параметрическую задачу выпуклого программирования
(Pp,г) f 1 (z) inf) A1 z = b1 + p, g1 (z) ^ r, z €V C Z, p € B, r € Rm — параметры,
где f1 : V ^ R1 — Липшицев строго равномерно выпуклый функционал; A1 : V ^ B — линейный непрерывный оператор; b1 — заданный элемент; g1 = (gl ,...,g^m): V ^ Rm — векторный функционал с выпуклыми липшицевыми компонентами gi, i = 1,... ,m, V C C Z — ограниченное выпуклое замкнутое множество; Z — равномерно выпуклое банахово пространство; B — рефлексивное банахово пространство; ö € [0, ¿о], ö0 > 0 — некоторое фиксированное число. Верхний индекс ö характеризует ошибку задания исходных данных задачи, при этом (P£,r ) обозначает невозмущенную (исходную) задачу. Будем считать, что выполняются следующие оценки \fl(z) — f°(z)\, \gl(z) — g°(z)\^ Kö, V z €V, \\Alz — — A°z\\ ^ Kö(1 + ||z||) Vz € Z, Wh1 — h01| ^ Kö с некоторой не зависящей от ö постоянной K> 0. Обозначим: V^^r = {z €V: \\A0z — b0 — p\\ ^ e, g0(z) ^ ri + e, i = 1,... ,m}, e ^ 0. Определим выпуклую полунепрерывную снизу функцию значений ß0 : B х Rm ^ R1 U {+^}
задачи ( P°r ): ß0(p,r) = lim ß0(p,r), ߣ0(p,r) = inf f°(z), ße(p,r) = +rc>, если V^£r =
£^+0 zev°^r
= Примем обозначение L^ r(z,X,ß) = f1 (z) + {X, A1 z — b1 — p) + {ß,g1 (z) — r) и определим
двойственную задачу V1r (X, л) = inf LP r (z, X, л) ^ sup, (X, л) € B* х R+m, а также элемен-
p’ z£V p’
ты z* r = argmin{f0(z) : z € V0,r}, z1 [X, л] = argmin{Lp,r(z, X, л) : z € V}. Обозначим через (XP’a, ßp’a) произвольную точку в B* х Rm, дающую на этом множестве максимум функционалу R^a(X, л) = Vpr(X, л) — a||X||2 — а\л\2, (X, л) € B* х Rm.
2487