2005 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА Сер. 10 Вып. 3
ПРОЦЕССЫ УПРАВЛЕНИЯ
УДК 519.3
В. Э. Вишневский
РАЦИОНАЛЬНЫЕ АППРОКСИМАЦИИ В НЕЛИНЕЙНЫХ ЗАДАЧАХ БЫСТРОДЕЙСТВИЯ
Введение. В этой работе разрабатывается и обосновывается аналитический алгоритм, допускающий численную реализацию построения оптимального по быстродействию управления, переводящего начальное состояние в начало координат 0, для системы управления, имеющей следующую математическую модель:
4 = АЯ + Ви + ^ (д, *), г € [0, Т], и € П„[0, Г],
и(г) € и[г) с яг, q0evq с дп, V* ) э о, (1)
V* е [о,т], ^ (0,0,0 = 0,
телесный компакт иг непрерывен по £ € [0,Т]; функция •) измерима и равно-
мерно суммируема на [0,Т]; для любой конечной области С Яп функция
Пи=ГЬоо[0,Т] либо Пп=%[0,Т]}; Т < оо или Т = оо.
На .Р и Г^[0,Т] наложены типичные ограничения, обеспечивающие достаточные условия существования и единственности решения задачи Коши для системы (1).
В основе предлагаемой методики лежит процедура преобразования системы (1) в свою укороченную линейную систему (на языке теории возмущений - в нулевое приближение)
С} = АС} + Вщ
и е пи [о,т], и(г)е и!г), *€[о,г], (2)
для которой должна быть решена задача быстрейшего перевода начального состояния С}0 - образа точки 6 Т>с} - образ множества Т>д) с помощью старого управления и при старых ограничениях в двигающуюся известным от и и t образом точку (£, [и]о) - образ точки 0 Е Т>д. Подчеркнем, что нелинейное отображение (2* (£, [гх]о) есть известная функция своих аргументов £ и [г1]£, и е Пи ПРИ * ^ Т. Если преобразование, о котором говорилось выше, окажется вычислимым, обратимым аналитически и определенным в области а обратное к нему преобразование будет
© В. Э. Вишневский, 2005
вычислимо в то формулы, представляющие оптимальное решение задачи (2), позволят сравнить Тпнп и Т и в случае Ттт ^ Т пересчитать величину <2ор (£, [гх0р]о) на величину qov [гл0р]о)> обладающую свойством
Таким образом, основная нагрузка алгоритма возложена на вычисление упомянутого выше преобразования и привлечение некоторых аналитических средств анализа в случае, когда оптимальная траектория <дор (<, [глор]о), оставаясь компактной, покидает область Рд и формулы вычисления обратного преобразования системы (2) в исходную систему (1) становятся неопределенными.
_/г\
Возвращаясь к системе (1), заметим, что выпуклость компакта и^ не предполагается, а липшицевость отображения .Р по д и и оказывается достаточной [1, 2] для
того, чтобы в любой конечной «области» Т>я х х [О, Т] для любого е > 0 вектор-функция Е (д, и, I) допускала равномерную по (д, и) в соответствующей норме пространства Ь(1уоо)[0,Т] по £ аппроксимацию вектор-многочленом Т^и^). То есть для всякого к Е 1: п следует, что
3 Тк € а*=1 V оо,
РЫЛ
из определения
Ч^8*—(Г, - ^*(0»М)|1хв[о,т] ^ е.
В общем случае, когда известно об Е лишь, что она липшицева (с «константой» £(•) € £а[0,Т]) и суммируема, вычисление коэффициентов сЙ^ и степеней N = ^к = - задача, алгоритмически не разрешимая. Однако в широком классе важных случаев аппроксимирующие многочлены Ть могут быть указаны в явном виде. Ниже предполагается, что в системе (1) функции Е (д, гд, £) - многочлены по д и и с
коэффициентами от 6 Ьа [0,Т], а 1 V оо.
Для преобразования системы (1) в свою укороченную форму (2) предлагается использовать каноническую технику Ли в форме Депри. Гамильтонова форма уравнений не является необходимой, однако при построении аналитических алгоритмов, на основе которых должны строиться численные методы, оказывается предпочтительней проводить все буквенные аналитические операции с одной функцией Гамильтона Н(рот 2п переменных, чем обрабатывать п функций ^х,..., каждая из которых зависит от п переменных ..., <?п ПРИ го > 1. И разница тем выше, чем больше го. Однако есть еще одно обстоятельство в пользу гамильтонова формализма, оно состоит в том, что в задачах управления с использованием принципа максимума каноническая техника отражает концептуальный характер предлагаемой методики. В заключение заметим, что система (1) в силу упрощающих предположений определена во всем пространстве соответствующих комплексных переменных д, и, т. е. правая часть дифференциального
уравнения для (1) задана элементом Вейерштрасса - многочленом по q и и с коэффициентами от t.
1. Достаточные условия голоморфности генератора Ли—Депри. Функция Гамильтона для системы (1) имеет вид
H(p,q,u,t) =< Aq + Ви + е- F{q,u,t)\p>, (3)
где билинейная форма
п
< а\Ь > =
к=1
и в комплексном случае со скалярным произведением не совпадает, е € С1. При е = О нулевое приближение для системы (1) определяет функция Я =< Aq + В и |р >, а при е = 1 - функция Я =< Aq + Ви -Ь F(q,u,t) | р >. Тем самым в Н выделено нулевое
приближение Но d= < Aq + Ви\р > и возмущение еН\ d= е < F(q, u, t)\p > так, что
Я (р, д, и, £) = Я0 (р, д, и) + е • Ях (р, u, t). (4)
Параметр е может быть введен и другими способами, вопрос же наилучшего выбора е-параметрического представления может в зависимости от критерия качества представлять самостоятельную задачу.
В неуправляемых задачах аналитической динамики каноническое преобразование {р, q} {V, Q}, переводящее гамильтониан Я в Ho(V, может быть формально осуществлено преобразованием Ли с генератором 5(р, q, t,e) как формальный локально-общий интеграл в форме Коши системы уравнений
/ dq _ OS d£ _ Э5 \
( de ~ dp' de ~ dg > ] (5)
В работе [3] доказано, что в случае, когда в выражении (4) Но и Н\ - многочлены и Spec А - спектр матрицы А не вырожден (определение см. ниже), преобразование функции Н в Но может быть осуществлено голоморфным в непустой области
Uо (Л) Э Q, И ^ 1 + 6 решением q {е, Q,t, [u]*),
системы (5) с аналитическим по фазовым переменным р,д гамильтонианом-генера-тором S (p,q,t,e,[u]о), t € [0, г], т > 0. В результате алгоритм преобразования Я (p,q,u,t,e) в свое нулевое приближение Ho(P,Q,u) состоит из построения генератора Ли-Депри
ос
S (р, <г,*,е, К) = £(em/m!)Sm+i(p,9,t,Mo)> (6)
771=0
m-приближения
которого Sm (p,q,t,[u]I) вычисляются рекуррентно через известные величины Яо, Hi и Sm—1? согласно [3], по формулам
0 • DoH^Hr, (m - \)Dm-iH\ + DmH0 - dtSm = 0, m > 1, (7)
где"£>т - скобка Пуассона,
порожденная потенциалом Sm.
Следующая часть алгоритма состоит в вычислении по генератору (6) при условии (7) соответствующих формул, представляющих локально-общий интеграл в форме Коши системы (5).
С точностью до квадратур решение (7) представляет m-приближение генератора S из формулы (6) следующим образом:
/М К 1
л Е Е Wftj?p (*)в<з-чл>«с?(а + (8)
|J|=a М=/9 |?|=1
с= (ci,...,cn), С = (Ci,...,C7n).
Здесь V = JdtVi, ск и Ск - константы интегрирования нулевого приближения (2), V d= V (t) =f fg е~АтВи (r)dr. Дифференциальный оператор Vi имеет вид
V*= Е & (лЗ»(<)»Мо. с, С, К, У) (9)
в котором г]к - многочлены своих аргументов, вычисленные в явном виде в работе [3], h-jiv (t) — коэффициенты многочлена Hi, A¿ - собственные значения матрицы А. В работе [3] доказана теорема голоморфности генератора 5.
Теорема 1. Достаточным условием сходимости ряда (6) при | е | ^ 1 + <5 и тогда голоморфности генератора S по р, q при функциональных, в соответствующих нормах, ограничениях на h, Т и на множество управлений и их значений является функционально-аналитическое неравенство
V(l + V_1A)
max max max \cK + VK (t) I < - /rriN ——-(10)
Uc,c пеШ «€[о,п 1 * w 1 2ft (T) exp ((Д + 2A)T)v 1
где
h (T)^ max II hrtp(.) ■ и>(.) 11^(0,T], (И)
и далее определены величины
Vd= min |<j-t|A>|, Д d= max |<J-?|A>|, |J|=2,|¿|=1 131=2,14=1
A =f min I A« I, A =f max | XK |.
(12)
Условие невырожденности У+ А ф 0 определяет, согласно неравенству (10), непустую по фазовым переменным q и управлениям и 6 [0, Т] область сходимости ряда (6). В работе [3] рассмотрен общий случай вырождения, т. е. любые резонансы Пуанкаре, в частности V -Ь А = 0. Доказано, что гарантировать равномерную сходимость по £ можно на конечном промежутке [0,Т*) Э так как преобразования Ли-Депри в этом случае содержат вековые и смешанные члены.
Оценка (11) при некоторых ограничениях, тем не менее охватывающих ряд практически важных случаев, допускает ослабление, а именно распространение на норму пространства [0,Т]. Правая часть в неравенстве (10) в классе всех полиномиальных систем может принимать сколь угодно большие значения, вырождающиеся для линейных систем в бесконечность, т. е. оценка тем лучше, чем меньше Н (•).
После построения генератора 5 преобразование Ли-Депри [гф {V, Я}+±{р, я}, связывающее в области, определяемой оценкой (10) вместе с оценкой Коши системы (1) и (2), вычисляется по формулам
М :
00 , V
771=1
(13)
771 — 1
+ X) {"\ } ' 0.3¡т—3]
3=1
: =
з-1
141 [и] : ^ ^ = В^ - Е С '
771=1
оо
Ч"1 М :
771=1
3(т)(<г,р,*,Мо) = -<?(т)(<г,р,*,К) +
771—1
+ Е
з=1 3
(14)
где -Оо Вт дрБт • — 9д5т • др. Алгоритм последовательного вычисления
«сначала (7), (8), затем (13), (14)» может быть распараллелен в алгоритм «одновременное вычисление 5т, поскольку генератор 5 линеен по импульсам, преобразование Ы^1 [м] от импульсов не зависит, т. е. это преобразование точечное. Точные формулы преобразования для импульсов в настоящей статье не потребуются.
Решение задачи Коши о) системы (1) при условии, что точка (<7°,(¿))
принадлежит функциональной области сходимости преобразований Ы^1 [и] : при £ ^ 0, вычисляется, согласно формулам (13), (14),
«(*,в°л«й) = +£(™!ГУт)(<2(*,<лмьик), (15)
т=1
в которых
г
<?(*, <3°, Но) = е*0Г + ем Iе~А,Ви{8)й8, и € П„[0,Т], «(«) €
(16) (17)
771=1 771=1
Формулы (15) не содержат импульсов. Вместе с тем они корректны при всех наборах таких, что решение ф (£, С}0, [*/]£) из формул (16) принадлежит области сходимости ряда из (13). Начальные данные необходимо принадлежат замыканию поликруга сходимости стационарного ряда (17), поскольку последний - степенной ряд по д?,...,
Последующее изложение связано с вопросом вычисления вектор-функции и когДа точки о) и не принадлежат области сходимости
соответствующего ряда - формулы (13) либо (17), но в точку <2 (£*, <5°, ЭДд*) при £ = V и точку существует аналитическое продолжение аналитической функции д (<2, [гл]^) и функции <2° (<7°) из своих областей голоморфности, задаваемых элементами Вейер-штрасса (13) и (17) соответственно.
2. Теорема об аналитическом продолжении преобразований Ли—Депри. Предварительно необходимо рассмотреть вопрос о свойствах аналитического продолжения самого преобразования Ли-Депри, а следовательно, и его генератора 5 как полной аналитической функции в случае их зависимости (функциональной зависимости) от управления и,
Теорема 2. (Об аналитическом продолжении.) Для всякого элемента (£, Мо), для которого поликруг сходимости по С} элемента Вейерштрасса (13), т. е. величины д (<2,£, Мо); не пуст, полное аналитическое по ф продолжение д (ф, Мо), голоморфное в области Т>д (£, [г&]д) С Сп, преобразует аналитическое по <2 продолжение укороченной системы (2) - в данном конкретном случае тривиальное - в аналитическое продолжение по д системы (1), которое в силу полиномиальности также совпадает с ней самой. Такое же утверждение справедливо для полной аналитической функции <2 (<?,£, Нд) в аналогичной области Т>д (£, [и]г0) С С71.
Доказательство содержится в [4] и следует из общей теории аналитических дифференциальных уравнений [5] и аналитической структуры гомологических уравнений (7). А именно: если элемент Вейерштрасса, в данном случае (13), удовлетворяет аналитическому дифференциальному уравнению (5), то его полное аналитическое продолжение д удовлетворяет аналитическому продолжению исходного дифференциального уравнения (в данном случае выражение (5) с генератором 5), построенному вдоль аналитического продолжения этого элемента Вейерштрасса, т. е. вдоль д. Напомним, что в этом рассуждении голоморфность относится к величинам б, имеющему смысл времени в уравнениях (5) и (13), (14), и фазовым переменным <?1,..., дп и <2ъ • ■ • ? Фп в тех же уравнениях. Величина и и исходное время I являются параметрами.
Данное утверждение остается теоремой и для случая неполиномиальных, но голоморфных по систем, преобразующихся к неполиномиальным голоморфным системам. Однако доказательство такого факта существенно связано с классификацией римано-вых областей для голоморфных функций многих переменных, задающих правые части исходных дифференциальных систем.
Последняя теорема гарантирует, что любой конструктивный метод суммирования преобразований Ли-Депри за поликругом сходимости по координатам необходимо предъявляет вычислимые (рекурсивные) формулы значений именно этих преобразований, а не каких-либо других, возможно, посторонних функций. В качестве упоминаемого метода суммирования предлагается использовать аппроксимацию Паде в форме, близкой к рассмотренной в п. 1, а также в работе [6]. Это частный случай аппроксимации рациональными функциями, коэффициенты которых вычисляются по рекуррентным формулам.
3. Аппроксимация Паде-Шенкса преобразований Ли-Депри, Выполним ряд предварительных построений.
Пусть г Е 1 : п и
оо
т=1
Пусть t < Т и кривая
Q (t) € U<">(r(t)), ra (t) > 6, > 0, d=*(ibô„).
Тогда существует вектор
0 = 0 (Q (t) ) € U(n)(<J), U<n>(i) € compC71, (19)
такой, что © (Q)( = Q для некоторого ( G С1, которое всегда существует. Подставляя 0 • ( в выражение (18), получим функцию
оо
4>i (С, *) = £ /<? ( е, t, [«]« ) • Cm = 9i ( 0 • С, i, К ), (20)
771=0
которая голоморфна по 0 6 U^(<5) и по С € {Ç : |Ç| ^ 1}; действительно, при ( = 1 следует 0 • 1 = 0 € U(n)(<J). Пусть
МЛ0)=Гтах|М<,*)1 (21)
Kl^i
при t € [о,т], 0 € S, >0, 5 € 1 : п. Тогда функция Mt (0) непрерывна по
(i,0) € [0,Т] xU(n)(i). Пусть
M d= шах Mt (0). (22)
[0,T]xU(n)(<5)
Очевидно, M < оо. Следовательно,
| -а'™ при Va ^ 1
и всех m 1 : оо. Не умаляя общности, можно считать, что при всех t € [О, Т] разложение Q (t) = 0 (t) • Ç (t) определяет непрерывные функции 0 (t) и
((t) £ S (1) {С : ICI ^ 1}> если только Q (t) непрерывна. Рассмотрим орбиту
г = U {Q(t)h г с С".
tG[0,Tmin]
По предположению, Г С U^(r(t)) при некотором значении t е [0,Tmin]. Тогда определена орбита
7 = U {CW}CS(1). (23)
t€[0,Tmia]
Множество Г - компакт, поэтому 7 - компакт. Пусть конечная последовательность 0<ii<Î2<---<*/v < Гтт равномерно разбивает отрезок [0,Tmin]. Представление (20) дает при t = tj, j 6 1 : iV, и свободной переменной ( е S (1) N функций от переменной С
оо
Ъ = £4? (e^'MÔi)-Cm, Qj^Qitj). (24)
771=0
Пусть каждая из функций 1)? • • • > ^¿(С^лг) аналитически продолжима в за-
мкнутый круг 5(И) за исключением /С^. полюсов, и е > 0 и VI (р),..., (р) - окрестности соответствующих полюсов - круги радиусов р > 0. Тогда [6] для каждой 'фj, 3 € 1 : существует аппроксимация Паде
"*>] *£ при с € 5(л) Х и ^</»)■ (»)
i/=l
Напомним, что п^"1* и 0^,^) - многочлены по С и вы-
числяются в явном виде по коэффициентам разложения (24), т. е. по величинам 1т Мо )> т ^ непрерывным по своим аргументам. Поэтому можно указать
конечные величины
Мм ^ тах{гаЛ и Км ^ тах{яЛ (з) (Л
такие, что оценка (25) в компакте
¿=1 |/=1
разве лишь улучшится при переходе к (Мм, Км) - аппроксимации Паде
< £. (26)
Если sup{/C^.} < оо и существует теоретико-множественный предел U)
N К*з
JimJS (Л) \ U U w) = Н (27)
j=l |/=1
то, во-первых, - компакт и, во-вторых, в силу равномерной непрерывности
величины (0, t, [u]q) при всех га ^ 0 на компакте U^(<5) х [О, Г] Э (0, t) существуют конечные пределы М£ = lim Мм, Ке — lim Км и оценка (26) может быть выполнена
JV-юо N-+ оо
равномерной по (0,i) для фиксированных р и е
-w (С, О
< е (28)
при всех значениях ( € 5 (<^,р). В неравенство (28) допустима подстановка £ (£), удовлетворяющая условиям ' 0 (0 = <2 (*) и СМ € 5(<^,р). При этом п процессоров независимо вычисляют дробь Паде из формулы (28), т. е. одновременно рассчитываются аппроксимации всех координатных функций кр^ при г € 1 : п.
Однако считать, что все 'фj = Фг^^]) аналитически продолжимы в общий круг 5{К) без конечного множества полюсов, трудно. (Индекс г здесь фиксирован.) Но предположение, что (С?^) аналитически продолжима вдоль орбиты 7, может быть оправдано тем, что 7 - компакт в данном случае, а в других случаях может быть оправдано физической природой задачи - ее аналитической структурой и специальными
предварительными аналитическими подготовлениями, развитыми Пуанкаре, Зубовым [7,8] и другими исследователями. Поэтому ниже будем предполагать, что указанная выше функция имеет аналитическое продолжение вдоль орбиты 7, и тогда существует ¿7-трубка, являющаяся ¿-окрестностью орбиты 7. Напомним, что проблемы выбора 7 нет, ибо решение Q (t, Q°, [it]g) известно. Более того, можно предполагать, что в ¿7 попадает особое множество Aus$<^ функции ipi (£которое, двигаясь, при t € [О, Т] не пересекает орбиты 7.
Кривая 7 при t = t* ^ Tmin первый раз выходит из круга 5(1), а при t = Tmin ^ Т она входит в точку С/т7 соответствующую точке
Q (2min? [wop]om,n) = ®/»n * C/in = Oop(^min? [^ор^""")'
Точка С/гп может как принадлежать кругу 5(1), так и не принадлежать ему. Введем множество
М = U 57(t)(5)U5(l), |®-7WI<i}, (29)
t€[0,Tmia]
которое будем считать односвязным, поскольку случай многосвязного Л4 легко сводится к данному. Очевидно, точка 0 € int М и вся часть орбиты 7, которая вне круга 5(1), лежит в открытом множестве intjVl. Ниже вместо множества ¿7 оказывается более удобным работать с множеством A4.
Используя результаты п. 2, исключим из A4 с помощью семейства разрезов особое для функции (pi множество Aus t<pi, за исключением того конечного числа полюсов, которое задает множество Vi,... ,Vr, наиболее существенно отражающее физическую сторону задачи, и перейдем к односвязному множеству М = М. Так же как и в п. 2, введем конформные отображения
р±г : M+±S (1) Э z, fit (0) = 0, (30)
для чего привлечем теорию уравнений Левнера-Куфарева.
В нуле элементы Вейерштрасса для функций ßt и мГ1 им^ют вид
оо
МС) = £«Л*)С", СеЗо(Д), Д>о;
к=0
оо
л1 (*) = £& («)*"• (31)
к=0
Множество Vi,..., Vr после конформного отображения перейдет в множество точек z\,..., гд. В последнем случае ¡jl< - не элемент из формулы (31), а уже полная аналитическая функция в М. Элемент Вейерштрасса для функции кр^ ((, t) из формулы (24), выраженный через переменную z, имеет вид
оо
Vi (С,t) = Vi{МГ1 (*), t) = £ (0, N0, ß(f))' zm (32)
m=О
при 2 € So (р), где р =f min \z*K \ >0. Коэффициенты вычисляются в конечном виде через ßi (t) и fm из формулы (20), которые следует отличать от скрывающихся
под тем же именем величин ¡т из выражения (32). Нетрудно видеть, что размерности областей определения коэффициентных функций из этих формул совершенно различны. Функция щ (/л^1 (*:),£) голоморфно продолжается в 5 (1) \ ,..., Яд, где г* -полюс и к € 1: Я. Тогда данная функция допускает е-аппроксимацию Паде, как и в случае (28), в области
(5 (1) \ и V,. (р)) Э л, V,. : |г - *Л < р}
г=1
с оценкой
< е (33)
в^^е,«)
при £ 6 [¿0>^ппп]? 0 где Ттш — время перехода из точки в точку £/гп при
условии, что Я постоянно на ^о,Тт1П]. Если число полюсов Я зависит от необходимо выделение промежутков постоянства функции Я(£). Согласно выражению (33), с точностью до е «функция» (рг (С, 0, представляется функциональной дробью
^(С^) ^ ^(се^)» ^ . (34)
для всех * € [0,Тт1п], 0 € и<»>(*) и С € М\ 0 ^ (р).
«=1
Правая часть оценки (34) с точностью е вычисляет функцию кр\ (С(£)? 0(^)> а тогда и функцию из формулы (20) и, следовательно, с точностью до е координатную функцию $ (£2,2, Мо)> задаваемую элементом Вейерштрасса (18) за поликругом сходимости и(п)(г(*)), когда д = <2 (4, д°, [и]£), т. е. в случае <2 € Г.
Введение правила для представления вектора д (¿) Е Г в виде произведения ф (¿) = ® (*) ' С (*)? гДе вектор
в е и(п)(<*) и скаляр ( € 7, определяет естественным образом обратную зависимость Сд (*) = С С) и (*) = С"1 * С (0 = (С (*» О))"1 * Я (*)• После чего имеет место оценка
„ (п , _ (^ц (С д)), д)]-1 • д,«) , р 9<(д,''Мо)" ^ЩмсШШШ^оТ) £ (35)
при д Е Г, £ Е а функция = ^Ор(^д0) фиксирована при фиксирован-
ном д°, если фиксировано начальное Подставляя в формулу для оптимального управления ггор(£, д°) величину
оо 7П=0
из формулы (14), просуммированную методом Паде, изложенным выше, в случае, когда <7° , Т>д - область сходимости преобразований Ли-Депри Ы^1, получим функцию - программное управление, определенное формулой. В заключение необходимо еще раз остановиться на вопросе, связанном с формулой (20) и союзной с ней формулой (35), т. е. на представлении вектора д = 0 • С и затем возвращении обратно к переменным д в формуле (35).
Пусть отмечена окрестность-поликруг
U(n)(0,5T(i))cU("'(r(i)).
Предполагалось, что при t, > О точка Q(t.*) 6 U^"' (г(<»)), следовательно, • г (и)) и (Е)° существует % е 1 : п такой, что
\Qi(U)\ >0,5 ■»■<(*.), U е [0,Т], t* > 0.
Тогда положим процедуру разложения Q = 0 • £ следующим образом:
0 ф Qi{t) - задана при t ^ U - момент выхода, Qi(t) = Q{(t) • ( и ((t) = Qi(t) / ©¿(i) при t ^ и тогда при г ф к € 1 : п следует, что SK(t) = QK(t) • Qi(t)/
QM „ _
(В)0 существует t такой, что для всякого % € 1 : п имеет место неравенство I Qi(t) | ^ 0,5 - п (t).
Очевидно, (В)° :=> Q(t) G U- область сходимости ряда (18). Теорема 3. (](В)° ► (Я)0) & ((Е)° (А)0).
Второй вопрос, на котором придется остановиться, - это пояснение того, что функции ipi((,t) = г € 1 : п, в формуле (32) как функции от z имеют точки zit • • • ? zri являющиеся образами полюсов Vi,... ,Vr функции ipi (С, t) как функции от £ и своими полюсами соответственно тех же порядков. Это следует из того, что однолистное конформное отображение [х (а тогда и /л"1) переводит полюса в полюса с сохранением их порядков. Например, f(z) = l/(z — с)р, 2 = <р(w). Тогда, вычисляя суперпозицию /(<£>(w)), получим равенства
/ (у (w)) = 1 / (<p(w) -с)Р=1/ ( (с + £ ск( w - х)" - с
\ к=1
= 1 / (w - х)Р- c«(w - я)""1) = B(w) / (w - *)',
причем В(х) ^ S > 0 - аналитическая в точке х. Здесь предполагалось, что конформная функция y (w) такова, что (ж) = с, т. е. 3 (•) с ж. По (•) с 3! (•)#, где и строится разложение v? по (w — х).
Осталось заметить, что функция с конечным множеством полюсов имеет представление
Ф (у) = Кг(у) / (у - + ■ ■ ■ + Кп(у) / (у ~ Pr)pk + К (у).
4. Проблема локального синтеза. Изложенная выше методика аппроксимации Паде преобразований Ли-Депри вдоль оптимальной орбиты Г позволяет в конечное число шагов построить формулы, представляющие с априорной оценкой оптимальное управление в форме синтеза, вообще говоря, локального.
Пусть uop(t,Q°) - оптимальное управление, заданное формулой, т. е. uop(t,Q°) -вычисляемая с точностью до квадратур по t функция аргументов t € [to, Tmin(Q0)] и Q° € Sqo (S) С ¿Г, причем Tmin(Q°) - вычисляемая функция от Q0, заданная формулой. При г € 1 : п формула (3.18) параллельно вычисляет значения ..., qn, когда Q пробегает орбиту Г, оптимальную для начального данного Q2 = Следовательно, вычислима оптимальная орбита J, выходящая из и под действием оптимального
программного управления иор^, входящая в 0 в момент времени Ттт(<Э2)- Множество 3 С 63, где 63 ~ образ <5Г.
Пусть для задачи (2) в окрестности орбиты Г - в области ¿Г - решена задача оптимального по быстродействию синтеза, т. е. построено оптимальное управление иор{Ь, ф) при С} € 6Г. Вопрос о разрешимости соотношения (35), т. е. выражения новых переменных Ф через старые переменные я, оказывается в связи с возможностью появления неконтролируемой по е новой погрешности алгоритмически проблемным. Отчасти это происходит из-за многозначной аналитической операции, обращающей отображение (35). Поэтому, с алгоритмической точки зрения, целесообразней действовать для априори заданной погрешности £, согласно алгоритму ПЗ, поменяв ролями переменные <3 и д и известную область ¿Г на^вычисленную область 63, а затем определить соответствующую рациональную (М, К)-аппроксимацию Паде для функции Я (я, ^ [гАор]о) ПРИ условии я 6 63• После этой подготовительной процедуры суперпозиция иор (£, ф [г1ор]о)) дает возможность вычислить с точностью до квадратур по £ оптимальный по быстродействию синтез исходной задачи (1) в области 63- Изложенная методика при условии равномерной ограниченности величины Тт\п((20), когда С}0 Е X, X - компакт, и равномерной ограниченности орбит Г при € X может быть перенесена на задачу построения синтеза г1ор(£, (?) при С? € 6Х, где 6Х — ограниченная окрестность компакта X. Однако при этом усложняются предположения, связанные с построением конформного отображения /х^1, рассмотренного в [9]. Важным оказывается решение задачи - как связаны комплексно-аналитические свойства исходных уравнений со свойствами особых множеств голоморфных по С функций На
каком шаге алгоритма эти особенности привносятся методом? Другими словами, какие особенности инвариантны относительно всех возможных методов решения рассматриваемой задачи? Метод [9] свободен от таких проблем. Строгое решение этого вопроса пока неизвестно.
Заключение. Вернемся к исходной системе (1) вида я = Ая + Ви + Р(я, и, £) и допустим, что для ее укороченной задачи быстродействия = А-Я+7г(£), —> 0 при
^пип
пор € П„[0, Т], Ттп1 ^ Т, 7г(<) е П<п) получено оптимальное решение (¡)*, [тгор]д), < € [0,Тт1п], где <3 =Г <2 + Ч-1(К>]о,0), <3* = 0°.
Пусть 7 = и Я , [^Ор]о) по всем t € [0, Тт1П] и преобразование Ли-Депри 1йь[и]: Я —я укороченной для (1) системы уравнений 0 = + Ви в исходную систему (1) аналитически продолжимо в открытую ¿-трубку траектории 7, обозначаемую через ¿7.
Теорема 4. Для всяких к Е 1: п, е > 0 существует область ^ С С1, Т>к Э [0,Тт1П], существуют конечные целые числа Ьо = Ьо(Х>л, А;,е), М = М(Х>*,/с,е); существует однолистное конформное отображение f~1 : Vк Е - единичный открытый круг в С\, такие, что для исходной оптимальной задачи
Я = Ая + Ви + Р{я,и,1),
v
решение существует, и верны равенства в силу преобразований Ли-Депри 4 6г как полной голоморфной по С} еСп функции
и = ч*(дор(*'><з0,к>]о),
Кроме тогоj существует вектор-полином ё^ (t) € Сп при компонентах € c[t], т € 1 : п} приближающих оптимальное решение укороченной задачи (2)
( sup II Q^(.,Q0,Kp]J)-eW(.)||
m€l:n v
в результате чего для всякого t EVk D [0,Tmin] имеет место оценка
£р?о/М]&иор).(Г1(т)У |/=0
lZrlsLo/M](t,uop).(f^(r))sl
s=o
T-t
< 6, (37)
где - голоморфная в T>k D [Oj^VnwJ близкая к (36) функция,
для которой (37) - ее аппроксимация Паде.
Summary
Vishnevsky V. Е. Rational approximations in nonlinear problems of quick action.
An analytical algorithm permitting numerical implementation of optimal quick action control for multinomial control systems are described.
Литература
1. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями / Пер. с англ.; Под ред. Р. В. Гамакрелидзе. М.: Наука, 1977. 622 с.
2. Шварц Л. Анализ: В 2 т./ Пер. с фр.; Под. ред. С. Г. Крейна. М.: Мир, 1972. 824 с.
3. Вишневский В. Э. Представления решений вблизи равновесия полиномиальных нестационарных систем обыкновенных дифференциальных уравнений. Применение к некоторым задачам механики и математической кибернетики. Ч. 2. - Л., 1983. 50 е.- Деп. ВИНИТИ, № 4826-83.
4. Вишневский В. Э. Функционально-аналитические представления решений в задачах теории автоматического регулирования: Автореф. докт. дис. СПб.: Изд-во С.-Петерб. ун-та, 1995. 28 с.
5. Голубев В. В. Лекции по аналитической теории дифференциальных уравнений. М.; Л.: Гос. изд. техн.-теор. лит-ры, 1950. 436 с.
6. Вишневский В. Э. Лучевая аппроксимация Паде-Шенкса преобразований Ли-Депри полиномиальных систем дифференциальных уравнений. - Л., 1985. 32 е.- Деп. в ВИНИТИ, № 3870-85.
7. Пуанкаре А. О кривых, определяемых дифференциальными уравнениями / Пер. с фр.; Под ред. А. А. Андронова. М.; Л.: Гостехиздат, 1947. 392 с.
8. Зубов В. И. Устойчивость движения (Методы Ляпунова и их применение). М.: Высшая школа, 1984. 232 с.
9. Вишневский В. Э., Иванова О. А. Функционально-аналитические представления решений в нелинейных задачах теории управления. СПб.: Изд-во С.-Петерб. ун-та, 2003. 112 с.
Статья поступила в редакцию 13 октября 2005 г.