Труды Карельского научного центра РАН № 5. 2011. С. 18-27
УДК 517.977.1
УСТОЙЧИВОСТЬ ИНТЕГРАЛЬНЫХ ОПЕРАТОРОВ НАБЛЮДЕНИЯ АНАЛИТИЧЕСКИХ СИСТЕМ
Ю. В. Заика
Институт прикладных математических исследовании Карельского научного центра РАН
Рассматривается задача определения фазового состояния нелинейной динамической системы по известной траекторной информации. В качестве операторов обработки измерений приняты линейные интегральные функционалы. Показано, что в аналитическом случае можно обеспечить устойчивость решения обратной задачи по отношению к малым вариациям весовых функций.
Ключевые слова: наблюдаемость, устойчивость, аналитические системы.
Yu. V. Zaika. STABILITY OF INTEGRAL OBSERVABILITY OPERATORS OF ANALYTICAL SYSTEMS
The observability problem of determining the phase state of a nonlinear dynamic system from known information about the path is considered. Linear integral functionals are taken as operators of measurements processing. We show that in the analytic case one can ensure the stability of the inverse problem solution with respect to small variations of weight functions.
Key words: observability, stability, analytic systems.
Критерии наблюдаемости
НЕЛИНЕЙНЫХ СиСТЕМ
Постановка задачи
Рассмотрим в области и С Мга нелинейную систему наблюдения
X = /(х), У = д(х), д : и ^ Мт, т < п, (1)
моделирующую закон движения и доступную информацию о движении. Вектор-функции /, д считаем гладкими. Для доказательства основных результатов потребуется вещественная аналитичность: /,д е Сш(и). Задан промежуток наблюдения [0, Т] и область возможных конечных состояний ит = {х(Т)} С и. Решения х( ■; х, Т) (х(Т ; х, Т) = х е ит) продолжи-
мы на отрезок [0, Т]. Задача наблюдения состоит в определении по информации
у(';х,Т) = #(х( ■;х,Т)): [0,Т] ^ Мт
фазового вектора х = х(Т) є Цт. Запись у(■; х,Т) означает, что известная на отрезке времени [0, Т] вектор-функция измерений у(-) однозначно определяется искомым неизвестным состоянием х в момент Т. Предполагается, что задачу необходимо решать систематически. Поэтому нас интересуют операции вычисления по любой возможной реализации у(-) соответствующего х(Т) из области ит. Можно ставить задачу в терминах неизвестных начальных данных х0 = х(0) є Цз. Но обычно интересуются фазовым состоянием к моменту окончания наблюдения. В рамках модели по
0
данным х(Т) (х0) можно численно восстановить решение и траекторию движения.
Установить наблюдаемость пары (/, д) (биекцию у(-) о х(Т) е ит) непосредственно по соответствию х ^ у( ■; х,Т) затруднительно, поскольку речь идет об обращении отображения в пространство вектор-функций. Поэтому обычно переходят к исследованию так называемого отображения наблюдаемости
Н : х ^ у( ■; х, Т) ^ г е Мр,
вычисляя значения р функционалов на у(-). Наблюдаемость (/, д) в множестве V С ит на отрезке времени [0, Т] означает биекцию у( ■; х,Т) о х е V. Если Н инъективно на множестве V С ит (Н(х) о х е V), то (/, д) наблюдаема в V и вектор х = х(Т) е V однозначно определяется по г = Н(х) е Н (V). Здесь значения г известны после обработки измерений у(-) (вместе с дополнительной информацией хт е V, если строго V С ит). Возможные способы построения Н (р = ^т):
a) х ^ (у'(Т), у^Т), ..., у^-1)/(Т)) е Мр;
b) х ^ (у/(^1), ..., у/(^,))/, t¿ е [0,Т];
c) х ^ (^ьуЬ ..., (kp,y))/, (■, ■) = (■,-)и;
^) х ^ ^ к1 (т, у) (1г,..., J кр(т, у) ^т) .
Достаточные условия наблюдаемости обычно получают на основе анализа инъективности отображения Н е С ^ит, Мр) в подобласти
V С ит при р = п (см. [Никайдо, 1972; Ортега, Рейнболдт, 1975; Кирин, 1993]). При этом не только на Н, но и на V накладываются ограничения. При построении Н можно использовать как способы а)—ё), так и их комбинации (р функционалов вида у(г)(з), у^(^),...). При этом критерии 1)—4) можно применять не только к Н, но и к МН, det М = 0.
С целью упрощения обозначений и без существенного для дальнейшего изложения ограничения общности можно считать т = 1.
Приведем некоторые результаты аналитической теории наблюдения. Ее развитие можно проследить в серии статей К. Е. Старкова в журнале «Автоматика и телемеханика» (80 — 90-е гг.). Для полиномиальной пары (/, д) при определении хт = х(Т) е ит вместо у(-) достаточно ограничиться вычислением конечного числа производных у( г)(£*), е [0,Т] [1поуе,
1977]. Но их количество р = р(/,д,ит) может оказаться сколь угодно большим, хотя семейство {у( ■; х,Т)| х е ит} «всего лишь» п-параметрическое. Для стационарной наблюдаемой вещественной аналитической пары (/, д)
без потери информации об искомом хт вместо у(-) можно ограничиться набором 2п + 1 значений y(tj) [Козеренко, 1987]. Моменты времени ^ фиксируются и не зависят от у(-). Но в общем случае множество «удачных» программ наблюдений {¿1,..., ¿2п+1} не открыто в [0, Т]2п+1. С учетом погрешностей задания tj это может привести к потере наблюдаемости. Устойчивые к возмущениям дискретные программы рассмотрены в [Заика, 1999]. Интегральные операторы наблюдения исследуются в ^а1ка, 2003]. Применение аналитической теории к простейшей модели движения центра масс летательного аппарата в вертикальной плоскости изложено в [Заика, 1988].
Если на измерение значений функции у^) существенное влияние оказывают различного рода неконтролируемые помехи, то предпочтительнее использовать интегральные операции обработки информации у(^. Основы соответствующего математического аппарата в линейном случае изложены в книге [Красовский, 1968]. Напомним известный результат, который будет взят за основу обобщения. Пусть / = ^х, д = Сх, где ^, С — матрицы п х п, т х п. Если в сопряженной системе
^(¿) = -^(¿) + ^СО, V(0) = 0, (2)
построить управление &(■) из условия V(Т) = Л, то по у(-) вычисляется проекция неизвестного хт = х(Т) на вектор Л: Л/хт = (к,у)ь2
V хт е Мп. Совокупность всех Л е Мп, для которых по любой возможной реализации у(-) однозначно восстанавливается проекция Л/хт, описывается множеством достижимости Рт = {V(Т)}. Этот подход Н. Е. Кириным [Иванов, Кирин, 1988; Кирин, 1993] обобщен на нелинейный случай. Построение оператора восстановления по у(-) значений данной функции ^ : ит ^ М в интегральной форме
г т
<^(хт) = к(т,у(т))^т Vхт = х(Т) е ит (3)
т 0 т т сводится к следующей задаче управления. В сопряженной системе
(¿,х) + ух(¿,х)■/(х) = к(^д(х)), -и(0,х) = 0,
требуется выбрать функцию &(■, ■) из условия -и(Т, х) = <^(х), х е ит .В линейном случае (/,д) = (^, С), к(^у) = k/(t)y получаем ^(¿,х) = V/(t)x, где вектор-функция V(^ удовлетворяет соотношениям (2). Нелинейная задача построения операции наблюдения для области фазового пространства является распределенной. Важно, что сопряженное уравнение линейное по паре функций (к, V) и возможно
применение теории управления и методов решения линейных граничных задач.
Сведения из комплексного анализа
1. Аналитические подмножества. Пусть О —
область в Сп. Множество А С О называется (комплексным) аналитическим подмножеством О [Чирка, 1985], если для каждой точки а е О найдутся ее окрестность и и голоморфные в ней функции /1,..., /„, такие, что А П и = {г е и | /1(2:) = ... = /„(г) = 0}. Локально множество А определяется общими нулями конечных наборов голоморфных функций и замкнуто в О. В изложении [Эрве, 1965] такие А называются аналитическими множествами в О (без приставки «под»). Можно оставить лишь требование открытости О, не меняя определения. В [Чирка, 1985] понятие аналитического множества «занято» несколько иным объектом (а е А).
Теорема 1 ([Чирка, 1985]). Если {Аа}ае/ — произвольное семейство аналитических подмножеств О, то А = Пае/Аа — тоже аналитическое подмножество О, причем для любого К с компактным замыканием в О (К 1 О) найдется конечное подмножество 3 С 3, такое, что А П К = (Па^А«) П К.
2. Ростки голоморфных функций. Рассмотрим кольцо Зга степенных рядов от п комплексных переменных, сходящихся в заданной открытой окрестности и фиксированной точки го е Сп. Идеалом 3 в Зга называется всякая аддитивная подгруппа Зга, удовлетворяющая условию 3га3 = 3 (а е Зга, Ь е 3 ^ аЬ е 3). Кольцо Зга, как известно, нетерово. Это означает, что в произвольном идеале 3 С Зга найдутся такие элементы Ь1,..., Ьр (конечный базис 3), что любой элемент Ь е 3 представим в виде линейной комбинации Ь = ^¿=1 агЬг, аг е 1П.
Если окрестность и не фиксировать, то приходим к понятию кольца ростков голоморфных функций в точке г0 е Сп [Эрве, 1965]. Приведем определения. Заданные и голоморфные в открытых окрестностях и1, и2 точки го е Сп функции /1, /2 эквивалентны, если в некоторой открытой окрестности из С и1 П и2 точки г0 они тождественны. Ростками голоморфных функций в точке г0 называются классы эквивалентности функций, определенных и голоморфных в открытых множествах, содержащих г0. Две функции, голоморфные в открытых окрестностях го, совпадают в некотором поликруге Р = {г : |гк — г0к| < Гк е М+\{0}, 1 ^ к ^ п} тогда и только тогда, когда они имеют одно и то же тейлоровское разложение в г0. Поэтому изоморфно кольцу
сходящихся степенных рядов. Сходимость ряда означает, что существует открытый поликруг Р, в котором ряд сходится. Росток, порожденный функцией /, обозначаем /. Сложение и умножение ростков определяются их представителями: /1 + /2 — росток, порожденный функцией /1 + /2, а росток /1 ■ /2 порожден функцией /1 ■ /2. Кольцо нетерово. Справедливо следующее утверждение.
Теорема 2 ([Эрве, 1965], с. 44). Для любого идеала 3 кольца можно указать:
(I) в некоторой открытой окрестности и
точки г0 конечное множество голоморфных функций Л1,..., с ростками в г0 из 3;
(II) (базис векторов в пространстве Сп и) последовательность открытых поликругов {Рг,г ^ 1} с центром в точке г0 и радиусами, монотонно стремящимися к нулю
(Р1 С и, Гк = Гк(г) > Гк(г + 1) > 0);
(III) числа > 0, г ^ 1, со следующим свойством: для каждой голоморфной в поликруге Рг функции Л с ростком Л е 3 существуют такие голоморфные в Рг функции а1,..., аг, что в Рг имеет место разложение
ЕТ
,=1 аj(г)^(г), (4)
||р. = |aj(г)| < ||Л||р V?.
При переходе к первоначальному базису Сп вместо поликругов Рг получим последовательность окрестностей и точки г0.
Следствие. Пусть Т — семейства функций, голоморфных в открытой окрестности и точки г0 е Сп. Тогда можно указать (открытый) поликруг Р С и с центром в г0 и набор функций /1,..., /„ е Т, обладающие следующим свойством: для каждой / е Т существуют такие голоморфные в поликруге Р функции а1,...,а„, что в Р справедливо представление / = а1/1 + ... + а„ /„.
В поликруге Р множество общих нулей функций / е Т совпадет с множеством общих нулей конечного подмножества Т.
3. Число определяющих функций. Пусть {/а} — семейство функций, голоморфных
в открытом множестве О С Сп. Тогда множество их общих нулей 2 есть аналитическое подмножество в О, причем существуют такие голоморфные в О функции д0,... , дп е О(О), что множество их общих нулей совпадает с множеством 2 [Чирка, 1985](с. 54).
Схема доказательства следующая. Пусть Ог — связные компоненты О, не принадлежащие 2, и аг е Ог \ 2 — произвольно выбранные точки. Для каждого г найдется функция /а, такая, что /а (аг) = 0. Представим О в виде такого счетного объединения О = и ^, что — ограниченные открытые множества, ^7 С ^?+1, К,- = ^ С О, и для каждого компакта К С О найдется в из условия К С К5. Подберем индукцией по j числа с, так, чтобы выполнялись следующие два неравенства:
| с,/а (г) | < 2— V г е к, , V г ^ j,
|Е1=1 Ск/«к (аг) > 2-1|сг/аг(аг) 1. (5)
Ряд £ / равномерно на компактах сходится в О к голоморфной функции, которую обозначим дп. По построению выполнено
д™(аг) =0 V г ^ ё1ш(2йп П Ог) < п,
где множество 2йп — нули дп в О, О С 2. Остальные функции дп-1,...,д0 строятся в [Чирка, 1985] по индукции в форме (счетных) линейных комбинаций некоторых функций /а аналогичным образом: д51^ = 0 и все неприводимые компоненты множества 2йп П ... П 2йа размерности ^ в в О принадлежат 2. Множество общих нулей д0,... , дп совпадает с 2.
Наблюдение по проекциям в ¿2
Остановимся на линейных операторах (3):
<^(жт) = (к,у)^2, жт = ж(Т) е ит,
где ¿2 = ¿2[0, Т], т = 1. Допустимые весовые функции к() обработки измерений у(^) считаем кусочно непрерывными на отрезке времени [0,Т]. Функционалы у() ^ (к,у) и сами числа (моменты) (к,у) будем называть проекциями. С вычислительной точки зрения важно иметь конечномерное представление функции у(). Можно ли подобрать такие к1(^),..., кр(), чтобы сужение у() до значений конечного числа функционалов 3г[у(^)] = (кг,у)^2 не приводило к потере информации об искомом ж(Т)? Имеется в виду биективное соответствие
у( ■; хт,т) о (3l[y(■)],...,3p[y(■)]), жт е ит.
В случае успеха «запоминание» у() сводится к интегрированию функций кг(£)у(£) по мере поступления измерений у(£), что сравнительно легко осуществляется техническими средствами. Иной акцент вопроса: возможна ли ситуация, когда пара (/, д) наблюдаема (инъективно отображение жт ^ у(0), но
по конечному числу проекций (кг, у) однозначно определять жт невозможно? Здесь функции кг(-), 1 ^ г ^ р, фиксируются одни и те же для всех возможных у(-), жт е ит. Если указанные наборы кг(■) существуют, как выбрать по возможности минимальным р? Пусть к() фиксирована. Цепочка жт ^ у() ^ (к, у) порождает функцию ^>(жт) = (к,у). Как дать аналитическое описание ^>()? Важен и в определенном смысле обратный вопрос. Обычно измеряется часть фазовых координат, требуется лишь восстанавливать оставшиеся или, более общо, значения заданных функций <^(жт). Как для заданной функции ^ подобрать к, чтобы выполнялось представление (3) с требуемой точностью? Изложим некоторые результаты в случае аналитичности /, д по ж.
Определение 1. Функцию <р: ит ^ М назовем наблюдаемой в множестве М С ит, если существует функционал Л из условия <^(ж) = Л[у(*)], где ж = Жт е М, у() = у( ■; Жт,Т).
Такие функции ^ будем также называть наблюдаемыми компонентами пары (/, д). Наблюдаемость ^ в М означает, что ее значения <^(ж) на неизвестном априори фазовом векторе ж = ж(Т) однозначно восстанавливаются по доступной в результате измерений информации у( ■; ж,Т), если дополнительно известно включение ж е М. Наблюдаемость пары (/, д) эквивалентна наблюдаемости всех координат <^(ж) = жг, 1 ^ г ^ п, в области ит. Когда исследуется наблюдаемость функции ^ в М и ^ задана лишь на подмножестве N (М С N С ит), то считаем ее доопределенной в ит\N произвольно. Обозначим через Ф(М) множество всех наблюдаемых в М функций ^>. Очевидно, Ф^) С Ф(М) при М С N.
Определение 2. Базисом множества Ф(М) наблюдаемых в множестве М функций назовем такую конечную совокупность ^г е Ф(М), 1 ^ г ^ р, что имеет место функциональная зависимость: V<р е Ф(М), Vж е М,
^(ж) = ^^[^1(ж),...,^Р(ж)].
В записи индекс отражает зависимость функции 3 от ^>. Множество Ф(М) является нелинейной (функциональной) оболочкой базисных наблюдаемых функций. Вычислив по измерениям у( ■; ж,Т) (ж е М) значения <^1 (ж),..., ^р(ж), дополнительной информации о неизвестном векторе ж = ж(Т) из у(-) уже извлечь невозможно. Наблюдаемость (/, д) в М С ит означает биекцию (^1(ж),..., ^>р(ж)) о ж е М. Если последним свойством обладает один из базисов, то это
0
же справедливо и для любого другого (при условии их существования). Действительно, пусть Лг — функционалы, соответствующие базисным ^>г е Ф(М) согласно определению 1, {кг, г ^ 1} — полная в ¿2 = ¿2[0, Т] система, т. е. {(<£, кг), г ^ 1} о <£(■) е ¿2. Тогда
фг е Ф(ит) С Ф(М), фг(ж) = (кг, у( ■; ж,Т)>.
Знак тождества = используем также в смысле равенства по определению в зависимости от контекста. Базисность означает, что
фг(ж) = 3г[^1(ж),... , <^р(ж)] Vг ^ 1, Vж е М.
Поэтому по значениям <^г(ж) = Лг[у( ■; ж,Т)],
1 ^ г ^ р, числа фг(ж), г ^ 1, определяются однозначно. В силу полноты {кг, г ^ 1} имеем
(^ч(ж),... ,^р(ж)) о у( ■; ж,Т), ж е М,
и вместо функций у(-) можно оперировать векторами (^1(ж),..., <^р(ж)), ж е М. Эти же функции ^>г образуют базис Ф^) V N С М.
Функционалы Лг в определении 1 могут быть различной природы, в частности, Лг[у(■)] = у(*г), Лг[у(■)] = у(г)(^*). Ограничимся классом линейных интегральных операций обработки измерений Л[у(*)] = (к,у). Очевидно, функции ф(ж) = (к, у( ■; ж,Т)) наблюдаемы в любом подмножестве области ит, т. е. ф е Ф(М) VM С ит. При необходимости класс допустимых весовых функций к(-) можно расширить до пространства ¿2.
Теорема 3. Пусть система наблюдения (/, д) вещественная аналитическая: / е Сш(и, Мп), д е Сш(и,М). Тогда для любого множества М с компактным замыканием в области ит (М <1 ит) из произвольной полной в ¿2[0, Т] системы допустимых весовых функций {кг, г ^ 1} можно выделить такие кг^ (■) (1 ^ V ^ р), что базис множества Ф(М) образуют компоненты
^: ит ^ М, ^(ж) = (кг^,у( ■;ж,Т)>.
Доказательство. Определим в ит х ит
Афг (ж1, ж2) = фг (ж1) - фг(ж2)
= (кг,у(■;ж1,т) - у( ;ж2,т)>, ж7 е ит.
Включение ф е Сш(и, М) означает, что функция ф в некоторой окрестности каждой точки области и представима сходящимся степенным рядом. По теореме Пуанкаре решение ж(^; ж,Т) аналитически зависит от начальных данных ж = ж(Т). Поэтому (см. [Эрве, 1965],
с. 14) функции Афг голоморфны в ит х ит. В силу леммы Абеля о сходимости степенных рядов можем считать, что Афг заданы и голоморфны в Ш = иС х иС С С2п, где комплексная область и^ является достаточно малой окрестностью области ит в С™. Это продолжение можно задать формулой
Афг(г1, г2) = (кг,у(; г1,т) - у(; г2,т)>,
г7 е иС. Смысл записи у( ■; г,Т) (г е иС) сохраняется, поскольку решения дифференциального уравнения ж = /(ж) можно рассматривать и при комплексных условиях Коши ж(Т) = г е иС С Сп. Продолжимость таких решений на отрезок времени [0, Т] гарантируется для достаточно малой комплексной окрестности и^ исходной области ит С Мп.
Обозначим через 2г множество нулей функции Афг в области Ш. Тогда общие нули Афг образуют аналитическое подмножество 2 = П^=12, области Ш и существуют такие номера г1,..., гр, что
2 П (М х М) = (П^=12г^) П (М х М).
Из Афг^ (ж^ ж2) = 0 для 1 ^ V ^ р, ж7 е М следует Аф^ж^ж2) =0, г ^ 1, и в силу полноты системы {кг, г ^ 1} получаем равенство у(;ж1,Т) = у(;ж2,Т). Отсюда Vж е М
(^1(ж),...,^р(ж^ =
= ((кг1 ,У),..., (кгр ,у)) о у( ■ ; ж,Т ),
^(ж) =Л[у( ■; ж, Т)] = 3у^ч(ж),...,^р(ж)],
V^ е Ф(М). Согласно определению функции ^>г образуют конечный базис Ф(М). □
Проблему поиска базиса наблюдаемых компонент пары (/, д) можно сформулировать в алгебраических терминах. Рассмотрим в кольце 0(Ш) голоморфных в Ш = и^ х и^ С Сп функций идеал, порожденный {Афг, г ^ 1}. Элементы этого идеала — конечные линейные комбинации функций Афг с коэффициентами из кольца 0(Ш). Конечный базис этого идеала (когда он существует) и определяет номера базисн(ых проекций )(кг, у) для множества М = ит (^ VM С ит). В частности ([Эрве, 1965], с. 50), V ж е ит существует окрестность
Р = {г е Сп: ||г — ж|| = шах |гг — жг| < г} С и^
(Р£ П Мп С ит) и конечный набор функций Афг1,..., Афг? из условий: (г1, г2) е Р х Р£,
Аф, (г1,г2) = Е^=1 7 (г1,г2)Афг^ (г1,г2)
0
І ^ 1, 7 є О (Рє х Рє). Тогда справедливо Дф^ (ж1, ж2) =0, 1 ^ V ^ д, ж-7' є М = Рє П Цг
^ Дфі(ж1,ж2) = 0, і ^ 1 ^ у(;ж1) = у(;ж2).
Базисом множества Ф(М) будут функции ^(ж) = ф^(ж) = (к*„,У( ■; ж,Т)):
(^ч(ж),... , ^(ж)) о у( ■; ж, Т), ж є М.
Если нет ограничений на весовые функции (в смысле включения к(-) є {кг}), то результат можно усилить (М = Цг, р = 2п + 1).
Теорема 4. Пусть {кг, і ^ 1} — полная в Т2[0, Т] система непрерывных функций, f є С ш(и, Мп), д є Сш(и, М). Тогда существует семейство наборов из 2п + 1 функций {гг(-)}, для которых наблюдаемые компоненты
^г(ж) = (г,у( ■; ж,Т)), 0 ^ і ^ 2п,
образуют базис Ф(ЦГ) (и Ф(М) УМ С Цг). Каждая г7-(■) представима 'равномерно сходящимся на [0,Т] рядом по элементам {кг}.
Доказательство. Рассмотрим голоморфные в области О = Ж = Ц? х Ц? С С2п функции
Дфг : Ж ^ С, Дфг(^1, г2) = фг(^1) - фг(^2).
Они определяются аналитическим продолжением функций фі(ж) из области Цг в достаточно малую окрестность (область) Ц? ^ Ц в Сп:
фі(г) = (кг, у( ■; г,Т)), г = ж(Т) є Ц?.
Коррекция составления линейных комбинаций состоит в том, что коэффициенты С7 (см. неравенства (5)) будем подбирать из условия
І С7 Дфаз (г1, г2) |
= |( с7 к«,-, ; ¿1,Т) - ; ¿2,Т))|
^ II с7ка 110 ■ II у(- ;г1,Т) - у(- ;г2,Т)!ь1
< 2-7 V (г1, г2) є К,
сохраняя при этом второе для с7- неравенство в (5). Эта модификация обеспечит не только сходимость ряда £ сгДфа в области Ж к голоморфной функции, но и сходимость ряда £ сгкаі в С[0,Т]. Используя такие построения по индукции и обозначая суммы рядов через г2п,..., го, приходим к следующему утверждению. Множество общих нулей функций
^г2) = (гі,у(.; г1,Т) - ; г2,Т)),
0 ^ i ^ 2n, в области W совпадает с Z = n°=1Zj (Zj — нули /\ф^- в W) .В силу полноты
системы {ki, i ^ 1} любые неравные на отрезке [0,T] функции у(•;ж1,^ = у(•; ж2,т), xj G UT, имеют различный набор проекций:
{<Гг, У (• ; ж1, T Г» = {< Гг, у (• ; Ж2 ,Т Г».
Из взаимно однозначного соответствия
у( • ; Ж,T) О (^о(ж), ... ,^>2п(ж)), ж G UT,
^г(ж) = (гг, у( •; ж,т)), следует базисность набора функций в множестве Ф(ит). Удачных наборов {rj} бесконечно много: имеется определенный произвол в выборе систем {ki} и коэффициентов рядов для функций rj. □
Если брать ki(t) = tl, то можно построить rj (t) вещественными аналитическими в форме степенного ряда. Допустимо использование и разрывных ki(t), если доказывать сходимость рядов для rj (t) в пространстве L2.
Наблюдаемость пары (f, g) в M С UT (у( •; ж, T) О ж G М) характеризуется тем, что для полной в L2 (или хотя бы в Y = {у(-)}) системы {ki, i ^ 1} множество общих нулей функций Дфг(ж1, ж2) в M х M совпадает с диагональю {(ж,ж)| ж G M}. Для базисных rj (•) вектор жт G M однозначно определяется по набору 2n + 1 проекций = (гг,у). Если (f, g) не является полностью наблюдаемой, поиск базиса Ф(М) (M С UT) сохраняет прикладное значение, поскольку для «отслеживания» значений и(ж^)) заданной функции и(ж) по предыстории измерений на [t — T, t] нет необходимости в промежуточном восстановлении полного фазового вектора ж^). Если какая-либо из базисных весовых функций k() не удовлетворяет ограничениям реализации |k(t)| ^ k = const, то вместо нее следует взять ak(-) с малым множителем а. Важны лишь «проекции на направления».
Устойчивость интегральных операторов наблюдения
Прежде чем переходить к уточнению понятия устойчивости операторов наблюдения, исследуем аналитическую структуру элементов множества достижимости DT = {v(T, •)} линейной сопряженной системы управления. В стационарном линейном случае, когда ж = Тж, у = Сж, имеем DT = {V(T)} = L(K), где L — линейная оболочка столбцов матрицы управляемости K = (G;, F'G;,..., F/n-1G^. Попытаемся найти аналог такого конечного описания в общем (бесконечномерном) случае.
Локальное представление элементов ©т
Рассмотрим вещественную аналитическую систему наблюдения (/, д): х € и С Мп,
х = /(х), у = д(х), у(-): [0, Т] — М.
С целью упрощения обозначений пишем /, д € Сш(и) и считаем т = 1, т. е. остановимся на анализе наблюдаемости по скалярным измерениям на отрезке [0, Т]. Это сужение задачи в дальнейшем непринципиально. Кроме того, ограничимся линейными весовыми функциями к(£,у) = к(£)у. Допустимы к(-) € С[0, Т] (при необходимости к(-) € КС).
Перейдем к задаче представления элементов множества достижимости
©т = {и(Т, ■): ит —— М,
к(£, у) = к(%, и(Т, х) = (к, у( ■; х, Т)>}
в форме линейных комбинаций конечного числа функций Lf.gr, где ¿0д(х) = д(х),
¿}+1д(х) = дж(Т}д(х)) ■ /(х), х € и.
В приложениях обычно компоненты вектор-функций /, д являются суперпозициями элементарных функций, тогда и Т.д таковые. В операторных терминах производные
. = АгВ (В = д, А = д*(-)/)
представляют аналог столбцов матрицы управляемости: (/, д) = (К, С) ^ Т.д(х) =
СТгх, З1'?-1^' — j-й столбец А). Производные выхода у(г) (¿) равны Т.д(х(£)). Теоретически удобно исследовать разрешимость системы уравнений Т.д(х) = у(г)(Т) , 0 ^ г ^ п — 1, относительно х = хт в области ит. Но последовательное дифференцирование измерений у(£) практически неприемлемо. В этом контексте интегральные операторы корректны: каждая операция производится независимо от другой и происходит сглаживание измерений.
Последующие построения носят локальный характер. Фиксируем произвольную точку х € ит и достаточно малый куб П С ит,
П = {х € Мп: ||х—х|| = тах |х^ — хг| <5} С ит.
В силу теоремы единственности для вещественных аналитических функций выполнено у|[о,т] ^ у|[*1,*2], 0 ^ ¿1 < ¿2 < Т. Поэтому для теоретического анализа наблюдаемости без существенного ограничения общности можно считать отрезок наблюдения таким, что функция у(£; х,Т) на множестве {(¿, х)} =
(—е, Т + е) х П, е > 0, разлагается в ряд по степеням (£ — Т) и компонент вектора х — х. Степенные ряды по х — х в кубе П для производных и элементов множества достижимости
¿¿(х) = д(х) = у(г)(Т; х,Т), ш(х) = -и(Т, х)
определяют такие голоморфные функции : Р — С, шС : Р — С, что
ГС1 ¿г |п
ад
ш|
Р = {г € Сп: ||г — х|| = тах |гг — хг| <5} .По непрерывности ¿С, шС продолжаются на замыкание Р (иначе уменьшим значение 5 > 0).
Рассмотрим идеал 3 в кольце Нп ростков голоморфных функций в точке х, порожденный {¿С : р — С, г ^ 0}. Элементы 3 — конечные линейные комбинации ростков с коэффициентами из Нп. Пусть окрестности точки го = х (поликруги Рг в подходящем базисе Сп), базисные функции ^1,..., Л,г , константы вг, г ^ 1, выбраны согласно теореме 2. Фиксируем номера в ^ 1, р ^ 1 из условий С Р и справедливости в достаточно малой окрестности У? ^ р представлений
ЕР— 1
(6)
||д. < в ЦТС ||д., в?* €0(0, С)
0 ^ V ^ р — 1, ? ^ р, в> 0. Это возможно, поскольку все функции в окрестностях 0г,
г ^ 1, являются линейными комбинациями голоморфных функций ^1, ..., Л,г. Последние, в свою очередь, в некоторой окрестности точки х представимы комбинациями конечного числа ¿V по определению идеала 3 (коэффициенты — голоморфные функции). Существование константы в, независящей от номеров V и ?, следует из оценок в теореме 2.
Итак, без существенного ограничения общности полагаем, что на множестве {(¿, х)} = (—е, Т + е) х П (е > 0) у(£; х, Т) =
= £ ^—Т? ум(т ) = £ -—Т? (х)
?=о
?=о
Ь?,г1,...,г„ ■
?,гь...,г„^0
V=1
Тогда для ш(х) = -и(Т, х) = (к,у( ■; х,Т)) при х € П справедливо представление
ЕОО , • ч
?=0 с?¿?(х) с? = (^ (т — Т)? >А? !
п
п
п
По теореме Абеля о сходимости степенных рядов из полученных разложений следует, что в открытом поликруге Р определены функции
чС©
,.=о с,(г) г е Р,
шС|п= ш|п, ¿С|п = |п. Используя представ-
ление (6), получим в окрестности р—1 р—1
,=0 v=0
а при вещественных значениях аргумента:
р— 1
(х) = Ие в^ (х), ш(ж) = Е С, (ж)
,=0
р— 1
+ ср^ v=0
р—1
^(ж)^ + Ср+^ Пр+1^(ж)^ + ....
V=0
¿С (*)
< тах 1 п(^,.г)|, К - Т| = Т, Т < Т,
С Т "Л|р
Т < Т + е, ||ТС||р ^ Т 7, Т = 8ПР | п(С,*01
С*
|£ — Т| = Т, г е Р, где Ь < в силу П С ЦТ Р С (5 достаточно мало). С учетом
Ы г! = /к(т)(т — Т)г ^т
0
в окрестности получаем последовательность оценок: q = ТТ < 1,
^1 + |ср| |вpv1 + |ср+1| |вр+1^(г)| + ...
^ ^ 1 + |ср| 11вpv ||дз + |ср+1| 11вр+1 ^ ||дз + ...
^ 1 с^'1 + 9 |ср| ||ьр!Р + 9 |ср+1| 11Ьрр+1 НР + ...
< |с* | + 9^Ь^р + 9^Ь^р+1 + ....
□
Заменим при £ е (—е, Т + е), ж е П Мга в
представлении у(£; ж, Т) =
= ¿0(ж) + (£ — Т)Ь1(ж) + 0.5(£ — Т)2Ь2(ж) + ...
производные Ь,, j ^ р, линейными комбинациями согласно разложениям (6) и «соберем коэффициенты» при функциях ¿0,..., Ьр— 1:
р-1
Вещественная часть голоморфной функции (ж) является вещественной аналитической в пересечении О., П Мга С П.
Лемма 1. Ряд в представлении (7) сходится абсолютно и равномерно в .
Доказательство. Достаточно доказать абсолютную и равномерную в области сходимость рядов ^ + Сpвpv (г) + Ср+1 вр+1^(г) +..., конечной линейной комбинацией которых и получается разложение (7). Сходящийся степенной ряд для у(£; ж, Т) определяет голоморфную функцию п(С, г), где |£ — Т| < Т + е, г е Р, п|А= У^, А = (—е, 2Т + е) х П. Для каждого г е Р в силу неравенств Коши
у(£; ж, Т) = Е 7г(£, ж)¿г(ж), ¿г = д, (8)
г=0 р—1
^(Т, ж) = Е ^^¿¿(ж), СТг(ж) = (к,7*(-,ж)),
г=0
ж е П Мп, £ е (—е0, Т + е0), е0 > 0, Т+е0 < Т < Т+е. В силу леммы абсолютная и равномерная сходимость комплексных функциональных рядов обеспечивает возможность перегруппировки слагаемых и вещественную аналитичность функций 7г(£,ж), а* (ж). Результат является следствием неравенств Коши и оценок в окрестности коэффициентов в,> из представлений (6) с константой 9 = 9(^, j).
В локальной постановке задачи наблюдения неопределенность в начальных данных ж( ) мала и требуется исследовать наблюдаемость в окрестности опорного движения с ж( Т) = ж. Поэтому сформулируем итог проведенных рассуждений в следующей форме.
Теорема 5. Пусть /,д е (Ц), отрезок времени наблюдения [0, Т] и область ЦТ = {ж(Т)} достаточно малы (ЦТ : ||ж — ж|| < 5). Тогда в ЦТ элементы множества достижимости Т>Т = {-и(Т, ■ )| к(£, у) = к(£)у} имеют представление (8), где функции т*(£,ж) являются вещественными аналитическими в области (¿;,£/;) х ЦТ Э [0,Т] х ЦТ, а функции Ог(ж) — в области ЦТ (т* = 7г(к)).
В отличие от линейного случая, в полученном конечном разложении элементов множества достижимости по «столбцам матрицы управляемости» АгВ = д коэффициенты Стг являются функциями фазового состояния. Если у набора ¿0,..., ¿р— 1 имеются два различных общих нуля в области ЦТ, то пара (/, д) заведомо неполностью наблюдаема в ЦТ. При т > 1 имеем (к, у)^т = (к1,у1) + ... + (кт,ут) и представление вида (8) останется в силе, только — строки (стг1,..., ).
Результат обобщает следующие построения. При / = Тж, д = Сж имеем у(£; ж, Т) =
^ (£ т)*
= С ехр{(£ — Т)^ж = ^^ж.
г=0
г!
25
Для номеров j ^ р, р = гапк(С/,..., Т/п—1С/), можно строки СТ^ выразить как линейные комбинации р строк С, СТ,..., СТр—1. Меняя порядок суммирования, получаем
р-1 р-1
у(£;ж,Т) = ^ 7, (¿)С^ ж = ^ 7, (ж),
,=0 ,=0
р—1
^(Т,ж) = (к,у) = Ест,-(ж), ст,- = (к,Т?>Ь2. ,=0
Коэффициенты 7, (£) обладают свойством
7(Т) = (70(Т),...,7р—1(Т))/ = еЪ 7(Т) = e2, ..., 7(р" _1)(Т) = ер, как и 7,(£,ж), построенные в (8): 7(Т,ж) = е1, 7*(Т,ж) = е2,..., {е*} — канонический базис М”. Впрочем, суммированием рядов заниматься необязательно. Достаточно воспользоваться представлением матричной экспоненты ехр{Т£} = а0(£)Е + ... + ар—1(£)Тр—1. Здесь (как и при т > 1) в качестве р можно взять степень характеристического или минимального аннулирующего полинома матрицы Т. Поиск а, (£) сводится к решению линейного однородного скалярного дифференциального уравнения р-го порядка.
Вариации весовых функций
Перейдем к вопросу об устойчивости локального базиса наблюдаемых компонент к малым вариациям весовых функций к(-), что существенно с вычислительной точки зрения. Для этого установим важное свойство коэффициентов 7г(£,ж). Само представление вида (8) неединственно: можно формально увеличить значение р (полагая соответствующие 7, = 0), изменить т* добавлением нетривиальной тождественной нулю комбинации производных и т. п. Фиксируем в разложении (8) именно те коэффициенты 7, (£, ж), которые построены выше (Т, ЦТ достаточно малы):
7j (t,x) =
(t - T )j j!
+£
(t - T)v
v=p
V!
nvj (x)
0 ^ j ^ р — 1, ^(ж) = Иевvj(ж),
£ е (—е0,Т + е0), е0 > 0, ж е ЦТ, т = 1. Фиксируем произвольную полную в ¿2 [0,Т] систему {кг,г ^ 1}. Тогда для элементов Шг(ж) = ■иг(Т, ж) = (кг,у( ■; ж,Т)), ж е ЦТ, получим (Ш1 (ж), Ш2(ж), . . .)/ =
/ (ki,7o) ,.. = I (k2,7o) ,..
х (^..., LP-i);.
(ki,7P-i)
(k2,7p-1)
Лемма 2. В представлении (9) элементов множества достижимости Wj Є DT, i ^ 1, среди строк матрицы Г = {(fcj,7j(-,x))} при любом фиксированном x Є UT можно найти p линейно независимых строк.
Без ограничения общности предполагаем, что базис строк матрицы находится среди p первых строк. В матричной записи получаем представление Г' = (M, MN), M = Mpxp. Предположим противное:
rank M <p ^ Гс = 0, с = (c0,..., cp-1)' = 0,
x = X Є UT. Тогда выполняется (ki,c'7) = 0, 7 = (7o,...,7p-i)'. В силу полноты системы (fci, i ^ 1} в L2 имеем Vt Є [0, T] с'7(t, X) =
p— (t -t)j (t -t)pp— ...
zJ j і Cj + p! npj (x)cj + ... = 0.
^_П J Г' ■_гч
j=0
j=0
Отсюда все с, =0 и получаем противоречие.
Пусть пара (/, д) вещественно аналитична в и С Мп. Фиксируем Т и окрестность Q некоторой опорной точки ж е и, для которых справедливо конечное представление (8), а также любую полную в ¿2[0,Т] систему {кг,г ^ 1} допустимых весовых функций.
Теорема 6. Если область неопределенности ЦТ (ж е ЦТ С Q) достаточно мала, то можно выделить такие кг1,..., , что:
1) элементы (ж) = ^ (Т, ж) = (к^, у) (ж е ЦТ, 1 ^ V ^ д) образуют базис множества достижимости £>Т (и Ф(иТ));
2) базис множества Т>Т образуют также
функции (ж) = (к^ + , у) при доста-
точно малых возмущениях ||£^ ||^1 < е.
Доказательство. Считаем иТ окрестностью опорной точки ж е и (требование малости ЦТ далее уточним). Рассмотрим идеал 1 С Н2П ростков голоморфных функций в точке (ж, ж) е ЦТ х ЦТ, порожденный множеством {Д^ : Р х Р С, г ^ 0}, Д^ (ж1, ж2) = ж1) — ж2 . Используем построения из до-
казательства теоремы 5. Представления
ALj (zi,z2) = 21=0 (zi,z2)AL
(10)
<?yALC ||q_, Q = 0(v,j), j ^ q,
(9)
справедливые в некоторой комплексной окрестности (Тз точки (ж, ж) в произведении Р х Р, доказывается аналогично разложениям (6). Считаем, что ЦТ х ЦТ С П М2п. Точно так же (только удваиваем размерность)
0
приходим к выражениям (9) с заменой элемен-тоэ шг(ж) на разности Дш*(ж1, ж2) = шг(ж1) — шг(ж2) = (кг,у(■;ж1,^ — у(■;ж2,т)(, заменой функций ¿э(ж) на разности Д^ (ж1, ж2) = ^ (ж1) — ^ (ж2) и номера р на д. Для этого в разложении в функциональный ряд
Ду = у(£; ж1,Т) — у(£; ж2,Т)
= Д^ + (£ — Т)ДЬ1 + 0.5(£ — Т)2ДЬ2 + ...
следует заменить Д^, j ^ д, линейными комбинациями функций Д^,..., Д^— по формуле (10) и поменять порядок суммирования.
Фиксируем теперь номера ¿1,..., линейно независимых в точке (ж, ж) строк соответствующей матрицы Г: (Дшг1,..., Дш^ ) =
= (Д!0,..., Д^—1)Д, ж1,2 е иТ.
При этом det Я(ж, ж) = 0. Элементы матрицы Я имеют вид скалярных произведений ,7?(' ,ж1,ж2)) (0 ^ j ^ д — 1, 1 ^ V ^ д). Поэтому при достаточно малых допустимых возмущениях ||{^ ||ь1[о,т] < е матрица Я с элементами + {^ ,7,) останется невырожденной в точке (ж, ж) и ее окрестности Цт х Цт . Здесь, если необходимо, снова уменьшаем область ит. Окончательно получаем
(ДЙ^ ,..., ДЙ^ ) = (Д^,..., ДЬq—1) Я, (11) (ж1, ж2) е ит х ит, det Я? = 0, ||{^ |^1 < е, ДЙ^ (ж1, ж2) = (^ + {г^, ДуО.
Из ДШгДж1, ж2) =0, V ^ д, следует
Д^ (ж1, ж2) =0, j ^ д — 1, и Д^ = 0, j ^ 0, у(■; ж1,^) = у(■; ж2,т). Поэтому
(Шг1 (ж), . . . ,£Тгч (ж)) О у( ■ ; ж,Т), ж е Цт .
Функции образуют базис множества достижимости РТ сопряженной системы и множества Ф(ит) наблюдаемых функций ^. □
СВЕДЕНИЯ ОБ АВТОРЕ:
Заика Юрий Васильевич
зав. лаб. моделирования природно-технических систем, д. ф.-м. н.
Институт прикладных математических исследований КарНЦ РАН
ул. Пушкинская, 11, Петрозаводск, Республика
Карелия, Россия, 185910
эл. почта: [email protected]
тел.: (8142) 766312
Следствие. Если дополнительно пара (/, д) наблюдаема в области Цт , то фазовый вектор ж(Т) е Цт однозначно определяется по д проекциям ^ = (к^, у) из системы уравнений (Т, ж) = ^, 1 ^ V ^ д. Однозначность восстановления ж(Т) останется при малом возмущении весовых функций (■).
ЛИТЕРАТУРА
Заика Ю. В. Вычисление фазовых переменных ЛА по результатам траекторных измерений // Методы восстановления и анализа динамики управляемых процессов. М.: МО, 1988. Вып. 1. С. 57-71.
Заика Ю. В. Устойчивые дискретные программы наблюдений в аналитических динамических системах// Математические заметки. 1999. Т. 66, № 2. C. 194-201.
Иванов А. П., Кирин Н. Е. Сопряженные задачи теории управления. Л.: ЛГУ, 1988. 88 с.
Кирин Н. Е. Методы оценивания и управления в динамических системах. СПб.: СПбГУ, 1993. 308 с.
Козеренко К. В. О числе замеров // ДАН СССР. 1987. Т. 296, № 5. С. 1069-1071.
Красовский Н. Н. Теория управления движением. Линейные системы. М.: Наука, 1968. 476 с.
Никайдо Х. Выпуклые структуры и математическая эконимика. М.: Мир, 1972. 523 с.
Ортега Дж., Рейнболдт В. Итерационные методы решения нелинейных систем уравнений. М.: Мир, 1975. 560 с.
Чирка Е. М. Комплексные аналитические множества. М.: Наука, 1985. 270 с.
Эрве М. Функции многих комплексных переменных. М.: Мир, 1965. 265 с.
Inoye Y. On the observability of autonomous nonlinear systems // Journal of Math. Analysis and Applications. 1977. Vol. 60, N. 1. P. 236-247.
Zcwka Yu. Integral observability operators of nonlinear dynamical systems // International Journal of Mathematics and Mathematical Sciences. 2003. N. 55. P. 3519-3538.
Zaika, Yury
Institute of Applied Mathematical Research, Karelian Research Centre, Russian Academy of Science 11 Pushkinskaya St., 185910 Petrozavodsk, Karelia, Russia
e-mail: [email protected] tel.: (8142) 766312