Научная статья на тему 'Метод экстремального сдвига в задачах идентификации и управления дифференциальными включениями, содержащими субдифференциалы'

Метод экстремального сдвига в задачах идентификации и управления дифференциальными включениями, содержащими субдифференциалы Текст научной статьи по специальности «Математика»

CC BY
60
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод экстремального сдвига в задачах идентификации и управления дифференциальными включениями, содержащими субдифференциалы»

ТЕОРИЯ УПРАВЛЕНИЯ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

УДК 517.934 © В. И. Максимов

МЕТОД ЭКСТРЕМАЛЬНОГО СДВИГА В ЗАДАЧАХ ИДЕНТИФИКАЦИИ И УПРАВЛЕНИЯ ДИФФЕРЕНЦИАЛЬНЫМИ ВКЛЮЧЕНИЯМИ, СОДЕРЖАЩИМИ СУБДИФФЕРЕНЦИАЛЫ1

Введение

В области О С Яп с достаточно гладкой границей Г рассмотрим смешанную граничную задачу

х*(£, п) - Дьх(£, П) + ао(п)х(г, п) + в(х(£, п) - ф(п)) Э (1)

Э (Bu(^))(n) - (Си(£))(п) + /(£, п) на ^ = Т х О,

а^(£, а) + а2дх(£,а)/ди = 0 на X = Г х (£о,$) с начальным условием

х(£о, п) = х0(п) при п. в. п € О.

Здесь Т = [£о,$] , а^ ^ 0, а1 + а2 > 0, ф € Н2(О) , /(■) € Ь2(^) , в — максимально монотонный граф на Я х Л, 0 € ^(в) = {<г € Я : в(^) < +^} , дх/ди — производная по внешней нормали, Д^х = ^П=о д2х/дп2 — оператор Лапласа, (и, 1'|и) и (^, | •|у) равномерно выпуклые банаховы пространства, В € С(и; Н) и С € £(У; Н) — линейные непрерывные операторы, Н = ^2 (О) .

Включения (1) используются для описания процесса управления термостатом, параболической задачи с препятствием, задачи Сигнорини и т. д. Интенсивное исследование параболических включений, содержащих субдифференциалы выпуклых функций началось в семидесятые годы прошлого века в значительной мере благодаря работам Х.Брезиса [1]. При этом основное внимание уделялось, как правило, вопросам существования и единственности решений, их регулярности. В работах В.Барбу [2] для таких включений рассматривались задачи оптимального программного управления (принцип максимума). Им же был развит метод динамического программирования [3]. Качественным вопросам управляемых субдифференциальных включений в банаховых пространствах посвящены работы А.А.Толстоногова [4].В данной заметке мы хотим обратить внимание на тот факт, что для исследования трех довольно разных по своей

природе задач - задачи отслеживания эталонного движения, задачи игрового управления и за-

дачи динамического восстановления входа (задачи идентификации)- может быть использован единый подход.

§ 1. Содержательная постановка задач

Приведем содержательную постановку обсуждаемых задач. Пусть фиксирована равномерная сетка Д = {тг}™о , тг = тг-1 + ^, то = ^о , тт = $ на интервале Т. Пусть решение включения (1) х(-) = х(-;Ьо,хо,и(-),у(-)) зависит от изменяющегося во времени управления п(-) € ^2(Т; и) и неизвестного возмущения -и(-) € ^2(Т; V) . Функция х(-) также неизвестна. В моменты £ € Т или т% € Д фазовое состояние х(£) (в первом случае) или х(т^) (во втором случае) измеряются с ошибкой. Результаты измерений — элементы ^(£) € Н или € Н, г € [0 : т - 1] — удовлетворяют неравенствам

!^(£) - х(£)|я < Н (2)

или

№ - х(тг)|Я < Н (3)

соответственно. Здесь Н € (0,1) — величина информационной погрешности.

хРабота выполнена при частичной финансовой поддержке Российского фонда фундаментальных исследований (грант 04-01-00059), Программы научно-исследовательских работ Президиума РАН №13 и Программы поддержки ведущих научных школ России НШ 7581.2006.1.

Задача отслеживания эталонного движения. Предполагается, что в правой части включения (1) v = -и(£) = 0, £ € Т. Задано число е > 0. Имеется эталонное движение, которое описывается также включением вида (1), в котором, однако, С = 0 , а и = и*(£) . При этом как функция и* (■) , так и решение эталонного включения $(•) неизвестны. Известно лишь, что и*(£) € В* при п.в. £ € Т, где В* С и заданное ограниченное и замкнутое множество. В моменты т € Д наряду с х(т^) измеряется (с ошибкой) состояние $(Гг) . Результаты измерений неточны. Требуется указать алгоритм формирования по принципу обратной связи управления и = и(£) € Р, £ € Т, такой, что траектория включения (1) останется при всех £ € Т в равномерной е -окрестности эталонного движения.

Задача игрового управления. Пусть фиксированы Р и Q — ограниченные и замкнутые множества из пространств и и V соответственно. Заданы непустое множество N С Н и число е > 0 . Требуется указать алгоритм формирования по принципу обратной связи управления и = и(£) € Р, £ € Т, включением (1) обладающий следующими свойствами. Каково бы ни было возмущение v(•) , V = v(£) € Q, £ € Т, расстояние от фазового состояния х(£)= х(£; £о,хо,и(-)^(-)) в момент £ = $ до множества N не должно превышать значения е.

Задача динамической реконструкции входа (задача идентификации). Пусть в правой части включения (1) управление равно нулю, то есть и = и(£) = 0, £ € Т. Требуется построить динамический алгоритм, который позволяет восстановить неизвестный вход (возмущение) V = v(•) в «реальном времени».

Для решения всех трех типов задач, описанных выше, может быть использован единый подход, основанный на методе вспомогательных позиционно-управляемых моделей. При этом зоконы выбора управлений в моделях основываются на тех или иных модификациях принципа экстремального сдвига Н.Н.Красовского [5]. Ниже приведена схема алгоритма решения задачи динамической реконструкции [6,7]. Аналогичная схема может быть использована и для решения двух других задач.

В соответствии с этой схемой вводится вспомогательная система (модель) М с траекторией ш' (£) и управлением и'(£) . Затем задача реконструкции заменяется задачей построения алгоритма управления моделью по принципу обратной связи. При этом алгоритм управления отождествляется с отображением Ы, выбираемым таким образом, что функция и'(-) «приближает» в ^2(Т; V) неизвестное возмущение v(•) : и'(£) = и' = Ы(т^', ш'(£)), £ € ^ , — в

первом случае, и и'(£) = Ы(£, £'(£), ш'(£)) , £ € Т , — во втором.

§ 2. Алгоритм решения задачи реконструкции

Обратимся к задаче реконструкции. Считаем, что подлежащее определению возмущение v(•) является элементом пространства ^(Т; V) . Включение (1) может быть записано в виде

х(£) + д^(х(£)) Э -С«(£) + /(£), £ € Т, (4)

где ^ : Н ^ Я — некоторая выпуклая функция, вид которой может быть указан явно [2]. Решение (1), порожденное возмущением v(•) € ^(Т; V) обозначим символом

х(') = х(-;£о,хо^(-)) . Пусть модель М описывается соотношением

Ш'(£) + д^(ш'(£)) Э -Си'(£) + /(£), £ € Т, ш'(£о)= хо. (5)

В первом случае (когда верны неравенства (2)), управление в модели (4) определим по правилу

и'(£) = Ы(р(£)) € V, £ € Т, (6)

где р(£) = (£,£'(£),ш'(£)). Во втором случае (когда верны неравенства (3)), мы считаем фиксированным семейство разбиений

Д' = {т*,'}то, т*,' = тг-1,' + 5, то,' = £о, т^,' = $ (7)

с диаметрами 5 = 5(Н) . Управление и'(■) в модели (4) при этом определим следующим образом:

и'(£) = Ы(рг) € V, £ € 5*,' = [тг,', т^,'), (8)

где р* = (т*,',^,ш'(£)) (при £ € 5*,' ).

Пусть v*(•; х(-)) — элемент минимальной ^(Т; V) -нормы из множества V*(х(-)) всех функций v(•) € Ь2(Т; V) , порождающих решение х(-) , т. е. v*(■; х(-)) = argтт{^(-)|^2(т;У) : v(■) € V*(х(-))} , где К(х(-)) = {£(•) € Ь2(Т; V) : х(-) = х(-; £о,хо,V(•))} .

Задача динамической реконструкции состоит в конструировании стратегии управления по принципу обратной связи Ы : Т х Н х Н ^ V такой, что управление и'(■) , определяемое согласно (6) или (8), обладает свойством и'(■) ^ v*(•; х(-)) в ^(Т; V) при Н ^ 0 .

Опишем два алгоритма решения этой задачи. Сначала рассмотрим первый случай. Введем функцию а(Н) : (0,1) ^ Я+ = {г € Я : г > 0} со свойствами

а(Н) ^ 0, Н2/3а-1 (Н) ^ 0 при Н ^ 0. (9)

Отображение Ы : Т х Н х Н ^ V зададим по правилу

Ы(р(£)) = а-1(Н)С*(£'(£) - ш'(£)), (10)

где символ С * означает сопряженный оператор, а символ ш'(-) — решение включения (5) с управлением и'(-) , определенным согласно (6), (10).

Теорема 1. Пусть выполнено условие (9). Тогда закон управления Ы вида (6), (10) решает задачу динамической реконструкции входа в первом случае.

Рассмотрим случай, когда выполняются неравенства (3), т.е. второй случай. Пусть фиксированы разбиения Д' , Н € (0,1) , (7) и функция а(Н) : (0,1) ^ Я+ . Пусть также выполнено следующее условие:

а(Н) ^ 0, 5(Н) ^ 0, 5(Н)а-2(Н) ^ 0, Н25-1 (Н)а-1 (Н) ^ 0 при Н ^ 0. (11)

Отображение Ы : Т х Н х Н ^ V зададим по правилу

Ы(р*) = а-1(Н)С*(£' - ш'(£)), (12)

где ш'(■) — решение включения (5), отвечающее управлению и'(-) , определенному согласно (8), (12).

Теорема 2. Пусть выполнено условие (11). Тогда закон управления Ы вида (8), (12) решает задачу динамической реконструкции входа во втором случае.

§ 3 . Алгоритм решения задачи отслеживания эталонного движения

Назовем (h, A,g) -решеним Xд g(■; t*,x*,U, vtt,$(■)), порожденным законом управления U на разбиении А , решение x(-) включения (1) (с начальным состоянием (t*,x*)), отвечающее кусочно-постоянному управлению u = uh(-) (формируемому по принципу обратной связи: uh(t) = uh Є U(pi) Є U , t Є [Ti,Ti+l) , i Є [О : m - І] , pi = (Ti,{h,g(Ti)) , |{h - x(t*)|h ^ h) и возмущению vt,,#(■) Є Qt,,#(■) .

Задача отслеживания эталонного движения состоит в построении закона управления U : T x H x H ^ P со следующими свойствами: каково бы ни было число є > О, можно указать (в явном виде) такие числа h* > О и й* > О, что выполняется неравенство supteT g(t,t0,X0,U) - g(t)|H ^ є, каковы бы ни были измерения со свойствами (З)

при h ^ h* и й = й(А) ^ й* .

Опишем процедуру формирования (h, A,g) -решения Xд g(■; t0,X0, U) , отвечающего фиксированному разбиению А и отображению U вида

U(t, x, g) = arg min{(x - g, Bu)H : u Є P}. (1З)

На интервале [t0,Tl) возьмем произвольный элемент u[j Є P. Под действием управления u(t) = uh , t Є [t0,T1) , реализуется (h, A,g) -решение {жД g(■; t0,x0,uh)}to, Tl . В момент t = т1 определим uh из условия

uh Є U(pl), где pl = (Tl,^h,^h), |^h - Xд,g(ti)|h < h, |^ - g(Tl)|H < h.

После этого вычислим реализацию (h, A,g) -решения ^д g(■; ті^Д w(Tl),uh)}Tl, T2 . Пусть (h, A,g) -решение Xд g(■) определено на интервале [t0,Ti] . В момент t = ті выберем

uh Є U (pi^ где pi = (Ti ,Cih,^h), |Cih - XA ,g (ті) |Я < h, |^ih - g(Ti)|H < h-

В результате действия управления uh(t) = uh , t Є [ті, ті+і) , i Є [О : m - І] (h, А, g) -решение системы (1) g(■; ті^д g(ті),uh)}Ti, Ti+1 реализуется на интервале [ті,ті+і] . Описанная выше

процедура формирования (h, A,g) -решения заканчивается в момент $ .

Теорема З. Пусть D* = P . Тогда закон управления U : T x H x H ^ P, определенная согласно (1З), решает задачу отслеживания эталонного движения.

Список литературы

1. Brezis H. Operateurs maximaux monotones et semigroups de contractions dans les espaces de Hilbert. Amsterdam, 197З.

2. Barbu V. Optimal control of variational inequalities. Research Notes in Mathematics, Pitman Advanced Publishing Program, London, 19В4.

3. Barbu V., Da Prato D. Hamilton-Jacobiequations in Hilbert spaces. Research Notes in Mathematics, Pitman Advanced Publishing Program, London, 19В4.

4. Толстоногов А.А. Свойства множеств достижимости эволюционных включений и управляемых систем субдифференциального типа. Сибирский мат. журнал. 2004. Т. 45, № 4. С. 920-945.

5. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974.

6. Осипов Ю. С., Кряжимский А. В., Максимов В. И. Обратные задачи динамики для параболических систем. Дифференц. уравнения. 2000. Т. З6. № 5. С. 579-597.

7. Osipov Ju. S., Kryazhimskii A. V. Inverse problems for ordinary differential equations: dynamical solutions. Gordon and Breach, London, 1995.

Максимов Вячеслав Иванович Институт математики и механики Уральского отделения РАН Россия, Екатеринбург e-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.