АДАПТИВНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ОБЪЕКТАМИ С КООРДИНАТНО-ПАРАМЕТРИЧЕСКИМИ ВОЗМУЩЕНИЯМИ ТИПА БЕЛОГО ШУМА
И. В. Разуваева1, А. Л. Фрадков2
1. С.-Петербургский государственный университет, аспирант, [email protected]
2. Институт проблем машиноведения РАН,
д-р техн. наук, профессор, зав. лабораторией, [email protected]
В работе доказывается теорема о диссипативности в среднеквадратическом адаптивных систем стабилизации линейного объекта при координатно-параметрических возмущениях типа белого шума. Адаптивный регулятор выбирается линейным с настраиваемыми коэффициентами. Для настройки используется алгоритм адаптации, синтезированный по методу пассификации. Рассматриваются объекты, у которых число входов может не совпадать с числом выходов. Доказательство основано на построении квадратичной стохастической функции Ляпунова (как известно, в случае чисто параметрических возмущений полученные условия оказываются необходимыми и достаточными для существования у системы функции Ляпунова с заданными свойствами). Получены условия диссипативности построенной замкнутой системы и показано, что в некоторых частных случаях диссипативность замкнутой системы сохраняется при произвольной интенсивности возмущений типа белого шума.
Введение. Математическая теория адаптивных систем управления была развита в работах В. А. Якубовича и других ученых в 1960-х годах [1—3]. Одним из эффективных подходов к синтезу адаптивных систем является метод пассификации, позволяющий находить простые условия достижения цели управления для широкого класса линейных и нелинейных систем [4-6]. Однако в большинстве существующих работ по адаптивному управлению на основе пассификации рассматриваются лишь детерминированные системы. В то же время в практических задачах возмущения зачастую носят случайный характер и оказывают существенное влияние на динамику системы.
Распространенный подход к описанию динамических систем со случайными возмущениями — использование моделей динамики в виде стохастических дифференциальных уравнений (уравнений Ито), описывающих возмущения типа белого шума. Решение некоторых задач адаптивного управления стохастическими дифференциальными уравнениями Ито на основе пассификации изложено в книге [3]. Результаты [3] интерпретируются как решение задачи адаптивной стабилизации линейных объектов, в которых возмущения в виде белого шума действуют либо на параметры объекта, либо на его координаты. Однако в реальных ситуациях воздействие случайных шумов на координаты и параметры бывает трудно разделить. Поэтому представляет интерес решение задачи адаптивной стабилизации для случая координатно-параметрических возмущений. Рассмотрению этого случая и посвящена данная работа.
Предварительные сведения. Приведем некоторые вспомогательные сведения, используемые в дальнейшем.
© И. В. Разуваева, А. Л. Фрадков, 2009
Пусть Ж( —семейство векторов евклидового пространства К”, зависящих от вещественного параметра £ ^ 0. Введем вектор-функцию а(Ь,х) = (а\(Ь,х),... ,ап(Ь,х)) и (п х к)-матрицу-функцию а(Ь,х) = ||ст^(1,х)\\.
Стохастическим дифференциальным уравнением Ито называют соотношение
dxt = а(1,х^& + о(ф,хъ )<1и>1, (1)
точный смысл которого вытекает из записи в интегральной форме
t t
xt = xo + j a(s,xs)ds + j a(s,xs)dws. (2)
t
Здесь wt — k-мерный винеровский процесс, J a(s, xs )dws — стохастический интеграл
to
Ито. Следующая теорема устанавливает условия существования и единственности решения уравнения (1) [7].
Теорема 1. Пусть функции a(t, x) и a(t, x) определены и измеримы на [to, T] х Rn, to ^ 0, непрерывны по (t,x), t ^ to, x £ Rn и локально-липшицевы по x: в каждой ограниченной по x области из множества (t, x) : t ^ to, x £ Rn выполнено условие
||a(t, xi) - a(t, x2)\\ + \\a(t, xi) - a(t, x2)\| < L||xi - x2\| (3)
для некоторой постоянной L > 0. Пусть существует непрерывно дифференцируемая по t и дважды непрерывно дифференцируемая по x неотрицательная функция V(t, x), для которой
LV ^ cV, c = const, (4)
VR = inf V(t, x) ^ ж при R ^ ж,
\x\'^R,t'^to
где L — производящий оператор диффузионного процесса xt, определяемый выражением
д 1
CV(t, х) = —V(t, х) + WT(t, x)a(t, х) + - trace aT(t, x)Vxx(t, x)a(t, x). (5)
Тогда для любого T ^ to справедливы следующие утверждения:
1) для любой случайной величины X(to), независимой от процессов wt — wto, существует единственное с точностью до стохастической эквивалентности в сильном смысле (то есть для любых двух решений Xi(t) и X2(t) выполнено P{ sup IX2(t) — Xi(t)| > 0} = 0) решение X(t) = Xto,X(to)(t), to ^ t ^ T,
to^t^T
уравнения (2), являющееся непрерывным с вероятностью 1 процессом;
2) это решение является марковским случайным процессом с переходной функцией P(r, x, t, Г), определяемой при t > r ^ to соотношением P(r, x, t, Г) = P{Xr,x(t) £ Г}, где Xr,x(t) —решение уравнения
t t Xr’x(t)= x + J a(s, Xr,x(s))ds + J a(s,Xr’x(s))dws;
еу(г, X(г)) < ехр{е(г - го)}ЕУ(го, X(го)),
если ЕУ(г0,Х(г0)) существует.
Функция СУ (г, х) называется стохастической производной функции У (г, х) в силу уравнения (1).
Из теоремы 1 легко вывести следующее утверждение, используемое в дальнейшем. Лемма 1. Пусть коэффициенты стохастического уравнения
дхъ = А(г,хг)<и + Е (г,хн)с]щ (6)
удовлетворяют условиям существования и единственности решения, и существует гладкая функция У (х) ^ 0 такая, что (к\, к2, а, Ь — положительные постоянные)
Иш У (х) = ж,
|| X У-
|УУ(х)|2 < к1[! + У(х)], |СУ(х)|2 < к2[1 + У(х)],
СУ < -аУ + Ь. (7)
Тогда при любом (возможно,случайном) начальном значении хо (не зависящем от процесса ) существует единственное непрерывное и необрывающееся решение х^ уравнения (1). Если существует ЕУ (хо), то выполнено неравенство
ЕУ(хг) < - + а
ЕУ(хо) - -
а
(8)
Нам понадобится также следующее утверждение о решениях квадратичных неравенств.
Лемма 2. Пусть 9, в0 — (1х т) -матрицы, Но = НТ — положительно-определенная (п х п)-матрица, Нг = НТ — положительно-определенные (I х 1)-матрицы.
Тогда для любых векторов х £ М”, / £ М” и чисел а > 0, Мг > 0 V* = 0,т верны неравенства
2xTHof < 1л0хтН0х + —/ТЯ0/, (9)
Мо
2
-2а{вт, - в°)тЩв° < - 0г°)тВД - 0°) + —(в°)тЩв° (10)
1^г
при любых /Лг > 0, * = 0, т, где в*, в? — столбцы матриц в, 9°.
Неравенство (9) доказывается раскрытием левой части неравенства
{лДм^х - \f\~l/^/)тЯ0(л/аздж - л/1/Мо/) > 0.
Неравенство (10) доказывается аналогично.
Рассмотрим линейную систему
х = Ах + Ви, (11)
У = Сх, (12)
где х £ М”, у £ М1 ,и £ Мт.
-а1
Передаточной функцией системы (11), (12) называется (I х т)-матрица Ш(А) = С(ХЕ — А)-1 В, Е — единичная (п х п)-матрица. Пусть О — (I х т)-матрица. Образуем (т х т)-матрицу Q(А) = ОТШ(А) и введем обозначения:
А(А) = ёвЬ(АЕ — А), <р(А) = A(А)detQ(А), Г = Иш АQ(А),
Л—
где Г — (т х т)-матрица. Матрица Q(А) называется минимально-фазовой, если р(А) — гурвицев многочлен. Матрица Q(А) называется гиперминимально-фазовой [2], если ^(А) —гурвицев многочлен, матрица Г симметрична и положительно определена.
Наконец, нам понадобится решение следующей алгебраической задачи, поставленной и решенной в [4, 5].
Даны вещественные матрицы А, В, С, О, К размера п х п, п х т, I х п, I х т, п х п соответственно (т ^ п,1 ^ п), причем К = КТ ^ 0.
Найти условия существования (п х п)-матрицы Н = НТ > 0 и (т х 1)-матрицы К таких, что
НА(К)+ А(К)ТН + К< 0, (13)
НВ = СТО, (14)
где
А(К )= А + ВКС. (15)
Решение дается следующей теоремой.
Теорема 2 [5]. О некоторых матричных уравнениях. Для существования, матриц Н = НТ > 0 и К, удовлетворяющих соотношениям (13), (14), (15), достаточно, а если гапк(В) = т, то и необходимо, чтобы система с передаточной
матрицей ОШ(А) была гиперминимально-фазовой.
Постановка задачи. Рассматривается система вида
ёхг = [Ахг + Ви + /]сМ + Е1(г, х^ёт^1 + Е2(г, хг)ёи^2'),
Уг = Схг,
где хг £ М”,у £ М1,и £ Мт,ш(1) £ Мк,и!\22 £ Мк — винеровские процессы, матрицы А и В постоянные, функция /(г) —детерминированное возмущение, а Е1, Е2 — (п х к)-матрицы, элементы которых е(1 (г, х) и е)2) (г, х) определены на [0, ж) х М” и в каждой ограниченной по (г,х) области выполнены условия (для всех г,])
— е)])(г,х2)1 < А||х1 — х2 У,
— е)2\г,х2)1 < А||х1 — х2 У .
Кроме того, предполагается, что ||/(г)Ц ^ ко, ||Е1 (г, хг)| ^ к1 |х| и ||Е2(г, хг)| ^ к2 при некоторых положительных ко, к1, к2. Выражения называют «пара-
метрическими» возмущениями типа белого шума, а Е2(г, хг)ёт(2) — «координатными» возмущениями типа белого шума.
Управление ищется в виде
иг = 9Т (г)уг, сШ(г) = ^ (у,9)&, (17)
означающем, что по наблюдениям уг вычисляется «настраиваемая» матрица в(Ь) и текущее значение управления и. Функцию Г предполагаем непрерывной в области определения.
В качестве цели управления в данной работе принимается диссипативность в среднеквадратическом, которая требует, чтобы:
1) процесс хг был необрывающимся;
2) для любых начальных данных (хо, 0(0)) и некоторого ! : 0 < ! < ж выполнялось условие
Й^(|Ы|2 + ||^)||2)^. (18)
г—
Таким образом, задача состоит в нахождении алгоритма адаптации (функции Г (у, в) в (17)) так,чтобы для некоторого класса объектов (16) в системе (16), (17) достигалась цель управления (18).
Основной результат. Предлагается использовать в качестве закона адаптивного управления адаптивный регулятор с неявной эталонной моделью, описанный в [2] и использованный для адаптивного управления стохастическими объектами с координатными возмущениями в [3]. Именно, предлагается следующий алгоритм адаптации:
!вг = - [($!уг) Ру + а-гвг] Л, (19)
где 01 — столбцы матрицы в, д^ — 1-мерные векторы, столбцы в матрице О = (д\,..., дт); Рг(= Р?) — I х /-матрицы; а* > 0 — числа, * = 1, то.
Теорема 3. Пусть матрица ОТШ(Л) гиперминимально-фазовая и выполнено условие (3) теоремы 1.
Тогда существует е > 0 такое, что при к\ < е алгоритм управления (17), (19) обеспечивает диссипативность в среднеквадратическом решений уравнений вида (16), (17), (19).
Доказательство. Выберем функцию Ляпунова в виде
т
V(х, в) = хТНох + - в0)ТИ№ - в0),
1=1
где Но = Н, Н = НТ, г = 1, то, и покажем, что СУ удовлетворяет неравенству СУ ^ —аУ + Ь (а,Ь > 0). Условимся через Ь^, в^, в0 обозначать столбцы матриц В, в, в0, тогда
тт
СУ (х, в) = 2х:Т Но(Ах + ЬгвТ у + I) + 2^^J(вi — в<0)Т Нг( — (дТ У)РгУ — агвг) + «1 + «21
1=1 І= 1
где «1 = ^2 е(1)ТН0е(1), «2 = ^2 е(2)ТН0е(2), в((1')(1,х) и в(2)(г,х) — столбцы матриц £1, І= 1 І= 1 £2. Очевидно,
СУ (х,в) = хТ (Н0А0 + АТ Н0)х + 2хТ Н01 +
т
+ 2£№ — в<0)Т (Hi( — (gT у)ру — + (хТ Нс,Ь^у) + «1 + «2,
І= 1
где Ao = A + B(9°)TC. Для того, чтобы функция V обладала свойствами функции Ляпунова (V(х,6) > 0 при x = 0, в = 0, LV(х,в) < 0 при x = 0 и f = 0), матрицы Hi(i = 1, то) должны быть положительно-определенными, а матрица Но должна удовлетворять соотношениям
HoAo + A Ho = —Q < 0,
H0B = CT G,
где QT = Q — положительно-определенная. Тогда —Hi(gTy)Piy + (xTHobi)y = 0 (i =
1, то) при Pi = H^1. Пользуясь теоремой 2, получаем
m
LV(x, в) = —xTQx + 2xTHof + 2^^(ei — e0)THi(-aiei) + wi + w2.
i=1
Поскольку для фигурирующих здесь матриц справедливы неравенства из леммы 2, получим
£V(x, в) ^ —xTQx + jj,oxTЩх Н-----fTHof—
Mo
По условию теоремы ||11| ^ к0, ||£1 ^ ^ к^хЦ, ||£2|| ^ к2. Очевидно,
|«1| < к1||Н0||||х||2.
Пусть к11Н01 < д, где д — минимальное собственное число матрицы QН-1 и, следовательно, выполняется неравенство Q > кЦНэЦН].
Примем ^ = м и зададим м0 и м столь малыми, чтобы оказалось (м0 + М + к1||Н0||)Н0 < Q. Тогда матрица Q — М0Н0 — мН — к1|Н0|Н0 положительно определена и справедливо неравенство
т
СУ(х,в) < -хТQx + М0хТЩх + к1ЦН0ЦхТН0х - ^(в< - в°)ТН(в1 - в\) +
+ £ ^(9”ГНЛ” + ^М + ^||Яо||,
М М0
означающее выполнение желаемой оценки СУ ^ -аУ + Ь.
Проверим условие (4) теоремы 1. Рассмотрим следующую функцию Ляпунова:
У1 = У+~. а
Поскольку
СУ\ = СУ < -аУ + Ъ < Ъ < Ъ + аУ = а = аУъ
получаем
СУ1 < аУ1.
означающей требуемую диссипативность в среднеквадратическом. Теорема доказана.□ Рассмотрим частный случай задачи, когда параметрическое возмущение действует параллельно управлению (in the range of control) и его интенсивность пропорциональна выходной координате объекта: E(xt,t) = k\Byt. В этом случае объект управления описывается системой
решения стохастического дифференциального уравнения будем считать выполненными.
Управление выбираем в виде
где ¥(уг,в) = — [(удту) Ріу + аів^ , ві — столбцы матрицы в, ді — 1-мерные векторы, столбцы в матрице О = (ді,..., дт)', Рг(= Р1') — I х 1-матрицы; оц > 0 — числа, і = 1, то.
Теорема 4. Пусть ||/(і)\| ^ ко, ||£2(£, Ж()|| ^ к2, матрица ОтШ(Л) гиперминималь-но-фазовая. Кроме того, пусть матрица £2 (і, х) локально-липшицева по х: для каждой ограниченной по х области из множества (і, х) : і ^ іо, х Є К” существует Ь > 0 такое, что \\£2(і,хі) — £2(і,х2)\\ ^ Ь||хі — х2І|. Тогда алгоритм управления (21) обеспечивает диссипативность в среднеквадратическом решений стохастического уравнения (11), (21) при любых уровнях помех ко, к2.
Доказательство .
Выберем функцию Ляпунова в виде
где Н0 = Но, Нг = Н^, * = 1, то.
Покажем, что СУ удовлетворяет неравенству СУ ^ —аУ + Ь (а,Ь > 0). Для этого найдем стохастическую производную. Условимся через Ь^,вг, в° обозначать столбцы матриц В, в, в°, тогда
E(\\x(t)\\2 + \\mw2)<-+\EV(xo,em
a
a
b
e
at
где
dxt = [Axt + Bu + f]dt + BytdW(1) + E2(t, xt)dwt2'), yt = Cxt,
(20)
где хг € К” — состояние системы, у € К1 —выход, и € Кт —управление, и>(1) € Кк, и>(2) € Кк —винеровские процессы. ||/(Ь)|| ^ к°, ||£2(Ь, хг)\\ ^ к^. Условия существования
u = 9t(t)yt, dB(t) = F(yt, 9)cM,
(21)
m
V(x, в) = xTHox + - в0)ТHM - в0),
i= 1
m
m
i= 1
i= 1
где о>1 = хтСтВтН°ВСх, и2 = ^ е(2')ТН°в(2\ Запишем ее в виде
1=1
СУ(х, в) = хт(Н°А° + АтН°)х + 2хтН°/+
+ 2^^{вг — в(°)т (Н1( — (9т У)РгУ — агвг) + (хТ НоЬ1)У) + ^1 + ^^2,
1=1
где А° = А + В(в°)тС. Для того чтобы функция У обладала свойствами функции Ляпунова (У(х,в) > 0 при х = 0, в = 0, СУ(х,в) < 0 при х = 0 и / = 0), матрицы Я* (г = 1,то) должны быть положительно-определенными, а матрица Но должна удовлетворять соотношениям
Н°А° + АтН° + К < —Q, н°в = ст а,
где Qт = Q — положительно-определенная, п = ствтн0вс = СТВТСТСС > 0.
Тогда —Щ(д[У)Р%У + (хтН0Ь)у = 0 (г = 1, то) при Д = ЯГ1.
Пользуясь теоремой 2, получаем
СУ(х, в) — —хтQx + 2хтН°/ + 2 ^ '(вг — в°)тНг(-а^вг) + &1 +
Ш2-
Для фигурирующих здесь матриц справедливы неравенства из леммы 2. Получаем
СУ(х, в) ^ —хт(^х + цохтНох -|-------/тЯо/—
М°
т т 2
- “ ^)ТНг{вг ~ ) + 53 ----(^°)Т^^°-
1=1 1=1 *
По условию
\\/1| < к°, ||Е2| < к2.
Примем = * и зададим *° и * столь малыми, чтобы оказалось (р° + *)Н° < Q. Теперь матрица Q — *°Н° — *Н° положительно определена. Тогда приходим к желаемому выражению
СУ < —аУ + Ь.
Заметим, что из локальной липшицевости функции £2(Ь,х) следует локальная липши-цевость всех правых частей замкнутой системы, т. е. выполнено условие (3) теоремы 1. Проверим условие (4) теоремы 1. Рассмотрим следующую функцию Ляпунова:
У1 = У+~.
а
Для нее
СУ\ =СУ < -аУ + ь < Ъ < Ъ + аУ = а ^ + У^ = аУх.
Получаем
СУ1 < аУ1.
£(||х(і)||2 + ||^)||2)<-+ \еУ(хо,Є(0))
ь
е
аЬ
а
а
где
а =
Она и означает требуемую диссипативность в среднеквадратическом. Таким образом, доказана диссипативность в среднеквадратическом решений уравнений вида (16) при любом уровне случайных помех к\. Теорема доказана.□
Заключение. В настоящей работе получены некоторые результаты, связанные со свойствами пассивности и диссипативности систем управления линейными стохастическими объектами с параметрическим и координатным возмущениями типа белого шума.
Сраговичем [3] доказана теорема, согласно которой предложенный алгоритм управления обеспечивает диссипативность в среднеквадратическом решений стохастических уравнений с координатным возмущением типа белого шума. В данной работе мы обобщили этот результат на случай объектов управления, подверженных действию координатно-параметрических возмущений. При этом оказалось, что, как следует из теоремы 4, в некоторых частных случаях диссипативность построенной замкнутой системы сохраняется при произвольной интенсивности возмущений типа белого шума.
В дальнейшем целесообразно исследовать возможность распространения полученных результатов на нелинейные стохастические системы.
Литература
1. Якубович В. А. К теории адаптивных систем // ДАН СССР. 1968. №3. С. 518-522.
2. Фомин В.Н., Фрадков А. Л., Якубович В. А. Адаптивное управление динамическими объектами. М.: Наука, 1981.
3. Срагович В. Г. Адаптивное управление. М.: Наука, 1981.
4. Фрадков А. Л. Синтез адаптивной системы стабилизации линейного динамического объекта // Автоматика и Телемеханика. 1974. №12. С. 96-103.
5. Фрадков А. Л. Квадратичные функции Ляпунова в задаче адитивной стабилизации линейного динамического объекта // Сибирский математический журнал. 1976. Т. 17. № 2. С. 436-
6. Андриевский Б. Р., Фрадков А. Л. Метод пассификации в задачах адаптивного управления, оценивания и синхронизации // Автоматика и телемеханика. 2006. №11. С. 3-37.
7. Хасьминский Р. З. Устойчивость систем дифференциальных уравнений при случайных возмущениях их параметров. М.: Наука, 1969.
Статья поступила в редакцию 25 марта 2009 г.
445.