= tfföw (w1í)}. (75)
где (**,'!*) = Mn+\ (т„ , t)+Г01 fo, t, s)r1 (s, t)x
xJx'-^O]. (76)
f„+1 (rM,t | s) = Г„+1 fo,/)-f01fo./.ijr'fcfjx
x(í(77) Использование (16) в (11), (63) дает: A(/) = M¡ft(í,xí)xrAr)| 770-}= Я0м{х, | z'0,T}Z}+
t=i *=i л£|7)=м{&(г,х„**)|х, =x\z,0,tj:}=
= Я0м{х, \x\zl,Я,м(«гГ4\x\z'0X} =
*=i n
-нЖиЬЪпАъФ)- (79) Таким образом, = 15)- /*(/)]+
+ (80)
М
Распишем (76) поблочно и получим
иЬ^О+г^мЭг-'М*!*1 -ЖО], (81)
х[х'-//(*,,)]. (82)
Используем (81) и (82) в (80):
Тогда м|^(г|дс,)-А(/)]^|*,)-А(0]Г}-
-Ж,*)!*
*[*, -м^оГ И^Л'ЬяЛОг-'М*
хм{м{х,-//(м)]Т | « }}х
= 'Л* 'Г-1 (*, г)я£+1 (/)=
= (85)
Подстановка (85) в (60) приводит к уравнению (72). Из (71) следует, что
"ЖТ'^у)'
Так как при ограничениях (15)—С17) то использование (87), (88) в (86) дает:
х[х' -о)]-1[х' -ЖОГ
(86)
(87)
(88)
*=i
n
Использование (53) в (83) дает
ъ
г-'М*
ÄfjT)- h{t)= H^y-isj)*^ -//М]. (84)
х(*'-//(м.)]. (89)
Последовательно получаем М}*, -Дм.-0)Гг-'(5,/я-0jxs-M(s,t„ -0)]} =
xJ^-^/.-OFUi.^-'Jb^Ul^«. (90) • Аналогично
(91)
Использование (90Х (91) в (89) с последующей подстановкой в (62) приводит к (73). Теорема 2 доказана. ЛИТЕРАТУРА
(83)
1. Гихман И.И., Скороход A.B. Введение в теорию случайных процессов. М.:Наука, 1977.
2. Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов. М.: Наука, 1974.
3. Демин Н.С. Теория фильтрации. Томск: Изд-во Том. ун-та, 198S.
4. Демин Н.С., Сушко Т.В., Яковлева A.B. Обобщенная обратная экстраполяция стохастических процессов по совокупности непре-
рывных и дискретных наблюдений с памятью // Изв. РАН. Теория и системы управления. 1997. № 4. С. 48-59.
Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, полупила в научную редакцию 22 февраля 2000 г.
УДК 62-50
В. И. Смагин, Е.В. Поползухина
СИНТЕЗ СЛЕДЯЩИХ СИСТЕМ УПРАВЛЕНИЯ ДЛЯ ОБЪЕКТОВ СО СЛУЧАЙНЫМИ СКАЧКООБРАЗНЫМИ ПАРАМЕТРАМИ И МУЛЬТИПЛИКАТИВНЫМИ ВОЗМУЩЕНИЯМИ
Рассматривается алгоритм синтеза систем слежения по интегральному кваарашчному критерию для непрерывных объектов с мультипликативными возмущениями и случайными параметрами, описываемыми целью Маркова с конечным числом состояний. Управление фор мируегся непосредственно по вектору измеряемого выхода без использования фильтров и наблюдателей.
Поведение объекта управления часто описывают сово- описываемые цепыо Маркова. К данному классу могут быть
купностью стохастических дифференциальных уравнений, отнесены системы, в которых происходит случайное резкое
которые задают режимы работы объекта. Между этими от- изменение режима функционирования, возникающее, напри-
дельными режимами происходят скачкообразные переходы, мер, вследствие внезапных отказов. Кроме того, параметры
объекта могут флуктуировать, математической моделью такого явления могут быть аддитивные мультипликативные возмущения.
Задачи управления объектами со случайными параметрами рассматривались в работах [1-9], в которых в основном исследуются задачи стабилизации либо задачи слежения, использующие обратную связь по состоянию. В настоящей работе методы синтеза следящих систем управления по интегральным квадратичным критериям для объектов со случайными скачкообразными параметрами и мультипликативными возмущениями развиваются для систем с неполной информацией о векторе состояния, при этом следящая система синтезируется по вектору наблюдаемого выхода
Постановка задачи
Пусть поведение объекта описывается следующими уравнениями:
ужом')*(о)=х0> (1)
1=1
где хеЛ" - вектор состояния; «/(/ЭбЛ2 - управление; х0 -начальные условия (М{х0}=х0, М{М{х0х1) = РХа)\ в(() ей""- белые гауссовские шумы с характеристиками: М{д(0} = О, Л/(Э(0} = 0,М{д(0дт(т)} = = £5(/-т),М{е(/)8т(т)} = Щ-т), М{д(фт(0) = = 0; у(1) е Л1 - марковская цепь с дискретным множеством состояний: у,,у2,—.У, (вероятность перехода из 1-го состояния в у'-е (/'*у) за время Л/ равна р0М + о(&)); А(у),В(у) и А,(у) (5=1,...^)-матрицы порядка их и, их/, их л соответственно.
Здесь приняты следующие обозначения: М - оператор математического ожидания, индекс <Т> -операция транспонирования, 5(/ - т) - дельта функция Дирака, Q = QT 2 0 - неотрицательно определенная матрица, /- единичная матрица.
Процесс у(0 зададим уравнением
¿К0=|уП(Л», у(0) = у0, где у0 - начальное состояние переменной у(/), пуассо-новская случайная мера £2(<Л, А) характеризуется
п
функцией П,т(<Л0 = ]Г/>/;8(у+у( -уу)<Л',при у = у.
Предполагается, что наблюдению доступен вектор
у(0 = &(/), (2)
где у е Я"1, 5 - матрица полного ранга. Пусть
£(0 = Лс(0 (4(0 е й"1) - вектор управляемого выхода объекта. Тогда необходимо выбрать такое управление и(0 для объекта (1), при котором выход объекта £(/) был бы достаточно близок к отслеживаемому сигналу г(() е Я"2. Зададим меру близости в виде квадратичного интегрального критерия
3 = -М{ |(ет(т)Се(т) + ит(т)£>и(т))А
+
+ет (Г)Ее(Г) / х(0) = х0, у(0) = у0}, (3) где е(/) = £(/)- г(0; С = Ст £ 0, й = £>т > 0, Е = £т> £ 0 - весовые матрицы. Задача состоит в выборе такого управления и((), при котором достигается минимум критерия (3).
Задача слежения для объекта с мультипликативным возмущением
В этом случае будем предполагать, что зависимость от у в уравнении (1) отсутствует. Структуру закона управления для следящей системы управления при неполной информации зададим в том же виде, что и в [8]:
и(1) = тУ(1)-0->Вт8. (4)
Тогда основной результат сформулируем в виде следующей теоремы.
Теорема 1. Оптимальные коэффициенты передачи в (4) вычисляются по формуле:
л:ЧО = -0~|ят£ЛГСт(£Лг£тГ1» ' (5) если существуют матрицы N(1) > 0, !(/) > 0 и вектор g(t), удовлетворяющие двухточечной краевой задаче:
N = АЫ+МАТ + ЛГ(0) = РХо, (6) ^ ....... .
¿ = Ах-Щ, х(0) = Х0, (7)
-¿ = Ат8- Р?Сг, £(Г) = -ЯтЕ2{Т) , (8) -1 = Ы + АЧ + 8тГ-18Ш1¥Ш8тГ-}5 +
+ ±А:1Аа + С, ЦТ) = ЛТ£Л,
(9)
Г = 5ЛГ5Т, IV = Вй-'В1, С = ЛТСЛ). Доказательство. Вычислим значение критерия (3) при управлении (4): 1 т
3 = -|[/гЛГ (С + 5ТЛГТ/Ж5 )+gтlVg + гтСг -
- 2gтBKSx-2zтCRx]dt + ^гЫ (Г)ЛТ£Л -
- гт(Г)£Дх(Г) + у2Т(Г)£г(Г), (10)
где N = М{хх1}, х = М{х), ¡г - обозначает след матрицы- Выберем в качестве функции Ляпунова выражение
1 1 г _
V(t,x,N) = ^ + g1x + -trLN + -tr¡LQdт, (11)
где Q - некоторая матрица (() 20, Q 2 Q + Q), функции у/^ и ¿ удовлетворяют уравнениям:
1т 1т 1
у(Т) = ^т(Т)Е2(Т),
(12)
-g = (A + BKS)Tg-RTCz, fl3)
g(T) = -R7Ez(T), -L = L(A + BKS)+(A + BKS)T L+C, a4) L(T) = Rr ER. Первые три слагаемые в представлении функции Ляпунова (11) являются значением критерия
j[t, = 1 М{ j(eT (т)Се(т) + нт(т)/Мт))А +
+ еУ(Г)£е(Г)/дС(0,у(0}
при управлении (4) [8], последнее слагаемое также неотрицательно при L > О,Q к 0, поэтому функция Ляпунова (11) неотрицательна. Проинтегрируем по времени полную производную функции Ляпунова, учитывая уравнения для N и х :
Т J т
V{t, x,N)dt = + gT х + gTÍ + оо
+ -trÍN + - trLÑ~trLQ)dt -2 2 т i i
о 2 2
- ^ trL[(A + BKS)N + N(A + BKS)1 +Q +
^A.NAjVdt = 4/(7>V(0) + gT(7W)-
+ ^ trL{T)N(T) - ^ trL(0)N(0) - ^ tr ¡LQ dt. ( 15)
- C) + grAx + v¡/ + gTx - zTCRx - zrCRx ■ --z1Cz--g1Wg+-trLQ}dt-
- j trL{ 0)ß(0) + ^(0) + g' (0)x(0) +
1
+ ^L(0)N(0)-y(T) + gl(T)x(T).
Так как значение критерия (18) должно быть всегда неотрицательным, то его минимум достигается при
С = С + STKTDKS + £ A]LA,.
(19)
- gT (0)х(0) + ч/(0) + gT (Г)х(Г) - g т (0)х(0) +
1
2 о
Учитывая (15), квадратичный критерий (10) представим в эквивалентной форме: т .
J = J{- trN(C + STKTDKS) + g1 Ах + \jf +
о 2
+ gTy4x + </ + gT3t + i trÍN - zTCÄx -
- ^ zTCí - ^ + + +
+ N(A + BKS)7 + Q + ¿ yí.A'/íJ -f=i
1 ~ T
- ^ trL(0)Q(0) + v/(0) + gT (0)3c(0) +
+ 1д0Ж(0)-КГ) + ят(Г)х(Г). (16)
Применяя правила матричного дифференцирования [10] к формуле (16), из условия dJ/dK=Q получим уравнение дня вычисления оптимальной матрицы К:
DKSNSт + BTLNSr = 0. (17)
Тогда в силу (17) К определится по формуле (5). Найдём в уравнении для L (14) выражение для матрицы С такое, чтобы критерий (16) был минимальным. Для этого правую часть (14) подставим вместо L в (16). Выполнив преобразования, получим
J = J{- trN(C + SrKTDKS+¿ Á¡LA, -
Покажем, что полная производная функции Ляпунова при К, равной (5), отрицательна. Это необходимо для обеспечения устойчивости в среднем квадратиче-ском [11]. Учшывая (12)—(14) и (19), получим
4V(t,x,N) = -±zTCz-l-gTWg + dt 2 2
+z'xCRx--tr{S1rxSNrÛWLNS'T x 2
xr'lS + RrCR)N-^trL(Q-Q-Q). (20)
В силу очевидного равенства trRTCRN = М{{х - ï)T x xRTCR(x-x)}+xTR1CRx (20) преобразуется:
— V(t, x,N) = --(z-Ri)T C{z-Rx)-dt 2
-\gTWg~trL{Q-Q-Q)~Mlx-x)TRr x
x CR(x - *)} - -j tr (ST Г'1 SNTÛWLNS т Г'1 S)N.
A это означает, что полная производная функции Ляпунова при выполнении условий теоремы 1 будет отрицательной. Уравнения (6)—(9) получаются, если
в уравнения для N = М{ххт}, х = М{х) и в (13), (14) подставить выражение К, полученное из (17). Теорема доказана.
В случае, если канал измерений содержит аддитивную помеху y(t) = Sx(t)+v(t), где v(t) е R"1 - белый гауссовский шум ( M{v(t)} = 0, M{v(t)qT(т)} = 0, M{v(t)eT(r)} = 0, M{v(t)vT(г)} = V8(t-г), в формулировке теоремы 1 необходимо в (6) матрицу Q заменить на Q = Q+BKVKTВ1 -xgTiV-WgxT, а
матрицу Г принять равной SNSr + V.
Отметим также, что в стационарном случае при постоянном отслеживаемом сигнале вместо критерия (3) необходимо минимизировать критерий
'¡■»suplj („ара „„рии должка
Г^ОО
быть стабилизируемой). В этом случае задача синтеза упрощается, так как уравнения (6)-(9) становятся алгебраическими:
AN + NA7 + £ AjNA] + Q = 0,
Arg + R*Cz = 0, Ax-Wg = О, LA + ATL+Srr-,SNLWLNSrr-lS + + ¿A¡LAJ + C = 0,
j=i
1=1
и тогда из леммы 12.2 [12] при условии, что Ь > 0 и пара матриц
I
С + SrK'TDK'S + £ ÁlLA, , А + BK'S (22)
детектируема, следует, что матрица А + ВК'Б асимптотически устойчива Применяя теорему 3.6 [12], получаем,
что если пара матриц 4с , А детектируема, то и пара матриц (22) также детектируема. Теорема доказана
Задача слежения для объекта
.......................
со скачкообразными параметрами
• • • •
Рассмотрим сначала случай полной информации о состоянии объекта (y(t)-x(t)). Применяя принцип оптимальности Беллмана, можно показать, что оптимальное управление объектом (1) имеет вид
"'(') = -D'1 Вт (y)(G(y)x(t)+g(r)), (23)
где - % = (Л(г) - fV(/)G(r))T g-RCz + dt
+ [£(/)], g(T,y) = -RTEz(T), (24) AT(y)G(y) + GA(y) - G(y)W(y)G(y)+C +
dt
+ *y[G(y)lG(T,y) = RrER. (25)
В (24), (25) W(y) = B(y)D-lBr(y). Так как y(t) -марковская цепь, то обратный производящий оператор в (24), (25) определяется по формуле 9ty[p(y)] =
г _
= Е/»#(р(Ту)-р(У/)) при у = у, (/ = 1 ,г ). Тогда уп-
7=1 j*'
равление (23) примет вид u'(t) = -D~*Bj(GjX(t) +gi) при y(t)-y,, где Gi и g, удовлетворяют уравнениям
-g, =(А, -fV.Cyg,-RCz + Xp„(gj -g,),
j=i )*>
(21)
где А = А-Т¥ШБ'ГГ18, 0 = аоп-
тимальные коэффициенты передачи определятся по (5).
Теорема 2. Если существует решение уравнений (21) такое, что матрицы N>0, Ь> 0 и пара матриц
л/с, А детектируема, то матрица А = А + ВК'Б асимптотически устойчивая.
Доказательство. Последнее уравнение в (21) эквивалентно уравнению
(А + ВК'8)ГЬ + ЦА + ВК'Б) + + С + Б1К'ТВК'8 + £ А]и, = О,
gl(T) = -RrEz(T), -G, = AjG, +G,At -G^G, +C +
+ ¿A</>TG,A? +£pu(Gj-Gt), G(T) = RTER,
j-i j*i
(Aí = A(y,),Bi=B(yi), А? = А,(у,),_
Щ = B,D-lBj, g, = g{yt) , G, = G(yt), (i:= ü) ).
Перейдем к рассмотрению задачи слежения по выходу для объекта (1) и канала измерений (2). В этом случае следящая система управления примет вид
1/(0 = -D-lB?(L, W'KO + &•), (26) гри у(0 = у, (Г, = SN,ST), где матрицы N, = M{x(t) х х хт (/) / у(/) = у (}, Z, и векторы ¿c(/) = M{x(t)/y(t) = Y,} > 81 определяются из уравнений
_ г
Ñ, = AtN, + N,Aj +YíPij(Nj -N,)+Q +
j* i j*'
^A^N.A^-x^g^-W^,
a=\
Nt(0)-M{x0x J /y(0) = Y¿},
(27)
j«
Зс("(0) = А/{х0/Г(0) = ^}. (28)
-I, =L,A + AjL, +S1r;,SNlL,WlL,N,STr;[S+C +
+ £ A^L, Af + £ PlJ (Lj - L,), L¡ (T) = RTER, (29) j-i i-\ )*<
-g, = Ah, - rTCZ+£ PlJ (gj - gl),
j'* j*I
(30)
(31)
gl(T) = -RтEz(T).
В (27Н30) А/=А1 .
Закон управления (26) имеет структуру
"(0 = КОМО - при у«) = у,.
Для доказательства того факта, что в (31) К^^-й'1 В]Г,"1, применим метод, используемый при доказательстве теоремы 1. Отличие будет заключаться в том, что необходимо учесть скачкообразную составляющую. Общая схема доказательства останется той же. В стационарном случае, если отслеживаемый вектор постоянный, то двухточечная краевая задача (27) -(30) сводится к алгебраическим уравнениям.
ЛИТЕРАТУРА
1. Красовский Н.Н., Лидский Э.А. Аналитическое конструирование регуляторов в системах со случайными свойствами // Автоматика и
телемеханика. 1961. №9. С. 732-745; 1961. № П. С. 1273-1278.
2. W.M. Wonham.. Random differential equation in control theory II Probabilistic methods in applied mathematics / Ed. A T. Bhamcha-Reid. N.Y.: Academ Press, 1971. P. 131-213.
3. M. Mariton. On the influence of noise on jump linear systems // IEEE Trans. Automatic Control. 1987. V. AC-32. № 12. P. 1094-1097.
4. Параев Ю.И. Введение в статическую динамику процессов управления и фильтрации. М: Сов. радио, 1976.184 с.
5. Казаков И.Е., Артемьев В.М., Бухаяев В.А. Анализ систем случайной структуры. М.: Наука, 1993. 270 с.
6. FX Boukas. Control of systems with controlled jump Maricov distuibances //Control theory and advanced technology. 1993. Vol. 9. № 2. P. 577-595.
7. ПакшинП.В. Дискретные системы со случайными параметрами и структурой. М.: Наука, 1994. 303 с.
8. Смагин В.И., Параев Ю.И. Синтез следящих систем управления по квадратичным критериям. Томск: Изд-во Том. ун-та, 1996.171 с.
9. Смагин В.И. Локально-оптимальные следящие системы управления для дискретных объектов со случайными параметрами // Авто-
матика и вычислительная техника. 1997. № 2. С. 32-40.
10. М. Äthans. The matrix minimum principle // Information and control. 1968. Vol. 11. P. 592-606.
11. Барбашин E.A. Функции Ляпунова. M: Наука, 1970. 240 с.
12. Уонем М. Линейные многомерные системы управления. М: Наука, 1980.376 с.
Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию 19 февраля 2000 г.