ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2014 Управление, вычислительная техника и информатика № 4 (29)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 681.5.01:62-50
О.О. Мухина, В.И. Смагин
ДИНАМИЧЕСКИЕ ЛОКАЛЬНО-ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ ПО ВЫХОДУ ДЛЯ ОБЪЕКТОВ С ИНТЕРВАЛЬНЫМИ ПАРАМЕТРАМИ С ЗАПАЗДЫВАНИЕМ ПО СОСТОЯНИЮ
Работа выполнена при финансовой поддержке РФФИ в рамках научного проекта (№ 13-08-01015 А).
Рассматривается задача динамического локально-оптимального управления по наблюдаемому выходу для дискретных объектов с интервальными параметрами и с запаздыванием по состоянию. Для ее решения предлагаются алгоритмы, в основе которых лежит оптимизация локального критерия без использования расширения пространства состояний. Управление определяется как функция измеряемых переменных с памятью, отслеживаемого сигнала и динамического звена. Исследуется асимптотическое поведение замкнутой системы. Ключевые слова: локально-оптимальное слежение; запаздывание по состоянию; интервальные параметры; динамические системы управления; управление по выходу.
Локально-оптимальные дискретные системы управления являются частным случаем дискретного прогнозирующего управления (Model predictive control) с прогнозом на один такт. Основным достоинством метода локально-оптимального управления является существенное упрощение процедуры синтеза. Область применения метода MPC и, соответственно, метода локально-оптимального управления охватывает задачи управления техническими системами, производственными системами, управление запасами и финансовую математику [1-14].
В целях улучшения качества управления объектами применяется практика введения в закон управления наблюдателей Люенбергера [15] или динамической обратной связи пониженной размерности [16-18].
В настоящей работе предлагается осуществлять синтез следящих динамических систем управления по выходу на основе оптимизации локального критерия, при косвенных измерениях для дискретных объектов с интервальными параметрами на основе вероятностного метода с учетом запаздываний по состоянию. Управление определяется как функция измеряемых переменных, динамического звена и отслеживаемого сигнала. Исследуется асимптотическое поведение системы, строятся оценки для асимптотической точности слежения. Результаты работы являются развитием [9] на случай синтеза динамической системы управления по выходу для модели объекта с интервальными параметрами.
1. Постановка задачи
Пусть управляемый объект с запаздыванием по состоянию и канал наблюдений описываются уравнениями
r r r
x(k +1) = (A + £ Ate, )x(k) + (A + £ Ae,)x(k - h) + (B + £ Bte, )u(k) + q(k);
1=1 i=1 ,=1
х(т) = ф(т), x = -h,1 - h,2 - h,... ,0; k = 0,1,2,...; (1)
y(k) = Sx(k) + v(k). (2)
В (1), (2) x(k)eRn - вектор состояний; h > 0 - величина временного запаздывания (целое число); u(k)eRm - управление; y(k)eRl - вектор измерений; A,A,,A, A,,B,Bt,i = 1,r - матрицы соответству-
ющих размерностей; - матрица канала наблюдения; матрицы В и полного ранга; пары матриц (А, В) и (А, В) управляемы, пары матриц (5, А) и (5, А) наблюдаемы; х0 - начальные условия (М{х0х°} = Р^); д(к), у(к) - гауссовские случайные последовательности входных возмущений и оши-
т
бок измерений с характеристиками: М{д(к)} = 0, М{у(к)} = 0, М{д(к)у (у)} = 0, М{д(к)дт (у)} = , М{у(к >т (у)} = V (к )Ък] (5г,} - символ Кронекера, б (к) = б т (к) > 0,
V(к) = Vт (к) > 0 - неотрицательно определенные матрицы); 0. - неопределенные параметры интервального типа (-1 <0,. < 1, V/ = 1,п). Матрицы В и 5 полного ранга, пара матриц (А, В) управляема, пара матриц (5, А) наблюдаема.
Оптимизируемый локальный критерий имеет вид
I (к) = М {(м>(к +1) - г (к ))т С (м>(к +1) - г (к)) + и т (к )Би (к)), (3)
где ^(к) = Нх(к) - управляемый выход системы (Н - матрица выхода системы), С = Ст > 0, Б = Бт > 0 -весовые матрицы, г(к) е Яп - отслеживаемый вектор, удовлетворяющий уравнению
г(к +1) = Гг(к) + дг (к), г(0) = г0, к = 0,1,2,.... (4)
В (4) дг (к) - гауссовская случайная последовательность с характеристиками: М{дг (к)} = 0, М{д2 (к)дт (у)} = 0, М{д2 (к)ут (у)} = 0, М{д2 (к)дг т (у)} = (к)дк,у, г0 - начальные условия (М{г0г° } = Р, М{г0 х^ } = Р, М{х0г° } = Р ), матрица динамики модели отслеживаемого сигнала.
Требуется найти управление объектом (1), используя наблюдения (2), минимизируя критерий (3). Суть вероятностного подхода заключается в том, что неопределенные интервальные параметры 0. заменяются независимыми случайными последовательностями 0(к) с равномерным законом распределения на интервале [-1, 1].
2. Оптимизация локального критерия
Динамический закон управления объектом (1) при измерениях (2) зададим в виде
и (к) = К0 (к Мк) + К (к) у(к) + К 2 (к) у(к - к) + К3 (к )г(к), (5)
где коэффициенты передачи К0(к), Кх(к), К2(к), К3(к) подлежат определению, а переменная ^(к) определяется с помощью динамического звена заданной размерности [16, 17]:
м>(к +1) = А (к Мк) + В (к) у (к) + С (к )г(к), ^(0) = 0. (6)
В (6) ^(к)еЯр (1 < р < п), А(к) = (Ь + МВК0(к)), В(к) = М(ВК1(к) + К), С(к) = МВК3(к). Матрица М удовлетворяет уравнению
М (А - ) - ЬМ = 0,
где Ь - заданная устойчивая матрица (ее собственные числа лежат внутри единичного круга). Матрица К вычисляется так, чтобы А - К5 имела заданные собственные числа, часть из которых совпадала бы с собственными числами матрицы Ь. Так как пара матриц (5, А) наблюдаема, то такую матрицу К всегда можно построить, применив методы модального управления [19]. Собственные числа матрицы А -КБ разбиваются на две группы: А,(1) (. = 1,р) и А,(2) (у = 1,п - р), причем группа состоит из чисел, которые совпадают с собственными числами матрицы Ь. Применяя метод [20], строится неособенная матри-
ца Л = [Л1;Л2], блоки которой Л1;Л2 формируются из р и п - р линейно независимых столбцов матриц
Д1 = ЪР (А - КБ - Х(.2)Е), А2 = ] (А - КБ - Х(1}Е). ]=1 '=1
Тогда матрицы М и К определятся следующими равенствами:
К = ЛЬ М = Н15
^ _1 ^ ^ ^ т т
где - соответствующий блок матрицы Л = [Н1 , Е 2] .
Решение задачи локально-оптимального слежения сформулируем в виде теоремы. Теорема 1. Пусть К = Л1, М = Е1. Если для объекта (1), канала измерений (2) и локального критерия (3) матрицы
С = (В т Н тСНВ + В +1 £ Б?Н т СИБ1) > 0, 3 '=1
Р(к) =
Р (к) (к) БРХ„ (к - А, к) Р^ (к)
(к)Б? БР, (к)Б?+ V(к) БР, (к - А, к)Б? Р2Х (к)Б?
Р^ (к, к - А)Б? БРХ (к, к - А)Б? БРХ (к - А)Б?+ V(к - А) Рх (к, к - А)Б?
Р„2 (к) Б^ (к) БРХ2 (к - А, к) Р (к)
> 0 (7)
положительно определены для всех к = 1,2,..., то оптимальные в смысле минимума критерия (3) коэффициенты передачи для управления (5) определяются матричными уравнениями
К0* (к) = аК* (к) + ЬК 2 (к) + сК 3 (к) + й; (8)
К* (к) = еК 0 (к) + X (к) + ЕК 2 (к) + А; (9)
К* (к) = тК0* (к) + пК* (к) + рК2(к) + Р; (10)
К3* (к) = 5К0* (к) + К* (к) + 1К2(к) + к, (11)
где
а = -БРот (к)Р-1 (к); Ь = -БРХК (к - А, к)Р-\к); с = -Р^ (к)Р-\к);
й = -С-1 [3 £бб НТС(НАР (к - А, к) + НАР (к - А, к)) +
3 1=1
+ В?Н?С(НАРХМ, (к) + НАРХМ, (к - А, к) - Р^ (к))]Р- (к); е = -Рх(к)Бт[БРх(к)Бт +V(к)]-1; / = -БР,(к -А,к)Б?[БР,(к)Бт +V(к)]-1; Е = -Рх (к)?[ БРх (к) Б т + V (к )]-1;
А = -С-1[1 £ ВТНтС(НАР (к - А, к) + НА'РХ (к))Бт + 31=1
+Вт Н тС (НАРх (к) + На4 Рх (к - А, к) - Р^ (к)) Б т ][ БРх (к) Б т + V (к )]-1; т = -РМ!Х (к, к - А)Бт [БРХ (к - А)Бт + V(к - А)]-1; п = -БРХ (к, к - А)Бт [БРХ (к - А)Бт + V(к - А)]-1;
р = -Р2Х (к, к - А)Бт [БРХ (к - А)Бт + V(к - А)]-1;
р = -С1[-3¿В,тНтС(на{рх2(к -А) + НАР(к,к - А)) +ВтНтС(НАРх(к,к - А) +
3 1=1
+ Н:~Рх (к - А) - Р2х (к, к - А))Бт ][БРх (к - А)Бт + V(к - А)]-1; * = -Рм,2 (к)Р2~\к); г = -БРх2 (к)Р-\к); I = -БРх2 (к - А, к)Р;1^);
к = ^В ИтС( иЛр (к-к, к) + ИЛр (к)) +
3 г=\
+ВтИТС(ИЛР2(к) + иЛр2 (к - к,к) - Р2(к))3т]Р2\к). (\2)
В(\2) введены обозначения:
Р (к) = М^(к)2т (к)}; Рх (к) = М¡у:(к)хт (к)}; Р 2Х (к, к - к) = РХ2 (к - к, к) = М^(к)хт (к - к)}; РХ2 (к, к - к) = Р]х (к - к, к) = М{х(к)2т (к - к)};
х (к - к, к) = МЩ)хт (к - к)}; Рх2 (к, к - к) = рт (к - к, к) = МЩк)2т'
Рх (к, к - к) = М{х(к)хт (к - к)}; Рх2 (к) = рх (к) = М{х(к)2т (к)}; ти л /_/"7_\„т п-\ ъ. п /и и 1.\ т>т /и 1. и\ л* т*
Р2Х (к) = Р1 (к) = М^(к)хт (к)}; Р ^ (к, к - к) = рт (к - к, к) = М^(к)тт (к - к)}; Р^х(к) = РТ(к) = МТк)хт(к)}; РК(к) = М\*(к(к)},
которые определяются системой разностных матричных уравнении с запаздываниями.
Доказательство. Для вычисления локального критерия получим уравнение состояния путем подстановки (5) в (\):
х(к + \) = (Л + Х Л,в,)х(к) + (Л + Х Л,в,)х(к - к) + (В + Х В,в,)К0 (к)т(к) +
1=\ ,=\ ,=\
+(В + в,)К\(к)3х(к) + (В + £в,в,)К\(к)у(к) + (В + ^Вгвг)К2(к)Эх(к - к) +
1=\ 1=\ 1=\
+(В + X В,в,)К2(к)у(к - к) + (В + Х В,в,)Къ(к)2(к) + д(к). (\3)
Учитывая (\), (2), (4), (5), (6), характеристики случайных последовательностей д(к) и у(к), вычислим значение локального критерия (3), а затем значения градиентов критерия по К0(к),К\(к), К2(к) и К3(к). Приравняв значения градиентов к нулю, получим уравнения, решения которых имеют вид
К 0 (к) = -С [СК\ (к )ЗРхг (к) + С К 2 (к )ЗРхг (к - к, к) + СК з (к) Ргм, (к) +
+ \ X ВтИТСИ(Л,Рт (к) +л,рт (к - к, к)) +
+ ВтИТС(ИЛРхт (к) + ИЛРхт (к - к,к) - рт (к))]Р- (к). (\4)
К\(к) = -С-\[(СКо(к)Ртх (к)5 + СК2(к) 5Рх (к-к, к) + СКз(к) Рх (к)) 5Т +
+ \ X ВiИтСИ(А,РХ (к) +Л,Рх (к - к, к))Бт + ВтИтС(ИЛРх (к) + ИЛРХ (к - к, к) -3 ,=\
- Рх (тт ][8Рх (к)8т + У(к)]-\. (\5)
К2 (к) = -С [С (К\ (к)БРХ (к, к - к) + К0 (к)РТХ (к, к - к) + К3 (к)Рхх (к, к - к))Б т +
+3Х^ВТИТСИ(АгРх(к,к - к) +Лр(к - к)) + ВтИтС(ИЛРх(к,к - к) +
3 ,=\
+ ИЛРх (к - к) - Рх (к, к - к)№Рх (к - к)3 т + У (к - к)]-. (\6)
К3 (к) = -С -1 [С (Ко (к)рт2 (к) + К\ (к)ЗРХ2 (к) + К2 (к)ЗРХ2 (к - к, к)) +
+ 3 X ВтИтСИ(Л,РХ2 (к) +ЛРХ2 (к - к, к)) + ВтИтС(ИЛРХ2 (к) + ИЛРХ2 (к - к, к) - Р2 (к))]Р- (к). (\7)
3 ,=\
Выполнив преобразование уравнений (\4)-(\7), получим
С [ К о (к) рт (к) + К\ (к )зрт (к) + К 2 (к ^рт (к - к, к) + К 3 (к) рт (к)] =
= -БтНтС[НЛРХК (к) + НЛРт (к - к,к) - Р2М, (к)] - 1ХБ?НтСН[А1РУЖ (к) +Л,РХ№ (к - к,к)]; (18)
3 I=1
С [Ко(к)РКХ (к)3 т + К1(к)(ЗРх (к)8 т + У(к)) + К2(к)8Рх (к - к, к)8 т + Къ(к)Р2Х (Щ т ] =
= - Б т Н т С[НЛРх (к) + НЛРх (к - к, к) - Рх (к Ж т - 1 £ Бгт Н 1 СН [ Л,Рх (к) +А,РХ (к - к, к)]; (19)
3 I=1
С [К0 (к )РКХ (к, к - к)Б т + К1 (к )БРХ (к, к - к)Б т + К 2 (к )(ЗРХ (к - к) + У (к - к)) + + К3 (к) Р2Х (к, к - к)Б т ] = - Б т Н т С[НЛРХ (к, к - к) + НЛРХ (к - к) - Р2Х (к, к - к)]Б т -
-1£ Б}Н тСН[ЛгРх (к, к - к) +АгРх (к - к)] ; (20)
3 1=1
С[К0 (к)РК2 (к) + К1 (к)8РХ2 (к) + К2 (к)8РХ2 (к - к, к) + К3 (к)Рг (к)] =
~ 1 г = - Б т Н т С[НЛРх2 (к) + НЛРхг (к - к, к) - Р 2 (к)] + - £ бт Н ТСН [ ЛРх (к, к - к) +Л,Рх (к - к)]. (21)
3 1=1
Входящие в (18)—(21) моменты Рх (к, ]),Р2 (к, ]),РХ2 (к, ]),Р2Х (к, (к, ]),Рт (к, Д Р№2 (к, Д Р ш (к, Д РК (к, ]) определяются следующими формулами:
Рх (к + 1, ] + 1) = М{х(к + 1)хт (] + 1)} =
= ^Ф)Рх (к, {]■)+ф)Рх (к, ] - щци)+3 £ ^ (к)Рх (к, и)+3 £ ^ (к)Рх (к, ] - к)и (]■)+
3 1=1 3 1=1
+^(к)Рх(к - к,Жти) + ^2(к)Рх(к - к, ] - к)£(]) + 3£(к)РХ(к - к,Ж](]) +
3 1=1
+3 £ (к)Р (к - к, ] - кЪ1 (]) + в (к, ]); Р (0) = РХо. (22)
3 ,=1
Р2Х (к + 1, ] + 1) = М{2(к + 1)Хт (] + 1)} = = РРх (к, № и) + РРх (кк, ] - к)£и) + ¥Р^ (к, ])К1и)Бт + ^2 (к, ])К3(])БТ; Рх (0) = Р^. (23) РХ2 (к + 1, ] + 1) = М{х( к + 1)2^ (] +1)} = Цкк) РХ2 (к, ] ) Рт + +Ъ(к)Рх2 (к - к, ])Рт + БК0(к)Р„2 (к - к, Г) Рт + БКъ(к)Р2 (кк, ])Рт; Рх2 (0) = РХо2о. (24) Р^ (к + 1, ] +1) = М{х(к + 1)м>т (] +1)} = = \(кк)Рш (к, ])Лт (Г) + Ъ (к)Рхш (к - к, ])Лт (]) + БК0 (к)Р^х (к, ])5т Бт (]) + +БК0{к)Р,(к,])Лт(Г) +^(к)Рх(к,])5тБт(]) + ^(к)Рх(к - к,])5тБт(]) + +БКЪ (к)Р„ (к, ])Лт (]) + БКЪ (к)Рх (к, ])5т Бт (]) +
+БК1 (к)У(к, у)5к,Б(])■;Рх2(0) = РХо0;Рх2(0) = РХо0. (25)
Рт (к +1, ] +1) = ММк +1) хт (] +1)} = = Л(к)Р^х(к, ](]) + Л(к)Р^х(к, ] - к)£(] - к) + Л(к)Р, (к, ])К0 (])Бт + +Л(к) Р№2 (к, ]) К3 (]) Бт + Б(к) ЗРх (к, № (]) + Б {к) БРх {к, ] - к)£ (]) + +Б (к )ЗР„ (к, ]) Кт0 (]) Бт + Б (к) БРх2 (к, ]) К3 (]) Бт + Б (к )У (к, ] )Ък К (}) Бт; РКХ (0) = РК0 Х0 . (26) рк (к+1, ] +1) = ммк +1) (] +1)} = Л(к) рк (к, ]) Лт (])+Л(к) Р„х Х, ]) зтБт (]) +
+Б (к) 5Рхж (к, ])Лт и) + Б (к) 5Рх (к, ])5тБт (]) + Б(к)У(к, ])Ък]Бт (]); РК (0) = Рщ. (27) Р (к +1, ] +1) = М{2(к +1)2^(] +1)} = (к, ^ + в (1, ; Р(0) = Ро. (28)
Рш (к + \ ] +1) = М{2(к + 1К (] +1)} = РРх (к, ЛЗтБт (]) + ¥Рш (к, ])Лт (]); Рш (0) = р0^ . (29) Р„г (кк +1, ] +1) = ММ к +1) 2 (] +1)} = Л(к) Рт (к, ]) ^ т (]) + Б (к )8Рхг (к, ]) Рт; Рт (0) = Р^ ^. (30)
Окончательно представим систему матричных уравнений (18)-(21) в следующем виде:
С [К о (k )| К (k )| К 2 (k )| K 3 (k)] P (k) =
= -[BT H тС[НАРш (k) + HAPw (k - h, k) - P^ (k)] +1 ±BJHTCH [AiPxw (k) +AiPxw (k - h, k)]
3 i=i
BTHTC[HAPX (k) + HAPX (k - h,k) - Pzx (k)]ST +1 £ BTHTCH[AiPx (k) +A,PX (k - h, k)]
3 i=i
BTHTC[HAPX (k, k - h) + HAPX (k - h) - Pzx (k, k - h)ST +1 £ BTH TCH[AiPX (k, k - h) +AliPX (k - h)]
3 i=i
BTHTC[HAPxz(k) + HAPa(k - h,k) -P(k)] -3£b,tHjch[apx(k,k -h) +A-Px(k - h)]. (31)
3 i=1
В силу условия (7) матрицы С и P (k) невырождены для всех k = 0,1,2,___, следовательно, уравнение (31) разрешимо относительно блочной матрицы [K0(k )| K1(k)| K2(k)| K3(k)] и имеет единственное решение (8)—(11), которое получается из (31) непосредственным вычислением.
3. Асимптотическое поведение
Теорема 2. Пусть в описании объекта (1), канала измерений (2), критерия (3) и модели отслеживаемого вектора (4) матрицы A, At, A, Ai,B,Bi,Q, S,V,C,D , i = 1,r, - постоянные; F = E, qz (k) = 0. Тогда, если выполняется условие (7) теоремы 1, существует установившееся решение уравнений (22)-(26), матрицы PX = lim PX (k) > 0, Q1 = lim Q1 (k) > 0, пара матриц (А, .,Jq1 ) стабилизируема, тогда матрица
динамики замкнутой системы Ъ = A + BK*S асимптотически устойчива для К* = lim К* (k).
k ^да
В теореме 2 введены обозначения:
%(k) = A + BK* (k)S; ^2(k) = A + BK2 (k)S; Ъ (k) = BK* (k) - E; Ъ (k) = A, + B,K*(k)S; ^ (k) = Ä, + B,.K*(k)S;
Q1 (k, j) = Ъ) Pw (k, j) k0*t (j) b T +ъ(,) pxz (k, j) k*t (j) b T + 3 £ Ъ (k )pxw (k, j) K0*T (j) B,t +
3 i=1
+1 £ Ъ (k )Pxz (k, j)K3T (j) BT + ^2 (k) pxw (k - h, j)K*T (j) BT + ^OP (k - h, j) K-*T (j) B T + 3 i=1
+1 £ Ъ2г(k)Pxw(k -h, j)K0T(j)BT+ BK*(k)(k, j)ЪТ(j) + BK*(k)Pwx(k, j - h)^( j) +
3 i=1
+1 £ ВгК*(k )Pwx (k, j )Ъ*T (j) + 3 £ BK*(k )Pwx (k, j - h)4T (j) + BK*(k) Pzx (k, j)^T (j) + 3 i=1 3 i=1
+BK* (k)Pzx (k, j - h)l£( j) + 3 £ BK* (k)Pzx (k, j)Ъ*T (j) + 3 £ BK* (k)Pzx (k, j - h)&T (j) +
3 i=1 3 i=1
+ВКО (k) Pw (k, j)K0T (j) BT + BKo*(k) Pwz (k, j)K*T (j) В T +1 £ BK* (k)P (k, j)Ko*T (j) B,t +
3 i=1
+1 £ BK0(k)Pw (k, j) K*T (j) В,т + BK* (k)V(k, j)5MK*T (j)BT + 3 i=1
+BK2(k)V(k - h, j - h)5k_А,j_hK2T(j)ВT + BK3(k)Pzw(k, j)К0t(j)ВT +
+BK* (k) pz (k, j) K*T (j) В T +1 £ B,k3 (k) (k, j)Ko*T (7)Вгт +
3 i=1
+3 ¿£Дэ*(£)Р (к, j) k*t (j)ßT + 3 ißtfikWik, (j) b,t +
3 /=1 3 ,=I
+3£в,к2(k)V(k-h, j-h)8kj_hK*2ßß + Q(k, j^,, . (32)
3 i=1
Доказательство. Если матрица Px > 0, то из леммы 12.2 [21] при условии, что пара матриц (А, ■JQi) стабилизируема, следует, что матрица асимптотически устойчива. Применяя теорему 3.6 [21], получаем, что если пара матриц (А, -y/Q!) стабилизируема, то и пара матриц (, -JQ) - также стабилизируема. Этим доказывается справедливость теоремы.
Асимптотическую точность слежения определим, вычислив оценку критерия:
J = lim М{||x(k) - z||2}, (33)
где II - евклидова норма вектора, z - постоянный отслеживаемый вектор. Построим сначала оценку для критерия J(к) = М{||x(k) - z||2}. Задавая далее условие, что k ^да, найдем оценку для критерия (33). При этом предположим, что условия теоремы 2 выполняются, а s =а1, ||^2||s =а2, ||ф||s =Ф, ||ф2||s =Ф2 (здесь || - спектральная норма матрицы, К0 = lim К0 (к), К* = lim К* (к), К2 = lim К2 (к),
s к^да к ^да к^да
2 2 2 2 К3 = lim К3 (к)). Введем условие ах + Ф < 1. Отметим, что выполнение этого условия обеспечивает
к ^да
асимптотическую устойчивость замкнутой системы с запаздываниями по состоянию. Учитывая (1), (2), (5)
2222
при коэффициентах передачи К0, К1, К2, К3, вычислим значение критерия (33) для к+1 такта: J(к +1) = М {xT (к)^т (к)£(к)x(к) + xT (к)^т (к)^2 (к)x(k - h) + xT (k)^T (k)ВК02w(k) + +xT (k)^T (k)^3 (k)z + xT (k)фт (k)фx(k) + xT (k)фт (k)ф2 (k)x(k - h) +
+xT (k)фт (k) £ вге,К^(к) + xT (к)фт (k) £ вгед32z + xT (k - h)^T (k)^(k)x(k) +
i=1 i=1
+xT (k - h)^2 (k)^2 (k)x(k - h) + +xT (k - h)^T (k) ВК02 w(k) + xT (k - h)^2 (k )^3 (k) z + xT (k - h)q£ (к )ф(к) x +
+xT (k - h)фT (к )ф2 (k) x(k - h) + xT (k - h)^T (к )фТ (k) £ В, е,К*™(к) +
i=1
+xT (k - h)^ (k) £ Вг егК*^ + wT (k) К02Т BT^(k) x(k) + wT (k) К02Т BT£, 2 (k) x(k - h) + i =1
+wT (k) К02Т B T ВК> + wT (k) К02Т B T^3 (k) z(k) + z T (k (k )^(k) x(k) + +zT (k)£3 (k)^2 (k)x(k - h) + zT (k(k)^3 (k)z(k) + zT^3 (k)ВК>(к) +
+wT (k) £ К02ТеТ вiтф(k) x(k)+wT (k) £ К02ТеТ вTф2 (k) x(k - h) +
i=1 i=1
+£ wT (k)К0ТеТBt £ B,еíк2w(k) +£ wT(k)К0ТеТb,t £ веКz+
i=1 i=1 i=1 i=1
+zT £ К32ТеТвТф(к)x(k) +£ zтК32ТеТвТф2(к)x(k - h) + i=1 i=1
+£ zт К32ТеТ BT £ вi еД02w(k) + £ zт К32ТеТ BT £ в, е,Kз2 z} + z T^T (k (k) z + frß (k), (34) i=1 i=1 i=1 i=1 '
где
*т0т
ф= 2 (а, 0, + в, 0 к 5); Ф2 = 2 (а, 0, + В, 0,К25); б (к) = б(к )5, к + ВКХ V (к) К*т В
г=1
,=1
1 ^
+ - 2 В,.К* V (к) К* В,т + ВК 2 V (к - к) К*' В1 + - 2 В К * V (к - к) К* * В1.
3 ,=1 3 ,=1
Из (34) в силу неравенства Коши-Буняковского получим оценку
3(к + 1) < (ах2 +Ф2)^(к) + (аха2 +ФФ2)32(к,к - к) + аДg + г1)J3(k) + +Ф(О + Я)33 (к) + (аха2 + ФФ2)32(к - к,к) + (а2 + Ф2)31(к - к) + а2(g + г1)33 (к - к) + +Ф2(О + Я)33 (к - к) + а1 (g + /)33 (к) + а2(g + г1)33 (к - к) + +(g +1)2 + Ф(О + Я)33 (к) + Ф2(0 + Я)33 (к - к) + (а + Я)2 + ,
т 1 г
т г>т
(35)
где
3 (к) = М{||х(к)||2}; 32(к,к - к) = М{||х(к)|| х ||х(к - к)||); 33 (к) = М{||х(к)||};
г=11^3 4; я=
2 В, 0К г
,=1
О =
ВК 0 Ц; б = Нш б (к) = Нш б(к -1).
к
к
2 В,0,^ ; * ,=1
Тогда, учитывая, что траектория замкнутой системы описывается уравнением
х(к) = (^ + ф)х(к -1) + (^2 + ф2)х(к - к -1) + (В + 2 В0,)К0*ц(к -1) +
,=1
+(В + 2 В,0,)К>(к -1) + (В + 2 В,0,)К>(к - к -1) + (В + 2 В0,)К3*г + д(к -1):
,=1
,=1
,=1
вычислим рекуррентные соотношения для критериев (к), 32 (к, к - к), 33 (к), которые входят в состав (35):
Л(к) < (а2 + Ф2)к31(0) + Ка2 + ФФ2) 2 К + Ф2)к-^2(у -1, у - к -1) +
у =1
+2а1 (г2 + g) (а? + Ф2)к"у у -1) +2Ф(Я + О) 22 (а? + Ф2)к"у у -1) +
у=1
у=1
+(а1а2 +ФФ2) 2 К +Ф2)к-у32(] -к -1,у -1) +
у =1
+(а2 + Ф2) 2 (а!2 + Ф2)к-у 7 - к -1) + 2а2(г2 + g) 2 (а^ + Ф2)к~у у - к -1) +
у =1
у =1
+2Ф 2 (О + Я) 2 (а12 +Ф 2)у3( у - к -1) + (а2 +Ф 2)к 1 ((g + Г2)2 + (О + Я)2 + (г&), (36)
,=1
(а2 +Ф2) -1
где г2 = ВК 3 г Рекуррентное соотношение для 32 (к, к - к) примет вид
32(к, к - к) < (а 2 + Ф2)к 32(0, - к) + (аха2 + ФФ2) 2 (а 2 + Ф2 )к32 (у -1, у - 2к -1) +
у=1
+а1 (/2 + g) 22 (а!2 + Ф2)к(у -1) +Ф(О + Я) 2 (а? + Ф2)к-у ^(у -1) +
у=1
у=1
+(а1а2 + ФФ 2) X (а? + Ф2)к -1 ] - А -1) + (а2 + Ф2) X (а12 + Ф2)к -1J2( ] -А -1, ] - 2А -1) 1=1 1=1
+а1 (Г2 + £) X (а!2 + Ф2)к-1 Jз (1 - А -1) +
у=1
+Ф2О + Я) X (а12 + Ф2)к-1 Jз( 1 -А -1) +а2(г2 + £) X (а* + Ф2)Ч3 (у -А -1)
1=1
к
+а2 (£ + г2) X К + Ф^-1 ^ (у - 2А -1) +Ф(Я + О) X К + ФГ; Jз (У - А -1)
1=1 1=1
1=1
к
12)к
+Ф2(Я + О) X к + Ф^-1 ^ (У - 2А -1)
=1
(а2 +Ф2)к -1 (а2 +Ф2) -1
((£ + Г2)2 + (О + Я)2 + /а), (37)
где & (к) = ВК;У (к - А -1)К2тВт + - X В^У(к - А -1)К*тВ/ .
3 1=1
Рекуррентное соотношение для Jз (к) имеет вид
ак -1
Jз(к) <а-Jз(0) + а2 X а^ ^О'-А -1) +-^(г + £).
1=1
а1 -1
(38)
Оценку критерия (34) построим, учитывая неравенства (36)-(38). Тогда при к ^ да из (34) получим
J <
[(О + Я)2 + (£ + Г2)2 + ^ ][(а2 + Ф2) + (а 2 + Ф 2)]
+2(а1а2 +ФФ 2)
1 - (а2 +Ф2)
(О + Я)2 + (£ + Г2)2 + 1 - (а2 +Ф2)
+2(£ + /2)(а, + а 2)( £ + Г> + (Ф + Ф 2)(0 + Я) + (£ + „)2 + (0 + Я)2 +(39)
1 -а1
Из оценки (39) видно, что при практически естественных ограничениях на класс динамических систем метод локально-оптимального слежения при косвенных измерениях с ошибками обеспечивает асимптотическое слежение с точностью, определяемой интенсивностью аддитивных возмущений и ошибок в канале измерений, динамическими характеристиками замкнутой системы, значениями параметров объекта и коэффициентов передачи следящей системы управления.
4. Результаты моделирования
Пусть объект и локальный критерий описываются следующими матрицами и векторами:
А =
Аз =
0,05 1 -0,025 1 0 0,1 0 0
; А =
; А4 —
А =
00 0,03 0 0 0 0 0,01 0 0,001 0 0
; В =
; А5 = А6 =
; а4 =
; А =
В1 = В2 = В3 = В4 =
0,1 1
0 0 0 0 0 0 0 0,002
0,005
; А =
0,05 0 00 0,03 0 0 0 0 0
; а2 = ; А2 =
00 0,005 0 0 0 0,05 0
; А5 = А6 =
; в5 =
0
; Вб =
0 0 0 " 0,025
Q =
0,02 0 0 0,02
; Б = [0 1]; Н = [1 0]; С = 1; В = 0,2; Е = 1; г =
10 10
; А = 1.
В ходе моделирования сравнивалось качество двух систем управления. Первая система управления моделировалась с оптимальными коэффициентами передачи, вычисленными с учетом интервальных параметров; вторая - с коэффициентами, которые рассчитывались по номинальным значениям параметров.
В качестве критерия оценки качества сходимости вектора состояния x(k) к желаемому значению z(k) рассчитывается средняя ошибка оценивания:
e =-
s|x(k) - z(k)|
k=1
N
где z(k) - желаемое значение вектора состояния.
В таблице приведены значения критерия качества сходимости для двух алгоритмов ^ = 100) для 5 различных наборов интервальных параметров Qi:
- алгоритм 1 - локально оптимальное управление для объекта с интервальными параметрами;
- алгоритм 2 - управление, вычисленное по номинальным значениям параметров [9].
Средние ошибки
Алгоритм e1 e2 e3 e4 e5 e6
1 0,384 0,258 1,169 0,819 0,572 0,274
2 0,449 0,307 1,204 0,830 0,611 0,281
Из таблицы видно, что средняя ошибка отклонения вектора состояния x(k) от отслеживаемого вектора z(k) при локально-оптимальном управлении для объекта с интервальными параметрами меньше, чем при управлении, построенном по номинальным значениям параметров.
Заключение
Решена задача управления выходом для дискретного объекта с интервальными параметрами с запаздыванием по состоянию. Решение выполнено на основе синтеза локально-оптимальной следящей системы управления линейным динамическим объектом при косвенных измерениях с использованием вероятностного метода. Исследовано асимптотическое поведение системы. Показано, что оптимальная система управления с постоянными коэффициентами передачи обеспечивает более высокую точность слежения, чем система управления, синтезированная по номинальным значениям параметров.
ЛИТЕРАТУРА
1. Camacho E.F., Bordons C. Model Predictive Control. London : Springer-Verlag, 2004. 405 p.
2. Aggelogiannaki E., Doganis Ph., Sarimveis H. An Adaptive Model Predictive Control Configuration for Production-Inventory Sys-
tems // International Journal of Production Economics. 2008. V. 114. P. 165-178.
3. Wang W., Rivera D. A Novel Model Predictive Control Algorithm for Supply Chain Management in Semiconductor Manufacturing //
2005 American Control Conference, Portland, OR, 2005. P. 841-855.
4. Stoica C., ArahalM. Application of Robustified Model Predictive Control to a Production-Inventory System // 48th IEEE Conference
on Decision and Control and 28th Chinese Control Conference Shanghai, P.R. China, 2009. P. 3993-3998.
5. Henneta J.-C. A Globally Optimal Local Inventory Control Policy for Multistage Supply Chains // International Journal of Production
Research. 2009. V. 47, is. 2. P. 435-453.
6. Dombrovskii V.V., Dombrovskii D.V. Predictive Control of Random-Parameter Systems with Multiplicative Noise. Application to
Investment Portfolio Optimization // Automation and Remote Control. 2005. V. 66, is. 4. P. 583-595.
7. Dai L., Xia Y., Fu M., Mahmoud M. Discrete-Time Model Predictive Control. Advances in Discrete Time Systems. InTech, 2012.
Chapter 4. P. 77-116.
8. Tang G., Sun H., Liu Y. Optimal Tracking Control for Discrete Time-Delay Systems with Persistent Disturbances // Asian Journal of
Control. 2006. V. 8, No. 8. P. 135-140.
9. Мухина О.О., Смагин В.И. Локально-оптимальное управление по выходу для дискретных объектов с запаздыванием по со-
стоянию // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2014. № 1 (26). С. 4-13.
10. Patre B.M., Bandyopadhyay B. Robust Control for Two-Time-Scale Discrete Interval Systems // Reliable computing. 2006. No. 12. P. 45-58.
11. Lin T-S., Chan S-W. Robust Adaptive Fuzzy Sliding Mode Control for a Class of Uncertain Discrete-Time Nonlinear Systems // International Journal of Innovative Computing, Information and Control. 2012. V. 8, No. 1(A). P. 347-359.
12. Смагин В.И., Смагин С.В. Адаптивное управление запасами с учетом ограничений и транспортных запаздываний // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2008. № 3(4). С. 19-26.
13. Киселева М.Ю., Смагин В.И. Управление производством, хранением и поставками товаров на основе прогнозирующей модели выхода системы // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2009. № 2(7). С. 24-31.
14. Киселева М.Ю., Смагин В.И. Управление с прогнозирующей моделью с учетом запаздывания по управлению // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 5-12.
15. LuenbergerD.G. An introduction to observers // IEEE. Trans. Automatic Contr. 1972. V. AC-16, No. 6. P. 596-602.
16. Домбровский В.В. Синтез динамических регуляторов пониженного порядка при Hм ограничениях // Автоматика и телемеханика. 1996. № 11. С. 10-17.
17. Домбровский В.В. Понижение порядка систем оценивания и управления. Томск : Изд-во Том. ун-та, 1994. 175 с.
18. Луценко И.В., Садомцев Ю.В. Синтез дискретных Н2-оптимальных регуляторов пониженного порядка // Автоматика и телемеханика. 2009. № 10. C. 114-132.
19. АндреевЮ.Н. Управление конечномерными линейными объектами М. : Наука, 1976. 424 с.
20. Абгарян К.А. Матричные и асимптотические методы в теории линейных систем. М. : Наука, 1973. 432 с.
21. Wonham W.M. Linear Multivariable Control: A Geometric Approach. Springer-Verlag, 1979. 354 p.
Мухина Оксана Олеговна. E-mail: [email protected]
Смагин Валерий Иванович, д-р техн. наук, профессор. E-mail: [email protected]
Томский государственный университет Поступила в редакцию 1 июня 2014 г.
Mukhina Oksana O., Smagin Valery I. (Tomsk State University, Russian Federation). Dynamic locally-optimal control systems for objects with interval parameters and state delay.
Keywords: local-optimal control, state delay, dynamic control system, output control.
Consider the problem of dynamical locally-optimal control based on the observed output for discrete objects with interval parameters and delay in the state, described by the following difference equation:
x(k +1) = (A +Z A,в,)x(k) + (A + Z A,в,)x(k - h) + (B + Z B,в, )u(k) + q(k); i=1 i=\ i=\
x(x)=ф(т),% = -h,1 -h,2 -h,...,0; k = 0,1,2,..., where x(k)eRn is a state vector, h > 0 is a positive integer time delay, u(k) eRm is a control input, A, A, , A, A, , B, B, , i = 1, r are constant matrices of appropriate dimensions, q(k) is the Gaussian random sequence of input disturbances, et is uncertain parameters of interval type (-1 < в, < 1) . The measurement channel is represented by equation
y(k) = Sx(k) + v(k),
where S is the matrix of measurement channel, v(k) is the Gaussian random sequence of measurement errors. To solve the problem, we propose an algorithm, which is based on the optimization of the local criteria
I (k) = M j(w(k +1) - z(k ))T C (w(k +1) - z(k)) + uT (k) Du(k)},
where w(k) = Hx(k) is the controlled output of the system, C = C > 0 и D = D1 > 0 are weighting matrices, z(k) e Rn is the tracking vector, described by equation
z(k +1) = Fz(k) + qz (k), where qz (k) is the Gaussian random sequence, F is a matrix.
The control law of object is determined by the function of measured variables with time memory of the tracked signal and the dynamic element w(k) :
u(k) = K0 (k)w(k) + K1 (k)y(k) + K2 (k)y(k - h) + K3 (k)z(k).
* * * *
The formulas for calculating the optimal transfer coefficients K0 (k), K1 (k), K2 (k), K3 (k) are given.
In this paper, the proposed synthesis algorithms of output control do not use an extension method of the state space. The asymptotic properties of the closed-loop system are obtained. For the square criterion
J = kim M{|| x(k) - z\\2},
which defines the asymptotic accuracy of tracking, it is shown that
J < [(G + R)2 + (g + r2)2 + trQ][(ai2 + Ф2) + (a2 + Ф2)] +
1 - (a2 +Ф2)
1 - (a, +02)
+,(g + r2)(ai + a2)(g + ri) + (° + °2)(G + R) + (g + fi)2 + (G + R), +1.
1 -a1
So, we see that under natural restrictions on the class of dynamic systems, the method of locally optimal tracking on indirect measurements with errors provides asymptotic tracking with accuracy determined by the intensity of additive disturbances and errors in the observations, dynamic characteristics of a closed-loop system, values of the parameters of the object, and the transmission coefficients of the tracking control system.
The comparison of the simulation results of the two control systems is given with:
- the optimal transfer coefficients, calculated with using the interval parameters;
- the transfer coefficients, calculated with using the nominal values of the parameters.
The criterion of estimation of the quality of convergence of the state vector x(k) to the desired value z(k) shows that the average error of the deviation of the state vector x(k) of the tracking vector z(k) in the robust control is less than the control constructed on the nominal values of the parameters.
REFERENCES
1. Camacho E.F., Bordons C. Model Predictive Control. London: Springer-Verlag, 2004. 405 p.
2. Aggelogiannaki E., Doganis Ph., Sarimveis H. An Adaptive Model Predictive Control Configuration for Production-Inventory Sys-
tems. International Journal of Production Economics, 2008, vol. 114, pp. 165-178. DOI: 10.1016/j.ijpe.2008.01.003
3. Wang W., Rivera D. A Novel Model Predictive Control Algorithm for Supply Chain Management in Semiconductor Manufacturing.
American Control Conference, 2005, Portland, OR, pp. 841-855. DOI: 10.1109/ACC.2005.1469933
4. Stoica C., Arahal M. Application of Robustified Model Predictive Control to a Production-Inventory System. 48th IEEE Conference
on Decision and Control and 28th Chinese Control Conference Shanghai, 2009, P.R. China, pp. 3993-3998. DOI: 10.1109/CDC.2009.5399740
5. Henneta J.-C. A Globally Optimal Local Inventory Control Policy for Multistage Supply Chains. International Journal of Production
Research, 2009, vol. 47, Issue 2, pp. 435-453. DOI: 10.1080/00207540802426458
6. Dombrovskii V.V., Dombrovskii D.V. Predictive Control of Random-Parameter Systems with Multiplicative Noise. Application to
Investment Portfolio Optimization. Automation and Remote Control, 2005, vol. 66, Issue 4, pp. 583-595.
7. Dai L., Xia Y., Fu M., Mahmoud M. Discrete-Time Model Predictive Control. Advances in Discrete Time Systems. InTech, 2012,
Chapter 4, pp. 77-116. DOI: 10.5772/51122
8. Tang G., Sun H., Liu Y. Optimal Tracking Control for Discrete Time-Delay Systems with Persistent Disturbances. Asian Journal of
Control, 2006, vol.8, no. 8, pp. 135-140. DOI: 10.1111/j.1934-6093.2006.tb00263.x
9. Mukhina O.O., Smagin V.I. Local-Optimal Output Control for Discrete Systems with State Delays. Vestnik Tomskogo gosudarstven-
nogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science, 2014, no. 1 (26), pp. 4-13. (In Russian).
10. Patre B.M., Bandyopadhyay B. Robust Control for Two-Time-Scale Discrete Interval Systems. Reliable computing, 2006, no. 12, pp. 45-58. DOI: 10.1007/s11155-006-2971-x
11. Lin T-S., Chan S-W. Robust Adaptive Fuzzy Sliding Mode Control for a Class of Uncertain Discrete-Time Nonlinear Systems. International Journal of Innovative Computing, Information and Control, 2012, vol. 8, no. 1(A), pp. 347-359.
12. Smagin V.I., Smagin S.V. Adaptive inventory control with restrictions and traport delays. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science, 2008, no. 3(4), pp. 19-26. (In Russian).
13. Kiseleva M.Yu., Smagin V.I. Control of goods production, storage and delivery based on prediction model systems output. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science, 2009, no. 2(7), pp. 24-31. (In Russian).
14. Kiseleva M.Yu., Smagin V.I. Model predictive control with time-delay in control input. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science, 2010, no. 2 (11), pp. 5-12. (In Russian).
15. Luenberger D.G. An introduction to observers. IEEE. Trans. Automatic Contr., 1972, V, AC-16, no. 6, pp. 596-602. DOI: 10.1109/TAC.1971.1099826
16. Dombrovskii V.V. Synthesis of the dynamic governor of reduced order under Hw restrictions. Avtomatika i telemekhanika, 1996, no. 11, pp. 10-17. (In Russian).
17. Dombrovskii V.V. Ponizhenie poryadka sistem otsenivaniya i upravleniya [Reduction of the order of evaluation and control systems]. Tomsk: Tomsk State University Publ., 1994. 175 p.
18. Lutsenko I.V, Sadomtsev Yu.V. Design of discrete H2-optimal reduced-order controllers. Avtomatika i telemekhanika, 2009, no. 10, pp. 114-132. (In Russian).
19. Andreev Yu.N. Upravlenie konechnomernymi lineynymi ob"ektami [Management of the finite-dimensional linear objects]. Moscow: Nauka Publ., 1976. 424 p.
20. Abgaryan K.A. Matrichnye i asimptoticheskie metody v teorii lineynykh system [Matrix and asymptotic methods in the theory of linear systems]. Moscow: Nauka Publ., 1973. 432 p.
21. Wonham W.M. Linear Multivariable Control: A Geometric Approach. Springer-Verlag, 1979. 354 p.