2012
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Управление, вычислительная техника и информатика
№ 1(18)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 519.2
М.Ю. Приступа, В.И. Смагин ПРОГНОЗИРУЮЩЕЕ УПРАВЛЕНИЕ ДИСКРЕТНЫМИ СИСТЕМАМИ С НЕИЗВЕСТНЫМ ВХОДОМ И ЕГО ПРИМЕНЕНИЕ К ЗАДАЧЕ УПРАВЛЕНИЯ ЭКОНОМИЧЕСКИМ ОБЪЕКТОМ
Рассматривается задача синтеза прогнозирующего управления, построенного на основе слежения за выходом системы при наличии неизвестного входа. Прогнозирование осуществляется на основе вычисления оценок состояний объекта, построенных с использованием экстраполятора Калмана, и оценок неизвестного входа. Рассматривается задача управления экономической системой производства, хранения и поставок товара потребителям.
Ключевые слова: дискретные системы, прогнозирующее управление, оценки неизвестного входа, модель производства.
При синтезе управлений широко используется метод управления динамическими объектами с применением прогнозирующих моделей - Model Predictive Control (MPC) [1, 2]. Область применения MPC охватывает задачи управления технологическими процессами, производственными системами и финансовую математику (управление портфелем ценных бумаг) [1-5] и др.
В работе рассматривается задача синтеза прогнозирующего управления для динамических объектов с неизвестным входом, при этом применяются методы вычисления оценок вектора состояния объекта, использующие оценки неизвестного возмущения (входа) [6-15]. В [6, 7] для вычисления оценок неизвестного возмущения рассматриваются алгоритмы расширения пространства состояний (к основной модели объекта добавляется модель ненаблюдаемого возмущения) и алгоритм двухэтапной фильтрации, уменьшающий вычислительные затраты за счет декомпозиции задачи. В работах [8-15] для вычисления таких оценок предложены алгоритмы рекуррентной оптимальной фильтрации, не использующие метод расширения пространства состояний.
Предложено синтезировать прогнозирующее управление с использованием оценок неизвестного входа, которые могут вычисляться двумя способами в зависимости от уровня априорной информации: на основе фильтра Калмана и на основе модифицированного МНК. Рассмотрена задача синтеза прогнозирующего управления производством, хранением и поставками товара с учетом случайных факторов при неизвестном входе.
1. Постановка задачи
Модели объекта, канала наблюдений и управляемого выхода описываются следующими соотношениями:
xt+\ = Axt + But + Irt + wt , xt=o = xo; (!)
v = Hxt + vt; ()
yt = Gxt , (3)
где xt e Rn - состояние объекта, ut e R” - управляющее воздействие (известный
вход), rt e Rq - неизвестный входящий сигнал, уt e R1 - наблюдения, выход системы контроля, yt e Rp - управляемый выход, A, B, I, H, G - матрицы соответствующих размерностей. Предполагается, что случайные возмущения wt и шумы измерения vt не коррелированы между собой и подчиняются гауссовскому распределению с нулевым средним и с соответствующими ковариациями:
M(wwJ } = WSa, M{vvT } = VSa , где btk - символ Кронекера. В (1) вектор начальных условий х0 является случайным, некоррелированным с величинами wt и vt и определяется следующими характеристиками:
M{Xo} = Xo, М{(Xo - Xo)(Xo - Xo)T} = PZti .
Ограничения на векторы состояния и управления зададим в виде
a1 < SjZt < a2, Ф1 (xt) < S2ut < ф2 (xt), (4)
где S1 и S2 - структурные матрицы, состоящие из нулей и единиц и определяющие компоненты векторов xt и ut, на которые накладываются ограничения; a1, a2, 91(xi), ф2Х) - заданные постоянные векторы и вектор-функции соответствующих размерностей.
Задача состоит в том, чтобы по наблюдениям определить стратегию управления, при которой вектор выхода системы yt будет близок к заданному вектору с учетом ограничений (4).
2. Прогнозирование поведения объекта
Модель (1) используется для прогнозирования поведения объекта на протяжении всего горизонта прогнозирования, обозначаемого N, на основе информации, имеющейся в момент времени t. Осуществим синтез алгоритма оптимального прогнозирования поведения объекта и вектора выхода, используя экстраполятор Калмана [16]. Пусть Z¡у и у^ - оценки состояния и вектора выхода в момент
времени i, вычисляющие информацию с у-го момента времени, j < i. Тогда:
Zt+1|t = AZt|t-1 + But + Irt+Kt (Vt- HZt|t-1), Zoi-1 = Zo; (5)
yt+1it=GZt+1|t; (6)
Kt = APtHT (HPtHT + V)-1; (7)
Pt+1 = W + APtAT - APtHT (HPtHT + V)" HPtAT, p = PXo . (8)
Для построения модели прогнозирования необходимо вычислить оценки неизвестного входа. Рассмотрим два подхода построения оценок неизвестного входа Г .
Для того чтобы применить подход, основанный на использовании фильтра Калмана, необходим определенный уровень априорной информации о неизвестном входе г, например необходимо иметь модель поведения неизвестного входа. Предположим, что закон его поведения задается следующим уравнением:
Г+1 = ЯГ + Т, Г=0 = ^, (9)
где Я - матрица, определяющая динамику неизвестного сигнала, т - случайная гауссовская величина с нулевым средним и дисперсией Т , г0 - случайный вектор начальных условий с известными характеристиками (М{г0} = ¥0,
М{(г0 - г0)(г0 - Г0)Т} = РГо). Предполагается, что т( не коррелирована со случай-
ными возмущениями ^ и шумами измерения Ур
Применяя фильтр Калмана к модели (9), получим оценку неизвестного сигнала в момент времени t+1, которая определяется из следующих выражений:
Г+1 = Я' + К (^+1 - НАх1\1-1 - НВщ - Н1г{), '0 = ' ,
К = рНТ (НрНТ + НШНТ + К)-1,
Р+1 = (Еп - КН) Р , р0 = р0, (10)
где Еп - единичная матрица размера пхп.
Перейдем к рассмотрению второго подхода. В этом случае отсутствует необходимость знать модель поведения неизвестного входа (9). Вычисление значений прогноза состояния системы (5) выполним как решение некоторой новой задачи оптимального управления, при этом под управлением понимаются значения неизвестного входа ' . Критерий оптимальности строится исходя из принципа минимума ошибок прогнозируемых оценок вектора состояния. Второй подход является вариантом модифицированного МНК. В качестве критерия оптимальности будем использовать квадратическую функцию следующего вида:
3(Гм) = X {К,- - {-11 1я +1И-11Ё>Я } , (1
,=1
где СЯ и БЯ - симметричные, положительно определенные матрицы.
Оптимизация критерия до текущего момента времени t сводится к минимизации критерия в каждый момент времени , = 1, t:
3^ = пиптш...шт^{|у,- -{С +1И-1|Ё>Я}. (12)
г0 Г1 ^-1 ,=^ Я '
Оптимальная оценка неизвестного входа на шаге t = 1:
3(Г0 ) = ШШ { - Нх1|01|СЯ + I|Г0 11^ } .
Учитывая, что х^ = Ах0 + Ви0 + 1г0, имеем
3(Г0 ) = ШШ {! - Шх0 - НВи0 - Шг01СЯ +1|'ь||^Я }. (13)
После преобразований получаем
J(r0) = min[r0T (lтHTCRHI + Dr ) - 2r0TITHTCR ( - HAx0 - HBu0 ) + a0 },
ro 1 V ’ ’
где a0 - величина, не зависящая от r0.
Оптимальная оценка находится из условия dJ (r0)
5/0
: 2(lтHTCRHI + £>R )r0 - 2IтHTCR ( - H4x0 - HBu0 ) = 0 ;
откуда получаем оптимальную оценку неизвестного входа в момент времени
t = 1:
Го = SR (4/1 - HAxo - HBu0 ), (14)
(T T \ 1 T T л
I H CRHI + Dr I I H CR . Подставляя полученное выражение для r0 в (13), вычисляем оптимальное значение критерия в момент времени t = 1:
J(Г,) = ( -HAx0 -HBu0)TMR ( -HAx0 -HBu0), (15)
где MR = CR -2CrHISr + SRT (lTHTCRHI + Dr)r .
В момент времени t = 2 оптимальная оценка неизвестного входящего сигнала находится исходя из оптимизации следующего критерия:
J(r1) = mm min {у 2 - {||{ +1{ ||Dr + || к - Hx1|o ||CR +1lro IIDr }.
Используя принцип оптимальности Беллмана, выражение для J(Г[) может быть преобразовано следующим образом:
J(r1) = mm{k2 - HX2|11|CR + IИ IIDr + J(Г0 )} =
=^n { 2- {- HBu1- {11 {+1 и d + iik1- HAxo- HBu0iîMR}=
= min{ (itHtCrHI + Dr H - 2rTITHTCR (2 - HAX1|0 - HBux ) + aj}, r1
где a! - величина, не зависящая от Щ . Дифференцируя по Щ , по аналогии с операциями, проведенными на первом шаге, имеем
Г = Sr (2 - HAX1|0 - HBul ) ; (16)
J(Г ) = (2 - HAX\p - HBux )T MR ( 2 - H4iXj|0 - HBux ) . (17)
Применяя принцип Беллмана для последующих шагов и метод математической индукции, получаем
rt = Sr ( t+1 - HAX^ - HBut ). (18)
Таким образом, учитывая динамику оценок неизвестного входа (10), (18), прогнозирование поведения объекта и выхода системы может быть выполнено по следующим формулам:
Xt+t\t = Ai-1Xt+1|t + § ^Bu^klt +§ А1'-*-1^ , yt+At = GXmt, i = W, (19)
k=1 k=1
где и+щ - управление, используемое для прогнозирования, г1+к - оценки прогноза неизвестного входа, которые строятся исходя из того, какой метод оценивания был выбран. В случае отсутствия априорной информации о поведении неизвестного входа оценки прогноза г+к могут быть построены на основе методов прогнозирования временных рядов. В случае, когда модель поведения неизвестного входа известна, целесообразно строить прогноз т+к на основе уравнения динамики (9):
г+к = КП+к-^ где начальное значение Г+1 определяется из (10).
Уравнения для прогнозируемых векторов состояния и выхода представляются в векторно-матричной форме. Для этого вводятся следующие векторы и матрицы:
¥ =
хі+1|г "уі+1|," иі+1|і " +1|г "
*і = Хі+М|і , Ї, = _ У і+N |і _ , и г = иг+М|г _ , А = Гг+N|i _
■ Еп ' ■ О "
А ОА
А2 , Л = ОА2
_ АМ-1 _ _ОАМ-1 _
" 0 0 0 ... 0" ■ 0 0 0 ... 0"
В 0 0 ... 0 ОВ 0 0 ... 0
Р = АВ В 0 ... 0 , Ф = ОАВ ОВ 0 ... 0
В 2 - • ^ А 1 АМ-3 В в 0 _ В 2 - : ^ А ОА і ОАМ-3 В ОВ 0
■ 0 0 0 ... 0" ■ 0 0 0 ... 0"
I 0 0 ••• 0 ОІ 0 0 ... 0
£ = АІ I 0 - 0 , Q = ОАІ ОІ 0 ... 0
АМ-21 АМ-31 • •• I 0 _ ОАМ-21 ОАМ-3І ОІ 0
. (20)
Прогнозирующая модель (19) может быть представлена в виде следующей системы:
*,= П+Ш+ Р^ + ^ ,
(21)
Схема преобразования ограничений (4) для прогнозирующей модели подробно изложена в [5].
3. Синтез прогнозирующего управления
Для решения поставленной задачи в качестве целевой функции используется
критерий
' к=1
где матрицы С > 0 и В > 0 - весовые матрицы.
Критерий (22) преобразуется к векторно-матричному виду: 3 (і) = 2 иї РП, + и] / + а , где а - слагаемое, не зависящее от управления,
(23)
F = Ф1CФ + D , f = Г
xt+1|t 1 D t ]
Л 0
R -
Yt ] _ 0 ]
Г = [фтСЛ ФтCQ -ФТС] , Yt
У+i|t
yt+Nit
С и D - диагональные матрицы, составленные из весовых коэффициентов С и D:
[ С 0 : 0 ]
С = 0 С : 0 , D
0 0 : С
2D -D 0 0
- D 2 D - D 0
0 - D 2D - D
0 0 -D 2D
Аналитическое решение сформулированной задачи квадратичного програм-
мирования без учета ограничений находится из условия
dJ (t)
dUt
= 0 с использова-
нием формул векторно-матричного дифференцирования [17]:
dJ (t) = 5
dut dut
2 UtT FUt + UtT f + a
1 3(trFUtUj) , d(Uj f)
3Ut
3Ut
= \ [ F TUt + FUt ]+ f = 0.
(24)
В силу симметричности матрицы Е уравнение (24) можно представить в виде
ри,+/ = 0.
Решение этого уравнения определяется выражением
U* = -(ФТСФ + D)-1 (ФТСAxt+1|t + ФтCQRt - ФтCYt) -
v 0 ,
Оптимальное прогнозирующее управление примет вид
u*+1t = ( 0 • •• 0)U*.
Оптимизация модели (1) - (3) с ограничениями (4) может быть выполнена численно. Для оптимизации целевой функции (23) используется процедура quad-prog системы Matlab.
4. Моделирование управления экономическим объектом
Рассмотрим задачу управления экономическим объектом, предназначенным для производства, хранения и поставок товаров потребителям [3, 5]. Модель объекта с дополнительно включенными неизвестными составляющими возмущений имеет вид
Ч,+1 =М,+Ь, + Ф, +§,, Чо = Чо,
7,+1 = 7,+Вй, + -Фt + С,, 70 = ^, (25)
где е В? , ч,-,, - количество товара г-го типа у потребителя в момент времени t (, = 1, Т , г = 1,5 ); 7;,, - количество товаров г-го типа на складе производителя; ю;,, -объем производства товаров ;-го типа; ф;,, - объем поставок товаров ;-го типа; Ъ, dt - неизвестные составляющие возмущений; ^- векторные гауссовские случайные последовательности (М{ ^ } = 0, М{ } = 0, М{|,^} = Е5, к, М{^,С^} = ^5,к , М{§,} = 0); А и В - матрицы, определяющие динамику производства и потребления.
В каждый момент времени t должны выполняться ограничения
7тт < 7, < 2тях, 0 < й, < Ют
^шт — ¿І — ^шах, 0 — — штах, 0 — фІ —
Переменные юІ и фІ рассматриваются как управляющие воздействия. Неизвестные составляющие возмущений вводятся по той причине, что на практике параметры модели (матрицы А и В) часто определяются с погрешностями, влияние которых может быть учтено за счет введения неизвестных возмущений. Задача состоит в том, чтобы по наблюдениям определить стратегию управления производством, хранением и поставками товара, обеспечивающую количество товаров у потребителя % близкое к заданному вектору % , при этом должны учитываться ограничения.
Модель системы (25) преобразуется к виду модели (1). Оптимизационная задача решается на каждой итерации для прогнозируемых значений вектора состояния.
Моделирование проведено при постоянных неизвестных возмущениях для следующих исходных данных:
А =
" 0,75 0 " , В = "0,3 0,1" = "0,1" = "1,5"
-0,25 0,9_ 0,2 0,8_ > шіп .0,1. > шах .2,5.
0,8 0,2 "0" "1" Г 0,1"
3шах 0,7 , ?0 = 0,2 , % = 0 , % = 2 3 о = = -в о = = .0,1.
Ъ = [0,05 0,03]Т , ё = [0,04 0,02]Т , Ъ0 = ё0 =[0 0]Т , кх = к2 = 1, ЛТ=10,
С = Е2, РХо = р = Н = Б = Е4, Г = 0, V = ^{0,0005; 0,0005; 0,0005 ; 0,0005}.
Результаты численного моделирования с использованием фильтра Калмана для построения оценок неизвестного входа приведены в виде графиков переходных процессов на рис. 1-4.
Результаты численного моделирования с применением модифицированного МНК для построения оценок неизвестного входа приведены на рис. 5-8. Прогнозирование оценок неизвестного входа осуществлено с помощью линейной экстраполяции. Для улучшения качества оценок прогноза использован метод экспоненциального сглаживания.
Рис. 1. Динамика изменения количества товаров у потребителя
Рис. 2. Динамика изменения количества товаров на складе и объемов поставок
Рис. 3. Процессы изменения объемов производства товаров
Рис. 5. Графики изменения количества товаров у потребителя
Рис. 6. Графики изменения количества товаров на складе и объемов поставок
ю1
0,6
Рис. 7. Процессы изменения объемов производства товаров
Заключение
Разработан метод решения задачи управления на основе синтеза прогнозирующего управления выходом дискретного объекта при наличии неизвестного входа, для реализации которого предложено использовать два алгоритма построения оценок неизвестного входа. Второй алгоритм, основанный на применении модифицированного МНК, для реализации управления с прогнозированием требует существенно меньшего уровня априорной информации о неизвестном входе, тем самым снимает вопрос об идентификации модели неизвестного входа, что играет важную роль при решении практических задач. Результаты моделирования показали, что основная цель (определение стратегии управления объектом, при которой вектор выхода будет близок к заданному вектору) достигается в обоих случаях.
ЛИТЕРАТУРА
1. Maciejowski J.M. Predictive control with constraints. Prentice Hall, 2002. 331 p.
2. CamachoE. F., Bordons C. Model predictive control. London: Springer-Verlag. 2004. 405 p.
3. Перепелкин Е. А. Прогнозирующее управление экономической системой производства, хранения и поставок товаров потребителям // Экономика и математические методы. 2004. Т. 40. №. 1. С. 125-128.
4. Домбровский В.В., Домбровский Д.В., Ляшенко Е.А. Управление с прогнозирующей моделью системами со случайными зависимыми параметрами при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2006. № 12. C. 71-85.
5. Киселева М.Ю., Смагин В.И. Управление производством, хранением и поставками товаров на основе прогнозирующей модели выхода системы // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2009. № 2(7). C. 24-30.
6. Friedland B. Treatment of bias in recursive filtering // IEEE Trans. Automat. Contr. 1969. V. AC-14. P. 359-367.
7. Astrom K., Eykhoff P. System identification. A survey // Automatica. 1971. V.7. P.123-162.
8. Hou M., Patton R. Optimal filtering for systems with unknown inputs // IEEE Trans. on Automat. Contr. 1998. V. AC-43. P. 445-449.
9. Darouach M., ZasadzinskiM.,Xu S. J. Full-order observers for linear systems with unknown inputs // IEEE Trans. Automat. Contr. 1999. V. AC-39. P. 606.
10. Hsieh C.-S. Robust two-stage Kalman filters for systems with unknown inputs // IEEE Trans. Automat. Contr. 2000. V. AC-45. - P. 2374-2378.
11. Janczak D., Grishin Y. State estimation of linear dynamic system with unknown input and uncertain observation using dynamic programming // Control and Cibernetics. 2006. V. 35(4). P. 851-862.
12. Gillijns S., Moor B. Unbiased minimum-variance input and state estimation for linear discrete-time systems // Automatica. 2007. V. 43. P. 111-116.
13. Hsieh C.-S. Extension of the optimal unbiased minimum-variance filter for systems with unknown inputs // Proc. 15th IEEE International Workshop on Nonlinear Dynamics of Electronic Systems. Tokushima. Japan. 2007. P. 217-220.
14. Hsieh C.-S. Robust parameterized minimum variance filtering for uncertain systems with unknown inputs // Proc. American Control Conference. New York, 2007. P. 5118-5123.
15. Hsieh C.-S. A unified solution to unbiased minimum-variance estimation for systems with unknown inputs // Proc. 17th World Congress The International Federation of Automatic Control. Seoul. Korea. July 6-11, 2008. P. 14502-14509.
16. Brammer K. and Siffling G. Kalman-Bucy Filters. Norwood, MA: Artech House, Inc., 1989. 391 p.
17. Athans M. The matrix minimum principle // Information and Control. 1968. V. 11. №з. 5/6. P. 592-606.
Приступа Марина Юрьевна
Смагин Валерий Иванович
Томский государственный университет
E-mail: [email protected], [email protected] Поступила в редакцию 26 октября 2011 г.
Pristupa Marina Yu., Smagin Valery I. (Tomsk State University). Model Predictive Control discrete systems with unknown input and its application to control problem of economic object.
Keywords: discrete systems, model predictive control, estimations unknown input, production model.
The problem considered in the paper deals with synthesis of Model Predictive Control that is applied to the discrete system containing unknown input. The control is carried out on the base of the system output tracking. The prediction is derived on the base of state estimation obtained by Kalman filter (extrapolator) and unknown input estimations. Two methods are considered to be used for evaluating the unknown input estimations. The first is based on the applying Kalman filter, the second - on the modified least-squares method. It is discussed that the choice of the method depends on the available a priori statistical information concerning unknown input signals.
The model investigated in the paper contains states, known and unknown inputs and disturbances acting on the system. It is assumed also that the system is operating under the state and input constraints. The aim of the system control is to synthesize control inputs based on observations providing the system output to be close to the reference.
The simulation results of the proposed methods are given for an example of the goods production, storage and delivery to consumers’ problem.