УДК 681.3
СИНТЕЗ АЛГОРИТМОВ КРИТИЧЕСКОГО УПРАВЛЕНИЯ С УЧЕТОМ ВЛИЯНИЯ ОКРУЖАЮЩЕЙ СРЕДЫ
ТИМОФЕЕВ В.А.__________________________
Рассматривается задача построения модели управления при отсутствии информации о статистических свойствах объекта. Исследуются пространства входных сигналов, используемых при синтезе критических систем управления. Предлагается структура закона управления для ARMAX- объекта в пространствах
L(m, 5) и D(m, 5).
Введение
Эффективность решения задачи синтеза системы управления реальным объектом в значительной степени зависит от того, насколько полной является информация об исследуемом объекте и об условиях его функционирования. Наличие такой информации существенно упрощает задачу, а ее отсутствие требует применения специальных методов, в частности адаптивных, позволяющих получать некоторые законы управления, корректируемые по мере поступления новых сведений об объекте и окружающей среде. Однако и такие методы требуют определенной информации, например, знания вида закона распределения сигналов и помех и т.д. [1,2]. Если же принятое предположение о виде закона распределения оказывается неверным, то синтезированный закон управления будет далеко не оптимальным.
В этих условиях достаточно эффективными являются алгоритмы критического управления, обеспечивающего поддержание некоторых характеристик объекта управления V (например, выходного сигнала объекта, ошибки управления и т.д.) внутри априорно задаваемых границ независимо от характера возмущений [3 ]:
|V(t,w) < E,| Vt є R , (1)
где t — непрерывное или дискретное время; w -внешние сигналы, отражающие влияние окружающей среды; e — заданная пороговая величина.
В общем случае задача поддержания выходных сигналов объекта управления в заданных границах возникла достаточно давно и для ее решения был развит целый ряд подходов. Так, в [4] был предложен статистический подход , максимизирующий вероятность того, что выходы объекта не выйдут за определенные границы при произвольных случайных входах. Известен метод, основанный на теоретико-множественном подходе [5], использующий концепцию “целевой трубы”, внутри которой должны оставаться фазовые переменные объекта, находящегося под воздействием неизвестных, но
ограничительных возмущений. Эффективный вычислительный алгоритм, реализующий данный подход, был предложен в [6], а в [7] решение задачи было распространено на нелинейные многомерные объекты. Однако основным недостатком указанных выше алгоритмов является сложность их практической реализации.
При рассмотрении критических систем достаточно популярным оказалось представление системы управления Sd(P,C) так, как это показано на рисунке.
Замкнутая система Sd (Р, С)
Здесь введены следующие обозначения: r — внешний задающий сигнал; w — возмущение; u — управляющий сигнал; у — выход объекта управления; Р :(u, w) ^ у — описание объекта; С : (r, у) ^ u — описание закона управления. В дальнейшем внешние входы w и r будем обозначать одним символом w , а выходные сигналы у и ошибку e = r - у будем рассматривать как обобщенный выход системы 9 .
Для синтеза системы критического управления требуется предварительное построение как моделей собственно объекта управления, так и окружающей среды. И если модель объекта может быть описана в терминах “вход — выход”, то влияние окружающей среды может быть учтено с помощью специального описания сигналов, действующих на объект.
Выбор того или иного способа описания внешних сигналов является определяющим при выборе конкретного метода синтеза закона управления. В настоящее время широко применяются пространства L(m, 5) и L(N, mg, 5 g), позволяющие учитывать ограничения на амплитуды входных сигналов, а также D(m, 5) и D(N, mg, 5g), вводящие ограничения на производные этих же сигналов. Здесь N говорит о том, что сигнал w представляет собой сумму N сигналов [4, 5].
Постановка задачи
Несмотря на довольно значительное число публикаций по этой теме, конкретных результатов получено мало. Целью настоящего исследования и является получение практически реализуемых алгоритмов управления линейным динамическим объектом в указанных пространствах.
Пусть управляемый объект р описывается ARMAX-моделью
Ау(к) = q dBu(k) + Cw(k) , (2)
48
РИ, 2004, № 1
где A, B и C — полиномы, имеющие соответственно вид
A = 1 + a^q 1 +... + bnq n,
B = b0 + b1q 1 + ..+bmq m ,
„ , -1 -l
C = 1 + C1q +... + Ciq ,
a y(k), u(k), w(k) — выходной, входной и возмущающий сигналы соответственно в дискретный момент времени k ; d > 1 — время чистого запаздывания в канале управления; q-1 — оператор сдвига назад; n, m и l — порядки полиномов A, B и C соответственно.
Необходимо получить законы управления при условии, что используются различные пространства входных сигналов.
Пространства входных сигналов
Пространство входных сигналов L(m, 5) образуется временной последовательностью w(k) такой, что w(k) = 0 при k < 0 , а для k > 0 и m є [1, да] и
5 є (0, да)
|| w ||m — 8 . (3)
При m = да получаем пространство L(«, 5), содержащее элементы w , произвольно имеющиеся в
любой момент времени t є N+ в рамках жёстких ограничений || ю || S .
Так, сигнал 5. sint • cost является элементом L(«, 5). Входные сигналы, рассматриваемые в задаче l1 — оптимизации, также принадлежат L(«, 5) [6, 7]. Реальные стохастические возмущения, действующие на систему, зачастую могут рассматриваться как элементы L(«, 5), являющиеся таким образом пространством ограниченных входных сигналов.
Заметим также, что в частном случае при m = 2 пространство входов L(2,5) описывает сигналы с ограниченной энергетикой, встречающиеся наиболее часто в задачах Hш — оптимизации [8, 9]. В случае, если m є [1, да), а некоторая переменная є є (0, да), рассматриваемое пространство является подпространством L(m + є, 5), т.е. L(m, 5) с L(m + є, 5). Несложно видеть, что для всех w є L(m, 8) в случае g = w || w ||4 задует
|| w||m =||w|g II ,
при этом
Ig^ < 1,i є N+, ||g||n - 1,n є [1, ”).
Поскольку єє (0, да) и m є [1, да) , то
1
w = w g = w
II llm+є 11 Ида II6 llm+є 11 Ида
1
да I im+є \ m+є
АЫ ' *
i=0
ю \ im \ m+є ,, 11 fro, im ^ m
*1N4 A gi I * HI*|A gi I
i=01
4=01
= w g II ll^P’llm
Следовательно, |НІт+Є ^ 8, откуда следует, что для m є [1, да) и є є (1, да), L(m, 5) с L(m + є, 5). Чтобы проверить это неравенство, выберем некоторую * -1/(m+eC
последовательность ®i = 2 ° для i = 0,1 и
* *
Юі = 0 в остальных случаях. Тогда w g L(m, 8), но
*
w є L(m + є, 8).
Кроме того, для m є [1, да) можно записать L(m, 5) с L(«, 5). Данное свойство следует из определения L(m, 5), а кроме того, можно показать, что
L(1,8) с L(2,8) с ... с L(o>, 8).
Обобщением данного пространства является комплексное пространство
L(N,m0,8 0) =
= { Z w(j) : w(j) є L(m0j, 80j), при j = 1,2,..., N}.
j=1
При синтезе цифровых систем управления более эффектным представляется использование дискретных пространств D(m, 5) и D(N, m0, S0), позволяющих учитывать не только амплитуды входных сигналов, но и их вариации.
В общем случае входное пространство D(m, 8) образуется множеством возможных последовательностей таких, что
k+m sup{ Z i=k
|ro(k)| < да для k є N,
Ага (i) :k є N} <5;
(4)
где S є (0, да), m є N+, а Дю представляет собой изменение (обычно первую разность) входного сигнала Aro(k) = ro(k) - ro(k -1) .
Из (4) следует, что пространство D(m, 5) вводит ограничения на скорость изменения входных сигналов. Для частного случая m = 0 пространство D (0,5) включает все последовательности с ограниченной первой разностью:
sup|Ara(k)| : k є N ^8
РИ, 2004, № 1
49
и в теории управления обычно называется устойчивым входным пространством. Противоположностью D(0,5) является пространство D(ro, 5), именуемое переходным и определяемое выражением
lim Дю(к) = 0
к^-да
В общем случае пространство D(m, 5) описывает как устойчивые, так и переходные режимы, при этом если 0 < m < да и 0 < r < m , то
5
D(m - r,---) с D(m, 5).
r +1
Несложно видеть, что при 0 < r < m справедливо неравенство
k+m, , к+m-r. .
.Z |Лю(і)| < І |Дю(і)| + i—к i—к
к+m-r. . к+m-r. .. (5)
+ ^ |Дю(і +1) +... + ^ |Дю(і + r)|
і=к і=к
Тогда для всех гає D(m - r, 5(r +1) 1) имеем к+m-r, . 5
S Дю(і) <-------, Vk є N. (6)
і=к r +1
После этого, подставляя (6) в (5), получаем
t+m , 5
Д ІДю(і) < (r +1)--= 5, Vt є N,
і=к r +1
что означает, что все гає (m - r, 5(r +1) 1) принад-
5
лежат D(m, 5), т.е. D(m - r,-) c D(m, 5).
r +1
Данные рассуждения приводят к следующим выводам: D(m, 5) с D(m -1,5) и
5
D(m -1, —) с D(m, 5) с D(m -1,5)
2
показывающим, насколько больше D(m -1,5) по сравнению с D(m, 5).
Обобщением этого пространства является комплексное пространство D(N, m0,5 0), образованное множеством последовательностей
N
Ю = Z ro(j), (7)
J=1
удовлетворяющих условию
(ю(1),ro5 (2) *,...ro(N)) є D(m01,S01)x
x D(m02,802) x ".x D(m0N’80N) •
Структуры закона управления
Рассмотрим введенную выше дискретную систему Sd (P, C) и дискретное пространство входов E • Положим ю = (r, ю) и запишем соотношение
v(ro, с) : к ^ у(к, ю, c), к є N ,
определяющее зависимость между выходом системы, внешними входами та и структурой закона управления C •
Тогда эффективность функционирования такой системы в общем случае определяется критерием
Jp (c) = sup{|v(k, та, c)|: к є N, та є E}
или, в первом приближении, максимальным абсолютным значением обобщенного выхода v при всех возможных входах та є E на временном интервале с є N •
В критических системах управления главной целью является поддержание достаточно малого уровня выходного сигнала на всём интервале управления, что может быть выражено в форме неравенства
JE(c) - єd ,
где є d — положительная величина, определяющая максимально возможное значение Jp (c).
Вместе с тем, как уже отмечалось выше, реальная задача управления описывается множеством критериев, заданных в форме системы неравенств.
Рассмотрим далее систему критического закона управления в пространстве входов L(mi, 5і ), обеспечивающего устойчивое поддержание системы неравенств J^(c, m^ < єі,і = 0,1,2,...,M, где число M задает количество всех ограничений, которые должны поддерживаться в процессе ее функционирования.
Заметим также, что в задаче с одним критерием Jl (c, да) < Є1 и входами, принадлежащими Ь(да,1), проблема синтеза сводится к минимизации
Є1 = min{Jp(c, да)} c
и эквивалентна задаче l1 — оптимизации.
Положим также, что полиномы A и q_dB, входящие в (2), являются взаимно простыми. Тогда справедливы следующие равенства:
AF + q dE = C , (8)
AQ + q_dBP = C ,
где полиномы F є R(q, d -1) с 60 = 1,
E є R(q, n -1), Q є R(q, d + m -1) с q0 = 1,P є R(q,n -1) единственны.
Используя параметризацию, можно записать структуру закона управления C :^ y ^ n в виде
C = (P + RA)(Q - Rq_dB)_1,R є A1, (9)
где P и Q определяются уравнением (8).
Используя (2) и (9), можно определить соотношение между выходным сигналом у и внешним возмущающим сигналом w в форме
у(к) = (Q - Rq_%ю(к), (10)
50
РИ, 2004, № 1
а также дать оценку значению критерия оптимизации
JL(C,m) =||Q - Rq'dB|iAn 8 , (11)
где n 1 + m 1 = 1.
Оценка (11) может быть получена из следующих соображений. Введем полином H = Q - Rq_ dB и запишем очевидное выражение, следующее из (10):
k
y(k) =Z h-ra(k - i). (12)
i=0 1 v '
С учетом того, что а є L(m, 5), а n_1 + m_1 = 1, и используя неравенство Холдера запишем
JL (C, m) <||Q - Rq“dB ||An 5 . (13)
+ *
Для каждого k є N существует ю є L(m, 5), определяемая соотношением
* [5|hi|n 1||H|A-nsign(hi),0 < i < k;
ю (k - i) =<j An
0, i є (-ro,0) v i є (k,+o>). Подставляя (14) в (12), получаем
(14)
*k y (k) = Z | hi | i=0
n ||H|A-n 5
II II An
Поскольку при k
^ <x
то
У(ю) = H A 8 ,
II II An ’
JL (C, m) >|| Q - Rq_dB || An 5
(15)
Из (13) и (15) следует справедливость (11).
В самом общем случае полином при управляющих воздействиях b может быть представлен в виде произведения B1 • B2 , где нули B1 лежат вне единичного круга, а нули B2 — внутри него. Положив R = RB1, можно ввести соотношение
Q - Rq_dB = Q - Rq_dB2 ,
после чего, используя (8) , записать
-d
Q = F + Dq
где D є R(q, m -1).
^ -dT
-d
Итак, поскольку Q - Rq B = F + (D - RB2)q ~ и
1
||Q - Rq “dB||T = (||F||A +||D - RB2 ||A )n , n An An
отметим, что задача минимизации || Q _ Rq B || a
может быть сведена к минимизации || D - RB2 ||a т.е.
An ’
_min{||Q - Rq dB||A } о min {|| D - RB 2 ||A } ReA1 An ReA1 An .
Таким образом, характеристики закона управления определяются свойствами полинома R , т.е. вместо
РИ, 2004, № 1
Jl(C,mi) законно использование JL(R,m^ . В этом случае задача синтеза закона управления может быть переформулирована следующим образом: при заданных полиномах
D є R(q,m - 1),B2 є R(q,r) и d є N+ найти полином r , обеспечивающий выполнение системы неравенств
JL(R,mi) <є^i = 0,1,...,M . (16)
Обозначим через R0 полином R є A1, обеспечивающий выполнение (16). Тогда в качестве допустимого закона управления можно использовать
C0 = (PB1 + R0A)((Q - R0q _dB2)B1)_1, (17) при этом в общем случае может существовать множество R є A1, удовлетворяющих (16).
Выводы
Рассмотрены и проанализированы пространства входных сигналов, используемые при синтезе критических систем управления. Предложена структура закона управления для ARMAX-объекта в пространствах L(m,5), L(N,m0,50), D(m,5) и
D(N, m0,5 0), достаточно просто реализуемая при решении практических задач. Получены соответствующие оценки критерия оптимизации, подтверждающие эффективность предлагаемых законов управления. В дальнейшем предполагается на основе предложенного критерия разработать ряд вычислительных процедур, реализующих в реальном времени алгоритмы для контроля и управления объектами, которые относятся к критическим системам.
Литература: 1. Изерман Р. Цифровые системы управления. М.: Мир, 1984. 544с. Ъ.ЦыпкинЯ.З. Основы информационной теории идентификации. М.: Мир, 1984. 544с. 3. Бондаренко М.Ф., Тимофеев В.А. Синтез супре-мального алгоритма управления динамическим объектом // Прикладная радиоэлектроника. 2003. № 1. 4. Liu G.P., Zakian Y. Sup regulators/ Proc. 29th IEEE Conf. on Decision and Control.-Nawaji, USA,1990. P.2145-2146. 5. Liu G.P., Disturbance space and sup regulator in discrete time // Syst. Control Letters.1992. Vol.18. N1. P.33-38. 6. Vidyasagar M. Further results of the optimal rejection of persistent bounded disturbances // IEEE Trans. on Aut. Control. 1991. Vol. 36. P.642-652. 7. Dehlen M.A., Pearson J.B. l’optimal compensators for discrete-time systems/ Proc. Amer. Control Conf. Seattle, USA, 1987. P.19641968. 8. Zames G. Feedback and optimal sensivity model reference transformations, multiplicative seminorens, and approximate inverses // IEEE Trans.on Aut. Control.-1981. Vol.26 N2. P.301-320. 9. Francis B.A. A Course in
H “ Control Theory// Lect. Notes Control and Inf. Sci. Berlin:Springer-Verlag.1987. 212p. 10. Luenberger D.G. Optimization by Vector Space Methods. N.Y.: Jihn Wiley&Sons. Inc., 1969. 412p.
Поступила в редакцию 02.12.2003
Рецензент: д-р.техн.наук, проф. Авраменко В.П.
Тимофеев Владимир Александрович, канд. техн. наук, доцент, вед. науч. сотр. кафедры ЭВМ ХНУРЭ. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 702-1354.
51