Алгоритм адаптивного управления многомерным динамическим стохастическим объектом на основе многошагового настраиваемого упредителя

Запорожец Олег Васильевич; Полянская Жанна Николаевна

УДК 681.513

АЛГОРИТМ АДАПТИВНОГО УПРАВЛЕНИЯ МНОГОМЕРНЫМ ДИНАМИЧЕСКИМ СТОХАСТИЧЕСКИМ ОБЪЕКТОМ НА ОСНОВЕ МНОГОШАГОВОГО НАСТРАИВАЕМОГО УПРЕДИТЕЛЯ

О. В. Запорожец, Ж. Н. Полянская

В статье рассматривается задача адаптивного управления многомерным стохастическим объектом, описываемым уравнением авторегрессии - скользящего среднего. Предлагается алгоритм адаптивного управления на основе настраиваемого многошагового упредителя, являющийся обобщением ряда известных законов управления.

В статт1 розглядаеться задача адаптивного керування бага-товимгрним стохастичним об'ектом, що описуеться ргвнянням авторегресп - ковзного середнього. Пропонуеться алгоритм адаптивного керування на основ1 настроюваного багатокро-кового випереджувача, який е узагальненням ряду вгдомих закотв керування.

Adaptive control problem for multidimensional ARMAX object is presented. Proposed adaptive control algorithm is based on tuned multistep predictor and can be considered as a generalisation of several known algorithm.

В статье рассматривается задача адаптивного управления при наличии ограничений объектом, описываемым многомерным уравнением авторегрессии - скользящего среднего с управляемыми и неуправляемыми наблюдаемыми входами и возмущениями типа нормального стационарного случайного процесса с дробно-рациональной спектральной плотностью и временными запаздываниями во входных каналах.

Итак, пусть объект управления описан разностным уравнением

A( z— 1) y (t )=zdB (z— 1) u (t)+C (z~1 )w (t)+ z~pD (z— 1) z( t) + EIs ,(1)

где y( t) , u (t) , w (t) , z( t)-( s x 1) , (r x 1), (s x 1) , (g x 1) -векторы выходов, управлений, неизмеряемых и измеряе-

1 1 1

мых возмущений соответственно, A(z ) , B(z ), C(z ) ,

1

D (z ) - (s x s), (s x r),( s x s),( s x g )-X - матрицы степени Па, nв, nс, nd соответственно, E = diag( e^ в2,—в )-(s x s) - матрица, задающая уровень выходного сигнала при ну-

левых входах, Is - вектор, состоящий из единиц, z

1

С(2 1) = I + С1) , ((С)(0) = I), аеС(2 1) - гурвпцев полином,

Ь (1) = Б0 + Ь (1 ) ,

I - единичная матрица,

М{м>(г)} = 0, М{w(г)м>Т(г)} = < ~ ,

М{^} - оператор математического ожидания.

Задачу управления объектом (1) будем решать на основе квазипрямого подхода к синтезу адаптивных систем [1-6], для чего исходное описание необходимо привести к форме упредителя. Поскольку управляющая переменная запаздывает по отношению к выходной, как минимум, на а тактов, при вычислении управлений необходимо иметь а -шаговый прогноз у(г + =М{у(г + <)}. Запишем критерий прогнозирования

Jp = M{\]y (t + d) -y (t + d\t)f} .

(2)

Используя теорему о делении X - матриц [7], запи-

1 1

шем соотношение между А (2 ) и С( 2 ) вида С = АЕ + ,

т-/ ~1\ т , т- -1 , , т- + 1

где Е(2 ) = I + Е^ +... +Еа_ .2 ,

G (z 1) = G0+G1 z 1+...+ Gn z

01 nA - 1

nA + 1

оператор сдвига назад, d и p - времена чистого запаздывания по соответствующим каналам.

Относительно объекта (1) принимаются следующие допущения:

A(z— 1) = I + A(z~1) , (A(0) = I) ,

1 „ 1 B(z ) = Bo + B(z ) , rankBo = min{s, r} ,

Существуют X - матрицы Е', G' , С' (не обязательно единственные) такие, что

Е'О = ОЕ, V(0) = I, аегЕ' = аегЕ , СТ = ЕС, С(0) = I, аегС' = аегС ,

С = ЕА + ¿'^О .

Очевидны следующие преобразования: Е'Ау( г) = Е'Ви( г -а) + г) + ЕЬ2( г-р) + ЕЕ^ ,

()у(г)=Е'Ви(г-а) + Е^(г) + Е'Ь2{г-р) + Е'Е^, Су (г) - С Еw( г) = О у (г - а)+ Е'Ви( г -а) + ЕЬ2( г-р) + ЕЕ^,

С'у(г) - С Еw(г) - Су(г\г~а) = Оу(г-а) + Е'Ви(г-а) + + Е'Ь2(г-р) + Е'ЕI-у(Цг~а) - Су(- а), после чего несложно записать выражение для оптималь-

124

"Радюелектронжа, шформатика, управлшня" № 1, 1999

О. В. Запорожец, Ж. Н. Полянская: АЛГОРИТМ АДАПТИВНОГО УПРАВЛЕНИЯ МНОГОМЕРНЫМ ДИНАМИЧЕСКИМ СТОХАСТИЧЕСКИМ ОБЪЕКТОМ НА ОСНОВЕ МНОГОШАГОВОГО НАСТРАИВАЕМОГО УПРЕДИТЕЛЯ

ного упредителя

y (t\t - d) = G'y (t - d) +F'Bu( t - d) + F'Dz( t - p)+ +F'EIS- C'y(t\t- d). Введем вектор

T T T

ф(t) = (y (t- d),...y (t- d- nA + 1), u (t- d),...

TT ..., u (t - 2d - Пв + 1), z (t - p), ...

TT ..., z (t-p - nD + 1), 1, -y (t- 1 |t- d- 1),...

(3)

D

'CpC

и snA + r(d + Пв) + g(d + nD) + 1 + snc )s x s - матрицу

TT ..., -y (t - nAt - Пс - d))

X (t) = I ® ^t) --

'ф(г) 0 0 . о ф(о о . о о ф(о .

о о

о

о о о

ф(Т)

где ® - символ тензорного произведения. Тогда оптимальный d - шаговый упредитель можно записать в виде псевдолинейной регрессии

У (^ - d) = ХТ( 00 ,

где 0 - (По х 1) = 0«а + г^ + пв) + g(d + пи) + 1 + тс)я х 1

- вектор параметров, подлежащих определению.

Расширим задачу и преобразуем описание объекта управления к форме d-шагового упредителя, полагая при этом, что качество прогнозирования оценивается при помощи квадратичного критерия вида

Jp = m\\p (z 1 )(y (t + d) - y (t + d\t)\

-1 PN(z )

P (z 1) = Jl-

PD(z ) p0 + p\

t-L N -1 , N -2 1 + p1 z + p2 z +

D , D -1 , D -2

p2

и цепочку очевидных преобразований

ГАРНУ(о = ^Рмви(г - С1) + о +

+ г -р) + Р'РмВ1я,

Р'АРвх(г) = Р'РмВы(г - d) + г) +

+ Г.РКБ2(г -р) + ГР^Е13,

(РНС' - )х(г) = Г'РыВм(г - d) + Г'РнСм>(г) +

+ г -р) + ГР^Е13,

РмС'х(г) - F'PNCw(г) = Г'РмВи(г - d) + + г -р) + + О'х(г - d),

С'Р(г) - СТР^(г) = Г'Р^и(г - d) + + г -р) + ГР^13 + О'х(г - d),

С'х(г) - г) = Г'Ви(г - d) + Г'Б2(г -р) + + ГЕ13 + РN О'х( г - d).

Тогда уравнение объекта с отфильтрованным выходом можно записать в виде

х(г) = (С')-1 Г'Ви(г - d) + (С')-1 Г'Б2(г -р) + (С')-1 Г'Е1 +

+ (PNC) G'x (t - d) + Fw( t)

(5)

(4)

где Р(z ) передаточная функция обобщенного линейного фильтра

x(t) = F'Bu( t - d) + F'Dz(t -p) + F'EIs + PN G'x(t - d) -

- Cx (t) + CFw( t) . Продолжая выкладки

C'x(t) - x(t|t - d) -Fw(t)) = F'Bu(t - d) + F'Dz(t -p) +

+F'EIs + P~N G'x( t - d) - x(t| t - d) - C'x(t| t - d) ,

получаем выражение для оптимального упредителя -1

x(t\t - d) = PN G'x(t - d) + F'Bu(t - d) + F'Dz(t -p) +

Pn (z ), Pd (z ) - некоторые заданные устойчивые полиномы.

Введем в рассмотрение отфильтрованный выход -1

объекта x (t) = P( z )y (t) и найдем его прогноз

x (t\t - d) =M{ x (t)}. По аналогии с предыдущим запишем матричные соотношения

PNC = AFPD + g dG , F'G = G'F , F'(0) = I, detF' = detF, C'F = F'C , C(0) = I, detC = detC ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

PNC = F'APd + z G'

+F'EIs - C'x(t|t - d) .

Вводя вектор

~ T „T

ф(t) = (x (t- d),..., x (t- d - nA + 1),

TT u (t- d), ... u (t- nB - 2d + 1),

TT z (t-p), ..., z (t-p - nD - d + 1), 1,

" T „ T T

-(x t - 1 It - d - 1),..., -x (t - nAt - nC - d))

(6)

и матрицу

X(t) = I ®ф(t) ,

-1 -1

где x(t) = Pn x(t) = Pd y(t) , запишем упредитель в

форме псевдолинейной регрессии

TT xT(t|t- d) = XT(t)6 .

Для оценивания параметров предложенных упредите-лей можно воспользоваться различными рекуррентными процедурами, которые можно представить в обобщенной форме

или

0(t) = 0(t- 1 ) + (I® r(t))X(t)(x(t)-i(t)) = = 0 ( t- 1) +1 ®( r(t) ф( t))(x ( t)-x ( t)),

(7)

ксимации -r(t)=

квадратов -r(t)=

£ ф (0ф(i) Vi = 1

\M( z 1 ) u ( t)|| Q2

где 9-(П0Х 1 ) - вектор оценок параметров настраивает "

емого упредителя x(t) = X (t)0(t- 1 ) на t-й итерации уточнения, r(t) - коэффициент усиления, который определяется конкретным алгоритмом идентификации. Так, например, широко распространенному алгоритму Кач-

-2

мажа соответствует r(t)=|| ф( t)|| , стохастической аппро-

т,

методу наименьших

=Mj| x*( t + d ) -X ( t + d\t)- w ( t + d )|| Q+|\u ( t) + M( z 1 ) u ( t)|| g2j

, (9)

где x(t + d|t) прогноз, полученный с помощью d-

шагового оптимального упредителя с отфильтрованным

1

выходом, w(t + d) = F(z )w(t + d) .

Для синтеза закона управления упредитель, представленный в форме псевдолинейной регрессии

x(t + d\t) = XT(t + d)0 , (10)

удобнее записать в несколько иной форме. Для этого запишем вектор ф(t + d) в виде т ■ т т

ф( t + d) = u ( t) ■ u ( t- 1), ..., u ( t-Hß-d-Hp + 1 ),

£ ф(г)ф (г) и т.д. V; = 1

Задачу синтеза квазипрямого адаптивного алгоритма управления рассмотрим с позиций стохастического программирования, когда требуется минимизировать функцию

^ = м{|| Я (z~1 )У*( г + d)- Р (z"1 ^^ (г + d 2д1 +

т т т

z ( t-p + d),..., z ( t-p + nD + 1 -np), 1, y ( t),...,

T ~T

y (t-n^-d-Hp), -x (t- 1 + d\t- 1 ),...,

-xT(t-Hç-Hp + d\t-nQ-Hp))T = (uT(t), yT(t))T,

после чего (10) можно представить в виде

X(t + d|t) = L0u(t) + L1^(t) = Ly(t + d) ,

(11)

(8)

Здесь у*(г + d) - некоторая желаемая 8-мерная траек-

1 1

тория движения объекта, Я(z ), Р(z ) - передаточные

-1 -1 -2 - -1 функции фильтров, Ы(2 ) = I+МlZ +M2z +... = I + М^ )

- устойчивая X -матрица, Ql и ^ -(5 х я) и (г х г) - неотрицательно определенные симметрические весовые

1

матрицы. Передаточные функции фильтров Я (z ) , 1 1

Р(z ) , М(z ) определяют характер переходных процессов в системе, влияют на расположение нулей и полюсов замкнутой системы, вводят астатизм по управлению и т.д., матрицы Ql и Q2 ограничивают амплиту-

1

ды ошибок и управлений. Параметры критерия Я(2 ),

1 1

Р(z ) , М(z ) , Ql , Q2 могут задаваться либо априорно, либо на более высоком уровне координации адаптивной системы управления.

Вводя отфильтрованные переменные

х*( г + d) = Я (z-1 )у(г + d),

х (г + d) = Р( z-1 )у (г + d) , критерий (8) можно переписать в виде

С I 2 У ~ -1 II2

Jt = М{\х*(г + d)-х(г + d)||Q + \\и(г)М(z )и(г)|Q2

-1 -1

где Lq, Lp L- (s x r),(s x(nq -sr)s ), (s x n^s ) - матрицы

параметров оптимального упредителя, подлежащие определению. Соотношение между формами упредителей (10) и (11) задается выражением

T T

X (t + d)Q = (I ®ф(t + d)) 6 = L^(t + d) ,

а расположение элементов в матрице L может быть найдено с помощью следующей процедуры: пусть номера элементов вектора 6 пробегают все значения i = 1,2,..., nQ, а индексы элементов матрицы

Ь-] = 1, ..., я ; I = 1, ..., Поя . Всегда найдется пара к

1

к' (к = 0, 1, ..., я- 1;к = 1, ..., Поя ) такая, что 1

г = кпоя + к'. Тогда 1-му элементу вектора 0

По По По

к— < г = к— + к' <(к + 1) — я я я

соответствует ]1 -элемент матрицы Ь : ] = к + 1 , I = к'. Несложно видеть, что первые г столбцов матрицы Ь образуют матрицу Ьо .

Поскольку в процессе идентификации проще восстанавливать вектор 0 , а управление удобнее рассчитывать с помощью Ь , подобный пересчет является необходимым этапом. Тогда критерий (9) можно записать в виде

= м|||х*(г + d)-Ь0и(г)-Ь1 г)-й(г + d)||Q+

||u ( t )M( z 1 ) u( t)|| Q

(12)

а поскольку w(t + d) не коррелирует с u(t) , x*(t + d), "Радюелектронжа, шформатика, управлшня" № 1, 1999

А. А. Малафеева: КОНЦЕПТУАЛЬНОЕ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССОВ УПРАВЛЕНИЯ В СЛОЖНЫХ СИСТЕМАХ

t) (12) можно преобразовать к виду

Jt = ||x*( t + d) -L0 u( t)- L1 t) + IL

k. 1

u ( t ) M( z

1 ) u ( t )||

2

ß2 +

+Mj||w(t + d)||Q j- = (x*(t + d) Q1 x*(t + d) -2x*(t + d)

T T

x Q1L1 y(t) + V (t)L1 Q1L1 y(t))

-(M(z )u(t)) Q2M(z )u(t) + Mj||W(t + d)\\Q1

согласно выражению:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

u ( t) = (L о ( t ) Q1L o( t) + Q2J x

x|L T0( t) Q1x*( t + d)-L T0( t)Q1 L1 t) - Q2M( Z1 ) u ( t)). (15)

Таким образом, получен закон квазипрямого локально-оптимального адаптивного управления объектом (1) на основе многошагового настраиваемого упредителя, являющийся обобщением ряда известных алгоритмов таких, как регулятор Койво, Кларка-Гофтропа, Остре-ма, Гудвина-Рэмеджа-Кейнеса, Бориссона и др.

-2(x*(t + d)TQ1L0 - vT(t)LT°Q1L0 -- (M(z-1 )u(t) )TQ2 )u(t) + uT( t)(LT^Q1 L0 + Q2)u( t) ,

определить

(13) минимум

после чего несложно квадратичной формы (13)

и*(г) = (4е^0 + Q2Г1 (ЬТ^1Ь1 х*(Х + а) -

т - -1

-Ь0е1 Ь1 ¥(г)-а2М(2 )и*(г)). (14)

Поскольку в рамках рассматриваемой задачи корректен принцип стохастической эквивалентности, естественно в законе управления (14) заменить истинные значения параметров их оценками, полученными в процессе идентификации, и вычислить управляющие воздействия

ПЕРЕЧЕНЬ ССЫЛОК

1. Astrom K.-J. Theory and application of adaptive control: a survey / / Automatica. - 1983. - 19. - N 5. - P. 471-486.

2. Narendra K.S., Annaswamy A.M. Recent trends in adaptive control theory // J. Soc. Instrum. and Contr. Eng. - 1984. - 23. - N 5. - P. 441-448.

3. Kumar P.R. A survey of some results in stochastic adaptive control // SIAMJ. Contr. and Optim. - 1985. - 23. - N 3. - P. 441-448.

4. Wittenmark B. Stochastic adaptive control methods: a survey // Int. J. Contr. - 1975. - 21. - N 5. - P. 705-730.

5. Martin-Sanchez J.M. Adaptive control for time-variant processes // Int. J. Contr. - 1986. - 44. - N 2. - P. 315-329.

6. Bayomi M.M., Wong K.J., El-Bagouri M.A. A self-tuning regulator for multivariable systems // Automatica. - 1981. - 17. - N 4. - P. 575592.

7. Ланкастер П. Теория матриц. - М.: Наука, 1978. - 280 с.

Надшшла 18.01.99

УДК 681.5.015

КОНЦЕПТУАЛЬНОЕ И МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССОВ

УПРАВЛЕНИЯ В СЛОЖНЫХ СИСТЕМАХ

А. А. Малафеева

Предлагается концепция моделирования сложных систем, основанная на использовании аппарата дифференциальной геометрии, алгебр и групп Ли. Такой подход дает возможность исследовать динамику неинтегрируемых систем на основе аналитического расчета траекторий эталонной системы и определения количественной оценки отклонения траекторий реальной системы от траекторий эталонной системы в любой точке фазового пространства.

The concept of modeling of complex systems based on use of the device of differential geometry, algebras and groups of Lie is offered. Such approach enables to investigate dynamics of non-integration systems on the basis of analytical account of trajectories of reference system and definition of a quantitative estimation of a deviation of trajectories of real system from trajectories of reference system in any point of phase space.

Идея Н.Винера о единстве законов управления в живых организмах и машинах, положенная в основу кибернетики, сыграла важную роль в развитии технических систем. Однако попытки использования этой логики для управления в системах другой природы не увенчались такими же успехами [1, 2]. Причина этого

заключается в некорректности рассмотрения живых систем как замкнутых, что было доказано Л.фон Берталанфи [З].

Сложные системы, главным образом, живые, демонстрируют на разных уровнях организации множество принципов и алгоритмов управления, основная часть которых не только не используется в техногенных системах, но и вообще не изучена. В технике автоматического регулирования доминируют только два принципа управления: по отклонению и по возмущению. Гомеостатическое, координирующее и др. принципы управления являются объектами интенсивного изучения с целью применения в различных областях техники, медицины, экономики и др., но эффективного практического использования в настоящее время не нашли. Непосредственное применение классического принципа обратной связи в сложных системах во многих случаях не только не приводит к желаемым результатам, но и часто служит причиной ошибок [4].

Аннотация научной статьи по математике, автор научной работы — Запорожец Олег Васильевич, Полянская Жанна Николаевна

Похожие темы научных работ по математике , автор научной работы — Запорожец Олег Васильевич, Полянская Жанна Николаевна