Метод “замораживания” в синтезе терминального управления многомерной системой

Дубовик Сергей Андреевич

неоднородных марковских процессов на случай полумарковских процессов.

Литература: 1. Королюк В.С. Стохастичні моделі систем. К.: Либідь, 1993. 135 с. 2. Герасин С.Н. Проблемы стабилизации распределений неоднородных марковских систем. Харьков. Изд-во ХТУРЭ, 1999. 212 с. 3. Герасин С.Н. Условия сходимости к предельному распределению в неоднородных цепях Маркова за конечное время // Вісник Харківського національного університету. 2000. №456. С.256-259. 4. Герасин С.Н, Дикаре в В.А., ЧислинН.И. Существование предельных вероятностей для конечных процессов Маркова с убываю-

УДК 62-50

МЕТОД “ЗАМОРАЖИВАНИЯ”

В СИНТЕЗЕ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ МНОГОМЕРНОЙ СИСТЕМОЙ

ДУБОВИК С.А.__________________________

Рассматривается задача приведения с векторным конечным условием для многомерного объекта при действии возмущений. Предлагается приближённый способ последовательного приведения, основанный на процедуре “замораживания” части коэффициентов регулятора, гарантирующей устойчивость и необходимую терминальную точность замкнутой системы.

Типичной для терминального управления является задача приведения в ноль вектора выхода линейной многомерной системы за конечное время. Известное её решение в форме синтеза имеет в конечный

момент tf особенности в коэффициентах обратной связи [1,2]. Это не позволяет реализовать решение для управления вплоть до tf включительно —

всегда существует интервал (tj, tf), где начинают проявляться некоторые ограничения, затрудняющие дальнейшее увеличение коэффициентов терминального регулятора. Эта проблема реализации терминального управления хорошо известна, но она не является единственной, особенно в многомерных задачах. В [1] показано, что в условиях возмущений задача приведения удовлетворительно разрешима только для идеально управляемых систем, что в обозначениях [1] эквивалентно равенству матриц при управлении и шуме: b = g . В задачах для многоканальных процессов возникают схемы различной управляемости. Так, при управлении продольным движением летательного аппарата с вертикальной тягой (ЛАВТ), совершающего посадку на палубу качающегося плавсредства, можно выделить два контура приведения — по дальности и по высоте. Вследствие качки канал высоты сильно зашумлен и не идеально управляем. В таких условиях представляется рациональной следующая схема последовательного управления. Сначала ЛАВТ приводится по дальности в заданную окрестность при одновременной стабилизации в канале высоты, а затем решается задача приведения по высоте, т.е.

щими к нулю временными промежутками перехода / / Доповіді НАН України. 1998. №7. С.15-19.

Поступила в редколлегию 11.06.2002

Рецензент: д-р техн. наук, проф. Шабанов-Кушнаренко С.Ю.

Герасин Сергей Николаевич, канд. техн. наук, доцент кафедры высшей математики ХНУРЭ. Научные интересы: теория вероятностей и ее приложения, теория процессов Маркова. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел: (0572)40-93-72 (раб.), (057)772-12-38 (дом.), e-mail: [email protected].

обеспечивается надлежащий контакт ЛАВТ с посадочной площадкой по вертикальным относительным координате и скорости. Успех применения подобной процедуры зависит от возможности перейти в канале дальности от терминального управления к стабилизации, т.е. “заморозить” управление. Эта ситуация является типичной при управлении многомерными марковскими процессами, в состав управляющих параметров которых входит момент остановки. В общей стохастической постановке такие задачи приводят к теории диффузионных процессов, далёкой от практически приемлемых решений. Предлагаемый метод “замораживания” даёт простой способ отделения задачи выбора момента остановки от процедуры синтеза управлений.

Рассмотрим на конечном промежутке [0, tf ] линейную систему для n-вектора состояния T

X = (xbx2,---,xn) :

dX/dt = AX + bU, X(0) = X0.

Здесь U - скалярное управление; A и b - матрица и вектор (соответственно) с постоянными элементами, составляющие управляемую пару. Управление будем выбирать таким образом, чтобы в момент t = tf обеспечить нулевые значения координаты xj (t) и k её производных (k < n). Переходя к каноническим переменным для состояния и управления [1,3], можно конкретизировать указанную задачу:

на движениях системы

dx/dt = Jnx + bnu, x(0) = x0, (1)

T

для вектора x = (xi,x2,---,xn) и выхода (везде далее нулями обозначены нулевые матрицы подходящих размеров)

II <4-1 'х и и y(tfX (2)

C - (ek1,ek2 >‘”ekk ,

где Jn =( 0,enben2> •” e n(n—1) )> bn =en> eni -

n - вектор, і-й элемент которого 1, а остальные -нули, е n = е nn ,

минимизировать функционал (ц > 0)

62

РИ, 2002, № 4

p^=—f + Ju2(t)dt, (3)

0

при p ^ 0.

Задача минимизации (3) при ограничениях (1), (2) и р > 0 имеет единственное решение, которое можно записать следующим образом:

u(t) = u0pt (t) = D(t)x(t), D(t) = - b^Pp,

здесь положительно определённая n x n - матрица

Рц удовлетворяет нелинейному уравнению

dPp/dt = -ppJn - jTp^+ VnbTPn,

Pp (tf) = CTC/P. (4)

Это решение можно использовать в задаче приведения (1)-(3), если устремить параметр р к нулю. При этом для любых t, tj, tj < tf, t є [0,tj], существует предел

P0(t) = KoJ(t) = HrnP, (t) (5)

и для t є [0,tj] имеем управление, решающее задачу (1)-(3):

U0(t) = -bTP0(t)x(t) = -bj^Ko1 (t)x(t). (6)

В указанном промежутке матрица K0 положительно определена, а на всём [0,tf] удовлетворяет линейному уравнению

dK0 /dt = JnK0 + K0JT -bnbT , K0(tf) = 0 . (7)

Особенность предельного терминального регулятора (ПТР) (5), (6) состоит в том, что его нестационарные коэффициенты оказываются дробно-рациональными функциями оставшегося времени

т = tf -1. В рассматриваемом случае имеем

P0(t) = W0T(t)C^CM0(t)CT )"1CW0(t), (8)

где W0(t) = {W0i,W02,-,W0n},

m

W0m(t) = 1 e„i

i-1

(tf-t)m 1 (m-i)!

m = 1,2,

M0(t) = {Mij(t)j,

,n,

Mij(t)

(tf ~t)2n 1J+1 ij = 12

(2n-i-J+1)(n-i)!(n-J)!’ ^

,n.

Применение управления (6) в окрестности момента tf затруднено неограниченным ростом коэффициентов обратной связи, т.е. наличием особенности в коэффициентах замкнутой системы [2,4]. Кроме

того, в реальных условиях момент окончания tf обычно известен лишь приближённо и в процессе управления может уточняться. Указанные и подобные им причины заставляют тем или иным образом

отклоняться от предельного решения (8) в некоторой малой окрестности конечного момента. В [4] приводятся такого рода способы устранения особенности в коэффициентах обратной связи. Некоторым обобщением их может служить метод “замораживания”, состоящий в том, что при t > t1 нестационарные коэффициенты в (6) перестают меняться во времени: если матричная функция

времени Pjx (t) на отрезке t є [0,tf ] удовлетворяет дифференциальному уравнению (4), то значение этой функции P|x1 в фиксированный момент

t1, t1 < tf, является решением алгебраического уравнения:

0 _ Vn JnP(x1 + P|x1bnbnP|x1 Q1,

где по построению Q1 = (dPp (t)/dt)t. Если это фиксированное значение P1 используется в (6) для формирования управления при t > tb то качество такого управления будет определяться свойствами матрицы Q1. А именно, если она оказывается неотрицательно-определённой и имеет квадратный корень S1 (т.е. Q1 = sT S1), составляющий наблюдаемую пару с J0, то очевидным образом гарантируется существование оптимального управления при t > t1 в смысле критерия [3]:

J (xT(t)Q1x(t) + u2(t)) dt. t1

Одновременно обеспечивается и асимптотическая устойчивость замкнутой системы. Аналогичные построения справедливы и в предельном случае

р = 0 , т.е. для матрицы P0 .

То, что указанные свойства матрицы Q1 далеко не всегда выполняются, показывает следующий пример: для случая n = 2, k = 1, т.е. системы (1) второго порядка со скалярным выходом y = x1 будем иметь:

tf -1

W01(t) = e21, W02 (t) = e21—1!— + e22,

C = (1,0), CM0(t)CT = (tf - t)3/3,

следовательно:

P0(t) = 3

1

tf -1

(1, tf - t)/(tf - tf =

= 3

( (tf -1)“3

V I------,_2

(tf -t)

-2 A

(tf - tr (tf -1)-1 у (9)

Подставляя это в правую часть уравнения (4) вместо PM (t), получаем:

Q1

' 9(tf -11)-4 6(tf -11)-3"

v 6(tf -11)-3 3(tf -11)-2,

РИ, 2002, № 4

63

Диагональные элементы этой матрицы положительны, но её детерминант

I Ql I = (tf - ti)“6 (27 - 36) = -9(tf - ЙГ6

— отрицателен, поэтому Qi не является неотрицательно-определённой. Из представления (8) следует результат, который мы приведём без доказательства.

Теорема 1. При k = n матрица Qi является неотрицательно-определённой ранга 1, причём Qi = CTCi, где cT - n - вектор, определяемый формулой

С =®o(tf - ti)Po(ti)

и составляющий наблюдаемую пару с матрицей Jn .

В соответствии с этой теоремой только в случае полного приведения гарантируется устойчивость системы с “замороженным” регулятором. Разумеется, в многомерных задачах это условие является слишком обременительным. Ситуация существенно улучшается, если перейти к сингулярно-возмущённому описанию многомерной системы, т.е. содержащему малый параметр при производных.

Выделяя в исходных уравнениях соответствующий параметр ц > 0, преобразуем их к канонической форме сингулярных возмущений [1] (волна над символом обозначает зависимость от малого параметра):

dX/dt = JnX + bnu, X(0) = x0, X = col(Z,§), (10)

~ = n

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Z є Rm

J

m

0

151 Jr/ bj

Rr,

bn =[e0rJ . E = eme°i, y(t) = CX(t) = CzZ(t),

yf = y(tf), C = (С z,0), (11)

Cz = (e kb e k2 г' e kk >0,#' x 0), k < m, m + r = n, где использованы те же обозначения, что и в (1), (2).

В соответствии с детерминированным вариантом теоремы 2 из [1] (где надо положить нулём возмущение: v = 0 ) решение задачи (10)-(12)

u(t) = ~(t) = p-iD(t)X(t) (13)

представляет собой асимптотическую композицию двух регуляторов — m -мерного ПТР и r -мерного стационарного. Это означает для любого ti = tf - Д из интервала (0, tf) существование равномерного по t, 0 < t < ti, предела

D(t) = (dz,d?) = 1™^Д), (14)

и гурвицевость (а значит, и невырожденность) матрицы A ^ = Jr + er d^, где d^ = -bT P^,

dz = dz (t) = —b° Pz(t), bZ = _EA er ; b ^ = e r ;

а Pz(t) и P§ есть (соответственно) m x m - матрица функций времени и r х r - матрица констант, удовлетворяющие уравнениям:

Pz(t) = W^(t)F“i(t)Wz(t), dWz(t)/dt = - Wz(t)Jm, Wz(tf) = С z,

dF(t)/dt = - WZ(t)bZbT Wz(t), F(tf) = 0 ,

0 = -Pj;Jr - J?Pj;+ P§b? boP^-Q? . (15)

Построим теперь терминальный регулятор, аппроксимирующий и оптимальный для задачи (10)-(12) в указанном смысле на промежутке [0, ti], а на полуинтервале (ti, tf ] воспользуемся следующей процедурой “замораживания” в обратной связи по “медленным” переменным:

dz(t) = dz = dz(ti) = _bZPz(ti). (16)

Полученную композицию из m -мерного ПТР, финального m -мерного стационарного регулятора по “медленным” компонентам и r -мерного стационарного регулятора по “быстрым” компонентам обозначим Di(t):

В уравнении (10) движения разделены на “медленные”, представленные m - вектором Z, и “быстрые” — r - вектор причём терминальные условия накладываются только на “медленные” компоненты. На входных и выходных координатах системы (10), (11) определим критерий следующего вида [1,3]:

+ р2 1 (XTQX + u2(t))dt ^ min, (12)

n 0 u

в котором матрица Q =

Qz Q*

и её m х m -

vQ* Q/M-

и r x r — блоки Qz , Q§ (соответственно) — все

T

неотрицательно-определённые, причём Q ^ = с ^ c ^ и для квадратного корня с^ выполнено условие:

а) пара (Jr, c^) - наблюдаема.

Di(t) - (diz(Н d^X diz(t)

dz(t), t < ti,

dz(tiX ti ^ t ^ tf.

Теорема 2. Пусть для задачи (10)-(12) выполнено условие а) и k = m, т.е. требуется привести в ноль все “медленные” компоненты вектора состояния. Тогда существует ц* > 0 такое, что при любом ц из интервала 0 < ц < ц* обратная связь Di(t) стабилизирует систему при t > ti.

Для доказательства следует воспользоваться линейным вариантом теоремы Климушева-Красовского [5], условия которой оказываются здесь выполненными в силу теоремы 1 и известных свойств инвариантных во времени регуляторов, оптимальных в смысле квадратического критерия [3].

Пример. Пусть первый этап некоторой многомерной задачи терминального управления состоит в приближённом приведении в ноль координаты и скорости системы (10), (11) третьего порядка с

64

РИ, 2002, № 4

двумя “медленными” компонентами Zj, Z2 и одной “быстрой” £, которая в данном случае является ускорением. Учитывая интегральные затраты на ускорение, сформируем критерий следующего вида:

Рд = f1 f 2 +Р2u2(t))dt ,

0

Z(t ) f z1(tf) I ~

где yf = Z(tf) = I I, т.е. блоки матрицы Q в

z2(tf ) )

(12) все нулевые, за исключением Q§ = 1. Условия теоремы 2 здесь выполнены. Для матрицы Dj(t) при t > tj, tj = tf - Д будем иметь:

Dj(t) = Dj = (diz(ti),d4),

здесь djz = djz(tj) = -bZ Pz(tj), d§ = -bj P = ~P.

Уравнение для P§ в (15) в данном случае тривиально: Р| -1 = 0 , откуда следует d^ = -1. Далее имеем

А Jr + er d^-~1, bz =-EA^1er = Є2 .

dWZ(t)/dt--Wz(t)J2, Wz(tf) -Cz -

10

01

откуда следует (см. также [ 1], следствие из теоремы 2), что Wz(t) = 1

F1(t) =

1z

tf -11 и

1}

-1)3/3 (tf -1)2 /2'

-1)2/2 tf -t

-t)-3 - 6(tf -1)-2N

-t)-2 4(tf -1)-1,

d1Z (t1) получим

-1

d1Z - _e2

10 Д 1

12Д"

-3

- 6Д

-2 А

- 6Д

-2

4Д"

-1

1 Д 01

= - (А, 1)

" 12Д_3 ч- 6Д- 2

6Д

-2 )

- 2Д

-1

(6 Д_2,4 Д-1)

Если теперь использовать это субоптимальное управление в (13), то для замкнутой таким образом системы будем иметь при t > t1 характеристическое уравнение P(s) = s + a2s + a1s + a0 = 0 с положительными коэффициентами:

—2 —1

a0 = 6Д / р, a1 = 4Д / р, a2 = 1/р.

Теорема 2 утверждает гурвицевость полинома P(s) при достаточно малом р < р*. В данном случае можно определить р*. Действительно, в соответствии с критерием Рауса-Гурвица для асимптотической устойчивости необходимо и достаточно выполнение неравенства для коэффициентов P(s) a1a2 > a0, что означает здесь: 1.5 р/ Д< 1, т.е. р* = Д/1.5.

Литература: 1. Дубовик С.А. Композиционный синтез терминальных регуляторов для систем с разделением движений // Радиоэлектроника и информатика. 1998. №3. С. 48-53. 2. Брайсон А., Хо Ю-ши. Прикладная теория оптимального управления. М.: Мир. 1972. 521с. 3. Смирнов Е.Я. Некоторые задачи математической теории управления. Л.: Изд-во Ленингр. ун-та, 1981. 200с. 4. Батенко А.П. Управление конечным состоянием движущихся объектов. М.: Сов. радио, 1977. 256с. 5. Климушев А.И, Красовский Н.Н. Равномерная асимптотическая устойчивость систем дифференциальных уравнений с малым параметром при производных // ПММ. 1961. Т.25, № 4. С.680-690.

Поступила в редколлегию 12.06.2002

Рецензент: д-р техн. наук Гайский В.А.

Дубовик Сергей Андреевич, канд. техн. наук, старший научный сотрудник, доцент кафедры технической кибернетики Севастопольского национального технического университета. Научные интересы: асимптотические методы в оптимальном управлении, математическое моделирование, управление движением. Адрес: Украина, 99053, Севастополь, Студгородок, Сев-НТУ, тел. 23-51-30.

УДК 007.51:51+681.51

МЕТОДИКА ІНФОРМАЦІЙНОЇ ОЦІНКИ ДОЦІЛЬНОЇ СТРУКТУРИ ОРГАНІВ УПРАВЛІННЯ ВІДКРИТИХ СИСТЕМ КЕРУВАННЯ

ОРЛОВ М.М., ЯКОБСОН є.в.

На підставі оцінки структури відкритої системи керування будь-якого призначення і розподілення потоків інформації в контурі керування розглядаються підходи щодо оцінки ступеня інформативності певної кількості параметрів, які визначають стан завдання, що досліджується органами управління в умовах обмеженого часового ресурсу. Визначається достатність складу органу управління шляхом автоматичної класифікації за показником схожості між ними.

Як відомо, будь-яка автоматизована система керування (АСК) процесами — людино-машинна система, в межах якої забезпечується автоматизований збір, оброблення і відображення інформації, необхідної для оптимізації керування цими процесами з метою найбільшої їх ефективності. Складовими частинами такої системи є: органи управління (ОУ), пункти керування, підсистема зв’язку і комплекс засобів автоматизації процесів керування. При рішенні певною організаційною структурою конкретних завдань S перед системою керування ставиться відповідна мета, яка потребує конкретних ресурсів. У цьому випадку ресурси можуть характеризуватися: часовими показниками Rt , людськими показниками R ч , матеріальними затратами R м . Кількісна оцінка необхідних ресурсів R ч впливає на визначення структури і складу ОУ і буде змінюватись залежно від характеру і складності завдань S •

РИ, 2002, № 4

65

Метод “замораживания” в синтезе терминального управления многомерной системой Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Дубовик Сергей Андреевич

Похожие темы научных работ по математике , автор научной работы — Дубовик Сергей Андреевич

The method of “freezing” in a synthesis of the multivariable terminal control

Текст научной работы на тему «Метод “замораживания” в синтезе терминального управления многомерной системой»