неоднородных марковских процессов на случай полумарковских процессов.
Литература: 1. Королюк В.С. Стохастичні моделі систем. К.: Либідь, 1993. 135 с. 2. Герасин С.Н. Проблемы стабилизации распределений неоднородных марковских систем. Харьков. Изд-во ХТУРЭ, 1999. 212 с. 3. Герасин С.Н. Условия сходимости к предельному распределению в неоднородных цепях Маркова за конечное время // Вісник Харківського національного університету. 2000. №456. С.256-259. 4. Герасин С.Н, Дикаре в В.А., ЧислинН.И. Существование предельных вероятностей для конечных процессов Маркова с убываю-
УДК 62-50
МЕТОД “ЗАМОРАЖИВАНИЯ”
В СИНТЕЗЕ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ МНОГОМЕРНОЙ СИСТЕМОЙ
ДУБОВИК С.А.__________________________
Рассматривается задача приведения с векторным конечным условием для многомерного объекта при действии возмущений. Предлагается приближённый способ последовательного приведения, основанный на процедуре “замораживания” части коэффициентов регулятора, гарантирующей устойчивость и необходимую терминальную точность замкнутой системы.
Типичной для терминального управления является задача приведения в ноль вектора выхода линейной многомерной системы за конечное время. Известное её решение в форме синтеза имеет в конечный
момент tf особенности в коэффициентах обратной связи [1,2]. Это не позволяет реализовать решение для управления вплоть до tf включительно —
всегда существует интервал (tj, tf), где начинают проявляться некоторые ограничения, затрудняющие дальнейшее увеличение коэффициентов терминального регулятора. Эта проблема реализации терминального управления хорошо известна, но она не является единственной, особенно в многомерных задачах. В [1] показано, что в условиях возмущений задача приведения удовлетворительно разрешима только для идеально управляемых систем, что в обозначениях [1] эквивалентно равенству матриц при управлении и шуме: b = g . В задачах для многоканальных процессов возникают схемы различной управляемости. Так, при управлении продольным движением летательного аппарата с вертикальной тягой (ЛАВТ), совершающего посадку на палубу качающегося плавсредства, можно выделить два контура приведения — по дальности и по высоте. Вследствие качки канал высоты сильно зашумлен и не идеально управляем. В таких условиях представляется рациональной следующая схема последовательного управления. Сначала ЛАВТ приводится по дальности в заданную окрестность при одновременной стабилизации в канале высоты, а затем решается задача приведения по высоте, т.е.
щими к нулю временными промежутками перехода / / Доповіді НАН України. 1998. №7. С.15-19.
Поступила в редколлегию 11.06.2002
Рецензент: д-р техн. наук, проф. Шабанов-Кушнаренко С.Ю.
Герасин Сергей Николаевич, канд. техн. наук, доцент кафедры высшей математики ХНУРЭ. Научные интересы: теория вероятностей и ее приложения, теория процессов Маркова. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел: (0572)40-93-72 (раб.), (057)772-12-38 (дом.), e-mail: [email protected].
обеспечивается надлежащий контакт ЛАВТ с посадочной площадкой по вертикальным относительным координате и скорости. Успех применения подобной процедуры зависит от возможности перейти в канале дальности от терминального управления к стабилизации, т.е. “заморозить” управление. Эта ситуация является типичной при управлении многомерными марковскими процессами, в состав управляющих параметров которых входит момент остановки. В общей стохастической постановке такие задачи приводят к теории диффузионных процессов, далёкой от практически приемлемых решений. Предлагаемый метод “замораживания” даёт простой способ отделения задачи выбора момента остановки от процедуры синтеза управлений.
Рассмотрим на конечном промежутке [0, tf ] линейную систему для n-вектора состояния T
X = (xbx2,---,xn) :
dX/dt = AX + bU, X(0) = X0.
Здесь U - скалярное управление; A и b - матрица и вектор (соответственно) с постоянными элементами, составляющие управляемую пару. Управление будем выбирать таким образом, чтобы в момент t = tf обеспечить нулевые значения координаты xj (t) и k её производных (k < n). Переходя к каноническим переменным для состояния и управления [1,3], можно конкретизировать указанную задачу:
на движениях системы
dx/dt = Jnx + bnu, x(0) = x0, (1)
T
для вектора x = (xi,x2,---,xn) и выхода (везде далее нулями обозначены нулевые матрицы подходящих размеров)
II <4-1 'х и и y(tfX (2)
C - (ek1,ek2 >‘”ekk ,
где Jn =( 0,enben2> •” e n(n—1) )> bn =en> eni -
n - вектор, і-й элемент которого 1, а остальные -нули, е n = е nn ,
минимизировать функционал (ц > 0)
62
РИ, 2002, № 4
p^=—f + Ju2(t)dt, (3)
0
при p ^ 0.
Задача минимизации (3) при ограничениях (1), (2) и р > 0 имеет единственное решение, которое можно записать следующим образом:
u(t) = u0pt (t) = D(t)x(t), D(t) = - b^Pp,
здесь положительно определённая n x n - матрица
Рц удовлетворяет нелинейному уравнению
dPp/dt = -ppJn - jTp^+ VnbTPn,
Pp (tf) = CTC/P. (4)
Это решение можно использовать в задаче приведения (1)-(3), если устремить параметр р к нулю. При этом для любых t, tj, tj < tf, t є [0,tj], существует предел
P0(t) = KoJ(t) = HrnP, (t) (5)
и для t є [0,tj] имеем управление, решающее задачу (1)-(3):
U0(t) = -bTP0(t)x(t) = -bj^Ko1 (t)x(t). (6)
В указанном промежутке матрица K0 положительно определена, а на всём [0,tf] удовлетворяет линейному уравнению
dK0 /dt = JnK0 + K0JT -bnbT , K0(tf) = 0 . (7)
Особенность предельного терминального регулятора (ПТР) (5), (6) состоит в том, что его нестационарные коэффициенты оказываются дробно-рациональными функциями оставшегося времени
т = tf -1. В рассматриваемом случае имеем
P0(t) = W0T(t)C^CM0(t)CT )"1CW0(t), (8)
где W0(t) = {W0i,W02,-,W0n},
m
W0m(t) = 1 e„i
i-1
(tf-t)m 1 (m-i)!
m = 1,2,
M0(t) = {Mij(t)j,
,n,
Mij(t)
(tf ~t)2n 1J+1 ij = 12
(2n-i-J+1)(n-i)!(n-J)!’ ^
,n.
Применение управления (6) в окрестности момента tf затруднено неограниченным ростом коэффициентов обратной связи, т.е. наличием особенности в коэффициентах замкнутой системы [2,4]. Кроме
того, в реальных условиях момент окончания tf обычно известен лишь приближённо и в процессе управления может уточняться. Указанные и подобные им причины заставляют тем или иным образом
отклоняться от предельного решения (8) в некоторой малой окрестности конечного момента. В [4] приводятся такого рода способы устранения особенности в коэффициентах обратной связи. Некоторым обобщением их может служить метод “замораживания”, состоящий в том, что при t > t1 нестационарные коэффициенты в (6) перестают меняться во времени: если матричная функция
времени Pjx (t) на отрезке t є [0,tf ] удовлетворяет дифференциальному уравнению (4), то значение этой функции P|x1 в фиксированный момент
t1, t1 < tf, является решением алгебраического уравнения:
0 _ Vn JnP(x1 + P|x1bnbnP|x1 Q1,
где по построению Q1 = (dPp (t)/dt)t. Если это фиксированное значение P1 используется в (6) для формирования управления при t > tb то качество такого управления будет определяться свойствами матрицы Q1. А именно, если она оказывается неотрицательно-определённой и имеет квадратный корень S1 (т.е. Q1 = sT S1), составляющий наблюдаемую пару с J0, то очевидным образом гарантируется существование оптимального управления при t > t1 в смысле критерия [3]:
J (xT(t)Q1x(t) + u2(t)) dt. t1
Одновременно обеспечивается и асимптотическая устойчивость замкнутой системы. Аналогичные построения справедливы и в предельном случае
р = 0 , т.е. для матрицы P0 .
То, что указанные свойства матрицы Q1 далеко не всегда выполняются, показывает следующий пример: для случая n = 2, k = 1, т.е. системы (1) второго порядка со скалярным выходом y = x1 будем иметь:
tf -1
W01(t) = e21, W02 (t) = e21—1!— + e22,
C = (1,0), CM0(t)CT = (tf - t)3/3,
следовательно:
P0(t) = 3
1
tf -1
(1, tf - t)/(tf - tf =
= 3
( (tf -1)“3
V I------,_2
(tf -t)
-2 A
(tf - tr (tf -1)-1 у (9)
Подставляя это в правую часть уравнения (4) вместо PM (t), получаем:
Q1
' 9(tf -11)-4 6(tf -11)-3"
v 6(tf -11)-3 3(tf -11)-2,
РИ, 2002, № 4
63
Диагональные элементы этой матрицы положительны, но её детерминант
I Ql I = (tf - ti)“6 (27 - 36) = -9(tf - ЙГ6
— отрицателен, поэтому Qi не является неотрицательно-определённой. Из представления (8) следует результат, который мы приведём без доказательства.
Теорема 1. При k = n матрица Qi является неотрицательно-определённой ранга 1, причём Qi = CTCi, где cT - n - вектор, определяемый формулой
С =®o(tf - ti)Po(ti)
и составляющий наблюдаемую пару с матрицей Jn .
В соответствии с этой теоремой только в случае полного приведения гарантируется устойчивость системы с “замороженным” регулятором. Разумеется, в многомерных задачах это условие является слишком обременительным. Ситуация существенно улучшается, если перейти к сингулярно-возмущённому описанию многомерной системы, т.е. содержащему малый параметр при производных.
Выделяя в исходных уравнениях соответствующий параметр ц > 0, преобразуем их к канонической форме сингулярных возмущений [1] (волна над символом обозначает зависимость от малого параметра):
dX/dt = JnX + bnu, X(0) = x0, X = col(Z,§), (10)
~ = n
Z є Rm
J
m
0
151 Jr/ bj
Rr,
bn =[e0rJ . E = eme°i, y(t) = CX(t) = CzZ(t),
yf = y(tf), C = (С z,0), (11)
Cz = (e kb e k2 г' e kk >0,#' x 0), k < m, m + r = n, где использованы те же обозначения, что и в (1), (2).
В соответствии с детерминированным вариантом теоремы 2 из [1] (где надо положить нулём возмущение: v = 0 ) решение задачи (10)-(12)
u(t) = ~(t) = p-iD(t)X(t) (13)
представляет собой асимптотическую композицию двух регуляторов — m -мерного ПТР и r -мерного стационарного. Это означает для любого ti = tf - Д из интервала (0, tf) существование равномерного по t, 0 < t < ti, предела
D(t) = (dz,d?) = 1™^Д), (14)
и гурвицевость (а значит, и невырожденность) матрицы A ^ = Jr + er d^, где d^ = -bT P^,
dz = dz (t) = —b° Pz(t), bZ = _EA er ; b ^ = e r ;
а Pz(t) и P§ есть (соответственно) m x m - матрица функций времени и r х r - матрица констант, удовлетворяющие уравнениям:
Pz(t) = W^(t)F“i(t)Wz(t), dWz(t)/dt = - Wz(t)Jm, Wz(tf) = С z,
dF(t)/dt = - WZ(t)bZbT Wz(t), F(tf) = 0 ,
0 = -Pj;Jr - J?Pj;+ P§b? boP^-Q? . (15)
Построим теперь терминальный регулятор, аппроксимирующий и оптимальный для задачи (10)-(12) в указанном смысле на промежутке [0, ti], а на полуинтервале (ti, tf ] воспользуемся следующей процедурой “замораживания” в обратной связи по “медленным” переменным:
dz(t) = dz = dz(ti) = _bZPz(ti). (16)
Полученную композицию из m -мерного ПТР, финального m -мерного стационарного регулятора по “медленным” компонентам и r -мерного стационарного регулятора по “быстрым” компонентам обозначим Di(t):
В уравнении (10) движения разделены на “медленные”, представленные m - вектором Z, и “быстрые” — r - вектор причём терминальные условия накладываются только на “медленные” компоненты. На входных и выходных координатах системы (10), (11) определим критерий следующего вида [1,3]:
+ р2 1 (XTQX + u2(t))dt ^ min, (12)
n 0 u
в котором матрица Q =
Qz Q*
и её m х m -
vQ* Q/M-
и r x r — блоки Qz , Q§ (соответственно) — все
T
неотрицательно-определённые, причём Q ^ = с ^ c ^ и для квадратного корня с^ выполнено условие:
а) пара (Jr, c^) - наблюдаема.
Di(t) - (diz(Н d^X diz(t)
dz(t), t < ti,
dz(tiX ti ^ t ^ tf.
Теорема 2. Пусть для задачи (10)-(12) выполнено условие а) и k = m, т.е. требуется привести в ноль все “медленные” компоненты вектора состояния. Тогда существует ц* > 0 такое, что при любом ц из интервала 0 < ц < ц* обратная связь Di(t) стабилизирует систему при t > ti.
Для доказательства следует воспользоваться линейным вариантом теоремы Климушева-Красовского [5], условия которой оказываются здесь выполненными в силу теоремы 1 и известных свойств инвариантных во времени регуляторов, оптимальных в смысле квадратического критерия [3].
Пример. Пусть первый этап некоторой многомерной задачи терминального управления состоит в приближённом приведении в ноль координаты и скорости системы (10), (11) третьего порядка с
64
РИ, 2002, № 4
двумя “медленными” компонентами Zj, Z2 и одной “быстрой” £, которая в данном случае является ускорением. Учитывая интегральные затраты на ускорение, сформируем критерий следующего вида:
Рд = f1 f 2 +Р2u2(t))dt ,
0
Z(t ) f z1(tf) I ~
где yf = Z(tf) = I I, т.е. блоки матрицы Q в
z2(tf ) )
(12) все нулевые, за исключением Q§ = 1. Условия теоремы 2 здесь выполнены. Для матрицы Dj(t) при t > tj, tj = tf - Д будем иметь:
Dj(t) = Dj = (diz(ti),d4),
здесь djz = djz(tj) = -bZ Pz(tj), d§ = -bj P = ~P.
Уравнение для P§ в (15) в данном случае тривиально: Р| -1 = 0 , откуда следует d^ = -1. Далее имеем
А Jr + er d^-~1, bz =-EA^1er = Є2 .
dWZ(t)/dt--Wz(t)J2, Wz(tf) -Cz -
10
01
откуда следует (см. также [ 1], следствие из теоремы 2), что Wz(t) = 1
F1(t) =
1z
tf -11 и
1}
-1)3/3 (tf -1)2 /2'
-1)2/2 tf -t
-t)-3 - 6(tf -1)-2N
-t)-2 4(tf -1)-1,
d1Z (t1) получим
-1
d1Z - _e2
10 Д 1
12Д"
-3
- 6Д
-2 А
- 6Д
-2
4Д"
-1
1 Д 01
= - (А, 1)
" 12Д_3 ч- 6Д- 2
6Д
-2 )
- 2Д
-1
(6 Д_2,4 Д-1)
Если теперь использовать это субоптимальное управление в (13), то для замкнутой таким образом системы будем иметь при t > t1 характеристическое уравнение P(s) = s + a2s + a1s + a0 = 0 с положительными коэффициентами:
—2 —1
a0 = 6Д / р, a1 = 4Д / р, a2 = 1/р.
Теорема 2 утверждает гурвицевость полинома P(s) при достаточно малом р < р*. В данном случае можно определить р*. Действительно, в соответствии с критерием Рауса-Гурвица для асимптотической устойчивости необходимо и достаточно выполнение неравенства для коэффициентов P(s) a1a2 > a0, что означает здесь: 1.5 р/ Д< 1, т.е. р* = Д/1.5.
Литература: 1. Дубовик С.А. Композиционный синтез терминальных регуляторов для систем с разделением движений // Радиоэлектроника и информатика. 1998. №3. С. 48-53. 2. Брайсон А., Хо Ю-ши. Прикладная теория оптимального управления. М.: Мир. 1972. 521с. 3. Смирнов Е.Я. Некоторые задачи математической теории управления. Л.: Изд-во Ленингр. ун-та, 1981. 200с. 4. Батенко А.П. Управление конечным состоянием движущихся объектов. М.: Сов. радио, 1977. 256с. 5. Климушев А.И, Красовский Н.Н. Равномерная асимптотическая устойчивость систем дифференциальных уравнений с малым параметром при производных // ПММ. 1961. Т.25, № 4. С.680-690.
Поступила в редколлегию 12.06.2002
Рецензент: д-р техн. наук Гайский В.А.
Дубовик Сергей Андреевич, канд. техн. наук, старший научный сотрудник, доцент кафедры технической кибернетики Севастопольского национального технического университета. Научные интересы: асимптотические методы в оптимальном управлении, математическое моделирование, управление движением. Адрес: Украина, 99053, Севастополь, Студгородок, Сев-НТУ, тел. 23-51-30.
УДК 007.51:51+681.51
МЕТОДИКА ІНФОРМАЦІЙНОЇ ОЦІНКИ ДОЦІЛЬНОЇ СТРУКТУРИ ОРГАНІВ УПРАВЛІННЯ ВІДКРИТИХ СИСТЕМ КЕРУВАННЯ
ОРЛОВ М.М., ЯКОБСОН є.в.
На підставі оцінки структури відкритої системи керування будь-якого призначення і розподілення потоків інформації в контурі керування розглядаються підходи щодо оцінки ступеня інформативності певної кількості параметрів, які визначають стан завдання, що досліджується органами управління в умовах обмеженого часового ресурсу. Визначається достатність складу органу управління шляхом автоматичної класифікації за показником схожості між ними.
Як відомо, будь-яка автоматизована система керування (АСК) процесами — людино-машинна система, в межах якої забезпечується автоматизований збір, оброблення і відображення інформації, необхідної для оптимізації керування цими процесами з метою найбільшої їх ефективності. Складовими частинами такої системи є: органи управління (ОУ), пункти керування, підсистема зв’язку і комплекс засобів автоматизації процесів керування. При рішенні певною організаційною структурою конкретних завдань S перед системою керування ставиться відповідна мета, яка потребує конкретних ресурсів. У цьому випадку ресурси можуть характеризуватися: часовими показниками Rt , людськими показниками R ч , матеріальними затратами R м . Кількісна оцінка необхідних ресурсів R ч впливає на визначення структури і складу ОУ і буде змінюватись залежно від характеру і складності завдань S •
РИ, 2002, № 4
65