электронное научно-техническое издание
НАУКА и ОБРАЗОВАНИЕ
Эя № ФС 77 - 305БЭ. Государствен над регистрация №0421100025.155Н 1994-0405_
Алгоритмы управления гамильтоновыми системами в условиях параметрической неопределенности
77-30569/282904
# 12, декабрь 2011
Мышляев Ю. И., Финошин А. В.
УДК 62.59
КФ МГТУ им. Н.Э. Баумана [email protected]
Введение.
Задача приближения к заданному энергетическому уровню в условиях полной априорной информации рассмотрена, например, в работах [1, 2]. ,Для решения этой задачи использовался метод скоростного градиента.
Большинство известных алгоритмов синтеза адаптивного управления подходят для решения таких задач, как стабилизация и слежение, когда траектории системы сходятся к точке или кривой. В этих случаях целевая функция обладает свойством радиальной неограниченности по отношению к вектору состояния управляемой системы. Однако в ряде приложений требуется только стабилизация по отношению к части переменных. Например, такие задачи возникают при синхронизации, стабилизации желаемого уровня энергии физических или механических систем [6].
Особенностью решения задачи приближения к заданному энергетическому уровню в условиях параметрической неопределенности объекта управления (ОУ) является вхождение в целевую функцию неизвестных параметров. Это предполагает идентификацию параметров объекта. Например, в работе [3] для однопараметрической модели маятника, введённой в [4].предложено параметрическое управление. Система состоит из объекта, подсистемы адаптации параметра маятника, синусоидального задающего воздействия с желаемой частотой колебаний и наблюдателя (эталонной модели).
В данной работе рассматривается синтез координатного управления методом бискоростного градиента [5]. Алгоритмы синтезируется в два этапа. На первом этапе в условиях полной априорной информации об объекте методом скоростного градиента формируется «идеальное» управление, обеспечивающее системе заданный уровень энергии. На втором этапе неизвестные параметры «идеального» управления и энергетического показателя заменяются настраиваемыми и синтезируется алгоритм идентификации.
Устойчивость расширенной системы, состоящей из ОУ и подсистемы адаптации, обосновывается методом функции Ляпунова. Постановка задачи.
Рассмотрим объект управления в гамильтоновой форме: . dH (x, u, %) . dH (x, u, %)
q = —^—p =--^—, (1)
dp dq
где x = [ q p ] - вектор состояния, q, p - обобщенная координата и обобщенный импульс, % eSc Жm, где S - множество возможных значений %, H ( x, u, % ) = H0 ( x, % ) + H1 ( x, % ) u - гамильтониан, H0 ( x, % ) - гамильтониан (энергия)
свободной системы, H1 ( x, % ) - гамильтониан взаимодействия.
Целью управления (ЦУ) является ограниченность всех траекторий замкнутой системы и достижение заданного уровня энергии H*
lim H о ( x, % ) = H*. (2)
t
Предполагается измеримость вектора состояния. Синтез алгоритма управления.
Синтезируем алгоритм управления методом бискоростного градиента [4] по двух-этапной схеме.
Предположение 1. Слагаемые гамильтониана Hi (x, %), i = 0,1 линейно зависят от %, т.е. представимы в виде Hi (x,%) = %TV%Hi (x,%) .
Этап 1. Синтез «идеального» управления u* (%, t), обеспечивающего достижение
цели управления (2) в условиях полной априорной информации о параметрах объекта управления.
Введем в соответствие с (2) целевую функцию Q (S*), например, в форме:
Q (S* )<Д, Vt >t*, (3)
где Д >0, t* > 0, Q(S*) - локальный целевой функционал; S* = H0(x,%) — H* - отклонение от целевого многообразия.
Условие Q (условиероста Q(S*)). Функция Q(S*) неотрицательная, равномерно-непрерывная в любой области вида {S* : |S*| < в} и удовлетворяет соотношению inf Q (S*) ^ при |S*| ^ да.
Условие D1 (условие достижимости). Для любого £ eS существует u*(£,t) и скалярная, непрерывная, строго возрастающая функция р, (Q)> 0 такая, что р, (0) = 0 и выполняется неравенство ](x,£,u*) < — р, (Q(S*)) , где
dQ dS*
](x,£,u*) =--*{H0,H,}u* - полная производная по времени функционала (3) в
dS* dx
/ч (ТТ , dH0 dH dH0 dH,
силу траектории системы (1); {H0, H,} =------ скобка Пуассона.
dq dp dp dq
Синтезируем алгоритм «идеального» управления методом скоростного градиента в конечной форме
u* ( £t ) = u0 (t ) — w( X £ ),
где u0 (t) - априорное управление (может быть выбрано нулевым), у > 0 - коэффициент
усиления; ((x,£) - функция, удовлетворяющая условию усиленной псевдоградиентно-сти.
Условие Ф (усиленной псевдоградиентности). Вектор-функция ((x, £) удовлетворяет условию
((x, £ )Vu](x, £, u) >вК]х, £, u )|8, где в > 0, 8 = 1,2,... - некоторые числа.
Условие Ф, выполнено, например, при ((x, £ ) = sign Vu](x, £, u) для 8 = 1 и в < 1. В дальнейшем ограничимся рассмотрением лишь релейных алгоритмов вида
u* ( £, t ) = u0 — Ysign Vu](x, £, u ). (4)
Этап 2. Синтез алгоритма идентификации. Введем в рассмотрение настраиваемую модель вида
x* = v, (5)
где х* = [Ц* р* ] - вектор состояния настраиваемой модели, V = У2 ] - вектор
входа настраиваемой модели.
Сформулируем дополнительные цели управления (ДЦУ)
ИтОе 0, (6)
t
и
lim е = £ (7)
t ^^
где Qe (e(t)) - локальный целевой функционал, e = x — x*.
Условие QE (условие роста Qe ( e (t))). Функция Qe ( e (t)) неотрицательная, равномерно-непрерывная в любой области вида {e : ||e|| < ß} и удовлетворяет соотношению inf Qe (e) ^ при ||e|| ^ ^.
Условие D2 (условие достижимости). Существует функция v* ( x, x*, u, £ ), скалярная, непрерывная, строго возрастающая функция ре (Qe) > 0 такая, что ре (0) = 0 и выполняется неравенство w (x, x*, £, v*) < — pe (Qe) , где
dQe f\dH(x,u,£) dH(x,u,£УТ Л
(x, x*, £, v*)
de
v*
У
полная производная по
др дц
времени функционала (6) в силу траекторий системы (1); (5).
Заменим в «идеальном» входном воздействии V* неизвестные параметры ^ на
настраиваемые 0 ( X )
V (X ) = V ( х, х*, 0 ) (8)
Синтезируем алгоритм адаптации методом скоростного градиента а ( 0 + ¥( х, 0, X)) / с1Х = -ГУе м> ( х, х*, 0, и ), (9)
где Г = Г > 0-(т х т) матрица; ^(х,0,X) е Жт удовлетворяет приведенному ниже условию G; и (X ) - внешний вход для модели ошибки.
Условие G (условие разрешимости и псевдоградиентности). Гладкая вектор-функция ^(х, 0, X) удовлетворяет условию псевдоградиентности
Т(х, 0, t) V в^(х, 0) > 0 , и для любых 0О е Жт, X е Ж , t > 0, существует единственное решение 0 = х (х, 0О, t) уравнения 0 + х, 0, t) = 0О.
Определение 1 [2]. Вектор-функция Г :[0,да) называется постоянно возбуждающей (ПВ) на [0,да), если она измерима и ограничена на [0,да) и существуют а > 0,
t+т
Т > 0 такие, что | Г ( 5) Г ( 5 )Т ds >а\т, t > 0.
Условие I. Г
- ПВ вектор-функция.
V0Н0 (X, 0) V0И (х, 0) Заменим в целевом функционале (3) и в «идеальном» управлении и* = и (£, х) параметры £ на настраиваемые 0 (t)
д (5 )<д, vt (10)
где 5 = Н 0 ( х, 0 )- Н*,
и (t ) = щ - Ysign VuM(x, 0, и). (11)
Теорема 1. Пусть выполнены условия Q, Б1, Ф, Б2, О, I. Тогда в системе (1), (5), (8), (9), (11) все траектории ограничены и 5 ^ 0, е ^ 0, 0 ^ £ при t ^ да. Для системы (1) существует функция Ляпунова:
I ..о
V(5,х,х*,£,0) = б(5) + бе (е) +110 - £ + Т(х,0,t)||^ . (12)
Введем в рассмотрение частный случай модели (5)
х* = V, (13)
где х* = р*.
ДЦУ имеет вид (6) относительно е = х — х*, х = р .
Следствие 1. Пусть для системы (1), (8), (9), (11), (13) выполнены условия теоремы 1. Тогда утверждения теоремы 1 сохраняют свою силу с точностью до замены вектор-функции е (t) на скалярную функцию е (t). Рассмотрим частный случай модели (5)
дН0 (х*,0*)
х* =--^-(14)
дд*
где x* = p* - обобщенный импульс эталонной модели, H0 ( x*, 0*) - гамильтониан (энергия) свободного движения эталонной модели, 0* - параметры эталонной модели.
Обозначим вместо u (t) вход гамильтоновой системы (1) за g (t) и представим вход в виде суммы входных воздействий
g (t) = u (t) + v (t), (15)
где u (t) - составляющая управления, обеспечивающая достижение ЦУ (2), v (t) - составляющая управления, обеспечивающая достижение ДЦУ (7) для модели ошибки e (t).
Следствие 2. Пусть для системы, состоящей из ОУ (1) со входом (15), эталонной модели (14), составляющих управления (8), (11), подсистемы адаптации (9), выполнены условия теоремы 1. Тогда утверждения теоремы сохраняют свою силу с точностью до замены вектор-функции e (t) на скалярную функцию e (t).
Замечание. Условия достижимости D1, D2 гарантируют достижение целей управления в условиях полной априорной информации о параметрах ОУ. Условия роста требуются для установления глобальных свойств системы.
Синтез алгоритмов при квадратичных целевых функционалах Рассмотрим применение приведенной методики синтеза применительно к квадратичным целевым функционалам вида:
Q (S ) = 0.5S2 (16)
Qe (e) = 0.5eTPe, P = PT > 0 (17)
Очевидно, что условия роста Q, QE выполнены.
Этап 1. Синтезируем алгоритм «идеального» управления вида (4). Для этого вычислим градиент от скорости изменения целевого функционала
Q (S* ) = 0.5S*2 (18)
вдоль траектории системы (1) и, используя условие усиленной псевдоградиентности, получим [1, 2]
u* = u -yq>(S* {H0,H1}), (19)
где (p{ S* {H0, H1}) = sign ( S* {H0, H1}).
Проверим выполнение условия достижимости D1.
Для этого вычислим скорость изменения целевой функции (18) в силу траекторий системы (1) с управлением (19)
й = Б* {Н0,Я1}и* = -уБ* {Н0,Н>(Б* {Н0,Я1}) < 0 (20)
в силу выполнения условия псевдоградиентности функции (р( Б* {Н0, Н1}) .
Заметим, что условие й < 0 нарушается в точках равновесия ¿С = р = 0 для некоторых ^ > 0, к = 1,2,.... Однако исследования, проведенные в работе [1, 2], показывают, что цель й (Б*) ^ 0, ? да достигается при почти всех (по мере Лебега) начальных
условиях.
Этап 2.
Введем в рассмотрение настраиваемую модель вида (5).
Выберем в качестве входного воздействия настраиваемой модели V* компенсирующий алгоритм вида
-А*е +
дН (х, и, £) дН (х, и,%)
др дс
где А* - гурвицева матрица.
Тогда производная целевой функции (17) в силу траектории системы (1), (5), (21)
йе =еТ РА*е <-Рй,
(21)
(22)
где ре = АшЬ (О )/Л.тах (Р) > 0 - минимальное и максимальное собственные числа матриц Р = РТ > 0, О = О > 0, удовлетворяющих уравнению Ляпунова РА + АТ Р = -О.
Следовательно, условие достижимости Б2 выполнено.
Заменяя в (21) вектор неизвестных параметров £ вектор-функцией настраиваемых параметров 0 (?), получаем алгоритм управления для настраиваемой модели в виде
V = - А*е +
дН (х, и, 0) дН (х, и, 0)'
дс
др
(23)
Определим йе в силу траектории системы (1), (5), (23)
<2е = еТ РА*е + еТ Р
дН (х, и, С) дН (х, и, 0) дН (х, и, 0) дН (х, и, С)
др
др
дц
дц
. (24)
Вычисляя градиент Ое по 0 и выбирая алгоритм адаптации (9) в дифференциальной форме, получаем
0 = -Г
дУе Н (х, и, 0)' др
дУ0 Н (х, и, 0)' дц
Ре.
(25)
Тогда из (24) с учетом (22) получаем ()е < -реОе. Откуда в силу леммы Барбалата следует ограниченность траекторий системы (1), (5), (9), (23) и достижение ДЦУ (17).
Замечание. Для эталонной модели (13) управление (23) и алгоритм адаптации будут иметь вид
дН ( х, и, 0 )
V = - ае
0 = -Г
др
дУ0 Н (х, и, 0)' дц
Т '
е.
(26)
Условие идентифицируемости I будет выполнено, если движение замкнутой системы обладает достаточным спектром собственных частот, например, когда в системе наблюдаются нелинейные колебания, что может быть обеспечено соответствующим выбором значения желаемого энергетического уровня Н* ( X ).
Используя результаты первого этапа синтеза и целевую функцию (16), выберем из семейства алгоритмов релейный алгоритм (19) при и0 = 0, при котором управление будет постоянно возбуждающим,
и = -Г^п ( 5 {Н0, Н1}). (27)
Пример.
Рассмотрим уравнение маятника в гамильтоновой форме.
ц = P,
р = Бт ц + ^2и,
(28)
где ^ = J , <^2 = J - параметры, J, т , I - физические характеристики объекта: момент инерции, масса и длина маятника, значения которых по условию считаются
неизвестными, £ = ] - вектор параметров. Гамильтониан маятника
H(x,£) = H0 (x,£) + H1 (x,£)u , где H0 (x,£) = p2¡2 + (1 - cosq) - гамильтониан
(энергия) свободной системы, H1 (x, £) = — ^2q - гамильтониан взаимодействия.
ЦУ (2) будет соответствовать раскачке маятника до амплитуды q* = arccos(1 — H*/mgl) при 0 < H* < 2mgl или приведение маятника во вращение с
угловой скоростью С = V2 H*/J при H* > 2mgl.
Проведем синтез алгоритма управления согласно описанной методике. Этап 1.
Алгоритм «идеального» управления вида (19) при u0 = 0 имеет вид
u* = —^sign (( H0 ( x,£ ) — H* )£ p ), (29)
Этап 2.
Для настраиваемой модели (13) алгоритм управления имеет вид
V = — a*e + p — Эх sinq + 62u, a* < 0. (30)
Алгоритм адаптации
0 = — Г [sin q —u]e, (31)
или
$ = -Ye sin q,
-1 1 , (32)
62 = y 2eu.
Условие идентифицируемости I выполнено для параметра 61 и не выполнено для
параметра в2, т.к. f = [sin q u] Для идентифицируемости по параметру в2 можно,
например, добавить в управление слагаемое вида e а sin (t, со - частота задающего воздействия, не совпадающая с собственной частотой колебания маятника. Заметим, что целевая функция (16) для маятника не зависит от 02. Более того «идеальное» значение
0*2 = > 0 . При этом алгоритм управления (27) можно использовать в виде
u
= —Ysign (( H0 ( x,01) — H*) p ) (33)
с подсистемой адаптации (32).
Для оценки у определим
Q (5 ) = 5 (x,¿ {dH 0(x¿) p +dH 0(x¿) q + ¿V
V ' V °I dp dq d¿ V (34)
= 5 (х,в )(^2 pu+(ei ) psin q- cos q в).
Тогда с учетом (33) Q(5) < —Y0 |5p| при
Y > 5((в1 - )psinq + (i - cosq)в1)|/|5p| + Y0, Y0 > 0. Результаты моделирования
системы приведены на рис. 1-3.
Условия моделирования: ^ = 0,98 ; = 0,1; H* = 10,2 ; Y = 2 ; Y1 = 12 ; Y2 = 6;
а* = -2; p ( 0 ) = 4,5; q ( 0 ) = 0,07; p* ( 0 ) = 0,03; ¿ ( 0 ) = 10; в2 ( 0 ) = 1.
25
20
15
10
5
энергия
i н0(в)
1
/_у H0®
0 2 4 6 8 10 12 14 16
^ с
Рис. 1. Гамильтониан свободной системы, оценка гамильтониана и желаемый уровень
энергии
настраиваемые параметры
10
'i «i 1 в, i J 1 Л' 1
'ir^.tr Ti—„ <M
jxi___________________ '^2
¿2 i
-5
-10
8 10 12 14 16
t, с
Рис. 2. Неизвестные и настраиваемые параметры
5
0
0
2
4
6
6 5 4 3 2 1
Рис. 3. Обобщенный импульс объекта и модели
: : /
I ', ¡» * л Jr\
I « j ■ ...............U„.-'„w_______ •
! X f 3*................
Î
2 4 6 8 10 12 14
t, с
Литература
1. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. - СПб.: Наука, 2000. - 548 с.
2. А.Л.Фрадков. Кибернитеская физика: принципы и примеры. СПб.: Наука, 2003. -208 с., 47 ил
3. D.V. Efimov, A.L. Fradkov (2006). Adaptive tuning to bifurcation for time-varying nonlinear systems. Automatica 42 (2006) 417 - 425.
4. Babitsky, V. I., & Shipilov, A. (2003). Resonant robotic systems. Berlin: Springer.
5. Мышляев Ю.И. Схема бискоростного градиента. // Сборник трудов междун. техн. конф. «Приборостроение - 2002», Винница-Алушта. - С. 180-184.
6. A. L. Fradkov and P. A. Yu, Introduction to Control of Oscillations and Chaos, Singapore: World Scientific, 1998.
electronic scientific and technical periodical
SCIENCE and EDUCATION
_EL № KS 77 - 3Ü56'». .V;II421100025, ISSN 1994-jMOg_
Control algorithms of Hamiltonian systems with unknown parameters
77-30569/282904
# 12, December 2011 Myshlyaev Yu.I., Finoshin A.V.
Bauman Moscow State Technical University Kaluga Branch
The authors consider the problem of achieving an energy desired level with unknown parameters. Two-stage control synthesis algorithm based on double-speed gradient is proposed. The objective function depends on unknown parameters. The identifiability of the model's parameters is obtained basing on self-tuning model. The algorithm efficiency is demonstrated via a pendulum example.
Publications with keywords: energy control, double-speed gradient method, adaptive control Publications with words: energy control, double-speed gradient method, adaptive control
Reference
1. Miroshnik I.V., Nikiforov V.O., Fradkov A.L., Nonlinear and adaptive control of complex dynamic systems, SPb., Nauka, 2000, 548 p.
2. A.L.Fradkov, Cybernetic physics: principles and examples, SPb., Nauka, 2003, 208 p.
3. D.V. Efimov, A.L. Fradkov, Adaptive tuning to bifurcation for time-varying nonlinear systems, Automatica 42 (2006) 417 - 425.
4. Babitsky V. I., Shipilov A., Resonant robotic systems, Berlin, Springer, 2003.
5. Myshliaev Iu.I., in: Proceedings of the international technical conference "Instrumentation technology - 2002", Vinnitsa - Alushta, pp. 180-184.
6. A. L. Fradkov, P. A. Yu, Introduction to Control of Oscillations and Chaos, Singapore, World Scientific, 1998.