РАЗВИТИЕ МЕТОДОВ РОБАСТНОГО УПРАВЛЕНИЯ В ЗАДАЧАХ
АДАПТАЦИИ А.А. Бобцов, С.А. Холунин
1. Введение
Всплеск популярности теории адаптивных систем имевший место в 70-х годах, постепенно начал угасать к середине 90-х. Темы, связанные с решением задач адаптивного управления перестали широко освещаться на отечественных и международных конференциях, финансирование проектов по этой некогда популярной тематике, постепенно стало уменьшаться. К причинам такого регресса следует отнести, в первую очередь, плохую реализацию на практике имеющихся схем адаптивного управления. Громоздкие, сложные и не всегда помехоустойчивые математические законы управления оказались "не по вкусу" инженерам-практикам. Возникло, как это часто бывает, рассогласование теоретических подходов с практикой. Решение проблемы понимания должно на этот раз исходить именно от математиков и специалистов, занимающихся теорией управления. Первые шаги в этом направлении были сделаны, в том числе, отечественными учеными [1,2], по огрублению алгоритмов адаптации по отношению к внешним неучтенным факторам. Дальнейший уход от алгоритмов адаптации интегрального типа к алгоритмам сигнальной адаптации [1,2], позволил значительно сократить размерность законов управления. Параллельно достижению этих результатов идет развитие методов адаптивного управления по выходу [3,4]. Получен ряд интересных схем и в том числе схем с огрублением для внешних возмущений, но проблема громоздкости и сложности все еще имеет место. К сегодняшнему дню получен ряд оптимальных подходов адаптивного управления по выходу заключающий в себе стратегию робастного управления [5-7].
Предлагаемая работа представляет собой развитие методов робастного управления в задачах адаптации по выходу [5-7]. В статье предлагаются новые схемы управления позволяющие получать менее сложные и громоздкие по размерности алгоритмы.
2. Постановка задачи
Рассмотрим неопределенную систему вида [3-5]
х = Ах + Ью(Г )т 9 + Ьи, (1)
У = стх, (2)
где х = х(V) - вектор переменных состояния; у - регулируемая переменная; и - сигнал управления; матрица А - гурвицева; ю ) - известная функция (регрессор); 9е Яд -вектор неизвестных постоянных параметров.
Наряду с моделью (1), (2) также будем рассматривать математическую модель "вход-выход" [3,5]
У^) = ^ [ )Т 9 + и ], (3)
где р = d / & - оператор дифференцирования и полином А(р) - асимптотически устойчивый.
Сформулируем цель управления, как решение задачи синтеза алгоритма, обеспечивающего при любых начальных состояниях объекта выполнение условия
Чу(*)| <в , (4)
где 8 - любое произвольно малое число.
3. Синтез алгоритма адаптации
Выберем передаточную функцию Ж(р), удовлетворяющую соотношению Ж (р) = (р + а) Н (р), (5)
где а - любая положительная константа. Очевидно, что при таком представлении передаточная функция Ж (р) является асимптотически устойчивой. Так как 1
Н (р) = ■
-Ж (р),
р + а
то модель (3) может быть переписана в виде
у = —1— [таг 9 + й ]+5 р + а
или
у = -а у + шг 9 + и +5
(6)
(7)
где 5^) - экспоненциально затухающая функция времени, вызванная ненулевыми начальными условиями; 5 = 5 + а5 - экспоненциально затухает; функция та = Ж(р)ш и й = Ж(р)и . (8)
Введем новую переменную
ф = таг 9 + 5, (9)
тогда модель (7) примет вид
у = -а у + ф+ и .
(10)
Пусть новый закон управления й имеет вид й = -ф, (11) где ф - текущая оценка функции ф . Тогда закон управления будет записан следующим образом
и = -Ж (р)-1 ф.
(12)
Проблема в синтезе алгоритма (12) - это:
• реализация операции дифференцирования;
• достаточно точная оценка функции ф.
Поэтому требуется выстроить такую схему оценки функции ф, чтобы:
• (ф - ф) ^ Б, где Б - малое число, такое что условие (4) будет удовлетворено;
• для нахождения производных от ф была использована реализуемая вычислительная процедура.
Временно предполагая, что функция ф подлежит измерению, выберем следующий алгоритм оценки
41
4 2 =7^
(13)
4т = Уа(-к141 - к242 - ... - кш4ш + ^фХ
ф = 41, (14)
где число т определяет порядок системы (13) и выбирается таким образом, чтобы закон управления (12) был бы реализуем; постоянная у > 0; положительная функция а
является функцией той же скорости роста что и |ф|2 (т.е. |ф|2/), а все ее т-1
производные известны или подлежат измерению; коэффициенты рассчитываются из
соображений асимптотической устойчивости модели (13).
Теорема 1. Алгоритм оценки (13), (14) позволяет при увеличении параметра у максимально приблизить оценку ф к функции ф .
Доказательство. Перепишем модель (13), (14) в векторно-матричной форме
4 = уа( Г4 + dk1ф), ф = Нт 4,
(15)
(16)
" 0 1 0 .. . 0 " "0" "1"
0 0 1 .. . 0 0 0
где Г = 0 0 0 .. . 0 , d = 0 и Н = 0
- ь - k2 kз .. . - km _ 1 0
Введем в рассмотрение вектор отклонений п = Нф-4, тогда для его производной получим
П = Нф - уа(Г(Нф - п) + dk1ф) = Нф + уаГп - у G(dk1 + ГН)ф. (17)
Так как dk1 = -ГН (проверяется подстановкой), то
П = Нср + уаГп,
где Г - гурвицева.
Для доказательства сходимости п в любую заданную область, рассмотрим функцию Ляпунова вида
V = цтРц, (18) где матрица Р = Рт > 0, такая что
ГтР + РГ<-ХР < 0. (19)
Дифференцируя (18), получаем
V = уаг|т (ГтР + РГ)п + 2птРНф < -ХуапР +
.-„т пиит , ..-1=-1М2
+ дапт РНН1 Рп + д а-
(20) (21)
где положительное число д такое что
V < -ХуаптРп + д-1а-1 |ф|2, а постоянная X > 0 .
При выводе соотношения (20) было использовано легко проверяемое неравенство
(да)-1 (даа - Ъ)2 > 0,
откуда следует, что
2аЪ < даа2 + (да)-1 Ъ
где а = п РН и Ъ = ф.
Поскольку функция а является функцией той же скорости роста что и |ф|2, то из выражения (21) следует, что вектор отклонений п = Нф-4 ограничен и все его переменные могут быть сведены к любому малому компактному множеству, за счет увеличения параметра у.
Для доказательства основного положения представленной теоремы, а именно максимального приближения ф к ф при увеличении параметра у, умножим вектор
отклонений п = Нф-4 слева на НТ . Тогда в силу структуры матрицы Н, получаем: Нт п = ф - Нт 4 = ф - ф
и при соответствующих у (достаточно больших) обеспечивается сходимость в любую малую окрестность.
Замечание 1. Следует отметить, что в качестве мажоранты а можно использовать функцию |тп|2 = тпTтп, так как сигнал ф(t) пропорционален |tb(t)|, т.е.:
( ) . В тоже время, в законе управления (12) будут использоваться только
Т (t )|
измеряемые производные от та вплоть до да-ой, что в свою очередь, позволяет выбирать мажоранту а указанным способом.
Замечание 2. Если функция ф(7) имеет неограниченный рост во времени, то в силу неравенства (21), следует, что при ф(t) ^ да переменная n ^ 0 и, следовательно, ф ^ф.
Замечание 3. Если регрессор ro(t) - ограничен, то в качестве мажоранты а можно принять любую положительную константу.
Замечание 4. Отметим, что реализация мажоранты а с использованием алгоритма приведенного в замечании1 для некоторых задач может оказаться громоздким, т.к. предполагает формирование вектора тп каждая компонента которого находится из соотношения тп i = pW (p )ш;. Во избежание громоздких процедур расчета мажоранты, целесообразно использовать алгоритм вида:
а = pW (p)[oT и+Р], где в > 0.
Теперь построим реализуемую схему алгоритма оценки (13), (14) следующего
вида
41 =7^
4 2 = 7^
(22)
с = уа(-^2 - ..-+ к1аУ)- к1 У,
=с + уа^1 у . (23)
Система (22), (23) содержит переменные, которые могут быть измерены или рассчитаны. Возможность применения указанного алгоритма представлена в следующей теореме.
Теорема 2. Алгоритм оценки вида (22), (23) эквивалентен алгоритму (13), (14). Доказательство. Из уравнения (10) находим
Ф = у + а у - и . (24)
Подставляя последнее уравнение в выражение (13), получаем
41 =7^
4 2 =7^
4т = Уа(-^141 - k242 - ... - km4m + k1(y + аУ - U)), учитывая, что
u = -ф,
получаем
(25)
41 =7^2, 4 2 =7^3,
4m = Ya( к242 - ••• - km4m + k1(У + 0У))-Введем в рассмотрение новую переменную
g = 4m - Y^y • (27)
Тогда дифференцируя (27) для системы уравнений (26), получаем
41 =Y^
4 2 =Y^43, (28)
(& = Y^(-k242 - ••• -к„4„ + к1аУ) - YakiУ, 4m =í + Y°¿1 У • (29)
4. Пример
Для иллюстрации работоспособности предложенной в работе схемы управления, рассмотрим числовой пример • Пусть модель (1), (2) имеет вид:
x&1 = x2, (30)
x2 =-x1 - 2x2 + 3sin4t + u, (31)
У = *1, (32)
где вектор неопределенных параметров 0 = 3, регрессор ш = sin 4/, u - искомое управление^
Для объекта (30)-(32) рассмотрим математическую модель математическую модель "вход-выход" вида (3)
y(t) =-1—т [3sin4t + ul (33)
(p + 1)2L J
Выберем передаточную функцию W (p) = —1—, тогда выражение (33) в
p+1
соответствии с результатами раздела 3, примет вид (см^ уравнение (10)):
y = -y + ф+ u , (34)
где функция ф = 5 + W (p)3 sin 4t •
Выбирая новый закон управления u как
u =-ф, (35)
получаем для истинного закона управления
u =-W(p)-1 ф =-(p + 1)ф =-ф -ф • (36)
Для реализации оценки ф, воспользуемся алгоритмом (22), (23):
{41 =Y42,
и = Y( -242 + У),
42 =? + Yy, (38) ф = 41, (39)
где коэффициенты к2 = 2, к1 = 1 и в силу ограниченности регрессора ш- sin4t (см^ замечание 3), мажоранта а = 1 •
Запишем закон управления в обозначениях алгоритма оценки (37)-(39)
u = -ф -фф = -41 - y (q + Yy )• (40)
(37)
и проведем компьютерное моделирование. Результаты моделирования для различных значений параметра у представлены на рис. 1, рис. 2 и демонстрируют уменьшение значения выходной переменной с ростом параметра у.
£, сек.
Рис. 1. График переходного процесса по переменной у ) при у = 5
t, сек.
Рис. 2. График переходного процесса по переменной у(1) при у = 20.
Заключение
Работа представляет собой развитие методов робастного управления в задачах адаптации по выходу. В статье предлагаются схемы управления позволяющие получать, как менее сложные и громоздкие по размерности алгоритмы и алгоритмы. Структура регулятора является линейной и содержит нестационарный фильтр, параметры которого выбираются из требований предъявляемых к выходной переменной объекта.
Литература
1. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М. Наука, 1981.
2. Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990.
3. Никифоров В.О., Фрадков А.Л. Схемы адаптивного управления с расширенной ошибкой. Обзор // Автоматика и телемеханика. 1994. №9.
4. Андриевский Б.Р., Фрадков А.Л., Избранные главы теории автоматического управления с примерами на языке MATLAB. СПб.: Наука, 1999.
5. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными механическими системами. СПб.: Наука, 2000.
6. Никифоров В.О. Робастное управление линейным объектом по выходу // Автоматика и телемеханика. 1998. № 9.
7. Никифоров В.О. Адаптивное и робастное управление с компенсацией возмущений. Диссертация на соискание ученой степени доктора технических наук. СПб., 2001.