УДК 517.977+ 62-50
DOI 10.19110/1994-5655-2019-1-9-11
В.Ф. СОКОЛОВ
МОДЕЛИРОВАНИЕ АДАПТИВНОЙ СУБОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ ДИСКРЕТНОГО МИНИМАЛЬНО-ФАЗОВОГО ОБЪЕКТА С НЕОПРЕДЕЛЕННОСТЬЮ В КАНАЛЕ ВЫХОДА
Физико-математический институт ФИЦ Коми НЦ УрО РАН, г. Сыктывкар
V.F. SOKOLOV
ADAPTIVE SUBOPTIMAL STABILIZATION OF DISCRETE-TIME MINIMUM-PHASE PLANT UNDER OUTPUT UNCERTAINTY
Institute of Physics and Mathematics, Federal Research Centre Komi Science Centre,
Ural Branch, RAS, Syktyvkar
Аннотация
Рассматривается задача оптимальной стабилизации дискретного минимально-фазового объекта с неизвестными параметрами и неизвестными уровнями ограниченного внешнего возмущения и неопределенности в канале выхода. Минимизация наихудшего по возмущениям верхнего предела модуля выхода объекта достигается с помощью использования показателя качества задачи управления как идентификационного критерия и оптимального множественного онлайн оценивания всех неизвестных параметров. Благодаря дробно-линейной зависимости показателя качества от уровней внешнего возмущения и неопределенности оптимальная онлайн идентификация неизвестных параметров сводится к задачам линейного программирования. Приводятся результаты моделирования адаптивного субоптимального управления для алгоритмов множественного оценивания с различным объемом памяти.
Ключевые слова:
адаптивное управление, оптимальное управление, робастное управление, ограниченное возмущение, множественное оценивание
Abstract
The problem of optimal stabilization of discrete-time minimum-phase plant with unknown parameters and unknown bounds on external disturbance and output uncertainty is considered. Minimization of the worst-case output in steady-state is based on treating the control criterion as the identification criterion and optimal set-membership estimation in closed-loop. Optimal estimation is reduced to linear programs due to the fact that the control criterion is linear-fractional in the upper bounds on the external disturbance and the uncertainty. Simulations of adaptive suboptimal control are presented for set-membership estimation algorithms of different memory.
Keywords:
adaptive control, optimal control, robust control, bounded disturbance, set-membership estimation
Введение
В работе [1] предложен алгоритм конусного оценивания для адаптивной оптимальной стабилизации дискретного минимально-фазового объекта с ограниченным внешним возмущением и неопределенностью в канале выхода. Возможность использования для решения этой задачи множественных оценок минимальной сложности (в виде линейных неравенств, число которых равно числу оцениваемых параметров) следует из дробно-рациональной зависимости показателя качества от верхних границ внешнего возмущения и неопределенности. В данной работе для улучшения переходных процессов в адаптивной системе предложено обобщение конусного алгоритма, в котором используются множественные оценки с произвольным, заранее выбранным числом запоминаемых неравенств, и приводятся результаты моделирования задачи адаптивной оптимальной стабилизации.
т— 1
1. Задача оптимальной стабилизации
Объект управления описывается моделью
а(ч-1)уг+1 = Ь(д—1)иь + , Ь = 0,1,2,... ,
(1)
где уь,иь,уь Е ж - выход объекта, управление и суммарное возмущение в момент времени Ь, д-1 -оператор сдвига назад (д—1хь := хь—1) и а(А) 1 + а1 А +... + ап Ап ,Ь(А) = Ь1 + Ь2А +... + ЬтА Неизвестное суммарное возмущение уь удовлетворяет ограничению
Ы < 5Ш + 5уРу(Ь), Ру(Ь) := тах \у,9\, (2)
Ь—
где 6Ш > 0 - неизвестная верхняя граница внешнего возмущения, 6у > 0 - неизвестная верхняя граница (коэффициент усиления) нормированной неопределенности ру в канале выхода. Память неопределенности ц Е n выбирается конструктором на основе доступной априорной информации об объекте управления.
Для модели с известными полиномами а(А) и Ь(А) и любыми начальными значениями
Уо, гулятор
,y-n+1, ио,
,и-т+1 неупреждающии ре-
b(q )ut = (a(q ) - 1)yt+1
(3)
обеспечивает равенство yt+1 = vt+1 и тем самым гарантирует минимизацию показателя качества
Jß{5y ,SW) := sup lim sup \yt\
где супремум берется по всем возмущениям V, удовлетворяющим ограничению (2). Точная верхняя оценка показателя . при ц ^ имеет вид [1]
J^(Sy,Sw) S
Sw
l- Sy
(ß ^ +rc>) , Sy < 1
(4)
где ^ означает монотонную сходимость снизу. Верхняя оценка (4) характеризует качество стабилизации для объекта с известными полиномами а(А),Ь(А).
Априорная информация об объекте управления состоит из предположений A1, A2:
A1. Неизвестный столбец коэффициентов £ := (а1,..., ап,Ь1,... ,Ьт)Т принадлежит известному ограниченному многограннику 2:
£ е 2 = {£ \ р£ > р} с жп+т, Р е ж1х(п+т),
Ь1 = 0 и корни полинома Ь(А) лежат вне замкнутого единичного круга {г Е с \\г\ < 1} для любого £ Е 2.
A2. Известна верхняя граница 6у < 1 неизвестного коэффициента усиления 6у :
0 < 5у < 5у < 1.
Задача. Для модели (1) с априорной информацией A1,A2 требуется построить обратную связь, гарантирующую с наперед заданной точностью неравенство
limsup \yt\ < J (Sy ,Sw) :
Sw
1" Sy
(5)
при любых начальных данных и любых возмущениях V, удовлетворяющих ограничению (2).
Поставленная задача является задачей адаптивной субоптимальной стабилизации с показателем качества .1 (6у ).
2. Адаптивная субоптимальная стабилизация
Сложность поставленной оптимальной задачи заключается в неидентифицируемости вектора коэффициентов £. Для решения задачи будут использованы множественные оценки вектора всех неизвестных параметров в = (£Т,6у )Т Е в с Жпе ,п,0 = п + т + 2, где в - априорное множество допустимых значений вектора в, в := {в = (£Т ,6у X )Т|Р£ > р,6у > 6у > 0 ,дт > 0} . Описание модели в виде уравнения (1) и ограничения (2) эквивалентно системе неравенств
\a(q )yt - q b(q )ut\ < Sw + Sypy(t)
(6)
несущих информацию о неизвестном векторе в. Пусть вь = (£Т,6уЬ,6,шЬ)Т -оценка неизвестного вектора в, вычисленная в момент времени Ь, и после поданного управления иь измерен выход уь+1. Положим
фь := (-уь, -УЬ—1, . . . , -уь—п+1,иь,... ,иь—т+1)Т, Пь+1 := sign(yь+l - ФТ£ь), Сь+1 := Пь+1уь+1 ,
Фь+1 := (ПЬ+1фТ ,Ру (Ь), 1)Т .
В этих обозначениях неравенство (6) относительно вь в момент времени Ь +1 эквивалентно неравенству
■ФТ+А > Сь+1 . (7)
Введем обозначение для показателя качества
I(в) :=
J (by ,Sw )
Sw
1- S y
в ев.
Множественная оценка вь вектора в в каждый момент Ь будет состоять из не более чем N > щ неравенств вида (7), где N - заранее выбранное число. В качестве начальной векторной оценки в0 выбирается вершина априорного многогранника в, являющаяся решением задачи дробно-линейного программирования
в0 := ащтш I(в), еев
а в качестве начальной множественной оценки в0 берутся п0 неравенств из описания в, на границе которых лежит в0. Оценки вь и вь обновляются согласно следующему алгоритму. Выберем любое число е,
0 < е < (1 - ду),
и положим
вь+1 := вь, вь+1 := вь, (8)
если 1ф~Т+1вь > — е\фь+1\. В противном случае вь+1 - вершина многогранника вь П Пь+1 П в, являющаяся решением задачи дробно-линейного программирования (9)
вь+1 := ащтт I(в), Пь+1 := в^О > Сь+1}. еев4пп4+1пв
(9)
Множественная оценка вь обновляется по правилу
et+1 = et П Qt+1
(10)
К
v
если число неравенств (7) в описании вг строго меньше N. Если число неравенств равно N, то новое неравенство (7) добавляется вместо любого из неравенств, на границе которого не лежит вг+1. В приводимых ниже результатах моделирования из описания в4+1 исключалось неравенство с наиболее удаленной от в4+1 границей.
Теорема 1. Пусть объект управления удовлетворяет описанию (1), (2) и выполнены предположения А1, А2 с неизвестным вектором параметров в = (£т, 6у, 6Ш)т. Пусть управление объектом осуществляется адаптивным регулятором
Ьг(д-1)щ = (аг(д-1) - 1)уг+1 , (11)
в котором полиномы аг(А) и Ьг(А) соответствуют вектору оценок вг. Тогда в замкнутой системе управления (1), (11), (8), (9) последовательность I(вг) возрастающая,
I(0t) < I(в)
Sw
1- Sy
(t ^ +œ), (12)
и если число изменеий оценок вг конечно, то
Итэир\уь\ < .1 (5уж,Кж) + Се < .(5у) + Се,
где 6уж,6шж - компоненты установившейся оценки
в Ж = (вт, 6уж,6тж)т и С = е.
0 200 400 600 800 1000
Рис. 1. График "хорошего" выхода yt при N = ид. Fig.1. Graph of "good" output yt for N = ид.
-10L
x 10
3. Моделирование
В этом разделе приводятся результаты моделирования для модели (1), (2) с полюсами (корнями а(А)) 0.9 и 0.8 ± 0.4г и нулями (корнями Ь(А)) 1.1 и 1.2. Число оцениваемых неизвестных параметров равно 8. Суммарное возмущение V моделировалось в виде
VI = + 5укгру (г),
где - последовательности независимых равномерно распределенных на [0,1] случайных величин, 6Ш = 1, 6у = 0.4 и память неопределенности р = 10. Априорные ограничения имели вид \а^ < 10, \Ь^ < 5, г = 1,2, 3, 0.1 < Ь1, Ь1 - Ь3 > 0.01, Ь1 - Ь2 + Ь3 > 0.01, Ь1 + Ь2 + Ь3 > 0.01, 0.5 > 5у > 0,^ > 0, параметр е = 0.001. Начальные значения у0,у-1,у-2 - случайные из отрезка [—6Ш, 6Ш], и0,и-1,и-2 - нули, начальные оценки каждого из коэффициентов ai,Ьi выбирались случайно из окрестностей радиуса 3 каждого из коэффициентов и не менялись на начальном интервале [1,ив].
Результаты моделирования показали, что качество переходного процесса адаптивной оптимальной системы сильно зависит от направления начального отклонения £ — £0 и слабо зависит от начальных значений уг и реализаций случайных величин wt, кг. На рис. 1 и 2 показаны графики "хорошего" и "плохого" переходного процесса для двух значений £0 с 11-нормами ||£ — £0||ь равными 6.5327 и 7.5138 соответственно, при одинаковых реализациях всех описанных выше случайных величин и N = ив.
0 200 400 600 800 1000
Рис. 2. График "плохого" выхода yt при N = ид. Fig.2. Graph of "bad" output yt for N = ид.
Если в случае "плохого" переходного процесса использовать параметр N = 2ид, то качество переходного процесса улучшается на несколько порядков (см. рис. 3) и остается примерно таким же при запоминании даже всех нарушаемых неравенств. 4000-,-,-,-,-
2000
о
-2000
0 200 400 600 800 1000
Рис. 3. График "плохого" выхода yt при N = 2ug. Fig.3. Graph of "bad" output yt for N = 2ng.
Эффект "плохого" выхода вызван тем, что при неудачных начальных оценках £0 возможен быстрый рост выхода и управления, в результате чего векторы в неравенствах (7) несут бедную информацию о векторе 0. Переходные процессы можно существенно улучшить применением на некотором начальном интервале времени асимптотически не оптимальных алгоритмов оценивания проекционного типа или метода наименьших квадратов.
Литература
1. Соколов В.Ф. Адаптивная субоптимальная стабилизация дискретного минимально-фазового объекта с неопределенностью в канале выхода // Известия Коми научного центра УрО РАН. 2018. № 3(35). С. 8-12.
References
1. Sokolov V.F. Adaptive suboptimal stabilization of discrete-time minimum-phase plant under output uncertainty // Proc. of the Komi Sci. Centre, Ural Branch, RAS. 2018. No. 3(35). P. 8-12.
Статья поступила в редакцию 04.02.2019.