УДК 517.98
© А.Д. Мижидон, К.А. Мижидон, А.В. Лобанов
АНАЛИТИКО-ЧИСЛЕННОЕ ОБОСНОВАНИЕ ПОСТРОЕНИЯ АЛГОРИТМА РЕШЕНИЯ ЗАДАЧИ УПРАВЛЕНИЯ, ОБЕСПЕЧИВАЮЩЕГО ВЫПОЛНЕНИЕ ЗАДАННЫХ ОГРАНИЧЕНИЙ ПРИ ПОЛИГАРМОНИЧЕСКИХ ВОЗМУЩЕНИЯХ 1
Статья посвящена построению алгоритмического обеспечения решения задачи построения управления линейной динамической системой, в которой основной целью управления является удержание системы в установившемся режиме в заданных фазовых ограничениях при заданном детерминированном полигармоническом возмущении.
Ключевые слова: линейная система, оптимальное управление, фазовые ограничения, полигармоническое возмущение, весовой коэффициент, среднеквадратический функционал.
© A.D. Mizhidon, K.A. Mizhidon, A. V. Lobanov
ANALYTICAL AND NUMERICAL BASIS FOR CONSTRUCTING AN ALGORITHM FOR SOLUTION A PROBLEM OF CONTROL PROVIDING FULFILLMENT OF DEFINED CONSTRAINTS UNDER
POLYHARMONIC PERTURBATIONS
The article is devoted to the construction of algorithmic support of solution the problem for constructing a control of linear dynamic system. The main purpose of control is to keep the system in a steady state in the defined phase constraints under determined polyharmonic perturbation.
Keywords: linear system, optimal control, state constraints, polyharmonic perturbation, weighting coefficient, mean-squared functional.
Введение
В статье рассматривается задача построения управления линейной динамической системой, в которой основной целью управления является удержание системы в фазовых ограничениях при заданном детерминированном возмущении. В качестве внешних возмущений рассматриваются полигармонические функции, для гармоник которых известны амплитуды, частоты и при этом неизвестны начальные фазы. Разработка аналитико-численного метода построения управления основана на подходе, предложенном в [1]. Рассматривается вспомогательная задача оптимального управления, функционал которого зависит от весового коэффициента. Окончательный выбор весового коэффициента обеспечивает построение управления. Проведено необходимое аналитико-численное обоснование предлагаемого метода.
1. Постановка задачи
Рассмотрим линейную управляемую систему с постоянными коэффициентами
x = Ax(t) + Bu(t) + f (t), (1)
где x - n -мерный вектор фазовых координат системы; u - r -мерный вектор управления; A - постоянная (n х n) -матрица; B - постоянная (n х r) -матрица, f (t) - n -мерный вектор внешних возмущений. Компоненты вектор-функции f(t) являются полигармоническими функциями
m
f (О = ZaP sin(®/ + Yj), (i = 1,2,...,n). (2)
j=1
Здесь амплитуды aj (i = 1, n, j = 1, m ) и частоты Cj (j = 1, m ) гармоник известны, а начальные
фазы Yj, (j = 1,m ) неизвестны.
Система управляется на бесконечном промежутке времени t > 0. При этом допустимыми управлениями u(t) являются непрерывно дифференцируемые функции, удовлетворяющие неравенствам
uT(t)Rku(t) < 1, (k = 1,2,...,p), t > 0, (3)
где Rk, (k = 1,2,...,p) - симметричные положительно-определенные (nх n)-матрицы.
1 Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 12-08-00309 а
Нормальное функционирование системы предполагает выполнение в установившемся режиме в каждый момент времени t > 0 фазовых ограничений
X7 (? (t) < 1, (I = 1,2,..., 5). (4)
Здесь Ql, (I = 1,2,...,5) - симметричные, неотрицательно-определенные (п х п)-матрицы. Требуется при полигармоническом возмущении f (?) с «наихудшими» начальными фазами
у. (у = 1, т ) найти допустимое управление ы*(?), при котором на траектории установившегося движения системы (1) выполняются в каждый момент времени ? > 0 фазовые ограничения (4).
Определение 1. Под «наихудшими» начальными фазами у. (у = 1, т ) понимаем такие начальные
фазы, для которых найдется момент времен ? > 0 такой, что при всех у = 1, т 8т(сту.? + у у) = 1. Ниже || • || - евклидовая норма.
Теорема 1. Если управление ы* (?) удовлетворяет условию
м ц2 1
ы(0 < —, ? > 0, (5)
М
где м - число наименьшее среди наибольших собственных значений матриц Rk, (к = 1,2,...,р), а соответствующая траектория х* (?)- условию
и ц2 1
х(?)2 <-, ? > 0 (6)
где 7] - число наименьшее среди наибольших собственных значений матриц Ql, (I = 1,2,...,5), тогда управление ы* (?) является допустимым управлением, обеспечивающим выполнение фазовых ограничений (4).
Доказательство теоремы 1. При фиксированном времени ? и для некоторой матрицы Rk рассмотрим задачу математического программирования
||ы(?)||2 ^ тт, ы7 (?)Якы(?) = 1, (7)
которую можно геометрически интерпретировать как задачу нахождения шара наибольшего радиуса, вписанного в эллипсоид.
Введя функцию Лагранжа в виде
Ь = ||ы(?)||2 + Я(1 - ы7 (?)Якы(?)), где Л - множитель Лагранжа, запишем условия стационарности
дТ
—— = 2(ы(?) - Щы(Г)) = 0. ды(?)
Таким образом, для нахождения стационарных точек имеем задачу
(Л1кк-Е )ы()) = 0, ы7 (?)Якы(?) = 1
которая заменой у = — сводится к задаче определения собственных значений и собственных векто-
Л
ров матрицы Як
(Як - уЕ)ы (?)) = 0,
при условии ы7 (?)Якы(?) = 1.
Известно, что у симметричной матрицы все собственные значения вещественны. Пусть все собственные значения пронумерованы в порядке возрастания у1 < у2 < — < уп. Обозначим соответствующие
им собственные векторы ы1 (?),ы2(?),- • ■ ,ып(?) .
Минимум в рассматриваемой задаче математического программирования (7) достигается на собственном векторе ып (?) , соответствующем наибольшему собственному значению уп. Действительно, имеем равенства
уп ||ып (?)( = (упып (?), ып (?)) = (Якып (?), ып (?)) = ып7 (? )Якып (?) = 1,
из которых следует справедливость вышесказанного.
Таким образом, если / является наименьшим среди наибольших собственных значений матриц
Rk, (к = 1,2,...,р), тогда (5) определяет шар наибольшего радиуса, вписанного в пересечение эллипсоидов (3). Отсюда следует, что управление и* (?), принадлежащее шару (5), принадлежит пересечению эллипсоидов (3), т.е. является допустимым управлением. Аналогично можно показать, если г/ является наименьшим среди наибольших собственных значений матриц Ql, (I = 1,2,...,5), тогда (6) определяет шар наибольшего радиуса, вписанного в пересечение эллипсоидов (4), и, следовательно, соответствующая управлению и*(?), траектория х*(?) удовлетворяет фазовым ограничениям (4). Теорема 1 доказана.
В силу теоремы 1 для построения закона движения рассмотрим задачу построения управления, удовлетворяющего ограничениям (5) и при полигармоническом возмущении f (?) с «наихудшими»
начальными фазами уу (у = 1, т ), обеспечивающего выполнение в установившемся режиме ограничений (6). Для этого рассмотрим вспомогательную задачу оптимального управления со среднеквад-ратическим функционалом, подынтегральная функция которого зависит от весового коэффициента, выбором которого обеспечивается выполнение ограничений (5) и (6).
2. Вспомогательная задача оптимального управления
Рассмотрим задачу оптимального управления:
х = Ах + Ви + f (?)
1 Т
J (и(-)) = Нт—|(а|| х(?)||2 + (1 -а)| |и(?) ||2 у?-
(8)
а||х(П|| + (1 -а)||и(Л|| Ш ^ тin,
12Т - \ - ' и(■)
где а (0 < а < 1) - весовой коэффициент.
Задача (8) является задачей аналитического конструирования оптимальных регуляторов (АКОР) при постоянно действующих возмущениях [1]:
х = Ах + Ви + f (?),
Т (9)
х'(.........
1Т
J(и) = Нт — I (х ' Qх + и'Яи)й1 ^ тт.
Т2Т 0 и(х,1)
т ^ 2Т ■
Здесь х - п -мерный вектор фазовых координат системы; и - г -мерный вектор управления; А -постоянная п х п -матрица; В — постоянная п х г -матрица; Q - неотрицательно-определенная, постоянная п х п -матрица; Я - положительно-определенная, постоянная г х г -матрица; f (?) - п -мерная заданная, непрерывная, ограниченная вектор-функция, характеризующая возмущения.
Для задачи АКОР (9) можно сформулировать следующую теорему [2].
Теорема 2. Если для матриц А и В выполняется условие управляемости
гапк[ВАВ..Ап-1В] = п, то оптимальное управление в задаче АКОР (9) имеет вид
и*(х,?) = -Я1В'(Кх + п(?)) , (10)
где симметричная положительно определенная матрица К - решение матричного алгебраического уравнения Риккати
КА + АК - КВЯ1В'К + б = 0, (11)
а п(?) - частное решение линейной системы дифференциальных уравнений
п(?) = -(А' - КВЯ 1В')п(?) + К f (?). (12)
Применение методики аналитического конструирования для решения задачи (8) требует решения матричного уравнения Риккати (11), кроме того, управление будет найдено в виде закона с обратной связью (10), и для определения закона движения возникает необходимость интегрирования уравнений движения при заданных начальных условиях. Поэтому для решения задачи оптимального управления (8) рассмотрим следующий подход. Так как, согласно постановке задачи, нас интересует уста-
новившийся закон движения, то будем искать стационарное оптимальное программное управление и соответствующую ему стационарную оптимальную траекторию.
Теорема 3. Если х(?) и у/ (?) стационарные решения системы
Г XX = Ах + ВЯ - В7 у + / (?),
Г 7 ^ (13)
[у/ = Qx - А>,
то стационарное оптимальное программное управление ы*(?) и соответствующая ей оптимальная траектория х* (?) в задаче оптимального управления (9) определяются следующим образом
ы' (?) = -Я1В'у/(?), х* (?) = /(?). (14)
Доказательство теоремы 3. Стационарная оптимальная траектория х* (?) определяется единственным стационарным решением системы
х = (А - ВЯ1В7К) х + ВЯ-'В7п(1?) + f (?), (15)
а соответствующее ей оптимальное программное управление в стационарном режиме в силу (10) определится выражением
ы' (?) = -Я 1 В7 (Кх* (?) + п(?)) , (16)
где К - решение матричного алгебраического уравнения Риккати (11), а п(?) - частное решение линейной системы дифференциальных уравнений (12).
Покажем, что
х(?) = х* (?) и у/ (?) = -К х* (?) + п(? ) (17)
стационарные решения системы (13). Для этого подставим (17) в систему уравнений (13)
х* (?) = Ах* (?) + ВЯ1В7 (-К х* (?) + п(?)) +(?),
<
-Кхх*(?) + П(?) = Qx*(?) - А7 (-Кх*(?) + п(?)).
Подставив правую часть первого уравнения во второе уравнение вместо производной х* (?), преобразовав, получим
х* (?) = (А - ВЯ1В7К) х* (?) + ВЯ 'В7п(?) + /(?), < (-КА + КВЯ1В7К - Q - А7К) х* (?) + (А7 - КВЯ 'В7 ) п(?) --К/ (?) + П (?) = 0.
Так как х* (?) является стационарным решением системы (15), то первое уравнение обращается в тождество. Второе уравнение также обращается в тождество, так как К - решение матричного алгебраического уравнения Риккати (11), а п(?) - частное решение линейной системы дифференциальных уравнений (12). Теорема доказана.
Для нашей задачи система (13) имеет вид
х = Ах + —1— ВВ у + / (?),
(1 -а) (18)
у/ = ах - А у
где / (?) = ^ а1 8т(ю.? + у).
i=1
3. К построению алгоритмического обеспечения нахождения стационарного решения систе-
мы (18)
Будем искать стационарное оптимальное программное управление и соответствующую ему ста-
ционарную оптимальную траекторию согласно теореме 3. Тогда нам достаточно найти частное решение системы (18).
Возьмем систему с . -ой гармоникой слагаемого /(?)
Перепишем (19) в виде
x = Ax +1BB'у + at sin(att + у), у = ax - A 'у.
X = Ax +1 BB 'у + as in(a t),
(19)
(20)
у/ = ax - A 'y.
Частное решение системы (20) будем искать в следующем виде
Гx(t) = ax sin at + bx cos cot,
W(t) = ay sin cot + by cos at. Подставляя (21) в (20), получим систему линейных алгебраических уравнений относительно
(21)
a , a , b , b
x' у' x' у
ab + Aa + BB' a + a = 0,
x x 1 -a у
Ab BB'b -aa = 0,
x 1 -a у
aK +aax - A '^ = 0 abx -a% - A 'Ьу = 0
Таким образом, частное решение системы (20) и управление будут иметь следующий вид
х(£,а) = ах + Ьх (a)cosюf,
и(£,а) = аи (а^тю? + Ьи (a)cosюf. Решение системы (19) будет иметь вид
т
х(£ ,а) = ^ х' (а^т(®'? + у1 + у1)
(22)
i(t ,a) = J м' (a)sin(a,.t + у + у ¡)
где x
(a) = Vax'2 + bx'2 , м' (a) = ^a/ + b
у ¡ = arc t
b
В формуле (22), нужно заметить, операции взятия арифметического корня и арктангенса производятся над компонентами векторов ах, Ьх, аи, Ьи.
4. О выборе весового коэффициента, обеспечивающего выполнение заданных требований
Для стационарного оптимального управления и (£,а) и для соответствующей ей траектории
х(£,а) в силу (22) квадраты нормы определяются соотношениями
||x(t,a)|| =
||w(t,a)|| =
J x (a)sin(at+у + уд
i=1
m
J м (a)sin(at + У + у i)
Согласно теореме 1 весовой коэффициента следует выбрать из условия выполнения неравенств в каждый момент времени £ > 0
||x(t,a)|| =
J x (a)sin(at+у + у,)
i =1
1
a
x
2
2
i =1
2
п
||u(t,a)|| =
J и' (a)sin(alt + у, + у,)
1
<—. М
Учитывая «наихудшие» фазовые смещения, введем в рассмотрение функции 8 (а),%(а) следующим образом
S(a) = max
t
X(a) = max
J x (a)sin(®'t + у, + yt)
J x' (a)
!=1
m
J U (a)
(23)
(24)
£ и' (а)ъш(®,* + ^ + х,)
* 1=1
Численные эксперименты показали справедливость следующего утверждения.
Утверждение. Если а меняется от нуля до единицы, то 8 (а) монотонно убывает, а % (а ) монотонно возрастает.
Найдем коэффициенты а а , такие, что 8(а1) = —, %(аЛ) = —.
1 1 л л
Исходя из монотонности функций 8 (а ) и % (а), можно предположить, что найдется коэффициент а*, принадлежащий отрезку [а ац].
При любом коэффициенте а , принадлежащем данному отрезку, соответствующее управление и (**) будет удовлетворять ограничениям (3), а фазовая траектория х (*) будет удовлетворять в каждый момент времени * > 0 фазовым ограничениям (4).
5. Численные эксперименты
Пример 1. Рассмотрим линейную управляемую систему
X = х2 + 3х3 + 6и2 + 28т(*), Х2 = 6х— + 7 х2 + 4х3 + и— + и2, Х3 = 5.1х— + 2х2 + 5х3 + 3и— + 2.1и2
при заданных ограничениях на управление
Mj + 4mjU2 + 5M2 < 1
необходимо обеспечить выполнение фазовых ограничений
2 Xj 2 Xj Х2 2 Х2 2 Х2 Х3 +2 Х3 < 1.
Г 0 1 3 > Г 0 6 > Г 2 ^ Г 2 -1 0Л
Здесь A = 6 7 4 , в = 1 1 , a = 0 , Ю= 1, Q = -1 2 -1
V 51 2 5 У 3 2 1 V0 У ч 0 -1 2 у
R =
(1 2 ^ v2 5 у
В результате вычислений получили
1 = 0.292893218813452, ц
— = 0.171572875253810, М
an = 0.274570691328006, au = 0.143547940495262.
Пользуясь программным комлексом DISLIN для компилятора CVF 6.6, строим графики функций S(a), %(a).
S(a) - убывающая функция x(a) - возрастающая функция
1=1
2
2
i=1
2
2
alpha
Рис. 1
Заключаем, что искомый весовой коэффициент а* е [0.143547940495262,0.274570691328006].
Пример 2. Рассмотрим линейную управляемую систему X = 8х1 + 18х2 + 21х3 + 5и1 + 3и2 + 41и3 + 29и4 + 3sm(5í), <х2 = 19 х + 11х2 + 24 х3 + 8и1 + и2 + 19и3 + 7и4 + 5Ып(5^), хх3 = 22х1 + 23х2 + 5 х3 + 4и1 + 2и2 + 42и3 + 8 sin(5í) при заданных ограничениях на управление
6и;2 + 8и1и2 + 14и1и3 - 6и1и4 + 51и2 + 16и2и3 + 10и2и4 + 28и^ + 2и3и4 + 32и^ < 1 необходимо обеспечить выполнение фазовых ограничений
х;2 + 2.4хх2 + 2хх3 + 4х\ + 6х2х3 + 5х^ < 1.
Г 8 18 21> Г 5 3 41 29 > Г 3 ^ Г1 1.2 1 ^
Здесь A = 19 11 24 , в = 8 1 19 7 , a = 51 , а> = 5, Q = 1.2 4 3
ч 22 23 5 У V 4 2 42 0 У V 8 У V 1 3 5 У
Г 6
R =
-3^
4 7
4 51 8 5
7 8 28 1
-3 5 1 32
В результате вычислений получили 1 = 0.126810680780817,
— = 1.811881624760944E - 002, И
av = 0.995648259402358,
а„ = 2.828223293916058E - 003.
И
Пользуясь программным комлексом DISLIN для компилятора CVF 6.6, строим графики функций S(a), х(а).
S(a) - убывающая функция ^(а) - возрастающая функция
11.0 -1
10.0 9.0 -
8.0 :
alpha
Рис. 2
Заключаем, что искомый весовой коэффициент а* е [0.002828223293916058,0.995648259402358].
Заключение
В работе рассмотрена задача удержания системы в фазовых ограничениях при постоянно действующем полигармоническом возмущении, которая сводится к решению вспомогательной задачи оптимального управления с критерием, зависящим от весового коэффициента, выбор которого обеспечивает решение задачи.
Алгоритмическая реализация разработанного аналитико-численного метода решения задачи предусматривает:
1. Нахождение собственных значений матриц Rk, (k = 1,2,...,p) и среди найденных собственных значений выбор / наименьшего среди наибольших собственных значений матриц.
2. Нахождение собственных значений матриц Qj, (I = 1,2,..., s) и среди найденных собственных значений выбор 7] наименьшего среди наибольших собственных значений матриц.
3. Поиск весовых коэффициентов аи и а7, удовлетворяющих соответственно условиям
Х(а») = — и 5(ап) = 1.
4. Если выполняется условие аи > а^ , то для построения эталонного управления (12) и соответствующей ей эталонной траектории (13) можем, в силу теоремы 5, выбрать любой весовой коэффициент а = а* из отрезка [а7,ам~\ .
Для реализации предложенного аналитико-численного метода разработано программное обеспечение на языке Фортран.
Литература
1. Мижидон А.Д., Мижидон К.А. Задача оптимального управления линейной системой при фазовых и смешанных ограничениях // Вестник Бурятского государственного университета. 2013. №9. С. 17-24.
2. Мижидон А.Д. Об одной задаче аналитического конструирования оптимального конструирования // Автоматика и телемеханика. 2011. № 11. С. 102-116.
Мижидон Арсалан Дугарович, доктор технических наук, профессор, заведующий кафедрой ВосточноСибирского государственного университета технологий и управления, тел.: (902-5) 633204, e-mail: [email protected]
Мижидон Клара Арсалановна, преподаватель кафедры Восточно-Сибирского государственного университета технологий и управления, тел.: (951-6) 398322, e-mail: [email protected]
Лобанов Алексей Валерьевич, студент Бурятского государственного университета, тел.: (950-3) 944685, email: [email protected]
Mizhidon Arsalan Dugarovich, doctor of technical sciences, professor, head of applied mathematics department, East-Siberian State University of Technology and Management.
Mizhidon Klara Arsalanovna, teacher, applied mathematics department, East-Siberian State University of Technology and Management.
Lobanov Alexey Valeryevich, student, Buryat State University.
УДК 517.977
© Д. О. Трунин, Д. Ганхуяг
МЕТОД НЕЛОКАЛЬНОГО УЛУЧШЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ С ФУНКЦИОНАЛЬНЫМИ ОГРАНИЧЕНИЯМИ
Работа выполнена при финансовой поддержке РФФИ (проекты 12-01-00914-а, 12-01-98011-р_сибирь_а, 13-01-92200-Монг_а)
В статье предлагается процедура нелокального улучшения допустимых управлений в нелинейных управляемых системах с функциональными ограничениями.
Ключевые слова: задача оптимального управления, нелокальное улучшение, функциональные ограничения.
D.O. Trunin, D. Gankhuyag
METHOD OF NONLOCAL IMPOVMENT OF CONTROLLED SYSTEMS WITH FUNCTIONAL CONSTRAINTS
In the article a nonlocal improvement procedure of admissible control in nonlinear controlled systems with functional constraints is proposed.
Keywords: optimal control problem, nonlocal improving, functional constraints.
Введение
В [1] для полиномиальных по состоянию задач оптимального управления со свободным правым концом построены методы нелокального улучшения управлений, основанные на нестандартных формулах приращения функционала без остаточных членов разложений. Отсутствие операции варьирования управлений и возможность улучшения управлений, удовлетворяющих принципу максимума, обусловливают повышенную эффективность построенных методов. В работе [2] эти методы обобщены на класс нелинейных задач оптимального управления со свободным правым концом. В данной статье предлагается процедура нелокального улучшения допустимых управлений для нелинейных задач оптимального управления с дополнительными функциональными ограничениями.
1. Постановка задачи
Рассматривается задача оптимального управления [3, 4] с функциональными ограничениями типа равенства
x = f (x,u,t), t e T = [t0,t ], (1)
x(t0) = x0, u(t) e U, (2)
O0(u) ^ min, (3)
ф. (u) = 0, i = 1s. (4)
Функционалы (3), (4) имеют вид
ф. (u) = (p. (x(t1)) + f F (x,u, t)dt, i = 0, s.
JT
Задачу (1)-(4) сведем к задаче оптимального управления с частично закрепленным правым концом [5]. Для этого преобразуем функциональные ограничения (4)