Вычислительные технологии
Том 6, № 6, 2001
МЕТОДЫ ИНТЕРВАЛЬНОГО АНАЛИЗА В СИНТЕЗЕ РОБАСТНОГО УПРАВЛЕНИЯ *
В. Н. Шлшихин
Санкт-Петербургский государственный технический университет, Россия
The method for solving the interval matrix equations, which appear in the synthesis of robust controls, is considered. The suggested method is based on the iterative procedure of solving two algebraic equations with real coefficients, which are in accord with the boundary values of parameters of the investigated system.
Введение
При синтезе управлений, обеспечивающих робастную устойчивость и робастное качество по отношению к параметрическим возмущениям, могут быть использованы математические модели систем в виде дифференциальных уравнений с интервальными коэффициентами
• def
x = dx/dt = Ax + Bu, x(0) = x0, (1)
где A e Mn>n(I(R)), A = [A; A], A = (агз)?.=1, Oij = [аг]; агз], B e Mn>m(I(R)), B = [B;B],
B = (bij)П=1, bij = [bij; bij], Mn,n(I(R)) — множество матриц, элементами которых являются вещественные интервалы I(R).
Синтез систем с робастными свойствами заключается в определении управления, которое обеспечивает устойчивость множества объектов (1) с заданным показателем [1]
а < а < а (а e а = [а; а]) (2)
либо гарантирует принадлежность значений квадратичного функционала качества интервалу требуемой ширины [2]
J < J(x,u) = J(xTGx + uTRu)dt < J (J e J=[J; J]). (3)
0
Методика синтеза робастного регулятора, обеспечивающего свойство (2) и (или) свойство (3), основана на обобщении достаточных условий существования оптимального управления [3]. Обобщение получено с использованием интервальной функции Ляпунова
V(x) = [V(x); V(x)] = [xTPx; xTPx] = xTPx
*Материалы были доложены на XVI конференции по интервальной математике, Красноярск, 17-19 августа 1999 г.
© В.Н. Шашихин, 2001.
и функционального уравнения Беллмана
шт^ирЦЛ^х)/^ \х € + хТСх + итЕп} = 0 ,
и
которые позволяют выделить множество регуляторов и = -Е-1 ВТРх, обеспечивающих оптимальную стабилизацию системы (1) [2]. В функциональном уравнении Беллмана ^ — интегральная воронка решений системы (1) при различных значениях параметров.
Параметры стабилизирующего робастного регулятора определяются интервальной матрицей Р, которая должна быть симметричным положительно определенным решением (У Р € Р, Р = РТ > 0) интервального уравнения
АТ р + М - рв р + <5 = 0, В = В Е-1 вТ, (4)
где А, Р, В, С € Мпп(1 (Е)) — интервальные матрицы. Предполагается, что В = ВТ > 0 (УВ € В, В = ВТ > 0), <5 = <СТ > 0 (УС € <5, С = СТ > 0). Матрица С — матрица квадратичной формы функционала (3), но в уравнении (4) и далее рассматривается общий случай с интервальной матрицей С.
Под интервальным матричным уравнением (4) понимается совокупность всех точечных уравнений АТ Р + РА - РВР + С = 0, где А € А, В € В, С € С.
При определении параметров робастного регулятора, следуя применяемым в интервальном анализе [4] методам решения уравнений с неточно заданными коэффициентами, будем использовать подход, основанный на построении оценок (внутренних или (и) внешних) для множества так называемых точечных решений.
В работе предлагается методика решения интервального матричного уравнения типа Риккати, основанная на интервальном итерационном процессе, на каждом шаге которого решается система линейных алгебраических уравнений.
1. Постановка задачи
Множество матриц, удовлетворяющих условию
Р = [Pe Rnxn (ЗА е А)(ЗD е D)(3G е G)(AT P + PA - PBP + G = 0)}, (5)
назовем объединенным множеством решений интервального матричного уравнения (4), которое образовано всеми решениями точечных уравнений ATP + PA - PDP + G = 0, где А е А, D е D, G е G. Объединенное множество решений, как правило, имеет сложную структуру, и его точное описание весьма трудоемко. Поэтому ограничимся внешним оцениванием объединенного множества решений, которое сводится к определению множества более простой структуры, содержащего множество (5). Далее будем решать задачу внешнего оценивания:
найти интервальную матрицу Pe = [Pв; Pв], которая включает объединенное множество решений P интервального уравнения (4):
Pb D P, где (pB)j D pj, i,j = l,n. (6)
В отличие от задачи внутреннего оценивания:
найти интервальную матрицу Рвн = [Pвн; Pвн], которая содержится в объединенном множестве решений P интервального уравнения (4):
Рвн С P, где (рвнС pij, i,j = l,n, (7)
задача внешнего оценивания в большей степени отвечает целям синтеза робастного управления в силу следующих причин. Симметричное положительно определенное решение Р уравнения ATP + PA — PDP + G = 0 обеспечивает устойчивость точечной системы x = Ax + Bu с регулятором u = —R-1BT Px, т. е. принадлежность собственных чисел матрицы (A — BR-1BTP) левой полуплоскости (ReAi(A — BR-1BTP) < 0, i = l,n) [5]. При использовании внутренних оценок PBH и регулятора u = —R-1B tPbh x обеспечивается устойчивость не множества систем типа (1), определяемого матрицами A и B, а более "узкого" множества ABH С A, BBH С B. Последнее имеет место из-за того, что оценка PBH содержит не все элементы объединенного множества решений P. Внешние оценки PB и регулятор u = —R-1BTPBx обеспечивают устойчивость более "широкого" множества систем AB D A, BB D B, так как оценка PB содержит дополнительные по отношению объединенного множества решений элементы.
Таким образом, использование внешних оценок объединенного множества решений приводит к расширению исходного множества объектов, для которых синтезированное робастное управление является стабилизирующим, а использование внутренних оценок — к сужению это множества.
2. Метод решения
Внешнюю оценку (6) для объединенного множества решений уравнения (4) будем строить в виде интервальной матрицы
Pb = [Pb ; Pb]. (8)
Для определения внешней оценки будем использовать интервальный итерационный процесс, позволяющий свести решение уравнения (4) к многократному решению интервального линейного матричного уравнения
[A — Di^B(fc)]Ti^B(k +1) + PB(k + i)[A — DPb(k)] = -[G + P^DP^k)], k = 0, l,2,... (9)
Утверждение. Пусть пары матриц (A,B), (A,B) управляемы, тогда внешняя оценка Pe (8) для объединенного множества решений интервального уравнения (4) равна пределу последовательности внешних оценок Pe(k), соответствующих итерационному процессу (9):
PB = lim PB(k), k (10)
Здесь lim PB(k) — предел интервальной матрицы PB(k), определенный через пределы матриц с вещественными элементами
lim PB(k); lim PB(k)l , где матрицы PB(k), PB(k) удовлетворяют следующим соотношениям:
[A — DPB(k)]TPB (k + 1) + PB(k + 1)[A — DPB(k)] = — [G + PB(k)DPB(k)], (11)
lim pPb (k) =
[А - БРв(к)]тРв(к + 1) + Рв(к + 1)[А - БРв(к)] = -[С + Рв(к)БРв(к)]. (12)
Доказательство. Покажем по индукции, что при любом к = 0,1, 2,... матрица (А -БРв(к)) устойчива и уравнение (11) в силу теоремы Ляпунова имеет единственное положительно определенное решение.
Пусть в > 0 таково, что в > - Ив АДА) (АДА) — собственное число матрицы А), тогда матрица — (А + вЕ) устойчива (Е — единичная матрица), а матрица Рв(0), удовлетворяющая уравнению
-(А + вЕ)тРв(0) - Рв(0)(А + вЕ) + 2Б = 0,
является положительно определенной в силу теоремы Ляпунова [6]. При таком способе определения матрицы Рв(0) матрица (А - БРв(0)) устойчива в силу справедливости тождества
(А - ЁРв(0))тРв(0) + Рв(0)(А - ЁРв(0)) + 2вРв(0) = 0
и обратного утверждения теоремы Ляпунова.
Предположим, что доказана устойчивость матрицы (А - БРв(к)), тогда матрица Рв(к + 1) однозначно определена уравнением (11) и нужно показать, что матрица (А -БРв(к + 1)) также устойчива.
При доказательстве будет использовано следующее тождество, справедливое для любых симметричных матриц Н и Н [5]:
Н(А - БН) + (А - БН)тН + НБН = = Н(А - БН) + (А - БН)тН + НБН - (Н - Н)Б(Н - Н). (13)
Полагая в соотношении (13) Н = Рв, Н = Рв(к), А = А, Б = Б, получаем
[А - БРв(к)]тРв + Рв [А - БР в (к)] + РвБРв = -С - [Рв(к) - Рв]Б[Рв(к) - Рв]. (14) Вычитая уравнение (14) из уравнения (11), имеем
[А - БРв(к)]т[Рв(к + 1) - Рв] + [Рв(к + 1) - Рв] [А - БР в (к)] =
= -[Рв(к + 1) - Рв]Б[Рв(к + 1) - Рв].
Так как правая часть последнего равенства отрицательно полуопределена, а матрица (А -БРв(к)) устойчива, то из теоремы Ляпунова следует [Рв(к +1)-Рв] > 0 или Рв(к+1) > Рв.
Полагая в равенстве (13) Н = Рв(к +1), Н = Рв(к), А = А, Б = Б, преобразуем уравнение (11) к виду _ _
[А - БРв (к + 1)]тРв(к + 1) + Рв(к + 1)[А - БРв (к + 1)] =
= -С - [Рв(к +1) - Рв(к)]Б[Рв(к +1) - Рв(к)] - Рв(к + 1)БРв(к + 1). (15)
Если равенство (14), в котором индекс к заменен на к + 1, вычесть из уравнения (15), то получим следующее выражение:
[А - БР в (к + 1)]т[Рв(к + 1) - Рв] + [Рв(к + 1) - Рв] [А - БР в (к + 1)] =
= - [Р в(к) - Рв (к + 1)]Б[Р в(к) - Рв(к + 1)] - [Рв (к + 1) - Рв]Б[Рв(к + 1) - Рв]. (16)
Правую часть этого уравнения обозначим через T. Очевидно, что матрица T отрицательно полуопределена. Предположим, что существует вектор x = 0 такой, что (A — DPB(k + 1))x = Ax, ReA < 0. Умножая равенство (16) слева на xT и справа на x, получаем
(А + A)xT(PB(k + 1) — PB)x = xTTx.
Так как T < 0, а матрица (PB(k +1) — PB) > 0, то последнее равенство выполняется лишь при xTTx = 0 или xT[PB(k) — PB(k + 1)]D[PB(k) — PB(k + 1)]x. D — положительно полуопределенная матрица, поэтому D[PB(k) — PB(k + 1)]x = 0. Отсюда (A — DPB(k))x = (A—DPB(k+1))x = Ax, что противоречит условию устойчивости матрицы (A — DPB(k +1)). Следовательно, матрица (A — DPB(k + 1)) должна быть устойчивой.
Если уравнение (11), в котором индекс k + 1 заменен на k, вычесть из уравнения (15), получим уравнение Ляпунова относительно матрицы (PB(k) — PB(k + 1)):
[A — DPB(k)]T[PB(k) — PB(k + 1)] + [PB(k) — PB(k + 1)] [A — DPB(k)] =
= — |PB(k) — PB(k + 1)]D[P B(k) — PB(k + 1)].
В силу теоремы Ляпунова матрица [PB(k) — PB(k + 1)] положительно полуопределена, т. е. PB(k) > PB(k + 1). Таким образом, последовательность матриц {PB(k)} является последовательностью невозрастающих положительно полуопределенных матриц, ограниченных снизу матрицей PB (невозрастание и ограниченность понимается в смысле частичного порядка > на множестве симметричных матриц, задаваемого правилом C > D, если разность C — D положительно полуопределена). Отсюда следует существование предела последовательности {PB(k)}, равного PB. Переходя к пределу в уравнении (11), убеждаемся, что lim PB(k + 1) = Pb.
Выполнив аналогичные действия для решения PB(k) уравнения (12), получаем PB(k) > PB(k + 1) > Pb и lim PB(k) = Pb.
к^гх
Следовательно, внешняя оценка PB для объединенного множества решений интервального уравнения (4) равна пределу последовательности внешних оценок PB(k) для объединенного множества решений итерационного процесса (9):
Pb = [Pb;Pb] = [lim P,(k); lim PB(k)] = lim PB(k),
что и требовалось доказать. U
Пример. Рассмотрим пример, иллюстрирующий предлагаемую методику решения интервального уравнения. Пусть
A = [—5; —3], B=[1;3], (5 = [2; 4], R = 1, D = BR-1BT.
В этом случае интервальное уравнение типа Риккати принимает вид
[—5; — 3]P + P[—5; —3] — P[1; 9]P + [2; 4] = 0,
а объединенное множество его решений равно P = [0.173048725; 0.605551275]. Уравнению (4) соответствует интервальный итерационный процесс (9)
{[—5; —3] —[1;9]JpB(k)}JpB(k+ 1) + Д^+1){[—5; — 3] — [1; 9]£(k)} = —{[2; 4] + ^(k)[1; 9]^)}.
Решая системы (11), (12) с вещественными коэффициентами, находим
к Рв (к) Р Р Рв (к)
0 1.000000000 0.173048725 0.605551275 1.000000000
1 0.392857143 0.173048725 0.605551275 0.625000000
2 0.198520622 0.173048725 0.605551275 0.605603448
3 0.173478932 0.173048725 0.605551275 0.605551275
4 0.173048852 0.173048725 0.605551275 0.605551275
5 0.173048725 0.173048725 0.605551275 0.605551275
6 0.173048725 0.173048725 0.605551275 0.605551275
Сравнивая полученные внешние оценки и объединенное множество решений, приходим к выводу, что для них справедливо следующее включение:
рв(5) = [0.173048725; 0.605551275] Э Р = [0.173048725; 0.605551275].
Заключение
Для вычисления решений матричных интервальных уравнений типа Риккати, которые возникают при синтезе робастных управлений в системах с неопределенно заданными параметрами, предложен алгоритм, основанный на итерационном решении двух линейных алгебраических уравнений с вещественными коэффициентами, соответствующими граничным значениям параметров исследуемой системы.
Список литературы
[1] ШАшихин В. Н. Робастная стабилизация интервальных динамических систем // Изв. РАН. Теория и системы управления. 1996. №6. С. 47-53.
[2] ШАшихин В. Н. Децентрализованное субоптимальное управление параметрически возмущенными системами с запаздыванием // Там же. 1998. №1. С. 56-63.
[3] КунцЕвич В. М., Лычак М. М. Синтез систем автоматического управления с помощью функций Ляпунова. М.: Наука, 1977.
[4] Калмыков С. А., Шокин Ю. И., Юлдашев З. Х. Методы интервального анализа. Новосибирск: Наука, 1986.
[5] ИкрАмов Х. Д., САгитов М. С. О разрешимости матричных алгебраических уравнений Риккати // Вычислительные процессы и системы. Вып. 9. М.: Наука, 1993. С. 163248.
[6] Ляпунов А. М. Общая задача об устойчивости движения. М.: Гостехиздат, 1950.
Поступила в редакцию 26 мая 1998 г., в переработанном виде —11 февраля 2000 г.