Научная статья на тему 'Минимаксное управление сингулярно возмущенной системой с неполной информацией'

Минимаксное управление сингулярно возмущенной системой с неполной информацией Текст научной статьи по специальности «Математика»

CC BY
107
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МИНИМАКСНОЕ УПРАВЛЕНИЕ / НЕГЛАДКАЯ ОПТИМИЗАЦИЯ / СИНГУЛЯРНО ВОЗМУЩЕННАЯ СИСТЕМА / MINIMAX CONTROL / NONSMOOTH OPTIMIZATION / SINGULAR PERTURBED SYSTEM

Аннотация научной статьи по математике, автор научной работы — Мышков С. К.

Рассматривается задача построения минимаксного управления линейной стационарной сингулярно возмущенной системой при существенно неполной информации, так как в управлении используются и при том частично только доминирующие координаты состояния. Показано, что главные члены асимптотических представлений для минимаксного управления и соответствующего значения функционала целиком определяются решением редуцированной задачи минимакса. Библиогр. 15 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Minimax control of singular perturbed system with incomplete information

The problem of designing the minimax control of a linear stationary singular perturbed system is considered when only a part of dominant state coordinates may be used in the control law. It is proved that the main terms of asymptotic representations for the minimax control and the corresponding value of functional are entirely determined by the minimax solution of the reduced problem.

Текст научной работы на тему «Минимаксное управление сингулярно возмущенной системой с неполной информацией»

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

Сер. 10. 2009. Вып. 4

УДК 517.97 С. К. Мышков

МИНИМАКСНОЕ УПРАВЛЕНИЕ СИНГУЛЯРНО ВОЗМУЩЕННОЙ СИСТЕМОЙ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ*)

Классическое решение задачи стабилизации в форме аналитического конструирования регулятора (АКР) [1, 2] в системах управления с неполной информацией о координатах состояния (с неполной обратной связью) достигается только при достаточно жестких ограничениях, накладываемых как на параметры объекта управления, так и на коэффициенты квадратичного критерия качества [3, 4]. Выходом из такой ситуации является определенная модификация классической задачи АКР. Получающееся при этом решение задачи оптимальной стабилизации, естественно, не будет оптимальным в классическом смысле, а потому все такие решения задачи АКР часто называют субоптимальными. Наиболее популярен подход, когда в канале управления все или часть недоступных измерению координат состояния объекта заменяется на их оценки, полученные тем или иным способом: фильтр Калмана, наблюдатели Луенбергера и др. [5, 6]. Основными недостатками здесь являются существенное усложнение задачи (повышение порядка системы дифференциальных уравнений) и неустранимая погрешность в субоптимальном управлении, вызванная неизбежным отличием оценки координат состояния от их истинных значений (поскольку оценки обеспечивают разве лишь асимптотическую близость). Существуют подходы, связанные исключительно с модификацией функционала, в которых достигается оптимальная в среднем стабилизация программного движения [3, 7]. Получающееся при этом решение зависит от информации о начальном положении объекта.

В настоящей работе рассмотрена модификация критерия качества, при которой возникает дискретная задача минимакса [8]. Основные результаты обусловлены особенностями сингулярно возмущенных систем, в которых движение объекта представляет комбинацию быстрых и медленных (доминирующих) мод [9]. В линейных стационарных динамических системах это обусловлено тем, что все множество собственных значений можно разделить на две группы, в одну из которых входят собственные значения порядка 0(1) (им соответствуют доминирующие моды), а в другую - порядка 0( —), где j - малый параметр: 0<j^1. Системы дифференциальных уравнений (ДУ), обладающие подобным свойством, относят к жестким системам ДУ, что вызвано особенностями численного интегрирования таких уравнений. Разработаны некоторые методы приведения жестких систем ДУ к стандартному виду, используемому в п. 1 (см. [10] и цитируемую в ней литературу).

Мышков Станислав Константинович — доцент кафедры математической теории моделирования систем управления факультета прикладной математики—процессов управления Санкт-Петербургского государственного университета. Количество опубликованных работ: 50. Научные направления: оптимальное управление, недифференцируемая оптимизация, устойчивость. E-mail: [email protected].

+ ) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (грант № 09-01-00360).

© С. К. Мышков, 2009

1. Постановка задачи. Функционирование линейной стационарной сингулярно возмущенной системы управления (СВСУ) с неполной информацией о координатах состояния при отсутствии внешних возмущений и ошибок измерения описывается следующими соотношениями:

x i = Pnx1 + P12X2 + Qiu, xi(0) = xw, (1)

jJX2 = P21 xi + P22X2 + Q2U, X2 (0) = X20, (2)

z = H1X1, (3)

u = Mz. (4)

Здесь xi € Rni ,X2 € Rn2 - векторы координат состояния; u € Rr - вектор управления; z G Rm - вектор измерений; t ^ 0 - время; ц - малый параметр, 0 < ц ^ 1; Pij,Qi,Hi,M - матрицы соответствующих размерностей, не зависящие от времени; матрица P22 - гурвицева, т. е. ReAi(P22) < 0, i€[1 : n2]. Предполагается, что

rank(Q) = r, rank (Hi) = m; r, m < ni, что означает неполную информацию о доми-

нирующих координатах и полное отсутствие информации о быстрых координатах. Далее потребуется компактная запись уравнений (1)-(3):

x = Px + Qu, x(0) = xo, (5)

z = Hx, (6)

где x^Rn, n = ni + n2,

Введем множество М = {МєНгхт\Ке\і(Р+QMH)<0, іє[1 : п]}. Пусть М = 0, т. е. система (1)-(4) стабилизируема. В задаче оптимальной стабилизации минимизируется квадратичный функционал

СЮ

1 (и) = J (х* Ах+х* Ви+и* В* х+и* Си)А (8)

о

на множестве допустимых управлений и = Мг, МєМ. Здесь А, В, С - матрицы подходящих размеров с независящими от Ь коэффициентами, причем квадратичная форма под интегралом положительно-определенная и С > 0; * - знак транспонирования.

Функционал (8) на решениях системы (1)-(4) при М єМ принимает значение

1 (и) = J (М,хо )= х* 0(М )хо, (9)

где 0(М) - решение алгебраического уравнения Ляпунова

0(Р + QMH ) + (Р + QMH )*0 + Ж (М ) = 0 (10)

с положительно-определенной матрицей

Ж (М) = А + ВМН + (ВМН)* + (МН)*СМН.

В общем случае для системы управления (5) с измерениями (6) не существует управления (4) с М € М, оптимального по отношению к функционалу (8) для Ухо€Яп [4], т. е. оптимальное значение матрицы М будет зависеть от начального состояния хо системы (5), что делает такое решение практически непригодным. Поэтому рассмотрим следующую модификацию квадратичного функционала (9):

I (М ) = тах 1 (М,хо) = Хтах0(М). (11)

||жо 11 = 1

Управление ио = Мог, Мо € М, при котором функционал (11) имеет наименьшее значение, называется минимаксным управлением. Решая задачу оптимизации функционала (11) при ограничении (10), приходим к следующему утверждению.

Теорема 1. Для того чтобы управление ио = Мог,Мо € М было минимаксным, необходимо, чтобы система уравнений

СМИЬИ* + ((^* 0 + Б*)ЬН* =0, (12)

0(Р + ЯМН ) + (Р + QMH )*0 + Ш^ (М ) = 0, (13)

Ь(Р + QMH)* + (Р + QMH)Ь + V * V* =0, (14)

0у = XV (15)

имела решение в виде 0 > 0,Ь ^ 0,Х > 0,у € Нп,М € М, где X - максимальное собственное значение матрицы 0, V - соответствующий собственный вектор.

При этом если матрица НЬН* - неособая, то искомое значение матрицы Мо из (12) определяется однозначно:

Мо = -С-1^*0 + Б*)ЬН* (НЬН*)-1. (16)

При Б = 0 это утверждение получено в [11]. При Б = 0 доказательство проводится аналогичным образом. Обобщение необходимых условий, содержащееся в теореме 1, позволяет решить не только исходную задачу, но и редуцированную задачу управления, которая играет в теории сингулярно возмущенных систем ключевую роль.

Замечание 1. Условия стабилизируемости системы (1)-(4) и положительной определенности квадратичной формы функционала (8) обеспечивают существование минимаксного управления, но единственность решения не гарантируется.

2. Редуцированная задача. Исходные соотношения в этой задаче получаются из (1)-(4), (8) после подстановки ц = 0. Тогда, в силу неособенности Р22, из (2) найдем Х2 = -Р—1(Р21 Х1 + Q2u). Это позволяет исключить Х2 в остальных формулах,

так что в результате придем к следующим соотношениям:

Хв Р8Хв + Qsus, Хв(0) Хs0, (17)

Н-8Х8, (18)

и8 = М8г8, (19)

СЮ

18(и8) = 18(М,8, Х8о) = I (Х* А,8Х8 + х*Б,8и,8 + и**Б**Х8 + и*С8и8)& = Х*о08(М8)Х8о, о

18(М8) = тах .18(М8,Х8о) = Хтах08(М8). (20)

11*го||=1

Здесь х8 € Нп1, и8 € Нг, г8 € Нт - векторы координат состояния, управлений и измерений; матрицы Р8^8,Н8,А8,Б8, С8 не зависят от £ и определяются равенствами

при этом использовано разбиение матриц А, В на блоки, аналогичное разбиению матриц Р^ в (7); очевидно, что А8 > 0,С8 > 0. Матрица 08 определена ниже.

Введем множество М8 = {М8єЯгхт\Ке\і(Р8 +Q8M8H8),i Є [1 : п{\}. Пусть М8 = 0, т. е. система (17)-(19) - стабилизируема.

Лемма. Если матрица Р22 - гурвицева и редуцированная система (17)-(19) стабилизируема, то линейная сингулярно возмущенная система управления (1)-(4) стабилизируема при всех ц Є (0,Д), где Д - положительная константа.

Действительно, если М8 = 0, то матрица Р8 + Q8M8H8, УМ8 Є М8 будет гурвице-вой. При выполнении условий леммы тогда по теореме Климушева-Красовского [12] существует Д > 0 такое, что для всех ц Є (0, Д) матрица Р + QMH при М = М8 будет гурвицевой, а это означает стабилизируемость системы (1)-(4) и выполнение условия

Ясно, что Ш8(М8) > 0. В соответствии с теоремой 1, если редуцированная задача (17)—(20) разрешима и и8 = М8г - минимаксное управление, то матрица М8 совместно с 08 > 0, Ь8 ^ 0,у8,Х8 необходимо является решением следующей системы уравнений:

где Х8 ,у8 - наибольшее собственное значение и соответствующий собственный вектор матрицы 08. Если при этом матрица Н8Ь8Н** неособая, то из (21) единственным образом находим

Отметим, что редуцированная задача имеет порядок п < п и не зависит от малого (и к тому же трудно определяемого на практике) параметра ц. (О методах решения системы (21)-(24) см. [4, 11, 13].)

3. Главные члены оптимального решения. Будем искать искомое решение уравнений (12)-(15) в виде следующих рядов [14, 15]:

Р8 = Рі1 - Р12Р221Р21, Q8 = Ql - Р12Р22^2, Н-8 = Ні,

^А-8 = А11 - А12Р-21Р21 - (А12Р221Р21)* + (Р-21Р21)* А22Р-21Р21, В8 = В1 - А12Р-2^2 + (Р-21Р21)* [А22Р-2^2-В2\,

С8 = С + (Р-2^2)*А22Р-2^2 - (Р-2^2)*В2 - В22Р^,

М = 0.

Положим

(21) (22) (23)

(24)

(25)

(26)

Ь-Ь(и)-(Ьп ЬіЛ-{^п Ь12\ у' ик (Ь(11} ь{^\ (27)

1-^>‘>-{ыг ь22)-{рш и+й«и’* 4ЇТ ( ’

А = АЫ = Л + ]Г^А« (28)

к=1

,к ( „Хк)

’--«-(д)-и)+£ад>ь <29)

____ 'і

Ь! І і,

к=1 к

М = М{ц) = М + ^^м(к)- (30)

к=1

Коэффициенты рядов (26)-(30) определяются стандартным образом после подстановки этих рядов в (12)—(15) и последующего приравнивания коэффициентов при одинаковых степенях ц.

Подставив ряды в (13) и приравняв коэффициенты при /л°, получим систему уравнений для определения главных членов асимптотических представлений блоков матрицы в(и)

в 11(Р11 + ЯіИНі) + (Ріі + ЯіИ Иі)*в 11 + в 12 (Р21 + ЯїМ Ні) + (Р21+

+ Q2M Н1)*в і2 + А11 + В1МІ Н1 + (ВМ Н1)* + (МИ)* СМ Н1 = 0, (31)

в 1іР12 + в 12Р22 + (Р21 + Q2M Ні)* в 22 + Аі2 + (В2М Ні)* = 0, (32)

в 22Р22 + Р22 в 22 + А22 = 0. (33)

В силу неособенности матрицы Р22, из (32) найдем матрицу в 12, подставим ее в (31), а затем полученное уравнение упростим, используя (33); в итоге получим

в іі(Р3 + QsMHl) + (Ра + QSM Ні )* в 11 + Ш5(М) = 0, (34)

где матрицы Ра, Qs, Ws определены в п. 2.

Проделав аналогичную процедуру с подстановкой рядов (27), (29), (30) в уравнение (14), для определения главных членов асимптотических представлений блоков матрицы Ь(р) получим

(Р11 + QlM Ні) Ь іі + Ь іі(Ріі + QlMHl)* + Р12І і2 + Ь 12Р*2 + щі*і = 0, (35)

Ь 11(Р21 + Q2M НіТ + Ь12 Р22 = ° (36)

(Р21 + Q2MНі)Ь 12 + 1*12 (Р21 + Q2MНі)* + І22Р*2 + Р22І22 = 0. (37)

В силу неособенности матрицы Р22, матрицу Ь12 в (35) можно заменить ее значением согласно (36). Затем, используя (37), уравнение (35) после несложных преобразований окончательно приведем к виду

(Ра + QsM Ні)Ь 11 + Ь11 (Ра + QsM Ні)* + ’иі'иі = 0. (38)

Уравнение (15) с учетом (29) можно записать как следующие два уравнения:

вііУі + ц2ві2У2 = \уі, (39)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0*12^2 . (40)

Подставим ряды (26), (28), (29) в (39), (40) и приравняем коэффициенты при /л°; в результате получим

0ц VI = Л#1, (41)

012 VI = Лд2. (42)

Из (41) следует, что Л - максимальное собственное значение, а VI - соответствующий ему собственный вектор матрицы 0ц, являющейся решением уравнения (34). При этом вектор %2 определяется из (42) единственным образом и равен

%2 = Л 1012'О1.

В завершение рассмотрим уравнение (12). С учетом блочного представления матриц 0, Ь, 3, Н, В его можно записать так:

(3*011 + Ц-^*2®*12 + В*1 ) Ь11Н* + ^*1012 + !Л-^*2 0 22 + В*2) Ь *иН\ + СМЩЬцН* = 0.

(43)

Подставив в (43) ряды (26), (27), (30), а затем выделив слагаемые порядка /л0, получим

сМщ Ь11Н1 + 31011 + 320*2 + В 1)111Н* + (32 022 + в*2 )Ь*12Н* = 0. (44)

Заменим в (44) 012, Ь12 согласно (32),(36), а потом сгруппируем слагаемые с учетом обозначений п. 2; в итоге придем к следующему уравнению:

СМН1Ь11Н* + 3 011 + В* )Ь пН* = 0. (45)

При условии неособенности матрицы Н1ЬцН* из (45) находим

М = -с-1^ 011+в* )Ь11 н* (Н1Ь11Н* )-1.

Сопоставляя уравнения (34), (38), (41), (45) с соответствующими уравнениями системы (21)-(24), приходим к заключению, что (011, Ьц,Л,'д,М) и (08, Ь8,Л8^8,М8) определяются одними и теми же уравнениями, а потому все их решения совпадают, т. е. имеют место равенства

М = Ма, 011 = 08, Ь11 = Ь8, Л = Ла, -01 = vs. (46)

Значения (46) для М, 0ц, Ьц, Л, Vl однозначно определяют 012, Ь12, Ь22, V2, тем самым завершая вычисление всех главных членов асимптотических представлений. Таким образом, доказана справедливость следующего утверждения.

Теорема 2. Если матрица Р22 - гурвицева, квадратичная форма функционала (8) - положительно-определенная и редуцированная задача (17)-(20) разрешима, то минимаксная задача (1)-(4), (11) разрешима и асимптотические представления искомых решений имеют вид

М0 = М8+01(л), I (и о) = Л,8 + 02(л). (47)

Здесь М8,Л8 - решение редуцированной задачи, 01(л),02(л) - остаточные члены, для которых справедливы оценки ^01(л)У ^ с1л, \02(л)\ ^ е2л,л^(0,л),

где ci,c2 — положительные постоянные. При этом если редуцированная задача имеет единственное решение, то в исходной задаче (1)—(4), (11) имеется единственное минимаксное управление u0 = M0z, в котором матрица М0 определяется равенством (47).

Следствие. В случае m = n1, т. е. когда информация о доминирующих координатах полная, минимаксное решение редуцированной задачи (17)—(20) единственно и совпадает с решением классической задачи АКР, при этом из (25) для H1 = E найдем

MS=-C-1(Q*S es+B*s),

где 0S — решение алгебраического уравнения Риккати

QsQsC-1Q*Qs - OsPs - p:&s - As + BsC-1B*s = 0.

Тем самым исходная задача (1)—(4), (11) при выполнении условий теоремы 2 будет иметь единственное решение и минимаксное управление будет осуществляться с матрицей (16) при Hi = E, для которой асимптотическое представление имеет вид Mo = -C-1(QS Os + B S)+OiM.

Замечание 2. Фактически теорема 2 показывает, что для функционала (8) имеет место аналогичное асимптотическое представление: J(щ) = x0Osxo + О^(р), где Оз(р) — остаточный член такого же типа, как в (47). Это обстоятельство дает возможность косвенно оценить близость минимаксного решения к решению классической задачи АКР [14].

4. Заключение. Методы исследования и оптимизации СВСУ характеризуются определенной спецификой и опираются на асимптотические представления решений. Специфика СВСУ проявляется в разделении движений на медленные и быстрые. Это обусловлено тем, что соответствующие им моды имеют порядки О(1) и О(1/р) [9, 14]. Естественно возникает потребность раздельного управления по быстрым и медленным модам.

В работе исследован общий случай управления по доминирующим координатам, причем информация о них неполная. Получены условия существования минимаксного управления, на базе которых строится решение исходной и редуцированной линейноквадратичных задач стабилизации. Показано, что главные члены асимптотических представлений для матричного коэффициента усиления регулятора и оптимального значения функционала в исходной задаче совпадают с точными значениями аналогичных величин для редуцированной задачи. Редуцированная задача имеет меньшую размерность, что позволяет успешно применить полученные результаты в прикладных задачах управления.

Литература

1. Андреев Ю. Н. Управление конечномерными линейными объектами. М.: Наука, 1976. 424 с.

2. Зубов В. И. Лекции по теории управления: учебник для вузов. М.: Наука, 1975. 492 с.

3. Мышков С. К. Оптимальная в среднем стабилизация линейных управляемых систем // Вестн. Ленингр. ун-та. 1971. № 1. С. 90-97.

4. Мышков С. К. Линейные управляемые системы с неполной информацией о координатах состояния // Негладкие задачи теории оптимизации / под ред. В. Ф. Демьянова. Л.: Изд-во Ленингр. ун-та, 1982. С. 248-272.

5. Wonham W. M. On the separation theorem of stochastic control // SIAM Journal on Control. 1968. Vol. 6, N 2. P. 312-326.

6. Квакернаак Х., Сиван Р. Линейные оптимальные системы управления / пер. с англ. В. А. Васильева, Ю. А. Николаева. М.: Мир, 1977. 652 с. (Huibert Kwakernaak, Raphael Sivan. Linear optimal control systems.)

7. Levine W. S., Athans M. On the determination of the optimal constant output-feedback gains for linear multivariable system // IEEE Trans. Automat. Contr. 1970. Vol. AC-15, N 1(Feb). P. 44-48.

8. Демьянов В. Ф., Малоземов В. Н. Введение в минимакс. М.: Наука, 1972. 368 с.

9. Васильева А. Б., Бутузов В. Ф. Асимтотические разложения решений сингулярно возмущенных уравнений. М.: Наука, 1973. 272 с.

10. Методы синтеза нелинейных систем автоматического управления / под ред. С. М. Федорова. М.: Машиностроение, 1970. 416 с.

11. Yahagi T. Minimax output feedback regulators // J. Dynamic Systems, Measurement and Control. 1976. Vol. 98, N 3. P. 270-276.

12. Климушев А. И., Красовский Н. Н. Равномерная асимптотическая устойчивость систем дифференциальных уравнений с малым параметром при производных // Прикладная математика и механика. 1961. Т. 25, вып. 4. С. 680-690.

13. Мышков С. К., Полякова Л. Н., Тарасова В. В. О применимости численных методов негладкого анализа к решению линейной квадратичной задачи оптимального управления с неполной информацией // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2005. Вып. 4. C. 130-137.

14. Chow J. H., Kokotovic P. V. A Decomposition of Near-Optimum Regulators for Systems with Slow and Fast Modes // IEEE Trans. Automat. Contr. 1976. Vol. 21, N 5. P. 701-705.

15. Мышков С. К. Линейно-квадратичная оптимизация сингулярно возмущенных систем управления с неполной информацией // Вестн. С.-Петерб. ун-та. Сер. 1: Математика, механика, астрономия. 2005. Вып. 3. C. 43-50.

Статья рекомендована к печати проф. В. Ф. Демьяновым.

Статья принята к печати 28 мая 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.