Научная статья на тему 'Стабилизация управляемых динамических систем за конечное время'

Стабилизация управляемых динамических систем за конечное время Текст научной статьи по специальности «Математика»

CC BY
258
131
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАБИЛИЗАЦИЯ / КОНЕЧНОЕ ВРЕМЯ / ЛИНЕЙНАЯ СИСТЕМА / STABILIZATION / FINITE TIME / LINEAR SYSTEM

Аннотация научной статьи по математике, автор научной работы — Кириллов Александр Николаевич

Рассмотрена задача стабилизации управляемых динамических систем за конечное время. Предложен метод стабилизации линейной системы с периодическими коэффициентами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FINITE TIME STABILIZATION OF CONTROLLABLE DYNAMICAL SYSTEMS

The problem of finite time stabilization of controllable dynamical systems is considered. A method for stabilization of a linear system with periodical coefficients is proposed.

Текст научной работы на тему «Стабилизация управляемых динамических систем за конечное время»

Труды Карельского научного центра РАН № 1. 2013. С. 68-72

УДК 517.977

СТАБИЛИЗАЦИЯ УПРАВЛЯЕМЫХ ДИНАМИЧЕСКИХ СИСТЕМ ЗА КОНЕЧНОЕ ВРЕМЯ

А. Н. Кириллов

Институт прикладных математических исследовании Карельского научного центра РАН

Рассмотрена задача стабилизации управляемых динамических систем за конечное время. Предложен метод стабилизации линейной системы с периодическими коэффициентами.

Ключевые слова: стабилизация, конечное время, линейная система.

А. N. Kirillov. FINITE TIME STABILIZATION OF CONTROLLABLE DYNAMICAL SYSTEMS

The problem of finite time stabilization

of controllable dynamical systems is considered. A method for stabilization of a linear system with periodical coefficients is proposed.

Key words: stabilization, finite time, linear system.

Основные понятия

В конце 1960-х гг. Н. Н. Петров [4] предложил понятие нормальной локальной управляемости. Рассмотрим динамическую систему управления

х = / (х,и), (1)

где х - состояние, х Є Мга, и - управление, и Є Кт. Пусть допустимое управление - кусочно постоянная функция времени Ь со значениями в ограниченном множестве и Є Кт.

Определение 1. Система (1) называется нормально локально или N -локально управляемой в окрестности начала х = 0, если для любого Т > 0 существует окрестность начала, из каждой точки которой с помощью допустимого управления можно попасть в 0 за время, меньшее Т.

Для аналитической динамической системы (1) при п = 2, т = 1 получены достаточные

условия N-управляемости в терминах коэффициентов степенных рядов, в которые раскладывается / [5]. В [1] автор ввел понятие Т-стабилизируемости.

Определение 2. Система (1) называется Т-стабилизируемой в точке х*, если для любого Т > 0 существует такая окрестность и (х*) точки х*, что все траектории системы (1), выходящие из и(х*), за время, меньшее чем Т, с помощью допустимого управления попадут в любую сколь угодно малую окрестность точки х* ив дальнейшем в ней останутся.

Это понятие мотивировано необходимостью решать задачи стабилизации систем с изменяющейся структурой, когда время стабилизации ограничено временем существования структуры. Введем понятие Т-синхронизации. Пусть х(£,х0 , и) - траектория системы (1), соответствующая управлению и и удовлетворяющая услвию х(0, х0, и) = х0.

Определение 3. Система (1) называется Т-синхронизуемой в точке ж*, если для любого Т > 0 существует такая окрестность и (ж*) точки ж*, что для любой точки Жо € и (ж*) найдется такое допустимое управление и, что траектория ж(£, ж0,и) системы (1) за время ¿(жо) < Т попадет в точку ж* ив дальнейшем не будет ее покидать, т. е. ж(^ ж0,и) = ж* при

^ ¿(ж0).

Понятие Т-синхронизуемости введено для решения задач управления объектами с большой инерционностью, например, в задачах управления процессами атомной энергетики. Очевидно, Т-синхронизуемость является частным случаем Т-стабилизируемости и нормальной локальной управляемости.

N -локальная управляемость и Т-стАБилизируЕмость

Установим связь между понятиями нормальной локальной управляемости и Т-стабилизируемости.

Теорема 1. Пусть /,/х непрерывны в некоторой окрестности начала координат. Если система (1) N-локально управляема, то она Т-стабилизируема.

Доказательство. Пусть для определенности система (1) N-локально управляема в начале ж = 0. Рассмотрим две окрестности начала иг (0), ид(0), г < Я. В [4] получена оценка для времени Д£ прохождения траекторией системы (1) слоя ид(0) \ иг(0)

Я2 — г2

где 0 < с(Я2,г2,К) - некоторая постоянная, причем в окрестности начала координат ||/(ж,и)|| ^ К. Возьмем произвольное е > 0. Покажем, что найдется окрестность и$(0) такая, что для любой точки ж0 € и (0) траектория, начинающаяся в точке ж0, при соответствующем допустимом (кусочно-постоянном) управлении не покинет ие(0). Возьмем е1 такое, что е > е1 > 0. Время Д^ прохождения траекторией слоя удовлетворяет оценке

Є — ЄТ

Поскольку система N-локально управляема в точке х = 0, то для любого т > 0 такого, что

существует окрестность нуля и(< т) такая, что все ее точки за время, меньшее т, можно перевести с помощью допустимого управления в начало. Если хотя бы одна траектория, начинающаяся в и(< т), выйдет на границу окрестности ие(0) до попадания в начало, то для попадания в начало ей придется пройти слой и£(0) \ и£1 (0), на что потребуется время Д^ > т. Это значит, что система не является N -локально управляемой в точке 0, что противоречит предположению. Применяя соответствующее управление для траектории, уже прошедшей начало и находящейся в и(< т), получим, что она также не может достичь границы окрестности ие(0). Итак, все траектории, начинающиеся в и(< т), остаются в ие(0). Выберем 5 > 0 такое, чтобы и(0) С и(< т). Тогда получаем, что точка

0 Т-стабилизируема. □

Замечание 1. Понятие Т-стабилизируемости является более широким, чем понятие нормальной локальной управляемости. Рассмотрим систему

х

х = —

л/|х| - и ’

где ж € М, и - кусочно-постоянная функция времени, принимающая значения из множества {П, п € М} Э и(£). Несложно показать, что точка ж = 0 Т-стабилизируема. Для попадания в любую е-окрестность начала достаточно положить и = П < е. При этом ни одна траектория не попадает в начало, т. е. N-локальной управляемости в начале нет.

Т-стабилизируемость нестационарных линейных систем

Рассмотрим сначала линейную стационарную систему управления

X = Ах + Ви := /(х,и),

(2)

где х Є Мп, и Є Мк, А, В - постоянные матрицы соответствующих размерностей. Тогда векторы /(0,иг) = Виг, 1 ^ і ^ т, не могут образовывать положительный базис [4] в М” при т > п ни при одном наборе постоянных векторов иг, 1 ^ і ^ т, иг Є Мк, если размерность вектора управлений меньше размерности вектора состояний, т. е. к < п. Действительно

Ви = Ь1и1 + ... + Ьк ик,

0<т<

Є2 - Є21

где Ъ3 - столбцы матрицы В, Uj - компоненты вектора и, 1 ^ ^ Й, а тогда вектор

69

Ви принадлежит линейной оболочке векторов Ъ 1,...,Ък, т. е. собственному подпространству пространства Мп. Таким образом, векторы /(0,иг) = Виг, 1 ^ г ^ т не образуют положительный базис, и поэтому нельзя применять теорему о Т-стабилизации, которая утверждает, что существование положительного базиса /(0, иг), 1 ^ г ^ п + 1 является достаточным условием Т-стабилизируемости системы (1) в точке ж = 0 [2]. Более того, справедлива

Лемма 1. Пусть к < п, управление и-кусочно-постоянно, и € {и1,..., ит}. Тогда точка ж = 0 не является Т-стабилизируемой для системы (2).

Доказательство. Доказательство повторяет рассуждение из теоремы работы [4] о том, что, если векторы /(0, и), г = 1,..., т образуют одностороннюю совокупность, то система (2) не является локально управляемой. □

Рассмотрим теперь нестационарную линейную систему с постоянной матрицей коэффициентов А

ж = Аж + В(¿)и := /(ж,и,¿), (3)

где В(£) - кусочно-непрерывная матрица. Предположим, что по-прежнему, к < п. Покажем, что при определенных условиях, накладываемых на В(£), точку ж = 0 можно стабилизировать за конечное, но не любое время с помощью кусочно-постоянного управления.

Пример 1. Рассмотрим систему

ж= 01(*)и, У = 02(*)и,

где ж, у, и € М,

Г 1, 0 < ¿< 0, 25Т0,

9^) = < -1, 0, 25Т0 < ¿< 0, 75Т0,

I 1, 0, 75Т0 < £ < Т0,

9 (/) = / 1, 0 < ¿< 0, 5Т0,

92(Г) = \ -1, 0, 5Т0 < £ < Т0,

9^ + Т0) = 9^), г = 1, 2,

где Т0 - положительная постоянная. Пусть управление и кусочно-постоянно и может принимать два значения: 0 или 1. Покажем, что данная система стабилизируема в нуле за конечное, но не любое время Т. При и = 1 участки траекторий системы принадлежат прямым ж + у = с или ж — у = с, с-постоянная. Траектории системы периодические, с периодом

То, геометрически представляют собой стороны равных квадратов, параллельные указанным прямым. Покажем, что любую начальную точку Мо(хо,уо) можно перевести в начало. Для этого, например, сначала переводим точку Мо на одну из прямых x + y = 0 или x — y = 0, а потом по этой прямой переводим точку в начало и там оставляем, полагая и = 0 (тем самым решая даже задачу синхронизации за конечное время). Построим соответствующее управление. Предположим, что Мо принадлежит прямой x + y = Со (или x — y = со), которая пересекает x — y = 0 (или x + y = 0). Полагаем u = 0 до того момента времени, когда gi = 1, g2 = — 1, если Мо лежит выше прямой x — y = 0, или когда gi = —1, g2 = 1, если Мо лежит ниже прямой x — y = 0. В этот момент времени полагаем и = 1 до тех пор, пока g1,g2 не поменяют знаки. Тогда останавливаемся, положив и = 0, и возобновляем процедуру. И так до попадания на прямую x — y = 0. Потом возобновляем аналогичный процесс управления до попадания в начало. При этом, в силу периодичности правых частей системы, остановка фазовой точки до возобновления движения длится в течение времени, не превышающего 0, 75То. Расстояние d, которое надо пройти фазовой точке от Мо до начала вдоль пути, описанного выше, как нетрудно показать, равно d = ^(|x — y| + |x + y|). Модуль вектора фазовой скорости при и = 1 равен л/x2 + y2 = л/2. Время движения не превосходит величины

ДТ = ° 75рТо + ° 5(^о — Уо1 + ^о + Уо|)

где p - количество простоев. Слагаемое 0,75рТо равно максимальному времени простоя. Итак, для любого Т > 0, 75рТо можно найти окрестность начала такую, что ДТ < Т. Для этого достаточно, чтобы выполнялось условие

0, 5(^о — уо| + ^о + уо|) < Т — 0, 75Тор,

т. е. все начальные точки Мо, для которых выполняется это условие, переводятся в начало за время, меньшее Т, и остаются там. Множество, задаваемое последним неравенством, является кругом радиуса R =

^V^о — Уо)2 + ^о + Уо)2 < -J2(|жо — Уо| + |xo + уо|) < (2Т — 1, 5Тоp). В построенном

примере время2 попадания в произвольно малую окрестность начала ограничено снизу величиной 0, 75Тор. Заметим, что p зависит от Мо и значение р(Мо) можно оценить.

Пример показывает, что система вида (3) может быть стабилизируема в нуле за ко-

0

нечное время Т при условии Т > 0, где 0 < 0 - постоянная. Таким образом, введение нестационарной матрицы коэффициентов позволяет решить задачу стабилизации линейной системы за конечное, хотя и не любое время. Этот результат созвучен в некотором смысле результату Г. А. Леонова, решившему проблему Р. Брокетта: насколько введение нестационарности в матрицу коэффициентов линейной обратной связи расширяет возможность стационарной стабилизации системы? Г. А. Леонов дал конструкцию периодической кусочно-постоянной матрицы, расширяющей возможности стационарной стабилизации [3]. Рассмотрим систему

ж = В(^и, (4)

где ж € Мп , В (¿) - кусочно-непрерывная матрица размерности (п х 1), и - управление, и € М.

Теорема 2. Пусть и - кусочно-постоянная функция, и(£) € {0,1}; В(£) - кусочно-

непрерывная, периодическая функция с периодом т, предположим, что существуют различные постоянные ¿г, 1 ^ г ^ п + 1, удовлетворяющие условиям:

а) ¿г € (0, т);

б) - внутренние точки промежутков непрерывности В (¿);

в) векторы В(¿г), 1 ^ г ^ п + 1, образуют положительный базис в Мп.

Тогда точка ж = 0 синхронизуема за любое время Т > 0 ^ 0, где постоянная 0 зависит от окрестности начала, переводимой в точку ж = 0.

Доказательство. Опишем метод синхронизации. В силу условия б) существуют окрестности иг точек ¿г такие, что если ¿г € и^, то векторы В(¿г), 1 ^ г ^ п + 1, образуют положительный базис. Если начальный момент времени ¿0 € иг при некотором I € {1, ...,п + 1}, и при этом вектор В(^) направлен внутрь соответствующего цилиндра стабилизации [2], то полагаем и = 1, и в течение некоторого времени продвигаемся внутрь цилиндра стабилизации до тех пор, пока В(£) направлен внутрь его. Далее полагаем и = 0 (останавливаем движение) и "ждем" наступления момента времени ¿г1 € иг1 такого, что вектор В(¿г1) направлен внутрь очередного цилиндра стабилизации. В этот момент полагаем и = 1. Поскольку длины всех интервалов иг больше некоторой по-

стоянной Д > 0, то траектория попадет на основание некоторого очередного цилиндра стабилизации. После этого процесс стабилизации продолжится аналогично тому, как это показано в теореме о Т-стабилизации. При этом, если суммарное время ожидания равно 0, то Т > 0. □

Пример 2. Рассмотрим систему вида

ж = 9^ — 0, 25иТ0), у = 92^ — 0, 25иТ0),

где функции 91 , 92 - из примера, рассмотренного выше. Пусть управление кусочнопостоянно и может принимать значения 0,1,2,3. Тогда начало, ж = 0 Т-

стабилизируемо. Для того, чтобы это показать, достаточно воспользоваться способом управления, представленном в первом примере, с той разницей, что теперь можно избежать "простоев".

Заключение

Представлен способ стабилизации за конечное время линейной нестационарной системы при ограничениях специального вида.

Работа выполнена при финансовой поддержке Программы стратегического развития ПетрГУ в рамках реализации комплекса мероприятий по развитию научноисследовательской деятельности.

Литература

1. Кириллов А. Н. Нелинейная стабилизация динамических систем управления// Мехатрони-ка, автоматизация, управление. 2008. № 12. С. 6-11.

2. Кириллов А. Н. Некоторые методы кусочнопостоянной стабилизации нелинейных динамических систем // Вторая российская мультиконференция по проблемам управления. Доклады. СПб., 2008. С. 70-71.

3. Леонов Г. А. Проблемма Брокетта в теории устойчивости линейных дифференциальных уравнений // Алгебра и анализ. 2001. № 4. С. 134-155.

4. Петров Н. Н. Локальная управляемость автономных систем // Дифференциальные уравнения. 1968. № 7. С. 1218-1232.

5. Петров Н. Н. Решение одной задачи теории управляемости // Дифференциальные уравнения. 1969. № 5. С. 962-963.

0

СВЕДЕНИЯ ОБ АВТОРЕ:

Кириллов Александр Николаевич

ведущий научный сотрудник, д. ф.-м. н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Институт прикладных математических исследований Карельского научного центра РАН ул. Пушкинская, 11, Петрозаводск, Республика Карелия, Россия, 185910 эл. почта: [email protected] тел.: (8142) 763370

Kirillov, Alexandr

Institute of Applied Mathematical Research, Karelian Research Centre, Russian Academy of Sciences 11 Pushkinskaya St., 185910 Petrozavodsk, Karelia, Russia

e-mail: [email protected] tel.: (8142) 763370

i Надоели баннеры? Вы всегда можете отключить рекламу.