218 НАУЧНЫЕ ВЕДОМОСТИ
Серия: Математика. Физика. 2014. №12(183). Вып. 35
MSC 34H05
ЗАДАЧА СИНТЕЗА ОГРАНИЧЕННЫХ УПРАВЛЕНИЙ В.И. Коробов, О.А. Тарасова
Белгородский государственный университет, ул. Победы, 85, Белгород, 308015, Россия, e-mail: [email protected],
Tarasova_OObsu.edu.ru
Аннотация. В работе исследованы вопросы решения задачи синтеза, построены примеры стабилизируемых систем.
Ключевые слова: задача синтеза, управляемая система, стабилизируемая система.
1. Введение. Математическая теория управления начала интенсивно развиваться в середине XX столетия. Ее возникновение связано с необходимостью решать новые на то время задачи, задачи управления механическими объектами, движение которых описывается дифференциальными уравнениями. Дальнейшее развитие теории управления связано как с прикладными задачами, так и с исследованием задач управления как чисто математических. Развитие математической теории управляемых процессов привело к возникновению новых направлений в теории дифференциальных уравнений, что в значительной мере определяет ее настоящее состояние. Одним из таких направлений стал допустимый позиционный синтез управления дифференциальных уравнений.В этой области проводились многочисленные исследования российскими и зарубежными авторами. Я отмечу работы: Скляра Г.М. , Благодатского В.И., Понтрягина Л.С., Коробова В.И.
Задача допустимого позиционного синтеза управления для системы дифференциальных уравнений
ж = /(ж, и), х € Мп , и € О С Мг
состоит в построении управления и = и(х), которое удовлетворяет заданным ограничениям и(х) € О, так что, траектория замкнутой системы
х = /(х, и(х)),
начинающая в произвольной точке жо из некоторой окрестности Q начала координат, попадает в начало координат за конечное время Т(жо). Мы рассматриваем случай, когда начало координат является точкой покоя системы, /(0,ио) = 0 при ио € О. Если Q = М”, то синтез называется глобальным, а если Q = М”, то локальным [1]. Поскольку через конечную точку проходит бесконечное число траекторий и время движения по каждой траектории в эту точку конечно, то в силу теоремы о единственности решения правая часть уравнения ж = /(ж,и), ж € М”, и € О С Мг, с выбранным управление не может удовлетворять условию Липшица в рассматриваемой окрестности. Поэтому управление, решающее задачу синтеза, не
НАУЧНЫЕ ВЕДОМОСТИ
Серия: Математика. Физика. 2014. №12(183). Вып. 35 219
может быть гладким, линейным, как в задаче стабилизации. Наличие ограничений на управление накладывает дополнительные сложности на построение такого управление.
2. Методы решения задачи синтеза. Задача синтеза ограниченных управлений, оптимальных по быстродействию состоит в следующем. Для управляемой системы
ж = /(£,ж, и), ж € Мп , и € О С Мг , 0 € О (1)
требуется найти управление и = (£,ж), принимающее значения в множестве О, такое, что
траектория системы
ж = /(£, ж, и(£, ж)), (2)
начинающаяся в произвольной точке жо, оканчивается в заданной точке ж1 за минимальное
время. В этом случае управление и(Ь, ж) является оптимальным по быстродействию и удовлетворяет уравнению Беллмана
дТ(£, ж) ^ дТ(£, ж)
тт |----^ ’ .1г
+ Е ().г 'Г f:il- Х’ и)) = _1 ’ (3)
«еп V dt ' дх
г=1
где T(to,Xo)- из произвольной точки Хо в момент времени to в фиксированную точку Х1 по траектории системы (2), отвечающей управлению u(t,x). Обозначим через T(t,x) для (1)и T(t, х) для (2) производные времени движения в силу системы (1) и (2), соответственно. Тогда равенство (3) будит
min T (t,x) = T (t,x) = -1 «еп
и означает, что производная в силу системы (2), времени быстродействия T(t, x) из произвольной точки x в заданную точку xi равна -1. Это равенство выполняется в точках существования производных. Для решения задачи синтеза также сформулирован допустимы принцип максимума [1], который по форме подобен принципу максимума в оптимальном управлении, но при этом указывается сопряженная функция, которая является функцией фазовых координат, а не времени, что позволяет определять позиционное управление.
3. Стабилизация системы относительно подпространства. В качестве примера рассмотрим линейную управляемую систему [5]
xi = 2xi — x2 + u, (4)
x2 = 3x1 — 2x2 + u.
Для этой системы A = ^ 3 2 ^ , b = ^ 1 ' Рассмотрим прямоугольную матрицу H =
(2,1), для которой rank H = l = 1. Тогда сопряженная матрица H* представляет собой столбец 2 1
1. Собственные значения матрицы A* равны ±1. Соответствующие им собственные вектора (-3,1) и (-1,1) и поэтому K- = (—1,1).
2. r = rank(Hb, HAb) = rank(3, 3) = 1. Обозначим вектор £ = w1h1, где w1 определяется из уравнения (£, b) = (£, Ab) = 0. Это дает 3w1 =0 и поэтому w1 = 0.
3. Введем вектор c = a1h1 такой, что а1 определяется уравнением а1 : (c, b) = 3а1 = 0 так, что (c, b) = 3, откуда а1 = 1, c = h1, j = 0.
220 НАУЧНЫЕ ВЕДОМОСТИ ШЯ Серия: Математика. Физика. 2014. №12(183). Вып. 35
4. Так как И * С £(е, А*с) + К- = М2, то стабилизация возможна.
Для построения стабилизирующего управления выберем такие постоянные 71, чтобы уравнение относительно ^ ^ + 71 = 0 имело корни ^ с Ие^ < 0. Пусть 71 = 1. Тогда управление имеет вид:
Следовательно, матрица Q имеет вид Q = (-3,1).
Подставим полученное управление в систему (4). Тогда система ж = (А + ^)ж имеет вид:
1. Коробов В.И. Метод функции управляемости // М.-Ижевск: НИЦ, 2007. - С.7,13.
2. Коробов В.И. Критерии управляемости линейной системы на подпространство // Вестник Харьковского университета. - 1981. - №221, Вып.46. - С.3.
3. Благодатских В.И. Введение в оптимальное управление / М: Высшая школа, 2001.
4. Ли Э.Б., Маркус Л. Основы теории оптимального управления / М: Наука, 1972.
5. Коробов В.И., Луценко А.В., Подольский Е.Н. Стабилизация линейной автономной системы относительно подпространства // 1975. С.117-122.
PROBLEM OF SYNTHESIS OF BOUNDED CONTROLS V.I. Korobov, O.A. Tarasova
Belgorod State National Research University,
Pobedy St., 85, Belgorod, 308015, Russia, e-mail: vkorobovPuniver.kharkov.ua,
Abstract. Some problems of control synthesis are studied and some examples of stabilized systems are built.
Key words: synthesis problem, stabilized system, control system.
x 1 = —x1, x 2 = — x2.
Ее общее решение:
J x1 = x°e 1,
\ x2 = x°e-:t,
где x1 = x1(0),x2 = x2(0). Тогда Hx = e-t(2x° + x°) ^ 0 при t ^ ro.
References