УДК 62-50
СИНТЕЗ ОПТИМАЛЬНОГО И СУБОПТИМАЛЬНОГО ПО БЫСТРОДЕЙСТВИЮ УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ МЕТОДОМ ДИВЕРСИФИКАЦИИ ЭКСТРЕМУМОВ ФАЗОВЫХ КООРДИНАТ
©2005 В.Е.Вохрьпнев
Самарский государственный технический университет
Рассматривается синтез оптимального и субоптимального по быстродействию управления линейными динамическими объектами с использованием функции переключения, содержащей линейную комбинацию фазовых координат и их экстремальные значения.
В теории и практике автоматического управления динамическими объектами к числу обычно рассматриваемых показателей качества относится в первую очередь время затухания переходных процессов в системе, то есть быстродействие. В связи с этим проблема поиска новых путей и методов синтеза оптимального и субоптимального по быстродействию управления динамическими объектами, раскрывающих не использованные резервы существующих систем и направленных на снижение сложности технической, алгоритмической и программной реализации, по-прежнему привлекает внимание специалистов в области автоматического управления [1].
Критерий оптимального по быстродействию управления имеет вид
<2
J = \dt = min
<i
и должен принимать минимальное значение на траекториях движения объекта при условии наложения ограничений на управление и/или фазовые координаты.
Анализ известных методов синтеза систем на основе приведенного критерия показывает, что все они связаны с выявлением инвариантов, присущих конкретным объектам, для которых синтезируется управление, и направлены на создание способов и процедур расчета, алгоритмическую и техническую реализацию синтезированных управлений.
Инварианты представляют собой некоторые функции или величины, остающиеся неизменными во время движения объекта в
силу законов сохранения (энергии, количества импульса движения, момента количества движения, массы), которые справедливы для всех форм существования материи.
Так, процедура синтеза оптимального по быстродействию управления линейными объектами и-го порядка с постоянными коэффициентами
п
*/ = £ алх, + b,u ,\u\<um,i = T^ (1) к -1
методом фазового пространства [2,3] связана с определением инвариантного многообразия L ,, разбивающего фазовое пространство системы на два подпространства. Это многообразие представляет собой гиперповерхность (или ее часть) переключения в фазовом пространстве системы в зависимости от характера собственных значений матрицы
коэффициентов aik объекта (1). Уравнение гиперповерхности имеет вид
М(х,) = 0, ¿ = ¡7, а управление представляется следующим образом:
«С */) = "msi8"( м(х< ))■ (2)
В работе [4] в качестве инварианта для синтеза управления (3) предлагается использовать гиперплоскость. .
В работе [5] в качестве инварианта выступает интегральный функционал от функции свободной составляющей с пределами от 0 до да и номинально-заданного управляющего воздействия С/н.
В процедуре принципа максимума [6]
определение управления в виде и=и(хх, т. е. решение задачи синтеза, сводится к установлению распределения знаков функций
п
^¿>,¡/,(7,) Сами функции (¿л определяются ы
численными методами и выполняют также роль инварианта синтезированной системы.
Алгоритмические методы синтеза оптимального по быстродействию управления нелинейными объектами [7] предполагают аппроксимацию нелинейных функций в дифференциальном уравнении объекта комбинацией различных функций, а гиперповерхность переключения (инвариант), являющаяся законом управления, также аппроксимируется функциями, удобными для технической реализации.
Каждый из приведенных подходов обеспечивает решение прикладных задач синтеза оптимального по быстродействию управления со свойственными ему особенностями, достоинствами и издержками. Одни расширяют возможности физической реализации управления в замкнутых системах, другие упрощают процедуры аналитических расчетов, третьи расширяют класс объектов, для которых можно построить оптимальное по быстродействию управление.
Таким образом, актуальной здесь является не только сама проблема синтеза. Не менее важным оказывается поиск новых подходов к ее решению.
Понятно, что известными методами не исчерпываются все способы построения, расчета и реализации систем управления динамическими объектами по критерию быстродействия, поскольку здесь по-прежнему остаются проблемы, нуждающиеся в дальнейшем исследовании и последующем изучении возможностей более рационального их решения для автоматических систем различного назначения.
Ниже предлагается подход для построения оптимального и субоптимального по быстродействию управления замкнутыми линейными системами, основанный на использовании экстремумов фазовых координат и их диверсификации (варьировании и изменении их количества).
Задача синтеза формулируется следующим образом: определить закон управления и(ху ..., х/) (3), обеспечивающий перевод объекта (1) из заданного начального состояния в предписанное конечное (например, начало координат фазового пространства) за минимально возможное время с учетом ограничений на управление.
При оптимальном по быстродействию управлении объектами (1) оказывается, что каждая из фазовых координат проходит не менее чем один раз через экстремум или достигает его. Общее их количество не превышает в процессе управления величину
п
т = 2п-1 + 21', а при отработке скачка по м
управляемой координате (в позиционных системах) общее их количество всегда точно
п
равно величине т ~ п + , что можно так-;=1
же считать инвариантом. Минимальное их количество равно 2и, если изображающая точка в фазовом пространстве оказывается перед началом управления на гиперповерхности переключения.
Эти факты используются в предлагаемом методе синтеза. Для решения задачи на входе релейного элемента, установленного на входе объекта, формируется функция переключения в виде
(3)
где Р1 (х,)= хл + к-, (х1е - Хц ) - XI, хл, -соответственно заданное конечное состояние объекта и экстремальные значения фазовых
координат х1, к1 - постоянные коэффициенты. При этом знак управления (2) определяется знаком линейной формы (3).
Если вектор конечного значения совпадает с началом координат фазового пространства, то уравнение (3) преобразуется к виду
л
¡=1
Переключения происходят, когда функция (4)
обращается в нуль М(х() = 0 или
п
хх(I) + х2(I) +... + дс„(I) = £к,х„0), (5)
В фазовом пространстве уравнение (5) -гиперплоскость, проходящая через точку с
координатами г), г = 1 л, иперпендикулярная единичному вектору Щ1,1,..., 1).
В момент включения системы при 1=0 экстремальные значения фазовых координат будут равны их начальным значениям, и функция (5) будет иметь вид:
М(0) = ^(кЛе(0)-х,(0)) =
= £(*,.-!>,.го;
(б)
Уравнение (6) определяет начальные условия и знак управления на первом интервале. В конце управления изображающая точка (ИТ) в фазовом пространстве переводится в начало координат, и правая часть уравнения (5) обращается в нуль:
(7)
где 1п - время регулирования. Выражение (7) определяет окончание управления по переводу ИТ в заданную точку.
Из выражения (5) видно, что правая часть уравнения - величина переменная. В результате гиперплоскость (3) или (4) перемещается скачком в фазовом пространстве параллельно самой себе при появлении экстремумов. Для того чтобы количество переключений при этом было не более (п-\), необходимо выбором коэффициентов к! обеспечить попадание текущего вектора фазовых координат объекта в гиперплоскость переключения не более чем (п-1) раз.
Для вычисления коэффициентов к! решается система уравнений вида
л к
X кЛе = (8)
¡=1 /=1
где г] ) - значения фазовых координат в
моменты переключения оптимального управления и в момент окончания управления
- экстремальные значения фазовых
координат в моменты времени, предшествующие моментам переключения оптимального управления, и в момент времени, предшествующий окончанию управления (они равны их значениям на предшествующих интервалах управления).
Алгебраическая система линейных уравнений и-го порядка (8) содержит п неизвестных коэффициентов к.. Существование решения определяется неравенством нулю определителя системы (8). Учитывая, что столбцы определителя представляют собой линейно независимые векторы (экстремальные значения фазовых координат линейно независимы в силу линейной независимости самих фазовых координат), можно считать, что неравенство нулю главного определителя выполняется и, следовательно, задача вычисления коэффициентов к( разрешима. Этот набор коэффициентов будет единственным, поскольку в каждом интервале управления значения х,е(1), х/г) являются единственными. Этим доказывается признак необходимости функции (4).
Уравнение (8) является необходимым условием реализации оптимального по быстродействию управления, но недостаточным. Для его достаточности необходимо, чтобы знаки функции переключения (4) чередовались на интервалах управления. Это требование проверяется решением системы уравнений:
) = ¿Г ) - х„0) А и>2, ¡=1
и обеспечивается величиной управляющего воздействиям .
ш
Использование в функции переключения (4) фазовых координат и их экстремальных значений в количестве, меньшем величины п, приводит к возникновению субоптимальных процессов в системе.
Таким образом, задача синтеза управления состоит в определении функции переключения (4), являющейся законом оптимально-
го или субоптимального по быстродействию управления, и заключается в отыскании коэффициентов обратных связей и их зависимостей от граничных условий системы с помощью соотношения (10):
Для этого необходимо определить значения координат х/у, у = 1,и — 1 в моменты переключения, а также экстремальные значения фазовых координат хе{(в моменты, предшествующие моментам переключения tj и в конце управления /*л, и вычислить
коэффициенты к,, /' =1,« для заданных значений граничных условий или в диапазоне их изменения.
Зависимость коэффициентов от граничных условий исчезает, если величину управляющего воздействия поставить в линейную зависимость от экстремального значения выходной координаты:
В этом случае в системе реализуются субоптимальные по быстродействию процессы, если величина \хХе-хкх\<|д:1с ~х1к\тах,
где \хи ~х\к\тах - максимальная ошибка из допустимой области, и оптимальные, если
|Х1е ~~ Х\к | = \х1е ~ х\к | тах
Пример.
Объект описывается системой дифференциальных уравнений третьего порядка:
Х1 ~Х2> Х2 =Х3' Х3 =и- ГДе Н-"т-
Граничные условия положим х(0)=(Зс|о)(),0| х=(0,0,0/
Поскольку оптимальное управление является релейным, легко проинтегрировать исходные уравнения:
1=1
х2О) = ск2+скз1-(-1)к0.512ит,
*ъ(0 = скъ-(-\)кШт,
где си - /-тая постоянная интегрирования к-го интервала управления, & = ¡Д
Решая систему уравнений, например, методом стыкования [4] можно определить моменты переключения управления, значения фазовых координат в моменты переключения, а также их экстремальные значения в эти моменты.
¡х/О)
х1(Ь) = х1(0 )-^ит> о
хи(0 = х]е(0) = х1(0), х2е(О = 0, х3е(О = 0, х1((2) = х](0
= Х3(12) = (1им,
х\е0г)=х^)> Х2еО'2) = -ит1*, ХЪе( 1\) = , Хи(1\ ) = Х1(0),
Х2е(Н) = ~ит1\> ХЪе(11) = итЦ,
Х1(1Ъ) = 0,Х2(13) = 0, Х3(1г) = 0.
Значения коэффициентов вычислим по уравнению (8):
к1х1е() + к2Х2е(<1) + кЪХЪе(Ч ) =
= Х\(Ч) + Х2(*\) + ХЪ(ЧЬ
к\Х\е( + к2х2е( + кЪхЪе( =
= х1(12) + х2(12) + х}((2),
кЛе('1) + к2х2[е( 1*3 )+к3х3е(1'3) = = хх(1г) + х2(Ц) + хъ(1ъ).
Полагая |«я|=1, х,(0)=2,х2(0;=х3(1)/)=0и вычисляя значения фазовых координат в моменты переключения и их экстремальные значения, получим:
2 к, +0 + 0 = -, 3
2
2А, ~к2~к3 = —, 2к{ -к2 +к} =0.
2
• ,в соответствии с соотношением (9), а
Отсюда находим к7= 0,
о
3 з
На рис. 1 и 2 приведены оптимальные и субоптимальные процессы в системе, полученные методом цифрового моделирования в среде МаЛСАЕ). На рис. 1 представлены процессы во временной области (здесь выведены на плоский график выходная координата, функция переключения М(0 и управление и(ф для случаев, когда величина и равна
1 07
0.05
•0.98
Рис. 1. Процессы в системе третьего порядка при и=±1, и и1 =0.5,(пропорциональном начальному значению регулируемой координаты с коэффициентом 0.5)
- I 0.25 -0.5 -1.25
N. J
XI
«-O.S 0.13 0.75 1.38 2
Рис. 2. Процессы на фазовой плоскости
начальные условия взяты соответственно 2 и 1. Из рисунка видно, что в обоих случаях процессы заканчиваются за одно и то же время. Коэффициенты к. при этом остаются без изменения.
Понятно, что во втором случае имеет место некоторая потеря быстродействия, поскольку здесь недоиспользуется диапазон управляющего воздействия.
В конце управления обеспечивается удержание выходной координаты в предписанном конечном состоянии переключениями управляющего воздействия с бесконечно большой частотой.
На рис. 2 смоделирована проекция фазовой траектории на плоскость ж, хг и проекция следа плоскости переключения М(1), на котором видны перемещения плоскости переключения в моменты времени появления экстремумов фазовых координат.
В заключение отметим, что использование предложенного метода синтеза позволяет строить простые и высокоэффективные управляющие устройства [8,9]
СПИСОК ЛИТЕРАТУРЫ
1.
2.
Степанов O.A. Европейские конференции по управлению 1991- 2003г.г. // Автоматика и телемеханика. 2004. №9. ФельдбаумА.А. Основы теории оптимальных автоматических систем. М.: Наука, 1966.
3. Павлов A.A. Синтез релейных систем, оптимальных по быстродействию. М.: Наука, 1966.
Антомонов Ю.Г. Оптимальные системы. Киев: Наукова думка, 1972.
5. Авдеев О.Н. Метод варьирования свободных функционалов и его применение в задачах синтеза систем автоматического управления. С-Пб, 1996.
6. Понтрягин Л.С., Болтянский В.Г.. Гамк-релидзе Р.В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.
4.
7. Клюев A.C., Колесников A.A. Оптимизация автоматических систем управления по быстродействию. М.: Энергоиздат. 1982.
8. Патент № 2113005 (РФ) Пневматический регулятор/Л.Е.Вохрышев. Опубл. БИ 1998.
Бюл. № 16.
9. Патент 2032925 РФ. Пневматическое устройство для построения автоколебательных самонастраивающихся систем / Авт. В.Е.Вохрышев. Опубл. БИ 1995, №10.
SYNTHESIS OF OPTIMAL AND SUBOPTIMAL DYNAMIC OBJECTS CONTROL BY SPEED FUNCTIONING WITH APPLICATION OF PHASE COORDINATES EXTREMES DIVERSIFICATION METHOD
© 2005 V.E.Vokhryshev
Samara State Technical University
The article considers the problems of synthesis of optimal and suboptimal dynamic objects control by speed functioning with application of switching function and linear combination of phase coordinates and their extreme qualities.