УДК 681.513.5
СИНТЕЗ ЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ С МАКСИМАЛЬНЫМ БЫСТРОДЕЙСТВИЕМ
В.И. Ловчаков, В. А. Мозжечков
Для линейных непрерывных объектов высокого порядка рассматривается задача синтеза при учете имеющихся ограничений на управление регулятора с минимальным временем регулирования, понимаемым в смысле классической теории автоматического управления. С использованием теории аналитического конструирования оптимальных регуляторов предложен метод ее решения. Установлено распределение полюсов оптимальной замкнутой системы управления.
Ключевые слова: линейный одномерный объект, быстродействие, аналитическое конструирование оптимального регулятора, полюса системы.
Для повышения эффективности функционирования многих технологических процессов, производственных агрегатов, электромеханических систем, желательно чтобы системы управления, входящие в их состав, отвечали критерию оптимальности по быстродействию, который непосредственно определяет их производительность. Однако строгое решение задач оптимального управления по критерию быстродействия в форме обратной связи представляет серьезную теоретическую проблему даже для линейных объектов относительно невысокого порядка (п=3, 4, 5). Действительно, задача быстродействия полностью решена для объектов второго порядка методом фазовой плоскости [1, 2]. Для объектов третьего порядка быстродействующее управление точно (аналитически) найдено только в отдельных частных случаях [1]. Соответственно для объектов четвертого и более высоких порядков аналитические решения задачи быстродействия практически неизвестны [3]. С другой, прикладной точки зрения, реализация строго оптимальных по быстродействию релейных алгоритмов управления, отличающихся математической сложностью, серьезно затруднена и соответственно требует многократно больших технических и экономических затрат в сравнении с линейными алгоритмами управления. При этом отметим, что применение строго оптимальных релейных алгоритмов в условиях действия интенсивных случайных возмущений является и нецелесообразным по причине увеличения ими среднеквадратичной ошибки регулирования системы по сравнению с теми же линейными законами управления [4]. Необходимо также подчеркнуть, что более 90% прикладных задач управления техническими объектами решаются с использованием линейных законов обратной связи, например, стандартных П, ПИ и ПИД-регуляторов [5].
В связи с указанными причинами в настоящей работе рассматривается задача синтеза линейной системы управления с минимальным временем переходных процессов, понимаемым в смысле классической теории
систем автоматического управления. Данная известная задача управления согласно анализу работ [2, 6-8] для многих объектов решается приближенными способами, а для определенных объектов, описываемых передаточными функциями с полюсами и нулями неустойчивого характера, является нерешенной.
1. Постановка задачи быстродействия. Рассмотрим одномерные объекты с постоянными параметрами, динамика которых адекватно описывается передаточной функцией (ПФ)
тгг/ ч вт о) + V'"-1 + + - + К
тУ 7 = -1---2---т<п-\ (1)
Л О) + + а2$п + --- + ал
общего вида, а их управление подчиняется ограничению |//(/)| ^и^.
Для данных объектов сформулируем задачу максимального быстродействия по аналогии с основной задачей управления работы [6]: требуется найти алгоритм управления в форме линейной обратной связи
и [Х(Г)] = К ■ Х(0 = [хзод - х(1)]0) (2)
7=0
с некоторыми параметрами па, , обеспечивающий замкнутой системе регулирования заданный порядок да астатизма и переводящий объект (1) из начального состояния Х(0)=Х0 в конечное, определяемое заданием хзад, с минимальным значением времени переходных процессов системы 1пп, понимаемым в смысле классической теории систем автоматического управления. Напомним, что временем 1пп называют наименьшее время, по истечении которого отклонение выходной переменной х(/) объекта от установившегося значения (хзад) не превышает заданной зоны А [2]. Подчеркнем, что в отличие от классической задачи оптимального быстродействия, решением которой является релейный алгоритм управления, сформулированная задача называется задачей максимального быстродействия. Она эквивалентна задаче, исследуемой в работе [6], в которой оптимальный регулятор отыскивается в форме передаточной функции определенной структуры. В ней искомый регулятор находится с использованием метода синтеза по желаемой ПФ [2], определяемой, в свою очередь, в форме нормированной передаточной функции или ПФ в форме Вышнеград-ского [2, 7]. Как известно, произвольная ПФ (1) может быть преобразована в нормированную заменой переменной 5 новой переменной
д = а = ц]а0/а„ :
щд) = ^^г ? (3)
дп + ахдп~х + а2д"~2 +... + ап-\д +1
где
bi =—b—т, ak =—°k , , i = 0,1,...,m; k = 1,2,...,n-1. ' „m-i „ -k
an ^ a'n a
Замена s = q/а переменной преобразования Лапласа равносильна замене t = at для переменной оригинала и умножения изображения на а. Поэтому время регулирования исходной системы tnn и время регулирования tnn для системы с нормированной ПФ связано соотношением tnn = a?nn. Другие прямые показатели качества, в том числе перерегулирование, для систем управления с исходной и нормированной передаточными функциями совпадают.
В работе [6] вслед за работами [7, 8] в качестве желаемой (оптимальной) нормированной передаточной функции используется функция вида Жн (q) = 1/N(q), причем характеристический полином N(s) имеет комплексные корни с одинаковыми вещественными частями h и мнимыми частями, образующими арифметическую прогрессию с разностью и первым членом, равным g. В работе [7] показано, что существует минимальное значение /л = УМ, при котором время регулирования системы минимально.
Далее автор [6], зная описание объекта (1) и желаемую передаточную функцию замкнутой системы Жн (q) = 1/N(q), известным методом синтеза определяет оптимальную ПФ искомого регулятора. Рассмотренное решение задачи быстродействия имеет следующие недостатки: 1) как будет показано далее, полиномы N(q) [7] для объектов выше второго порядка не обеспечивают максимального быстродействия САУ; 2) используемый метод синтеза в силу его специфических особенностей применим не ко всем линейным объектам (1).
Ниже предлагается метод синтеза систем управления с максимальным быстродействием практически свободный от указанных отрицательных особенностей, основанный на использовании результатов теории аналитического конструирования оптимальных регуляторов (АКОР) [2, 9, 10].
2. Разработка метода синтеза. Для обеспечения требуемого порядка qa астатизма проектируемой САУ в качестве нового управления U(t) будем рассматривать сигнал, подаваемый на вход дополнительного qa-кратного интегратора, включенного последовательно с исходным объектом. В этом случае «расширенный» объект управления будет описываться передаточной функцией
= = _3m^ ° , Па = п + qa . (4)
w L[U(t)] pqaAn (s) Ana (s)' a 4a
(5)
(6)
Как известно, используя или физические сведения об управляемом объекте или теорию решения задачи о построении динамической реализации системы, описанию объекта в форме передаточной функции (4) можно поставить в соответствие его описание в некотором пространстве состояния [9, 10]:
(г) = А1- Z (г) + В1- и(г) с управляемой переменной
* (г) = хзад - х(г) = С1 • Z (г), где Z(г) - вектор состояния объекта; А1, В1, С1 - матрицы параметров общего вида, имеющие соответственно размерности па хпа, па х 1, 1хпа.
С целью упрощения решения сформулированной задачи управления проведем преобразование фазовых координат объекта Z(г) = Б • X(г) с использованием такой невырожденной матрицы Б, при которой описание объекта принимает каноническую форму Фробениуса
X (г) = А • X (г) + В • и(г) (7)
с матрицами следующей структуры
Г 0 1 ... 0 > ( 0 ^
А= 0 0 1 0 , В = 0
ч а1 а2 ... апа у V Ь у
Как известно, матрица перехода Б, обладающая указанным свойством, может быть найдена разными способами [9, 10].
Подчеркнем, что компоненты вектора состояния X имеют ясный математический и физический смысл
*1(г) = Хзад -х(г), *2(г) = *1(г), хэ(г) = *2(г),...,хпа (г) = хщ-1(г)
- смысл отклонения выходной переменной объекта от заданного режима и его производных.
В качестве следующего шага в решении целевой задачи быстродействия (1), (2) сформулируем и решим для объекта (7) известную задачу АКОР Летова-Калмана [2, 10]. Она состоит в определении закона обратной связи и(X) ° и(Х1,Х2,..,хп ), который в совокупности с объектом (7) образует асимптотически устойчивую систему, переводящий ее из начального состояния X(г=0)=X0 в конечное нулевое состояние X(г^ж)=0 с минимальным значением квадратичного функционала
I=1
¥ п1
X дгх2(г) + ги 2(г)
0 V г=1
А
¥ I
° 1 (xT (г ^ (г) + ги 2(г
г, 41, г > 0, (8)
0
где г, дг - некоторые положительные весовые коэффициенты критерия качества управления, соответственно Q - диагональная матрица, составленная из коэффициентов
Как известно [2, 9, 10], решение задачи (7), (8) описывается линейным алгоритмом управления
и(г) = -г~lвTPX(г) = -ш(г), к = я_1ВТР, (9)
в котором матрица Р находится как положительно определенное решение матричного уравнения Риккати
РА + АТР - г~1РВВТР + Q = 0. (10)
Воспользуемся решением (9), (10) для приближения к решению целевой задачи (1), (2), выбрав соответствующие значения весовых коэффициентов квадратичного критерия (8). Во-первых, согласно результатам работы [11], для увеличения быстродействия синтезируемой системы управления целесообразно задать значения коэффициентов 42 = 4з = "' = 4па = 0
. В указанной работе показывается, что для объектов, описываемых в фазовом пространстве с каноническим вектором состояния
X = (х,Х,...,х(па-1))Т, введение в квадратичный критерий составляющих
(г), 1=2,3,..., па только увеличивает время переходных процессов в оптимальной системе, так как это приводит к ограничению величин скорости, ускорения и т.д. выходной переменной. Во-вторых, можно принять значение 4=1, нормировав определенным образом переменную х1(г). Значение оставшегося весового коэффициента г критерия для увеличения быстродействия линейной системы необходимо уменьшать до возможного минимального значения: уменьшение г снижает уровень ограничения, накладываемый на сигнал управления при минимизации функционала (8), увеличивая значения и(г) и, соответственно, быстродействие САУ. Однако при уменьшении г необходимо не допустить превышения значений управления установленного предела |и(г)| < итах.
Подытоживая указанные результаты, можно предложить методику решения задачи быстродействия (1), (2), содержащей следующие процедуры.
1. По ПФ (4) «расширенного» объекта с требуемым порядком да ас-татизма определяем описание объекта в пространстве состояния (5), (6).
2. Определяем матрицу преобразования Б описания объекта к канонической форме (7), например, с использованием методик работ [9, 10].
3. Для объекта (7) решаем задачу АКОР по квадратичному критерию (8) с весовыми коэффициентами 41 = 1, 42 = 4з = " = = 0 и значении г, обеспечивающем выполнение ограничения |и(г)| < итах, и находим
матрицу коэффициентов усиления к закона обратной связи (9).
4. Определяем искомый закон управления
и (г) = ^ (г), К = КБ- (11)
для исходного объекта управления (5), (6).
15з
3. Анализ свойств системы управления с максимальным быстродействием. Исследуем свойства системы, синтезированной с применением предложенной методики, и, в частности, установим распределение ее полюсов при г —> 0. С этой целью воспользуемся известным результатом [4, 9], что корни характеристического полинома 0(я) оптимальной системы управления при больших значениях параметра р = 1/г —> <х> будут при-
~ 2п 2
ближаться к устойчивым корням двучлена 5 а + рЪ , которые на комплексной плоскости совпадают с вершинами правильного 2 па -угольника, вписанного в окружность радиуса
В литературе такое распределение корней известно как распределение (размещение) Баттерворса порядка па с радиусом (12), причем они определяют полюса динамических систем, называемых фильтрами Баттерворса
Таким образом, с учетом наличия ограничения на управление и известного факта, что невырожденное преобразование фазовых координат объекта К^) = £> • Х(/) не изменяет характеристический полином системы управления [9], приходим к утверждению 1: линейная динамическая система порядка п имеет время переходных процессов близкое к минимальному значению, если распределение ее корней приближается к распределению Баттерворса /7-го порядка.
Дальнейшие исследования по уточнению и обобщению этого утверждения привели к формулировке утверждения 2: необходимым услови-
передаточной функцией вида Ж(р) = К/А(р), имеющей, в общем случае, комплексные характеристические полюсы и значения сигнала управления, не превышающие заданного ограничения \и(0\<итгх, является расположение ее характеристических чисел (полюсов) строго на окружности
радиус Я которой выбирается из условия выполнения ограничения на величину управления.
Предварительно, перед доказательством утверждения 2, отметим, что распределение полюсов оптимальной системы управления нечетного порядка удовлетворяет условию (13) лишь приближенно. Как показали последующие исследования, условие (13) выполняется тем точнее, чем выше порядок системы. Например, погрешность выполнения этого условия для нормированной системы третьего порядка составляет ~ 18%, системы пятого порядка - -1%.
(12)
[2, 9].
(13)
Также подчеркнем, что первоначально это утверждение было сформулировано в форме гипотезы в работе [12], в которой отмечалось принадлежность полюсов фильтров Баттерворса окружности (13).
При доказательстве равенства (13) будем исходить из следующего факта классической теории автоматического управления, что существует линейная замкнутая система п-го порядка с максимальным быстродействием, которая является асимптотически устойчивой системой и соответственно, в общем случае, описывается передаточной функцией, имеющей некоторое число 2 у комплексных полюсов с отрицательной частью и п - 2у вещественных отрицательных полюсов:
К (р) = 1 "пЬгР + 1)Г1 Т2 Р2 + 2,р +1). (14)
/ г=1 7=1
Отметим, что передаточная функция (14) соответствует системе, представляющей последовательное соединение определенного числа апериодических и колебательных звеньев, характеризующихся постоянными времени Т и коэффициентами демпфирования , причем коэффициент усиления системы условно принимается равным единице (он не влияет на время ее переходных процессов). Подчеркнем, что в данной работе рассматривается ограниченный класс быстродействующих систем, описываемый ПФ, числитель которых является константой. Аналогичный класс систем управления исследовался и в работе [6].
При решении сформулированной задачи максимального быстродействия системы (14) воспользуемся преобразованием (3) и в дальнейшем данную задачу будем рассматривать применительно к системе с ПФ
к (я) = 1 "пТя + 1)п(Т;2д2 + 27,4 +1), (15)
/ г=1 7=1
в которой безразмерные (относительные) постоянные времени связаны соотношением
п-2у _ у
п т п т2=1. (16)
г=1 ,=1
Подчеркнем, что преобразование (3), осуществляющее переход к использованию относительного времени, не изменяет коэффициенты демпфирования системы и, соответственно, не изменяет характер (форму) ее переходных процессов, а изменяет только масштаб изображения переходных процессов во времени.
При решении сформулированной задачи максимального быстродействия воспользуемся также физически ясным фактом, вытекающим из основ теории автоматического управления, что время переходных процессов системы (15) при фиксированных значениях ее параметров (при
фиксированном характере переходных процессов) является возрастающей функцией 1пп = /(ад,-,Тп-у) при увеличении значений ее аргументов -
постоянных времени Т- , т.е. она имеет положительные частные производные по указанным аргументам.
Предположим, что некоторым образом удалось установить значения коэффициентов демпфирования ^,, соответствующие системе максимального быстродействия с указанным ограничением на сигнал управления. При данных фиксированных значениях параметров ^, рассмотрим
задачу оптимизации (минимизации) времени переходных процессов системы (15) за счет выбора ее постоянных времени Т-, - = 1,2,...,п-у. Для оптимизации времени переходных процессов рассматриваемой системы в соответствии с возрастающим характером функции 1пп = / Т1,Т2,—, Тп-у)
необходимо параметры Т-, - = 1,2,. .,п-у уменьшать, причем согласно ограничению (16) уменьшение целесообразно осуществлять до значений Т = 1. Дальнейшее же уменьшение Т- < 1 приведет к увеличению некоторых постоянных времени Т, > 1 и, следовательно, к увеличению времени
1пп при условии, что все постоянные времени Т- имеют одинаковую степень влияния на время переходных процессов системы. Таким образом, при данном условии приходим к выводу, что нормированная система (15) будет иметь минимальное время переходных процессов, если ее постоянные времени Т = Т2 = — = Тп-у = 1, а полюса ее передаточной функции соответственно расположены на окружности единичного радиуса. В этом случае исходная (ненормированная) система (14) с учетом соотношения р-1 = 1/ Т будет иметь максимальное быстродействие, если ее полюсы строго удовлетворяют условию (13) утверждения 2.
Если же степень влияния различных Т- на время 1пп неодинакова,
то для минимизации 1пп целесообразно уменьшить значения Т- с максимальной степенью влияния, пожертвовав некоторым увеличением Т- с минимальной степенью влияния. В результате вектор значений Т[, Т2,..., Тп -у,
доставляющий минимум 1пп, в этом случае не будет единичным: часть Тс максимальной степенью влияния на 1пп будет меньше 1, другая - больше 1, но их среднее значение может быть относительно близко к единице. Последующий анализ показывает, что постоянные времени апериодического и колебательного звеньев по разному влияют на длительность переходных процессов системы. Этот вывод непосредственно следует из физики движения указанных звеньев, а математически выражается в том, что движе-
156
ние апериодического звена описывается экспоненциальной функцией, а колебательного - принципиально иной: произведением экспоненты на гармонические функции. В тоже время нет никаких оснований считать, что влияние на длительность переходных процессов системы однотипных звеньев (только апериодических или только колебательных) различно. Отталкиваясь от этого вывода, при четном значении п передаточную функцию быстродействующей системы представим последовательным соединением однотипных колебательных звеньев, постоянные времени которых в одинаковой степени влияют на время ее переходных процессов и поэтому их значения Т = Т2 = — = Тп/2 ° Т равны. В этом случае с учетом соотношения |рг-| = 1/ Т полюсы системы с максимальным быстродействием
строго удовлетворяют условию (1з) утверждения 2, т.е. расположены на окружности радиуса Я = 1/ Т.
Необходимо отметить, что меньшее время переходных процессов гпп системы, получаемое при меньших величинах постоянных времени Т = Т2 = " • = Тп /2 ° Т, достигается за счет больших значений сигналов управления и поэтому чем меньше гпп , то тем больше максимальное по модулю значение управления и . Следовательно, при синтезе быстродействующего регулятора и последующем его моделировании с целью выбора величины Я = 1/ Т, применимо правило: чем больше Я, тем больше значение и и тем ближе приближаемся к границе неравенства
|и(г^ < итах.
Подчеркнем, что быстродействующая система может содержать в своей структуре и апериодические звенья с равными постоянными времени, которые получаются из указанных колебательных звеньев при £ = 1.
Необходимо отметить, что для некоторого класса систем условия утверждения 2 являются не только необходимыми, но и достаточными условиями быстродействия. К данному классу, например, относятся системы с переходными процессами монотонного характера, которые имеют только действительные отрицательные полюса. Для этих систем условие (13) и ограничение на управление однозначно определяют параметры оптимальной передаточной функции
Ж (я) = к/ Т + 1)п . Данный результат был установлен ранее в работах [6, 7].
Для указанных систем условие (13) однозначно определяют параметры передаточных функций замкнутых систем управления, зная которые с использованием метода синтеза по желаемой ПФ относительно легко осуществить синтез регулятора, обеспечивающего максимальное быстродействие проектируемой системе. Данный метод подробно описан в работах [2, 6].
Список литературы
1. Атанс М., Фалб П.Л. Оптимальное управление. М.: Машиностроение, 1968. 764 с.
2. Пупков К. А. Методы классической и современной теории автоматического управления: в 3 т. / К. А. Пупков и др. М.: Изд-во МГТУ им. Н.Э. Баумана, 2000.
3. Ловчаков В.И. Функции переключения оптимального по быстродействию регулятора для четырехкратного интегратора // Мехатроника, автоматизация, управление. 2014. №9. С. 3-5.
4. Абдулаев Н.Д., Петров Ю.П. Теория и методы проектирования оптимальных регуляторов. Л.: Энергоатомиздат, 1985. 240 с.
5. Александров А.Г., Паленов М.В. Состояние и перспективы развития адаптивных ПИД-регуляторов // АиТ. 2014. №2. С. 16-30.
6. Ким Д.П. Синтез оптимальных по быстродействию непрерывных линейных регуляторов // АиТ. 2009. №3. С. 5-16.
7. Красовский А.А., Г.С. Поспелов Основы автоматики и технической кибернетики. М.: Гостехиздат, 1962.
8. Рубинчик А.М. Приближенный метод оценки качества регулирования в линейных системах. Сборник: устройства и элементы теории автоматики и телемеханики. М.: Машгиз, 1952.
9. Квакернак Х. Линейные оптимальные системы управления. М.: Мир, 1977. 650 с.
10. Александров А.Г. Оптимальные и адаптивные системы. М.: Высшая школа, 1989. 264 с.
11. Садовой А.В., Сухинин Б.В., Сохина Ю.В. Системы оптимального управления прецизионными электроприводами. Киев: ИСИМО, 1996. 298 с.
12. Ловчаков В.И. К решению задачи максимального быстродействия линейных систем. // Системы управления электротехническими объектами. Вып. 7. Сб. научных трудов седьмой Всероссийской научно- практической конференции. Тула: Изд-во ТулГУ, 2015. С. 127 -133.
Ловчаков Владимир Иванович, д-р техн. наук, проф., [email protected], Россия, Тула, Тульский государственный университет,
Мозжечков Владимир Анатольевич, д-р техн. наук, [email protected], Россия, Тула, ЗАО ««Инженерно-технический центр ««Привод»»
SYNTHESIS OF LINEAR CONTROL SYSTEMS WITH A MAXIMUM OPERA TING SPEED
V.I. Lovchakov, V.A. Mozzhechkov 158
The paper is concerned the problem of synthesis for high order linear continuous objects with restrictions on regulator control and minimum regulation time in terms of classic automatic control theory. The method of solving the problem with the help of analytical design theory of optimal controllers was proposed. It was also found distribution of poles closed-loop control system.
Key words: linear one-dimensional object, maximum operating speed, analytical design of optimal controller, poles of closed-loop control system.
Lovchakov Vladimir Ivanovich, doctor of technical science, professor, [email protected], Russia, Tula, Tula State University,
Mozzhechkov Vladimir Anatol'evich, doctor of technical science, main engineer, [email protected], Russia, Tula, JSC "ETCPrivod"
УДК 681.513
СОВРЕМЕННЫЕ ПРОБЛЕМЫ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ЭЛЕКТРОПРИВОДАМИ И ПУТИ ИХ РЕШЕНИЯ
Б.В. Сухинин, В.В. Сурков
Известно, что если проблемы не решаются на том уровне, где они появились -необходимо подняться на уровень выше. Возникающие проблемы оптимального управления невозможно решить чисто математически: математика без физики - глупа, физика без математики - слепа. Предлагается взглянуть на проблемы метода динамического программирования Р. Беллмана, имеющего методологическое значение, со стороны физических явлений. Это позволяет решить проблемы оптимальной по точности системы управления электроприводом высокого порядка, в том числи и нелинейным.
Ключевые слова: аналитическое конструирование, оптимальное управление, оптимальная точность, устойчивость, функциональное уравнение.
Наиболее общий метод решения задач оптимального управления в форме обратной связи, получивший название динамического программирования, предложен Р. Беллманом еще в 30-х годах прошлого столетия. В его основе лежит принцип оптимальности: любой конечный участок оптимальной траектории является также оптимальным, а любой промежуточный участок может быть не оптимальным.