заведений / под ред. И.Я. Браславского. М.: Издательский центр «Академия», 2004. 256 с.
2. Кузнецова О. А. Многокритериальная оптимизация асинхронного электропривода: монография / под ред. В. А. Сушкина. Тула: Изд-во ТулГУ, 2009. 104 с.
3. Поляков В.Н., Шрейнер Р. Т. Экстремальное управление электрическими двигателями: монография / под общ. ред. Р.Т. Шрейнера. Екатеринбург: Изд-во УГТУ-УПИ, 2006. 420 с.
4. Уайт Д., Вудсон Г. Электромеханическое преобразование энергии: пер. с англ.; Л.: Энергия, 1964. 528 с.
M.V. Gryazev, O.A. Kuznetsova
OPTIMAL CONTROL IN ASYNCHRONOUS ELECKTRIC DRIVE
The basic concept of an optimal energyefficient control of asynchronous electric drive is considered.
Key words: optimal control, asynchronous drive.
Получено 18.10.11
УДК 681.513
А.Э. Соловьев, д-р техн. наук, проф., (910)701-60-61, [email protected], Е.В. Ловчаков, асп., (961) 265-06-78 (Россия, Тула, ТулГУ)
МЕТОД СИНТЕЗА КВАЗИОПТИМАЛЬНЫХ СИСТЕМ УПРАВЛЕНИЯ ПО КРИТЕРИЯМ БЫСТРОДЕЙСТВИЯ И ЭНЕРГОСБЕРЕЖЕНИЯ
Для широкого класса объектов с полиномиальными нелинейностями разрабатывается метод синтеза квазиоптимальных замкнутых систем управления относительно высокого п порядка по критериям быстродействия и энергосбережения. Данный метод основан на замене решения данной задачи управления решением соответствующей задачи аналитического конструирования оптимального регулятора для рассматриваемого объекта по заданному определенным образом функционалу качества. Для решения последней задачи модифицируется известный метод степенных рядов, который позволяет получать ряд приближений к оптимальному управлению с возрастающей точностью и, соответственно, сложностью.
Ключевые слова: фазовое пространство системы управления, полиномиальная нелинейность, критерий быстродействия, энергосбережение, задача аналитического конструирования оптимального регулятора.
Постановка задачи исследования
В работе рассматривается задача оптимальных систем управления (СУ) объектами с полиномиальными нелинейными характеристиками, которые описываются дифференциальными уравнениями:
xi(t) = ai[X(t)] + bi[X(t)] • u(t); i = 1,2,...,n; \u(t)| < Umax = 1, (1)
T
где X = (xi,X2,...,xn) - вектор состояния объекта, u(t) - управляющее воздействие, ограниченное величиной Umax, ai (X) = ai (xi, X2,..., xn), bi (X) = bi (xi, X2,..., xn) - однозначные полиномиальные функции от компонент вектора состояния. Такие модели являются типичными для электротехнических задач, в частности, для электропривода при учете его характерных нелинейностей.
Для данных объектов исследуется задача аналитического конструирования оптимальных регуляторов (АКОР) [1, 2] по критерию качества:
T2
11 =J(q + ru2(t))dt, q,r > 0. (2)
0
Первоначально данная задача управления возникла в связи с разработкой подхода приближенного решения задач максимального быстродействия. Действительно, данный критерий при r ^ 0 приближается к функционалу быстродействия и поэтому его использование при достаточно малых значениях параметра r позволяет определять квазиоптимальные по быстродействию управления. Подчеркнем, в настоящее время известны законы оптимального быстродействия, полученные методом фазовой плоскости, для замкнутых систем второго порядка и отдельных классов систем третьего порядка. Для объектов высокого порядка (n > 4) с нелинейными характеристиками не установлены, за редким исключением, такие законы управления, хотя в них существует высокая практическая потребность [2].
Одновременно отметим, что задача АКОР (1), (2) имеет самостоятельное большое, как прикладное, так и теоретическое значение: оптимизация по комплексному критерию (2) означает достижение максимального быстродействия (первое слагаемое функционала) при использовании управлений с минимальной мощностью (второе слагаемое критерия) - соотношение этих слагаемых определяется значениями весовых коэффициентов критерия q и r. Последнее является актуальным в свете требований современных энергосберегающих технологий, особенно для автономных электроприводов подвижных объектов (автомобилей, самолетов, судов), питаемых, например, от аккумуляторных батарей. При этом заметим, что полагать значение q = 0 и решать задачу энергосбережения без учёта ограничения на быстродействие системы, как правило, не имеет физического смысла. Действительно, как следует из [3], для устойчивых объектов задача управления при q = 0 имеет решение
U(X) = 0, которое для практики не представляет интереса.
С другой стороны, необходимо отметить, что использование критерия (2) может упростить нахождение приближенных решений задачи быстродействия. Действительно, применение метода динамического программирования [1, 2] к задаче (1), (2) определяет закон обратной связи в форме
u (X ) = -sat
1 £ ^ • Ь [ X а)]
(3)
2г/=1 дх/
в котором функция Беллмана удовлетворяет следующему уравнению в частных производных:
п дS (X) ( 1
£—— ai (X)--
i=1 дх/ 4г
'£ ^ • Ь (X)Л V/'=1 дх/ у
2
Я ,
(4)
известному в литературе как уравнение Гамильтона - Якоби - Беллмана (ГЯБ). Данное уравнение имеет квадратичную нелинейность, дифференцируемую при любом значении аргумента. Это в отличие от строгой задачи
имеющей модульную нелинейность
£ • ьг (X)
быстродействия, ^
/=1 дх/
обеспечивает для задачи АКОР (1), (2) существование дифференцируемой функции Беллмана S (X) во всем фазовом пространстве объекта и соответственно применимость для ее решения мощного метода динамического программирования. Последнее утверждение вытекает из известной теоремы Коши - Ковалевской [6], которая устанавливает существование единственного аналитического решения для аналитических дифференциальных уравнений в частных производных, т.е. для уравнений в которых функции а/ (X), Ь/ (X) представляются степенными рядами, сходящимися в определенных областях. Очевидно, вывод теоремы справедлив и для уравнений с полиномиальными функциями, являющимися частным случаем аналитических. Указанная теорема определяет надежный теоретический фундамент предлагаемого подхода конструирования квазиоптимальных СУ, как по критерию быстродействия, так и комплексному критерию (2), состоящего в нахождении единственного решения уравнения (4) с последующим определением искомой обратной связи по выражению (3).
Практически единственным общим методом решения уравнений вида (4) является метод степенных рядов [2]. В теории оптимального управления этот метод наиболее разработан для синтеза систем, оптимальных по квадратичному функционалу качества: Т ( п . \ Т
12=1
2 2 £ я/х (У) +ги (У)
У, Я/, г > 0. (5)
Л =\ X) + ги (У)
о V/'=1 у о
В общем случае Q(X) может быть положительно определенной
функцией, содержащей не только квадратичные слагаемые, но и составляющие более высоких степеней, например, четвертой. При конструировании СУ объектами (1) по критерию (2) оптимальное управление описывается выражением (6), в котором функция Беллмана определяется как решение уравнения
Г л2
п д8 (X) _ 1 [ п д8 (X) л
Ъг (X)
V/=1 дх/
-6(Х).. (6)
• щ (X)-— /=1 дх/ 4г Данное уравнение отличается от (4) только правой частью - константа д заменяется на положительно определенную функцию Q(X).
Метод степенных рядов решения уравнения (6) основан на определении функции Беллмана в форме ряда
п п
8(X) = ^ Аукх/х]хк + ^ Аук1х/х]хкх1 + ••• (7)
}=1 / ,],к=1
с искомыми коэффициентами А], А]к, Луы, причем полиномиальные функции щ (X), Ъ (X), Q(X) уравнения представляются в аналогичном виде [2].
Однако стандартный метод степенных рядов неприменим к уравнению (4), так как его правая часть не является отрицательно определенной функцией равной нулю в начале координат. В связи с этим в работе решается следующая целевая задача: исследовать способы приближения в заданной области фазового пространства Х единичной функции /¡(X) = 1 положительно определенными функциями Q(X) и на их основе предложить метод синтеза квазиоптимальных систем управления объектами (1) с высокой степенью приближения минимизирующие функционал качества (2).
Разработка метода синтеза квазиоптимальных СУ
Аппроксимация функции критерия
При выборе положительно определенной функции Q(X) функционала (5) необходимо учитывать два основных требования, обеспечивающих близость решений указанных задач управления: 1) данная функция должна быть как можно ближе к функции /¡(X) = 1 во всем фазовом пространстве Х объекта за исключением точки X=0, в которой Q(0)=0 (это обеспечивает повышение быстродействия системы); 2) функция Q(X) должна иметь соответствующую структуру, обеспечивающую возможность применения стандартного метода степенных рядов в решении задачи АКОР.
Второе требование непосредственно выделяет два класса функций, в которых следует искать зависимость Q(X): 1) класс полиномов и 2) класс дробно-рациональных функций. Именно эти функции позволяют применить описанный метод степенных рядов в исследуемой задаче управления.
В соответствии с результатами работы [7] для объектов, имеющих
канонический базис X = (х , х,..., х (п 1))Т, функцию Q(X) целесообразно задавать как функцию одной выходной переменной объекта Q(X) = Q(х1). В указанной работе для линейных объектов утверждается, что введение в квадратичный критерий составляющих дх), / = 2,3,...,п увеличивает время переходных процессов в оптимальной системе, так как это приводит
223
к ограничению величин скорости, ускорения и т.д. выходной переменной. Если теперь учесть, что /1(х1)=1 является четной функцией своего аргумента, то приходим к выводу о необходимости искать функцию 0(х\) в структуре полинома
О Л А
Q( х^) = а^ + «2 х^ + а^Х1 +... (8)
или дробно-рациональной функции
Q( ^ ) = а1х12 + а2 х14 + а3х16 +... (9)
1 + Ь^2 + ¿2 х14 + Ьз х16 +...
с коэффициентами аЬ, 1 = 1,2,3,...
Относительно просто коэффициенты полиномиальной аппроксимации (8) рассчитываются методом наименьших квадратов (МНК) [6], в котором искомые коэффициенты определяются из условий минимума среднеквадратичной ошибки аппроксимации
2
/ =1
- й
й ( т Л 1 - £ а^х 1
г=1
т.е. решением системы уравнений
йх,
д/ в
й
2
й
и т й
| 1 - £ агх 1 йх = 2 |
г
т
1 - £ а^х21
х2кйх = 0, к = 1,2,..., т..
дак дак -й V г=1 ; -й V г=1
где [-й, й] - рассматриваемый интервал задания функции. Данная система после интегрирования полиномиальных функций преобразуется к виду
т й21 1
£---аг =-- , к = 1,2,...,т. (10)
1=12(1 + к) +1 1 2к +1
Полиномиальные аппроксимации, построенные с использованием уравнений (10), с увеличением порядка довольно медленно приближаются к функции /1(Х)=1, причем только на принятом интервале аппроксимации - за пределами этого интервала аппроксимирующие функции неограниченно увеличиваются по модулю (рис. 1, а). Поведение же дробно-рациональных функций принципиально иное: дробно-рациональная функция при больших значениях аргумента практически совпадает с единицей, асимптотически приближаясь к ней (рис. 1, б). Даже простейшая аппроксимация
01(х1) = ^4 (11)
1 + ах1
при определенных значениях параметра а обеспечивают меньшую сред-неквадратическую ошибку приближения, чем полином восьмой степени, коэффициенты которого рассчитаны с помощью МНК.
а б
Рис. 1. Аппроксимации функции/1(Х)=1: а - полиномиальная степеней 6,8,10; б - дробно-рациональная, а=25, а=100
По указанным причинам при решении задачи управления (1), (2) рекомендуется использовать, как правило, дробно-рациональную аппроксимацию (11). Величину ее параметра а можно определить также методом наименьших квадратов. Поскольку величина а в основном влияет на скорость монотонного приближения функции к единице и соответственно величину интервала, в котором она существенно, например, более чем на 5 % отличается от единицы (рис. 2.), то величину а можно рассчитать из других соображений. Так, в частности, значение а целесообразно выбирать непосредственно в процессе синтеза СУ задавшись величиной Xи указанного интервала - интервала малых отклонений системы, для которых время переходных процессов не является критичным ввиду его малости.
Этапы метода синтеза
Подытоживая вышеизложенное, сформулируем основные этапы предлагаемого метода синтеза оптимальных по быстродействию СУ.
1. Задаем в соответствии с рекомендациями предыдущего раздела положительно определенную функцию 0(х1) критерия (5) в форме полинома (8) или дробно-рациональной функции (9) (последнее часто предпочтительнее с точки зрения точности и, возможно, объема вычислений).
2. Определяем функцию Беллмана для задачи АКОР (1), (5) как решение уравнения ГЯБ вида (6) стандартным методом степенных рядов.
3. Определяем по формуле (3) квазиоптимальное управление.
4. При моделировании синтезированной системы управления уточняют значения параметров д и г критерия качества. Для системы быстродействия д=1, а величина г постепенно уменьшается до момента достижения системой максимального быстродействия с допустимым перерегулированием. Для системы энергосбережения, наоборот, параметр г=сот1 (определяет энергию сигнала управления), а величина д медленно
увеличивается до момента, когда время переходных процессов станет приемлемой для заказчика. Если используется аппроксимации (9), то указанные процедуры осуществляется совместно с уточнением величины границы Х И интервала малых отклонений системы и соответственно параметра а аппроксимации согласно указанным рекомендациям.
5. Если желаемого быстродействия синтезируемой системы не удается достичь, то увеличивается степень полинома, аппроксимирующего функцию Беллмана, или изменяется аппроксимация функции Q(x1) критерия и этапы 2 - 5 повторяются.
6. На заключительном этапе оценивается точность решения задачи управления, определяемая величиной [£(Хо) -/(Хо)]/£(Хо), где/(Хо) -значение функционала (5), вычисленное на траектории движения синтезированной системы из начального состояния Хо до конечного Х = 0. Если она не устраивает проектировщика, то пп. 1 - 6 повторяются при повышенной точности аппроксимации функций Q(x1), £(Хо).
Замечание: анализ результатов синтеза по пп. 5 и 6, как правило, выполняются одновременно.
Проверка метода синтеза на примере задачи быстродействия объектом второго порядка
Применим данный метод к решению задачи быстродействия для простейшего объекта:
х^) = х2(г), Х2(г) = и (г) < 1, (12)
для которого известен оптимальный по быстродействию закон управления [1]:
и (Х) = - s1gn( х1 + 0.5х21 х2|). (13)
В дальнейшем сравнение управления (13) и управления, найденного с применением предложенного метода синтеза, позволит сделать определенные выводы о работоспособности и особенностях этого метода.
Предположим, что проектировщика СУ интересует движение объекта (12) при изменении координаты х1 в интервале [-2,5; 2,5].
В соответствии с изложенным методом квазиоптимальное по быстродействию управление объектом (12) находим по выражению
1 д£ (Х )"
и (Х) = -sat
(14)
2 г дх2
в котором функция Беллмана £(Х) удовлетворяет следующему уравнению в частных производных:
х2 -р
дх1
Ад£ (Х)л2
2 4 6
= -а^ -а2х1 -а3х1 , (15)
ч дх2 )
где в = 1/4г, а1 = 1,440, а2 = -0,507, а3 = 0,0502 (эти значения рассчитаны решением системы уравнений (10) при т = 3 и й = 2,5).
Уравнение (15) решаем методом степенных рядов:
226
S(X) - АцХ]2 + 2Аиxix22 + A1111x14 + А1112x13x2 +
2 2 3 4
+ A1122 x1 x2 +A1122 x1x2 + A2222x2 + ••• (16)
Подставляем функцию (16) в уравнение (15):
(24Л + 2А12x2 + •••) ■ x2 - Р(2А12x1 + 2А22x2 + ...)2 -
— —(х^! —a 2 x1 —0,3 x1 • (17)
Приравниванием коэффициентов при квадратичных слагаемых уравнения (17) получаем систему уравнений
x12: — 4РА122 — ab x1x1:2An — 8РА12А22 — 0, x22 : 2А12 — 4РА222 — 0-(18) Ее решением определяем искомые коэффициенты при квадратичных членах функции Беллмана:
А12 — 0•^Л/aí7p, А22 — VА12/Р, А11 — 2РА12А22 • (19)
Для указанных исходных параметров задачи управления d=2,5, r=0,1 эти коэффициенты принимают значения А11=1,045, А12=0,379, А22=0,275^
Соответственно приравниванием коэффициентов при слагаемых уравнения (19) четвертой степени получаем систему уравнений
x1 : 3
x1 x2 :
2 2 x1 x2
3
x1 x2 :
x2
4
— 4РА12 А1122 ——a 2,
4 A1111 — P(8 A12 A1122 + 4 A22 A1112) — 0, 3 A1112 — P(12 A12 A1222 + 8 A22 A1122) — 0, 2 A1122 — P(16 A12 A2222 +12 A22 A1222) — 0, A1222 — 16PA22 A2222) — 0^
(20)
Численным решением системы линейных алгебраических уравнений (20) легко найти значения коэффициентов А1112= - 0,134, А1122= - 0,0386, А1222= - 0,0165, А2222= - 0,0015 функции Беллмана.
Аналогичным образом, численным решением системы уравнений, полученной приравниванием коэффициентов при слагаемых уравнения шестой степени, находим значения коэффициентов А111112= 0,0132, А111122= 3,4310-3, А„Ш2= 4,1510-3, А112222= -4,814 10-8, А122222= - 1,3 9 8-10-8, А222222 = - 8,458-10- искомой функции Беллмана.
Таким образом, рассчитали все параметры квазиоптимального управления
u (X) — —sat
— (А12 x1 + 2 А22 x2 + A1112 x13 + 2 A1122 x12 x2 + 2r
2 3
+ 3 A1122 x1x2 + 4 A2222x2 + •••)
(21)
Квазиоптимальные системы управления объектом (12) с законами обратной связи и1(Х), и3(Х), и5(Х), получаемых из (21) соответственно
удержанием только линейных слагаемых, только слагаемых до третьей степени и только слагаемых до пятой степени, были промоделированы с использованием математического пакета Mathcad. Переходные процессы перевода объекта их начального состояния Х0=(2,5 0) в конечное нулевое состояние представлены на графиках рис. 2.
2Ы Щл
6
Рис. 2. Переходные процессы в оптимальной и квазиоптимальных системах: а - (и1(Х)-1) = 0,336; б - (и5(Х)-1) = 0,28; в - (из(Х)-1) = 0,593; г - (из(Х)-1) = 0,326
Сразу отметим, что система управления с законом и3(Х) оказалась неработоспособной - неустойчивой. Явление неустойчивости системы с управлением и3(Х) в отличии управлений и1(Х), и5(Х) можно объяснить тем, что используемая при синтезе управления и3(Х) функция 2 4
/э(х) = (65/3)х -130х , аппроксимирующая /1(х)=1, в отличие от функ-
О О А А
ций /[(х) = (65/3) х и /5(х) = (65/3)^ -130хн + (2210/7) х при больших значениях аргумента функция не является положительно определенной из-за отрицательности слагаемого с наибольшей используемой степенью, что нарушает условия теоремы устойчивости Ляпунова [1].
При моделировании СУ значение параметра г = 0,1 было выбрано из условия наилучшего приближения переходных процессов системы управления с законом и5(Х) к оптимальным процессам. Однако быстродействие данной системы 1пп ~ 4 с существенно отличается от оптимального *
? пп = 3,16 с и переходной процесс имеет перерегулирование.
Более высокое качество управления было получено при использовании дробно-рациональной аппроксимации
^ (х) = -(Ьх? + a2 x4) /(1 + ах?)2 (22)
с параметрами а= 25, Ь = 55,5 и представления:
5 (X) = А( X )/(1 + ах2), (23)
где А(Х) - искомый полином:
А( Х) = А11х12 + А12 х1х2 + А22 х2 + А1111х14 + А1112х3 х2 +
+ А1122 х12 х2 + А1122 х1 х2 + ••• • Его коэффициенты при г = 1.55 были найдены методом степенных рядов: Ац= 32,086, А12= 18,55, А22= 5,362, Апп= 165,128, АШ2= 104,448, А1122= 24,5, А1222= - 18,014, А2222= - 1,302 •
Согласно уравнениям (14), (22), (23) искомый закон обратной связи принимает вид
3 2
( А12 Х1 + 2 А22 Х2 + АШ2 Х1 + 2 А1122 Х1 Х2 +
2г (1 + ах2)
щ (X) = -
2 3
+ 3 А1122Х1Х2 + 4А2222х2 )
2 г (1 + ах2)
(24)
Он является более простым в сравнении с управлением (21) (число полиномиальных слагаемых в два раза меньше), но в то же время и более близким к оптимальному: длительность переходного процесса по координате х1 согласно рис. 2,г приблизительно равна ¿пп-3.3 с и близко к опти-
*
мальному значению ? пп= 3.16 с.
Предложенный метод синтеза систем, оптимальных по критерию качества (2), показал аналогичные свойства при конструировании СУ третьего порядка.
Обобщим и уточним отмеченный факт, что некоторые синтезируемые системы являются неустойчивыми. С использованием системы уравнений (10) в общем случае получается аппроксимация функции А(Х) = 1 в форме полинома
т
т(х) = С1х2 -С2х4 + С3х6 -С4х8 +... + Стх2п = X(-1)*-1 Скх2к• (25)
к=1
с положительными коэффициентами Ск.
Предположим, что при синтезе квазиоптимального регулятора мы ограничиваемся определением полиномиальной функции Беллмана (она же является функцией Ляпунова для синтезируемой системы), содержащей члены с наибольшей степенью Ы3=2к. Если значение к - четное, то согласно (25) коэффициент (-1)к^Ск будет отрицательным, т.е. функция (25),
а соответственно и функция Беллмана как решение уравнения ГЯБ (4), не являются положительно определенными в области больших отклонений системы, а сама СУ согласно теореме Ляпунова неустойчивой в этой области. Таким образом, доказано утверждение: для обеспечения устойчивости системы, синтезируемой предложенным методом, необходимо задавать максимальное значение степени Ns=2k слагаемых полиномиальной функции Беллмана, соответствующее нечетному значению k, т.е. устойчивость обеспечивается управлениями u1(X), u5(X), u9(X),..., u2k-1(X).
Это утверждение, исключающее из рассмотрения половину неудовлетворительных управлений, имеет важное прикладное значение, особенно для объектов высокого порядка.
Список литературы
1. Методы классической и современной теории автоматического управления. Т. 2. Синтез регуляторов и теория оптимизации систем автоматического управления / К.А. Пупков [и др.]. М.: Изд-во МГТУ им. Н.Э. Баумана, 2000. 736 с.
2. Справочник по теории автоматического управления / А. А. Кра-совский [и др.]. М.: Наука, 1987.
3. Сиразетдинов Т. К. Методы решения многокритериальных задач синтеза технических систем. М.: Машиностроение, 1988. 160 с.
4. Муромцев Ю. Л., Орлова Л. П. Микропроцессорные системы энергосберегающего управления. Тамбов: Изд-во ТГТУ, 2001. 60 с.
5. Коробов В. И. Метод функций управляемости. М. Ижевск: НИЦ «Регулярная и хаотическая динамика», 2007. 576 с.
6. Бронштейн И.Н., Семендяев К. А. Справочник по математике для инженеров и учащихся втузов. М.: Наука, 1986. 544 с.
7. Садовой А.В., Сухинин Б.В., Сохина Ю.В. Системы оптимального управления прецизионными электроприводами. Киев: ИСИМО, 1996. 298 с.
A.E. Soloviev, E.V. Lovchakov
METHOD FOR SYNTHESIS OF QUASICONTROL CRITERIA AND SPEED ENERGY CONSERVATION
For a wide class of objects with polynomial nonlinearities Pipeline Synthesis of quasi-closed systems management with respect to the high (n) order on the criteria of performance and energy efficiency is construkted. The method is based on replacing the control solution of this problem solving the corresponding analytical construction of optimal controller for the object in a given functional in some way in the quality. To solve the latter problem is modified by well-known method ofpower series, which produces a number of approximations to the optimal control with increasing precision and, therefore, complexity.
Key words: phase space control systems, polynomial nonlinearity, the criterion of performance, energy conservation, the problem of analytic design of optimal controller.
Получено 18.10.11