УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
УДК 681.513
A.В. Сурков, инж., [email protected] (Россия, Тула, ТулГУ),
Б.В. Сухинин, д-р техн. наук, проф., зав. кафедрой, [email protected] (Россия, Тула, ТулГУ),
B.В. Сурков, д-р техн. наук, проф., (4872) 33-23-34, [email protected] (Россия, Тула, ТулГУ)
КОЛИЧЕСТВО ИНТЕРВАЛОВ УПРАВЛЕНИЙ ОПТИМАЛЬНЫХ ПО БЫСТРОДЕЙСТВИЮ СИСТЕМ
Рассматривается «физический» подход к решению задачи быстродействия на основе функций переключения. Доказывается, что для нелинейных систем оптимальное по быстродействию управление состоит из n интервалов управлений, которые могут быть найдены один за другим по мере сжатия - расширения фазового пространства в процессе функционирования системы.
Ключевые слова: аналитическое конструирование оптимальных по быстродействию регуляторов, количество интервалов управлений.
Решение задач быстродействия для нелинейных объектов представляет серьезную теоретическую проблему [1], а с учетом широкого распространения задач быстродействия - также и практически важную проблему. Их решение относится к центральной проблеме современной теории автоматического управления - проблеме оптимизации в «большом» [1, 2]. Для ее решения неизвестны теоретически законченные, относительно простые методы. Так, например, для синтеза оптимальных по быстродействию систем часто применяется теорема об n интервалах А.А. Фельдбаума [3], которая им доказана для линейных систем, имеющих апериодические переходные процессы. Позднее аналогичный вывод был сделан и для нелинейных систем [4], которые будучи линеаризованными имеют апериодические переходные процессы (не осциллирующие системы). Однако данная теорема позволяет определить только количество интервалов, а не оптимальное быстродействующее управление.
Для простоты рассуждений, не влияющих на сущность решаемой задачи, рассмотрим одномерный объект, уравнение возмущенного движения которого можно представить в виде
X(t) = A(X) + B(X) • u(t), (1)
где X e Rn - вектор отклонений фазовых координат состояния объекта от заданной траектории движения; A(X) - матрица-столбец с элементами aA(X) = ai(x1,x2,^,xn), i = 1,2,...,n , в общем случае это нелинейные однозначные функции вектора состояния объекта; B(X) = (b1,b2,.,bn) -
вектор-столбец с элементами b1 = 0,b2 = 0,. ,bn-1 = 0,bn = 1 ;
I u(t) |< 1 (2)
- управляющее воздействие, которое в оптимальных системах должно доставлять минимум функционалу
J = J Fo(X)dt, Fo(X) > 0 (3)
0
при переводе объекта управления из начального положения X(0) = X0 в конечное нулевое положение. В критерии (3) F0(X) не зависит явно от управляющего сигнала; Т - время регулирования не фиксировано. В частном случае при F0(X) = 1 получаем критерий быстродействия.
Для такой задачи в [5] получено основное функциональное дифференциальное уравнение относительно функции переключения
ÿ (X) = G • X = f(X) + 9(X) • u (4)
оптимального релейного закона управления при 9(X) > 0 :
u = -sign(ÿ). (5)
Здесь G = (gbg2,...,gn), gi =dy/dxi, f(X) = G• A, 9(X) = G• B > 0 - неизвестные функции координат объекта, требующие своего определения.
Это позволяет сформулировать задачу аналитического конструирования оптимальных по быстродействию регуляторов: для критерия (3) при F0 (X) = 1 определить функцию переключения оптимального управления
(5) объектом (1), используя функциональное уравнение (4) и учитывая ограничение (2).
Будем называть траектории движения объекта естественными при действии максимально возможного управления |u| = 1 (umax =+1 или umin = -1). Рассмотрим одну из траекторий движения объекта (1) под действием оптимального по критерию (3) управления u = -sign(ÿ) из некоторой начальной точки фазового пространства X(0) = X0, причем ÿ(X0) ф 0.
Процесс движения объекта (1) под действием управления (5) можно условно разбить на два этапа [1]: первый этап (первый интервал) устойчи-
вого движения к поверхности переключения ÿ(X) = 0 [6 ] и второй этап движения вдоль (по) поверхности ÿ(X) = 0.
Процесс перевода объекта на многообразие ÿ(X) = 0 оптимален по быстродействию, поскольку происходит под действием максимального управления | u | = 1 , и может быть двух видов: апериодический или колебательный [7]. При этом точка фазового пространства (в дальнейшем просто точка), двигаясь по естественной траектории системы (1), либо втыкается в поверхность и затем движется вдоль этой поверхности, либо "прошивает" поверхность переключения (рис. 1).
В первом случае | ÿ(X) | уменьшается апериодически (неосциллирующий объект), а точка, попав на поверхность переключения (точка А), остается на ней. При этом для перевода объекта на поверхность ÿ(X) = 0 потребуется всего один интервал максимального значения управления u = ±1 в соответствии с теоремой А.А. Фельдбаума (рис. 1,а).
а б
Рис. 1. Схематическое изображение движения к поверхности переключения: а - апериодическое; б - колебательное
Во втором случае для осциллирующего объекта | у(Х) | уменьшается колебательно [6]. В зависимости от колебательных свойств системы и положения точки Х0 в фазовом пространстве (начальной величины
у(Х0)) потребуется несколько чередующихся по знаку интервалов максимального значения управления (по теореме А.А. Фельдбаума), например, рис. 1,б соответствует трем интервалам.
Назовем процесс перевода объекта на многообразие у(Х) = 0 (апериодический или колебательный) интервалом управления [5].
Дальнейшее движение точки (второй этап) будет происходить под действием того же управления и = -sign(y) вдоль поверхности переключения у(Х) = 0 при \{/ (X) = 0 [5]. Такое движение также может быть двух видов. Первый вид: движение происходит за счет скользящего режима по бесконечно малым кускам естественных (фазовых) траекторий объекта (рис. 2). Число переключений управляющего сигнала теоретически равно
бесконечности, причем у (Х) только в пределе равно нулю [8]. При этом естественные траектории движения объекта не совпадают с поверхностью переключения. Второй вид - движение происходит точно вдоль (по) поверхности при точном равенстве у (Х) = 0, при этом естественные траектории движения объекта точно совпадают с поверхностью переключения.
Очевидно, что наиболее быстрый процесс движения точки в фазовом пространстве будет только в том случае, если это движение происходит по естественным траекториям объекта. Следовательно, для наиболее быстрого процесса движения вдоль поверхности у(Х) = 0 необходимо и достаточно поверхность переключения у(Х) = 0 выбрать так, чтобы она совпала с естественной траекторией движения, при этом у (Х) = 0, но не за счет скользящего режима, а точно равно нулю.
Рис. 2. Схематическое изображение скользящего режима движения
по поверхности переключения
Другими словами, начиная с момента переключения сигнала управления (рис. 1, точка А), когда точка окончательно окажется на поверхности у(Х) = 0 (после апериодического или колебательного движения к поверхности у (Х) = 0), скорость проникновения у (Х) для быстродействующего процесса на втором этапе должна быть точно равна нулю независимо от знака и величины этой скорости до переключения [7, 8].
Если обозначить скорость проникновения до переключения у _ (Х), а после переключения - у+(Х), то необходимое и достаточное условие совпадения поверхности переключения с естественной траекторией движения на втором этапе можно записать в следующем виде [7 :] у _ (Х) • у + (Х) = 0. В последнем выражении обязательно должны присутствовать обе скорости - у _ (Х) и у+(Х), поскольку неизвестен нак управление до и после переключения, известно только, что управление меняет
141
знак. Пусть, например, до переключения управление и _ =_1, а после переключения и + =+1 или наоборот, тогда, подставляя соответствующие
производные от функции переключения из уравнения (4) в последнее ра-
2 2
венство, будем иметь: у_-у += Г (Х)_ф (Х) = 0.
Учитывая, что ф(Х) > 0 [5], получим необходимое и достаточное условие наиболее быстрого движения точки по поверхности у(Х) = 0 (второй этап), причем поверхность переключения точно совпадает с естественной траекторией движения:
I ЦХ) | = ф(Х). (6)
Отметим, что условие (6) не зависит от управляющего воздействия и должно выполняться с момента перехода от первого этапа (первого интервала) ко второму этапу (то есть с момента окончательного сближения точки с поверхностью у(Х) = 0 ) и не зависимо от вида движения на первом интервале к поверхности у(Х) = 0 . Если характер движения на первом интервале апериодический, то на первом интервале вплоть до момента окончательного сближения точки с поверхностью у(Х) = 0 должно выполняться условие | Г (Х) | = ф(Х); если колебательный, то | Г (Х) I > ф(Х)
[6], а по мере приближения к поверхности у(Х) = 0 (рис. 1, точка А) последнее неравенство должно превращаться в равенство. Условие (6) можно назвать необходимым и достаточным условием смены этапов (интервалов) при очередном переключении сигнала управления.
Решим уравнение у(Х) = Г(Х) + ф(Х) • и = 0 относительно управления (найдем эквивалентное управление и2 [6, 8], обеспечивающее движение вдоль у(Х) = 0), при этом учтем равенство (6):
и 2 =_ ^ = _^п[Г(Х)]. (7)
ф(Х)
Отметим, что оптимальное управление на втором этапе одно и то же и определяется формулой (5). Эквивалентное управление (7) является всего лишь следствием (преобразованием) основного управления (5) в силу дополнительного уравнения у(Х) = 0, появляющегося на втором этапе.
Если решить теперь уравнение у(Х) = х: + а(х2, х3,...,хп) = 0 относительно выходной (самой "медленной") координаты х: = ст(х2, х3,..., хп) и подставить х: в уравнения объекта (1) и эквивалентного управления и2 (7), то можно увидеть, что на втором этапе движения объекта вдоль у(Х) = 0 произошло сжатие фазового пространства в
момент переключения на одну координату. Отметим, что условие (6) является одновременно необходимым и достаточным условием сжатия фазового пространства в момент переключения. Здесь следует пояснить, почему надо исключать самую младшую координату х:, а не самую старшую хп
(как, например, это делает А.А. Колесников [1]). Поскольку самая старшая координата хп наиболее информативная и наиболее "чувствительная" (ближе всех расположенная) к управляющему воздействию, то именно она должна остаться вплоть до окончания всего процесса управления.
Процесс движения объекта (1) на втором этапе под действием управления (7), в свою очередь, можно условно разбить также на два этапа: первый этап (второй интервал) устойчивого движения к поверхности переключения Г (Х) = 0 и второй этап движения вдоль поверхности Г (Х) = 0.
Если обозначить функцию Г (Х) в эквивалентном управлении (7) за новую функцию переключения второго интервала
у2(х2, х3,..., хп) = Цх2, х3,..., хп), то по отношению к новой функции у2 второго интервала можно, в свою очередь, повторить все сказанные выше рассуждения. Выполняя аналогичные действия для последующих интервалов, приходим к выводу, что последняя функция переключения будет состоять всего лишь из одной координаты хп: уп = хп, причем последнее эквивалентное управление ип = _sign(уп) = _sign(xn) переводит и удерживает точку в начале координат.
Теорема. Если объект управления описывается нелинейным дифференциальным уравнением (1) п-го порядка, то для оптимального по быстродействию управления необходимо и достаточно не более п интервалов управлений и = _sign(у¡), причем функция переключения ьо интервала у i 0 = 1,2,...,п _ 1) определяется функциональным уравнением у¡(Х) = ^(Х) + ф^Х)• и, а последнего (п-о) интервала - уп = хп. Для осциллирующих объектов интервалы управлений будут иметь несколько чередующихся по знаку интервалов максимального значения управления теоремы А.А. Фельдбаума. Для неосциллирующих объектов п интервалов управлений и = _sign(у{) равны п интервалам максимального значения управления теоремы А.А. Фельдбаума.
1. Для оптимального по быстродействию управления осциллирующим объектом необходимо выполнить условие | ^ (Х) | > ф^ (Х) и достаточно условия |^(Х)| = ф^(Х) в момент окончания текущего и начала следующего интервала.
2. Для оптимального по быстродействию управления неосциллирующим объектом необходимо и достаточно условия | ^(Х) | = фх(Х) .
Доказательство. Воспользуемся динамическим программированием Р. Беллмана и рассмотрим весь процесс управления поинтервально, но в обратном порядке (рис. 3).
На последнем интервале (от точки А п-1 до начала координат в точке 0) управление ип = _sign(уп) = _sign(xn) оптимально по быстродействию переводит точку фазового пространства на поверхность переключения последнего интервала уп = хп = 0 размерности, равной нулю (точка 0) по
линии переключения (по поверхности переключения предпоследнего интервала уп_1(хп_1, хп) = 0 размерности, равной единице).
Рис. 3. Схематическое изображение структуры поверхности переключения и траектории движения при оптимальном по быстродействию управлении
Рассмотрим предпоследний - (п-1)-й интервал движения от точки А п-2 до точки А п-1. На предпоследнем интервале управление ип_1 = _sign(уп_1) переводит точку фазового пространства по поверхности уп_2(хп_2 хп_1,хп) = 0 размерности, равной двум, на поверхность
уп_1 (хп_1, хп) = 0 размерности, равной единице.
Для того чтобы движение точки на предпоследнем и последнем интервалах по поверхности переключения уп_1(хп_1, хп) = 0 было оптимально по быстродействию, необходимо, чтобы поверхность переключения уп = хп = 0 принадлежала поверхности переключения уп_1(хп_1,хп) = 0 предпоследнего интервала более высокой размерности, а функция переключения последнего интервала уп = хп удовлетворяла функциональному уравнению предпоследнего интервала уп_1 = Гп_1 + фп_1 • и, где Гп_1 = уп = хп. При этом необходимо, чтобы выполнялось условие | Гп_1 | > ф п_1 до тех пор, пока точка двигается колебательно вокруг поверхности переключения уп_1(хп_1, хп) = 0 и достаточно, чтобы выполнялось условие | Гп_11 = фп_1 с того момента, когда точка окончательно попадет на поверхность уп_1(хп_1, хп) = 0. Условие | Гп_11 = фп_1 достаточно, так как только в этом случае поверхность уп_1(хп_1, хп) = 0 совпадает с естественной траекторией движения точки к поверхности уп = хп = 0 последнего интервала и удовлетворяются все перечисленные необходимые условия. Если процесс сближения точки на предпоследнем интервале с поверхностью переключения у п_1 (х п_1 , х п ) = 0 предпоследнего интервала носит апериодический харак-
144
тер, то условие | Гп_1 | = фп_1 необходимо и достаточно для оптимального по быстродействию движения на предпоследнем и последнем интервалах.
Продолжив дальнейшие рассуждения и двигаясь от интервала к интервалу к начальной точке у(Х0 ) фазового пространства, имеем: для того чтобы движение точки (объекта) было оптимально по быстродействию, необходимо, чтобы на каждом ьм интервале движения (i = 1,2,..., п _ 1) выполнялось условие | ^ | > ф^ пока точка совершает колебательные движения вокруг поверхности переключения у{ = 0 и достаточно | ^ | = ф^ для движения по поверхности переключения на единицу меньшей размерности. Если движение точки к поверхности у{ = 0 носит апериодический характер, то необходимо и достаточно условие | ^ | = ф^.
1. Поверхность переключения для оптимального по быстродействию управления состоит не более чем из п вложенных друг в друга поверхностей переключения все более уменьшающейся размерности, последняя поверхность вырождается в точку начала координат.
2. В общем случае оптимальный по быстродействию переходный процесс состоит из п интервалов движения, каждый из которых описывается своим функциональным уравнением (4) и на каждом из которых действует свое эквивалентное управление (5).
3. Любой интервал заканчивается при окончательном сближении точки со своей поверхностью переключения.
4. Оптимальное по быстродействию движение объекта происходит по естественным траекториям, принадлежащим поверхности переключения на каждом интервале вплоть до начала координат.
5. Теорема позволяет провести декомпозицию задачи быстродействия на п однотипных задач, решая которые поинтервально с последнего интервала (в соответствии с методом Р. Беллмана), можно получить оптимальный по быстродействию закон управления.
Приведём, например, алгоритм решения задачи быстродействия для неосциллирующих нелинейных объектов п-го порядка: п-й интервал: у п = хп, ип =_sign(xn);
(п-1)-й интервал: у п_1 = хп +1 хп | •и, ип_1 = _sign(уn_l);
(п-2)-й интервал: уп_2 = уп_1 + | уп_1 | ^ , ип_2 = _^п(уп_2);
... и так далее ...
(1+1)-й интервал: у{+1 = у{+2 + | у 1+2 | ^ , и1+1 = _sign(у 1+1);
1-й интервал: уi =уi+1 +1 уi+11 •и, и =_sign(у¡);
. и так далее .
2-й интервал: у2 =у3 +1 у3| •и, и2 =_sign(у2);
1-й интервал: у =у2 +1 у2| •и, и =_sign(у).
Здесь у 1 = {у^ + С = {[у 1-1 + | у 1-1 | -и]& + С 1 = -1, С -
константа интегрирования соответствующего функционального уравнения у 1 с учетом уравнений объекта от 1 до п. Константы С определяются из условий у¿(0) = 0, так как поверхность переключения должна проходить через начало координат.
Пример. Задан неосциллирующий объект:
х 1 = х2, х 2 = х3, х 3 = и. (8)
Уравнениями (8) приближенно описывается ряд объектов, например, процесс управления курсом нейтрального самолета, собственным демпфированием которого можно пренебречь. Наиболее полно и подробно задача синтеза оптимальной системы (7) с ограниченной третьей производной регулируемой величины решена А.А. Фельдбаумом [3] и А.А. Павловым [9]. В этих работах получено точное решение для быстродействующего оптимального управления (рис. 4):
u = -sign
x1 +
3
x3
+
x2x3 +
2
x3
+ x2sign
x2 +
I x3 I x3
3 '
Л 2
sign
У_
_
x+
|x3 |x3^
(9)
Рис. 4. Переходный процесс для объекта (8) при управлении по закону (9) при С = -3,3308 (на графике управления рис. 4 не показан скользящий режим, возникающий по окончании переходного процесса)
Проведем синтез функции переключения, начиная с последнего интервала. На последнем (3-м) интервале функции переключения у3 = х3 и и3 =-sign(x3). На предыдущем (2-м) интервале функциональное урав-
нение будет иметь вид у2 = у3 + | у3 | -и = х3 + | х3 | -и или с учетом уравне-
146
3
2
2
2
ний объекта (7) имеем у2 = х2 + | х3 | -х3. Учитывая, что на 2-м интервале х3 не меняет своего знака (это процессы третьего интервала), получим
Подчеркнем, что функциональное уравнение (10) 1-го интервала является одновременно основным (общим) функциональным уравнением, из которого интегрированием в силу уравнений объекта можно определить функцию переключения оптимального по быстродействию регулятора и оптимальное управление:
С - постоянная интегрирования уравнения (12), которую легко найти с помощью вычислительной техники. Оптимальный регулятор определяется формулой (1 1) и содержит в цепи обратной связи интегратор, работающий в соответствии с формулой (12). Результаты моделирования (см. рис. 4) процессов системы (8) с точным известным управлением (9) и управлением (11), (12) показывают полное совпадение графиков.
1. Колесников А.А. Синергетическая теория управления. М.: Энер-гоатомиздат, 1994. 344 с.
2. Справочник по теории автоматического управления; под ред.
A.А. Красовского. М.: Наука, 1987. 712 с.
3. Фельбаум А.А. Основы теории оптимальных автоматических систем. М.: Наука, 1966. 624 с.
4. Клюев А.С., Колесников А.А. Оптимизация автоматических систем управления по быстродействию. М.: Энергоиздат, 1982. 240 с.
5. Оптимальные управления в релейных системах / В.В. Сурков
[и др.] // Изв. вузов. Электромеханика. 2002. № 6. С. 29-35.
6. Критерий оптимальности систем с релейным управлением /
B.В. Сурков, Б.В. Сухинин, В.И. Ловчаков, Е.И. Феофилов // Изв. вузов. Электромеханика. 2004. № 3. С. 44-50.
7. Барбашин Е.А. Введение в теорию устойчивости. М.: Наука, 1967. 223 с.
8. Уткин В.И. Скользящие режимы в задачах оптимизации и управления. М.: Наука, 1981. 367 с.
У 2 = х2 +
интервала:
(10)
и = -sign(y) = -sign(x1 + х4 + С),
(11)
где
(12)
Список литературы
9. Павлов А.А. Синтез релейных систем, оптимальных по быстродействию. М.: Наука, 1966. 390 с.
A. Surkov, B. Sukhinin, V. surkov
Quantity of control intervals of optimal speed systems
The physical method of solving the problem of optimal speed based on switching function is considered. It is shown that optimal speed control for non-linear systems consists of n control intervals which may be found one by one as phase space compression and expansion go during system operation.
Keywords: analytical design-optimal controllers, the number of intervals offices.
Получено 12.01.10
УДК 534.14:534.122
B.Н. Хмелев, д-р техн. наук, проф., (3854) 43-25-81, упЬ@Ьй^еспа.ш,
C.Н. Цыганок, канд. техн. наук, доц., (3854) 43-25-70, grey@bti. secna.ru,
А.В. Шалунов, канд. техн. наук, доц., (3854) 43-25-70, shalunoу@bti.secna.ru,
А.Н. Лебедев, инж., (3854) 43-25-70, 1ап@Ьй^еспа.ги,
С.С. Хмелев, асп., (3854) 43-25-70, [email protected],
А.Н. Галахов, асп., (3854) 43-25-70, [email protected] (Россия, Бийск, БТИ)
РАЗРАБОТКА ПЬЕЗОЭЛЕКТРИЧЕСКИХ УЛЬТРАЗВУКОВЫХ КОЛЕБАТЕЛЬНЫХ СИСТЕМ ДЛЯ ИНТЕНСИФИКАЦИИ ПРОЦЕССОВ В ГАЗОВЫХ СРЕДАХ
Предложены и исследованы новые конструкции многопакетных пьезоэлектрических колебательных систем для формирования высокоинтенсивных колебаний ультразвуковой частоты в газовых средах. Разработана методика проектирования и моделирования колебательных систем с изгибно-колеблющимися дисковыми
излучателями ступенчато-переменной толщины. Предложенные технические решения положены в основу разработанного специализированного технологического оборудования, обеспечивающего ультразвуковое воздействие для интенсификации различных технологических процессов в газовых средах.
Ключевые слова: ультразвук, ультразвуковая колебательная система, дисковый излучатель, многоэлементный излучатель.
1. Введение. Постановка задач исследований
Применение механических колебаний ультразвуковой частоты высокой интенсивности для воздействия через газовые среды позволяет ускорить различные технологические процессы: коагуляцию аэрозолей и пыли [1]; сушку продуктов и материалов [2]; осаждение пены [3] и др. Для эффективного проведения подобных процессов необходимо обеспечивать уровень звукового давления в газовой среде более 130.. .140 дБ. Для созда-