УДК 629.7.0
прогнозирующие алгоритмы управления динамическими объектами
В. А. Погонин,
доктор техн. наук, профессор
П. М. Оневский,
канд. техн. наук, доцент
А. А. Третьяков,
канд. техн. наук, доцент
А. М. Иванов,
аспирант Тамбовский государственный технический университет
Предложены алгоритмы терминального управления нелинейными динамическими объектами, использующие методы математического программирования для поиска оптимального решения. Благодаря применению прогнозирующих моделей, включающих наряду с моделями объектов уравнения чувствительности, задача оптимального управления сводится к задаче на условный экстремум функции нескольких переменных.
Ключевые слова — оптимальное управление, прогнозирующая модель.
Введение
При решении задач оптимального управления методами математического программирования возникают трудности, связанные с поиском экстремума функций при огромном количестве переменных и ограничений. В соответствии с традиционно используемой методикой при формулировании задачи оптимального управления в виде задачи математического программирования каждая скалярная компонента вектора состояния или управления рассматривается для каждого дискретного момента времени как особая переменная. При этом число таких переменных и соответствующих ограничений увеличивается с увеличением количества временных интервалов дискретизации при описании показателя качества и модели объекта в дискретной форме и в пределе стремится к бесконечности [1]. Увеличение размерности задачи снижает точность вычислений и увеличивает время поиска оптимального решения, что затрудняет использование разрабатываемых алгоритмов управления на практике, особенно при их реализации в реальном масштабе времени.
Использование прогнозирующих моделей для описания поведения объекта в будущем и для определения чувствительности компонент его
вектора состояния к управляющим воздействиям позволяет заменить решение задачи математического программирования в традиционной постановке на последовательность более простых, т. е. с меньшим количеством переменных и ограничений, задач математического программирования. Это даст возможность разработать алгоритмы терминального управления нелинейными объектами, способные функционировать в реальном масштабе времени.
Алгоритм управления конечным состоянием объекта
Пусть объект управления описывается уравнением
X = f(X, и, #), Х(#0) = Хо, (1)
где Х(г) = [х1(#), х2(г), ..., хп(г)]т — вектор состояния; Щ(г) = [м1(#), и2(г), ..., ит(г)]т — вектор управляющих функций, т < п; Х0 = [х1(г0), х2(г0), ..., хп(г0)]т — вектор начальных условий; f = [/1, f2, ..., fnl — дифференцируемая по всем аргументам нелинейная вектор-функция.
Требуется перевести объект (1) из начального состояния Х(г0) в конечное состояние Хг(г1), причем требования на конечное состояние могут на-
кладываться не на все компоненты, а на r < n компонент вектора X. Предполагается также, что система (1) управляема по этим r фазовым координатам. Каких-либо дополнительных требований к траектории X(t) в процессе движения объекта
(1) в конечное состояние XT(t1) не предъявляется.
Вектор управлений зададим в виде
U(t) = U(S, t), (2)
где S = [s1, s2, ..., sk]T — k-мерный вектор настраиваемых параметров, k > m.
Компоненты вектора U(t)
Uj (t) = Uj (Sj, t), j = 1,m, (3)
где Sj с S, Sj Ф Sv при j Ф v, v = l,m, т. е. множество компонент вектора параметров S разбито на m не-пересекающихся подмножеств Sj.
Функции (3) могут выбираться в достаточной мере произвольно, однако они должны быть дифференцируемы по своим аргументам. Например, возможно их задание в виде
uj (t) = u°jn (s1t + s2 )(1 + s3 + s4t), (4)
где u°n (t) — опорные управления, получаемые с использованием известных методов оптимального управления, например принципа максимума, для номинального режима функционирования объекта [2]. Таким образом, функции u°n (t) определяют качество процесса управления и удовлетворение технологическим и техническим ограничениям в определенных пределах в процессе движения объекта к конечной точке. Настраиваемые параметры Sj в (4) играют роль модулирующих функций, деформируя опорные управления по частоте (s1), фазе (s2), амплитуде (s3) и углу наклона к оси времени (s4). Таким образом, с помощью соответствующего выбора настраиваемых параметров sj можно найти такой вектор управляющих функций U(t), который бы переводил систему (1) из начального состояния Х0 в конечное XT. При этом в ограниченной области изменения начальных и конечных условий получаемые траектории близки к оптимальным в том смысле, в каком были получены опорные управления u°n (t).
Управление объектом (1) представляет собой итеративный процесс. На каждом цикле коррекции траектории путем прогнозирования определяются отклонения реализуемых конечных значений вектора X(t1) от заданных XT, на основе которых вычисляются поправки к вектору настраиваемых параметров S.
Рассмотрим решение системы (1) с управлением
(2). Так как при реализации траектории X(t, t0, U(S, t), X0) начальные условия в точке t = t0 уже выбраны и не варьируются, полагаем, что X(t, t0, U(S, t), X0) = X(t, U(S, t)).
Потребуем, чтобы в некоторый момент времени t выполнялось равенство Х@, U(S, t)) = Хт. Линеаризуя левую часть данного равенства в окрестности точки (БР ^), где — значение вектора параметров, полученное на р-й итерации; t1 — фиксированный момент времени, t1 > t0, имеем
X(ti, U(Sp, ti)) + f
дU дS
t=ti AS +
s=sp
д X д U
CD U д t
л д X t=ti At + ——
s=sp дt
t=ti At — Xt. (5)
s=sp
Выражение (5) может быть использовано для определения поправок ДS к вектору ^ и поправок Дt к длине интервала прогнозирования для случая, когда время управления жестко не фиксировано или неизвестно.
Подставляя t = t1 в выражение (5), получим уравнение для вычисления поправок ДS для случая фиксированного конечного момента времени:
t=ti AS— (Xt — X(ti)) = 0, (6)
s=sp
где X(t1) = X(t1, U(Sp, t1)), или в скалярной форме
k
£ ap Asj — bp = 0, i = ITT, (7)
j=i
д X дU
CD U 5S
где ap = £
д Xi д Uk
. — чувствительность пе-
11 диь дв: Р
Ь=1 ь 1 в] =в] ременной хі по параметру Sj; ДSj — поправка к j-му настраиваемому параметру; ЬР = хіт — хі (^) — невязка по і-й управляемой переменной на р-й итерации.
В уравнения (7) вошли г компонент вектора состояния X, на которые наложены требования в конечной точке t = t1.
При г = & система (7) представляет собой систему из & линейных алгебраических уравнений относительно неизвестных поправок Дsj, ] = 1, Ь. Решая систему (7) относительно Дsj, производим уточнение вектора параметров S по формуле
S Р+1 = S Р + Г ДS Р, (8)
где Г — симметричная & х &) матрица, характеризующая величину шага; р — номер итерации на каждом цикле коррекции траектории.
Выбирая соответствующим образом элементы матрицы Г, можно реализовать тот или иной алгоритм спуска к искомому S.
Уравнения (6) или (7) могут также использоваться для вычисления поправок Дsj и для случая, когда время управления жестко не фиксиро-
вано. Это возможно, если контроль за остановом процесса интегрирования при прогнозировании осуществлять по достижению какой-либо монотонно изменяющейся координаты х1 вектора X своего заданного значения хт. Это более эффективный способ, чем находить искомые поправки из уравнения (5).
ОЫъ
Выражения для частных производных
дsj
в (7) известны и определяются видом управля-
д X'
ющих функций (3). Производные —- являются
дщ
функциями чувствительности параметров траектории хг по управлениям ик и определяются из решения соответствующих уравнений чувствительности [3]:
• дf дf
Z(t) = Z(t) +----, Z(t0) = 0, (9)
д^ дИ
„ д X
где Ъ = — (п х т) матрица чувствительности;
ди
ет д£
---, — матрицы Якоби размерности соответ-
д X ди
ственно (п х п) и (п х т).
Использование уравнений чувствительности резко сокращает число прогнозов по сравнению со случаем, если бы частные производные системы (7) определялись численным дифференцированием, а также повышает точность определения поправок Asj.
Таким образом, для организации управления объектом (1) на каждом цикле коррекции траектории необходимо совместно интегрировать уравнения модели (1) и уравнения чувствительности (9), затем, используя выражения (7) и (8), определять уточненные значения вектора параметров S. Количество прогнозов (итераций) зависит от требуемой точности, выбранного начального приближения S0 и уровня возмущений, действующих на объект (1). Вариант реализации данного алгоритма представлен в работе [4].
Алгоритм оптимального управления нелинейным объектом при отсутствии ограничений на управления
Решим задачу, рассмотренную выше, при дополнительных требованиях, предъявляемых к управляемому процессу, в виде минимизации некоторого показателя качества:
J(S) = f /о (Х(^И^Д)^, (10)
%
где /0(Х, и) — дифференцируемая скалярная функция векторных аргументов, отражающая мгновенные потери качества.
Требуется с помощью управления (2) перевести объект (1) из начального состояния Х0 в конечное Хт за время t1 - t0 и при этом обеспечить минимизацию показателя качества (10).
В соответствии с (10) расширим вектор состояния системы (1), тогда
X = f (X, И, а Х(^) = Хо, (11)
где Х@) = [Х0(0, х^), Х2^), ..., Xn(t)]T; U(t) = [и^), u2(t), ..., Um(t)]T; Х0 = [0, Xl(to), x2(to), ..., Хп(^)]т; f =
= [/0, /1, /2, ..., /Х
Переменная х0(^ в системе (11) характеризует текущее значение показателя качества, уравнение для которой получается дифференцированием (10) по t. При t = t1 разложим х0(^ U(S, t)) в ряд Тейлора в окрестности точки ^, оставляя в разложении члены до 2-го порядка включительно:
к
Хо ^,И(ЗД) = Хо^р) + £
1=1
к к
д Хо
дs;
р AS' +
в: =3," '
д хо
2 .л дв'дв: :=1 ]=1 ' 1
в1=вР
р
31 =в •
1 1
Ав'Аз1. (12)
При t = t1 и S = ^ решим задачу на условный экстремум функции (12) при ограничениях (7), для чего введем функцию Лагранжа:
L(^ Я, X) =хо(я Р) + Е +
к к д2 г
Хо AsiAsj + Е Х.
к к +1Е Е
2.л... дs;дs; . .
1=17=1 1 1 1=1
к д Х
Е Е*, Ав7 - Ьр 1=1 дЯ1
, (13)
где (' = 1,г) — множители Лагранжа.
Заметим, что число уравнений системы (7) должно быть меньше числа настраиваемых параметров, т. е. г < й. Стационарная точка (AS*, X*), соответствующая минимуму функции L(AS, X), а следовательно, минимуму по AS функции (12) при ограничениях (7), определяется из системы уравнений
= 5хо_д\_ A + £ хпдхп = о; дAв^ дв: .л дв:дв,- 1 л п дв:
I I 1=1 I 1 ^=1 1
^Х)=)Г дХ1 Aвv-ьр=о.
дХ1 v=1 двv 1 .
(14)
Решая систему (14), состоящую из й + г линейных алгебраических уравнений с й + г неизвестными Asi, X (: = 1, к, ] = 1, г), производим уточнение вектора параметров S по формуле (8).
Частные производные системы (14) определяются из выражений
=ТТ
д2Хо ди ди1 +т дх
д Хо
двмдв., ^ ^ ди:ди/ дв.. дв.
ц V '=11=1 I 1 ц
+Т
2
д Щ
дXq т дх^ диу
двм .. ди; двм ’
1 =1 1
q = о, г; . = 1, к; V = 1, к.
(15)
ди.-
Частные производные
дв..
^2
д щ
дй.д вv
в (15) опре-
деляются так же, как и в первом разделе, функ-
ции чувствительности
д Xq
ди;
2
д Хо
ди-ди1
из реше-
ния следующей системы уравнений чувствительности 1-го и 2-го порядков при нулевых начальных условиях:
d
д2Х п п
и ■л-q ______
д2/ дХм дXv
dtдujдu; ТТдХмХу ди, дu;
' 1 М=1.=1 . . 1 1
^2
д хл,
д/
п д/
Т :
, дXv дщ-ди; ди,ди:
V=1 v 11 11
ди,
(16)
q = 0,n; ' = 1,т; 1=1, т.
Поскольку порядок дифференцирования в производных 2-го порядка системы (16) безразличен, то общее число различных уравнений этой системы равно т(т + 3)(п + 1)/2.
Итак, для определения управлений (2) для объекта (1), доставляющих минимум показателю (10) и переводящих объект из Х0 в Хт, необходимо на каждом цикле коррекции траектории определять вектор параметров S, для чего организуется итеративный процесс (8). Поправки ДSp на каждой итерации определяются из системы линейных алгебраических уравнений (14), коэффициенты которой вычисляются с помощью формул (15). Функции чувствительности, входящие в формулы (15), определяются из решения системы дифференциальных уравнений (16) при t = t1, которые интегрируются совместно с уравнениями модели (11).
Алгоритм оптимального управления нелинейным объектом при наличии ограничений на управления
Рассмотрим задачу из предыдущего раздела при условии, что на управления и наложены ограничения в виде диапазонов изменения настраиваемых параметров:
а у < вj < ру , 1= 1,к, (17)
где а,, в, — заданные вещественные числа.
Требуется перевести объект (11) из Х0 в Хт, обеспечив при этом минимизацию х0(^, и(Б, t1)) при выполнении условий (17).
Как и ранее, решение поставленной задачи осуществляем итеративным путем. На каждом цикле коррекции траектории организуем итерации для определения вектора настраиваемых параметров S. Каждая итерация — переход от Бр
: Б + 1 —
включает последовательность операций:
1) нахождение направления уменьшения функции хо (t1 ,И( S, t1)), т. е. вектора спуска ДSp с координатами Двp, ] = 1, к; 2) выбор величины шага, с которым надо двигаться по направлению спуска; 3) собственно итерационный переход от Бр по направлению спуска с выбранным шагом к следующей точке Бр + 1. Выбор величины шага, в отличие от алгоритмов, рассмотренных выше, здесь играет существенную роль, поскольку велика вероятность выхода за границы допустимой области (17).
Таким образом, на каждом цикле коррекции траектории решается задача нелинейного программирования. Воспользуемся для ее решения алгоритмами метода внутренних точек [5], а именно комбинированным алгоритмом, который позволяет совместить поиск допустимого решения с поиском оптимального и упростить тем самым вычислительную процедуру.
1. Определение направления спуска ДSp.
Линеаризуем х0(^, и(Б, ^)) в окрестности точки ^:
к
Хо (1 И(^ ^)) = Хо ^р) + Т ср (18)
1=1
д Хо
где сР =
дв1
в1 =вР■
Для определения направления спуска, согласно работе [5], необходимо минимизировать функцию
* №=Еср ^+2 Т (^р2 / ^ (19)
1=1 1=1
при условиях (7), где весовые коэффициенты стр вычисляются по формуле
N (‘Г - а, )2. -в )2 }.
1 = 1, к,
(20)
где N — некоторое положительное число. При неограниченности по условиям (17) Sj сверху (в, = да) и снизу (а, = -да) стр всегда равно N.
Функция Лагранжа для данной задачи имеет вид
х)=]Тс [^1 + 2 Т (^1 )2/ст Р -1'=1 1'=1
-Т
,=1
к
Т -ьр
11=1
(21)
Следуя известной методике, находим условия оптимальности:
ср + Aвj/стР = ТарX,, 1=1, к;
,=1
Тар Aвj=ьР, '=1,г,г<к.
1=1
(22)
Пусть Aвp — решение задачи (19) при условиях (7), тогда
Aв? = стр
Т а,рх, - ср
=1
(23)
Подставляя Aв? во второе уравнение системы (22), получим систему уравнений
(24)
г=1
где ^ = Т страра?; < = I. - £ стр*р.ср.
1=1 1=1
Система (24) состоит из г линейных алгебраических уравнений с г неизвестными причем
матрица
всегда симметрична и неотрицательно определена.
Решая систему (24), находим двойственные переменные Хр и вычисляем двойственные невяз-
ки: 8р =ТарХр - ср. Затем определяем направ-1=1
ление спуска — вектор ДSp с координатами
Aвp = стр8р, )=Ък. (25)
Частные производные в выражениях (7), (18) определяются аналогично предыдущим разделам.
2. Выбор величины шага.
При определении величины шага ур корректировки решения необходимо, во-первых, гарантировать выполнение условий (17) в виде строгих неравенств на следующей итерации. Это достигается при соблюдении соотношения
о<ур<ур; (26)
ур = шт
. в1 - вр
шт -----------— п,
1: Дв?>0 AвР 3 1
. а 1- вр
шт ------------— п
1*: Двр<о Aв-?
1 1
(27)
где п — заданная величина из открытого интервала (0, 1).
Во-вторых, необходимо стремиться к сокращению невязок балансовых ограничений (7)
и уменьшению целевой функции х0(^, и(Б, ^)). Этого можно достичь с помощью функции
Gp (у)= х0 ^р + yДSр) +
х^т — XI (sр + yДSр), Ь = 1,г, (28)
+ К тах
где К — достаточно большой штрафной коэффициент.
Шаг корректировки решения вычисляется по формуле
ур = шт
1п|ур, Ур },
(29)
где у1’ определяется из выражения (27), ур — в точке, где реализуется минимум Gp(y).
Таким образом, выбор величины шага сопровождается решением задачи одномерной минимизации функции (28), которая достаточно просто решается одним из регулярных методов оптимизации [6].
3. Итерационный переход.
Переход к следующему шагу определения вектора Б производим по формуле
Sр+1 = Sр + у р ASр.
(30)
Компоненты вектора начального приближения Б0 можно определять по правилам:
в° = (Р1' + а7)/2, (ау^-¥, Ру^¥);
в° = а 1 + Д, (а у ^-да, в у =да);
в° = в!' -Д, (ау =-¥, ру ^¥);
в° = о, (а у = -¥, в у = ¥>),
где Д — заданная положительная величина.
Итерации заканчиваются при выполнении условия
|^р+1 - £р| < е,
где Gp + 1, Gp определяются в соответствии с (28) при у = 0; е — заданное достаточно малое положительное число.
Заключение
При реализации алгоритмов из двух последних разделов в случае незначительных возмущений, действующих на объект управления, нет необходимости использовать данные алгоритмы на каждом цикле коррекции траектории. Если найденный с помощью этих алгоритмов оптимальный вектор настраиваемых параметров Боп лежит внутри области ограничений (17), то доста-
точно использовать данные алгоритмы только на первом цикле коррекции траектории для определения новых опорных управлений и°п (#), за которые принимаем управления и(), соответствующие вектору Sоп, полученному на первом цикле. Далее на последующих циклах используется алгоритм из первого раздела при начальном приближении в0 = 0. Аппроксимацию и°п (£) можно произвести либо с помощью метода наименьших
Литература
1. Табак Д., Коу Б. Оптимальное управление и математическое программирование. — М.: Наука, 1975. — 280 с.
2. Мазгалин Д. В. Построение способа управления ракетой-носителем при использовании в качестве управления программных угловых скоростей разворотов // Информационно-управляющие системы. 2010. № 3. С. 21-28.
3. Розенвассер Е. Н., Юсупов Р. М. Чувствительность систем управления. — М.: Наука, 1981. — 464 с.
4. Оневский П. М., Оневский М. П., Ишин А. А. Реализация алгоритма терминального управления не-
квадратов, либо (для функций сложной формы) с помощью сплайнов или каким-либо другим методом. Во всех случаях функции и°п (^ должны быть дифференцируемы по t.
Такая комбинация алгоритмов позволит реализовать управление объектом в реальном масштабе времени, сократить вычислительные затраты при незначительном отклонении от оптимального режима.
линейным динамическим объектом // Вестник Тамб. гос. техн. ун-та. 2010. Т. 16. № 4. С. 789-796.
5. Дикин И. И., Зеркальцев В. И. Итеративное решение задач математического программирования (алгоритмы метода внутренних точек). — Новосибирск: Наука, 1980. — 144 с.
6. Кудрявцев Е. М. Исследование операций в задачах, алгоритмах и программах. — М.: Радио и связь, 1984. — 184 с.
Международная выставка «СВЯЗЬ, ТЕЛЕКОММУНИКАЦИИ И 1Т- ТЕХНОЛОГИИ - 1СТ 2012»
16-18 октября 2012
Место проведения: г. Краснодар, ВЦ «КраснодарЭКСПО»
Организатор
Выставочная компания ITE Moscow
Сегодня большое внимание уделяется развитию регионов России: внедрению информационнокоммуникационных технологий, увеличению информационных ресурсов в сети Интернет, обеспечению информационной безопасности, производству современной программной продукции, развитию в сельской местности современных телекоммуникационных услуг, внедрению электронного документооборота и т. д.
Выставка ICT — это единственная выставка информационных технологий, связи и телекоммуникаций на Юге России. Цель выставки — оказать содействие в реализации программы правительства, нацеленной на обеспечение разработки и реализации новой концепции обеспечения телекоммуникаций и связи Юга России.
Основные разделы выставки
Телекоммуникации и сети 1Т и офисные технологии Кабели и беспроводная связь Спутниковая связь и технологии Оборудование и технологии телерадиовещания Банковские технологии и услуги Системы безопасности Широкополосная связь и технологии Программное обеспечение и системы автоматизации
Э-правительство и э-образование
Дополнительная информация и справки Тел.: +7 (495) 935 7350, доб. 4251 Факс: +7 (495) 935 7351 Эл. адрес: [email protected]
Сайт: http://www.ides-expo.ru/home/exhibitions/ ict/info.aspx