УДК 681.513.54
Вестник СПбГУ. Сер. 1. Т. 1 (59). 2014. Вып. 2
ОПТИМИЗАЦИЯ ДИНАМИКИ СИСТЕМ
С КОРРЕКЦИЕЙ ПАРАМЕТРОВ СТРУКТУРЫ УПРАВЛЕНИЯ
С. А. Кабанов
Балтийский государственный технический университет «ВОЕНМЕХ» им. Д. Ф. Устинова,
Российская Федерация, 190005, Санкт-Петербург, 1-я Красноармейская ул., 1
В статье предлагается метод вычисления оптимального управления, основанный на коррекции параметров структуры управления, вид которой определяется из принципа максимума. Коррекция параметров может производиться из условия минимума как функционала с дополнительной интегральной частью, включающей затраты на управление с применением принципа максимума, так и критерия Красовского с использованием алгоритма с прогнозирующей моделью. Библиогр. 16 назв.
Ключевые слова: принцип максимума, структура управления, прогнозирующая модель.
1. Введение. Вариационные принципы и оптимизационные задачи управления зародились в классической механике вследствие явной механической гармонии и устойчивости в природе. Это побуждает к созданию искусственных аналогий в управляемых системах [1-6]. Оптимальное управление следует из основного принципа механики — принципа наименьшего действия. Найти оптимальное управление сложной системой, описываемой системой дифференциальных уравнений высокого порядка, в условиях действия возмущений и при неполной информации о ее состоянии — задача трудная. Основная трудность связана не столько с объемом вычислений, как с необходимостью выбора начального приближения, обеспечивающего сходимость итерационных процедур нахождения управления. Отказ от оптимизации приводит к понижению роли выбора управления и использованию субъективных решений и соответствующих устройств. Поэтому «детальное понимание структуры решения может потребовать переформулировки исходной задачи и представления ее в другом математическом виде» [3]. В данной работе предлагается новый метод вычисления оптимального управления, основанный на коррекции параметров структуры управления, вид которой определяется из принципа максимума.
2. Основная задача оптимального управления. Рассмотрим задачу оптимального управления системой
х = /(х, и, £), (1)
где х — п-мерный вектор состояния, и — т-мерный вектор управления, |и| < ит, /(х, и, £) = /\(х, £)+/ (х, ¿)и, /, /1 — п-мерные векторные и /2 — пх т-мерная матричная непрерывные функции своих аргументов, имеющие непрерывные частные производные по х, £ на интервале [¿о, t;]. На вектор управления накладывается ограничение и(£) € и. Требуется минимизировать функционал
I = V; (х,Ь;). (2)
Здесь функция V; (х,£;) имеет непрерывные частные производные по своим аргументам.
Из принципа максимума следуют канонические уравнения [1, 2]
х = Щ, р = -нТ, (3)
Н = рт/(ж, и, 4) = рт /1(ж, 4) + /2 (ж, 4)и] = Н\ (ж,р, 4) + Н2(ж,р, 4)и —гамильтониан, Н(ж,р, 4) = рт/х(ж, Н2(ж,р, 4) = рт/2(ж, 4), р — п-мерный вектор сопряженных переменных, Нх = дН/дж, Нр = дН/др, уравнение для выбора управления имеет вид
Н(ж,р, и0,4) = inf Н(ж,р,и,4),
п^и
(4)
откуда следует
-мmsignH2, Н2 =0, и„ Н2 =0,
(5)
а из условий трансверсальности в граничных точках
о,/
(6)
определяются граничные условия для вектора состояния, сопряженных переменных (задача со свободным правым концом) = и + ^^ = 0 для нахож-
дения значения 4/. Здесь и8 —особое управление [1, 2, 4].
Существование участков траектории системы с предельными величинами управлений, с особыми (сингулярными) управлениями, наличие скользящих режимов и т.д. приводит к весьма сложным решениям [1, 2, 4]. В результате возникает некоторая структура управления с соответствующими точками переключения. «Коль скоро структура оптимального управления тем или иным способом угадана, не так трудно установить, как правило, что она действительно такова» [3]. В качестве примеров можно отметить структуру релейного управления с одним переключением в задачах оптимизации движения материальной точки в бессиловом поле под действием ограниченной силы [1, 5, 6], оптимальной организации рекламной кампании при ограничении на вкладываемые средства [6], релейного управления с тремя переключениями в задаче максимального быстродействия при перемещении груза мостовым краном под действием ограниченной силы [7, 8], структуру с участками предельного управления и особого управления при оптимизации пространственного маневра автоматического подводного аппарата [9].
Рассмотрим следующую вспомогательную задачу оптимального управления. В общем случае можно рассмотреть структуру управления, зависящую от некоторых параметров, в виде и = и(0,4), где О — вектор размерности г, состоящий из параметров (коэффициенты, моменты переключения управления, уровни ограничения сигналов) структуры [2].
3. Вспомогательная задача оптимального управления. Предположим, что из рассмотрения основной задачи оптимального управления определена структура управления и сформирован вектор О = т, где т — вектор моментов времени переключения управления. Представим управление системой (1) в виде [10]
и(4) = и^4) + Дит(4)1(4, т),
(7)
Дит = (Ди1 Ди2 ... Диг), 1т(4, т) = [1(4, Т1) 1(4, Т2)... 1(4, тг)], Ди = — и + и^+1, и^(4) = 1(1(4) при 4 < т\. Здесь г = 1 ,г, г — номер участка структуры управления (слева направо по шкале времени), г — количество переключений управления в структуре,
и
0
и$(£) и — управления на предыдущем и последующем участках этой структуры
относительно т\ соответственно, а /(£, т) — функции вида
= ^ + -аг<^(ф - п)), 2 п
с — коэффициент, при неограниченном возрастании которого функция /(£, т^) приближается к единичной функции [11].
К системе (1) добавим уравнения
(8)
где т —вектор новых переменных, принимаемых за дополнительные управления. За критерий оптимальности выберем функционал
1 Г
I = + - I и)тк~2и)&, (9)
2 ■'гп
где к 2 —матрица весовых коэффициентов. Гамильтониан На этой задачи примет вид
11
На = Ра 1а + к IV = Н + ртЧЛ + -IV IV,
где = ), /Т = (/Тт ).
Из условия дНа/ди> = 0 определяется управление
т = -к2рт. (10)
Вектор рт (£) находится из решения двухточечной краевой задачи для системы канонических уравнений (3) вида
х = /(х, и,£), х(£о) = хо,
-т = т, т (¿о ) = то, (11)
\ дх
Т
(12)
где
дНа А Т АдНа А Т ттТ Т сТ хТ/. \А гТ
— ) =итн2 =^г1иР = 5 (Ь,т)Аи/ир,
г д/ ди Т ди
5Т(¿,т) = [¿(¿,п) ¿(¿,т2) ... ¿(¿,тг)],
<5(4, П) =
дт< п[1 + с2(£ - т,)2]'
т = т
с
Краевую задачу (10)—(12) можно решать, например, методом Ньютона [12 ] с использованием функции невязки, элементы которой следуют из условий трансверсальности (6), или методом последовательных приближений Крылова—Черноусько [13]. Если полагать т(4о) заданным, то функция невязки примет вид
^(ро) =
дУ/ т. . дУ/ тт . :
^Г-рЛЬ) -ьг + Н^Ъ)
т = ( т т)
дха Щ ' , ~а - ^ Т" ),
рт = (ртрт), ро —параметры функции невязки ро = [рт(4о) 4/]т. Или можно считать т(4о) свободным и в векторе параметров ро компоненту рт (4о) заменить на то.
При вычислениях последовательность переключений = 1,г, остается неизменной. При сближении соседних значений моментов переключения до минимальной величины (т^+1 — т^) < е принимается т^+1 = т, и количество всех переключений в структуре (г) уменьшается на единицу: (г — 1), где е > 0 — заданная малая величина. Далее число варьируемых параметров и уравнений в системе (8) уменьшается на единицу при соответствующей корректировке исходной структуры управления (7) — сокращении на единицу числа участков. С учетом этого структура (7) может быть установлена даже с избытком участков.
4. Теорема. Для решения основной задачи оптимизации системы (1) по критерию (2) при заданной структуре управления (7) необходимо и достаточно, чтобы была решена вспомогательная задача оптимального управления системой (1), (8) по критерию (9).
Доказательство. Необходимость. Из условия наличия решения основной задачи оптимизации (1), (2), (7) следует, что известны оптимальные значения компонент вектора моментов времени переключения управления то в структуре (7). При этом знак функции Н2 = рт/2(ж,4) определяет управление в соответствии с (5), и в окрестности оптимальных значений т эта функция Н2 близка к нулю (в силу непрерывности функции и(4)), то есть при т = т : Н2 « 0, ||р(т)|| < е. Тогда ||и|| < ||к2Ди /т||е, так как и = —к2рт, где рт(4) = Ди(т)/т(ж, т)р(т), и вспомогательная задача решена. Здесь е — сколь угодно малое положительное число.
Достаточность. Решение вспомогательной задачи (10)-(12) приводит к управлению и = —к2рт, рт = —(дНа/дт)т = (ди/дт)тНт = ¿т(4, т)ДиНт. Тогда рт (4) = Ди(т )Н2т (ж, р, т). Согласно (5) возможны следующие переключения управления в моменты времени 4 = т^: с —ит на ит или на ия, с ит на —ит или на ия, с ия на ит или на —ит. Как правило, при решении основной задачи оптимизации численным методом затруднительно обнаружить участок особого управления в соответствии с (5). Однако характерным является то, что график Н2 (4) носит монотонный характер, меняет знак в окрестности точки переключения и на интервале особого управления имеет уменьшение угла наклона. Рассмотрим вариант переключения с —ит на ит, для которого Ди^(4) > 0. При выборе начального значения т^(4о) < тда в соответствии с (5) Н2 > 0. Тогда из уравнений (10)-(12) получаем р^ < 0 и и^ > 0, что приводит к увеличению т (4о). Аналогичные рассуждения для случая т^(4о) > тда (когда Н2 < 0) приводят к уменьшению т (4о). Для других вариантов переключений рассуждения повторяются с учетом знака Ди^(4). Теорема доказана.
Используя для решения двухточечной краевой задачи (10)-(12) итерационный вычислительный алгоритм, например метод Ньютона, по завершении переходных
процессов получаем в соответствии с уравнением (4)
lim min Ha(x,p,u,t) = inf H(x, t) (13)
w^ü w «eU
при выборе ро в качестве параметров функции невязки, ро = [р^ (to) tf ]T • Или, считая т(to) свободным и в векторе параметров ро компоненту рт(to) заменив на то,
lim min Ha(x,p, u,t) = inf H(x,t).
т^Topt w «eu
В первом случае имеет место переходный процесс т(t), завершающийся по достижении условия t = Tj, во втором — выбор то = Topt сразу приведет к inf«eu H(x,p, u,t) (при этом рт = 0 и, следовательно, w = 0).
Сходимость переходных процессов т(t) к оптимальным значениям т0р зависит от выбора начальных значений параметров функции невязки, но существенно проще решения основной задачи, когда вычислительный алгоритм усложняется выбором структуры управления. В ряде случаев начальные значения моментов времени переключения управления можно определить из эвристических соображений [8-10] вплоть до их произвольного выбора из интервала оптимизации [14]. В последнем случае в задаче построения области достижимости подводного аппарата происходит даже упрощение структуры. При изначально заданном числе переключений r = 2 по завершении переходных процессов тх (t) и т2^) остается лишь одно: величина т2 выходит на постоянное значение, равное tf, и последний участок в структуре исчезает.
В качестве критерия для вспомогательной задачи оптимизации можно принять функционал обобщенной работы [2, 5, 9, 11, 14, 15, 16]
1 ftf
I = Vf(x,tf ) + — / (wTk2w + wjk~2w0) dt. (14)
2 • 'to
Как известно [2], при и = ио (ио —оптимальное значение и) гамильтониан Нь вспомогательной задачи оптимизации,
т , , т 1 т 2 1 т _2
Нь = Рь /ь = Н(х,р,и,Ь) +рти) + -и> кчи+-чи0к и)07
равен гамильтониану прогнозирующей модели
Нм = Н (ж,р, и, 4),
при и = 0 совпадающему с гамильтонианом основной задачи. Здесь /т = (/тит). Из условия дНь/ди = 0 имеем
и о = —к2рт. (15)
Вектор рт(4) находится из двух задач Коши для уравнений прогнозирующей модели со структурой управления (7):
ж = /(ж, и, 4), ж(4о) = жо,
т = 0, т (4о ) = то, (16)
т / N т
' p(i') = Ur
= Pr(tf)= о, (17)
где
= ^ {Ш)Т = = = T)AufZp.
При начальных условиях x(to) = xo решается задача Коши для системы (16) на интервале [to,tf] и определяются конечные значения вектора состояния. Затем вычисляются граничные условия pT(tf) = dVf /дх. Далее решается задача Коши для системы (16), (17) и находятся значения pT(t), необходимые для вычисления управления (15) для системы (1), (7), (8). В данном случае pTi(t) = pTi(Tj). По завершении переходных процессов т(t) имеем
lim minHb(x,p, u,t) = inf H(x, t). (18)
w^0 w uEU
Несмотря на близость уравнений (13) и (18), решение по критерию (14) существенно проще в реализации.
Решение по критерию Красовского можно сопоставить с решением (по критерию (9)) двухточечной краевой задачи (10)-(12) методом Ньютона при включении то в параметры функции невязки. В первом случае алгоритм с прогнозирующей моделью обеспечивает переходной процесс т(¿) в выходом на оптимальное значение тор4, во втором — это значение т0р вычисляется по реккурентной формуле с использованием матрицы Якоби. Численное решение задач оптимизации движения материальной точки в бессиловом поле под действием ограниченной силы, оптимальной организации рекламной кампании при ограничении на вкладываемые средства [5] и оптимального управления автоматическим подводным аппаратом [9, 14, 16] подтвердили близость результатов применения этих двух алгоритмов.
Замечание 1. В данном методе предполагается, что структура управления считается заданной. При численной реализации метода это условие следует контролировать, чтобы значения параметров, характеризующие моменты переключений, оставались упорядоченными слева по шкале времени.
Замечание 2. При вычислениях следует обратить особое внимание на расчет управления в окрестности такого момента времени смены структуры т\, в который происходит переключение с особого или на особое управление. Дело в том, что особое управление иа может вычисляться по сложным формулам (приведенным для одного из приложений, например в [9]), справедливым при Н2 = 0. В приведенном решении, однако, его вычисление определяется лишь значением при котором, как правило, Н2 = 0, что может привести к |и81 ^ ит с несправедливым срывом решения. В этом случае следует учитывать условие (5) и вычислять управление в виде
I -umsignH2, |и 3 1 > um,
и=
[ и„ Н2 =0.
Тогда по завершении переходного процесса т\ (£) удается получить такое его искомое значение, при котором Н2 ~ 0.
Таким образом, метод коррекции параметров структуры управления может служить как основным инструментом для получения оптимального управления, так
и вспомогательным — для нахождения начального приближения, например начальных значений сопряженных переменных при решении краевой задачи принципа максимума методом Ньютона или начального приближения для управления в методе Крылова—Черноусько. Этот метод можно рекомендовать для вычисления управления в темпе динамики системы.
Литература
1. Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1983. 392 с.
2. Справочник по теории автоматического управления / под ред. А. А. Красовского. М.: Наука, 1987. 712 с.
3. Беллман Р. Процессы регулирования с адаптацией. М.: Наука, 1964. 360 с. (Richard Bellman. Adaptive Control Processes: a Guided Tour. Princeton University Press, Princeton, New Jersey. 1961.)
4. Marchal C., Contensou C. Singularties in Optimization of Deterministic Dynamic Systems // Journal of Guidance and Control. 1981. Vol.4, N3. P. 240-252.
5. Кабанов С. А. Управление системами на прогнозирующих моделях. СПб.: Изд-во С.-Петерб. ун-та, 1997. 200 с.
6. Кабанов С. А. Оптимизация динамики систем при действии возмущений. М.: ФИЗМАТЛИТ, 2008. 200 с.
7. Troch I. Parametrisierung — Ein Werkzeug zur Berechnung optimaler Steuerungen // Automatisierungstechnik AT. (38.) 1990. №6. S. 230-236.
8. Кабанов С. А., Никулин Е. Н., Якушев Б. Э., Якушева Д. Б. Оптимальное перемещение груза мостовым краном // Изв. вузов. Приборостроение. 2011. Т. 54, №5. С. 56-65.
9. Кабанов Д. С. Оптимизация пространственного маневра автоматического подводного аппарата с коррекцией параметров структуры управления // Мехатроника, автоматизация, управление. 2012. №9. С. 57-61.
10. Кабанов С. А. Управление системами с оптимальной коррекцией параметров прогнозирующей модели // Межд. конф. «Седьмые Окуневские чтения». 20-24 июня 2011 г. Санкт-Петербург: Материалы докладов / Балт. гос. техн. ун-т. СПб., 2011. С. 237-238.
11. Буков В. Н. Адаптивные прогнозирующие системы управления полетом. М.: Наука, 1987. 232 с.
12. Федоренко Р. П. Приближенное решение задач оптимального управления. М.: Наука, 1978. 488 с.
13. Черноусько Ф. Л., Баначук В. П. Вариационные задачи механики и управления (Численные методы). М.: Наука, 1973. 238 с.
14. Малышев В. В., Кабанов Д. С. Алгоритм коррекции структуры управления автоматическим подводным аппаратом для построения области достижимости // Изв. Вузов. Приборостроение. 2012. Т. 55. №7. С. 21-27.
15. Ким Д. П. К синтезу оптимальной линейной системы управления по критерию обобщенной работы // Мехатроника, автоматизация, управление. 2009. №4. С. 7-10.
16. Кабанов Д. С. Алгоритм синтеза оптимального программно-позиционного управления многорежимным автоматическим подводным аппаратом // Мехатроника, автоматизация, управление. 2014. №1. С. 60-66.
Статья поступила в редакцию 26 декабря 2013 г.
Сведения об авторах
Кабанов Сергей Александрович —доктор технических наук, профессор; [email protected]
DYNAMIC SYSTEM OPTIMIZATION USING CORRECTION OF CONTROL STRUCTURE PARAMETERS
Sergei A. Kabanov
Baltic State Technical University D.F. Ustinova ("VOENMEH"), 1-ya Krasnoarmeyskaya ul., 1, St.Petersburg, 190005, Russian Federation; [email protected]
A new method of optimal control is presented. This method is based on correction of control structure parameters. The control's structure is obtained from the solution based on Pontryagin's maximum principle. The correction of control structure parameters is optimized by minimization either of the two functionals. The first one is a functional with an additional integral cost of control using maximum principle. The second one is a Krasovsky's criterion using the algorithm with a forecasting model. Refs 16. Keywords: pontryagin's maximum principle, control's structure, forecasting model.