УДК 62.501.12
А. Т. КОГУТ А. В. КРАСУ ЛИН А. А. ЛАВРУХИН
Омский государственный университет путей сообщения
АНАЛИЗ АЛГОРИТМОВ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ УСКОРЕНИЕМ ДВИЖУЩЕГОСЯ ТЕЛА
Построены алгоритм, использующий только первые производные, и рекуррентная процедура, основанная на разложении в ряд Тейлора, учитывающая вторые производные. Показано применение построенных методов, отражающее при моделировании преимущество алгоритмов второго порядка.
В работе [ 1 ] описывается применение метода полиномиальной аппроксимации для синтеза системы оптимального управления, который основан на решении обратных задач динамики [2] и разложении нелинейных функций в ряд Тейлора, в котором, кроме первой производной [3], учитываются и высшие, в частности вторая. Распространим данную методику на оптимальное управление ускорением прямолинейно движущейся ракеты, развивающей постоянную мощность [4]. Вектор состояния данной системы состоит из скорости движения х, и величины х2, обратной массе ракеты. Он связан с управляемым ускорением и уравнениями:
Л,
еИ с1х 2
Л
(1)
На фазовые координаты системы и управление накладываются ограничения
<£с2 > 0;
ск,
<1; Ы<1.
(2)
Н =
+ + Ч/2и
(3)
ветствует расстоянию от точки (.х^,)до точки (*},*2)|При этом
- -
(4)
Составим алгоритм оптимального управления системой (1), с применением метода оптимального управления, описанного в работе [3]. В этом случае необходимо перейти к описанию непрерывной модели (1) разностным уравнением в матричной форме:
х(к + \) = /(х(к)Мк)У,.х(0) = х
0
(5)
Считая фиксированными начальные значения
оо ,
скорости х, и х2 массы, требуется минимизировать
время, необходимое для достижения известной конечной скорости х\, затрачивая при этом заданное количество горючего, объем которого во время движения уменьшается и, соответственно, уменьшается
масса ракеты, достигая конечного значения х^ .
Для поиска оптимального управления объектом составляется функция Гамильтона, зависящая от управляющего воздействия и координат вектора У, сопряженного с этой функцией:
где х(к) — «-мерный вектор состояния на к-и шаге дискретизации;
и(к) — скалярное управляющее воздействие; хй — вектор начальных условий.
На линейную функцию /(х(к),и(к)) накладывается ограничение, что она, по крайней мере, дважды дифференцируема по управлению и(к).
Система (5) должна отрабатывать п-мерный вектор задающего воздействия g(k +1), дискретные значения которого получаются из решения уравнений (1) при и(1) = и *. На каждом шаге дискретизации должен минимизироваться критерий
(6)
Запишем алгоритм оптимального управления в виде
(7)
где /ц 1 (•) - обратная по аргументу и функция к Дд:(*),«(*)).
Для решения обратной задачи (7) обычно применяется процедура линеаризации [3]. Нелинейная функция /(х(к),и(к)) аппроксимируется линейным отрезком ряда Тейлора
Исходя из выражения (3), оптимальным будет управление и *, обеспечивающее максимум функции Гамильтона в каждый момент времени, что соот-
где уу _ вектор Якоби.
т
-0.5
Классический метод 1 порядка
т-
V .
- /
. "Ч. V Ч X ' V
>] Метод па/юномиапьноО аппроксимации ? трндка
2
о
^(0) .6 -8 -10 -12
Г1
-V >
-0,5 О
Ф) —
0.5
Кпассический I I Метод попиномиапьной
_Ь
метод 1 порядка
I аппроксимации 2 порядка
Рис. 1. Область устойчивости классического метода и метода второго порядка в плоскости (и(0),.т,(0)) (а) и (и(0),л2(0)) (б).
■
/ 1 ......... \ 1
\ » \ * ^
\лЛ
1 1 1 Д___I
1 \ /
Г/
1 /
»( 11
...... 1г
- классический метод
____метод второго порядка
Рис. 2. Переходный процесс и(к) при различных начальных условиях.
В формуле (8) разность
Ди(*) = и(*)-и(*-1), (9)
поэтому формула (7) для оптимального управления заменяется рекуррентной процедурой
где {у)+ — псевдообратная матрица.
Допустим, что алгоритм (8) является классическим методом первого порядка [5].
Для повышения качественных показателей процесса управления используем разложение, в котором будут учитываться вторые производные
/ ( л (к), и (к)) = /к + \и (к) +1V2 /к Ли (к) ■ Ди (*), (11)
гдеУ"/^ - матрица Гессе.
По аналогии с [ 1 ] условие минимума функции (6) можно записать в виде:
к{к + \) = /к+Ч/к-Ьи{к) + -Ч2/кЬи(к)-Ьи(к). (12)
Из выражения (12) нельзя определить в явной форме Ди (А-), поэтому допустим, что одно из значений Лм(А:)1 в третьем слагаемом, известно и равно 5и (к). В этом случае в место (12) запишется линейная относительно Ди (/с) формула
д «(а). (13)
Подставляя в (13) разность (9), получим алгоритм управления второго порядка
в(*) = н(*-1)+ 2/к6»{к) (*(* + !)-/*). (14)
Как и в работе [1] в формуле (13) разность 5и(к) зададим в виде:
(15)
где и {к) - значение управления и [к), рассчитанного классическим методом (10);
На к-том шаге представленного метода проводится вычисление на двух ступенях, на первой рассчитывается
1-*-
Обнуление переменных фег и массива Ех1г
---i-
Расчёт значений функции управления и координат объекта
X
Определение массива локальных экстремумов управления Ех(г;
X
Определение устоявшегося значения управления
к X
Определение крайних значений 5%-ной трубки
7 X
Определение длины массива 1_епЕ>Лг = [.епд^Ехи)
X
Задание начального значения для переменной цикла | = ЬепЕйг
Рис. 3. Графическая схема алгоритма поиска времени регулирования
значения и(к) по формуле (10), находится разность
по формуле (15); на второй - результат первой ступени подставляется в (14) и находится результат оптимального управления.
Дискретная модель для объекта (1) запишется в виде:
[ *1(А + 1) = *1(А) + Д/-и(*); [х2{к + \) = х2(к) + А1-и2(к),
(16)
где А/- шаг дискретизации.
Желаемая траектория g получается путем решения уравнений:
4 =
- хх(к- -1) + Д/ и(^-1) "
/2(*)_ х2(к- -1) + Дг-н2(*-1)
-дг
2Ми(к-\)
V2 А =
о
2ДГ
(17)
(18)
(19)
Для каждого шага предлагаемого метода производятся следующие вычисления. На первой ступени,
[82(к + 1) = 82(к) + Ы(и*)2,
где и* определяется по формуле (4).
В соответствии с (16) матрицы и V/ имеют следующий вид:
используя формулы (16), (17), определяется и{к) всо-ответствии с правой частью выражения (10). На второй ступени формируется разность 6и(к) по формуле (14), она и вектор вторых производных (18), подставляются в алгоритм (13) и окончательно определяется управлением и{к) , На последующих шагах вычисления повторяются.
чС°)
—— метод второго порздка ____классический метод
Рис. 4. Зависимость времени регулирования от управления.
т --»
—— метод второго порядка ____классический метод
Рис. 5. Зависимость времени регулирования от управления.
Результаты численных экспериментов при различных начальных условиях и(0), х,(0), х2(0) приведены на рис. 1, 2 и 4. Области устойчивости классического метода и алгоритма второго порядка, для плоскости («(0), л,(0)) показаны на рисунке 1а, для плоскости (»(0), л2(0)) - на рис. 16.
В качестве примера на рис. 2 представлены графики переходного процесса при различных начальных условиях.
Для анализа показателей качества системы управления, в соответствии с алгоритмом, графическая схема которого приведена на рис. 3, построена зависимость времени регулирования от начального значения управления (рис. 4). Зависимость квадратичной интегральной оценки качества от изменения начального значения управления
т ,
3 = I («*(*)-«(*)) ,
ЫГ
приведена на рис. 5.
Из представленных графиков можно сделать вывод о том, что предлагаемый метод синтеза системы оптимального управления, учет высших производных обеспечивает лучшие показатели качества, что
позволяет рекомендовать его к использованию для решения поставленной задачи.
Библиографический список
1. КогутА.Т. Оптимальное управление для навигационной задачи быстродействия. //Омскийнаучный вестник. - 2003. - №23, -С. 114-116.
2. Крутько П.Д. Обратные задачи динамики управляемых систем. Нелинейные системы. - М.: Наука, 1988. - 327 с.
3. Рубан А.И. Адаптивное управление с идентификацией. -Томск: Иэд-воТГУ, 1982. - 302 с.
4. ЛейтманДж. Введение в теорию оптимального управления. -М.: Наука, 1968,- 192 с.
5. КогутА.Т. Полиномиальная аппроксимация в некоторых задачах оптимизации и управления. Омск: Изд-во ОмГУПС, 2003. -243 с.
КОГУТ Алексей Тарасович, кандидат технических наук, доцент кафедры АиСУ.
КРАСУЛИН Александр Владимирович, аспирант кафедры автоматики и телемеханики, ЛАВРУХИН Андрей Александрович, студент пятого курса.