Научная статья на тему 'Анализ алгоритмов оптимального управления ускорением движущегося тела'

Анализ алгоритмов оптимального управления ускорением движущегося тела Текст научной статьи по специальности «Математика»

CC BY
78
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Когут Алексей Тарасович, Красулин Александр Владимирович, Лаврухин Андрей Александрович

Построены алгоритм, использующий только первые производные, и рекуррентная процедура, основанная на разложении в ряд Тейлора, учитывающая вторые производные. Показано применение построенных методов, отражающее при моделировании преимущество алгоритмов второго порядка.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Когут Алексей Тарасович, Красулин Александр Владимирович, Лаврухин Андрей Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ алгоритмов оптимального управления ускорением движущегося тела»

УДК 62.501.12

А. Т. КОГУТ А. В. КРАСУ ЛИН А. А. ЛАВРУХИН

Омский государственный университет путей сообщения

АНАЛИЗ АЛГОРИТМОВ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ УСКОРЕНИЕМ ДВИЖУЩЕГОСЯ ТЕЛА

Построены алгоритм, использующий только первые производные, и рекуррентная процедура, основанная на разложении в ряд Тейлора, учитывающая вторые производные. Показано применение построенных методов, отражающее при моделировании преимущество алгоритмов второго порядка.

В работе [ 1 ] описывается применение метода полиномиальной аппроксимации для синтеза системы оптимального управления, который основан на решении обратных задач динамики [2] и разложении нелинейных функций в ряд Тейлора, в котором, кроме первой производной [3], учитываются и высшие, в частности вторая. Распространим данную методику на оптимальное управление ускорением прямолинейно движущейся ракеты, развивающей постоянную мощность [4]. Вектор состояния данной системы состоит из скорости движения х, и величины х2, обратной массе ракеты. Он связан с управляемым ускорением и уравнениями:

Л,

еИ с1х 2

Л

(1)

На фазовые координаты системы и управление накладываются ограничения

<£с2 > 0;

ск,

<1; Ы<1.

(2)

Н =

+ + Ч/2и

(3)

ветствует расстоянию от точки (.х^,)до точки (*},*2)|При этом

- -

(4)

Составим алгоритм оптимального управления системой (1), с применением метода оптимального управления, описанного в работе [3]. В этом случае необходимо перейти к описанию непрерывной модели (1) разностным уравнением в матричной форме:

х(к + \) = /(х(к)Мк)У,.х(0) = х

0

(5)

Считая фиксированными начальные значения

оо ,

скорости х, и х2 массы, требуется минимизировать

время, необходимое для достижения известной конечной скорости х\, затрачивая при этом заданное количество горючего, объем которого во время движения уменьшается и, соответственно, уменьшается

масса ракеты, достигая конечного значения х^ .

Для поиска оптимального управления объектом составляется функция Гамильтона, зависящая от управляющего воздействия и координат вектора У, сопряженного с этой функцией:

где х(к) — «-мерный вектор состояния на к-и шаге дискретизации;

и(к) — скалярное управляющее воздействие; хй — вектор начальных условий.

На линейную функцию /(х(к),и(к)) накладывается ограничение, что она, по крайней мере, дважды дифференцируема по управлению и(к).

Система (5) должна отрабатывать п-мерный вектор задающего воздействия g(k +1), дискретные значения которого получаются из решения уравнений (1) при и(1) = и *. На каждом шаге дискретизации должен минимизироваться критерий

(6)

Запишем алгоритм оптимального управления в виде

(7)

где /ц 1 (•) - обратная по аргументу и функция к Дд:(*),«(*)).

Для решения обратной задачи (7) обычно применяется процедура линеаризации [3]. Нелинейная функция /(х(к),и(к)) аппроксимируется линейным отрезком ряда Тейлора

Исходя из выражения (3), оптимальным будет управление и *, обеспечивающее максимум функции Гамильтона в каждый момент времени, что соот-

где уу _ вектор Якоби.

т

-0.5

Классический метод 1 порядка

т-

V .

- /

. "Ч. V Ч X ' V

>] Метод па/юномиапьноО аппроксимации ? трндка

2

о

^(0) .6 -8 -10 -12

Г1

-V >

-0,5 О

Ф) —

0.5

Кпассический I I Метод попиномиапьной

метод 1 порядка

I аппроксимации 2 порядка

Рис. 1. Область устойчивости классического метода и метода второго порядка в плоскости (и(0),.т,(0)) (а) и (и(0),л2(0)) (б).

/ 1 ......... \ 1

\ » \ * ^

\лЛ

1 1 1 Д___I

1 \ /

Г/

1 /

»( 11

...... 1г

- классический метод

____метод второго порядка

Рис. 2. Переходный процесс и(к) при различных начальных условиях.

В формуле (8) разность

Ди(*) = и(*)-и(*-1), (9)

поэтому формула (7) для оптимального управления заменяется рекуррентной процедурой

где {у)+ — псевдообратная матрица.

Допустим, что алгоритм (8) является классическим методом первого порядка [5].

Для повышения качественных показателей процесса управления используем разложение, в котором будут учитываться вторые производные

/ ( л (к), и (к)) = /к + \и (к) +1V2 /к Ли (к) ■ Ди (*), (11)

гдеУ"/^ - матрица Гессе.

По аналогии с [ 1 ] условие минимума функции (6) можно записать в виде:

к{к + \) = /к+Ч/к-Ьи{к) + -Ч2/кЬи(к)-Ьи(к). (12)

Из выражения (12) нельзя определить в явной форме Ди (А-), поэтому допустим, что одно из значений Лм(А:)1 в третьем слагаемом, известно и равно 5и (к). В этом случае в место (12) запишется линейная относительно Ди (/с) формула

д «(а). (13)

Подставляя в (13) разность (9), получим алгоритм управления второго порядка

в(*) = н(*-1)+ 2/к6»{к) (*(* + !)-/*). (14)

Как и в работе [1] в формуле (13) разность 5и(к) зададим в виде:

(15)

где и {к) - значение управления и [к), рассчитанного классическим методом (10);

На к-том шаге представленного метода проводится вычисление на двух ступенях, на первой рассчитывается

1-*-

Обнуление переменных фег и массива Ех1г

---i-

Расчёт значений функции управления и координат объекта

X

Определение массива локальных экстремумов управления Ех(г;

X

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Определение устоявшегося значения управления

к X

Определение крайних значений 5%-ной трубки

7 X

Определение длины массива 1_епЕ>Лг = [.епд^Ехи)

X

Задание начального значения для переменной цикла | = ЬепЕйг

Рис. 3. Графическая схема алгоритма поиска времени регулирования

значения и(к) по формуле (10), находится разность

по формуле (15); на второй - результат первой ступени подставляется в (14) и находится результат оптимального управления.

Дискретная модель для объекта (1) запишется в виде:

[ *1(А + 1) = *1(А) + Д/-и(*); [х2{к + \) = х2(к) + А1-и2(к),

(16)

где А/- шаг дискретизации.

Желаемая траектория g получается путем решения уравнений:

4 =

- хх(к- -1) + Д/ и(^-1) "

/2(*)_ х2(к- -1) + Дг-н2(*-1)

-дг

2Ми(к-\)

V2 А =

о

2ДГ

(17)

(18)

(19)

Для каждого шага предлагаемого метода производятся следующие вычисления. На первой ступени,

[82(к + 1) = 82(к) + Ы(и*)2,

где и* определяется по формуле (4).

В соответствии с (16) матрицы и V/ имеют следующий вид:

используя формулы (16), (17), определяется и{к) всо-ответствии с правой частью выражения (10). На второй ступени формируется разность 6и(к) по формуле (14), она и вектор вторых производных (18), подставляются в алгоритм (13) и окончательно определяется управлением и{к) , На последующих шагах вычисления повторяются.

чС°)

—— метод второго порздка ____классический метод

Рис. 4. Зависимость времени регулирования от управления.

т --»

—— метод второго порядка ____классический метод

Рис. 5. Зависимость времени регулирования от управления.

Результаты численных экспериментов при различных начальных условиях и(0), х,(0), х2(0) приведены на рис. 1, 2 и 4. Области устойчивости классического метода и алгоритма второго порядка, для плоскости («(0), л,(0)) показаны на рисунке 1а, для плоскости (»(0), л2(0)) - на рис. 16.

В качестве примера на рис. 2 представлены графики переходного процесса при различных начальных условиях.

Для анализа показателей качества системы управления, в соответствии с алгоритмом, графическая схема которого приведена на рис. 3, построена зависимость времени регулирования от начального значения управления (рис. 4). Зависимость квадратичной интегральной оценки качества от изменения начального значения управления

т ,

3 = I («*(*)-«(*)) ,

ЫГ

приведена на рис. 5.

Из представленных графиков можно сделать вывод о том, что предлагаемый метод синтеза системы оптимального управления, учет высших производных обеспечивает лучшие показатели качества, что

позволяет рекомендовать его к использованию для решения поставленной задачи.

Библиографический список

1. КогутА.Т. Оптимальное управление для навигационной задачи быстродействия. //Омскийнаучный вестник. - 2003. - №23, -С. 114-116.

2. Крутько П.Д. Обратные задачи динамики управляемых систем. Нелинейные системы. - М.: Наука, 1988. - 327 с.

3. Рубан А.И. Адаптивное управление с идентификацией. -Томск: Иэд-воТГУ, 1982. - 302 с.

4. ЛейтманДж. Введение в теорию оптимального управления. -М.: Наука, 1968,- 192 с.

5. КогутА.Т. Полиномиальная аппроксимация в некоторых задачах оптимизации и управления. Омск: Изд-во ОмГУПС, 2003. -243 с.

КОГУТ Алексей Тарасович, кандидат технических наук, доцент кафедры АиСУ.

КРАСУЛИН Александр Владимирович, аспирант кафедры автоматики и телемеханики, ЛАВРУХИН Андрей Александрович, студент пятого курса.

i Надоели баннеры? Вы всегда можете отключить рекламу.