Универсальный метод синтеза оптимальных управлений нелинейными Лагранжевыми динамическими системами

Андрашитов Дмитрий Сергеевич; Костоглотов Андрей Александрович; Костоглотов Александр Иванович; Лазаренко Сергей Валерьевич; Ценных Борис Михайлович

УДК 62-50

Универсальный метод синтеза оптимальных управлений нелинейными Лагранжевыми динамическими системами

Д.С. Андрашитов, А. А. Костоглотов, А.И. Костоглотов, С.В. Лазаренко,

Б.М. Ценных

Введение

Неизменным практическим интересом характеризуются задачи синтеза оптимальных управлений сложными техническими объектами, например, манипуляционными роботами, ракетой и т.п. [1] Это связано с ситуацией, когда существует большое количество вариантов законов управления для линейных динамических систем, а высокой практической значимостью обладают обычно нелинейные случаи. Для них известные методы, как правило, обеспечивают синтез управлений только при введении различного рода упрощений и ограничений [2]. Поэтому проблема синтеза оптимального управления нелинейной динамической системой остается актуальной. При этом в качестве тестовых управляемых объектов при исследовании новых алгоритмов управления достаточно часто используются маятники.

Существенный вклад на пути решения проблемы синтеза внес А.А. Фельдбаум [3]. Важным этапом в решении проблемы синтеза является теория аналитического конструирования регуляторов, связанная с именами А. М. Летова, Р.Э. Калмана, А.А. Красовского [4, 5, 6]. Это направление развивается в рамках поставленной академиком А.А. Красовским крупной научной проблемы поиска оптимального управления с использованием информации о свойствах исследуемого объекта в виде физических законов сохранения, что и привело к созданию концепции обратных задач динамики

[7, 8].

На ее основе Пятницким Е.С. и Крутько П.Д. [7, 8] синтезированы имеющие оригинальную структуру управления. При этом применение предложенного в [8] метода декомпозиции затруднено отсутствием рекомендаций по построению функции, входящей в обратную связь, а

полученные в [7] с привлечением функций Ляпунова решения обратных задач динамики при синтезе оптимального управления, как правило, квазиоптимальны или оптимальны для линейных систем.

Идея учета физических особенностей динамической системы также лежит в основе методов синергетического подхода [9]. С ее помощью решаются задачи управления нелинейными объектами, но часто синтезируемые таким образом управления являются структурно-сложными, зависят от эвристических коэффициентов, кроме того не доказана их связь с оптимальными решениями.

Известны конструктивные результаты решения обозначенной проблемы, полученные с использованием вариационных принципов механики [12 - 23]. Поэтому цель настоящего научного исследования -разработка метода синтеза оптимальных управлений нелинейными Лагранжевыми динамическими системами.

Для достижения поставленной цели в работе применяется подход, заключающийся в рассмотрении неизвестных причинных характеристик как обобщенных сил, подлежащих определению на основе аппарата объединенного принципа максимума (ОПМ) [12 - 23]. Он базируется на применении игольчатого варьирования к инвариантным признакам действительного движения в форме интеграла действия Гамильтона -Остроградского [24]. Его эффективность подтверждается результатами решения задачи синтеза управления из области кусочно-постоянных функций для нелинейной динамической системы второго порядка.

Постановка задачи синтеза оптимального управления

Движение управляемой системы подчиняется принципу Гамильтона-Остроградского на конечном промежутке времени * е [*о, *к ] [22]

*к

8И = | (8Г + 8'Л)Ж = 0, (1)

* 0

*=tо, чМ = я о; я (*о) = я о; * = Ч, Фк) = я к; я (Ь) = я к;

мерой качества управляемого процесса выбран целевой функционал

n tk

J = 0.5 ^ | ( - у5) А ^ min, (2)

5=1 * о

где у е [,...,уп] - заданный закон движения, я е [$ь...,$п]; я е [$ь...,$п] -

1 п

обобщенные координаты и скорости; Г = — ^а5кС5$к - кинетическая

2 5, к=1

n

энергия, ask - коэффициенты инерции; £А = ^QsSqs - элементарная работа

s=1

обобщенных сил, зависящих от управлений,

Qs = Qs (я, 4,и,*); и = {иу } е Ои; 5 = 1, п, у = 1, т, т - число искомых параметров управления. Управления выбираются из замкнутого множества

и}

< Cu , Cu = const. В качестве функций управления может назначаться и

обобщенная сила |Qs| < Cs, Cs = const.

Из принципа (1) следуют уравнения Лагранжа второго рода

d дТ дТ _ —

= Qs, s =1 n. (3)

dt dqs dq "s

Задача состоит в построении таких допустимых управлений и е Ои или О е GQ, которые переводят систему (3) из начального состояния * = *о в конечное * = *к, а целевой функционал (2) принимает при этом минимальное значение.

Необходимые и достаточные условия оптимальности управления

Пусть по правилу множителей Лагранжа составлен расширенный функционал

tk

J = J1 + XR = J

10

Л(Т + A) + £(qs - ys )2 s=1

dt , (4)

где Л - неопределенный множитель Лагранжа.

Теорема. Для того чтобы обобщенная сила О(я, я, и, *) е GQ и

соответствующая ей траектория (я, я) е Я2п доставляли минимум расширенному функционалу (4), необходимо и достаточно выполнить условия максимума для обобщенной мощности

ф^ q, Q,^> = max IЛ (q, q, u) + ( - ys )]qs,

(5)

QєGQ s=1

при этом Л = const > 0, а на концах траектории t = to, t = tk выполняются условия трансверсальности для функции Гамильтона-Остроградского H (q, p, t) и обобщенного кинетического потенциала L(q, (j, t)

H = Л(Г + A) +I(cs - ys )2 = o;

s=1

L = Л(Т - A) + I (qs - ys )2 = o ,

s=1

(б)

(7)

где р Є [,..., рп ] - обобщенные импульсы [24].

Доказательство. Асинхронная вариация функционала, обусловленная вариацией обобщенной силы О є Од, будет иметь вид [18]

t n tk

AJ = Л + A) + F]At|tk + I j [Л

o

s=1 to

дГ дГ %

т— % s +—&ls + Qs%Cs \дС s ^s

+ (Cs - ys ]dt ^ 0, (8)

где 8,88 - синхронные вариации обобщенных координат и скоростей;

Д/ = 8/ + /Д? - асинхронная вариация.

Интегрирование по частям первого слагаемого под знаком интеграла и замена в граничных условиях синхронной вариации так, чтобы асинхронная вариация равнялась нулю = 8д5 + С 8 Д? = 0, откуда 8 =-с 5 Д?,

преобразует первое слагаемое под знаком интеграла выражении (8) к виду

[18]

n tk дT n tk

I їЛд— %lsdt = -I j

s=1 t0 ^s s=1

to

ґ л v dt j

дГ

d дГ

—+ Л------------------------8qs

дС s dt де s

dt. (9)

Из этого выражения следует, что Л = const, а при преобразовании краевых условий использовано выражение Sqs(to) = Sqs(tk) = 0. С учетом преобразований первая асинхронная вариация (8) приводится к условиям трансверсальности (б), (7) и выражению

ґ 1 \

n tk

AJ = I j

s=1 to

Л

d дГ дГ

----------+------------+ Qs

+ (Cs - ys )

Sqsdt > 0. (10)

А д$ 5 дц5

Из (10) следует (5) [17, 18]. Достаточность выполнения условия максимума для функции обобщенной мощности поясняется следующими преобразованиями.

Пусть из допустимой области GQ выбрана другая обобщенная сила,

полученная из первой игольчатым варьированием Qss = Qs + Ф 0

при * е [т,т + дг], [6, 22]. Асинхронная вариация функционала для этой обобщенной силы запишется аналогично (10)

AJ

n tk е-I j

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

s=1 to

Л

d дT дT

----------+--------+ Qss

+ (є - ys )

У

Sqsdt. (11)

А д$ 5 дц5

В силу произвольности синхронные вариации можно положить одинаковыми д$5 = д$е5 при * = т + ед. Из сравнения (10) и (11) получается вторая асинхронно-игольчатая вариация функционала

d д^є- t) + д(^- t)

dt дСь

n tk

A2 J = Л/є - AJ = I j Л

s=1 to

= I j {Q£s - Qs )+( - ys )-(Cs - ys )dt.

s=1 to

Sqsdt +

(12)

Отрезок [*о, *к ] можно разделить на три части [6, 17]. На полуоткрытом интервале I [*о,т) произвольная и варьированная обобщенные силы

совпадают, поэтому А JI = 0. На ограниченном замкнутом интервале

II [т, т + ед*] Qss Ф Qs, но в силу малости интервала ед* = О(е), Ге - Г = О(е), [25]. Вторая вариация функционала определяется

соотношением

д2Jii = Ё -Qs)+(-л)-(-ys))]st, (i3)

s =1

и соответственно

2

d111 ) = Ё ( - ys )- (qs - ys ))^qs (t); t = т + ^, Д JШ (т + S^) = Д Jii

dt s=1

(14)

При предельном переходе s —— 0, Fss - Fs — 0, qs — q , qs — q, 8q — 0, dq — 0. Из (12) с учетом (2) получается

д2 j n

lim----2^= -Ё [Л(&я - Qs ) + ((qss - ys )-(qs - ys ))]qss^ 2 > 0 (15)

s — 0 S s = 1

Если обобщенная сила Qs соответствует минимуму целевого функционала, то из (15) вытекает, что условие (5) не нарушается вдоль траектории, так как в соответствии с (14) и предельным переходом величина Д Jiii = const вдоль траектории t е (т + sSt, t^ ].

Пример. Решение задачи синтеза оптимальной системы управления нелинейным объектом

Решается задача синтеза оптимальной системы управления нелинейным объектом, уравнения возмущенного движения которого имеют вид [9]:

q = sin q + u = U, q(t0 )= 1, q(t0 )= 1, t0 = 0. (16)

Математическая модель (16) описывает движение математического маятника в неустойчивом положении, где q - угол отклонения от вертикали, u -момент, приложенный к маятнику [9, 15]. Необходимо отметить, что ее часто используют в качестве тестового объекта управления. Она, например, представляет собой упрощенную модель однозвенного манипуляционного робота с абсолютно жесткими элементами конструкции. Такой манипулятор может совершать движения в плоскости и управляется моментами сил, создаваемыми в идеальных цилиндрических шарнирах. В этом случае q -

угол поворота динамического звена относительно основания [26]. Уравнение (16) также описывает движение асинхронного электродвигателя с маятником на валу в предположении отсутствия трения. Тогда д - относительная угловая координата положения вала асинхронного электродвигателя [27].

Требуется синтезировать управление |и| < 6, обеспечивающее изменение угла д в соответствии с желаемой траекторией у :

*к -

3 = 0.51 ((*)- у()) & ^ тіп. (17)

* о

Пусть желаемая траектория находятся из дифференциального уравнения [9]

у + ^2 у + кі у = 0, кі = 2, к2 = 3. (18)

Таким образом, цель управления состоит в приведении исследуемой динамической системы по заданной траектории из начального состояния (і,і) в точку фазового пространства (0,0). Соответственно, данная постановка отвечает задаче удержания манипулятора робота в верхнем неустойчивом положении или обеспечения требуемого режима разгона, торможения асинхронного электродвигателя с маятником.

Тогда использование теоремы объединенного принципа максимума для поставленной задачи позволит получить следующий закон управления [23]

д\д\

и =

—-------—

(19)

Л~ 21и\

где |и| - допустимое управление. Его форма соответствует известному

решению принципа максимума Л. С. Понтрягина [11].

Анализ эффективности синтезированной обратной связи проведен на основе сравнения с конструктивным вариантом решения поставленной задачи из [9]. Он определяется следующим дифференциальным уравнением:

и = иь и1 = -

( п ^

в1 . а

+

V Т1

Т1Т2

с

Г а • « в2 • 1 '

+-----+ соб q + ^- slgnqslgns +---------

Т2 Т1 Т1

(и + б1п q) а + — + — + в2 signqsigns V Т1 Т2

\\

а +

Т

С

(20)

2 у;

а

я = — q +

Т2

а+

Т2

С + и + Б1П q,

2 У

где в = 1, в = 1, вз = 1,а = £Т = 1,Т1 = 0.2, Т2 = 0.5 - параметры настройки, которые находятся из (18).

При этом необходимо отметить, что решение поставленной задачи синтеза (16), (17) на основе ОПМ приводит к получению закона управления, вид которого для Лагранжевой динамической системы не зависит от обобщенных сил правой части (16). Структура управления определяется целевым функционалом (17). Использование принципа максимума Л.С. Понтрягина в задачах синтеза требует поиска и анализа решения краевой задачи с целью определения явной формы обратной связи для каждой конкретной динамической системы, что часто затруднительно. Применение методологии изложенной в [9] также относительно трудоемко. Полученные решения, как правило, отличаются громоздкостью. Кроме того, такая процедура требует вычисления параметров £1,£2 [9, 15], которые в соответствии с (18) определяют желаемую траекторию у .

Результаты математического моделирования показаны на рисунке 1. Здесь цифрами обозначено: 1, 3 - соответственно динамика угла отклонения маятника от вертикали с и скорости его изменения при использовании (19); 2, 4 - соответственно динамика угла отклонения маятника от вертикали с и скорости его изменения при использовании (20). Видно, что при выбранных параметрах, когда Л = 140 -10-3, |и| = 6, кривые желаемого движения и

управляемого с использованием (19) совпадают с высокой точностью в

8

1

отличие от (20). Все величины приведены в безразмерных единицах. Следует отметить, что более детальный выбор параметров закона управления (20) позволяет существенно повысить точность расчетов. Анализ переходных процессов позволяет сделать вывод о превосходстве ОПМ над (20) по критерию быстродействия и точности. При этом для (19) 3 = 7 • 10-6, а для

(20) 3 = 26 • 10

- 3

Структура синтезированных законов изменения моментов,

приложенных к маятнику, изображена на рисунке 2, где цифрами обозначено: 1 - закон изменения момента, полученный с использованием

(19); 2 - закон изменения момента, полученный с использованием (20). и и

1 * - : > * • * * * * 1 * ■ 1 м »

з + м » > * * »* * ; : :

і : і** г і с

. о :> Ї? 0 ■ ’ ї і ■ » ї * *

і . I її* > * * м * » * ■ *

з ; і : : > * * » * ■ *

5 ! : т т * * * г * * х * ■ *

к

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г І у V'

Г Г % * т

Рис. 2 - Структура синтезированных законов изменения моментов,

приложенных к маятнику

Синтезированное управление релейное, что в совокупности с переходным процессом дополнительно подтверждает справедливость выводов о существовании связи между объединенным принципом максимума и принципом максимума Л. С. Понтрягина, которая продемонстрирована совпадением аналитической формы решений в [15, 18] и доказана в [23]. Это следует из того, что для классического решения оптимальные траектории математического маятника должны содержать счетное количество переключений управления, сгущающихся к точке (0,0) [28]. В результате в практических задачах часто целесообразно переходить к субоптимальным управлениям или искать решения из области непрерывных функций [11, 14] как, например, (20).

Заключение

Анализ полученных результатов позволяет сделать следующие выводы:

1. Универсальность метода заключается в том, что он позволяет синтезировать управления, обеспечивающие минимизацию целевого функционала (2), для любых Лагранжевых динамических систем из условия максимума функции обобщенной мощности (5). Его форма остается неизменной независимо от конкретной формы записи выражения (3), которая определяется действующими обобщенными силами и структурой кинетической энергии [17, 19, 24].

При этом применение к расширенному функционалу (4) процедуры асинхронно-игольчатого варьирования [24] обеспечивает получение

необходимого и достаточного условия минимума, аналогичного по структуре (5), для любого целевого функционала, чье подынтегральное выражение задается определенно положительной функцией обобщенных координат [19].

2. Процедура получения условия оптимальности в форме принципа максимума функции обобщенной мощности отличается от ранее известной [15 - 23] детальным исследованием условий трансверсальности, которые

получены в форме равенства нулю функции Гамильтона и кинетического потенциала.

3. Синтезированное управление (19) отличается от (20) компактностью записи, меньшим в 4.4 раза числом элементарных операций сложения, вычитания, деления и умножения, что определяет его вычислительную эффективность [29], а сама процедура получения обратной связи не предполагает никаких дополнительных предположений, в частности относительно заданного уравнением (18) закона движения. Кроме того, в сравнении с принципом максимума Л.С. Понтрягина не требуется решения двухточечной краевой задачи, которое часто обеспечивает получение лишь программ оптимального управления [25].

4. Анализ переходных процессов управляемой динамической системы позволяет сделать вывод о превосходстве над (20) [9] ОПМ по критерию быстродействия и точности, что также подтверждается расчетными значениями целевого функционала (17) для (19) и (20).

5. Исследование синтезированного кусочно-постоянного управления позволило установить соответствие законов управления принципа максимума Л.С. Понтрягина и ОПМ.

Таким образом, поставленная цель исследований достигнута.

Литература

1. Браганец С.А., Гольцов А.С., Савчиц А.В. Система адаптивного

управления и диагностики сервомоторов направляющего аппарата гидроагрегата с поворотно-лопастной турбиной [Электронный ресурс] // Инженерный вестник Дона. 2013. № 3. - Режим доступа:

http://www.ivdon.ru/magazine/archive/n3y2013/1807 (доступ свободный) -

Загл. с экрана. - Яз. рус.

2. Черноусько Ф.Л., Ананьевский И.М., Решмин С.А. Методы управления нелинейными механическими системами [Текст]: Монография / Черноусько Ф.Л., Ананьевский И.М., Решмин С.А.. - Москва: Физматлит, 2006. - 328 с.

3. Фельдбаум А. А. О синтезе оптимальных систем с помощью фазового пространства [Текст] // Автоматика и телемеханика, 1965. - № 2. - С.129 -149.

4. Гурман В.И. Модели и методы теории управления [Текст] // Программные системы: теория и приложения. ИПС РАН. 2004. - №1. -С. 101 - 116.

5. Мелса Дж. Л., Сейдж Э.П. Идентификация систем управления. [Текст] М.: Наука, 1974. - 24S с.

6. Справочник по теории автоматического управления. [Текст] Под ред. А. А. Красовского. М.: Наука. 19S7. - 712 с.

7. Крутько П.Д. Обратные задачи динамики в теории автоматического управления. [Текст]: Цикл лекций: Учеб. пособие для ВУЗов / Крутько П. Д. - М.: Машиностроение, 2004. 576 с.

S. Пятницкий Е.С. Принцип декомпозиции в управлении механическими системами [Текст] // Доклады академии наук СССР, 19SS. Том 300, №2. С. 300 - 303.

9. Колесников А.А. Синергетическая теория управления. [Текст] М.: Энергоатомиздат, 1994. 343 с.

10. Матюхин В.И. Управление колесной системой в условиях неопределенности [Текст] // Автоматика и телемеханика. - 2009. - № 5. -С. 76 - 94.

11. Майкова О.Е. Субоптимальные режимы в задаче Фуллера [Текст] // Труды математического института им. В.А. Стеклова . - 2002. - т. № 236. -С. 226 - 229.

12. Kostoglotov A.A., Kostoglotov A.I., Lazarenko S.V. Joint maximum principle in the problem of synthesizing an optimal control of nonlinear systems [Text] // Automatic control and computer sciences - 2007. - V. 41. № 5. - P. 274-2S1.

13. Kostoglotov A. A., Lazarenko S.V. Nonsmooth analysis in measurement processing [Text] // Measurement techniques - 2009. - V. 52. № 2. - P. 117-124.

14. Костоглотов А. А. Решение задачи А. Фуллера на основе объединенного принципа Понтрягина - Гамильтона - Остроградского. [Текст] // Автоматика и вычислительная техника. - 2007. - №4. - С. 3 - 14.

15. Андрашитов Д.С., Дерябкин И.В., Костоглотов А.А., Кузнецов А.А., Лазаренко С.В. Синтез алгоритма автономного управления математическим маятником на основе объединенного принципа максимума [Текст] // Известия высших учебных заведений. Северо - Кавказский регион. Технические науки. - 2010. - №3. - С. 9 - 14.

16. Андрашитов Д.С., Костоглотов А. А., Костоглотов А.И., Лазаренко С.В. Многопараметрическая идентификация конструктивных параметров методом объединенного принципа максимума [Электронный ресурс] // Инженерный вестник Дона. 2011. №1. - Режим доступа: http://www.ivdon.ru/magazine/archive/n1y2011/348 (доступ свободный) - Загл. с экрана. - Яз. рус.

17. Костоглотов А.А., Костоглотов А.И., Лазаренко С.В. Объединенный принцип максимума в задаче синтеза оптимального управления нелинейными системами [Текст] // Автоматика и вычислительная техника. -2007. - №5. - С. 52 - 61.

18. Костоглотов А.А., Костоглотов А.И., Лазаренко С.В. Синтез

оптимальных по быстродействию систем на основе объединенного принципа максимума [Текст] // Информационно-измерительные и управляющие

системы. - 2007. - №12. - С. 34 - 40.

19. Костоглотов А.А., Костоглотов А.И., Лазаренко С.В. Объединенный принцип максимума в задачах оценки параметров движения маневрирующего летательного аппарата [Текст] // Радиотехника и электроника. - 2009. - т.54., №4. - С. 450 - 457.

20. Костоглотов А.А., Лазаренко С.В. Метод решения обратных

измерительных задач с применением аппарата негладкого анализа [Текст] // Информационно-измерительные и управляющие системы. - 2009. - Т. 7. №

10. - С. 38 - 45.

21. Костоглотов А.А., Лазаренко С.В. Негладкий анализ в задачах обработки измерительной информации [Текст] // Измерительная техника. -2009. - № 2. - С. 6 - 11.

22. Костоглотов А.А., Костоглотов А.И., Лазаренко С.В., Ценных Б.М. Метод оценки параметров движения управляемого летательного аппарата на основе объединенного принципа максимума с построением опорной траектории [Текст] // Успехи современной радиоэлектроники. - 2012. - №6. -С. 61 - 66.

23. Костоглотов А.А., Костоглотов А.И., Лазаренко С.В., Шевцова Л.А. Синтез оптимального управления на основе объединенного принципа максимума [Текст] // Известия высших учебных заведений. Северо -Кавказский регион. Технические науки. - 2010. - №2. - С. 31 - 37.

24. Маркеев А.П. Теоретическая механика. [Текст] М.: Наука, 1990. 416 с.

25. Понтрягин Л.С. Математическая теория оптимальных процессов. [Текст] М.: Наука, 1976. 392 с.

26. Костоглотов А.А., Костоглотов А.И., Лазаренко С.В., Чеботарев А.В. Метод механико-математического синтеза при построении оптимального управления механическими системами [Текст] // Современные проблемы науки и образования. - 2012. - №6. - http://www.science-education.ru/106-7733

27. Луковников В.И., Веппер Л.В. Исследование автоколебательного движения асинхронного электродвигателя с маятником на валу [Текст] // Вестник ГГТУ им. П.О. Сухого. - 2003. - №1. - С. 53 - 60.

28. Борисов Б.Ф., Зеликин М.И., Манита Л.А. Экстремали с накоплением переключений [Текст] // Современная математика и ее приложения. Оптимальное управление. - 2008. - Т. 58. - С. 3. - 56.

29. Тесты [Текст] // Мобильные компьютеры. 2004. №6. С. 20-39.

Универсальный метод синтеза оптимальных управлений нелинейными Лагранжевыми динамическими системами Текст научной статьи по специальности «Математика»

Universal method of synthesis of optimal control of nonlinear Lagrang dynamic systems

Текст научной работы на тему «Универсальный метод синтеза оптимальных управлений нелинейными Лагранжевыми динамическими системами»