Метод Охоцимского-Понтрягина в теории управления и аналитической механике. Часть 2: метод Охоцимского-Понтрягина в аналитической механике

Голубев Ю.Ф.

Механика

УДК 531.36

МЕТОД ОХОЦИМСКОГО-ПОНТРЯГИНА В ТЕОРИИ УПРАВЛЕНИЯ

И АНАЛИТИЧЕСКОЙ МЕХАНИКЕ. ЧАСТЬ 2: МЕТОД ОХОЦИМСКОГО-ПОНТРЯГИНА В АНАЛИТИЧЕСКОЙ МЕХАНИКЕ

Ю. Ф. Голубев

1.4. Изопериметрические ограничения. Предположим, что требуется найти экстремаль функционала Ф(7) среди всех вектор-функций, для которых выполнено ограничение

Ф(7) = J G(x, u,t) dt = c.

Функционалу Ф(7) отвечает функция Гамильтона [1]

т

Н = С(х, и,Ь)+^ грг/г(х, и,Ь),

г=1

где функции 1рг, г = 1,...,ш, удовлетворяют системе дифференциальных уравнений

диХг дн й'фг дН . ^

йЬ дф^ йЬ дхг' '"'' '

и условиям трансверсальности

т

Н(х(Ьо), и(Ьо),ф(Ьо)) йЬо - ^ Фг(Ьо) йхг(Ьо) = 0,

г=1

т

Н(х(Ь 1), и(Ь1 ),ф(Ь1)) йЬ1 - ^ Фг(Ь1) йХг(Ь1) = 0.

i=1

Определение. Градиентом функционала $(7) называется вектор-функция

дФ / дН дн\

д7 \ ди1 дик I Пусть на отрезке Ьо ^ Ь ^ ¿1 заданы две вектор-функции

71 = {у е як : у(Ь) = (У1 (Ь),..., у к (*))} , 72 = е Ек : z(Ь) = (¿1 (Ь), ...,гк Определим для них скалярное произведение

(71Л2) = (1Ь, 'Ы'2 = (71,71), \\ъ\? = (72,72).

/с 1 =1

Для вычисления градиентов функционалов $(7) и Ф(7) применяются различные сопряженные переменные ф и ф.

Теорема 2. В задаче о поиске экстремума найдется постоянная X, для которой дифференциал функционала Ф при условии, что функционал Ф сохраняет постоянное значение, совпадает с безусловным дифференциалом функционала Ф + ХФ.

Доказательство. Дифференциалы функционалов можем представить в виде

'дФ

д1

Пусть задана произвольная вариация 5. Тогда вариация 5', обращающая в нуль значение йФ, может быть получена по формуле

5' = 5-

дФ

д7

-2

Л

д^у' )

По смыслу 5' представляет собой вариацию в плоскости, перпендикулярной к градиенту функционала Ф в пространстве функций. Дифференциал функционала Ф на 5' можно выразить в виде

5

дФ

д7

2

9Ф \ 9Ф

с?7' ) с?7

Э[Ф + ЛФ]

д7

для любого 5. Для того чтобы получить градиент в правой части, достаточно взять вектор-функцию ф = ф + Лф. Скаляр Л выражается формулой

Л = -

дФ

д7

2

/9Ф 0Ф\

\ с?7 ' с?7 ) '

Пример 3 (максимальная высота подъема ракеты). Уравнение движения имеет вид

д = —д + и — /(д)д, V = и, 0 ^ и ^ и*,

где д — вертикальная координата, д — ускорение силы тяжести, и — удельная тяга, V — характеристика расхода топлива, и* — максимальное значение удельной тяги, /(д) — коэффициент аэродинамического сопротивления, зависящий от высоты: /(д) = к[1 — а(д — К)}, Н — высота однородной атмосферы. Здесь через а(д — К) обозначена сингулярная ст-функция, обладающая свойствами

\ 0, х < 0; йа ~ ~ Г+го, х = 0;

°{х)= 1, ш= • О, ^0,

5(х) йх = 1.

Расход топлива ограничен: V(Ь) ^ С. Необходимо найти такое управление, которое обеспечивает максимум величины д(Т), где Т — время окончания движения, определенное условием д(Т) = 0. Переформулируем задачу в переменных д = х\, д = Х2:

т

хх = х2, х2 = —д + и — /(х\)х2, Ф = J х2 йЬ, V(Т) = J ийЬ = С.

о о

Требуется найти максимум функционала Ф при условии, что функционал V сохраняет постоянное значе-

ние.

В соответствии с теоремами 1 [1] и 2 составим гамильтониан задачи

Н = х2 + Ли + фх + Ф2 —д + и — / (х\)х2)

и систему уравнений для сопряженных переменных

фх = —К^2х2 5(х1 — К), Ф2 = Ф2/х) — фх — 1. Начальная точка фиксирована:

йхх(0) = йх2(0) = йЬ0 = 0. Следовательно, условия трансверсальности будут выполнены, если принять

{[Л + ф2(Т)}и(Т) — ф2(Т)д} йТ — фх(Т) йхх(Т) — ф2(Т) йх2(Т) = 0.

Величина Х\(Т) не фиксирована. Поэтому ф\(Т) = 0. Тогда с учетом первого уравнения (1) получим

( 0, Х1(£) <Ь, 0 < Ь < Т;

Ф1(Ь) = <

{хф2^1)[1 - а(х1 - Ь)], Х1(Т) > Ь, Х1 (¿1) = Ь. Поскольку Т тоже не фиксировано, то следует принять

[Л + Ф2(Т)]п(Т) - ф2(Т)д = 0. Дифференциал функционала Ф представится в виде

т

(Ф = ! [Л + Ф2(Ь)]5и(Ь) (Ь.

Если Ф достигает максимума, то значение (Ф должно быть отрицательным для любого допустимого §и(Ь). Следовательно, оптимальным будет управление

и = — [1 + sign(A + ф2)] .

Рассмотрим сначала случай, когда Х1(Ь) ^ Ь, 0 ^ Ь ^ Т. Напишем решение второго уравнения (1):

ехр(к[Ь - Т]).

М*) = - +

к

ЫТ) - -

к

В зависимости от величины Ф2(Т) функция ф2(Ь) либо монотонно убывает, либо монотонно возрастает. Функция [Л+ф2(Ь)] может иметь лишь одну перемену знака в некоторый момент времени т. Экстремалями служат функции

(и*, 0 < Ь<т; ¡0, 0 < Ь<п;

и = 0, п =п*, П1(Ь) = ( и2(Ь) = ^ *

[0, т ^ Ь ^ Т, \^и*, т1 ^ Ь ^ Т.

Вариант и = 0 следует отбросить как отвечающий минимальному значению предельной высоты полета. Вариант и = и* можно рассматривать как предельный, например, для варианта и = П1 (Ь) при Т ^ т либо для варианта и = щ(Ь) при т1 ^ 0. Непосредственный подсчет показывает, что высота, достигаемая при и = и^Ь), оказывается больше, чем при и = щ (Ь). Следовательно, оптимальным будет только управление и = щ(Ь).

Пусть теперь Х1(Т) > Ь. Имеем

• [ к[ф2 - Ф2 (Ь1)] - 1, 0 < Ь < Ь1;

Ф 2 = <

[-1, Ь1 <Ь < Т.

Отсюда видим, что при 0 ^ Ь ^ Т функция ф2(Ь) монотонно убывает, а потому оптимальным остается вариант и = и^Ь).

Данная задача решена в предположении, что сопротивление воздуха линейно по скорости, а плотность кусочно-постоянна. В работе [2] показано, что если сопротивление квадратично зависит от скорости, а плотность воздуха зависит от высоты экспоненциально, то при достаточно больших скоростях будут возникать режимы управления, содержащегося внутри допустимой области.

2. Стандартная задача вариационного исчисления. Найти необходимое и достаточное условие, определяющее экстремали функционала

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ф = У Ш(д1,...,дп,д1,...,ди,Ь) (Ь, (2)

ь0

где q(Ь) = (д1(Ь),..., дп(Ь)) — дифференцируемая вектор-функция параметра Ь, Ш — дважды дифференцируемая функция своих аргументов на заданном множестве вектор-функций q(Ь).

Для решения этой задачи воспользуемся методом Охоцимского-Понтрягина. Определим вектор-функцию q(t) с помощью следующей системы дифференциальных уравнений:

Ч=^=и' (3)

где и = (и\,..., ип) — вектор-функция управлений, выбираемых произвольно. Функционал (2) перепишем в виде

¿1

Ф = ! №(дх,...,дп,их,...,ип,Ь) йЬ. (4)

ь0

Согласно теореме 1 [1], функционалу (4) и системе уравнений (3) отвечает гамильтониан

, йфг дН

йфг дН дН

йЬ ддС йЬ дфг'

г=Х

а дифференциал функционала (4) выражается формулой

¿1 П дН йФ = о— &

.) . , диг

Ьо г=Х

при выполнении условий трансверсальности

п

Н^(Ьо), и(Ьо), Ф(Ьо)) йЬо — фг (Ьо) йдг (Ьо) = 0,

г=х

п

Й^(Ьх), и(Ьх ), ф(Ьх)) йЬх — фг (Ьх) йдг (Ьх) = 0.

г=х

2.1. Задача с фиксированными концами. В этой задаче к сравнению допускаются вектор-функции q(t), имеющие в фиксированные начальный и конечный моменты времени фиксированные значения начальных и конечных координат. Тогда условия трансверсальности автоматически удовлетворяются. Поскольку управление принадлежит открытой области, то необходимыми и достаточными условиями экстремума функционала будут равенства

дН дШ , дШ дШ . л

— = ^—+фг = 0 -»■ фi = -—— = - — , 1 = 1,...,П. (5)

диг диг диг ддг

Подставив найденные выражения в дифференциальные уравнения для сопряженных переменных и выразив переменные иг через дг, заметим, что для экстремальности функционала (2) в задаче с фиксированными концами необходимо и достаточно, чтобы выполнялись уравнения Эйлера

й ( дШ \ дШ

= 0, г = 1,..., п. (6)

йЬ\ ддг ) дд.

2.2. Случай дШ/дЬ = 0. Экстремаль функционала определена уравнениями (6), для которых будет справедлив первый интеграл

■А дШ и ддг

где Н — постоянная интегрирования. Предполагая, что функция Еq) не тождественный нуль, и не учитывая условия ее сохранения, вычислим дифференциал функционала

¿1 п ¿1 п дШ

г ^ дШ г

■] = = у р(ч> ч)гМ + ф

¿0 г х ¿0

на экстремали функционала Ф. С учетом равенств (5) найдем

¿1

<и = у 5Е <И

ь0

при выполнении условий трансверсальности

™ дш

(Е + Я) йЬ+У^ — (1дг

г0 дп,

7=1 п

д<Пг

¿0

^ дШ ,

7=1 дпг

¿0

дш

(Р + Н) + £ —<1®

Н .= 1 дпг

дШ ,

дпг

¿1 г=1

= 0, = 0,

¿1

поскольку на экстремали имеем Е + Н = 0. Если теперь к сравнению допустить только кривые, для которых сохраняется Е(4, 4) = Л, но которые проходят через фиксированные начальную и конечную точки (время не фиксировано), то получим аналог принципа Мопертюи-Лагранжа-Якоби [3]. А именно при дШ/дЬ = 0 вектор-функции 7, удовлетворяющие уравнениям Эйлера, будут экстремалями функционала .] среди всех кривых с одинаковым значением константы Л, проходящих через фиксированные начальную и конечную точки в координатном пространстве.

Пример 4 (задача о брахистохроне). Материальная точка соскальзывает без начальной скорости в поле параллельных сил тяжести в вертикальной плоскости по кривой 7, соединяющей заданные начальную точку А и конечную точку В. Среди всех дифференцируемых кривых 7, проходящих через фиксированные точки А и В, найти такую, для которой время движения точки из А в В минимально.

Вариант 1. Брахистохрона образует идеальную связь. Поместим начало координат в точку А. Ось Ау направим вертикально вниз. Горизонтальную ось Ах выберем так, чтобы плоскость Аху содержала

точку В. Время Т движения по кривой 7 можно выразить с помощью криволинейного интеграла первого Г

рода [4]: Т = / —, где йв — элемент длины дуги, а г> — скорость материальной точки, которую в данном

случае можно найти из интеграла энергии: и = у/2ду. Функционал Т можно представить в виде

У1

Т = Ш<у, Ш =

х

./ 2

+ 1

у/5ду

(7)

У0

Решением задачи будет циклоида (см., например, [3, 4]).

Вариант 2. Брахистохрона с вязким трением. В классической задаче о брахистохроне функционал (7) записан в предположении, что существует интеграл энергии. При добавлении в систему трения, например вязкого, формулой (7) воспользоваться невозможно и задача стандартными методами вариационного исчисления не решается. Представим систему уравнений движения в виде

X1 = х2, X 2 = -кх2 — их4, X з = х4, Х4 = —д — кх4 + их2,

где члены, содержащие управление и, выражают составляющую реакции брахистохроны, перпендикулярную скорости. Далее

т

Ф = J 1 <Ь, Н = 1 + ф1х2 — ф2(кх2 + их4) + ф3х4 + ф4 (—д — кх4 + их2). о

При условии, что сопряженные переменные удовлетворяют дифференциальным уравнениям

Ф1 =0, Ф2 = —ф1 + кф2 — ф^и, фз =0, ф)4 = —фз + кф4 + ф2 и и условиям трансверсальности

ф1 (Т )= а, ф2 (Т) = 0, фз(Т )= в, ф4 (Т) = 0, 1 + ах2(Т) + /Зх4 (Т) = 0,

дифференциал функционала выражается формулой

т

йФ = !(ф4х2 — ф2х4) 5и йЬ.

Имеем условие экстремальности ф^х2 — ф2Х4 = 0. После дифференцирования его по времени в силу уравнений Гамильтона получим ах^ — (3x2 + ф29 = 0. Повторное дифференцирование приводит к искомому условию оптимальности

и(ах2 + /Зх4 — ф4 д) = 2д(а — кф2). (8)

Чтобы воспользоваться этим условием, зададим значения х2(Т), (Т). Тогда значения постоянных а, в можно найти из уравнений

1 + ах2(Т) + вхА (Т) = 0, ах А (Т) — вх2(Т) = 0.

Далее система уравнений движения и уравнений для сопряженных переменных интегрируется с учетом условий трансверсальности и условия (8) в обратном времени до тех пор, пока скорость не окажется равной нулю. Траектория, которая при этом получится, и будет брахистохроной с вязким трением. На рис. 1, 2 показаны брахистохроны с вязким трением. Для сравнения на тех же графиках приведены брахистохроны без трения, отмеченные точками. Радиус окружности, порождающей идеальную брахистохрону, обозначен через К. Видно, что с увеличением коэффициента трения к происходит уменьшение кривизны соответствующей брахистохроны.

Рис. 1. Брахистохрона с вязким трением, к = 0,05, К = 19,5 м

Рис. 2. Брахистохрона с вязким трением, к = 0,1, К =30 м

3. Интегральные вариационные принципы механики. Пусть Ш = Ь(дх,..., дп, дх,..., дп, Ь) есть лагранжиан механической системы, Ь — время, а дг, г = 1,...,п, суть производные от обобщенных координат по времени. Другими словами, Ь = Ь2 + Ьх + Ьо, где Ь2 — положительно определенная квадратичная форма скоростей, Ьх — линейная форма скоростей, Ьо от скоростей не зависит.

Уравнения (6) совпадают с уравнениями Лагранжа второго рода. Отсюда и следует принцип Гамильтона, состоящий в том, что решения уравнений Лагранжа составляют экстремаль функционала (2) в задаче с фиксированными концами.

Из полученного решения также следует, что если из уравнений

* = * = .........

г ддг

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

выразить дг = Яг(дх,..., дп, фх,..., фп, Ь) и подставить их в выражение для Н:

Нф = Н(дх,...,дп,дх(q, Ф,Ь),..., Яп(ц^, Ф, ь),ь),

то с учетом (5) получим

дНф _дЬ | А дЬ дд3 | А дд3 _ дЬ _ дН % % дд3 % 3 % % %'

дН^ п дЬ дд* А , дд*

= Т7" ^ГТ + 'ФзТГ + & =

дфг ~х дЯз дфг ^ дфг

Поэтому сопряженные переменные и лагранжевы координаты удовлетворяют следующей системе уравнений Гамильтона:

г!грг _ дН'ф

М дпг ' М дфг ' >•••>•

Связь между полученными уравнениями и каноническими уравнениями Гамильтона определяется каноническим преобразованием вида

(4; ^) = (я; —р), Н* = —Н,

имеющим валентность —1. Здесь Н — стандартный гамильтониан системы и р. = дЬ/дпг, % = 1,...,п.

Заключение. Формулы дифференциалов, предложенные Д. Е. Охоцимским, можно использовать для исследования функционалов, в том числе и в теории дифференциальных игр, так же, как дифференциалы функций.

Методы теории управления обогащают стандартные методы классического вариационного исчисления, их можно применять для решения вариационных задач в неконсервативных постановках.

Методы оптимального управления и гамильтонова механика, представленные единой теорией, образуют эффективный инструмент для решения современных проблем науки.

Работа выполнена при поддержке РФФИ (грант № 07-01-00134).

СПИСОК ЛИТЕРАТУРЫ

1. Голубев Ю.Ф. Метод Охоцимского-Понтрягина в теории управления и аналитической механике. Часть 1: Метод Охоцимского-Понтрягина в теории управления // Вестн. Моск. ун-та. Матем. Механ. 2008. № 6. 50-56.

2. Охоцимский Д.Е. К теории движения ракет // Прикл. матем. и механ. 1946. X, вып. 2. 251-272.

3. Голубев Ю.Ф. Основы теоретической механики: Учебник. 2-е изд., перераб. и доп. М.: Изд-во МГУ, 2000.

4. Вариационные принципы механики: Сб. статей / Под ред. Л. С. Полака. М.: Физматлит, 1959.

Поступила в редакцию 26.03.2008

УДК 531.3.01

МОБИЛЬНЫЕ РОБОТЫ С ДВУМЯ НЕЗАВИСИМЫМИ СООСНЫМИ ВЕДУЩИМИ КОЛЕСАМИ: ДИНАМИКА И СХЕМЫ УПРАВЛЕНИЯ

В. Е. Павловский, В. В. Евграфов, В. В. Павловский, Н. В. Петровская

1. Введение. В работе исследуются задачи синтеза гладких траекторий и задачи планирования и корректной реализации движения мобильных роботов с двумя независимо управляемыми активными колесами — роботов с дифференциальным приводом. Актуальность изучаемых задач обусловлена эффективностью рассматриваемой кинематической схемы. Одно из возможных применений задачи — построение динамически корректного управления роботами-футболистами.

2. Динамика колесного робота и управление им. Рассмотрим робот с двумя независимыми активными колесами, оси которых лежат на одной прямой. Движение такого колесного робота изучалось в статье [1], затем авторами в [2, 3]. Исследование движения цепочки подобных объектов приведено в [4-6].

Модель. Пусть система представляет собой два абсолютно твердых диска, расположенные на осях, лежащих на одной прямой; в местах крепления колес к осям находятся точечные цилиндрические шарниры; колеса управляются идеальными электродвигателями. К осям жестко прикреплен корпус — абсолютно твердое тело, которое может перемещаться плоскопараллельно. Эта "тележка" движется по абсолютно шероховатой плоскости, колеса в точках касания с плоскостью не проскальзывают. Модель рассматриваемого робота приведена на рис. 1. При условии плоскопараллельного движения корпуса положение системы описывается пятью координатами (х, у, в, ф1,ф2), углы (^1 представляют собой углы поворота ведущих колес робота относительно оси. Центр масс корпуса объекта находится в точке С (рис. 1). Положение центра масс корпуса С в связанной системе координат задается вектором Ь = (Ь1,Ь2). Середина расстояния между колесами обозначена 0(х,у). Влияние пассивных колес на движение системы считаем незначительным.

Похожие темы научных работ по математике , автор научной работы — Голубев Ю. Ф.