__________УЧЕНЫЕ ЗАПИСКИ ЦАГИ
Том XXIX 199 8
№1-2
УДК 629.735.33.015 517.97
ВЫБОР НАЧАЛЬНОГО ПРИБЛИЖЕНИЯ ДЛЯ МНОЖИТЕЛЕЙ ЛАГРАНЖА ПРИ РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ МЕТОДОМ ВТОРОГО ПОРЯДКА
Н. М. Гревцов, О. Е. Ефимов, И. О. Мельц
Рассматривается двухточечная краевая задача нахождения начального приближения для множителей Лагранжа в итерационной процедуре решения методом второго порядка общей задачи оптимального управления динамической системой, описываемой конечно-разностными уравнениями.
При решении задач на условный экстремум с использованием методов второго порядка требуется задать начальное приближение как для оптимизируемых параметров, так и для множителей Лагранжа. Начальное приближение для оптимизируемых параметров может быть принято на основе физического смысла рассматриваемой задачи. Для множителей Лагранжа такой подход по крайней мере затруднителен.
Здесь предлагается процедура определения начального приближения для множителей Лагранжа при использовании метода второго порядка для решения общей по постановке задачи оптимального управления динамической системой, описываемой конечно-разностными уравнениями.
К числу множителей Лагранжа относятся не только сопряженные переменные, соответствующие фазовым координатам, но и множители, соответствующие фазовым и смешанным ограничениям типа неравенств, терминальным условиям, а также шагам интегрирования для задачи со свободным временем.
Для нахождения начального приближения ставится оптимизационная задача на условный экстремум: за счет выбора этих множителей требуется на номинальной траектории минимизировать квадрат нормы невязки условий оптимальности при заданных уравнениях для сопряженных переменных и при условиях трансверсальности. Эта задача сводится к специальной двухточечной краевой задаче, для решения которой предлагается процедура ее решения. Решение этой задачи позволя-
ст осуществить выбор оптимального приближения для множителей Лагранжа, количество которых в задаче оптимального управления может в несколько раз превышать число шагов интегрирования.
Этот подход имеет аналогию с методом проекции градиента.
Для пояснения этой аналогии с методом проекции градиента вначале рассматривается обычная задача на условный экстремум в конечномерном пространстве.
Описанный подход был успешно использован для решения целого ряда задач оптимального управления самолетом при перелете из заданных начальных в заданные конечные условия с минимумом расхода топлива или за минимальное время с ограничением на расход топлива. Опыт расчетов показал, что неудачное начальное приближение для множителей Лагранжа может существенно повлиять на сходимость итерационной процедуры метода второго порядка для решения задачи оптимального управления.
1. Задача на условный экстремум. Для стандартной задачи на условный экстремум
где /. — вектор множителей Лагранжа и ' (штрих) — символ транспонирования. Необходимые условия оптимальности для этой задачи записываются в виде
/ = /(х) -» тах, ф = ср(.*) = О
•V
(д- и ф - векторы) функция Лагранжа имеет вид
X = / + /.'ф.
(1)
где
и
А' = (а\...ар), а,- = , / = 1, ..., р.
Если выбрать некоторые начальные значения для х и а, то для итерационной процедуры решения системы уравнений (1) получим следующие соотношения для определения Ах и Ал:
Щ И Дф — желаемые изменения Ь'х И ф при переходе ИЗ ТОЧКИ Л\ /. в точку х + Ах, X + Д/..
Определение Ах и АХ из системы уравнений (2) соответствует методу второго порядка решения рассматриваемой задачи.
При
ДХд. = - их и Дф = -ф (3)
имеем обычную схему метода Ньютона.
Очевидно, что сходимость итерационной процедуры может существенно зависеть от выбора начального приближения для вектора
Предлагается начальное приближение для множителей Лагранжа выбирать из условия
11^* II2 = 1к+ А'}-\? -»■т1п- (4)
к
Решение задачи (4) приводит к следующему известному результату:
Х = ~{АА')~Х А%. (5)
При этом значении множителей Лагранжа Ь’х = g + А'/. = g представляет собой [1-3] проекцию градиента в пе-
I -А'{АА') 1А
ресечение условий ф в точке X.
Существенно, что в точке, которая является решением исходной задачи, выражение (5) дает точное значение вектора множителей Лагранжа.
2. Условия оптимальности для дискретной динамической системы.
Будем рассматривать динамическую систему п-го порядка при заданных начальных условиях, описываемую конечно-разностными уравнениями [4]
**+1 = /* = /*(**> г'ъ А{к)< Д'*+1 = Ык, к = 0............ N -I,
(6)
при векторных ограничениях вида
Ф*(**, и*, Д/*)г>0. (7)
При фиксированном числе шагов N требуется определить управления, представляющие собой /я-мерные векторы ик, к = О, ..., N - 1, и величину А1 (д^ = А1 для любого к) так, чтобы обеспечивался максимум функционала
Г = Г(х^, ДГ) -> тах (8)
ик, д/
= Ц'{хм, Д/) = О
и свободном времени. Для этой же задачи, но при заданном времени в записи уравнений (6), а также в (7)—(9) величина Д/ отсутствует.
В работе [4] описаны необходимые детали организации вычислительной процедуры, использованные при решении прикладных задач. Гамильтониан (6)—(8) задачи имеет вид
(10)
где Хк, <лк и представляют собой множители Лагранжа.
Множители Лагранжа Хк и \1к удовлетворяют следующим уравнениям:
Хк = Н* = /* %к+1 + ф* ®к,
И* = Нд, = ц*+1 + /|/ ^+1 + ф|
(П)
которые являются аналогом уравнений для сопряженных переменных. Краевые условия для (11) имеют вид
(12)
где V — вектор множителей Лагранжа, соответствующих терминальным условиям (9).
Условия оптимальности первого порядка для этой задачи задаются уравнениями (6), (9), (11), (12), а также соотношениями
6Р ) дик
= = Хк+1 + Фи тк =
6Р
6М
а к >0 при ф* = 0, юк = 0 при ф* > 0.
(13)
Последние два соотношения в (13) являются условиями оптимальности Куна — Таккера [5] для ограничений типа неравенств.
Для организации итерационной процедуры оптимизации требуется задать начальное приближение для множителей Лагранжа Хк, сак ц*и V.
3. Постановка задачи определения множителей Лагранжа. Аналогом условия (4) для рассматриваемой задачи является минимизация квадрата нормы, который имеет следующий вид:
где а0 — масштабирующий множитель. Он может быть положен равным единице.
Особенность этой задачи заключается в том, что в отличие от (4) минимум функции (14) требуется обеспечить при выполнении условий (11) и (12). Это обстоятельство приводит к необходимости решения двухточечной краевой задачи для определения Хк, со*. цк и V.
4. Условия оптимальности для определения множителей Лагранжа. Введем функцию Лагранжа для задачи минимизации (14) при условиях (11), (12) и полученных для номинальной траектории последовательностей хк, Ык, соответствующих последовательности управлений ик:
к=о
+ V* V - Я.дг) + Рлг(^А/ + Уд/ V - Цлг)>
где я* и р* (к = 0, ..., Ю — соответствующие множители Лагранжа. Условия минимума для этой функции Лагранжа имеют следующий
вид:
к=о
N-1
к = 0, ..., К-1,
о\^к+1
(15)
|^- = (**+1/н*+®*ф£)ф ки + п'кч>х + р*ф£ = °>
к = О, ..., N-1,
дЬ . , , п
— = П'МЦ1’Х + = О
= 0. ^,0, * = о.......N.
спк сРк
которые соответствуют уравнениям (11) и краевым условиям (12).
5. Решение задачи. Из условия дЬ/дськ = 0 в (15) получим
01
к = -(ф£ ф£') Чфки /„*’>■*+1 + ф*яА' + Фд,р)-
(17)
С использованием (17) остальные условия оптимальности для определения множителей Лагранжа можно переписать в виде
где
'■к = Ак У.к+1 + Вк пк + Ск р,
**+1 = &к }-к+1 + Л'к 71 к + £*-Р-М-А’+І = М-А- _ Е'к /-к+1 _ С к 71 к ~ &к Р\
я0 = 0,
Ц0 = а0 Р<
'-/V = Г.х + Ч'х V,
РАГ = Рлг + Ч'д? V,
\|/д. Лдг + Ч'дг Р = °'
Ак=/Хк'-ф*1фХТф*/*\
^ = -фІ'(ф£ф£') Ч'’
с* = -фІ'(ф£ ф£') І£р
-ФІЕЧФЇФЇ'ГЧІЇ)/*'. ^“/І-ЛЧІфЇфІЇ'ГфЬ.
= -ф1)(ф£ф£') 1
(18)
(19)
и I — единичная матрица.
Соотношения (18), (19) описывают двухточечную краевую задачу. Введем матрицы Як, рк, дк и скаляры ак, которые подлежат определению, и будем искать решение с использованием уравнений связи
Я* = $к 'Кк + Рк р. Ц* = Як '•к + Ч р, к = 0, ..., N
(20)
=0, Ро = 0, д0 = О,
которые соответствуют значениям я0 = 0 и ц0 = й'ор из (19). Уравнения связи (20) являются аналогом соотношений, которые приводят к уравнению Риккати в обычных непрерывных задачах оптимизации [5], используемому при решении двухточечной краевой задачи.
Подставив (20) в (18), получим
и следующие рекуррентные соотношения для 5а., рк, дк и ак :
Соотношения (22) следуют из (18) при условии, что они выполняются как тождество для любых значений множителей Лагранжа, к числу которых относятся также все /.к и скаляр р.
Использовав (20) при к = N в условиях на правом конце из (19), для определения множителей Лагранжа у и р получим уравнения:
Уравнения (22) для номинальной траектории, определяемой начальными условиями и управлением, могут быть проинтегрированы слева направо при начальных условиях 50 = 0, р0 = 0, <?0 = 0 и при выбранном масштабирующем коэффициенте ао, который может быть принят равным единице. В результате будут получены все Sk, рк и ак, в том числе 5дг, р?1, <удг и огдг, которые используются для вычисления у и р по формулам (23) и (24). Путем расчета по формулам (21) могут быть вычислены значения }.к, к = N -1, ..., 0 при краевом условии для (19), где используется полученное значение V. При этом по формулам (17) вычисляются и все значения ок, к = 0...... /V - 1, с ис-
пользованием значений жк, вычисляемых с помощью (20).
}.к - (/ - Вк Як) 1Ак/.к+1 + (/ - В^к) [(Ск + Вкрк)р (21)
■^А + 1 = Аг + Л'к $к (1 - Вк 5к Г1 Ль Рк+1 = Ек + А'кРк + А'к$к(1 ~ ДА-) '(О: + ^кРк )-Чк+\ ~ ~Е'к + (Як ~ С к $к XI ~ Вк $к У' Ак -ак + \ = ак ~ ~ С'кРк + (Як ~ С'к£к)(1 ~ ДА ) '(О: “ ^кРк)-
(22)
<Ч' у + М'.уРлгХм'а/ ~ Я<УМ'.У) Ядг
(Ч'дг + М'.у/>лг)(^ ~
аМ ,
-1
(23)
Р = - Ямрх) + (М'лг - ЯмМ'л-)'0.
а м
(24)
Аналогичным образом с помощью (20) вычисляются все значения ц*, к = 0, N - 1, которые используются при максимизации гамильтониана (10).
Описанная процедура, как было отмечено в начале статьи, эффективно использовалась для решения широкого класса задач оптимального управления самолетов на основе подхода, описанного в [4].
Работа выполнена при поддержке Российского фонда фундаментальных исследований.
ЛИТЕРАТУРА
1. R о s е n J. В. The gradient projection method for nonlinear programming //
I. Soc. Indust. Appl. Math. — 1960. N 1; 1961. N 4.
2. Э н e e в Т. М. О применении градиентного метода в задачах теории оптимального управления // Космические исследования. Т. II. — 1966.
Вып. 5.
3. М е л ь ц И.О. Применение методов нелинейного программирования для оптимизации динамических систем в функциональном пространстве //
ATM: - 1968. № 5.
4. Е ф и м о в О. Е. Метод второго порядка оптимизации управления нелинейных динамических систем и его применение для расчета оптимальных траекторий самолета // Ученые записки ЦАГИ. — 1991. Т. XXII, № 3.
5. Брайсон А.. X о Ю-Ши. Прикладная теория оптимального управления. — М:: Мир. — 1962.
Рукопись поступила 26/XII1994 г.