УДК 519.71
В.А. Дыхтл1, С.П. Сорокин1, Г.Н. Яковенко2 1 Институт проблем управления им. В.А. Трапезникова РАН 2 Московский физико-технический институт (государственный университет)
Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры
Для расширения сферы применимости методов теории управления, связанных с решениями неравенств и уравнения Гамильтона-Якоби, вводится новый класс функций типа Ляпунова, зависящих от канонических переменных дифференциальной системы условий экстремальности и обладающих свойствами сильной и слабой монотонности относительно решений этой системы. Предлагаются способы использования этого класса функций для решения позиционных и оптимизационных задач управления. Обсуждаются также математические модели управляемых систем, в основе которых лежат группы и алгебры Ли. Рассматривается процедура, позволяющая при помощи «пробных» воздействий на систему выявить структурные свойства.
Ключевые слова: принцип максимума, условия экстремальности, экстремали, неравенства Гамильтона-Якоби, достаточные условия оптимальности, идентификация системы, группы и алгебры Ли, алгебраическая структура.
I. Условия экстремальности в управляемых системах и задачах оптимального
управления
Рассмотрим управляемую систему
х = /(¿,х,и), и(1) Е и (1)
на произвольном отрезке времени Т = [¿0,^1] и всевозможные процессы этой системы — пары функций (х,и) Е АС(Т,КП) ■ Ь^(Т,и), удовлетворяющие (1) почти всюду на Т.
Предполагая функцию / непрерывной и достаточно гладкой, определим функцию Понтряги-
на:
Н(¿,х,р,и) = р ■ /(¿,х,и)
и сопряженную систему
p = -Hx(t,x,p,u), q = -Ht(t,x,p,u). (2)
Экстремалью системы (1) назовем любой процесс (x,u), для которого существует решение (p(t),q(t)) = 0 системы (2), обеспечивающее условия максимума функции H по u Е U:
H(t, x(t), p(t), u(t)) + q(t) = 0, t Е T,
H (t, x(t), p(t), v) + q(t) ^ 0 при (t,v) Е T ■ U. ()
В этом случае набор функций y = (x(t), u(t), p(t), q(t)) назовем биэкстремалью системы (1), а пару (p, q) — коэкстремалью. (По поводу этих понятий см. [1-4].)
Ясно, что оптимальное решение любой задачи динамической оптимизации в системе (1) (без поточечных фазовых и смешанных ограничений) следует искать среди биэкстремалей системы, удовлетворяющих дополнительно соответствующим краевым условиям. Но это уже будут биэкс-тремали задачи (соответственно экстремали и коэкстремали задачи). Отметим, что в подобной ситуации биэкстремали иногда называют каноническими экстремалями [5] и даже просто экстремалями [1, 2]. Компоненту q(t) сопряженной системы (2) при этом часто опускают, хотя в задачах с нефиксированными моментами времени её введение эффективно и почти неизбежно (хотя бы в неявной форме). Из (3) следует стандартное условие максимума функции H по u Е U, которым
можно ограничиться в задачах управления на фиксированном отрезке T, что и делается далее. В этой ситуации условия экстремальности в системе (1) принимают вид канонической системы:
x = Hp, p = -Hx (4)
и условия максимума:
u e U* (t,x,p). (5)
Здесь
U*(t,x,p) = {u e U|u e Arg maxH(t,x,p,u)}
— множество предэкстремальных управления (предстратегий). Обозначим через E множество троек функций (x,u,p), удовлетворяющих условиям (4), (5) на отрезке времени T.
Заметим, что при аналитическом исследовании конкретных задач оптимального управления с помощью принципа максимума Понтрягина (ПМП) имеют дело именно с системой (4), (5). Для дальнейшего важно иметь в виду связь системы условий экстремальности с решением уравнения Гамильтона-Якоби-Беллмана методом характеристик [6, 7] и его версиями при использовании неравенств Гамильтона-Якоби [3, 6, 8-10]. А именно, если в системе (1) рассматривается задача терминального управления со свободным правым концом, то есть при условиях
x(to) = xo, x(ti) свободно, J(u) = l(x(ti)) ^ min, (6)
то имеет место равенство (для простоты считаем, что оптимальное управление существует)
min J(u) = min{l(x(t1))|(x,u,p) e E,x(t0) = x0,p(t1) = —l(x(t1))}, U = L^(T,U). (7)
U
Его естественный аналог имеет место и для функции Беллмана семейства задач типа (1), (6) с варьируемой начальной позицией (to,xo). Однако задач оптимального синтеза мы не касаемся.
II. Монотонные потенциалы канонической системы и их приложения
Перейдем к предлагаемому обобщению методов, основанных на использовании неравенств (и уравнений) Гамильтона-Якоби. Пусть F — множество функций S(t,x,p) : T х Rn х Rn ^ R непрерывных и гладких по (x,p) при фиксированных t £ T и липшицевых по t при фиксированных (x,p) (тогда функции S суперпозиционно абсолютно непрерывны и даже липшицевы вдоль траекторий (x,p) канонической системы (4)). На таких функциях, которые условимся называть потенциалами, определим оператор r[S] = S полной производной по t в силу системы (4), то есть в краткой записи:
r[S ] = St + SxHp — SpHx. (8)
При фиксированной S £ F правая часть есть функция (t,x,p,u) и можно определить функцию (или оператор)
r*[S] = max r[S ] = max S, (9)
u€U uGU
если множество U компактно.
По аналогии с [8, 9, 11, 12] введем следующие понятия:
S сильно убывает (относительно системы (4) на множестве Q := T х Rn х Rn), если
r*[S](t,x,p) < ОнаО (10)
или
Г[5](г,ж,р,и) < ОнаО х и; (11)
Б слабо возрастает, если
Г*[5](*,ж,р) ^ ОнаО. (12)
Заметим, что Б — первый интеграл канонической системы, если Г[Б] = 0; он относится к сильно убывающим потенциалам. К ним относим и решения уравнения Г* [Б] = 0.
Поясним, что если S сильно убывает, то суперпозиция S(t, x(t), p(t)) монотонно не возрастает вдоль любого решения (x,p) системы (4) с графиком в Q. Предположим, что в системе (1) при любом выборе управления решение существует на T, а в системе (4) множество скоростей компактно и выпукло. Тогда если S слабо возрастает, то для любой точки (t*, x*, p*) € ü существует хотя бы одно правостороннее решение системы (4), начинающееся в этой точке и имеющее график в Q, вдоль которого S(t, x(t), p(t)) не убывает. Введенное сочетание свойств монотонности потенциалов можно заменить на комбинацию «сильно возрастает — слабо убывает» путем замены оператора Г* на r*[S] = minueu r[S] и смены знака неравенств на противоположный. Ясно, что эти формальные изменения соответствуют смене знака функции S € F.
В частном случае — для функций, не зависящих от p, — потенциалы переходят в функции типа Ляпунова управляемой системы (1), если их трактовать достаточно широко, как в канонической теории оптимальности Гамильтона-Якоби [3, 9-12]. При этом неравенства (10), (12) трансформируются в стандартные неравенства Гамильтона-Якоби:
St+H(t-x-S-) {; о на ü;
где
%(t,x,p) = max H (t,x,P;U)
u€U
— гамильтониан. (В этом контексте отметим, что мы называем систему (4) канонической, а не гамильтоновой, в которую она переходит при замене функции Понтрягина H на H, то есть при выборе управления из (5). Однако это требует нетипичной гладкости гамильтониана.)
Как и в случае стандартных потенциалов (не зависящих от p) сильно монотонные функции позволяют получать внешние оценки множества соединимых точек (множества достижимости) канонической системы и оценки снизу целевого функционала задачи оптимизации, следовательно, с их помощью можно получать достаточные условия оптимальности. Напротив, слабо монотонные потенциалы дают внутренние аппроксимации множества соединимых точек системы (4) и оценки сверху целевого функционала. Таким образом, они приспособлены для получения необходимых условий оптимальности, а также методов улучшения неоптимального управления по схеме работ [9, 11, 13], см. также ниже п. 4.
Ограничимся здесь одним из результатов.
Обозначим через R[a,b] множество точек, соединимых решениями системы (4) на отрезке [a,b] С T, то есть
R[a,b] = {q ■= (x(a), p(a); x(b), p(b))l(x(-), p(-)) — решение (4) на [a,b]}.
Теорема 1. Пусть T С F — произвольное множество сильно убывающих потенциалов. Тогда имеет место включение
R[a,b] С E[a,b](T);
где множество E^a,b](T) состоит из векторов q = (xa,pa; xb,pb), удовлетворяющих системе неравенств
S(b,xb,pb) — S(a,xa,pa) < о V S € T. (13 )
Вспоминая равенство (7), сформируем следующую конечномерную задачу оптимизации, вспомогательную (терминальную) по отношению к задаче управления (1), (6):
l(x) ^ min; q € Et(T), (14)
где множество Et(T) соответствует [a,b] = T и учету условия x(to) = xo.
Следствие 1. а) minu^u J(u) ^ minqeET(S) l(x) =■ ß(T);
б) если для управления U € U и соответствующей траектории x найдется такое множество T С F сильно убывающих потенциалов, что l(x(ti)) = ß(T), то U — оптимальное управление.
С учетом предваряющих пояснений эти утверждения почти очевидны. Отметим лишь, что при формировании множества Et(T) условия трансверсальности для котраекторий не обязательно считать выполненными (соответствующие примеры имеются в [3]).
Следствие 1 распространяет достаточные условия оптимальности с множеством сильно монотонных функций типа Ляпунова на случай потенциалов и формально охватывает их. Хотя к настоящему моменту времени не накоплен достаточный опыт работы по изложенной схеме, представляется, что альтернативные варианты могут не уступать ей в эффективности. Опишем их кратко.
1) Переход к стандартным потенциалам. Если множество £ достаточно богато, то по его функционально независимым наборам из n потенциалов можно построить некоторое множество стандартных сильно монотонных потенциалов (путем ввостановления функции по заданному градиенту) и далее действовать по традиционной схеме. В этом случае оценочное множество (13) и ограничения терминальной задачи (14) будут подмножествами фазового пространства, что более естественно. Например, для управляемых L-систем, обладающих набором из n первых интегралов канонической системы (4), линейных относительно импульса p, этот путь может оказаться особенно эффектным, и не только для анализа ПМП, приведенного в [14].
2) Множество стандратных потенциалов, построенных по варианту 1), можно использовать в модифицированных условиях оптимальности Каратеодори и Кротова [9, 10], рассматривая соответствующий обобщенный лагранжиан задачи (см. [15] и конструкцию K-функций в [16]).
Для иллюстрации рассмотрим элементарный
Пример 1. задачи оптимального управления в одномерной L-системе: x = (x — 1)u, u £ [0,1], x(0) = 0, J = x3(1). Условие ПМП таковы: H = p(x — 1)u,
p = —pu, p(1) = —3x2(1), p(x — 1)u ^ max; u £ [0,1] (15)
(то есть Hu(x,p)u ^ max; u £ [0,1]).
Во-первых, заметим, что Hu = 0, то есть S1(x,p) = p(x — 1) — первый потенциал, диктуемый теорией L-систем. Он является частным решением неравенства сильной монотонности (11):
[(x — 1)Sx — pSp]u < 0.
Но оно имеет, как легко убедиться, с учетом краевых условий еще два решения: S2(x) = x и S 3(p) = —p.
Далее, естественное использование S1 для упрощения ПМП, описанное в [14], предписывает заменить условие максимума из (15) на следующее: cu ^ max; u £ [0,1], то есть u £ signс, где константа с зависит от искомой траектории (x,p) через равенство S1 = с. Возникает необходимость перебора вариантов значений c при выполнении условий
—3x2(1)(x(1) — 1) = с, x(1) ^ 0( это дает S2).
Отсюда с ^ 0 и возможны два случая:
(а) с = 0, тогда x(1) = 0, откуда p* = 0, x* = 0, u* = 0 — особая биэкстремаль задачи;
(б) с > 0, тогда u = 1, x(t) = 1 — et — неособая экстремаль.
Поскольку задача невыпуклая, то это все, что дает ПМП. Так как оптимальное управление в задаче существует, то очевидно, что u — решение задачи. Однако интересно, что дают формальные методы без привлечения теоремы существования.
Покажем, что особое управление u* = 0 не оптимально (заметим, что все локальные условия оптимальности оказываются не эффективными в силу глубокого вырождения этой экстремали). Воспользуемся конструкцией улучшения управления из [9, 11]: так как S2 слабо (и сильно) убывает, то для любой траектории x(-)
x(1) — J(u*) = x(1) ^ 0 и, следовательно, x3(1) — J(u*) ^ 0, что и требовалось.
Установим теперь оптимальность u = 1, пользуясь достаточными условиями следствия 1 с учетом замечания 1). Потенциал S1 порождает (из равенства Sx = p = ^(x — 1)) функцию
S (t,x) = ln(1 — x)£(t),
где £(t) > 0 — произвольная гладкая функция. Для нее (см. (9))
r*[S] = max S = Щ + 1 = 0,
[ ] «eux £(t) ,
если выбрать £(t) = £(0)e-t, £(0) > 0. При этой £ S(t,x) удволетворяет уравнению Гамиль-тона-Якоби и, следовательно, сильно убывает. Положив теперь в следствии 1 £ = {S} — одноэлементное множество, убеждаемся, что xql) является решением терминальной задачи (14). Это и означает оптимальность управления u.
III. Системы с алгебраической структурой Определение 1 [14, 17]. Система с управлением u1 (в (1) f (t,x,u) = p(x)u)
n
x? = ^ p? (x)u1 (t), k = Щ (16)
1=1
kf
называется L-системой, если для функций р? (x) выполнены условия
det
Р? (x) = 0, (17)
n
[Xi,Xj] = £ C?X?, C? = const, i, j, k = 1,n, (18)
?=1
где обозначено
n я _
X1 = £ ^, l ^ (19)
dx?'
k=1
[Xj,Xj] — коммутатор операторов (19):
д
[ВД-] = £{X(х) - ^(х)}^. (20)
к=1
Пример 2. Уравнение Ньютона ш« = и(£) — в-2, определяющее одномерное движение управляемой точки при наличии сопротивления пропорционального квадрату скорости, погружается в ¿-систему
х \ /1 2х х2 \ / и1 \
у I = I 0 2 2х I I и2 I (21)
¿/ \ 0 0 еу / \и3/
при следующей специализации переменных:
х = ш— у = —2§в/ш, и1 = «(£), и2 = 0, и3 = —в/(ш)2. Для соответствующих системе (21) операторов (19)
XI = 1-, Х2 = 2х^ + 2^, Хз = х2^ + 2х^ + еУ #■ (22)
дх дх ду дх ду дг
выполняется условие (18) с постоянными С^ = 2, С2з = 1, С23 = 2 (здесь и далее приводятся только ненулевые структурные постоянные С-, удовлетворяющие условию г < j). Третье уравнение в (21) добавлено, чтобы матрица в (21) стала квадратной и для нее были бы справедливы условия (17), (18).
Условия (17), (18) удостоверяют, что операторы (19) могут быть приняты за базис алгебры Ли, которой соответствует просто транзитивная п-параметрическая группа:
x? = g?(x1, ..., xn, v1, ..., vn), k = 1,n, (23)
определенным образом построенная по базисным операторам (19) [14, 20]. Любая пара (и(Ь), Т}, где и(Ь) — конкретное подставленное в (15) управление, определяет преобразование пространства Кп(х): сдвиг вдоль решений х(Ь) начальных точек хо = х(0) в конечные х(Т). Показывается [19], что для каждой пары (и(Ь), Т} найдется набор параметров V1, ..., уп, определяющий при помощи (23) соответствующее паре (и(Ь), Т} преобразование сдвига вдоль решений системы. Показывается также [17, 19], что по функциям фк(х), задающим ¿-систему (15), строится система уравнений для нахождения генераторов п-параметрической группы симметрий системы (15). Опуская вычисления, приведем уравнения группы симметрий для системы (21):
х = х+т1(еу-хх] 1-т1х ,
У = У + Т2 - 21п(1 — пг),
х = х(еТ2 -Т1Т2+Т3)
г = 1-т1х ■
Каждому набору параметров п, Т2, тз соответствует замена переменных в (21), не меняющая вид правых частей, и любое решение и(Ь), х(Ь), у(Ь), г(Ь) системы (21) группа переводит в решение и(Ь), х(Ь), У(Ь), Х(Ь) (функции и(Ь), х(Ь), у(Ь), г(Ь) подставляются в правую часть уравнений группы).
IV. Классы эквивалентности для ¿-систем
Для ¿-систем справедлив следующий результат, который приведем без доказательства. Теорема 2 [14, 20]. Две Ь -системы: (15) и
¿к = Е $ (¿)и1(Ь), к = 1,п,
(24)
1=1
удовлетворяют условиям (17) — (19) с одними и теми же постоянными Ск в (18) тогда и только тогда, когда они связаны диффеоморфизмом г = г(х).
Если системы (15), (24), связанные диффеоморфизмом х о г, считать эквивалентными, то каждому классу эквивалентности соответствуют постоянные Ск:
хк = £ П=1 фк (х)и1 $ х о г
гк = £ п=1 Фк (г)и1
^ (ск}.
(25)
Соответствие — взаимно однозначно: по структурным постоянным Ск вычисляется некоторый базис Х1, ..., Хп алгебры Ли [14, 20], по операторам X^ определяется представитель (15) класса эквивалентности (25) с возможностью диффеоморфизмом перейти к другому представителю. Набор С к являет собой пример инвариантной математической модели динамической системы. По этому набору можно исследовать те свойства системы, которые сохраняются при заменах переменных: управляемость, структура оптимального управления и т.д. Алгебраическая структура, определяемая Ск, позволяет строить в соответствующем классе эквивалентности (25) представители специального вида: линейного, билинейного, двухуровневого, блочного и т.д.
Пример 3. Линейная стационарная (автономная) управляемая система (А = 1|ан1,
В = ||ЬкУ — числовые матрицы)
х = Ах + Ви, погружается в класс Ь-систем:
х х
хеКп
10
Ах Е
иеКг
1
Ви
(26)
(27)
(Е — единичная матрица) добавлением к (26) верхнего уравнения. Проверка для (27) условия (18) приводит к постоянным в (18): С0к = —ак, 1,к = 1,п (нумерация столбцов в (27) и соответствующих операторов в (19) начинается с номера 0). Постоянные С10к = —ак, 1,к = 1,п, определяют инвариантную модель { Ск } соответствующую классу эквивалентности (25), которому
принадлежит система (27), то есть в соответствии с теоремой 2 любая, в том числе и нелинейная, неособенная замена переменных в (27) приведет к ¿-системе (24) с таким же, как у (27), набором постоянных С0к = — ак, = 1,п, в (18). Теорема 2 дает ответ и на вопрос: возможно ли конкретную нелинейную систему заменой переменных привести к линейному виду? Возможна тогда и только тогда, когда система является системой с постоянными С^ = —ак, = 1,п.
У следующих трех механических систем соответствующие ¿-системы принадлежат одному и тому же классу эквивалентности (25), то есть постоянные Ск в (3) у систем совпадают.
Пример 4. Одномерному линейному осциллятору
x + x = 0
(28)
соответствует L-система (1) (x2 = x)
x1
x
2 x2
00 10 01
(29)
с постоянными Cj в (18):
C32 = 1,
C123 = —1.
(30)
Пример 5. Тело с неподвижной точкой, с осью динамической симметрии — первой главной осью инерции (B = C), с управляющим моментом М, направленным по третьей главной оси. Динамические уравнения Эйлера имеют вид
p = 0,
R— A
q = rr-A pr, r = pq + R1 M.
Переход на поверхность p = const, выбор масштабов для времени t ^ at и управления M ^ u = вМ приводят к уравнениям
q = r,
r = —q + u,
которым соответствуют такие же, как в примере 3: L-система (29) и постоянные Cj (30).
Пример 6. Точка движется в плоскости (x2, x3) под действием силы F, перпендикулярной скорости V. Анализ показывает, что при таком движении скорость V не меняется по величине. Введение переменной x1 — угла между осью x2 и направлением скорости V — и выбор масштабов для x2, x3, F приводит к уравнениям
x
2 x2
x
u
cos x1 sin x1
1 0 0
0 cos x1 — sin x1 0 sin x1 cos x1
(31)
Проверка условий (17), (18) показывает, что система (31) есть ¿-система с такими же, как в примерах 3, 4, постоянными (30).
Вследствие теоремы 2 заменой переменных можно добиться совпадения матриц (х)|| в правых частях систем (29) и (31), но то, что у систем по-разному специализированы управления иг, приводит к существенным различиям их свойств с точки зрения возможностей управления. Дополнительное требование — одинаковое расположение в пространстве Яга у двух систем множеств и допустимых управлений — приводит к понятию более сильной зквивалентности, чем было определено ранее. Этот аспект в данной работе не затрагивается.
1
2
3
V. Идентификация алгебраической структуры
Инвариантная модель { С^ } есть результат завершения следующего процесса: имеется реальная система с входными переменными — управлениями и = (и1, ..., ип) и выходными переменными х = (х1, ..., хп), системе сопоставляется математическая модель (15), специальные свойства (17)-(19) которой приводят к взаимно однозначному соответствию (25). ¿-система (15) в приведенном процессе играет промежуточную вспомогательную роль «производителя» структурных постоянных Ск, и естественно поставить вопрос о нахождении чисел С^, экспериментируя с исходной реальной системой. К ответу на вопрос приводит следующая последовательность воздействий на систему. Для нахождения постоянных С?в с фиксированными нижними индексами а и в в а-й канал подается единичное воздействие: и1 = 5а. За малое время т система из начального состояния хо переходит в состояние XI. Затем единичное воздействие подается только в в-й канал: и1 = 5р, за то же время т происходит переход XI ^ Х2. В течение того же времени т подается вход и1 = —5а, и затем то же время т — вход и1 = —5р. Состояние системы возвращается в окрестность начального:
Х0 ^ Х1 ^ х2 ^ х3 ^ х4 & х0,
но с рассогласованием. На последнем шаге подбирается такой постоянный вход и, чтобы система за время т = т2 осуществила переход х0 ^ х4 за один шаг. Структурные постоянные равны
Сга1з = иг. (32)
Описанная процедура повторяется для всех пар индексов а, в. К результату (32) приводят прямые вычисления, основанные на системе (15). Представим начальный и конечный этапы:
х1 = хк + тфка(хо) + 2т2 £П=1 ^а(хо)+ о(т2),
. (33)
хк=+т2 £п=1 (ф1«Ш - Ф1М)
= хк + т2 £П= 1 С1а„ф? (хо) + о(т2) использовано свойство (18) ¿-системы. С другой стороны:
+ о(т2) =
п
„к/
х4 = х0о + ф? (хо)и1 + о(т), 1=1
что с учетом формулы (33), условия (17) и т = т2 с точностью до о(т2) определяет результат (32).
Замечание 1. Формула (32) асимптотически — при т ^ 0 — точна.
Замечание 2. Приведенная процедура носит инвариантный характер: в каких бы переменных х не измерялся выход, результат (32) один и тот же.
Замечание 3. Результат (32) не зависит от начального состояния хо, в окрестности которого проводится процедура.
Замечание 4. Пусть система имеет вид (15), выполняется условие (17): ёе! \\ф?(х)|| = 0, но не выполняется условие (18), то есть (15) не ¿-система. Определим постоянные С^ так, чтобы в равенстве (33) совпали коэффициенты при т2, а именно:
С* ^ ^ I ,п1 дфв Ф дФа \ фг
' ' х=хо
(34)
где \\фк(х) \\ = \\фк(х) \\ 1. Описанная процедура, примененная не к ¿-системе (15), приводит к постоянным, совпадающим с (34). Проверка показывает, что постоянные С^, определенные формулой (34), удовлетворяют условиям, которым должны удовлетворять структурные постоянные алгебры Ли [20]: антисимметрия по нижним индексам и тождество Якоби. Эта алгебра инвариантно аппроксимирует исходную систему в окрестности выбранного начального положения хо.
Работа выполнена при финансовой поддержке СО РАН (интеграционный проект СО РАН-УрО РАН № 85), РФФИ (гранты 11-01-00672-а, 10-01-00228) и АВЦП Развитие научного потенциала высшей школы 2009-2010 гг. (проект 2.1. 1/3604).
VI. Заключение
С целью расширения сферы применимости методов теории управления, связанных с решениями неравенств и уравнения Гамильтона-Якоби, введен новый класс функций типа Ляпунова, зависящих от канонических переменных дифференциальной системы условий экстремальности, и обладающих свойствами сильной и слабой монотонности относительно решений этой системы. Предлагаются способы использования этого класса функций для решения позиционных и оптимизационных задач управления. Обсуждена также возможность выявления структурных постоянных алгебры Ли, моделирующей управляемый процесс.
Литература
1. Афанасьев А.П., Дикусар В.В., Милютин А.А., Чуканов С.А. Необходимое условие в оптимальном управлении. — М.: Наука, 1990. — 319 с.
2. Milyutin A.A., Osmolovskii N.P. Calculus of variations and optimal control // American Math. Society, Providence. Rhode, Island. 1998. — 372 p.
3. Дыхта В.А. Неравенство Ляпунова-Кротова и достаточные условия в оптимальном управлении // Итоги науки и техники. Совр. математика и ее приложения. — 2006. — Т. 110. — С. 76-108.
4. Антипина Н.В., Дыхта В.А. Линейные функции Ляпунова-Кротова и достаточные условия оптимальности в форме принципа максимума // Изв. вузов. Математика. — 2002. — № 12. — С. 11-21.
5. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. — М.: Наука, 1979. — 429 с.
6. Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. — Москва-Ижевск: Институт компьютерных исследований, 2003. — 336 с.
7. Bardi M., Capuzzo-Dolcetta I. Optimal Control and Viscosity Solutions of Hamilton-Jacobi-Bellman Equations. — Boston: Birkhauser, 1997. — 570 p.
8. Clarke F.H., Ledyaev Yu. S., Stern R.J., Wolenski P.R. Nonsmooth Analysis and Control Theory. — New York: Springer-Verlag, 1998. — (Grad. Texts in Math.; V. 178).
9. Дыхта В.А. Неравенства Гамильтона-Якоби в оптимальном управлении: гладкая двойственность и улучшение // Вестн. Тамбов. ун-та. Сер. Естественные и технические науки. — 2010. — Т. 15, вып. 1. — С. 405-426.
10. Dykhta V., Samsonyuk O. Some applications of Hamilton-Jacobi inequalities for classical and impulsive optimal control problems // European Journal of Control. — 2011. — V. 17, N 1. — P. 55-69.
11. Дыхта В.А. Некоторые приложения неравенств Гамильтона-Якоби в оптимальном управлении // Изв. ИГУ. Математика. — 2009. — Т. 2. — С. 15-28.
12. Дыхта В.А., Сорокин С.П. Позиционные решения неравенств Гамильтона-Якоби в задачах управления дискретно-непрерывными системами // Автоматика и телемеханика. — 2011. — № 6. — С. 48-63.
13. Аргучинцев А.В., Дыхта В.А., Срочко В.А. Оптимальное управление: нелокальные условия, вычислительные методы и вариационный принцип максимума // Изв. вузов. Математика. — 2009. — № 1. — С. 3-43.
14. Яковенко Г.Н. Теория управления регулярными системами. — М.: БИНОМ. Лаборатория знаний, 2008. — 264 c.
15. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. — М.: Наука, 1973. — 448 c.
16. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. — М.: Наука, 1974. — 479 c.
17. Яковенко Г.Н. Симметрии по состоянию в системах с управлением // Прикладная механика и математика: межвед. сб. науч. трудов. — М.: МФТИ, 1992. — С. 155-178.
18. Яковенко Г.Н. Математическое моделирование эволюционных процессов алгебрами Ли // Труды Международной конференции «Математика. Экономика. Образование. Ряды Фурье и их приложения». Т. 10, вып. 1/ под ред. Б.И. Голубова, И.С. Гудович, И.Я. Новикова. — Воронеж: Воронежский государственный университет, 2002. — С. 101-107.
19. Яковенко Г.Н. Дифференциальные уравнения с фундаментальными решениями: Софус Ли и другие. — М.: Физматкнига, 2006. — 112 с.
20. Овсянников Л.В. Групповой анализ дифференциальных уравнений. — М.: Наука, 1978. — 400 с.
Поступила в редакцию 24.05.2011.