Научная статья на тему 'Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры'

Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры Текст научной статьи по специальности «Математика»

CC BY
59
12
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Дыхта В. А., Сорокин С. П., Яковенко Г. Н.

Для расширения сферы применимости методов теории управления, связанных с решениями неравенств и уравнения Гамильтона-Якоби, вводится новый класс функций типа Ляпунова, зависящих от канонических переменных дифференциальной системы условий экстремальности и обладающих свойствами сильной и слабой монотонности относительно решений этой системы. Предлагаются способы использования этого класса функций для решения позиционных и оптимизационных задач управления. Обсуждаются также математические модели управляемых систем, в основе которых лежат группы и алгебры Ли. Рассматривается процедура, позволяющая при помощи «пробных» воздействий на систему выявить структурные свойства.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры»

УДК 519.71

В.А. Дыхтл1, С.П. Сорокин1, Г.Н. Яковенко2 1 Институт проблем управления им. В.А. Трапезникова РАН 2 Московский физико-технический институт (государственный университет)

Управляемые системы: условия экстремальности, оптимальности и идентификация алгебраической структуры

Для расширения сферы применимости методов теории управления, связанных с решениями неравенств и уравнения Гамильтона-Якоби, вводится новый класс функций типа Ляпунова, зависящих от канонических переменных дифференциальной системы условий экстремальности и обладающих свойствами сильной и слабой монотонности относительно решений этой системы. Предлагаются способы использования этого класса функций для решения позиционных и оптимизационных задач управления. Обсуждаются также математические модели управляемых систем, в основе которых лежат группы и алгебры Ли. Рассматривается процедура, позволяющая при помощи «пробных» воздействий на систему выявить структурные свойства.

Ключевые слова: принцип максимума, условия экстремальности, экстремали, неравенства Гамильтона-Якоби, достаточные условия оптимальности, идентификация системы, группы и алгебры Ли, алгебраическая структура.

I. Условия экстремальности в управляемых системах и задачах оптимального

управления

Рассмотрим управляемую систему

х = /(¿,х,и), и(1) Е и (1)

на произвольном отрезке времени Т = [¿0,^1] и всевозможные процессы этой системы — пары функций (х,и) Е АС(Т,КП) ■ Ь^(Т,и), удовлетворяющие (1) почти всюду на Т.

Предполагая функцию / непрерывной и достаточно гладкой, определим функцию Понтряги-

на:

Н(¿,х,р,и) = р ■ /(¿,х,и)

и сопряженную систему

p = -Hx(t,x,p,u), q = -Ht(t,x,p,u). (2)

Экстремалью системы (1) назовем любой процесс (x,u), для которого существует решение (p(t),q(t)) = 0 системы (2), обеспечивающее условия максимума функции H по u Е U:

H(t, x(t), p(t), u(t)) + q(t) = 0, t Е T,

H (t, x(t), p(t), v) + q(t) ^ 0 при (t,v) Е T ■ U. ()

В этом случае набор функций y = (x(t), u(t), p(t), q(t)) назовем биэкстремалью системы (1), а пару (p, q) — коэкстремалью. (По поводу этих понятий см. [1-4].)

Ясно, что оптимальное решение любой задачи динамической оптимизации в системе (1) (без поточечных фазовых и смешанных ограничений) следует искать среди биэкстремалей системы, удовлетворяющих дополнительно соответствующим краевым условиям. Но это уже будут биэкс-тремали задачи (соответственно экстремали и коэкстремали задачи). Отметим, что в подобной ситуации биэкстремали иногда называют каноническими экстремалями [5] и даже просто экстремалями [1, 2]. Компоненту q(t) сопряженной системы (2) при этом часто опускают, хотя в задачах с нефиксированными моментами времени её введение эффективно и почти неизбежно (хотя бы в неявной форме). Из (3) следует стандартное условие максимума функции H по u Е U, которым

можно ограничиться в задачах управления на фиксированном отрезке T, что и делается далее. В этой ситуации условия экстремальности в системе (1) принимают вид канонической системы:

x = Hp, p = -Hx (4)

и условия максимума:

u e U* (t,x,p). (5)

Здесь

U*(t,x,p) = {u e U|u e Arg maxH(t,x,p,u)}

— множество предэкстремальных управления (предстратегий). Обозначим через E множество троек функций (x,u,p), удовлетворяющих условиям (4), (5) на отрезке времени T.

Заметим, что при аналитическом исследовании конкретных задач оптимального управления с помощью принципа максимума Понтрягина (ПМП) имеют дело именно с системой (4), (5). Для дальнейшего важно иметь в виду связь системы условий экстремальности с решением уравнения Гамильтона-Якоби-Беллмана методом характеристик [6, 7] и его версиями при использовании неравенств Гамильтона-Якоби [3, 6, 8-10]. А именно, если в системе (1) рассматривается задача терминального управления со свободным правым концом, то есть при условиях

x(to) = xo, x(ti) свободно, J(u) = l(x(ti)) ^ min, (6)

то имеет место равенство (для простоты считаем, что оптимальное управление существует)

min J(u) = min{l(x(t1))|(x,u,p) e E,x(t0) = x0,p(t1) = —l(x(t1))}, U = L^(T,U). (7)

U

Его естественный аналог имеет место и для функции Беллмана семейства задач типа (1), (6) с варьируемой начальной позицией (to,xo). Однако задач оптимального синтеза мы не касаемся.

II. Монотонные потенциалы канонической системы и их приложения

Перейдем к предлагаемому обобщению методов, основанных на использовании неравенств (и уравнений) Гамильтона-Якоби. Пусть F — множество функций S(t,x,p) : T х Rn х Rn ^ R непрерывных и гладких по (x,p) при фиксированных t £ T и липшицевых по t при фиксированных (x,p) (тогда функции S суперпозиционно абсолютно непрерывны и даже липшицевы вдоль траекторий (x,p) канонической системы (4)). На таких функциях, которые условимся называть потенциалами, определим оператор r[S] = S полной производной по t в силу системы (4), то есть в краткой записи:

r[S ] = St + SxHp — SpHx. (8)

При фиксированной S £ F правая часть есть функция (t,x,p,u) и можно определить функцию (или оператор)

r*[S] = max r[S ] = max S, (9)

u€U uGU

если множество U компактно.

По аналогии с [8, 9, 11, 12] введем следующие понятия:

S сильно убывает (относительно системы (4) на множестве Q := T х Rn х Rn), если

r*[S](t,x,p) < ОнаО (10)

или

Г[5](г,ж,р,и) < ОнаО х и; (11)

Б слабо возрастает, если

Г*[5](*,ж,р) ^ ОнаО. (12)

Заметим, что Б — первый интеграл канонической системы, если Г[Б] = 0; он относится к сильно убывающим потенциалам. К ним относим и решения уравнения Г* [Б] = 0.

Поясним, что если S сильно убывает, то суперпозиция S(t, x(t), p(t)) монотонно не возрастает вдоль любого решения (x,p) системы (4) с графиком в Q. Предположим, что в системе (1) при любом выборе управления решение существует на T, а в системе (4) множество скоростей компактно и выпукло. Тогда если S слабо возрастает, то для любой точки (t*, x*, p*) € ü существует хотя бы одно правостороннее решение системы (4), начинающееся в этой точке и имеющее график в Q, вдоль которого S(t, x(t), p(t)) не убывает. Введенное сочетание свойств монотонности потенциалов можно заменить на комбинацию «сильно возрастает — слабо убывает» путем замены оператора Г* на r*[S] = minueu r[S] и смены знака неравенств на противоположный. Ясно, что эти формальные изменения соответствуют смене знака функции S € F.

В частном случае — для функций, не зависящих от p, — потенциалы переходят в функции типа Ляпунова управляемой системы (1), если их трактовать достаточно широко, как в канонической теории оптимальности Гамильтона-Якоби [3, 9-12]. При этом неравенства (10), (12) трансформируются в стандартные неравенства Гамильтона-Якоби:

St+H(t-x-S-) {; о на ü;

где

%(t,x,p) = max H (t,x,P;U)

u€U

— гамильтониан. (В этом контексте отметим, что мы называем систему (4) канонической, а не гамильтоновой, в которую она переходит при замене функции Понтрягина H на H, то есть при выборе управления из (5). Однако это требует нетипичной гладкости гамильтониана.)

Как и в случае стандартных потенциалов (не зависящих от p) сильно монотонные функции позволяют получать внешние оценки множества соединимых точек (множества достижимости) канонической системы и оценки снизу целевого функционала задачи оптимизации, следовательно, с их помощью можно получать достаточные условия оптимальности. Напротив, слабо монотонные потенциалы дают внутренние аппроксимации множества соединимых точек системы (4) и оценки сверху целевого функционала. Таким образом, они приспособлены для получения необходимых условий оптимальности, а также методов улучшения неоптимального управления по схеме работ [9, 11, 13], см. также ниже п. 4.

Ограничимся здесь одним из результатов.

Обозначим через R[a,b] множество точек, соединимых решениями системы (4) на отрезке [a,b] С T, то есть

R[a,b] = {q ■= (x(a), p(a); x(b), p(b))l(x(-), p(-)) — решение (4) на [a,b]}.

Теорема 1. Пусть T С F — произвольное множество сильно убывающих потенциалов. Тогда имеет место включение

R[a,b] С E[a,b](T);

где множество E^a,b](T) состоит из векторов q = (xa,pa; xb,pb), удовлетворяющих системе неравенств

S(b,xb,pb) — S(a,xa,pa) < о V S € T. (13 )

Вспоминая равенство (7), сформируем следующую конечномерную задачу оптимизации, вспомогательную (терминальную) по отношению к задаче управления (1), (6):

l(x) ^ min; q € Et(T), (14)

где множество Et(T) соответствует [a,b] = T и учету условия x(to) = xo.

Следствие 1. а) minu^u J(u) ^ minqeET(S) l(x) =■ ß(T);

б) если для управления U € U и соответствующей траектории x найдется такое множество T С F сильно убывающих потенциалов, что l(x(ti)) = ß(T), то U — оптимальное управление.

С учетом предваряющих пояснений эти утверждения почти очевидны. Отметим лишь, что при формировании множества Et(T) условия трансверсальности для котраекторий не обязательно считать выполненными (соответствующие примеры имеются в [3]).

Следствие 1 распространяет достаточные условия оптимальности с множеством сильно монотонных функций типа Ляпунова на случай потенциалов и формально охватывает их. Хотя к настоящему моменту времени не накоплен достаточный опыт работы по изложенной схеме, представляется, что альтернативные варианты могут не уступать ей в эффективности. Опишем их кратко.

1) Переход к стандартным потенциалам. Если множество £ достаточно богато, то по его функционально независимым наборам из n потенциалов можно построить некоторое множество стандартных сильно монотонных потенциалов (путем ввостановления функции по заданному градиенту) и далее действовать по традиционной схеме. В этом случае оценочное множество (13) и ограничения терминальной задачи (14) будут подмножествами фазового пространства, что более естественно. Например, для управляемых L-систем, обладающих набором из n первых интегралов канонической системы (4), линейных относительно импульса p, этот путь может оказаться особенно эффектным, и не только для анализа ПМП, приведенного в [14].

2) Множество стандратных потенциалов, построенных по варианту 1), можно использовать в модифицированных условиях оптимальности Каратеодори и Кротова [9, 10], рассматривая соответствующий обобщенный лагранжиан задачи (см. [15] и конструкцию K-функций в [16]).

Для иллюстрации рассмотрим элементарный

Пример 1. задачи оптимального управления в одномерной L-системе: x = (x — 1)u, u £ [0,1], x(0) = 0, J = x3(1). Условие ПМП таковы: H = p(x — 1)u,

p = —pu, p(1) = —3x2(1), p(x — 1)u ^ max; u £ [0,1] (15)

(то есть Hu(x,p)u ^ max; u £ [0,1]).

Во-первых, заметим, что Hu = 0, то есть S1(x,p) = p(x — 1) — первый потенциал, диктуемый теорией L-систем. Он является частным решением неравенства сильной монотонности (11):

[(x — 1)Sx — pSp]u < 0.

Но оно имеет, как легко убедиться, с учетом краевых условий еще два решения: S2(x) = x и S 3(p) = —p.

Далее, естественное использование S1 для упрощения ПМП, описанное в [14], предписывает заменить условие максимума из (15) на следующее: cu ^ max; u £ [0,1], то есть u £ signс, где константа с зависит от искомой траектории (x,p) через равенство S1 = с. Возникает необходимость перебора вариантов значений c при выполнении условий

—3x2(1)(x(1) — 1) = с, x(1) ^ 0( это дает S2).

Отсюда с ^ 0 и возможны два случая:

(а) с = 0, тогда x(1) = 0, откуда p* = 0, x* = 0, u* = 0 — особая биэкстремаль задачи;

(б) с > 0, тогда u = 1, x(t) = 1 — et — неособая экстремаль.

Поскольку задача невыпуклая, то это все, что дает ПМП. Так как оптимальное управление в задаче существует, то очевидно, что u — решение задачи. Однако интересно, что дают формальные методы без привлечения теоремы существования.

Покажем, что особое управление u* = 0 не оптимально (заметим, что все локальные условия оптимальности оказываются не эффективными в силу глубокого вырождения этой экстремали). Воспользуемся конструкцией улучшения управления из [9, 11]: так как S2 слабо (и сильно) убывает, то для любой траектории x(-)

x(1) — J(u*) = x(1) ^ 0 и, следовательно, x3(1) — J(u*) ^ 0, что и требовалось.

Установим теперь оптимальность u = 1, пользуясь достаточными условиями следствия 1 с учетом замечания 1). Потенциал S1 порождает (из равенства Sx = p = ^(x — 1)) функцию

S (t,x) = ln(1 — x)£(t),

где £(t) > 0 — произвольная гладкая функция. Для нее (см. (9))

r*[S] = max S = Щ + 1 = 0,

[ ] «eux £(t) ,

если выбрать £(t) = £(0)e-t, £(0) > 0. При этой £ S(t,x) удволетворяет уравнению Гамиль-тона-Якоби и, следовательно, сильно убывает. Положив теперь в следствии 1 £ = {S} — одноэлементное множество, убеждаемся, что xql) является решением терминальной задачи (14). Это и означает оптимальность управления u.

III. Системы с алгебраической структурой Определение 1 [14, 17]. Система с управлением u1 (в (1) f (t,x,u) = p(x)u)

n

x? = ^ p? (x)u1 (t), k = Щ (16)

1=1

kf

называется L-системой, если для функций р? (x) выполнены условия

det

Р? (x) = 0, (17)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

n

[Xi,Xj] = £ C?X?, C? = const, i, j, k = 1,n, (18)

?=1

где обозначено

n я _

X1 = £ ^, l ^ (19)

dx?'

k=1

[Xj,Xj] — коммутатор операторов (19):

д

[ВД-] = £{X(х) - ^(х)}^. (20)

к=1

Пример 2. Уравнение Ньютона ш« = и(£) — в-2, определяющее одномерное движение управляемой точки при наличии сопротивления пропорционального квадрату скорости, погружается в ¿-систему

х \ /1 2х х2 \ / и1 \

у I = I 0 2 2х I I и2 I (21)

¿/ \ 0 0 еу / \и3/

при следующей специализации переменных:

х = ш— у = —2§в/ш, и1 = «(£), и2 = 0, и3 = —в/(ш)2. Для соответствующих системе (21) операторов (19)

XI = 1-, Х2 = 2х^ + 2^, Хз = х2^ + 2х^ + еУ #■ (22)

дх дх ду дх ду дг

выполняется условие (18) с постоянными С^ = 2, С2з = 1, С23 = 2 (здесь и далее приводятся только ненулевые структурные постоянные С-, удовлетворяющие условию г < j). Третье уравнение в (21) добавлено, чтобы матрица в (21) стала квадратной и для нее были бы справедливы условия (17), (18).

Условия (17), (18) удостоверяют, что операторы (19) могут быть приняты за базис алгебры Ли, которой соответствует просто транзитивная п-параметрическая группа:

x? = g?(x1, ..., xn, v1, ..., vn), k = 1,n, (23)

определенным образом построенная по базисным операторам (19) [14, 20]. Любая пара (и(Ь), Т}, где и(Ь) — конкретное подставленное в (15) управление, определяет преобразование пространства Кп(х): сдвиг вдоль решений х(Ь) начальных точек хо = х(0) в конечные х(Т). Показывается [19], что для каждой пары (и(Ь), Т} найдется набор параметров V1, ..., уп, определяющий при помощи (23) соответствующее паре (и(Ь), Т} преобразование сдвига вдоль решений системы. Показывается также [17, 19], что по функциям фк(х), задающим ¿-систему (15), строится система уравнений для нахождения генераторов п-параметрической группы симметрий системы (15). Опуская вычисления, приведем уравнения группы симметрий для системы (21):

х = х+т1(еу-хх] 1-т1х ,

У = У + Т2 - 21п(1 — пг),

х = х(еТ2 -Т1Т2+Т3)

г = 1-т1х ■

Каждому набору параметров п, Т2, тз соответствует замена переменных в (21), не меняющая вид правых частей, и любое решение и(Ь), х(Ь), у(Ь), г(Ь) системы (21) группа переводит в решение и(Ь), х(Ь), У(Ь), Х(Ь) (функции и(Ь), х(Ь), у(Ь), г(Ь) подставляются в правую часть уравнений группы).

IV. Классы эквивалентности для ¿-систем

Для ¿-систем справедлив следующий результат, который приведем без доказательства. Теорема 2 [14, 20]. Две Ь -системы: (15) и

¿к = Е $ (¿)и1(Ь), к = 1,п,

(24)

1=1

удовлетворяют условиям (17) — (19) с одними и теми же постоянными Ск в (18) тогда и только тогда, когда они связаны диффеоморфизмом г = г(х).

Если системы (15), (24), связанные диффеоморфизмом х о г, считать эквивалентными, то каждому классу эквивалентности соответствуют постоянные Ск:

хк = £ П=1 фк (х)и1 $ х о г

гк = £ п=1 Фк (г)и1

^ (ск}.

(25)

Соответствие — взаимно однозначно: по структурным постоянным Ск вычисляется некоторый базис Х1, ..., Хп алгебры Ли [14, 20], по операторам X^ определяется представитель (15) класса эквивалентности (25) с возможностью диффеоморфизмом перейти к другому представителю. Набор С к являет собой пример инвариантной математической модели динамической системы. По этому набору можно исследовать те свойства системы, которые сохраняются при заменах переменных: управляемость, структура оптимального управления и т.д. Алгебраическая структура, определяемая Ск, позволяет строить в соответствующем классе эквивалентности (25) представители специального вида: линейного, билинейного, двухуровневого, блочного и т.д.

Пример 3. Линейная стационарная (автономная) управляемая система (А = 1|ан1,

В = ||ЬкУ — числовые матрицы)

х = Ах + Ви, погружается в класс Ь-систем:

х х

хеКп

10

Ах Е

иеКг

1

Ви

(26)

(27)

(Е — единичная матрица) добавлением к (26) верхнего уравнения. Проверка для (27) условия (18) приводит к постоянным в (18): С0к = —ак, 1,к = 1,п (нумерация столбцов в (27) и соответствующих операторов в (19) начинается с номера 0). Постоянные С10к = —ак, 1,к = 1,п, определяют инвариантную модель { Ск } соответствующую классу эквивалентности (25), которому

принадлежит система (27), то есть в соответствии с теоремой 2 любая, в том числе и нелинейная, неособенная замена переменных в (27) приведет к ¿-системе (24) с таким же, как у (27), набором постоянных С0к = — ак, = 1,п, в (18). Теорема 2 дает ответ и на вопрос: возможно ли конкретную нелинейную систему заменой переменных привести к линейному виду? Возможна тогда и только тогда, когда система является системой с постоянными С^ = —ак, = 1,п.

У следующих трех механических систем соответствующие ¿-системы принадлежат одному и тому же классу эквивалентности (25), то есть постоянные Ск в (3) у систем совпадают.

Пример 4. Одномерному линейному осциллятору

x + x = 0

(28)

соответствует L-система (1) (x2 = x)

x1

x

2 x2

00 10 01

(29)

с постоянными Cj в (18):

C32 = 1,

C123 = —1.

(30)

Пример 5. Тело с неподвижной точкой, с осью динамической симметрии — первой главной осью инерции (B = C), с управляющим моментом М, направленным по третьей главной оси. Динамические уравнения Эйлера имеют вид

p = 0,

R— A

q = rr-A pr, r = pq + R1 M.

Переход на поверхность p = const, выбор масштабов для времени t ^ at и управления M ^ u = вМ приводят к уравнениям

q = r,

r = —q + u,

которым соответствуют такие же, как в примере 3: L-система (29) и постоянные Cj (30).

Пример 6. Точка движется в плоскости (x2, x3) под действием силы F, перпендикулярной скорости V. Анализ показывает, что при таком движении скорость V не меняется по величине. Введение переменной x1 — угла между осью x2 и направлением скорости V — и выбор масштабов для x2, x3, F приводит к уравнениям

x

2 x2

x

u

cos x1 sin x1

1 0 0

0 cos x1 — sin x1 0 sin x1 cos x1

(31)

Проверка условий (17), (18) показывает, что система (31) есть ¿-система с такими же, как в примерах 3, 4, постоянными (30).

Вследствие теоремы 2 заменой переменных можно добиться совпадения матриц (х)|| в правых частях систем (29) и (31), но то, что у систем по-разному специализированы управления иг, приводит к существенным различиям их свойств с точки зрения возможностей управления. Дополнительное требование — одинаковое расположение в пространстве Яга у двух систем множеств и допустимых управлений — приводит к понятию более сильной зквивалентности, чем было определено ранее. Этот аспект в данной работе не затрагивается.

1

2

3

V. Идентификация алгебраической структуры

Инвариантная модель { С^ } есть результат завершения следующего процесса: имеется реальная система с входными переменными — управлениями и = (и1, ..., ип) и выходными переменными х = (х1, ..., хп), системе сопоставляется математическая модель (15), специальные свойства (17)-(19) которой приводят к взаимно однозначному соответствию (25). ¿-система (15) в приведенном процессе играет промежуточную вспомогательную роль «производителя» структурных постоянных Ск, и естественно поставить вопрос о нахождении чисел С^, экспериментируя с исходной реальной системой. К ответу на вопрос приводит следующая последовательность воздействий на систему. Для нахождения постоянных С?в с фиксированными нижними индексами а и в в а-й канал подается единичное воздействие: и1 = 5а. За малое время т система из начального состояния хо переходит в состояние XI. Затем единичное воздействие подается только в в-й канал: и1 = 5р, за то же время т происходит переход XI ^ Х2. В течение того же времени т подается вход и1 = —5а, и затем то же время т — вход и1 = —5р. Состояние системы возвращается в окрестность начального:

Х0 ^ Х1 ^ х2 ^ х3 ^ х4 & х0,

но с рассогласованием. На последнем шаге подбирается такой постоянный вход и, чтобы система за время т = т2 осуществила переход х0 ^ х4 за один шаг. Структурные постоянные равны

Сга1з = иг. (32)

Описанная процедура повторяется для всех пар индексов а, в. К результату (32) приводят прямые вычисления, основанные на системе (15). Представим начальный и конечный этапы:

х1 = хк + тфка(хо) + 2т2 £П=1 ^а(хо)+ о(т2),

. (33)

хк=+т2 £п=1 (ф1«Ш - Ф1М)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= хк + т2 £П= 1 С1а„ф? (хо) + о(т2) использовано свойство (18) ¿-системы. С другой стороны:

+ о(т2) =

п

„к/

х4 = х0о + ф? (хо)и1 + о(т), 1=1

что с учетом формулы (33), условия (17) и т = т2 с точностью до о(т2) определяет результат (32).

Замечание 1. Формула (32) асимптотически — при т ^ 0 — точна.

Замечание 2. Приведенная процедура носит инвариантный характер: в каких бы переменных х не измерялся выход, результат (32) один и тот же.

Замечание 3. Результат (32) не зависит от начального состояния хо, в окрестности которого проводится процедура.

Замечание 4. Пусть система имеет вид (15), выполняется условие (17): ёе! \\ф?(х)|| = 0, но не выполняется условие (18), то есть (15) не ¿-система. Определим постоянные С^ так, чтобы в равенстве (33) совпали коэффициенты при т2, а именно:

С* ^ ^ I ,п1 дфв Ф дФа \ фг

' ' х=хо

(34)

где \\фк(х) \\ = \\фк(х) \\ 1. Описанная процедура, примененная не к ¿-системе (15), приводит к постоянным, совпадающим с (34). Проверка показывает, что постоянные С^, определенные формулой (34), удовлетворяют условиям, которым должны удовлетворять структурные постоянные алгебры Ли [20]: антисимметрия по нижним индексам и тождество Якоби. Эта алгебра инвариантно аппроксимирует исходную систему в окрестности выбранного начального положения хо.

Работа выполнена при финансовой поддержке СО РАН (интеграционный проект СО РАН-УрО РАН № 85), РФФИ (гранты 11-01-00672-а, 10-01-00228) и АВЦП Развитие научного потенциала высшей школы 2009-2010 гг. (проект 2.1. 1/3604).

VI. Заключение

С целью расширения сферы применимости методов теории управления, связанных с решениями неравенств и уравнения Гамильтона-Якоби, введен новый класс функций типа Ляпунова, зависящих от канонических переменных дифференциальной системы условий экстремальности, и обладающих свойствами сильной и слабой монотонности относительно решений этой системы. Предлагаются способы использования этого класса функций для решения позиционных и оптимизационных задач управления. Обсуждена также возможность выявления структурных постоянных алгебры Ли, моделирующей управляемый процесс.

Литература

1. Афанасьев А.П., Дикусар В.В., Милютин А.А., Чуканов С.А. Необходимое условие в оптимальном управлении. — М.: Наука, 1990. — 319 с.

2. Milyutin A.A., Osmolovskii N.P. Calculus of variations and optimal control // American Math. Society, Providence. Rhode, Island. 1998. — 372 p.

3. Дыхта В.А. Неравенство Ляпунова-Кротова и достаточные условия в оптимальном управлении // Итоги науки и техники. Совр. математика и ее приложения. — 2006. — Т. 110. — С. 76-108.

4. Антипина Н.В., Дыхта В.А. Линейные функции Ляпунова-Кротова и достаточные условия оптимальности в форме принципа максимума // Изв. вузов. Математика. — 2002. — № 12. — С. 11-21.

5. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. — М.: Наука, 1979. — 429 с.

6. Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. — Москва-Ижевск: Институт компьютерных исследований, 2003. — 336 с.

7. Bardi M., Capuzzo-Dolcetta I. Optimal Control and Viscosity Solutions of Hamilton-Jacobi-Bellman Equations. — Boston: Birkhauser, 1997. — 570 p.

8. Clarke F.H., Ledyaev Yu. S., Stern R.J., Wolenski P.R. Nonsmooth Analysis and Control Theory. — New York: Springer-Verlag, 1998. — (Grad. Texts in Math.; V. 178).

9. Дыхта В.А. Неравенства Гамильтона-Якоби в оптимальном управлении: гладкая двойственность и улучшение // Вестн. Тамбов. ун-та. Сер. Естественные и технические науки. — 2010. — Т. 15, вып. 1. — С. 405-426.

10. Dykhta V., Samsonyuk O. Some applications of Hamilton-Jacobi inequalities for classical and impulsive optimal control problems // European Journal of Control. — 2011. — V. 17, N 1. — P. 55-69.

11. Дыхта В.А. Некоторые приложения неравенств Гамильтона-Якоби в оптимальном управлении // Изв. ИГУ. Математика. — 2009. — Т. 2. — С. 15-28.

12. Дыхта В.А., Сорокин С.П. Позиционные решения неравенств Гамильтона-Якоби в задачах управления дискретно-непрерывными системами // Автоматика и телемеханика. — 2011. — № 6. — С. 48-63.

13. Аргучинцев А.В., Дыхта В.А., Срочко В.А. Оптимальное управление: нелокальные условия, вычислительные методы и вариационный принцип максимума // Изв. вузов. Математика. — 2009. — № 1. — С. 3-43.

14. Яковенко Г.Н. Теория управления регулярными системами. — М.: БИНОМ. Лаборатория знаний, 2008. — 264 c.

15. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. — М.: Наука, 1973. — 448 c.

16. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. — М.: Наука, 1974. — 479 c.

17. Яковенко Г.Н. Симметрии по состоянию в системах с управлением // Прикладная механика и математика: межвед. сб. науч. трудов. — М.: МФТИ, 1992. — С. 155-178.

18. Яковенко Г.Н. Математическое моделирование эволюционных процессов алгебрами Ли // Труды Международной конференции «Математика. Экономика. Образование. Ряды Фурье и их приложения». Т. 10, вып. 1/ под ред. Б.И. Голубова, И.С. Гудович, И.Я. Новикова. — Воронеж: Воронежский государственный университет, 2002. — С. 101-107.

19. Яковенко Г.Н. Дифференциальные уравнения с фундаментальными решениями: Софус Ли и другие. — М.: Физматкнига, 2006. — 112 с.

20. Овсянников Л.В. Групповой анализ дифференциальных уравнений. — М.: Наука, 1978. — 400 с.

Поступила в редакцию 24.05.2011.

i Надоели баннеры? Вы всегда можете отключить рекламу.