Научная статья на тему 'Точные штрафы в задаче наблюдения'

Точные штрафы в задаче наблюдения Текст научной статьи по специальности «Математика»

CC BY
92
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАБЛЮДАЕМОСТЬ / ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ / ШТРАФНЫЕ ФУНКЦИИ / НЕДИФФЕРЕНЦИРУЕМАЯ ОПТИМИЗАЦИЯ / УПРАВЛЕНИЕ / OBSERVABILITY / THE DIFFERENTIAL EQUATIONS / PENAL FUNCTIONS / NOT DIFFERENTIATED OPTIMIZATION / MANAGEMENT

Аннотация научной статьи по математике, автор научной работы — Карелин Владимир Витальевич

Проблеме учета ограничений в задачах математического программирования было уделено много внимания. Во многих случаях ее решали с помощью штрафных функций. В настоящее время идея точных штрафов хорошо разработана и широко используется. Подход, основанный на точном штрафе, наиболее интересен и изящен, но он приводит к необходимости решать негладкую задачу оптимизации, даже если исходная задача является гладкой. Однако прогресс в области численных методов недифференцируемой безусловной оптимизации, достигнутый в последние годы, дает некоторую надежду, что эти трудности будут преодолены. Ранее теория точных штрафов была применена к исследованию одного класса задач управления, в которых «управления» были просто параметрами системы дифференциальных уравнений, описывающей поведение некоторого управляемого объекта. В статье рассматривается задача наблюдения. Система дифференциальных уравнений считается ограничениями. Показано, как можно их убрать, вводя соответствующую штрафную функцию. Получающийся новый функционал существенно негладкий, тем не менее он обладает интересными дифференциальными свойствами, и современные методы недифференцируемой оптимизации позволяют решать указанные задачи численно. Библиогр. 3 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Exact penalty functions in the problem of supervision

The problem of reducing a constrained mathematical programming problem to an unconstrained one has been given a great deal of attention. In most cases such a reduction is performed with the help of so-called penalty functions. At present the theory of Penalization is well developed and widely used. The exact penalization approach is the most interesting and elegant but it generally requires solving a non-smooth problem even if the original one was smooth. However, recent developments in Non-differentiable Optimization give some hope that these difficulties will be overcome. To be able to reduce a constrained optimization problem to an unconstrained one via exact penalization it is suitable to represent the constraining set in the form of equality, where the function describing the set must satisfy some conditions on its directional derivatives (or, in general, on its generalized directional derivatives). In the present paper we show how to describe the constraints given in the form of differential equations by a (non-smooth) functional whose directional derivatives satisfy the required properties. We treat one parametric optimization problem. This problem is reduced to a non-smooth unconstrained optimization problem. It makes it possible to construct a numerical algorithm for the unconstrained optimization problem just allowing one to solve the original parametric optimization problem. Then by making use of necessary optimality conditions (for a non-smooth problem) it is shown that the conditions we obtain are equivalent to the well-known ones.

Текст научной работы на тему «Точные штрафы в задаче наблюдения»

2008 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. Сер. 10. Вып. 4

ПРИКЛАДНАЯ МАТЕМАТИКА

УДК 539.3 В. В. Карелин

ТОЧНЫЕ ШТРАФЫ В ЗАДАЧЕ НАБЛЮДЕНИЯ

Введение. Задачу нахождения состояния динамической системы в начальный момент времени называют задачей наблюдения. Фиксированный процесс в пространстве состояний, описываемый следующей системой дифференциальных уравнений:

х = I (х,г), (1)

генерирует однозначно процесс в соответствии с уравнением выхода

у(г) = Зх(г), (2)

в котором В — п-мерный вектор. Представляет интерес, единственный ли процесс х(Ь) может вызвать этот выход у(Ь). Если процессы х(Ь) и у(Ь) находятся во взаимно однозначном соответствии, то задача наблюдения разрешима.

Постановка задачи. Обозначим вектор неизвестных параметров х(0) = х0, и рассмотрим функционал

I (xq)= F (x(t,xo ))dt,

J о

где F(x(t,xo)) = (y(t) — Bx(t, хо))2 и x(t,xo) - решение уравнений (1), (2) с хо G IR".

Пусть х,хо G IR", y G IRm, t G [0,T], T > 0, f : IR" x IR ^ IR" дифференцируема

no x. Функции /, ^ непрерывны на IR" x IR. Введем множество

Q := {[z, хо] | z G C[0, T],: y(z, хо) = 0},

здесь

\iT c i1 \2 11/2

<p(z,xo)= J (z(t) — f (хо + J z(t )dr,xo,t)j dt Заметим, что p(z,xo) ^ 0 Vz,xo G P[0,T]. Если z, хо G Q , то функция

x(t) = хо + z(t )dT

Jo

удовлетворяет (1), (2) и наоборот.

Карелин Владимир Витальевич — доцент кафедры математической теории моделирования систем управления факультета прикладной математики—процессов управления Санкт-Петербургского государственного университета. Автор 60 работ. Научные направления: идентификация систем управления, недифференцируемая оптимизация. E-mail: [email protected].

© В. В. Карелин, 2008

Таким образом, задача решения системы (1), (2) для некоторого хо Є Ш.п эквивалентна нахождению г Є Р[0,Т] такого, что р(г,хо) =0.

Пусть д := [и, д], где и Є С[0, Т], д Є Ш,п. Положим

:= тах{||-у||, ||^П}, ІМІ :=

(v(t))2 dt

1/2

:= Vх?-

Пара g определяет направление (на множестве C[0, T] х IR"). Функция р в точке [z, хо] удовлетворяет p(z, хо) > 0 в направлении g. Теперь определим

<p'(z, Х0;д) = lim — [p(z + av, х0 + ад) - <p(z, ж0)].

a|0 а

Можно показать, что предел существует и конечен, т. е. верно следующее утверждение.

Лемма 1 [1]. Если p(z,x0) > 0 (т. е. [z,xo] ^ Q), то функция р дифференцируема в окрестности точки [z, х0].

При этом

p'(z,x0\ g) = ^v(t),w(t)

(df(r)

l dx

j(r )dr dt —

где

w(t)~l (^йг) '<І)Л

(3)

Так как (3) линейно в д, заключаем, что р дифференцируема около [г,хо] вместе с «градиент» ^р (на множестве С[0,Т] х Ж"). Более того, справедливо утверждение. Лемма 2. Существует а > 0 такая, что

min (^р, д) ^ —а < 0 y[z, хо] Є И.

11з11=1

Доказательство. Докажем сначала, что

Vß = 0.

(4)

(5)

В (5) «0» - нулевой элемент в пространстве С[0, Т] х Ш". Предположим, что это не так, тогда

‘■Т (опту п V дх

т. е. 1м(1) =0" Ш € [0, Т], и мы получили противоречие. Предположим теперь, что (4) неверно. Тогда существует последовательность ^к,х^] такая, что

*>—і:

)(т)dr = 0„ yt Є [0, T],

[zk,xo] Є ^, ^ßk —— 0,

где

Vßk

M f (dfk(r)X t w f1 fdfk(t)Y u^u

Wk J \ dx ) Wk(T)dT’~J — ) wk{t)dt

о

=P

д/к(г) _ д/(хк(і),х%,г) д/к(г) д/(хк(і),х%,г)

дх

дх

дхо і

дхо

хк (г) = хо + гк (т)йт,

о

(г) =

1

р(гк,хк)

2к(і) - ¡(хо +! Ык (т)йт,х'к ,г)^ .

Отметим, что

Из соотношения (6) следует, что

где

ІКІІ =1 11^ І -0, гТ ( д/к (тГ *

ч \ дх

Из выражений (8) и (9) вытекает, что ^ 0, а это противоречит (7). Теперь рассмотрим случай, когда р(г,хо) = 0. Укажем, что

р(г,хо) = гп&х г(Ь) — I(хо + г(т)в,т,хо,1),гд(1)\ А,

Ы\ = ^о \ .¡о )

и2 (г) ¿г

1/2

Если р(г,хо) = 0, то Н(Ь) = г (г) — / (х0 + /0 г(т )йт,хо,г) =0 Ш Є [0,Т]. Так как

г (г) +аи(г) — / (хо + (г(т)+аи(т ))йт,хо + ад,г) =

о

ь(г) + а

”(т)* “ ~д^4

тогда (см. (6))

/Т / О Г /і\ пі

------I и{т)(1'

+ о(а),

д/(г)

у(т)с1т-------------д <М

дхо

Используя ту же процедуру, что ив (8), (9), для (11) имеем

р (г, хо; д) = тах

11^11 = 1

йг —

(Ш,

V дхо

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

д и(г)йг, д

Из (11) и (12) следует

(7)

(8)

(9)

(10)

(11)

(12)

о

о

*

о

Лемма 3. Если р(г, хо) = 0, тогда функция р дифференцируема по направлению в т. [хо,г] и даже субдифференцируема, т. в.

где

р'(г,хо; д) = тах (С,д),

ОЄд^(г,хо)

др(г,хо) = { О = [и*,д*]\и* Є С[0,Т],д* Є Ж^и*(г) = Щ —

(д/(т)

I дх

и(т)йт, д*

[ еС[0’т]’и*и ^ ч- (13)

Таким образом, задача наблюдаемости свелась к проблеме минимизации функционала

Г Ґ

ф(г,хо)= ¥ (хо + г(т )йт )йг,

оо

(14)

подчиненного условиям р(г,х о) = 0.

Функционал ф(г,хо) дифференцируем:

ф'(г,х0;д) = Ит-

а|о а

І'Т І'і

/ ¥ (хо + (г(т)+аи(т ))йт )йг — ф(г,х о)

оо

( д¥ (х(г))

(г)\ йг

о дх

и его «градиент» (на множестве С[0,Т] х Ш,п) имеет вид

Vф(г,хо) =

д¥ (х(г))

дх

0ЭТ

(15)

Следуя работам [1-3], можно доказать такое утверждение:

Теорема. Если р липщицева на С[0, Т] х Ж.п, тогда найдется Ао ^ 0 такая, что для всех А ^ Ао множество минимумов функции ф на множестве О = {[г,хо]\ р(г,хо) = 0} совпадает с множеством минимумов функции

ф\(г, хо) = ф(г, хо) + Ар(г, хо)

на всем множестве С[0, Т] х Ш.п.

Таким образом, если [г*,х*] - точка минимума функции ф\(г,хо) (для А ^ Ао), тогда р(г*,хо) = 0 и ф содержит его минимальные значения на О около [г*,х*]. Это также означает, что функция

"(г) = хо + [ г*(т)йт

о

является решением дифференциальной системы уравнений

х(г) = I (х(г),х*о ,г), х(0) = хо,

и функционал I(хо) имеет минимальное значение в точке хд. 6

*

X

Из него следует, что существует функция V € С[0,Т] такая, что ||г>|| ^ 1, и при этом

Заменяя \у^) на v(t) в (16) и (17), получаем, что если х*(Ь) = х(Ь,хо) минимизирует (14), то существует вектор-функция v(t) € С[0,Т] такая, что

Если ¥(х) дважды непрерывно дифференцируема, тогда (18) можно переписать в «дифференциальной» форме

Заключение. Таким образом, задачу наблюдения удалось свести к задаче оптимизации без ограничений, для которой найдены следующие условия оптимальности.

Если хд € Ж.п минимизирует функционал I(хо) с системой дифференциальных уравнений (1),(2), тогда функция v(t) € С[0,Т], определенная (20) и (21), удовлетворяет (19).

Karelin V. V. Exact penalty functions in the problem of supervision.

The problem of reducing a constrained mathematical programming problem to an unconstrained one has

(16)

(17)

где

df(t) _ df(x*(t),x*0,t) df(t) _ df(x*(t),x*0,t)

dx dx ’ dxo dxo

(18)

И

(19)

(20)

(21)

Summary

been given a great deal of attention. In most cases such a reduction is performed with the help of so-called

penalty functions. At present the theory of Penalization is well developed and widely used. The exact penalization approach is the most interesting and elegant but it generally requires solving a non-smooth problem even if the original one was smooth. However, recent developments in Non-differentiable Optimization give some hope that these difficulties will be overcome. To be able to reduce a constrained optimization problem to an unconstrained one via exact penalization it is suitable to represent the constraining set in the form of equality, where the function describing the set must satisfy some conditions on its directional derivatives (or, in general, on its generalized directional derivatives). In the present paper we show how to describe the constraints — given in the form of differential equations — by a (non-smooth) functional whose directional derivatives satisfy the required properties. We treat one parametric optimization problem. This problem is reduced to a non-smooth unconstrained optimization problem. It makes it possible to construct a numerical algorithm for the unconstrained optimization problem just allowing one to solve the original parametric optimization problem. Then by making use of necessary optimality conditions (for a non-smooth problem) it is shown that the conditions we obtain are equivalent to the well-known ones.

Key words: observability, the differential equations, penal functions, not differentiated optimization, management.

Литература

1. Demyanov V. F., Facchinei F., Karelin V. V. Optimal control problems via Exact Penalty Function // J. of Global Optimiz. - 1998. - Vol. 12, N 3. - P. 215-223.

2. Di Pillo G., Grippo L. On the exactness of a class of Non-differentiable Penalty functions // J. Optim. Theory Appl. - 1988. - Vol. 57. - P. 397-408.

3. Giannessi F., Niccolucci F. Connections between nonlinear and integer programming problem // Symposia Mathematica. - New York: Acad. Press, 1976. - Vol. XIX. - P. 161-176.

Статья принята к печати 29 апреля 2008 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.