О квадратичной скорости сходимости схемы проектирования в задаче захвата точки семейством
выпуклых тел
Киселев Ю.Н., Хабаров Н.В. ([email protected]) МГУ им. М.В.Ломоносова, факультет ВМиК
1 Введение
В линейной теории быстродействия [1] важную роль играют множества, состоящие из начальных состояний в фазовом пространстве, для которых время быстродействия равно заданному значению [2], [3]. Эти множества называются изохронами. Время быстродействия совпадает с моментом первого захвата пзохроной начальной точки. Такой подход восходит к работам Нейштадта, Итона [7], [8], см. также [4] - [6], [9], [10], [12]. Для гладких задач быстродействия опорный вектор к изохроне в начальной точке определяет начальное значение сопряженной переменной и, на основании принципа максимума Л.С.Поптрягипа [1], описывает оптимальное управление в явной форме в терминах суперпозиции градиента опорной функции области управления и оптимальной сопряженной переменной [2], [3].
Геометрическая конструкция изохроны использовалась в [2], там же предложен и исследован метод проектирования начального состояния на изохрону в линейной задаче быстродействия в начало координат
x{t) = Ax{t) + u{t), u(t)eU, х,иеШп, ж(0) = у, x(ti) = О, ti —^ min .
Область управления U считается гладким [2] выпуклым компактом из В.". О 6 int U. В [2] рассмотрены непрерывный и дискретный варианты метода проектирования на изохрону. Для дискретного варианта схемы проектирования обоснована квадратичная скорость сходимости [2]. В [4] рассмотрен метод потенциалов решения линейной задачи быстродействия, для которого доказана квадратичная сходимость. В данной статье исследуется метод проектирования в задаче захвата точки семейством гладких выпуклых монотонно расширяющихся компактов, непрерывно зависящих от времени. Основным результатом данной статьи является теорема о квадратичной скорости сходимости для дискретной версии схемы проектирования.
Отметим, что в этой статье операция проектирования считается элементарной, и алгоритм решения задачи захвата формулируется в терминах этой операции.
Новый подход к построению алгоритмов проектирования точки на гладкий выпуклый компакт на основе соприкасающихся эллипсоидов с приложениями к линейной задаче быстродействия и к задаче захвата точки семейством гладких выпуклых компактов предложен и исследован в [13] - [17]; этих вопросов в данной статье мы касаться не будем.
(1)
Электронный журнал "ИССЛЕДОВАНО В РОССИИ" 2069 http://zhurnal.ape.relcirii.ru/articles/2003/170.pdf
2 Постановка задачи. Формулировка предположений
Пусть у G R" - фиксированная точка, a N(t) - семейство выпуклых компактов в R", непрерывно зависящих от времени / G [0, Т]; непрерывность понимается в смысле метрики Хаусдорфа. Опорная функция компакта МсГ определяется [18] соотношением
а(М,р) = ma,x(x,p), рЕ R".
хеш
Опорная функция множества N(t)
cr(N(t),p) = та х(х,р) (2)
xeN(t)
зависит от времени t и векторного аргумента р G R", Для опорной функции (2) вводится более краткое обозначение
a(X(t),p) = e(t,p). (3)
Предположим, что с ростом времени t множества N(t) монотонно расширяются:
J4(t) С int H(i') V t, t' G [0, T], t < f', (4)
причем у ф N(0), у G intN(T). Условие (4) имеет место при выполнении неравенства
e't(t,p)> 0 Vp G § = {р : \р\ = 1}. (5)
Тогда существует момент времени /* G (().'/') такой, что
у i N(t) при t G [0, £*), ye dN(Q.
Момент времени /* решает экстремальную задачу
i^min t G [0, Т], (6)
- задачу быстрейшего захвата точки у семейством выпуклых тел Х( /). Пусть р* - единичный опорный вектор для множества N(t») в его граничной точке у. Будем рассматривать конструктивные методы вычисления оптимальной пары (/*./»*) на основе геометрической конструкции проектирования точки у на выпуклый компакт N(t), предполагая, что семейство выпуклых компактов Х( /) обладает определенными свойствами гладкости, а именно: опорная функция 0(t,p), см. (3), непрерывна по совокупности переменных (t,p) вместе с частными производными до второго порядка включительно (последнее при р ф 0), причем ранг гессиана
G(t,p) = e;p(t,p), рф О, (7)
равен п — 1. Градиент опорной функции (3) по аргументу р
at,p) = e!p(t,p), Рф о, (8)
определяет опорную точку множества N(t) в направлении вектора р ф 0. Кроме того, напомним, предполагается выполненным условие (5), которое влечет включения (4). Без ограничения общности можно считать, что 0 G intN(t) Vi G [0,Т]. Единичный
оптимальный опорный вектор р* при сделанных предположениях определяется единственным образом.
В рассматриваемую схему вкладывается линейная задача быстродействия (1), причем здесь в роли семейства множеств Х(/) выступают выпуклые компакты, ограниченные ¿-нзохронамн, а точка у есть начальное состояние управляемого объекта [2], [3].
Для решения экстремальной задачи (6) и вычисления оптимальных параметров (¿*,Р*) привлекается схема проектирования точки у на выпуклый компакт кото-
рая является аналогом схемы проектирования начального состояния на изохрону при решении линейной задачи быстродействия [2], [3]. Сначала эта схема описывается в непрерывной форме в терминах некоторой задачи Коши. Далее рассматривается дискретная форма этой схемы, в которой определяется последовательность пар к,Рк), сходящаяся к решению (/*./»*). Основным результатом статьи является утверждение о квадратичной скорости сходимости итерационной последовательности {1и-,Рк). В [2] аналогичный результат установлен для дискретной схемы проектирования в линейной задаче быстродействия для последовательности моментов времени //,.. последовательности расстояний г и и сформулирован для последовательности опорных векторов р
Проекция точки у на выпуклый компакт Л
7г (Л, у) = ащтш | о — у |
аел
есть точка компакта Л, наименее удаленная от проектируемой точки у.
3 Схема проектирования в непрерывной форме
Пусть
v(t)=nm),y) (9)
- проекция точки у на множество 3\T(t), а
r(t) = \v(t)-y I (10)
- расстояние от точки у до проекции v(t), 0 < / < /*: ясно, что r(t») = 0. Уравнение проектирования в статике (при фиксированном t) имеет вид
r(t)p(t) = y^Ç(t,p(t)), 0</</„ (И)
|p(í)| = l, (12)
где p(t) - единичный опорный вектор, параметризующий проекцию v(t) точки у на множество D\T(t): v(t) = Ç(t,p(t)), см. (8). Функции p(t),r(t) определяются задачей Коши
p(t) = [r(í)J + G(í,p(í))+p(í)p*(ír1-K(í,p(í)Mí)^CÍ(í,p(í))],
f(t) = -e't(t,p(t)),
P[U) - r(0) ' (13)
r(0) = I У 7г(3\Г(0), t/) I,
0 < t < u,
где G - гессиан (7), I - единичная матрица, обращаемая матрица в первом уравнении (13) невырождена. Соотношения (13) получаются из уравнений (11), (12). Пусть
(p(t),r(t)), ()</</,. (14)
- решение задачи Коши (13). Функция r(t) в силу предположения (5) монотонно убывает, а момент времени /* определяется условием /•(/* ) = 0. Задача Коши (13) дает принципиальное решение проблемы поиска пары (t*,p*): t* есть положительный корень уравнения r(t) = 0, а оптимальный опорный вектор р* = p{t)\t=u- Задача Коши (13) полезна при обосновании квадратичной скорости сходимости дискретной схемы проектирования, см. раздел 5. Образно говоря, непрерывная задача (13) является "несущей конструкцией "для дискретной схемы проектирования.
4 Дискретная форма схемы проектирования. Сходимость
Рассмотрим следующий дискретный итерационный процесс
Рк+1 = ~——, = И,(рк+1), к = 0,1,.... (15)
Гк
Здесь ттк = у(Ьь) = ^к,Рк+\), Тк = г(^), рк+\ = р(^), а t = Ь(р) есть положительный корень функции
9{Ьр) = 0{Ьр)-{у,р) (16)
относительно аргумента В начале итерационного процесса (15) выбирается момент
времени ¿о Е (0,£*) и по формулам (15) (при к = 0) вычисляются р\ = ^ '
¿1 = МР1); исходя из найденных рх, по формулам (15) (при к = 1) вычисляются р-2, ¿2 и т.д. Геометрический смысл метода (15) иллюстрирует рис. 1.
Рис. 1.
Геометрическая иллюстрация дискретной схемы: 7Гк = = Фк;Рк+Фк+1,Рк+1) - У ± Рк+1-
Утверждение. При сделанных предположениях процесс (15) сходится к оптимальной паре (¿*,р*); причем tk 1" t* при к —^ оо.
Справедливость этого утверждения следует из монотонности и ограниченности последовательности {tk} в рассматриваемом процессе (15). Заметим, что процесс (15) может сходиться за конечное число шагов; эту простую ситуацию в дальнейшем исключаем из рассмотрения, так что все расстояния = r(tk) > 0, а моменты tk < t*.
5 Обоснование квадратичной скорости сходимости
Пусть
p(t),r(t), о < / < /,. (17)
- решение задачи Коши (13), тогда, очевидно, параметры Pk+i, г и процесса (15) связаны с решением (17) равенствами
Рк+1 = p(tk), Гк = r(tk) > 0. (18)
Теорема 1 При сделанных выше предположениях процесс (15) сходится, к оптимальной паре (t*,p*) с квадратичной скоростью, т.е. существуют положительные числа С\, С-2, Сз и номер К та,кие, что при всех к > К выполняются неравенства
\tk+i — t*\ < C\\tk — i*|2, (19)
\Pk+i ^P*\< С2\рк^р* |2, (20)
Гк+i < С,г2к. (21)
Доказательство теоремы. Привлекая функцию (16), введем множество
£ = {реЕ"\{0}: g(t,p) = 0}. (22)
Положим
p(t,p) = -\/(t^Q2 + \p^p«\2. (23)
Для функции (16) имеют место равенства
g{t*,p*) = 0, g'p{t*,p*) = 0. (24)
Докажем сначала вспомогательные утверждения, сформулированные в леммах 1 и 2.
Лемма 1 Для, всех точек (t,p) из достаточно малой окрестности точки (t*,p*) при условиях
t<U, ре L(t) (25)
отношение р/\р^р* \ ограничено, где расстояние р определяется, формулой (23).
Доказательство леммы 1. Условие (25) влечет равенство
g(t,p) = 0. (26)
На основании (24), (26), применяя формулу Тейлора, имеем
0 = g(t,p) - g(t*,p*) = g't(t*,p*)(t - Q + g'Jt*,p*)*(p - p*) + R2, (27)
где остаточный член I>\ удовлетворяет условию
r'2 = о(р) при р -»■ 0. (28)
Из (27), (28) и второго равенства (24) следует, что
R
t,^t = — = р-е(р), (29)
£ #
где е* = g't(t*,p*) > 0 - фиксированная константа, а
е(р) 0 при р -»■ 0. (30)
Принимая во внимание (23) и (29), получаем р2 = р2 - е2(р) + \ р — р* |2, откуда
J^f = Т^е\р)- (31)
Последняя дробь в силу (30) ограничена при р 0. что доказывает лемму 1. Замечание 1 В силу (30) и (31) существует число ро > 0 такое, что
\ 2
\—"—г I < 2 (32)
IР ~ Р* I /
0 < р < ро- (33)
Далее считаем, условие (33) выполненным.
Лемма 2 Для любой точки (t,p) при условиях (25) и (33) найдутся окрестность точки (t*,p*) и число С > 0 та,кие, что в этой, окрестности справедливо неравенство
\t-U\ <С\р^р,\'. (34)
Доказательство леммы 2. Запишем формулу Тейлора для функции (16)
g(t,p) = g(t*,p*) + {sft{t*,p*){t - и) +g'p{t*,p*)*(p-p*)} +
Ц {g!tt(t*,P*)(t - Q2 + 2g'b(U,p*)*(p - p*)(t - Q+ (35)
+ ip - p*)*g^p(t*,p*)ip - p*)} + -R3
с остаточным членом
R-з = °(p2) ПРИ P 0. (36)
Из (35) в силу равенств (24), (26) следует, что
(t„ - t) {2е* + g"t(t*,P*)(t* - i) + 2g't'p(t*-,p*)*(p ^ Р*)} = ^
= ip-p*)*g^p(t*,p*)ip-p*) + 2R3.
Из (37) следует соотношение
(р-р*\* ,,и ^ { р^р* \ ,о Дз ( р ^2
t ( lu^J ь ш
t.-t---\p-p.\- (38)
где
Дх = 0(р) при р 0. (39)
В силу (36) и (39) существует число р\ £ (0, ро] такое, что выполняются неравенства
Е3/р2 < 1/4, < (40)
при условии
о < р < Ръ (41)
Из (38) при условии (41) с учетом (32), (40), получаем неравенство
I , + 1 , |2
-Ц<-\Р^Р* | ,
£ #
где Л* = та,х q*g!! (t¡f ,p¡f)q > 0 - константа. Таким образом, последнее неравенство
I 9 1=1
показывает, что доказано неравенство (34) с константой ( = (Л» + 1)/е* > 0, верное при условии (41). Лемма 2 доказана.
Продолжим доказательство теоремы. В силу сходимости итерационной последовательности {1и-,Рк) к (¿*,Р*) при к оо существует номер К такой, что
Р&к,Рк)<Р1 У к > К.
В дальнейшем считаем, что к > К.
В процессе (15) имеет место равенство /•/, = р*к+^[у — ттк], которое, в силу представления проекции тгк = ц(7/,../)/,.. |). влечет выполнение соотношения
гк =р*к+1у^в(гк,рк+1). (42)
В ходе итерационного процесса (15) выполняется равенство (см. (16), (15))
Рк+\У ~ 0{Ь+1,Рк+1) = 0. (43)
Почленное вычитание равенств (42) и (43) дает выражение для расстояния
гк = в^к+1,рк+1) - 9{Ц,рк+1), которое можно записать в интегральной форме
tk+1
/•/,■ = I в'^,Рк+1)(И. (44)
Привлекая выражение для производной г(£) = —из задачи Коши (13) и условие г к = см- (18), запишем равенство
1
Гк-Гк+1= I (45)
!'к
Из соотношений (44) и (45) в силу равенства ри+г = Р^к), см. (18), можно получить следующее представление для гк+\
1
Гк+1 = Гк- / &гЦ,рЦ))(Н =
^ (46)
= /
tk
с интегрантом
т = (47)
удовлетворяющим условию
/*(**) = 0. (48)
В силу (48) = ¡к^п)^-^), тк е [^,^+1]. При к>К,ге [гк,и) имеет место оценка модуля производной функции (47)
|А(*)1<С1 (49)
с некоторой положительной константой сх, не завиясщей от к. Поэтому из (46), (48) и (49) получаем неравенство
4+1
Гк+1 < сх / {г - гкщ = - гк)2 = §дт|, ^^
^Тк = 1к+\ — д.
Из сделанных предположений вытекает существование положительных постоянных С и С+ таких, что
(' <0',(1.рк.1) <('. Ук>к,ге[гк,и],
С_ < < с+.
Формула (44) и первая двусторонняя оценка (51) влекут неравенства
(51)
Г А7, < /•, < С+АТк. (52)
Опираясь на неравенства (50) и (52), можно записать цепочку неравенств
(53)
В силу второго уравнения (13) имеем:
и
г(гк)-г(и) = I в'^рЦ))ей, (54)
Ьк
и, так как /•(//,.) = /•/,.. /•(/*) = 0, то формула (54) принимает вид
и
/•/,■ = I 0'^.,рЦ))
!'к
который, в силу второй оценки (51), влечет оценку
C-{U-tk)<rk<C+{U-tk). (55)
Используя (53) и (55), получаем:
t* — tfc+i Ь -JJ— ь 2qTгк Ь
< фг (С+(и - tk)f = Сф{и - tkY = (56)
= Cl(t* — tk)2-
В силу (56) можно утверждать, что первая оценка (19) теоремы получена с константой Ci = (ciC*)/(2C*).'
Далее имеем:
IР* ~Рк+1 I = I p{U) - p(tk) I =
и
fp(t)dt
tk
<J\p(t)\dt<c2-(t^tk), (57)
tk
где С2 = п1нх | /'(/ ) | - константа, не зависящая от номера к > К. Существование такой ЩккМ
положительной константы С2 можно извлечь из первого уравнения задачи Коши (13).
Так как в процессе (15) д(1к,Рк) = 0, то в силу определения множества (22) имеем: Рк € £(//,). Поэтому, полагая в неравенстве (34) t = tk, р = рк, к > К, получаем неравенство
~ < С\р* -Рк |2, (58)
и теперь из (57) и (58) следует, что
\р* ~Рк+11 < С2С\р* -рк |2. (59)
Неравенства (53) и (59) означают, что доказаны оценки (20), (21) теоремы с константами ('■> = ('■>('. Сл = 7777т- Теорема доказана полностью.
Замечание 2 Из оценок (19) и (20) следует неравенство
р(ЫъРк+1)<Ср2^рк) с константой С = тах(С1, Су.
Работа выполнена в рамках Программы в Поддержку ведущих научных школ, проект НШ-1846.2003.1.
Список литературы
[1] Понтрягин Л. С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. - М,: Физматгиз, 1961.
[2] Киселев Ю.Н. Линейная теория быстродействия с возмущениями. I. - М.: Издательство МГУ, 1986.
[3] Киселев Ю.Н. Оптимальное управление. - М, Издательство МГУ, 1988.
[4] Киселев Ю.Н. Быстросходящиеся алгоритмы решения линейной задачи быстродействия // Кибернетика. 1990. N 6. С. 47-57, 62,
[5] Аввакумов С.Н., Киселев Ю.Н., Орлов М.В. Методы решения задач оптимального управления на основе принципа максимума Понтрягина // Труды МИЛН им. В.А. Стеклова. 1995. Т. 211. С. 3-31.
[6] Киселев Ю.Н.. Орлов М.В. Численные алгоритмы линейных быстродействий. // ЖВММФ, 1991. N 12. С. 1763-1771.
[7] Neustadt L. W. Synthesizing time-optimal control systems //J. Math. Anal, and Appl.
- 1960. 1, N 3-4. - pp. 484-493.
[8] Eaton J.O. An iterative solution to time optimal control // Ibid. - 1962. - 5, N 2. -pp. 329-344.
[9] Пшеничный Б.Н. Численный метод расчета оптимального по быстродействию управления для линейных систем // ЖВММФ, 1964, N 1, С. 52-60.
[10] Fujisawa Т., Yasuda Y. An iterative procedure for solving the time-optimal regulator problem //J. SIAM Control. 1967. Vol. 5, N4, pp. 501-512.
[11] Болтянский В.Г. Математические методы оптимального управления. - М,: Наука, 1968.
[12] Федоренко Р.П. Приближенные методы решения задач оптимального управления.
- М.: Наука, 1978.
[13] Киселев Ю.Н. Проектирование точки на выпуклый компакт. // Международная конференция по управлению "АВТОМАТИКА-2001", 2001. Т. 1. С. 30-31.
[14] Хабаров Н.В. Алгоритмы проектирования точки на гладкий выпуклый компакт с квадратичной скоростью сходимости // Тезисы докладов ВЗМШ. 2001. С. 269-270.
[15] Хабаров Н.В. Алгоритмы решения задач быстродействия с квадратичной скоростью сходимости // Тезисы докладов ВВМШ. 2001. С. 164-165.
[16] Хабаров Н.В. Алгоритм решения задачи быстродействия на основе проектирования конечного состояния на множество достижимости // Труды XXIV Конференции молодых ученых механико-математического факультета МГУ им М.В.Ломоносова. 2002. С. 182-184.
[17] Хабаров Н.В. Алгоритм решения задачи оптимального управления на основе соприкасающихся эллипсоидов // Материалы Воронежской весенней математической школы. 2002. С. 156-157.
[18] Благодатских В.И. Введение в оптимальное управление. - М,: Высшая школа, 2001.