Научная статья на тему 'Глобальный метод улучшения управления для случая конечного числа разрывов траектории'

Глобальный метод улучшения управления для случая конечного числа разрывов траектории Текст научной статьи по специальности «Математика»

CC BY
95
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИНАМИЧЕСКАЯ СИСТЕМА / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / ИМПУЛЬСНОЕ УПРАВЛЕНИЕ / МЕТОД УЛУЧШЕНИЯ / DYNAMICAL SYSTEM / OPTIMAL CONTROL / IMPULSE CONTROL / IMPROVEMENT METHOD

Аннотация научной статьи по математике, автор научной работы — Трушкова Екатерина Александровна

Рассматривается задача оптимального управления динамическими системами, линейными по неограниченному управлению. Построено обобщение этого класса систем, включающее процессы с разрывными траекториями на концах и в конечном числе внутренних точек временного отрезка. Предложен итерационный метод улучшения обобщенного процесса. Более детально метод разработан для задачи оптимального управления билинейными системами. Представлены результаты вычислительных экспериментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The global method of control improvement for the case of trajectory discontinuities finite number

The problem of optimal control of linear in unlimited control dynamic systems was considered. We built the extension of the systems of this class. It included processes with discontinuous trajectories at the ends and in the finite number of time interval interior points. It was constructed the iterative method for generalized process improvement. In more detail the method was designed for the problem of bilinear systems optimal control. We gave the results of computational experiments.

Текст научной работы на тему «Глобальный метод улучшения управления для случая конечного числа разрывов траектории»

УДК 517.97

doi: 10.18097/1994-0866-2015-0-9-145-149

ГЛОБАЛЬНЫЙ МЕТОД УЛУЧШЕНИЯ УПРАВЛЕНИЯ ДЛЯ СЛУЧАЯ КОНЕЧНОГО ЧИСЛА РАЗРЫВОВ ТРАЕКТОРИИ 1

© Трушкова Екатерина Александровна

доктор физико-математических наук, ведущий научный сотрудник Института проблем управления РАН

Россия, 117997, г. Москва, ул. Профсоюзная, 65, e-mail: [email protected]

Рассматривается задача оптимального управления динамическими системами, линейными по неограниченному управлению. Построено обобщение этого класса систем, включающее процессы с разрывными траекториями на концах и в конечном числе внутренних точек временного отрезка. Предложен итерационный метод улучшения обобщенного процесса. Более детально метод разработан для задачи оптимального управления билинейными системами. Представлены результаты вычислительных экспериментов.

Ключевые слова: динамическая система, оптимальное управление, импульсное управление, метод улучшения.

THE GLOBAL METHOD OF CONTROL IMPROVEMENT FOR THE CASE OF TRAJECTORY DISCONTINUITIES FINITE NUMBER

Ekaterina A. Trushkova

DSc, Leading Researcher, Institute of Control Sciences, RAS

65 Profsoyuznaya st., Moscow 117997, Russia

The problem of optimal control of linear in unlimited control dynamic systems was considered. We built the extension of the systems of this class. It included processes with discontinuous trajectories at the ends and in the finite number of time interval interior points. It was constructed the iterative method for generalized process improvement. In more detail the method was designed for the problem of bilinear systems optimal control. We gave the results of computational experiments.

Keywords: dynamical system, optimal control, impulse control, improvement method.

Введение

В работе [1] рассматривалась задача оптимального управления динамическими системами, описываемыми обыкновенными дифференциальными уравнениями, линейными по неограниченному управлению. Для таких задач характерно отсутствие минимума на ординарном классе допустимых процессов (непрерывные траектории, кусочно-непрерывные управления) и достижение его на некотором обобщении этого класса, включающем процессы с разрывными траекториями. Для обобщенной постановки задачи в случае разрывов траектории на концах временного отрезка был разработан метод последовательного улучшения управления [1], обобщающий известный глобальный метода улучшения [2-4]. В настоящей статье проводится дальнейшее исследование подобных задач, а именно, исследуется обобщенная постановка для случая конечного числа разрывов траектории на временном отрезке и разработан для этой постановки глобальный метод улучшения.

1. Постановка задачи

Рассматривается обобщенная задача оптимального управления для случая разрывов траектории x(t) в точках t = 0, t = if и t = Т

1 Работа выполнена при финансовой поддержке РФФИ (проект № 15-07-09091).

145

](т) = F(x(r)) ^ min, х(0) = х0, х(0 +) = П(т(0),0,х(0)), (1)

x(t) = g(t,x(t)) + h(t,x(t))u(t), t e (0,,f) и Ц,Т), х(^) = П(т(?), £*(?-)), х(Т) = П(т (Т),Т,х(Т-)), где x(t) - n-мерная непрерывная на (0, U Ц, Т) кусочно-дифференцируемая функция; управление u(t) — скалярная кусочно-непрерывная функция, т(0), r(if), т(Г) 6 R, П(т, t, х) — решение задачи Коши для предельной системы

— = h(t, ш), о)(0, t, х) = х. (2)

dr

Непрерывно-дифференцируемые функции F(x), g(t, х), h(t, х), состояние х0 и момент Т заданы.

По аналогии с обобщенной задачей из [1], где рассматривались разрывы лишь в точках t = 0 и t = T, обозначим через Е множество допустимых обобщенных процессов

m = (x(t),u(t),r(0),T(0,T(T)).

Величины т(0), r(if) и т(Г) играют роль управляющих параметров. Обобщенное управление (u(t), т(0), r(if), т(Г)) будем называть импульсным.

Таким образом, каждому обобщенному управлению соответствует обобщенная траектория х(t), разрывная по t в точках t = 0, t = (и t = Т.

Поставим задачу улучшения для обобщенной постановки: задан процесс т° 6 Е; требуется получить процесс тЕ Е такой, что j(m) < J(m0).

На эту задачу здесь доопределяется метод глобального улучшения, предложенный и исследованный в [1_4].

2. Метод улучшения обобщенного процесса

Введем в рассмотрение функционал

т

L(m) = G(t(T),x(T-)) + g°(t(0)) - j R(t,x,u)dt + g1(r(^),x(^ -)),

о

G( т,х) = F(ü)(r,T,x)) + q)(T,x), G0( т) = -^(0, ^(т, 0, x0)), G1(t,x) = (p(^-,x) - <р(^+,<^(т,^х)), R(t,x,u) = q)x(g(t,x) + h(t,x)u) + yt, t e (0, T), где <p(t,x) непрерывно-дифференцируема по (t,x) при t Ф

Функционал L является обобщенным лагранжианом для обобщенной задачи (1), т. е. L(m) = J(m), m 6 Е$.

Опишем одну итерацию глобального методаулучшения для рассматриваемой обобщенной задачи.

0. Задаем обобщенное управление (и0(i),r°(0), T0((f), т0('Т)). Находим соответствующую траекторию x0(t) и вычисляем значение функционала F(x°(T)) = F(co(t°(T), Т, х°(Т—))).

1. Находим функцию х) из условий

G(T0(T),x0(T —)) > G(T0(T),X) Vx, g1(t0(^),x0(^-))>g1(t0(^),x)vx, R(t,x0(t),u0(t)) < R(t,x,u0(t))Vx,t 6 (0,^) U (,T).

2. Построение улучшенного режима проводим последовательно для t = 0, t 6 (0, if), t =

£ (if ,T) и t = T. А именно, разрывная траектория допустимого процесса строится следую -

щим образом:

1) интегрируем уравнение (2) при t = 0, х = х0 и находим значение т(0) из условия

т(0) 6 Arg min G°(t);

т

2) находим решение x(t) задачи Коши

х = g(t, х) + h(t, x)u(t, х), t 6 (0, х(0 +) = &>(т(0), 0, х0),

где u(t,x) вычисляется по формуле, аналогичной формуле особого режима, представленной в [1];

3) интегрируем уравнение (2) при t = if, х = ) и находим значение т(^) из условия

т(^) 6 Arg min G1(r, х( -)).

4) находим решение x(t) задачи Коши

х = g(t, х) + h(t, x)u(t, х), t 6 Т), хЦ +) = ш(т(), xOf-)^

где u(t,x) вычисляется по формуле, аналогичной формуле особого режима, представленной в [1];

5) интегрируем уравнение (2) при t = Т,х = х(Т—) и находим значение т(Т) из условия

т(Т) е Arg min G(t, х(Т —)).

т

6) вычисляем новое значение функционала

F(x(T)) = F(ù)(t(T),T,x(T-))).

Справедлива следующая теорема.

Теорема. Описанная выше процедура гарантирует выполнение неравенства L(m) < L(m°) и, как следствие, выполнение неравенства J(m) < J(m°). При этом, если выполняется хотя бы одно из следующих неравенств:

G(t(T),x(T-))<G(t°(T),x(T -)),

G(t0(T),x(T-))<G(t°(T),x°(T-)),

t

G0(t(0)) < G0(t0(0)), j(R(t,x(t),u0(t)) -R(t,x0(t),u0(t)))dt > 0,

о

то справедливо строгое неравенство L(m) < L(m°) и, как следствие, строгое неравенство ](m) < J(m°).

Доказательство теоремы проводится аналогично доказательству соответствующей теоремы в [1].

Замечание. Все вышеизложенное легко обобщается на случай конечного числа s разрывов траектории (импульсов управления) при t = 0, t = k = 1,..., s,t = T.

3. Метод улучшения для билинейных систем

Для случая, когда

g(t,x(t)) + h(t,x(t))u(t) = (A(t) + B(t)u(t))x(t), F(x(T)) = xt(T)Mx(T), разрешающую функцию <p(t,x) можно искать в линейном виде, т. е. <p(t,x) = Одна

итерация глобального метода улучшения для этого случая перепишется в следующем виде.

0. Задаем обобщенное управление (и0(t),T°(0),T0(^),T°(T)'). Находим соответствующую траекторию x°{t) и вычисляем значение функционала F(x°(T)), где х0(Т) = Ф(т0(Т), Т)х0(Т—), Ф(т,0 = е8^ - фундаментальная матрица решений системы (2) для рассматриваемого случая.

1. Находим функцию ^(t) как решение задачи Коши

ф = ~(A(t) + B(t)u°(t))Txp, ф(Т) = -2ФТ(т0(Т),Т)МФ(т0(Т),Т)х0(Т -).

2. Вычисляем т(0) из условия

т(0) 6 Arg min{-\pT(0)Ф(т,0)х0).

т

3. Находим решение x(t) задачи Коши

x(t) = (A(t) + B(t)u(t, x(t))) x(t), t e (0, t), x(0 +) = Ф(т(0), 0)x0,

где u(t,x) вычисляется по формуле, аналогичной формуле особого режима, представленной в [1].

4. Вычисляем т(^) из условия

т(0 е Arg min{-xpTЦ +)Ф(т,0х( -)}.

т

5. Находим решение x(t) задачи Коши

x(t) = (A(t) +B(t)u(t,x(t)j)x(t),te Ц,Т),х( +) = Ф(т(0,0х^-),

где u(t,x) вычисляется по формуле, аналогичной формуле особого режима, представленной в [1].

6. Из соотношения

т(Т) 6 Arg тт{—хт(Т ~)Фт(т, Т)МФ(т, Т)х(Т -)},

т

находим т(Г).

7. Вычисляем новое значение функционала

F(x(Г)) = F(Ф(т(7,), Т)х(Т-

4. Вычислительные эксперименты

В качестве модельного примера рассмотрим грубую аппроксимацию для известной задачи вращения плоской молекулы [5, 6]. После разложения волновой функции и операторов, входящих в соответствующее уравнение Шрёдингера, по собственным функциям конечномерная аппроксимация третьего порядка рассматриваемой динамической системы в действительных переменных запишется в виде

х(0 = (Л(0 + в(0и(0)*(0д е [0,Г],х(£) 6 Я6,

(3)

где

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V

о о 0 1 о 0

0 0 0 0 4 о

о о 0 0 0 9

-1 о о о о о

0 -4 о о о о

о 0 -9 о о о

, в() =

0

о о

о

о о о

1 2

о о о о

\о -

0

1 2

о о о о

1 2

0

1 2

о о о

о\

1 2

о о о

о

В отличие от [5, 6], где рассматривалась задача перевода волновой функции из первого собственного подпространства (соответствующего собственному значению 1) во второе (соответствующее собственному значению 4), поставим задачу перевода волновой функции из первого собственного подпространства в третье (соответствующее собственному значению 9), что соответствует постановке задачи оптимального управления системой (3) с начальным условием х(о) = (1,о,... ,о)т наминимумфункционала F(x) = 1 — х| — х\.

При проведении вычислений для работы компьютерной программы (написанной на языке программирования С++), реализующей вышеизложенный итерационный метод улучшения управления при различном равномерном выборе точек разрыва траектории, были фиксированы Г = 3, ограничение на управление |и(£)| < 1оо| и начальное управление и0(0 = о.о1. Полученные результаты представлены в следующей таблице и позволяют сделать вывод об улучше -нии работы метода при добавлении точек внутренних разрывов траектории.

Номер т(о) т(о.75) т(1.5) т(2.25) т(3) ^(х(3))

итерации

Без внутренних разрывов

0 0 0 1

1 0 0.001256 1

2 0 1.234020 0.999982

3 0 5.468880 0.000327

4 0 0.168389 0.000193

5 0 5.645440 0.000130

Один внутренний разрыв при ^ =1.5

0 0 0 0 1

1 0 2.895920 0.001256 1

2 0 1.439480 0.616380 0.000208

3 0 1.439480 0.586850 0.000144

4 0 1.438850 0.586850 0.000128

5 0 1.438220 0.579938 0.000112

Тривнутреннихразрыва при = о.75, = 1.5, = 2.25

0 0 0 0 0 0 1

1 0 5.987880 0.435425 6.258680 0.175301 1

2 0 5.979080 0.769690 6.210930 4.099780 0.999960

3 0 5.797500 0.772203 0.007539 0.082309 0.001222

4 0 5.796870 0.771575 0.008168 0.006911 0.000113

5 0 5.796870 0.771575 0.008168 0.081053 0.000049

Заключение

Разработан итерационный глобальный метод улучшения обобщенного процесса, включающего разрывные в конечном числе внутренних точек временного отрезка траектории. Детально метод представлен применительно к задаче оптимального управления билинейными системами. Проведена программная реализация соответствующих алгоритмов улучшения на языке C++. Метод апробирован в вычислительных экспериментах на модельной тестовой задаче.

Литература

1. Кротов В.Ф., Моржин О.В., Трушкова Е.А. Разрывные решения задач оптимального управления. Итерационный метод оптимизации // Автоматика и телемеханика. - 2013. - № 12. -С. 31-55.

2. Кротов В.Ф., Фельдман Н.Н. Итерационный метод решения задач оптимального управления // Изв. АН СССР. Техн. киберн. - 1983. - № 2. - С. 160-168.

3. Krotov V.F. Global methods in optimal control theory. - New York: Marcel Dekker, 1996.

4. Трушкова Е.А. Алгоритмы глобального поиска оптимального управления // Автоматика и телемеханика. - 2011. - № 6. - С. 151-159.

5. Boussaid N., Caponigro M., Chambrion T. Periodic control laws for bilinear quantum systemt with discrete spectrum. - URL: http://arXiv.org/pdf/1111.4550v1

6. Трушкова E. А. Метод глобального улучшения для гамильтоновых систем с управляемыми коэффициентами // Изв. Сарат. ун-та. Нов. сер. - 2013. - Т. 13. Сер. Математика. Механика. Информатика, вып. 1, ч. 2. - С. 95-99.

References

1. Krotov V. F., Morzhin O. V., Trushkova E. A. Razryvnye resheniya zadach optimal'nogo upravleniya. Iteratsionnyi metod optimizatsii [Discontinuous solutions of optimal control problems. The iterative optimization method]. Avtomatika i telemekhanika - Automation and Remote Control. 2013. No. 12. Pp. 31-55.

2. Krotov V. F., Fel'dman N. N. Iteratsionnyi metod resheniya zadach optimal'nogo upravleniya [The iterative method for solving optimal control problems]. Izvestiya AN SSSR. Tekhnicheskaya kibernetika - Proceedings of USSR Academy of Science. Engineering Cybernetics. 1983. No. 2. Pp. 160-168.

3. Krotov V. F. Global methods in optimal control theory. New York: Marcel Dekker, 1996

4. Trushkova E. A. Algoritmy global'nogo poiska optimal'nogo upravleniya [Algorithms of control improvement global search]. Avtomatika i telemekhanika - Automation and Remote Control. 2011. No. 6. Pp. 151-159.

5. Boussaid N., Caponigro M., Chambrion T. Periodic control laws for bilinear quantum system with discrete spectrum. Available at: http://arXiv.org/pdf/1111.4550v1.

6. Trushkova E. A. Metod global'nogo uluchsheniya dlya gamil'tonovykh sistem s upravlyaemymi koeffitsientami [Global improvement method for Hamiltonian systems with controllable coefficients]. Izvestiya Saratovskogo universiteta. Ser. Matematika. Mekhanika. Informatika. Proceedings of Saratov University. Ser. Mathematics. Mechanics. Informatics. 2013. Bk. 13. V. 1. No. 2. Pp. 95-99.

i Надоели баннеры? Вы всегда можете отключить рекламу.