Научная статья на тему 'О проблеме синтеза оптимальных систем'

О проблеме синтеза оптимальных систем Текст научной статьи по специальности «Математика»

CC BY
148
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНЫЕ СИСТЕМЫ / LINEAR SYSTEMS / УПРАВЛЕНИЕ / СИНТЕЗ / SYNTHESIS / ОБРАТНАЯ СВЯЗЬ / FEEDBACK / АЛГОРИТМЫ / ALGORITHMS / OPTIMAL CONTROL

Аннотация научной статьи по математике, автор научной работы — Габасов Рафаил, Кириллова Фаина Михайловна

Рассматриваются задачи оптимального управления линейными динамическими объектами в условиях множественной неопределенности. Вводятся понятия оптимальной классической обратной связи, оптимальной размыкаемой связи и многократно замыкаемых связей. Излагаются алгоритмы формирования управляющих воздействий в режиме реального времени

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Габасов Рафаил, Кириллова Фаина Михайловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the Optimal Synthesis Problem for Control Systems

Optimal synthesis problem to linear indeterminate dynamic systems is under consideration. The concept of classical optimal feedback, optimal unclosable feed-back and repeatedly closable feedbacks are introduced. Algorithms of forming real-time control actions are justified.

Текст научной работы на тему «О проблеме синтеза оптимальных систем»



Серия «Математика»

2015. Т. 14. С. 55—63

Онлайн-доступ к журналу: http://isu.ru/izvestia

УДК 518.517

О проблеме синтеза оптимальных систем *

Р. Габасов

Белорусский государственный университет

Ф. М. Кириллова

Институт математики НАН Беларуси

Аннотация. Рассматриваются задачи оптимального управления линейными динамическими объектами в условиях множественной неопределенности. Вводятся понятия оптимальной классической обратной связи, оптимальной размыкаемой связи и многократно замыкаемых связей. Излагаются алгоритмы формирования управляющих воздействий в режиме реального времени.

Ключевые слова: линейные системы, управление, синтез, обратная связь, алгоритмы.

Синтез оптимальных автоматических систем — центральная проблема теории управления [12]. Первые постановки задач и результаты по проблеме относятся к началу 50-х годов прошлого столетия [8; 13; 14; 17]. С тех пор, несмотря на выдающиеся достижения математической теории оптимальных процессов, проблема синтеза остается нерешенной за исключением редких случаев (задача быстродействия для линейных стационарных систем второго порядка [11], линейно-квадратичная задача оптимального управления без учёта прямых ограничений на управляющие воздействия [8; 16]).

При классическом подходе к проблеме синтеза оптимальных систем основная трудность, известная как «проклятие размерности», состоит в табулировании функций многих переменных. В описываемом ниже подходе обратные связи не табулируются, их нужные для управления текущие значения вычисляются в режиме реального времени по ходу каждого конкретного процесса.

1. Введение

* Работа выполнена при поддержке ГПНИ «Конвергенция»(НАНБ)

В Минске методы управления в реальном времени разрабатываются с начала 90-х годов прошлого столетия [2] - [6], [15]. Ниже приводятся некоторые результаты этой работы.

2. Классическая оптимальная обратная связь

Пусть T = [t*,t*] - промежуток времени, —те < t* < t* < те; h = (t* — t*)/N - период квантования времени; N > 1 - натуральное число; Th = {t*,t* + h,...,t* — h}; T (т) = [т, t*],A(t) e Rnxn, b(t), m(t) e Rn; m(t),t e T e Rn - кусочно-непрерывные функции; c e Rn,g*,g* e Rm; h(i) e Rn - i-ая строка матрицы H e Rmxn, i e I = {1,2,..., m}; X* = {x e Rn : g* < Hx < g*}; U = {u e R : \u\e Lu}, 0 < Lu < те, 0 < Lw < те; xo e Rn, x(-) = (x(t),t e T).

Определение 1. Функция u(-) называется дискретной (с периодом квантования h), если u(t) = и(т),t e [т,т + h[, т e Th.

В классе дискретных управляющих воздействий рассматривается линейная задача оптимального управления:

c'x(t*) — max; x = A(t)x + b(t)u, x(t*) = x0, x(t*) e X*, (2.1)

u(t) e U, t e T.

Здесь x = x(t) e Rn — состояние модели объекта управления в момент времени t, u = u(t) e R — значение управляющего воздействия в момент времени t.

Определение 2. Управляющее воздействие u(-) называется доступным, если u(t) e U,t e T.

Каждому доступному управляющему воздействию u(-) соответствует единственная траектория x(-) динамической модели (2.1).

Определение 3. Доступное управляющее воздействие u(-) — программа, если x(t*) e X*.

Определение 4. Программа u0(t),t e T, называется оптимальной (программным решением задачи (2.1)), если на соответствующей ей траектории x°(^) показатель качества программы J(u(-)) = c'x(t*) достигает максимального значения на множестве U(•) всех программ:

J(u°(-)) = max J(u(-)),u(-) e U(■).

Предположим, что в каждый текущий момент т e Th процесса управления будет точно известно текущее состояние x*(т) динамического объекта. В соответствии с этим задачу (2.1) погрузим в семейство

Сх(г*) — тах; х = А(г)х + Ь(г)и, х(т) = г, (2.2)

х(г*) е Xи(г) е и, г е т(т),

зависящее от позиции (т, г).

Пусть п°(г\т, г),г е т(т), — оптимальная программа задачи (2.2) для позиции (т,г); Хт — множество состояний г, для которых эта задача имеет решение.

Определение 5. Функция

и°(т, г) = и0(т\т,г),г е Хт,т е Тн, (2.3)

называется оптимальной дискретной обратной связью (по состоянию) или позиционным решением задачи (2.1).

Подстановка функции (2.3) в уравнение (2.1) (замыкание системы) приводит к оптимальной системе управления:

х = А(г)х + ь(г)и0(г, х),х(г*) = х0- (2.4)

конечной цели оптимального синтеза. Эта цель в теории принципа максимума Понтрягина достигается с помощью построения поверхностей переключения [11]. В динамическом програмировании обратная связь (2.3) получается из решений уравнений Беллмана [1]. В принятом выше классе управляющих воздействий уравнение (2.4) всегда имеет единственное решение х(-), которое строится по шагам. В обоих методах функция (2.3) табулируется до начала процесса, что при п > 2 (стационарный случай) и при п > 1 (нестационарный случай) представляет серьезную трудность.

Ниже описывается другой метод оптимального синтеза, в котором функция (2.3) не строится заранее, а необходимые ее значения вычисляются по ходу процесса управления.

Чтобы пояснить суть нового подхода, предположим, что функция

(2.3) построена. Она построена по детерминированной модели, но предназначена для управления динамическим объектом, поведение х*(-) которого в общем случае отличается от поведения х(-) модели. Проанализируем ее использование в конкретном процессе управления динамическим объектом, на который действует неизвестное возмущение '№*(■). Будем считать, что это возмущение породит в замкнутой системе

(2.4) переходный процесс, который доступен измерению в моменты и удовлетворяет тождеству:

х*(г) = А(г)х*(г) + ь(г)и0(г,х*(г)) + >ш*(г),г е т. (2.5)

Из (2.5) видно, что в рассматриваемом процессе управления оптимальная обратная связь используется неполностью, достаточно знать ее значения только вдоль изолированной кривой х*(■).

Процесс управления начинается в момент t* с подачи на вход объекта управляющего воздействия u*(t) = u0(t*,x0),t > t*. В момент t = t* + h становится известным состояние объекта x*(t* + h). По этой информации за время s(t* + h), 0 < s(t* + h) < h, находится новое значение управляющего воздействия u0(t* + h,x*(t* + h)). С момента t* + h + s(t* + h) на вход объекта подается воздействие u*(t) = u°(t* + h, x*(t* + h)),t > t* + h + s(t* + h), где s(t* + h) - время поиска значения u0(t* + h + s(t* + h),x*(t* + h)).

При продолжении этого процесса получается последовательность управляющих воздействий:

u*(t) = u0(r,x*(r)),t £ [т + s(t), т + h + s(t + h)[,

0 < s(t) <h,T £ Th,

называемая реализацией оптимальной обратной связи (2.3) в конкретном процессе управления объектом.

Определение 6. Устройство, которое для каждой текущей позиции (t,x*(t)) способно вычислять значение u*(t),t £ T, за время, не превосходящее h, назовем оптимальным регулятором.

Согласно определению 5, значение управляющего воздействия u0(t*,xo) равно начальному значению оптимальной программы для позиции (t*,x0), которое можно найти до начала процесса управления. Следующее значение управляющего воздействия u0(t* + h,x*(t* + h)) получается из оптимальной программы u0(t*,x0) двойственным методом линейного программирования с помощью коррекции предыдущей оптимальной опоры.

В [3; 5] описан алгоритм работы оптимального регулятора, в основе которого лежат: 1) дискретность управляющих воздействий; 2) редукция задачи построения последовательности оптимальных программ к задачам линейного программирования; 3) двойственный метод с длинным шагом для коррекции опор; 4) распараллеливание вычислений; 5) в стационарном случае - методы ускорения вычислений с помощью рекурретных уравнений и метода разновесов; 6) процедуры замораживания переменных и размораживания ограничений.

3. Размыкаемая обратная связь

Классический подход (см. п. 2) к проблеме синтеза оптимальных систем базируется на детерминированных моделях и не использует никакой информации о возмущениях. Введение недетерминированных моделей позволяет оценить качество процесса управления относительно

возмущений. Различают два типа неопределенностей: стохастическую [10] и множественную [7].

Начнем с простейшей задачи оптимального управления динамическим объектом в условиях множественной неопределенности:

c'x(t*) — max; x = A(t)x + b(t)u + m(t)w(t), (3.1)

x(t*) e X*,u(t) e U,w(t) e W,t e T.

Задача (3.1) отличается от задачи (2.1) наличием неизвестной функции w(-), которая может реализоваться в виде любой кусочно-непрерывной функции со значениями из компакта W.

Управляющее воздействие u(-) и возмущение w(-) порождают в задаче (3.1) траекторию x(t\t*,xg,u(-),w(-)),t e T.

Определение 7. Множество возможных терминальных состояний объекта управления (3.1), соответствующее доступному управляющему воздействию u(-),

X(t*,u(■)) = {x e Rn : x = x(t*\t*,xg,u(-),w(-)),w(-) e W(•)},

назовем распределением терминального состояния в момент t*.

Определение 8. Доступное управляющее воздействие ug(•) называется гарантирующей программой задачи (3.1), если X(t*,ug(•)) С X*.

Пусть качество гарантирующей программы оценивается числом J (ug (■)) = min c'x(t*\t*,xo ,ug (-),w(-)),w(-) e W (■)

(гарантированное значение показателя качества).

Оптимальную гарантирующую программу u°g(■) определим равенством

J (u°g (')) =max J (ug ()),ug (') e Ug (').

Оптимальная программа ug(•) с гарантией переводит в момент t* систему (3.1) на терминальное множество X* и обеспечивает максимум гарантированному значению показателя качества Jg (u).

Для определения гарантирующего позиционного решения задачи (3.1) рассмотрим семейство задач:

Cx(t*) — max; x = A(t)x + b(t)u + m(t)w(t), (3.2)

x(t) = z,x(t*) e X*; u(t) e U,w(t) e W,t e T(t).

Обозначим: ug(t\T, z),t e TT — оптимальная гарантирующая программа задачи (3.2) для позиции (t,z); Xt — множество всех состояний z e Rnx, для которых существуют гарантирующие программы задачи (3.1).

Определение 9. Функция

п°д(т,г) = п°д(т\т,г),г е Хт,т е Ти, (3.3)

называется экстремальной дискретной размыкаемой обратной связью по состоянию (позиционным решением задачи (3.1)).

Задача построения экстремальной дискретной обратной связи (3.3), как и задача (2.1) (см. п. 2), в классе дискретных управляющих воздействий сводится к задаче линейного программирования и решается двойственным методом [3; 5].

4. Замыкаемые обратные связи

При определении размыкаемой обратной связи (см. п. 3) объект замыкался в каждый текущий момент времени т е Тн и не использовалась информация о том, что замыкания могут осуществляться и в будущие моменты времени Ь > т. При использовании детерминированных моделей это обстоятельство не играет никакой роли. В случае недетерминированных моделей ситуация изменяется и дополнительная информация существенно влияет на процесс управления.

В настоящем разделе описывается метод управления в предположении, что объект кроме каждого текущего момента т будет замыкаться в некоторые будущие моменты времени. Учет этого обстоятельства называется препостериорным анализом.

Приведем некоторые результаты, полученные для случая одного замыкания.

Пусть траектория объекта управления описывается уравнением

ж'* = А(Ь)х* + Ъ(Ь)и + (Ь),х* (Ь*) = Хд, (4.1)

траектория модели — уравнением

Х = А(Ь)х+Ъ(Ь)и + ш(Ь)'ш(Ь) ,х(Ь*) = хд, (4.2)

Здесь ,ш*(Ь),'ш(Ь),Ь е Т, — возмущения, действующие на объект и на модель (соответственно).

Обозначим через момент времени, Ь* < < Ь*, в который станет известно состояние х*(Ь\) объекта, т.е. объект в этот момент будет замкнут.

Каждая тройка {и(•),,ш*(Ь)^(-)} порождает единственные траектории системы (4.1), (4.2).

Функция х*(Ь),Ь е Т, — непрерывное решение уравнения объекта

(4.1), функция х(Ь),Ь е Т, — кусочно-непрывное решение уравнения

(4.2) с точкой разрыва в момент замыкания: х(Ь\ + 0) = х*(Ь\).

Терминальное состояние модели (4.2) имеет вид: ,-г* гН

п* Л

сЬ*

х(г*) = г(г*,г*)хо + [ г(г*,щг)п(г)м + [1 г(г*,г)т*(г)ы*(г)м+ .¡г* .¡г*

г (г*,г)т(г)ы(г)м,

+

где Г(г,т),г > т,г,т С Т, - фундаментальная матрица решений однородной части уравнения модели (4.2), Г(г,т) = Г(г)Г-1(т),Г(г) €

Ппхп, г е т,Р = А(г)г, г (г*) = е .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Далее, следуя п. 2, получаются программное и позиционное решения для управления объектом в реальном времени по принципу однократно замыкаемой обратной связи.

Аналогичным образом решаются задачи экстремального управления в реальном времени по принципу многократно замыкаемых обратных связей (по состоянию).

Список литературы

1. Беллман Р. Процессы регулирования с адаптацией / Р. Беллман // М. : Наука, 1964. - 360 с.

2. Габасов Р., Кириллова Ф. М. Оптимальное управление и наблюдение в реальном времени / Р. Габасов, Ф. М. Кириллова // Изв. РАН. Теория и системы управления. - 2006. - № 3. - С. 90-111.

3. Габасов Р. Оптимальное управление динамическим объектом по совершенным измерениям его состояний / Р. Габасов, Ф. М. Кириллова, Н. С. Павленок // Докл. Акад. наук (РАН). - 2012. - Т. 444, № 4. - С. 371-375.

4. Габасов Р. Оптимальное наблюдение в реальном времени линейного динамического объекта / Р. Габасов, Ф. М. Кириллова, Е. И. Поясок // Докл. Акад. наук (РАН). - 2013. - Т. 448, № 3. - С.145-148.

5. Габасов Р. Оптимальное управление в реальном времени многомерным динамическим объектом / Р. Габасов, Ф. М. Кириллова, Во Тхи Тань Ха // Автоматика и телемеханика. - 2015. - № 1. - С. 121-135.

6. Габасов Р., Кириллова Ф. М., Поясок Е. И. Оптимальное управление в реальном времени / Р. Габасов, Ф. М. Кириллова, Е. И. Поясок // Изв. Иркут. гос. ун-та. Сер. Математика. - 2009. - Т. 2, № 3. - C. 132-169.

7. Красовский Н. Н. Управление динамической системой / Н. Н. Красовский. -М. : Наука, 1985. - 520 с.

8. Лернер А. Я. О предельном быстродействии систем автоматического управления / А. Я. Лернер // Автоматика и телемеханика. - 1954. - Т. 15, № 6. -С. 461-477.

9. Лётов А. М. Аналитическое конструирование регуляторов / А. М. Лётов // Автоматика и телемеханика. - 1960. - Т. 21, № 4. - C.436-441.

10. Леондес Л. Т. Фильтрация и управление в динамических системах /Л. Т. Ле-ондес. - М. : Мир, 1980. - 404 с.

11. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. - М. : Физматгиз, 1961. - 392 с.

12. Фельдбаум А. А. Основы теории оптимальных автоматических систем / А. А. Фельдбаум. - М. : Физматгиз, 1963. - 552 с.

13. Фельдбаум А. А. Оптимальные процессы в системах автоматического регулирования / А. А. Фельдбаум // Автоматика и телемеханика. - 1953 - Т. 14, № 5. - С. 712-728.

14. Bushaw D. W. Experimental towing tank / D. W. Bushaw // Stevens Institute of Technology, Report:469, Hobonen N. J. - 1953. - P. 1-80.

15. Gabasov R. Optimal feedbacks controls and related topics // R. Gabasov, F. M. Kirillova // Abstracts of the Workshop on Geometric Methods in Nonlinear Optimal Control. - Hungary-Austria. Sopron-Laxenburg, July 22-26, 1991. - P. 11-12.

16. Kalman R. E. Optimal synthesis of linear sampling control systems generalized performance index / R. E. Kalman, R. W. Koepke // Trans. ASME. - 1958. - Vol. 80. - P. 1820-1826.

17. Hopkin A. M. A phase plan approach to the compensation of saturating servomechanisms // Trans. AIEE. - 1951. - Vol. 70, pt. 1. - P. 631-639.

Габасов Рафаил, доктор физико-математических наук, профессор, Белорусский государственный университет, 220050, Минск, пр. Независимости, 4 тел.: (37517)3270469 (e-mail: [email protected])

Кириллова Фаина Михайловна, чл.-кор. НАН Беларуси, доктор физико-математических наук, профессор, главный научный сотрудник, Институт математики, НАН Беларуси, 220072, Минск, ул. Сурганова, 11 тел.: (37529)7617359 (e-mail: [email protected])

R. Gabasov, F. M. Kirillova

On the Optimal Synthesis Problem for Control Systems

Abstract. Optimal synthesis problem to linear indeterminate dynamic systems is under consideration. The concept of classical optimal feedback, optimal unclosable feedback and repeatedly closable feedbacks are introduced. Algorithms of forming real-time control actions are justified.

Keywords: linear systems, optimal control, synthesis, feedback, algorithms

References

1. Bellman R. Adaptive control processes. Princeton University Press, 1961.

2. Gabasov R., Kirillova F.M. Real-time control and observation (servey) (in Russian). J. Computer and Systems Sciences Intern, 2006, vol. 45, no 3, pp. 421-441.

3. Gabasov R, Kirillova F.M, N.S. Pavlenok. Optimal control of a dynamic system using perfect measurements of its states (in Russian). Doklady Mathematics. Pleiades Publishing. Ltd. 2012, vol. 85, no 3, pp.436-440.

4. Gabasov R., Kirillova F.M, Poyasok E.I. Real-time optimal observation of a linear dynamic system (in Russian). Doklady Mathematics. Pleiades Publishing. Ltd., 2013, vol.87, no 1, pp. 120-123.

5. Gabasov R.,Kirillova, F.M., Vo Thi Thanh Ha. Optimal real- time control of multidimensional dynamic plants (in Russian).Automation and Remote control, 2015, vol. 76, no 1, pp.98-110.

6. Gabasov R, Kirillova F.M., E.I.Poyasok. Real-time optimal control (in Russian). Izvestia of the Irkutsk State University. Mathematics, 2009, vol. 2, no 3, pp. 132169.

7. Krasovskii N.N. Dynamic system control (in Russian). Moscow, Nauka, 1985. 520 p.

8. Lerner A.Ya. On time-optimality of automatic control systems (in Russian). Automation and Remote Control, 1954, vol.15, no 6, pp. 461-477.

9. Letov A.M. Analytical design of regulators (in Russian). Automation and Remote Control, 1960, vol. 21, no 4. pp. 436-441.

10. Leondes C.T, Ed. Control and dynamic systems. Academic Press. New York, San Francisko and London, 1976. 404 p.

11. Pontryagin L.S.,Boltyanskii V.G.,R.V.Gamkrelidze P.V. and E.F.Mishchenko. Mathematical theory of optimal processes (in Russian). Moscow, Nauka, 1961. 392 p.

12. Feldbaum A.A. Fundamentals of the theory of optimal automatic systems (in Russian). Moscow, Fizmatgiz, 1963. 552 p.

13. Feldbaum A.A. Optimal processes of automatic system regulation (in Russian). Automation and Remote Control, 1953, vol. 14, no 5, pp. 712-728.

14. Bushaw D.W. Experimental towing tank. Stevens Institute of Technology. Report:469. Hobonen N.J, 1953. 80 p.

15. Gabasov R., Kirillova F.M. Optimal feedbacks controls and related topics . Abstracts of the Workshop on Geometric Methods in Nonlinear Optimal Control, Hungary-Austria, Sopron-Laxenburg, July 22- 26, 1991, pp. 11-12.

16. Kalman R.E., Koepke R.W. Optimal synthesis of linear sampling control systems generalized performance index. Trans ASME, 1958, vol. 80, pp. 1820-1826.

17. Hopkin A.M. A phase plan approach to the compensation of saturating servomechanisms. Trans. AIEE, 1951, vol.70, pt.1, pp. 631-639.

Gabasov Rafail, Doctor of Sciences (Physics and Mathematics), Professor, Belarusian State University, 4, Nezavisimosti prosp., Minsk, 220050 tel.: (37517)3270469 (e-mail: [email protected])

Kirillova Faina Mihajlovna, Principle Investigator, Institute of Mathematics of Belarus Academy of Sciences, 11, Surganov st., Minsk, 220072 tel.: (37529)7617359 (e-mail: [email protected])

i Надоели баннеры? Вы всегда можете отключить рекламу.