Naumov Valeriy Nikolaevich - the department of multi-purpose tracked vehicles and mobile robots; dr. of eng. sc.; professor.
Ryabov Anatoliy iktorovich - 3 Central Scientific Research Institute for Defense Ministry of RF; e-mail: [email protected]; 85, Red street, Bronnitsy, Russia; phone: +74992612723; senior researcher.
УДК 007+518; 62-50
А.Б. Филимонов, Н.Б. Филимонов
ПОЛИЭДРАЛЬНАЯ ФОРМАЛИЗАЦИЯ ДИСКРЕТНЫХ ЗАДАЧ ТЕРМИНАЛЬНОГО УПРАВЛЕНИЯ С РЕСУРСНЫМИ ОГРАНИЧЕНИЯМИ*
Обсуждается полиэдральная методология решения дискретных задач терминального управления динамическими объектами в условиях ресурсных ограничений. Рассматривается концепция оптимального терминального упреждающего управления и вводится в рассмотрение вспомогательная базовая задача оптимального планирования траекторий. Основу полиэдральной методологии составляет формализм полиэдральной оптимизации и три теоретически конструкции: прогнозная экстраполяция управляемых движений объекта, принцип инвариантного погружения исходной оптимизационной задачи в ряд алгоритмически более простых вычислительных задач и механизм экстремального прицеливания. Применяется стратегия упреждающего управления на основе многошаговой экстраполяции динамики объекта, причем прогноз на каждом шаге повторяется и, в итоге, получается двойной эффект: во-первых, реализуется виртуальная обратная связь; во-вторых, реализуется «управление со скользящим интервалом прогноза». В результате, алгоритмизация базовой задачи оптимального планирования основана на сведении к задаче линейного программирования. При этом для реализации решения задачи оптимального терминального упреждающего управления по принципу алгоритмической обратной связи предлагается использование стратегии позиционно-программного управления. Эффективность представленной полиэдральной методологии иллюстрируется решением задачи упреждающего импульсного управления непрерывным объектом третьего порядка со скалярным входом и двумерным выходом.
Терминальное управление; ресурсные ограничения; многошаговый прогноз; полиэдральная оптимизация; принцип погружения; экстремальное прицеливание.
A.B. Filimonov, N.B. Filimonov
THE POLYHEDRAL FORMALIZATION OF DISCRETE TERMINAL CONTROL PROBLEMS WITH RESOURCE CONSTRAINTS
The polyhedral methodology of the solution of discrete terminal control problems by dynamic objects in conditions of resource constraints is discussed. The conception of optimal terminal look-ahead control is considered and the auxiliary base problem of optimal design of trajectories is introduced into consideration. The formalism of the polyhedral optimization and three theoretical structures such as: the prediction extrapolation of controlled movements of object, the principle of immersion of input optimization problem in a number of the simpler computing problems algorithmically and mechanism of the extreme aiming consists in base ofpolyhedral methodology. The strategy of look-ahead control on the basis of multistep extrapolation of dynamic of object is used, moreover the prediction is repeated on every step and as a result is double effect: in the first place the virtual feedback is realized, and secondly "control with sliding prediction interval" is realized as a result the algorithmization of the base problem of optimal designing is based on re-
* Работа выполнена при поддержке РФФИ, грант № 13-08-00161.
duction to problem of linear programming. In this connection of the problem of optimal terminal look-ahead control on the principle of algorithmic feedback the utilization of strategy ofposition-al-programmed control is suggested. The effectiveness of the represented polyhedral methodology is illustrated by the solution of problem of look-ahead impulse control by the continuous object of the third order with scalar input and two-dimensional output.
Terminal control; resource constraints; multistep prediction; polyhedral optimization; principle of immersion; extreme aiming.
В современной теории и практике автоматического управления все большую популярность приобретают стратегии управления с прогнозом, обладающие способностью на основе информации о динамике управляемого объекта предвосхищать его будущее поведение. Концепция упреждающего управления динамическими объектами с многошаговым прогнозом, впервые предложенная в работе авторов [1], получила развитие в работах [2-4; 5, п. 4; 6, п. 7.4]. В настоящей работе обсуждается полиэдральная методология решения дискретных задач упреждающего терминального управления динамическими объектами в условиях ресурсных ограничений на основе принципов инвариантного погружения и экстремального прицеливания.
Концепция упреждающего управления. Рассматриваемый класс линейных дискретных объектов управления описывается векторным разностным уравнением состояния вида
x[0 +1] = Ax[0] + Bu[0], (1)
где 0е Z+ - дискретное время; x е X = Rи - состояние, u eRг - управляющий
ТЪ ИХИ ^ Т) ПХГ
е R , B е R .
Полагаем, что управление ограничено, т.е. задана область допустимых управлений:
Далее
u е U е Rг. (2)
x[0] = x о. (3)
Задано целевое множество состояний объекта
G с X.
В частном случае G является одноточечным множеством:
G = {xF}, (4)
где x F е X.
Рассмотрим следующую задачу терминального управления: объект (1) необходимо перевести за конечное время из начального состояния (3) в целевое множество (4) в условиях ресурсных ограничений (2).
В случае разрешимости задачи пусть 9FeZ+ - момент времени перевода объекта в целевое множество:
x[0F]eG. (5)
Введем требование оптимальности процесса управления - он должен завершаться за минимальное время:
0F ^min . (6)
Через 0 * обозначим минимальное значение этого критерия, а через u * [0] и
x*[0] - соответствующие ему оптимальное управляющее воздействие и оптимальную фазовую траекторию.
Решение задачи будем основывать на прогнозной экстраполяции управляемых движений объекта. Пучок всех возможных траекторий его движения из некоторого состояния x длительностью в h шагов можно описать дискретной формулой Коши:
т—1
~=Aтx + £AT—V—1 Bu[v], T=1:h. (7)
v=0
Введем дополнительные обозначения:
♦ Пй (x) с X - множество состояний объекта, достижимых из состояния X
не более чем за h шагов;
♦ O(x) с X - множество всех достижимых из x состояний объекта:
Q(x) = lim П h (x) .
Элементы данных множеств, очевидно, представляются формулой (7).
Далее полагаем, что исследуемая задача терминального управления разрешима, т.е.
G с Q(x о). (8)
Условие (5), (6) означает, что
П(xo) Пg=0 ^ h <eF .
Алгоритмизацию решения данной задачи будем основывать на принципе инвариантного погружения [7], получившего широкое применение в методологии динамического программирования для многошаговых дискретных процессов оптимального управления [8]. Суть данного принципа заключается в погружении исходной оптимизационной задачи в ряд алгоритмически более простых вычислительных задач.
Базовая задача оптимального планирования траекторий. Введем некоторую меру расстояния точек пространства состояний x е X до целевого множества (8) - dist(x, G).
Для применения принципа погружения нам потребуется вспомогательная оптимизационная задача в следующей формулировке.
Заданы:
1) критерий близости состояний к целевому множеству;
Q(x)=dist(x, G);
2) интервал времени управления: e = 0 : h—1;
3) некоторая точка пространства состояний ^еХ, лежащая вне целевого множества ^ ^ G .
Необходимо найти управляющее воздействие U[e] (e=0:h—1) и порождаемую им траекторию x[e] (e=1: h ) , выпущенную из этой точки:
x[0] = \ , (9)
которая приближает состояние объекта к целевому множеству G на минимально возможное расстояние:
Qx[h]) ^min. (10)
Данную задачу будем называть базовой задачей оптимального планирования траекторий, сокращенно - БЗОПТ(^, h), а финальную точку x[h] будем именовать точкой прицеливания.
Траектория движения объекта в соответствии с (7) определяется равенствами:
0-1
х[0]=A+ £ A0-v-1 Bu[v] (е=1: h), (11)
v=0
где
ü[v]eU (v=0 :h-1) . (12)
Предложение. Пусть в семействе задач:
БЗОПТ(х0,1), БЗОПТ(х0,2), ..., БЗОПТ(х0,h") (13)
точка прицеливания ít[h* ] последней задачи и только она попадает в целевое множество G:
0(X[h * ]) = 0 . (14)
Тогда решение последней задачи БЗОПТ(х0,h*) дает также решение исходной задачи предельного быстродействия (6):
и*[0] = и[0], х*[0] = i[0], 0F = h* .
Итак, здесь принцип погружения воплощается семейством вспомогательных задач (9), (10), решением которых являются стратегии упреждающего управления на основе многошаговой экстраполяции динамики объекта и принципа экстремального прицеливания.
Полиэдральная формализация задачи управления. Задачи (13) относятся к классу задач математического программирования. Они характеризуются выбором целевой функции Q^), критерием оптимальности (10) и ограничениями (9), (11), (12).
Дальнейшую формализацию и метод решения БЗОП будем основывать на концепции и аппарате полиэдрального программирования [2].
Применение полиэдральной методологии требует постулирования полиэдральной структуры для области управления U , целевого множества состояний G и целевой функции Q^) .
Полагаем, что область допустимых управлений U является r-мерным параллелепипедом:
U = {и = col(w1, u2, ..., ur )| u < ui < Ui, i =1: r},
где U < 0 < Ui - заданные предельные значения управляющего входа Ui.
Считаем, что целевое терминальное множество состояний G также является полиэдром и задано полиэдральным неравенством
G = {х | У(х) < 0}, (15)
где V(x) - некоторая полиэдральная функция.
Принципиальное значение имеет следующее свойство функции V (x) : вне множества G она принимает положительные значения и может служить мерой расстояния до его границы. В связи с этим в качестве такой меры расстояния будем использовать следующую модификацию функции V (x):
Q^) = max{ V(х), 0}. Отметим, что эта функция неотрицательна и вне множества G совпадает с V (x). В случае, когда G является одноточечным множеством (4), в качестве целевой функции Q(x) можно принять функцию вида
Q^) =V (х - х f) , где V(x) - некоторая полиэдральная норма.
Вследствие описанной выше формализации решаемые оптимизационные задачи БЗОПТ(%, h) будут иметь полиэдральную структуру. Важно подчеркнуть, что алгоритмизация данных задач в конечном итоге основана на их сведении к задачам линейного программирования (ЗЛП).
Принцип алгоритмической обратной связи. Итоговым результатом решения задачи терминального управления является оптимальное программное управление u*[9]. Наряду с этим теоретический и практический интерес представляет организация процессов терминального управления по принципу обратной связи.
В этом случае целесообразно воспользоваться сформулированной Дрейфусом (S.E. Dreyfus) стратегией программно-позиционного управления - формировать гибкие, циклически обновляемые (в частности, на каждом шаге) программы.
Суть такого подхода состоит в том, чтобы рекуррентно решать соответствующую задачу оптимального планирования траекторий на каждом шаге процесса управления. Именно, полагаем
%=x[6]
и решаем семейство задач {БЗОПТ(%,h),h=1:h*} до выполнения условия (14). Задаче БЗОПТ(%, h* ) отвечает управляющая программа
{U [0], u [2], ..., u [h*-i]},
первая дискрета которой и определяет текущее значение управляющего входа:
u[0] = U [0].
Итак, на каждом шаге управления объект направляется по вычисленной экстремальной траектории - благодаря рекуррентному характеру такой процедуры как раз и формируется управляющая обратная связь.
В изложенном подходе применяется стратегия упреждающего управления на основе многошаговой экстраполяции динамики объекта. В конкретных инженерных приложениях может возникнуть необходимость в снижении вычислительной нагрузки на управляющий контроллер посредством априорного фиксирования глубины прогноза h е Z+, h > 0, и решения на каждом шаге управления лишь одной экстремальной задачи БЗОПТ(%, h). Прогноз повторяется на каждом шаге и, в итоге, получается двойной эффект: во-первых, реализуется виртуальная обратная связь; во-вторых, реализуется «управление со скользящим интервалом прогноза». Заметим, что обоснование данной стратегии дано Н.Н. Красовским в виде принципа локальной эквивалентности позиционного и программного управлений.
Пример. Рассмотрим задачу упреждающего импульсного управления непрерывным объектом. Пусть n = 3, m = 2, r=1. Динамика объекта в непрерывном времени t описывается уравнениями:
x=Ax+Bu, y = Cx,
где x=col( x1, x2, x3), y=col(x, x2 ),
"0 1 0 " " 0 "
A = 0 0 1 , В = 0
0 -1/T2 - 22, / T 1/T2
С =
причем T > 0. Ограничения на управление:
| u | < M.
Передаточная матрица объекта по каналу «вход-выход» равна
>i(s)"
W(s) =
где
W1(s) =
s(T 2 s 2 + 2^Ts+1)
W2(s)
W2(S)=
T 2 s 2 + 2^ Ts + 1
Объект включен в цепь импульсного управления с экстраполятором нулевого
порядка, в которой непрерывное время квантуется с периодом квантования Td,
так что дискреты процесса управления (отсчеты аналоговых сигналов) определяются равенствами:
u[0]=u(0Td), x[0]=x(0Td), ^[0]=^(0Td).
Далее полагаем T=4, £ = 0,35 , M=2, Td = 0,25.
Пусть Gw с X - рабочая (Work) зона объекта управления и вне ее находится критическая (Alarm) зона GA = X\ Gw. В случае попадания состояния объекта в последнюю он должен принудительно возвращаться в рабочую зону Gw наискорейшим образом. Таким образом, здесь целевое множество G=Gw.
Полиэдр G зададим в виде трехмерного куба, определяемого неравенством (15), где
V(x)=max{| Xi |, | Х2 |,| X3 |}-1.
Положим, что применяется стратегия полиэдрального «управления со скользящим интервалом прогноза», причем глубина прогноза фиксирована и равна h=10.
На рис. 1 показаны проекции дискрет фазовых траекторий движения объекта x[0] на координатную плоскость (x, x2 ) из четырех начальных состояний:
1) x(0) = col(-10,0,0) ; 2) x(0) = col(0,5,0);
3) x(0) = col(10, - 5,0); 4) x(0) = col(0, - 5,5) .
ч 0
о О " о о
2
О о
G
-10 -5
0
X,
Рис. 1. Проекции дискрет фазовых траекторий движения объекта из четырех
начальных состоянии
Там же представлена проекция целевого полиэдра С.
На рис. 2 приведены графики дискретных управляющих сигналов и[0], отвечающих этим вариантам движения объекта.
1
1
5
1
4
3
5
0
1
'????? 9 ? ? •
3
2 a 0 -2« i i 2
. X X11
3
0 ■ 2 ;-
о -
-2 г
4
0 1
2 3 4 5
t
Рис. 2. Дискретные управляющие сигналы для четырех вариантов движения
объект а
2
БИБ ЛИОГРАФИЧЕСКИЙ СПИСОК
1. Филимонов А.Б., Филимонов Н.Б. Дискретное регулирование линейных объектов методом наискорейшего спуска // Современные технологии в задачах управления и обработки информации: Труды междунар. науч.-техн. семин. - М.: МАИ, 1997. - С. 96-98.
2. Филимонов А.Б., Филимонов Н.Б. Упреждение в дискретных процессах управления техническими объектами // Новые технологии управления движением технических объектов // Труды I-й междунар. конф. - Ставрополь: НП НИИ СУП, 1999. - С. 54-56.
3. Филимонов Н.Б. Дискретное упреждающее управление динамическими объектами // Интеллектуальные системы: Труды Пятого Междунар. симп. - М.: МГТУ им. Н.Э. Баумана, 2002. - С. 131-135.
4. Filimonov N.B. Discrete Control by Dynamic Objects with Multistep Prediction // Proc. of the 16th Intern. Соп£ on Systems for Automation of Engineering and Research. - Sofia: Print. House of USB, 2002. - P. 53-57.
5. Филимонов Н.Б. Полиэдральное программирование в дискретных задачах управления // Информационные технологии. Приложение. - 2004. - № 1. - 32 с.
6. Филимонов Н.Б. Методы полиэдрального программирования в дискретных задачах управления и наблюдения // Методы классической и современной теории автоматического управления: Учебник в 5-и т. Т. 5. Методы современной теории автоматического управления. Гл. 7. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2004. - С. 647-720.
7. Касти Дж., Калаба Р. Методы погружения в прикладной математике. - М.: Мир, 1976. - 224 с.
8. Беллман Р. Процессы регулирования с адаптацией. - М.: Мир, 1964. - 359 с.
Статью рекомендовал к опубликованию д.т.н., профессор Г.Н. Лебедев.
Филимонов Александр Борисович - Московский государственный университет приборостроения и информатики; e-mail: [email protected]; 107996, г. Москва, ул. Стромынка, 20; тел.: 89032929125; кафедра компьютерных информационно-управляющих систем; д.т.н.; профессор.
Филимонов Николай Борисович - Московский государственный университет им. М.В. Ломоносова; e-mail: [email protected]; 119991, Москва, ГСП-2, Ленинские горы; тел.: 89165147102; кафедра физико-математических методов управления; д.т.н.; профессор.
Filimonov Aleksandr Borisovich - Moscow State University of Measurements and Information; e-mail: [email protected]; 20, Stromynka street, Moscow, 107996, Russia; phone: +79032929125; the department of computer information-control systems; dr. of eng. sc.; professor.
Filimonov Nikolay Borisovich - M.V. Lomonosov Moscow State University; e-mail: [email protected]; Leninskie Gory, Moscow, 119991, Russia; phone: +79165147102; the department of physics and mathematical methods of control; dr. of eng. sc.; professor.