Верифицированный алгоритм координации для иерархических гибридных систем управления
Тележкин В.Ф., Угаров П.А. ([email protected]) Южно-Уральский государственный университет, г. Челябинск
Введение
Основной задачей, решаемой при проектировании иерархической системы управления, является разработка алгоритмов координации, используемых для согласования работы автономно функционирующих подсистем. До последнего времени основное внимание уделялось координации при решении оптимизационных задач и координации в линейных динамических системах [1, 2]. С другой стороны, в последние десять лет активно развивается теория гибридных систем, в которой рассматривается управление сложными распределенными объектами, сочетающими в себе как дискретные, так и непрерывные компоненты [3]. В теории гибридных систем используются специальные методы управления, основанные на вычислении множеств достижимости разного рода в гибридном (дискретно-непрерывном) пространстве состояний Q х X . Сложность вычисления этих множеств может быть достаточно велика даже для объектов невысокого порядка, поэтому для гибридных систем особенно актуально использование декомпозиционных подходов. Однако вопросы построения гибридных систем управления по иерархическому принципу пока еще мало изучены. Поэтому большой интерес представляет разработка алгоритмов координации, учитывающих применение элементами нижнего уровня методов управления, основанных на вычислении множеств достижимости в пространствах состояний агрегатов объекта управления.
Важнейшими задачами при проектировании систем управления являются обеспечение безопасности функционирования сложных технических объектов и верификация поведения системы в условиях неопределенности. Верифицированный алгоритм координации позволяет гарантировать определенные значения показателей качества верхнего уровня в условиях действия помех и неопределенностей. Он должен быть основан на использовании оптимальных гарантий при обмене информацией между элементами иерархической структуры, позволяющем локализовать действие помех и неопределенностей, специфичных для того или иного элемента.
Далее будем рассматривать координацию в двухуровневой системе, имеющей два элемента нижнего уровня и один элемент верхнего уровня (координатор). Эта структура соответствует системе управления ультразвуковой технологической установкой [4], в которой одна локальная система управляет подачей материала (СПМ), а другая - ультразвуковым генератором (УЗГ).
1. Агрегирования информации
Одной из особенностей иерархических систем является агрегирование информации, передаваемой на верхний уровень управления [2]. Элемент верхнего уровня (координатор) интересует не действительное текущее состояние всех элементов нижнего уровня, а некоторые показатели их работы на определенном интервале времени, то есть информация, позволяющая эффективно решать координирующую задачу управления. Следовательно, решение элемента верхнего уровня, связанное с выбором текущего координирующего воздействия, принимается по некоторым упрощенным моделям, отражающим поведение элементов нижнего уровня. Важно отметить, что эти упрощенные модели (абстракции) должны описывать не только сам объект управления, но и применяемые на нижнем уровне локальные регуляторы. Очевидно, что сам алгоритм координации в значительной мере определяется подходом к агрегированию информации, то есть способом стратификации системы [1].
В данной работе будем использовать дискретные абстракции, основанные на концепции поведения [5]. Под поведениями подразумеваются последовательности входных и выходных символов. К преимуществам поведенческих абстракций относятся лучшая точность по сравнению
Электронный журнал «Исследовано в России» 363 http://zhurnal.ape.relarn.ru/articles/2004/034.html
с абстракциями, основанными на прямой дискретизации пространства состояний, а также значительная гибкость. Каждая дискретная абстракция элемента нижнего уровня должна описывать работу некоторого гибридного объекта управления (агрегата) совместно с определенным множеством локальных регуляторов. Основой для построения абстракции является решение ряда задач синтеза наименее ограничивающих стабилизирующих регуляторов [6], в результате которого в пространстве состояний агрегата выделяются максимальные управляемые инварианты. Эти инварианты соотносятся с выходными символами поведения. Под входными символами понимаются законы управления (регуляторы), используемые для перехода из одного инварианта в другой.
Дискретную абстракцию одного элемента нижнего уровня, получаемую путем составления цепочек поведений, определим как кортеж вида А = (Ха,Я,Г,С,Я, Т,Б^. Я = {г(1),г(2),К ,г)}
- конечное множество законов управления (регуляторов), которые может использовать система управления нижнего уровня. Эти регуляторы робастны в том смысле, что они обеспечивают заданное верхним уровнем качество управления при условии, что на нижнем уровне помехи и неопределенности принадлежат множествам Б х , используемым при решении локальных
теоретико-игровых задач управления. Г = {Б(1),Б(2),К ,Б(} - допустимые множества в
гибридном пространстве состояний агрегата, Б(1) ^ Q х X. Данные множества строятся в соответствии с типом задачи, для решения которой будет использоваться дискретная абстракция. Например, они могут задавать области, через которые должно проходить состояние объекта в определенные моменты времени, связанные с безопасностью ограничения и т.д.
' = {Ж(1),Ж(2),К ,Ж№)} - максимальные управляемые инварианты агрегата [6],
соответствующие допустимым множествам Г. Каждое множество Ж(1) строится в результате теоретико-игровой задачи синтеза наименее ограничивающего регулятора, обеспечивающего удержание состояния системы в Б(1). Если в момент времени Хш гибридное состояние агрегата
принадлежит определенному инварианту, то есть (ц(Хпи), х(Х1п1Х)) еЖ(1), то существует такое управление, при котором УХ > Хш гарантируется выполнение включения (ц(Х), х(X)) е Б(1). Данная гарантия выполняется при условии, что помехи и неопределенности принадлежат множествам Б , использовавшимся при решении теоретико-игровой задачи синтеза управления.
Ха = {х^, х^2),К , х^Х)} - конечное множество состояний абстракции. Состояние
абстракции А с поведением длиной I в момент времени Хк определяется как последовательность вида
[Ж (Хо)], к = 0, (Хк) = <([[(Х0),К ,Ж(Хк)],[г(Х0),К ,г(Хк_1)]), к = 1,К ,/, ([[(Хк-/),К ,Ж(Хк)],[г(Хк-/),К ,г(Хк-1)]), к > /. Каждый момент времени Х соответствует окончанию решения некоторой задачи, поставленной перед элементом нижнего уровня координатором, например, моменту входа агрегата в определенный целевой инвариант. В этот момент на верхний уровень передается информационный сигнал, в котором содержится текущее (обновленное) состояние соответствующей дискретной абстракции. На основании этого сигнала, а также информации о том, в каком состоянии пребывают абстракции остальных элементов нижнего уровня, координатор принимает решение по выбору следующего регулятора, который будет использоваться данным элементом нижнего уровня. Конечность множества Хл следует из того,
что ' , Я и / конечны. В качестве состояний дискретной абстракции используются только те строки, которые может генерировать исходная система.
С ^ Хл х Хл - переходное отношение между состояниями дискретной абстракции (далее
также обозначается как ^). Если переход из 1-го состояния в ] -е возможен, то (х^))е С
(х%) ^ х(;)) . В противном случае (), х(;)) й C . R = (Я.) - матрица, определяющая множества регуляторов, с помощью которых выполняется переход из г -го состояния дискретной абстракции в . -е состояние: Я. с Я; (х£), х%)) е C ^ Я. ^ 0, (х'^), х^)) й C ^ Я. =0. T = (Тг]) - матрица,
определяющая время перехода из одного состояния в другое: Т. с (0,да). Множества Т. вычисляются в результате решения дифференциальных гибридных игр, поэтому гарантируется,
что действительное время перехода ху ^ х(;) будет принадлежать соответствующему множеству Т . независимо от действий дискретных и непрерывных помех и неопределенностей, которые были
учтены при решении соответствующей теоретико-игровой задачи управления. B = (в. ) - матрица,
определяющая множества в пространстве состояний агрегата, которым гарантированно принадлежит состояние при переходе из -го состояния дискретной абстракции в . -е при условии использования регуляторов R.
Пусть множество Т = {^0,^,,К } включает все моменты времени, в которые происходит смена состояния дискретной абстракции элемента нижнего уровня. Множество всех функций, задающих отображение Т ^ Яа х W, обозначим как (Я% х W )Т . Поведением элемента нижнего уровня Ва будем считать некоторое подмножество данного множества, совместимое с действительной гибридной моделью агрегата и используемыми локальными регуляторами. Таким образом, Ва с (( х W)Т . Ограничение поведения дискретной абстракции элемента нижнего уровня определяется следующим образом [5]:
Вка = {ък е (Я, W) |зЪк + е(Я, W) + : \_Ък, Ък+] е Ва}
Рис. 1. Дискретная абстракция элемента нижнего уровня 1 (СПМ + САУ СПМ).
Дискретные абстракции строятся для каждого элемента нижнего уровня. Например, для первого элемента (СПМ + САУ СПМ) определяются три локальных регулятора г(г) е {г(1),г(2),г(3)} .
Здесь г(1) - наименее ограничивающий стабилизирующий регулятор. При работе этого регулятора состояние системы удерживается в определенном максимальном управляемом инварианте Ж(г) с Г(г). Так как этот режим является наименее ограничивающим, при его использовании может выполняться оптимизация собственной эффективности агрегата [4]. г(2), г(3) - переходные регуляторы, используемые для перевода состояния системы из одного инварианта в другой (на всем интервале движения гарантируется включение гибридного состояния системы в определенное множество В . , соответствующее переходу из -го состояния абстракции в . -е
состояние). г(2) используется для движения в направлении увеличения значения переменной
используется для движения в направлении уменьшения х1 . Далее
состояния х
а г
Электронный журнал «Исследовано в России» 365 http://zhurnal.ape.relarn.ru/articles/2004/034.html
определяются допустимые множества, инвари- анты и все остальные компоненты абстракции.
Итоговая абстракция, имеющая 22 состояния, представлена на рис. 1. Для состояний ха',К ,х( в прямоугольниках приведен диапазон значений переменной состояния х1 , определяющий соответствующий инвариант. Для остальных состояний используется запись вида «1 ] s», где 1, ] е {1,К , - номера предшествующего и текущего инвариантов, ^ е {+, -} - регулятор,
который использовался для перехода («+ » соответствует г(2), «- » соответствует г(3)). Рис. 2 поясняет соответствие между некоторым элементом нижнего уровня и соответствующей ему дискретной абстракцией, которой оперирует система управления верхнего уровня (координатор).
Программа переключений Р,
{элемент нижнего уровня 1
Локальная система управления С,
Гибридный
объект управления Р}
дхХ
Дискретный координатор-супервизор
Регулятор гГ
Регулятор
Регулятор г™
\
\
ч
\
Дискретная абстракция элемента нижнего уровня
Траектория для графа + длительности переходов с управляемым временем:
Р,
Неопределенность поведения отражается множествами времени перехода между состояниями
Рис. 2. Соответствие между элементом нижнего уровня и дискретной абстракцией
2. Алгоритм координации
С помощью дискретных абстракций можно анализировать траектории в пространстве показателей элементов нижнего уровня, а не в пространстве состояний объекта управления. Например, если у каждого из двух элементов нижнего уровня имеется единственный показатель, при решении задачи координации достаточно рассматривать двумерное пространство, в то время как общее количество непрерывных и дискретных переменных состояния гибридных агрегатов объекта управления может быть достаточно велико.
Глобальная целевая функция определяется как Г0(ё0). Здесь - показатели
качества элементов нижнего уровня, = (ё10,К ,ё°)'е Б0 - вектор помех и неопределенностей
верхнего уровня. Данная целевая функция позволяет определить оптимальный установившийся режим элементов нижнего уровня. Задачей управления в переходном режиме является перевод агрегатов в такие подмножества пространств состояний, из которых в дальнейшем будет осуществляться вход в установившийся режим [4]. Естественно, этим подмножествам должны соответствовать такие значения показателей качества, которые максимизируют Г0. При этом ^ и
можно рассматривать как агрегированные переменные состояния системы и решать задачу
Электронный журнал «Исследовано в России» 366 http://zhurnal.ape.relarn.ru/articles/2004/034.html
поиска траектории в глобальном двумерном пространстве состояний. При построении дискретных абстракций для элементов нижнего уровня уже введены допустимые множества в
пространствах состояний агрегатов Б1 = {Е1(1),Е1(2),К } и Б2 = {Р2(1),Р2(2),К ,Е,№2)}, поэтому
выбор целевых множеств для перехода сводится к определению элементов множеств Б1 и Б2. Индексы целевых множеств для первого и второго элементов / и ]^ определяются решением по
Штакельбергу следующей статической игровой задачи, в которой выбор пары индексов допустимых множеств осуществляется игроком-лидером, а выбор элементов из этих допустимых множеств, а также значений глобальных помех и неопределенностей осуществляется ведомым игроком:
((, ) = ,. та* ... П , ^С^ ^ё (1)
Каждое из отображений П1 и П2 позволяет определить значение показателя качества нижнего уровня для любой точки пространства состояний агрегата. Например, для первого элемента нижнего уровня (СПМ + САУ СПМ) П1 является проекционным отображением на ось
переменной состояния х1.
В результате решения задачи (1) для элементов нижнего уровня определяются целевые
множества Е^2') и р(1/2). Действия координатора должны быть направлены на улучшение
некоторых свойств переходов, значимых с точки зрения верхнего уровня иерархической системы управления. Эти свойства задаются показателями качества верхнего уровня. Будем рассматривать два свойства: быстродействие и интегральную квадратичную оценку близости к оптимальному режиму во время осуществления перехода
1 Т!!
1 = Т-1 [Р0(^),*2(0,АО) - ад*(АО),^(ё0(0), АО)]2 Л. (2)
0
ГТ1 1—Г^ 1—г^
Здесь 13 - время перехода системы в целевое множество; г1 , г2 - оптимальные значения показателей качества нижнего уровня для заданного вектора помех и неопределенностей верхнего уровня ё ).
Рассмотрим средства, которыми располагает координатор для улучшения значений показателей качества верхнего уровня. Если для абстракции элемента нижнего уровня А1 (А2) известны начальное х1(ё0)( х2ё0)) и конечное х^')(х2)) состояния, то существует множество
траекторий Е1 (Е2), соединяющих эти состояния. Каждая траектория определяется как последовательность состояний дискретной абстракци. Например, для первого элемента:
Ук е{0,К, /'} : х^) е X
-1 =
К = (хОсО х(г1) К х)\
Ь1 — (^Ы > Л1ё 5х4- 5 Л1ё )
Ук е{0,К, /' -1}: ((), х1ё^)С
(3)
Выбор элементов множеств Е1 и Е2 выполняется координатором в соотвествии с целями верхнего уровня иерархической системы. Траекториям и К2 соответствуют последовательности 01 и 02 интервалов времени перехода между состояниями дискретной абстракции. Для первого
элемента 01 = (а<(^©^К ,01(г/'"()^, 01 е Т^ х хК хТ^^ . Например, (о\4) является
длительностью перехода х^) ^ х^+1), к = 1,К ,(/' -1) . Данные последовательности неоднородны
в том смысле, что одни их элементы соответствуют переходам с управляемым временем (то есть работе в режиме стабилизации), а другие - переходам с неуправляемым временем. Обозначим первые элементы как Ои1 и 0.и2, а вторые как 0.ё 1 и 0.ё2. 01 =(Ои1, 02 = (Ц2,Ц2). Таким
образом, с точки зрения верхнего уровня управляемыми переменными являются , К2, Цл , Ц2. Они и передаются на нижний уровень в составе координирующих сигналов. Действия
Электронный журнал «Исследовано в России» 367 http://zhurnal.ape.relarn.ru/articles/2004/034.html
координатора направлены на максимизацию двух показателей качества верхнего уровня: YJ (быстродействие) и Y 2 (точность слежения).
YJ Qj,О2) = -Ts; Ts = max(T QJ),T2 (£2,О2)) - время перехода всей системы в
целевое множество. Здесь Tj О1)е [0,да) - время перехода дискретной абстракции A1 в целевой инвариант WJ'11) е F/'-1 ), T2 (2, О2) е [0, да) - время перехода A2 в W2() е F2(). Гарантия
Yg : Yg (2, Q„2 )=omin Yj Qui, Ou2, Qd J, Qd2 ).
Qd 1 ,od 2
Y2 (QJ3О2) - показатель близости к оптимальному значению глобальной целевой функции F0 на интервале времени [0, TS], определяемый как среднее значение интервальных гарантий J. Необходимость введения Y 2 обусловлена тем, что интегральная оценка (2) не может непосредственно использоваться при решении задачи координации. Ось времени т представим как последовательность интервалов оси реального времени In, то есть т = {In}, п е {1,K , NT}. In = [тп ,<] - замкнутые интервалы для всех n, Vn : тп <т'п, Vn > 1: тп =т'п_х, Vn : In е [0, TS].
NT
Также TS = -тп) . Гарантии рассчитывается отдельно для каждого интервала In, в течение
n=1
которого состояния дискретных абстракций элементов нижнего уровня не меняются, то есть выполняется переход из одного состояния в другое.
1 NT
2
(4)
- S n=1
Здесь Bn ,Bn - множества значений показателей качества элементов нижнего уровня на интервале времени In. Эти множества определяются тем, какие переходы дискретных абстракций выполняются на интервале In. Например, если на интервале времени In первый элемент нижнего уровня выполняет переход x(d ^ x(d}, а второй элемент выполняет переход x^j ^ x^™), то B(n = П( [Bj ], Bn = П2 [B2m ]. Определим гарантию показателя для определенного выбора траекторий
и управляемых параметров: Yf ((,£2,Ои1,Qu2)= min Y2.
Цг (,Цг 2
И так, координатор должен воздействовать на элементы управления таким образом, чтобы максимизировать показатели качества верхнего уровня Y( и Y2. Будем считать, что Y( является
приоритетным показателем, то есть переход в первую очередь должен осуществляться с максимальным быстродействием. Рассмотрим два случая, соответствующе наличию и отсутствию горизонтальных связей между агрегатами объекта управления.
При отсутствии горизонтальных связей координатор не может улучшить значение Y( по
сравнению с полностью децентрализованным управлением, то есть независимым выбором траекторий дискретных абстракций. Для этого случая будем считать, что задачей координатора является максимизация Yf при условии Yf > Yf, где Yj - оптимальная гарантия при децентрализованном управлении. Отметим, что время перехода всей системы в целом равно времени перехода «самого медленного» элемента нижнего уровня. Поэтому этот элемент можно выделить в качестве «ведущего» и использовать его траекторию максимального быстродействия в качестве опорной траектории. По этой траектории можно определить траекторию «ведомого» элемента. Последняя должна выбираться таким образом, чтобы улучшить гарантию Yf при условии, что гарантированное время перехода «ведомого» элемента не превысит гарантированное время перехода «ведущего» элемента. Как правило, при оптимизации гарантии Yf в основном
используется изменение траектории дискретной абстракции «ведомого» элемента нижнего уровня, а также длительностей переходов с управляемым временем, соответствующих этой траектории. Это обусловлено тем, что при условии сохранения общесистемного быстродействия имеется значительная свобода варьирования траектории более «быстрого» элемента.
Электронный журнал «Исследовано в России» 368 http://zhurnal.ape.relarn.ru/articles/2004/034.html
При наличии горизонтальных связей задача координатора является
лексикографической задачей оптимизации по двум показателям. В этом случае каждая из гарантий Tf, Tf зависит от выбора траекторий и параметров обеих абстракций.
Рассмотрим общую схему алгоритма координации, используемого при выполнении процедуры запуска и изменения режима. Процесс координации является «сквозным», то есть координирующая система всегда определяет полные траектории абстракций, но элементы нижнего уровня выполняют лишь первый шаг этих траекторий, а затем обращаются к координатору, который рассчитывает новые траектории. Каждая локальная система управления работает в том или ином режиме до тех пор, пока не будут выполнены определенные условия перехода в новое состояние дискретной абстракции. При использовании стабилизирующего регулятора r(1) таким условием является истечение времени, определенного координатором, а при использовании переходных регуляторов r(2) и r(3) - вход в определенные инварианты пространства состояний. Таким образом, элементы нижнего уровня значительную часть времени работают независимо. По окончании решения своих локальных задач элементы нижнего уровня
сообщают об этом координатору с помощью информационных сигналов у1 = ^ х^ ^ и у2 = ^ x2dа
в ответ получают координирующие сигналы Д* = , Q^) и в ={^2>, QU2), определяющие новые
траектории дискретных абстракций и длительности переходов с управляемым временем. Оба элемента нижнего уровня обращаются к координатору асинхронно. Координатор при необходимости может прервать работу одного элемента нижнего уровня в результате обращения на верхний уровень другого элемента нижнего уровня.
Предложенный подход концептуально близок к широко используемому в промышленности методу управления MPC (model predictive control - управление с предсказанием модели), который используется при решении задач управления в условиях неопределенности системами, описываемыми разностными уравнениями. MPC-регулятор также определяет полные «программы» управления, но на объект управления подается лишь первый отсчет найденной последовательности векторов управления. Далее опять определяется полная «программа» управления с учетом нового состояния объекта управления и модели объекта, которая постоянно обновляется работающими параллельно алгоритмами идентификации. Таким образом, реализуется управление с обратной связью.
Алгоритм координации с определением полных траекторий позволяет перевести систему в заданное целевое множество даже тогда, когда координатор не вмешивается в работу нижнего уровня после завершения каждого перехода дискретных абстракций, так как начальные траектории гарантируют вход в целевое множество за определенное гарантированное время. Таким образом, система будет работать даже в том случае, если координатор по каким-либо причинам не сможет оперативно реагировать на запросы элементов нижнего уровня. Причиной такого поведения координатора может стать нарушение межуровневых связей, загруженность координирующей системы управления решением других более важных задач и т. д. Однако, своевременное вмешательство координатора позволяет улучшить некоторые показатели работы системы при осуществлении перехода в целевое множество. Таким образом, иерархическая система управления обладает определенной робастностью по отношению как ко внешим помехам и неопределенносям, так и ко внутренним нарушениям структурных связей. Элементы нижнего уровня способны решать свои задачи независимо, и отказ координирующей системы управления не приводит к катострофическим последствиям, хотя и вызвает некоторое снижение количественных показаталей работы системы. Далее приведена детальная схема предлагаемого алгоритма координации.
Алгоритм координации
Исходные данные: A1, A2, F0.
Результат работы: Д* = QUi), Д* = QU2) •
Определение целевых (конечных) состояний дискретных абстракций элементов нижнего уровня. В качестве целевых принимаются состояния х^1) = ([^(г 11)]) и
х2 f) = (^ f)]).
<2> Определение текущих состояний дискретных абстракций элементов нижнего уровня.
Если до включения алгоритма выполнялось управление по дискретным абстракциям, то текущие состояния уже известны. В противном случае элементы нижнего уровня определяют, каким множествам W!о) и W2( io) принадлежит состояние объекта управления. На верхний уровень передаются индексы этих множеств, и координатор использует состояния дискретных абстракций х^о) = ([W !|o)]), x2 do) = ([W2( io)]). Иначе говоря, для каждого элемента нижнего уровня в качестве исходного режима принимается режим стабилизации.
<3> Поиск траекторий дискретных абстракций, обеспечивающих максимальное
быстродействие. По найденным абстракциям выбираются траектории в соответствии со следующими критериями максимального быстродействия: ¿¿0 = arg min Tf (¿¿) , ¿20 = arg min Tf (¿2). Например, если для первого элемента нижнего уровня ¿¿0 = {х^о), х^,К , x[f)} - оптимальная траектория, то ей соответствует следующее fl-i гарантированное время перехода из х^ в x[f): Tf ) = ^Л|T^ ч+1 ], где +1 являются k=0 элементами матрицы T1. Отображение Л выделяет единственный элемент множества T ¡к 1 следующим образом: если x|dk) ^ x1(dk+l) является переходом с управляемым временем (то есть соответствует работе в режиме стабилизации), то выбирается минимальный элемент множества 0. В противном случае выбирается максимальный элемент. Данное отображение позволяет однозначно определить Q1. Для поиска оптимальных траекторий ¿¿0 и ¿20 можно использовать любой метод поиска кратчайшего маршрута, динамическое программмирование и т.д. Так как количество состояний абстракций ограничено, время 00 решения этой задачи невелико. В дальнейшем траектории <д1 и ¿2 используются в качестве начальных точек при решении задачи координации. Им соответствует оптимальная гарантия Yf = - max (Tf (¿10), Tf (¿¿0)) . Также на данном этапе можно выбрать в качестве «ведущего» элемент нижнего уровня с наибольшим гарантированным временем перехода; для ультразвуковой технологической установки таким элементом будет первый элемент, то есть СПМ.
<4> Оптимизация гарантии для выбранных траекторий. Длительность переходов с
управляемым временем выбирается в результате решения следующей задачи: ((,QU2) = arg max Yf Цл,"u2), Yf "01,^2) > ^. Управляемыми Qu1,Qu 2 переменными (их выбирает «ведущий игрок») данной минимаксной задачи являются длительности работы элементов нижнего уровня в режиме стабилизации, а неуправляемыми переменными (их выбирает «ведомый игрок») являются длительности работы в переходных режимах. На практике можно ограничиться оптимизацией длительности управляемых переходов «ведомого» агрегата, оставив для «ведущего» агрегата решение задачи максимального быстродействия.
<5> Выбор новых траекторий дискретных абстракций. Дальнейшее улучшение работы
системы в переходном режиме возможно за счет выбора новых траекторий дискретных абстракций (¿,¿2). Траектория «ведущего» агрегата остается прежней, то есть ¿11 = ¿¿0. Выбирается новая траектория «ведомого» агрегата ¿2, обеспечивающая переход в целевое состояние x2f). Для этой траектории должно выполняться условие Tf (¿20) < -4%f . Для пары траекторий (¿¿,¿2) вновь решается минимаксная задача <4> и находятся новые значения Q^ , QU2. Если Yf (¿/,¿2, QI1, QU 2 )>Yf ¿%0, Q°u1, Q02) и Yf (¿/,¿2, QI1, QU 2 )>Y%, то
определяются новые текущие решения задачи координации: = , = £2, О^ = О^, О 12 = О'и2. При условии выполнения ^ (£,£2,О^,0}и2) > можно поменять и траекторию «ведущего» агрегата, то есть Поиск новых пар траекторий (£ ), 1 = 0,1,К продолжается до тех пор, пока не будет выполнено некоторое условие, определяющее окончание решения задачи координации: истечение времени, выделенного на решение этой задачи, получение удовлетворительного значения гарантии 42, полный перебор всех пар траекторий и т.д.
<6> Передача координирующих сигналов элементам нижнего уровня. На нижний уровень
передаются сигналы Д* = О^) и Д2* = (£*, О *и.
<7> Реализация элементами нижнего уровня заданных траекторий. Каждый элемент нижнего
уровня включает регулятор, соответствующий переходу между первыми двумя состояниями траектории. Если этот переход является переходом с управляемым временем, то элемент нижнего уровня работает в режиме стабилизации в течение интервала времени, заданного координатором. Если же время перехода неуправляемо, то элемент работает с заданным регулятором до тех пор, пока соответствующий агрегат не войдет в заданный целевой инвариант.
<8> Вмешательство координатора. Как только любой элемент нижнего уровня выполняет первый переход заданной траектории, он посылает координатору сигнал, содержащий информацию о текущем состоянии дискретной абстракции: ^ =(х^ ^ или у2 х2^ Координатор может определять новые траектории после каждого перехода любой абстракции в новое состояние, реализуя тем самым управление с обратной связью на верхнем уровне. Если координатор не отвечает на запрос элемента нижнего уровня, этот элемент выполняет второй переход определенной ранее траектории.
<9> Окончание перехода. При входе одного из агрегатов в целевой инвариант соответствующий элемент нижнего уровня переходит в режим стабилизации. Для второго элемента определяется траектория максимального быстродействия, которая передается на нижний уровень.
Когда оба агрегата объекта управления входят в целевые инварианты, переходная задача координации считается решенной. Далее координирующая система решает задачу поиска удовлетворительных решений, определяя допустимое множество показаталей качества нижнего уровня для работы в установившемся режиме [4].
Моделирование иерархической гибридной верифицированной системы управления является сложной задачей, потому что необходимо реализовать как модели и алгоритмы управления нижнего уровня, так и собственно алгоритмы координации, обеспечив необходимые связи между всеми элементами многоуровневой системы. Для решения этой задачи хорошо подходит система Мл^Ь, которая имеет средства для моделирования динамических систем (БтиНпк), большие возможности для выполнения сложных математических расчетов, необходимых при реализации алгоритмов координации, а также разнообразные средства визуализации получаемых результатов. Рассмотрим решение в Matlab процедуры запуска ультразвуковой технологической установки для определенных начальных условий и известной глобальной целевой функции. Пусть показатели качества нижнего уровня имеют начальные значения ^ = 1.2, Г2 = 0.55. Отсюда определяются индексы исходных состояний дискретных
абстракций элементов нижнего уровня (х^о),х2): /0 = 1, = 4, то есть в начальный момент
времени работают стабилизирующие регуляторы СПМ и УЗГ. По глобальной целевой функции
определяется целевое состояние (х'^1), х2)), 1п = 5, = 4. Декартово произведение
соответствующих целевых множеств выделено на рис. 3 прямоугольником. Также на этом рисунке эллипсами показаны линии уровня глобальной целевой функции. На рис. 3 (а) представлена траектория системы в пространстве показателей нижнего уровня, полученная с использованием предложенного алгоритма координации. Для сравнения на рис. 3 (б) приведена траектория,
Электронный журнал «Исследовано в России» 371 http://zhurnal.ape.relarn.ru/articles/2004/034.html
полученная при децентрализованном (независимом) управлении агрегатами по критериям максимального быстродействия. В таблице 1 сведены показатели качества верхнего уровня, полученные в каждом случае.
Таблица 1 - Показатели качества верхнего уровня для различных стратегий.
Тип управления - ^ Т1 Т х 2 I
Иерархическое управление (рис. 3 (а)) 12.28 12.28 12.6 1.29
Децентрализованное управление (рис. 3 (б)) 12.28 12.28 0 2.35
а) иерархическое управление б) децентрализованное управление
Рис. 3. Траектории системы в пространстве показателей элементов нижнего уровня.
Заключение
Предложенный алгоритм координации позволяет эффективно решать координирующую задачу при иерархическом управлении сложными гибридными объектами. Основой для построения алгоритма является метод агрегирования информации с использованием поведенческих абстракций. Одним из главных преимуществ алгоритма является то, что он позволяет анализировать динамическое поведение системы в пространстве показателей элементов нижнего уровня. Таким образом, снижается вычислительная сложность задачи управления на верхнем уровне. Кроме того, данный алгоритм хорошо согласуется с известными методами теории гибридных систем, основанными на построении множеств достижимости. По сути, он позволяет осуществлять эффективную декомпозицию задачи поиска множества достижимости. Результаты моделирования системы управления ультразвуковой технологической установкой в Мл^Ь показали значительное преимущество иерархического управления с координацией по предложенному алгоритму по сравнению с децентрализованным управлением.
Электронный журнал «Исследовано в России»
Список литературы
1. Месарович М., Мако Д., Такахара И. Теория иерархических многоуровневых систем. - М.: Мир, 1973. - 344 с.
2. Алиев Р.А., Либерзон М.И. Методы и алгоритмы координации в промышленных системах управления. - М.: Радио и связь, 1987. - 208 с.
3. Тележкин В.Ф., Угаров П.А. Синтез многоуровневых систем управления с гарантированным качеством // В кн.: Механика и процессы управления. Труды XXXII Уральского семинара. -Екатеринбург: Уральское отделение РАН, 2002. - С. 340-345.
4. Approaches to modeling, analysis and control of hybrid systems / R.K. Boel, B. De Schutter, G. Nijsse, G.M. Schumacher, J.H. van Schuppen // Journal A. - December 1999. - V. 40, № 4. - P. 1627.
5. Raisch J. Discrete Abstractions of Continuous Systems - an Input/Output Point of View // Mathematical and Computer Modelling of Dynamical Systems. Special issue on Discrete Event Models of Continuous Systems - 2000. - V.6, № 1. - P. 6-29.
6. Tomlin C., Lygeros J., Sastry S. A game-theoretic approach to controller design for hybrid systems // Proceedings of the IEEE. - 2000. - V. 88, № 7. - P. 949-970.