С. В. Завадский
СТРУКТУРНО-ПАРАМЕТРИЧЕСКАЯ ОПТИМИЗАЦИЯ В ЗАДАЧЕ СТАБИЛИЗАЦИИ ПЛАЗМЫ
1. Введение. В последние десятилетия пристальное внимание уделяется проблемам термоядерного управляемого синтеза. Для проведения экспериментов с плазмой в установках токамак необходима система управления с обратной связью для контроля над током, формой плазмы и ее положением. В связи с этим на передний план выступают задачи анализа и синтеза стабилизирующих регуляторов тока и формы плазмы в токамаке. Данным вопросам посвящены исследования Д. А. Овсянникова, Е. И. Вере-мея, А. П. Жабко [1-7]. В большинстве работ для решения поставленной задачи используются идеи и методы LQG-оптимального синтеза [1, 3]. Результатом LQG-алгоритма является комбинированный контроллер, объединяющий линейный пропорциональный регулятор и фильтр Калмана. Но в связи с большой размерностью и сложностью структуры модели объекта управления LQG-подход применяется к ее редуцированному аналогу. В статье предложен структурно-параметрический подход, дополняющий существующий LQG-инструментарий. Он позволяет провести параметрическую оптимизацию переходных процессов с учетом структуры объекта управления полной размерности. В рамках данного подхода выполнена оптимизация переходных процессов полной замкнутой системы управления плазмой в токамаке, когда рассматривается полноразмерный объект управления, замкнутый регулятором пониженной размерности. Минимизируемый в ходе оптимизации интегральный критерий качества задан на динамике огибающей траекторий объекта, моделирующей переходный процесс, возмущенный не одним, а целым множеством начальных возмущений. В функционал введены терминальные члены, что позволяет оценить траектории в конечный момент времени управления.
2. Математическая постановка задачи стабилизации тока и формы плазмы. Линейные системы широко используются в задачах построения систем управления сложными объектами. Синтез регулятора, стабилизирующего форму плазмы в токамаке ITER, выполняется на основе линеаризации дифференциальных уравнений, описывающих поведение плазмы. К полученному LTI-объекту применяется LQG-алгоритм аналитического конструирования регуляторов. Для полноты изложения приведем основные идеи и методы этого подхода. Уравнения объекта управления в пространстве состояний имеют вид
х = Ах + Ви,
У = Сх,
где х € Еп - вектор пространства состояний; и € Ег - вектор управлений; у £ Ек -вектор измерений; А, В, С - известные матрицы. На траекториях системы введен квадратичный функционал качества
т
J (y*(t)Ry(t) + cou*(t)Qu(t)) dt, (1)
о
© С. В. Завадский, 2007
здесь Д и <5 - положительно-определенные симметрические весовые матрицы функционала.
Замыкание объекта управления синтезированным регулятором осуществляется по схеме на рис. 1.
—► и Объект управления У
Регулятор формы
Рис. 1. Замыкание объекта управления.
Под синтезом регулятора понимается такой выбор параметров ЬТ1-звена регулятора, что замкнутый объект устойчив и минимизируется квадратичный функционал качества (1), заданный на траекториях замкнутой системы. Первое слагаемое в функционале (1) отвечает за точность управления и характеризует скорость протекания переходных процессов, а второе соответствует энергетическим затратам и оценивает величину входной переменной. Вклад каждого из двух членов в критерии зависит от константы со. Получить матрицы регулятора, обеспечивающего экспоненциальную устойчивость замкнутого объекта управления и минимизирующего квадратичный критерий качества, позволяет ЬОС-подход. В основе данного алгоритма лежит теорема о разделении [8], позволяющая разбить исходную задачу на две независимых. Первая -задача аналитического регулятора, решением которой является матрица К линейного регулятора вида
и = Кх,
минимизирующего квадратичный критерий качества
СЮ
J (у*(г)Ду(£) + Со и*(<)<3«(^)) (П.
о
Вторая - задача оптимального наблюдения при наличии шумов в канале измерений и канале управлений. Ее решением является матрица Н наблюдателя вида
г = Аг + Ви — Н(у — Сг), (2)
минимизирующего функционал невязки
(<ТШ(*)) = (х(*) - Ф))Т {*{*) - Ф)) ■
Решение исходной задачи объединяет полученную матрицу обратной связи К и наблюдатель (2) в регулятор вида
i = Аг + Ви — Н(у — Сг), и = Кг.
Алгоритмы получения матриц К и Н подробно рассмотрены в работах [4, 8]. Но необходимо отметить, что, ввиду большой размерности объекта управления, сначала выполняется его редукция, а затем по редуцированному объекту строятся матрицы К и Н. Далее рассмотрим подробнее управление регулятором пониженной размерности.
3. Управление регулятором пониженной размерности. Под размерностью регулятора понимается количество компонент его вектора состояний. Размерность регулятора играет большую роль в системе управления. Чем она больше, тем сложнее и дороже реализовать регулятор на практике. В случае цифровой системы управления с возрастанием размерности регулятора многократно увеличивается время вычислений. Построение регулятора с помощью ЬС^С-оптимального синтеза дает такую же размерность, что и у объекта управления. На практике же часто оказывается, что и регулятор более низкой размерности обеспечивает вполне приемлемые динамические характеристики. В этом случае выполняют редукцию объекта управления.
Исходный объект управления имеет г входов, к выходов, п состояний и описывается матрицами А, В, С. Процедура редукции дает объект с таким же количеством входов и выходов (г и к соответственно), но с меньшим числом состояний - т < п. Пусть полученный объект описывается матрицами Аг, Вг. Сг. Представим исходный и редуцированный объекты на рис. 2.
I
У[кх\] ~ ^[Ь«]*[мх1]
II
г'[с*п—► = АГ[„„, „]*[,ЯХІ] + -1]. ► У\Ы
II Г} 1
Рис. 2. Исходный (I) и редуцированный (II) объекты.
При этом матрицы Аг, Бг, Сг в процессе редукции выбираются так, чтобы минимизировать разность
I \Gijw) | - \Grijw) | | ->■ тіп,
где | и \Grijw) | - АЧХ исходного и редуцированного объекта соответственно.
Далее выполним синтез ЬС^-оптимального регулятора для редуцированного объекта. Для пары (Аг, Вг) строим оптимальную матрицу регулятора Кг, а для пары (АТ, Сг) - оптимальную матрицу фильтра Калмана Нг. Построенные таким образом регулятор и фильтр Калмана замыкают полный объект управления:
х = Ах + В и, у = Сх,
£ = Агг + Вги + Нг(у — Сг-г), и — Кгг.
4. Параметрическая оптимизация регулятора полноразмерной системы.
В рамках структурно-параметрического подхода основное внимание уделяется структуре объекта управления и тому, как в нее входят оптимизируемые параметры. Структура модели управления плазмой в токамаке ITER достаточно сложна. Модель представляет собой цепочку соединенных динамических звеньев (рис. 3), в которой имеются две подцепочки, соединенные параллельно: подцепочка вертикального регулятора и подцепочка регулятора формы плазмы. В процессе отработки регулятором возмущений эти подцепочки взаимно влияют друг на друга.
Так как структурно-параметрический подход требует некоторого начального решения, то исследование может быть проведено в два этапа. Первый включает в себя редукцию модели и LQG-синтез начального регулятора. Второй этап - параметрическая оптимизация полученного регулятора с учетом матричной структуры полноразмерного замкнутого объекта управления, причем здесь анализируется переходный процесс, возмущенный некоторым множеством отклонений от состояния равновесия.
Проведем параметрическую оптимизацию регулятора, замыкающего полноразмерную систему объекта управления. В замкнутую цепочку полноразмерной системы входят следующие динамические LTI-объекты:
1) уравнения состояния плазмы в токамаке;
2) регулятор вертикального смещения плазменного шнура;
3) линейные фильтры в канале диагностики;
4) динамика системы питания управляющих электромагнитов;
5) регулятор тока и формы плазмы.
Соединение указанных LTI-объектов и их размерности схематично представлены на рис. 3.
Рис. 3. Схема замкнутой системы управления положением плазмы.
В результате объединения этой схемы получим LTI-объект размерности [112 х 112]
х =
Ар О О 0 врс,
W^wpGp Аи,р Bwpcv О О
О ВуСщр Av О О
О Bfcwp О А! О
О О О BcCf
[ О Схир О О о ] X,
(3)
где матрицы Ас, Вс, Сс являются параметрами и далее будут подлежать оптимизации. Элементы этих матриц объединим в вектор параметров р = {рг}, где каждый параметр имеет свой индекс. Пусть Р - матрица линейной системы (3). Обозначением Р(р) подчеркнем ее зависимость от оптимизируемых параметров. Промоделируем динамику огибающей траекторий для системы (3). И на огибающей траекторий введем интегральный квадратичный функционал качества. Пусть в пространстве Rn задан эллипсоид, охватывающий множество начальных возмущений:
(х0 - х0У G0 (х0 - х0) = 1, (4)
здесь х0 - центр эллипсоида, a Go - симметричная положительно-определенная матрица размерностью п х п, задающая эллипсоид. Сдвиг эллипсоида вдоль решений системы (3) есть также эллипсоид с центром в точке x(t) [9, 10]
(х — x(t))* D-1(£) (х — x(t)) = 1, (5)
где D{t) - матрица вторых моментов, обратная к которой задает эллипсоид (5). При этом центр эллипсоида x(t) и матрица вторых моментов D(t) определяются в каждый момент времени из уравнений
х = Р(р)х,
(6)
с начальными условиями
D = P(p)D + DP*(p)
х(0)=хо, D(0) = D0 — Gq
(7)
(8)
Таким образом, здесь под £>о понимается матрица, обратная матрице, задающей эллипсоид, ограничивающий множество начальных состояний системы (3). Тогда диагональные элементы с?и(£) матрицы £)(£) будут давать квадраты максимальных отклонений Xi — на эллипсоиде (х — х{{))* (х — х(£)) = 1. В таких случаях
говорят, что диагональные элементы матрицы /)(£) описывают движения огибающей траекторий, выходящих из начального эллипсоида (4).
Тогда введем функционал, который позволит следить за динамикой (или отклонением от номинальных режимов) одновременно как центра эллипсоида (5), так и огибающих траекторий, выходящий из начального эллипсоида (4):
1
I(p) - J [sp(BD) + <p(t,x{t))} dt + sp(GD(T)) + g(x(T))
О)
О 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0
б
Рис. 4■ Переходные процессы с исходным (а) и оптимизированным (б) регулятором.
где В, <7 - заданные весовые симметрические матрицы; (р, д - заданные функции; Т -фиксировано; хЦ) - центр тяжести пучка; £>(£) - матрица вторых моментов. Преобразуя функционал стандартным образом [7, 8], получим представление для вариации функционала (9) и градиента функционала по параметрам р = {р*}
61
в котором
= _ f [г№Рр(р)т+ ,1Пх
J sp(D(t)e(t)ApP(p) + Q(t)D(t)ApP*(p))]dt , [W)
О
А рР = Р(р + Ар)-Р(р), (11)
0 = -0Р - Р*в - В, 0(Г) = -G, (12)
4, = _А.ф+{Шжу, = <13,
Градиент рассматриваемого функционала по параметрам задает выражение
Э1_ _ _ Г
dpi J
' ,,дР п / т^дР*
Ф т—х + 2 sp QD—
dpi \ dpi
dt,. (14)
На основе аналитических выражений (6)-(14) создан программный комплекс, реализующий градиентный спуск [11] функционала (9) по параметрам р = {р;}.
4. Результаты численной оптимизации. Представим на рис. 4 результат работы вычислительной программы. Оптимизировались огибающие переходных процессов для первых б компонент вектора измерений у\..... у§, соответствующих б зазорам между сепаратрисой магнитного поля (определяющей горячую область плазмы) и стенкой камеры токамака. На рис. 4, а, б представлены огибающие переходных процессов. Напомним, что они описывают квадраты максимальных отклонений. На рис. 4, а изображены огибающие переходных процессов объекта, замкнутого исходным регулятором, полученным LQG-синтезом для редуцированной модели; на рис. А, б - огибающие переходных процессов после параметрической оптимизации регулятора. На рисунке видно, что исходный регулятор отрабатывает заданное множество начальных возмущений за 1,8-2 с, оптимизированный - за 1-1,2 с. Значение функционала в процессе оптимизации изменилось на 10%.
5. Заключение. В данной работе рассматриваются вопросы, связанные с синтезом регулятора формы плазмы в токамаке ITER. Представлены математическая модель объекта и задача оптимальной стабилизации по отношению к интегральному квадратичному функционалу. Уделено внимание существующему подходу к решению данной задачи, в основе которого положены алгоритмы LQG-оптимального синтеза и редукции системы управления. Как дополнительный инструмент решения поставленной задачи предложен структурно-параметрический подход. В рамках данного метода для регулятора, полученного стандартным путем, проводится параметрическая оптимизация с учетом матричной структуры полноразмерного замкнутого объекта управления. В процессе оптимизации анализируется переходный процесс, возмущенный некоторым множеством начальных отклонений от состояния равновесия. Представлены результаты работы программного комплекса.
Summary
Zavadsky S. V. Structural parametric optimization in a plasma stabilization problem.
Problems of plasma shape control and stabilization in tokamak are reviewed. The parametric optimization of a plasma shape controller is suggested.
Литература
1. Ovsyannikov D. A., Veremey E. I., Zhabko A. P. et al. Mathematical methods of plasma vertical stabilization in modern tokamaks // Nuclear Fusion. 2006. Vol. 46. P. 652-657.
2. McArdle G. J., Belyakov V. A., Ovsyannikov D. A., Veremey E. I. The MAST plasma control system // Proc. 20th Intern. Symp. on Fusion Tecnology. SOFT’98. Marseille, France. 1998. P. 541-544.
3. Ovsyannikov D. A., Zhabko A. P.. Veremey E. I. et al. Plasma current and shape stabilization with control power reducing // Proc. of the 5th Intern, workshop “Beam Dynamic &; Optimization”. St.Petersburg, 1998., P. 103-111.
4. Ovsyannikov D. A., Veremey E. I., Zhabko A. P. at al. Mathematical methods of tokamak plasma shape control // Proc. of the 3th Intern, workshop “Beam Dynamic & Optimization”. St.Petersburg, 1996. P. 218-229.
5. Misenov B. A., Ovsyannikov D. A., Ovsyannikov A. D. et al. Analysis and synthesis of plasma stabilization systems in tokamaks // Control Application of Optimization: Preprints of the Eleventh IFAC Intern. Workshop. St.Petersburg, 2000. P. 249-254.
6. Misenov B. A., Ovsyannikov A. D., Ovsyannikov D. A. et al. Non-linear model of tokamak plasma shape stabilization // Intern, conf. on Informatics and Control (ICI&C’97). St.Petersburg, 1997. P. 382-388.
7. Misenov B. A. Computational aspects of plasma shape control synthesis problem // Proc. of 2nd Intern, workshop “Beam Dynamics and Optimization”. St.Petersburg, 1995. P. 138-145.
8. Алиев Ф. А., Ларин В. Б., Науменко К. И., Супцев В. Н. Оптимизация линейных инвариантных во времени систем управления. Киев: Паукова думка, 1978. 327 с.
9. Овсянников Д. А., Егоров II. В. Математическое моделирование систем формирования электронных и ионных пучков. СПб.: Изд-во С.-Петерб. ун-та, 1998. 276 с.
10. Овсянников А. Д. Совместная оптимизация программного и возмущенных движений: Учеб. пособие. СПб.: НИИ химии С.-Петерб. ун-та, 2002. 53 с.
11. Васильев Ф. П. Численные методы решения экстремальных задач. М.: Наука, 1980. 518 с.
Статья рекомендована к печати членом редколлегии проф. Д. А. Овсянниковым.
Статья принята к печати 22 февраля 2007 г.