УДК 62.501
Вестник СибГАУ 2014. № 3(55). С. 28-34
О НЕПАРАМЕТРИЧЕСКОМ УПРАВЛЕНИИ СТОХАСТИЧЕСКИМ ОБЪЕКТОМ С ПАМЯТЬЮ
А. В. Банникова1, А. А. Корнеева1, М. Е. Корнет2, Н. А. Сергеева1
1 Сибирский федеральный университет Российская Федерация, 660041, г. Красноярск, просп. Свободный, 79 Е-шаЛ: [email protected] 2Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
Е-mail: [email protected]
Рассматривается задача непараметрического управления дискретно-непрерывным процессом кислородно-конвертерной плавки стали. Приводятся некоторые результаты моделирования процесса кислородно-конвертерной плавки стали, которые показывают, что процесс ведется в рамках технологического регламента, однако этого не достаточно для качественного управления процессом плавки. Приводятся некоторые результаты моделирования в случае, когда расчетное управляющие воздействие поступает на реальный объект в искаженном в силу ряда причин виде. Предложена двухконтурная схема управления процессом, в которой контур управления, включающий в себя оператора, сохранен, но добавлен внешний контур управления, несущий в себе черты дуализма.
Ключевые слова: идентификация дискретно-непрерывных процессов, непараметрическое управление, объект с памятью, дуальное управление, непараметрическая регрессия, непараметрическая идентификация кислородно-конвертерной плавки.
Vestnik Б&ОЛИ 2014, N0. 3(55), Р. 28-34
ABOUT NONPARAMETRIC CONTROL OF OBJECT WITH MEMORY
A. V. Bannikova1, A. A. Korneeva1, M. E. Kornet2, N. A. Sergeeva1
1 Siberian Federal University 79, Svobodnyi prosp., Krasnoyarsk, 660041, Russian Federation Е-mail: [email protected] 2 Siberian State Aerospace University named after academician M. F. Reshetnev 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation Е-mail: [email protected]
This article discusses the problem of nonparametric control of discrete-continuous process of BOF steel smelting. The problem of identifying objects with stochastic discrete - continuous nature of the process is also considered. Additionally, the problem of identification and management of multidimensional stochastic systems is investigated in a closed loop, i. e. in the form of a macroscopic object, including a system to - regulator. Moreover, the emphasis is not only on the presence of random noise in different channels of communication, but also on the lack of information about the course of the process. Special attention is paid to the case when the design is applied to control the impact of a real object in a distorted. The dual-process control scheme, in which the control circuit comprising operator saved but added external control loop that carries the features of dualism is proposed. This control scheme allows to increase the quality of management of the entire system as a whole significantly. Some results of numerical simulation of the two-loop circuit control are given. Some results of the modeling process of BOF steel smelting show that the process is conducted in the framework of technological regulations, however, it is not enough for quality control smelting process.
Keywords: Identification of discrete-continuous processes, nonparametric control, object with memory, dual control, nonparametric regression, nonparametric identification for oxygen-converter steelmaking.
Введение. Проблема моделирования, идентификации надолго останется одной из центральных проблем теории управления. Эта проблема продолжает оставаться актуальной для различных реальных процессов дискретно-непрерывного типа.
Предметом исследования настоящей статьи является построение обучающегося, адаптивного управляющегося устройства [1; 2], которое в процессе функционирования улучшает рабочие свойства управляющей системы процесса конвертерной плавки. Прежде всего необходимо произвести моделирование процесса выплавки стали. Кислородно-конвертерная плавка представляет собой процесс изготовления стали из жидкого чугуна без затраты топлива путем продувки чугуна в конвертере технически чистым кислородом, подаваемым через фурму, которая вводится в металл сверху. Управляет процессом кислородно-конвертерной плавки оператор. Вследствие быстротечности процесса оператор должен достаточно быстро принимать управленческие решения, опираясь при этом во многом на свой профессиональный опыт, а также на технологический регламент процесса плавки. Разработка адекватной модели конвертерной плавки предназначена, прежде всего, для ее использования в системе управления.
Моделирование процесса конвертерной плавки стали. В работе рассматривается процесс конвертерной выплавки стали [3], который может быть представлен в виде схемы (рис. 1), на которой показаны входные-выходные переменные процесса.
Входные контролируемые переменные можно разделить на управляемые по ходу процесса и неуправляемые. Применительно к процессу кислородно-конвертерной плавки контролируемыми управляемыми переменными являются: и1 - расход кислорода на продувку, м3, и2 - расход кислорода на прогрев, м3, расход материалов, т (и3 - известь, и4 - электродный бой, и5 - флюс ФОМИ, и6 - ФМ-1, и7 - агломерат офлюсованный, и8 - уголь ССО), и9 - продолжительность продувки, мин, и10 - расстояние между кислородной фурмой и уровнем ванны конвертера.
В качестве контролируемых неуправляемых по ходу плавки переменных выступают: - расход чугуна, т, химический состав заливаемого чугуна, % (ц2 - кремний (81), ц3 - магний (Мп), ц4 - сера (8), -фосфор (Р)), ц6 - температура чугуна, С°, ц7 - расход лома, т.
Хим. состав заливаемого чугуна. %
Температура чугуна, °С
Расход материалов, т
Расстояние между кислородной фурмой и уровней ванны конвертера
Продолжительность продувки
Температура металла на повалке, °С
Хим. состав металла на повалке, %
Хим. состав конечного шлака на повалке, %
Рис. 1. Входные и выходные переменные процесса конвертерной плавки
К помехам £,(/), действующим на процесс, относят различные трудноформализуемые факторы. К таким факторам можно отнести состояние сталевы-пускного отверстия, тепловое состояние футеровки ковша перед постановкой на выпуск, угар, усвоение присадок и др.
Векторная выходная переменная х(г) характеризует качество конечного продукта кислородно-конвертерной плавки, а именно: химический состав металла на повалке, % (х1 - углерод (С), х2 - магний (Мп), х3 - сера (8), х4 - фосфор (Р)), химический состав конечного шлака на повалке, % (х5 - СаО, х6 -8Ю2, х7 - БеО, х8 - MgO, х9 - А1203, х10 - 8, хи - МпО, х12 - Р205, х13 - ТЮ2, х14 - У205), х15 - температура металла на повалке, С°.
Векторная переменная ю(г) представляет собой дополнительные сведения о ходе процесса, которые оператор использует для управления: ю1 - состав конвертерных газов и ю2 - температура конвертерных газов, С°.
Для исследования процесса кислородно-конвертерной плавки использовалась выборка входных-выходных переменных {и,, , х,}, г = 1,35, где и = (и1,и2, ..., и8), ц = (щ,ц2, ..., ц7), х = (х1,х^ ..., х15) . Выборка представляла собой измерения, полученные при выплавки стали марки Ст3пс/Э в ККЦ № 2 ОАО «ЕВРАЗ Западно-Сибирский металлургический комбинат».
Важнейшей выходной переменной является векторная переменная «химический состав металла на повалке», %. Для вычислительного эксперимента были построены 4 непараметрические модели вида
£ х,. П ф( (и - и/))
х* (и ) = -(1)
£Пф( ( - и/))
г=1 j=1
где I = 1,4, объем выборки в данном случае был равен 5 = 35.
Для оценки полученных моделей была использована квадратичная ошибка
Я* = 1 £ (х, - х* ), (2)
5 г=1
где х, - измеренное значение выходной переменной; х* - полученная оценка; Я* - квадратичная ошибка.
Непараметрические модели были построены в режиме «скользящего среднего» для выходных переменных х1, х2, х3, х4. Полученные результаты представлены в таблице, где показаны: квадратичная ошибка моделирования Я* (2), оценка дисперсии Б* выхода объекта х,, а также ошибка прогнозирования
Ш = Я* / Б.
Из таблицы видно, что ошибка прогнозирования достаточно велика. Это говорит о том, что полученный прогноз является достаточно грубым.
Результаты вычислительного эксперимента
Элемент Показатель
Ошибка Я5 Оценка дисперсии Б* выходной переменной хг Отношение Ш
Углерод, С (хО 0,00019778 0,000234 0,845
Марганец, Мп (х2) 0,0004301358 0,0005404 0,85
Сера, Б (х3) 0,00000755 0,00001183 0,64
Фосфор, Р (х4) 0,00004077 0,000041137 0,99
Вычислительные эксперименты показали, что управление процессом кислородно-конвертерной плавки ведется неудовлетворительно, но, тем не менее, соответствует технологическому регламенту. Иными словами, в рамках технологического регламента управляемый процесс представляет собой «облако», т. е. переменные процесса могут принимать произвольные значения из всей области определения переменных, регламентируемой технологической картой. На нынешних предприятиях технологический регламент чаще всего достаточно широк, и если процесс ведется в рамках технологического регламента, но не рациональным образом, то ожидать конечного продукта высокого качества не следует.
Непараметрическая идентификация в условиях малой текущей информации. Следует отметить, что действия оператора регламентируются технологической картой, а также опытом управления данным объектом. Зачастую его действия по корректировке входных управляемых воздействий по тем или иным причинам не контролируются. Это приводит к тому, что при моделировании исследователь сталкивается с неполнотой текущей информации об объекте, а также о значениях управляемых воздействий, поступающих на объект. В этом случае исследование процесса построения модели представляет специальный самостоятельный процесс.
Пусть объект представляет собой динамическую систему и описывается уравнением: х(г) = /(х(г -1),х(г - 2), ...,х(г - к),и(г),ц2(г),
ц3(г)), где к определяется на основании имеющейся априорной информации. Блок-схема рассматриваемого динамического процесса представлена на рис. 2, где приняты следующие обозначения: х(г) - выходная переменная процесса, и(г) - входное воздействие, ц(г) = {ц1(г), ц2(г), М3(/)} - вектор входных неизвестных, но контролируемых воздействий, х(г - 1), х(г - 2) -выходы объекта в предыдущих состояниях, и (г) -неизвестное входное воздействие, х*(г) - задающее воздействие, х(г) - выход модели объекта, г - непрерывное время. Контроль переменных осуществляется через интервал времени Дг. Таким образом, мы имеем выборку входных-выходных переменных
{xi,,,ц13,и1,г = 1,*} , где 5 - объем выборки, УУ -
устройство управления, блок Н - выполняет роль сумматора входных воздействий и (г) и Ди(г).
Рис. 2. Блок-схема моделирования динамического процесса
Следует заметить, что х(/ - 1), х(/ - 2) фактически играют роль ц(/), но отличаются от ц(/) тем, что представляют собой значения выходной переменной на один и более тактов позже, что и характерно для объекта с памятью.
В данном случае задача идентификации состоит в оценивании класса операторов на основе выборки
{х, X-ъ X-2> Мъ> М2 > Мш Щ >' = 1. В качестве непараметрической модели объекта можно использовать непараметрическую оценку [4]:
¿ X .ф()ф(Ís-L-^
-)ф(-
- Xi_
)
xs (и, ц) =
i=1
!ф(
i=1
ф (■
U,, Uj X 1 X; Л-L )ф(^-1-L
cs cs
■Цц
1)ф(-
- X,
) -ф(
iM ) ,ф( Ь*
Cs
"H-3i
ф (
l^n) -ф(
iM) ,ф( Ь*
(3)
где Ф( ) - ядерная колоколообразная функция; ех -
коэффициент размытости ядра, которые удовлетворяют следующим условиям сходимости [4].
> 0; Ф(с-1 (и - щ )) < да;
с-1 | Ф(с-1(м - щ = 1; (4)
lim cs = 0;
Q(u )
lim с-1Ф(с- (и - u)) = 8(u - u),
lim scSm = да;
Рассмотрим действие исследуемой задачи в ходе численного исследования. Пусть исследуемый объект является динамическим и описывается уравнением вида
x(t) = 0,1x(t -1) + 0,2 x(t - 2) + 3,09u(t) + +1,03ц1 (t) +1, 05ц2 (t) + 2,03ц3 (t), где x(t) - выходная переменных процесса; u(t) -входная переменная процесса; x(t -1), x(t - 2) - значение выходной переменной в предыдущие моменты времени; ^j(t),^2(t),^3(t) - контролируемые воздействия.
Пусть входное воздействие имеет вид u(t) = 2 + 2 sin(0,2 t).
Входное воздействие, поступающее на объект, примем в виде U (t) = 2 + 1,8sin (1,8t), t) = 0,5 • cos (0,5 • t),
l2(t) = 0,35 • cos (0,4 • t), |3(t) = 0,2 • sin (0,6 • t).
На рис. 3 представлены графики входных воздействий процесса.
Рассмотрим модели, полученные при различных входных данных. Установим значения переменных: шаг дискретизации - 0,2, объем выборки - 150, помехи отсутствуют (рис. 4).
Квадратичная ошибка модели, представленной на рис. 4, равна 1,54, относительная - 0,36. Как мы можем увидеть из графика функций и значения относительной ошибки, модель получилась достаточно грубой. Сравним полученный результат с моделированием ситуации, когда все входные воздействия, действующие на объект, известны (рис. 5).
Здесь квадратичная ошибка равна 0,16, относительная - 0,03. Как мы и предполагали, модель, полученная в условиях полной текущей информации о входных воздействиях, намного качественней.
Как и следовало ожидать, в первом случае модель объекта с памятью оказалась грубее, чем во втором, при этом важно отметить, что нарушения технологического регламента не происходило. Как и следовало ожидать, действия оператора существено сказываются на управлении, хотя ведутся в рамках технологического регламента. Также была рассмотрена зависимость ошибки моделирования от шага дискретизации и уровня помех. Приведенные исследования открывают возможность для построения внешнего контура управления в дальнейших исследованиях с целью оптимизации ведения технологического процесса в рамках технологического регламента.
Непараметрическое двухконтурное управление процессом конвертерной плавки. Пусть объект представляет собой динамическую систему и описывается уравнением
x(t) = f (x(t - 1), x(t - 2), ..., x(t - k), U(t), |1(t), 12 (tX 13 (t
где k определяется на основании имеющейся априорной информации. Блок-схема рассматриваемого динамического процесса представлена на рис. 6.
х
Рис. 3. Входное управляемое воздействие (а); вектор неизвестных воздействий (б)
Рис. 4. Выход модели и выход объекта при недостатке текущей информации
Рис. 5. Выход модели и выход объекта при полной текущей информации
Х(1)
Рис. 6. Двухконтурная схема управления процессом конвертерной плавки стали
б
а
Примечательно, что в вышеописанной схеме контур управления, включающий в себя оператора, сохранен, но добавлен внешний контур управления, несущий в себе черты обучаемости и дуализма. Для него объект и оператор (УУ) являются своеобразным макрообъектом.
Очевидно, что управляющие устройство является внешним контуром управления, который позволяет улучшить качество управления объекта.
Дуальное управление. Дуальное управление было открыто А. А. Фельдбаумом и развито на основе теории статистических решений [5]. Такой путь предполагает знание априорной плотности распределения случайных возмущений и параметров управляемого объекта. Если же эти плотности распределения неизвестны, то нужно искать, видимо, новые пути решения задач.
Из изложенного видно, что обучающиеся системы управления являются системами «с памятью», т. е. они не только способны изучать характеристики объекта, но и, сохраняя их в памяти, вырабатывать оптимальные управляющие воздействия. Теория непараметрических систем управления достаточно подробна изложена в [2].
Непараметрический алгоритм дуального управления, подробно описанный в [2], имеет вид
Us+1 = U* + Aus+1
(5)
где в и* сосредоточены «знания» об объекте; Aus+1 - «изучающие» поисковые шаги:
Aus+1 =S( x*+1 -xs ).
(6)
В этом и состоит дуализм алгоритма (5). Составляющая и* из (5) будет равна:
£иг ——)Ф(x*-1 x-1)Ф(x-2 x-2)
С,,
Us =
г=1
£ ф(x-xi-)ф( xs-1 xi-1 )ф( xs-2 xi-2 )
C„ С с.
Ф( ^s |1г )ф(|2S |2г )ф( М3* М3г )
,_C_s_С_Cs
Ф( M1s - М1г )Ф( М2s - М2г )ф( M3s - М3г )
(7)
г=1
где x - задающее воздействие.
Проанализируем характер дуализма алгоритма (5). На начальной стадии управления основная роль принадлежит второму слагаемому Aus+1 формулы (5). Это случай активного накопления информации в системе дуального управления, который начинается с появления первого наблюдения входной и выходной переменных объекта. По мере процесса обучения (накопления информации) всё возрастающую роль при формировании управляющего воздействия us+1 начинает играть
первое слагаемое, т. е. и*. Таким образом, в процессе дуального управления объектом фигурируют как этап изучения объекта, так и этап приведения его к цели.
Приведем некоторые результаты вычислительного эксперимента. Пусть исследуемый объект является динамическим и описывается уравнением вида
x(t) = x(t -1) + 2 x(t - 2) + 3x(t - 3) + + u(t) + |j(t) + |2(t) + 2|3(t),
где x(t) - выходная переменных процесса; u(t) -входная переменная процесса; x(t -1), x(t - 2) - значение выходной переменной в предыдущие моменты времени; |j(t), |2(t),|3(t) - контролируемые воздействия.
Пусть входное воздействие имеет вид u(t) = 2 + 2sin(0,2t). Входное воздействие, поступающее на объект, примем в виде U(t) = 2+1,8sin (1,8t), |1(t) = 0,5 • cos (0,5 • t), М2 (t) = 0,35-cos (0,4 • t), Цз(0 = = 0,2 • sin (0,6 • t).
На рис. 7 представлена работа системы управления при ступенчатом задающем воздействии в отсутствии помех.
Рис. 7. Работа системы управления при ступенчатом задающем воздействии в отсутствии помех
Рис. 8. Работа системы управления при ступенчатом задающем воздействии, помеха 10 %
На рис. 8 изображен случай, когда на объект действует помеха, величиной 10 %.
Подводя итог, следует заметить, что рассматривается очень важная с практической точки зрения задача идентификации в замкнутом контуре для дискретно-непрерывных процессов в условиях непараметрической неопределенности. Актуальность этой задачи обусловлена тем, что при управлении техническими процессами контур управления, включающий оператора, сохранен, но добавляется внешний контур управления, что существенно улучшает качество управления системы в целом.
Приводятся некоторые результаты моделирования процесса кислородно-конвертерной плавки стали, которые показывают, что процесс ведется в рамках технологического регламента, однако этого не достаточно для качественного управления процессом плавки. Приводятся некоторые результаты моделирования в случае, когда расчетное управляющие воздействие поступает на реальный объект в искаженном в силу ряда причин виде.
Основное внимание уделяется построению непараметрической системы дуального управления. Обсуждается проблема дуализма при управлении дискретным непрерывным процессом. Изложены результаты вычислительного эксперимента. Как и следовало ожидать, введение внешнего контура позволяет повысить качество регулирования процесса.
Библиографические ссылки
1. Цыпкин Я. З. Адаптация и обучение в автоматических системах. М. : Наука, 1968. 400 с.
2. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983. 174 с.
3. Воскобойников В. Г. Общая металлургия. М. : Металлургия, 1998. 768 с.
4. Надарая Э. А. Непараметрические оценки плотности вероятности и кривой регрессии. Тбилиси : изд. Тбил. ун-та, 1983. 194 с.
5. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М. : Физматгиз, 1963. 552 с.
References
1. Tsypkin J. Z. Adaptacia I obuchenie v av-tomaticheskih sistemah [The adaptation and learning in automatic systems]. Moscow, Nauka Publ., 1968, 400 р.
2. Medvedev A. V. Neparametricheskie sistemy adap-tacii [Nonparametric adaptation systems]. Novosibirsk, Nauka Publ., 1983, 174 p.
3. Voskoboinikov V. G. Obschaya metallurgia [Overall Metallurgy]. Moscow, Metallurgia Publ., 1997, 768 p.
4. Nadaraya E. A. Neparametricheskie ocenki plot-nosti veroyatnosti i krivoj regressii [Non-parametric estimation of the probability density and the regression curve]. Tbilisi, izd. Tbil. un^, 1983, 194 p.
5. Feldbaum A. A. Osnovi teorii optimalnih av-tomaticheskih system [Fundamentals of the theory of optimal automatic systems]. Moscow, Fizmatgiz Publ., 1963, 552 p.
© Банникова А. В., Корнеева А. А., Корнет М. Е., Сергеева Н. А., 2014