УДК 681.5.015
ИДЕНТИФИКАЦИЯ ОБЪЕКТА ПО РЕЗУЛЬТАТАМ ЕГО НОРМАЛЬНОЙ ЭКСПЛУАТАЦИИ
В ЗАМКНУТОМ КОНТУРЕ УПРАВЛЕНИЯ
В.А. Кривоносов, Ю.В. Дурнева
В статье рассматривается задача идентификации линейного динамического объекта по результатам его нормального функционирования в замкнутой системе управления. Показано, что оценки метода наименьших квадратов (МНК-оценки) являются смещенными. Предложен алгоритм коррекции МНК-оценок, позволяющий устранить смещение
Ключевые слова: идентификация, динамический объект, возмущающее воздействие, метод наименьших квадратов, коррекция
Введение
Одной из центральных задач в проблеме построения адаптивных систем управления является задача идентификации динамического объекта по результатам его нормального функционирования в замкнутом контуре управления. Структурная схема контура приведена на рис. 1.
Рис. 1. Структурная схема контура управления
Чаще всего задача идентификации для реальных промышленных объектов решается с использованием МНК. Однако режим нормального функционирования замкнутой системы управления имеет ряд характерных признаков [1,2], существенно усложняющих процедуру идентификации:
1) В режиме нормального функционирования задание y (t) изменяется, как правило, в достаточно узких пределах, а управляющее воздействие u(t) направлено, в основном, на подавление возмущения f(t). Поэтому диапазон изменения u(t) соизмерим с величиной неконтролируемого возмущения f(t), а диапазон y(t) - с погрешностью измерения выхода e(t). То есть соотношение сигнал/шум в данных нормальной эксплуатации является достаточно низким.
2) Наличие обратной связи приводит к тому, что сигналы u(t) и y(t) связаны не только оператором объекта, но и оператором регулятора, что необходимо учитывать в процедуре идентификации. Такая зависимость может вообще приводить к неидентифицируемости объекта [2].
3) Действие регулятора вызывает корреляцию сигнала u(t) с возмущением f(t) и погрешностью измерения e(t), а динамика объекта - корреляцию
Кривоносов Владимир Алексеевич - СТИ МИСиС, канд. техн. наук, доцент, E-mail: [email protected] Дурнева Юлия Валериевна - СТИ МИСиС, аспирант, тел. (4725) 328-091
у© с предысторией процесса ОД, что нарушает
предпосылки [2] применения МНК для получения несмещенных, состоятельных оценок параметров объекта в процессе идентификации.
Поэтому разработка конструктивных процедур идентификации динамических объектов по
результатам их нормального функционирования в замкнутом контуре управления остается в настоящее время актуальной проблемой.
Постановка задачи
Пусть объект управления в замкнутой системе, приведенной на рис.1, описывается разностным уравнением п-го порядка
п т
М![к] = £ а^[к - і] +^ Ь^[к - ;], (1)
1=1 ^=1
у[к ] = м![к ] + п[к ]; v[k ] = и[к ] + / [к ],
где у[ к ] и w[ к ]- вход и выход объекта;
/[к] и п[к] - возмущающее воздействие и
погрешность измерения выхода соответственно;
и [к ] и у[к ] - управляющее воздействие и
результат измерения выхода, используемые в качестве входных и выходных данных в процедуре идентификации;
аі, Ь] - неизвестные параметры объекта.
Возмущение /[к ] представляет собой стационарный случайный процесс с известной автокорреляционной функцией Я/ [і], например,
Я/ [і] = • е““І‘1, (2)
где Б/ и а - известные статистические характеристики / [ к ] .
Погрешность измерения г/[к ] является
последовательностью некоррелированных
случайных величин
Яот[‘] = Ч-£И, (3)
где - известная дисперсия погрешности ц[к];
(1 при к = 0;
8[к ] = \ - символ Кронекера.
[0 при к Ф 0
Последовательность rj[k] некоррелирована с возмущением f [k], предысторией сигналов u[k] и
Ук]
Rfv[j] = 0 V i ;
і N
Rnu[i] = limNZn[j] • u[j + i] = 0Vi < 0; (4)
N j=1 і N
Rny [i] = lim N Ш j] • y[j+i] = 0 Vi < 0. (5)
N^& N j=1
Разностное уравнение регулятора имеет вид:
#]=X c-u[k - i]+X Jje[k - j]’
j=0
(6)
e[k ] = y*[k ] - y[k ],
где у [к] - текущее значение задания;
є[к] - сигнал рассогласования (ошибка
регулирования);
Сі, ^ - известные параметры регулятора.
Необходимо определить неизвестные параметры аі, Ь] объекта, структура (1) которого известна
априорно, по результатам обработки последовательностей и[к ] и у [к ] (к = 1, ...,К) экспериментальных данных, полученных в результате нормальной эксплуатации замкнутой системы управления (1), (6). Статистические
характеристики (2) и (3) возмущения и помехи измерения известны априорно.
Для сокращения дальнейших выкладок будем считать, что в уравнении (1) т = п, а в уравнении (6) 11 = 12 = I. Последние предположения не являются принципиальными, а введены только для уменьшения громоздкости последующих формул.
МНК-оценка параметров объекта
Перепишем уравнение (1) объекта в матричном
виде
Y = H• A + E + ¥• A ,
где YT = \y[n +1] y[n + 2] ••• y[n + N]J y[n] ••• У1] u[n] ••• u[1]
(7)
H =
y[n + N-1] ••• y[N] u[n+N-1]
u[N]
AT = \a1
an b1
ET = \[n +1] n[n + 2] ••• n[n + N]]J
¥=
-nn
П] f[n]
-rftn+ N-1] ... -TUN] f[n+N-1] ... f[N]
Т - символ транспонирования.
МНК-оценку вектора А неизвестных
параметров объекта получают в результате минимизации квадрата евклидовой нормы вектора
У = У - Н ■ А невязок
||f||2 = YT • Y = (Y -H • A)T (Y -H • A).
(8)
Условием минимума (8) является равенство нулю частных производных по всем составляющим
вектора А. Иными словами, градиент функции (8)
€ д ~т ~
по А должен равняться нулю —^(У ■ У) = 0,
дА
Л((У - Н ■ А)т (У - Н ■ А)) =
дА
=4? (УтУ - 2 ■ утн ■ А+АтнтнА) = 0, дА
- 2 ■ УтН + 2 ■ &НтН = 0.
Отсюда транспонированием получаем уравнение для определения МНК-оценок
НтУ = НтН ■ А . (9)
Откуда А = (НтН)-НтУ . (10)
Заметим, что (9) получается из исходного уравнения
объекта (7), если его умножить слева на Нт:
НтУ = Нт НА + Нт Е + Нт ТА. (11)
и отбросить слагаемые НтЕ + НтТ А , вызванные погрешностью измерения п и возмущением £
Согласно (4) и (5) вектор погрешностей измерения Е и матрица Н предшествующих экспериментальных данных некоррелированы, т.е.
М (НтЕ) = 0, где М - символ математического ожидания. Отбрасывание слагаемого НтЕ не вызывает смещение МНК-оценки вектора А. В то же время, М (Нт Т) Ф 0 при любом порядке п объекта, поэтому МНК-оценка (10), не учитывающая этого фактора, является смещенной.
Алгоритм коррекции МНК-оценки
Рассмотрим подробнее последнее слагаемое
1 T (11). nm(ht -^) = к =
-Ry[0] ... -Rn[n-1] Ry[0] ... Ry[n-1]"
-Ry[1-n] ••• -Ry[0] Ry[1-n] ... Ry[0]
-Ru[0] ••• -Rn[n-1] RfJß] ••• Ru[n-1]
-цд-я] ••• цл-п ... цло
Корреляционные моменты, фигурирующие в данной матрице, выразим, используя известное [3] соотношение
Rx. [i] = S [ j] •Rxx [i - j]
(12)
j=0
где х - случайное воздействие (в нашем случае / или п); 2 - реакция линейной импульсной
системы (в нашем случае у или и); wхz - весовая характеристика замкнутой системы (1), (6) по соответствующему каналу. Заметим, что для устойчивых систем верхний предел суммы можно ограничить дискретным временем практического
существования весовой характеристики или временем корреляции случайного воздействия.
В свою очередь, значения весовой характеристики мх2 [Д] могут быть выражены через параметры аі, Ьі, сі, йі замкнутой системы. Так, например, для системы, объект и регулятор которой описываются уравнениями 2-го порядка (см. уравнения (1), (6) при п = т = /1 = /2 = 2),
передаточная функция №/у (2) по каналу / ^ у имеет вид
Ъ,. + Ъ2
Wy (Z ) = ■
l +-
Ъ,. + Ъ2
. - a. - a.
d G. + d,. + d2
З 2
= Pl. + P2. + РЗ. + P4
4 З 2 ,
. - q,. - q2. - qз. - q4 где р, = Ъ,; p2 = Ъ2 -Ъ,^;рЗ =-Ъ2cl -Ъlc2;p4 =-Ъ2c2; q, = a, + c, - d0Ъl ; q2 = a2 - a,c, + c2 - d0Ъ2 - d,^ ; qз = —a,c2 — a2c, — d|Ъ2 — d2Ъ| ; q4 = —a2c2 — d2Ъ2 . .Тогдаw/y[G] = G; w^[l] = р,; w^[2] = P2 + qw[l]; w/y [З] = Рз + q,w/ [2] + q2wfy [1]; w/,[4] = р4 +
+qiw/y[3]+q2 w/y[2]+q3w/y[l];
[j]=Zq,w/y[j-i] Vj -5
Для устранения смещения МНК-оценок
воспользуемся уравнением (11), в котором обе части разделим на N и заменим второе и третье слагаемые правой части их математическими ожиданиями
1HTY = — HTH • A + K • A . (13)
N N
Итерационный алгоритм идентификации, устраняющий смещение включает следующие этапы:
1. Определение МНК-оценки (10) вектора A.
2. Определение значений весовых характеристик замкнутой системы по каналам f ^ у; f ^ и;
П ^ у; п ^ и с использованием A.
3. Определение корреляционных моментов Rfy И; Rfu И; Rny И; Rv PL фигурирующих в приведенной выше матрице К.
4. Определение скорректированной оценки
вектора A параметров объекта с использованием (13)
A = (— HTH + K)-1— HTY . (14)
NN
5. Циклическое повторение этапов (2) - (5) до тех пор, пока в двух последовательных циклах коррекции различие между оценками (14) не станет пренебрежимо малым.
Проверка на многочисленных примерах показала, что алгоритм коррекции устраняет смещение МНК-оценок, сохраняя их низкую дисперсию.
Рассмотрим пример.
Объект управления в замкнутой системе, приведенной на рис.1 описывается разностным уравнением 1-го порядка:
^+1 = а • + Ь • V , (15)
для которого выполняются условия (2) ^ (4).
Rff [i] = G,GG2 - e~0’693-1
D„ = G,GGGG5.
Дискретные передаточные функции объекта управления и регулятора имеют вид:
»•„ (2) = ■ 0Л175
Wр(Z)=
. - G,SS25 dG. + d, = 5. - 4.4
. - c,
.-l
Длина последовательности экспериментальных данных N = 2GG точек.
МНК-оценки будут получены из уравнений:
' N N N
Z Уk+l- yk=a-Z yk +Ъ-Z uk- yk
к=l к=l k=l ґлг\
і . (1б)
N N N
Z yk+i • uk =a-Z yk- uk +Ъ-Zu2
[ к=' к=l к=l
Воспользуемся алгоритмом коррекции МНК-оценок, при этом матрица К примет следующий вид:
К =
- Rny tG] Ry tG]
- Rnu [G] Ru [G]
Выразим корреляционные моменты, фигурирующие в данной матрице. Согласно (12), значения весовых характеристик будем выражать через параметры а, Ь, с1, ё0, системы:
R/y[G]=Z w/y[ j] Rf[—j];
j=G
Передаточная функция W/y (Z) по каналу f ^ y
имеет вид:
Wy (Z ) =
. - (l + a - Ъcl). - (a - Ъ^)
И.П.Ф. по каналу / ^ у имеют следующие значения:
[0] = 0; *у\1] = Ь; Жу[2] = аЬ_ Ь2с1;
™у[п] = (1+ а _ Ьс1) • [«-1] + (а _ Ьс2 ) • ™/у[« _ 2].
ОТ
[0] = z[А ц/[_
А=о
Передаточная функция ^/м (2) по каналум имеет вид:
Wu (Z ) =
-Ъ^ . - Ъc2
. - (l + a - Ъcl). - (a - Ъ^)
И.П.Ф. по каналу f ^ u имеют следующие значения: w fu [G] = G;
wu[,] = -^ wfu [2] = (l + a -Ъб;1) ■ (-ClЪ) + c2^
wfu [n] = (l+ a - Ъ£;,) ■ wfu[n-l] + (a - t>c2) ■ wfy [n - 2].
ОТ
Rny[G] = Z wny[ j] -Rnn[—j];
j=G
¡=i
Dn при j = 0;
Распределение оценок параметра b
ппПД] [0 при Д Ф 0.
мпи[0] = 1; Япу[0] = Оп ■ мпу[0] = °п.
ОТ
Япи [0] = X Мпи [Д] Я„„ [-Д] = Мпи [0] =
Д=0
= Оп ■ (-ё0) = -5^ч.
Проведено 20 экспериментов. Полученные результаты оценивали по показателям, приведенным в таблице.
Показатель Параметр
a b
Истинное значение параметра 0,8825 0,1175
Среднее значение оценок параметра по МНК 0,8587 0,1346
Среднее значение оценок параметра по МНК с коррекцией 0,8823 0,1179
Величина диапазона значений (Д) оценок по МНК 0,0653 0,0292
Величина диапазона значений (Д) оценок по МНК с коррекцией 0,0603 0,0373
Рис. 3. Гистограмма распределения оценок параметра Ь
Литература
1. Ломов А. А. Параметрическая
идентифицируемость линейных стохастических систем по наблюдениям коротких отрезков траекторий // Известия РАН. Теория и системы управления. 2002, №2, С. 53 - 58.
2. Ворчик Б.Г. Идентифицируемость параметрических стохастических систем // Автоматика и телемеханика, 1985, №5, С. 64 - 78, №7, С.96 -109.
3. Цыпкин Я.З. Теория линейных импульсных систем. М.: Физматгиз, 1963, 968 с.
Как видно из полученных результатов, при приблизительно равной величине диапазонов значений оценок параметров а и Ь , оценки, полученные по методу наименьших квадратов получились смещенными, в отличие от оценок, полученных в результате МНК с коррекцией. Более наглядно это демонстрируют
гистограммы, приведенные на рис. 2, 3.
Рис. 2. Гистограмма распределения оценок параметра a
Старооскольский технологический институт
IDENTIFICATION OF OBJECT BY RESULTS OF ITS NORMAL FUNCTIONING IN
THE CLOSED CONTROL SYSTEM V.A. Krivonosov, Y.V. Durneva
The article is devoted to the problem of identification of linear dynamic object by results of its normal functioning in the closed control system. There is shown, that estimations of a method of the least squares are displaced. In the article is offered the algorithm of correction of estimations of the method of the least squares, allowing to avoid displacement
Keywords: identification, the dynamic object, revolting influence, a method of the least squares, correction