УДК 681.3
В.А. ТИМОФЕЕВ, канд. техн. наук, ХНУРЭ (г. Харьков)
ОБ ОДНОЙ МОДИФИКАЦИИ РЕКУРРЕНТНОГО МЕТОДА
НАИМЕНЬШИХ КВАДРАТОВ
Розглядається задача ідентифікації динамічного об’єкту в припущенні, що відомим є тільки рівень вади. Досліджено існуючі алгоритми. Розроблено рекурентний алгоритм ідентифікації, що має супремальні властивості та властивості МНК-оцінок, виконано оцінку його збіжності. Перевагою розробленого алгоритму є простота його використання в задачах контроля та керування.
The problem of dynamical object identification is considered under suggestion that only noise level is known. A survey of existing algorithms is given. Recurrent identification algorithm is developed, having supremal properties of LSM-estimations and it’s convergence is analyzed. The dignity of developed algorithm is simplicity it’s application to the problems of monitoring and control.
Введение. На сегодня проблема управления техническим объектом в условиях неопределенности - одна из центральных проблем современной теории управления. Адекватным математическим аппаратом для решения этой проблемы является теория адаптивных систем управления, а широкое распространение микропроцессорной техники привело к развитию дискретных адаптивных систем управления [1 - 16].
К настоящему времени сформировался ряд относительно независимых направлений в теории адаптивных систем. Здесь, прежде всего, следует выделить адаптивные регуляторы с минимальной дисперсией (основополагающая работа [17]), адаптивные регуляторы с обобщенной минимальной дисперсией (основополагающие работы [18, 19]), адаптивные системы с требуемым размещением нулей и полюсов (основополагающие работы [19 - 21]), системы с адаптивными упредителями (основополагающая работа [22]).
Во всех этих подходах предполагается, что возмущения, действующие в системе, имеют стохастическую природу, причем это, как правило, белый шум с нулевым математическим ожиданием и ограниченной дисперсией. В практических ситуациях статистические предпосылки являются надуманными, в связи с чем гораздо более реальными представляются допущения лишь об ограниченности шума или его разностей по амплитуде. В этих условиях использование методов идентификации, основанных на квадратичных критериях и, прежде всего, рекуррентного метода наименьших квадратов явно неэффективно. Возникающие затруднения частично могут быть преодолены в рамках адаптивных робастных систем управления [ 23 -26], в которых, тем не менее, все равно «спрятаны» определенные статистические предпосылки.
В связи с этим представляется целесообразным осуществить синтез теории адаптивного и критического управления, что приведет к созданию адаптивных супремальных методов контроля, идентификации и управления динамическими объектами, функционирующими в условиях существенной неопределенности о характеристиках объекта и окружающей среды.
Целью настоящей работы и является разработка рекуррентного метода идентификации, обеспечивающего получение оценок, обладающих супремальными свойствами, которые не зависят от статистических характаристик сигналов и помех, и свойствами МНК-оценок.
Постановка задачи. Рассмотрим динамический объект, функционирующий в замкнутой системе управления 8^ (Р, С), описываемый разностным уравнением
Л(д) у(к) = д'ёБ(д)и(к) + м>(к), (1)
где полиномы Л(д) е Я[д, п] с а0 = 1, Б(д) е Я[д, т]; ё - время чистого запаздывания ё е N+; у ,и и w - выходной, управляющий и возмущающий сигналы соответственно.
Относительно возмущений предполагается ограниченность их первых разностей.
В случае, если параметры объекта априори известны и неизменны, задача критического управления может быть решена с помощью супремального регулятора, т.е.
ДЕ(д)Б(д)и (к) = -Е(д)у(к), (2)
где полиномы Е(д) е Я[д, ё -1] с /0 = 1 и Е(д) е Я(д, п) задаются уравнением
ДЛ(д)Е (д) + д~ёЕ(д) = 1.
В том случае, если параметры объекта неизвестны, можно воспользоваться тем или иным методом идентификации, а затем применить закон управления (2), в котором истинные значения параметров объекта заменены их оценками. В этом и состоит суть адаптивного подхода к проектированию систем управления объектами, функционирующими в условиях неопределенности. Как правило, в качестве процедур идентификации применяются те или иные модификации рекуррентного метода наименьших квадратов либо проекционные алгоритмы, так или иначе связанные с квадратичными критериями. При использовании критериев, отличных от квадратичных, например, модульных, хотя и получают робастные процедуры, статистический смысл задачи идентификации тем не
менее сохраняется. Естественно, что такие алгоритмы идентификации не могут быть использованы в критических системах управления.
В связи с этим возникает необходимость синтеза адаптивных алгоритмов идентификации, не связанных ни с какими статистическими предпосылками, обладающих высокой скоростью сходимости, вычислительной простотой и пригодных для работы в реальном времени в контуре критической системы управления динамическим объектом.
Алгоритмы идентификации, применяемые в критических системах.
Введем в рассмотрение полином
О(д) = 1- Д4(д), (3)
где О(д) = g1q -1 + g 2 д -2 +...+ д~п-1, и перепишем уравнение объекта (1) в виде
у (к) = 0Т у( к -1) + 1\м>(к), (4)
где 0 = g2,...gn+1,Ъ0,Ь1,...рт)Т ;
¥(к -1) = (у (к -1), у (к - 2),... ,у(к - п -1);
Ди(к - й), Ди(к - й -1),... ,Ди(к - й -т))Т;
Ди(к) = и(к) - и(к -1);
Ди^к) = w(k) - w(k -1).
Тогда задача идентификации с позиции теории критических систем сводится к нахождению оценок неизвестного вектора параметров 0 таких, что
Е(©) = {©: |у(к) -©Т - Т(к -1)| <8, У к є И}. (5)
л
Здесь © - оценка параметра © .
К настоящему времени сложился ряд подходов к задаче идентификации, связанной с неравенством (5). Это, прежде всего, подход Фогеля-Хуанга [27], в основе которого лежат некоторые геометрические построения. Известна также процедура Лозано-Лила-Ортеги [28], синтезированная как на геометрических предпосылках, так и исходя из условий устойчивости процесса сходимости. Нельзя не отметить также алгоритм Канудас де Вита-Каррильо [29], являющийся некоторой модификацией экспоненциально взвешенного рекуррентного МНК. Несмотря на эффективность этих процедур, их использование в критических системах наталкивается на серьезные затруднения.
P \k) =
Так, оптимальный алгоритм Фогеля-Хуанга настолько сложен с вычислительной точки зрения, что не может быть и речи о его использовании в режиме реального времени. Эта сложность обусловлена, прежде всего, необходимостью отыскания на каждой итерации глобального минимума многоэкстремальной функции n + m + 2 переменных, что само по себе
является достаточно сложной проблемой.
В алгоритме Лозано-Лила-Ортеги, имеющем вид
0(k) = 0(k -1) +------------aP(k -1)V(k -1)-(| e(k) | -51sign e(k), a є (0,1); (6)
І + у (k -1)P(k -1)y(k -1)
P-1(k-1) +-------- aP(k - 1)^(k -1)--------(| e(k)|-S1) x
(І + уг (k - 1)P(k -1) y( k - 1)e(k)
x sign e(k), | e(k) | > 5j; (7)
P-1(k-1), | e(k) |< 5j;
S1 = ^/ 1 + a5; (8)
л г
e(k) = y(k) - 0 (k -1)V(k -1), (9)
априори предполагается ограниченность значения уг (k - 1)P(k - 1)y(k -1), из которого следует условие сходимости
lim | e(k) |= V1 + a 5, a є (0,1), k
т.е. ошибка идентификации e(k) никогда не может быть по модулю меньше
заданных ограничений 5 .
В алгоритме Канудас де Вита-Каррильо
0(k) = 0(k -1) + a(k)P(k -1Mk -1) (| e(k) | -5)slgne(k); (10)
уг (k -1) P(k -1)v(k -1)
P(k) = X-1( P(k - 1) - a( k )P(k-1Mk -І)Уг (k - 1) P(k -І) (1 ));
у (k -1)P(k - 1)y(k-1) | e(k)| (11)
X є (0,1];
[і, | e(k)> 5 или уг(k -1)P(k -1)y(k -1) = 0; a(k) = ] (12)
[0,| e(k) <5,
где e(k) определяется соотношением (9),
е(к) = у(к) -0 (к -1)у(к -1).
В ситуации, когда | е(к) |> 5 и значение уТ (к -1)Р(к -1)у(к -1) близко к нулю, возникает режим неустойчивости, поскольку компоненты вектора
Р(к - 1)у(к - 1)(уТ (к - 1)Р(к - 1)у(к -1))-1
могут неограниченно возрастать. Кроме того, в случае, когда а(к) = 0,
невозможно гарантировать выполнение условия I е(к) |< 5 в предположении,
что уТ (к-1)Р(к-1)у(к-1) ограничено.
Модифицированный алгоритм идентификации и оценивание его сходимости. Объединяя достоинства рассмотренных процедур, можно ввести комбинированный алгоритм, являющийся своеобразной комбинацией рекуррентного МНК и процедур (6) - (8) и (10) - (12).
Рассмотрим алгоритм вида
0(к) = 0(к -1) +----а(к)Р(к -1Жк -1)------(| е(к) | -5)sign е(к); (13)
1 + уТ (к -1)Р(к -1)у(к -1)
Р(к) = Р(к-1)- а(к)Р(к- 1)У(к-1)¥Т(к-1)Р(к-1) ( е(к)\ -5); (14)
| е(к)| +(2| е(к) - 5)уТ (к)Р(к - 1)у(к -1) 1 1
Г1, если | е(к) |> 5, а( к) = ] (15)
[0, если | е(к) |< 5.
где е(к) определяется в соответствии с (9) и проанализируем его сходимость.
Введем в рассмотрение вектор уклонений оценок от истинных значений параметров
~ л
0(к) = 0 - 0(к)
и функцию Ляпунова
~ Т ~
V(к) = 0 (к)Р-1(к) 0(к).
Объединяя (4) с (13) - (15), получаем
а(к)(| е(к) | -5)
V (к) = V (к = 1) +
(1 + уТ (к -1)Р(к - 1)у(к -1)) | е(к) |
х (д^ _ (1 + ¥Т (к-1)Р(к- 1)у(к-1))|е(к) |3
| е(к) + (2 | е(к) | -5)уТ (к -1)Р(к - 1)у(к -1)
С учетом ранее введенного условия w е ,0(0,5) несложно переписать (16) в виде неравенства
а( к )(| е(к) I - 5)
V (к) <¥ (к -1) +
(1 + ут (к - 1)Р(к - 1)у(к -1)) | е(к) |
„2 (1 + УТ (к -1)Р(к - 1)у(к -1)) | е(к)| 3 ч
х (5---------------------------г------------------------) -
| е(к) | +(2 | е(к) | -5)ут (к - 1)Р(к - 1)у(к -1)
- V (к -1} - а( к)(|е(к)|-5) „
(1 + у т (к - 1)Р(к -1)у(к -1)) | е(к) |
(| е(к) |3 -2 | е(к) | 52 + 53)(1 + ут (к - 1)Р(к - 1)у(к -1)) + (| е(к) | -5)52
| е(к) | +(2 | е(к) | -5)ут (к - 1)Р(к - 1)^(к -1)
^ пк 1} а(к)(| е(к) | -5)(| е(к) |3 -2 | е(к) | 52 + 53)
(| е(к) | +2 | е(к) | -5)ут (к -1)Р(к - 1)^(к -1) | е(к) | которое справедливо в случае | е(к) | > 5. Кроме того, поскольку в этом случае
2 2 53
е (к) - 25 + .. . >| е(к) | (| е(к)| -5)
| е(к) |
несложно видеть, что
V(k) <У(к -1)-------а( кХ1е(кЖ|е(к)1-5>2 , (17)
2(1 + ут (к-1) Р(к-1)у(к-1)
откуда
,.т ----- а(к)( | е(к)|-5)2---- о, (18)
к 1 + ут (к -1) Р(к-1)у(к -1)
что свидетельствует о критериальной сходимости алгоритма (13) - (15).
Л
Перенеся в левую часть (13) ©(к -1) и возведя обе части полученного выражения в квадрат, получаем
Л
©(к) - 0(к -1)
- а(к)ут (к - 1)Р2(к -1)у(к -1) (| е(к) |-52) <
V (к) (1+ут (к -1) Р(к -1Мк -1))2
< а(к)Хтах(Р(к-1)) (|е(к)| -52),
1 + ут (к -1) Р(к - 1)у(к -1)
где ^тах(Р(к -1)) - максимальное собственное значение матрицы Р(к -1). Из (14) очевидно следует условие
^тах(Р(к)) <^тах(Р(к-1)) <•••<^тах(Р(0)Х
позволяющее переписать (19) в виде
л
л
0(к) - 0(к -1)
< а( к )* шах(Р(0))"
(| е(к) | -5)2
V (к)
'■шах^ Т 1ЧГ)/7 1Ч п 1Ч
1 + у (к -1)Р(к - 1)у(к -1)
который вместе с выражением (18) свидетельствует об аргументной сходимости алгоритма.
Далее, используя лемму об обращении матриц, запишем
Р 1 (к) = Р х(к-1) +
откуда следует неравенство
(1
5
а(к)у(к -1)у (к -1)
1 + уТ(к-1)Р(к-1)у(к-1) ' |е(к)|
т),
Хт1п(Р '(к)) >Хт1п(Р '(к-1)) > •••>!(0)),
где (Р _1(к)) - минимальное собственное значение матрицы Р-1(к).
Это неравенство совместно с (17) приводит к тому, что
V (к) ^ (0)
0(к )
< * шах(Р (к)
V (к)
0(0)
V (к)
откуда можно записать выражение
2
0(к) <-
* шах(Р (к))
V (к)
* шіп(Р “Ч0»
0(0)
V (к)
определяющее скорость сходимости введенного алгоритма.
Выводы. В работе предложена модификация рекуррентного МНК, обладающая супремальными свойствами. Так как основой данного алгоритма является рекуррентный МНК, трудностей с его практической реализацией не возникает. Полученная оценка скорости сходимости предложенного алгоритма свидетельствует о том, что эта скорость в значительной мере
определяется свойствами ковариационной матрицы наблюдений Р 1(к) соотношением ее максимального и минимального собственных чисел). Кроме того, входящая в алгоритм величина 8 зачастую известна лишь приближенно, поэтому необходимо в процессе идентификации осуществлять оценивание
191
2
и
2
2
2
(уточнение) этой величины и подставлять полученные оценки в алгоритм идентификации.
Список литературы: 1.Isermann R. Practical aspects of process identification // Automatica. - 1980.
- 16. - P. 575-597. 2. Evans R. J., Betz R. E. New results and applications of adaptive control to classes of nonlinear systems // Ricerche di Automatica. - 1982. - 13. - № 2. - Р. 277-297. 3. Tsypkin Y. Z. The theory of adaptive and learning systems // Cybern.: Theory and Appl. - Washington, D. C., 1983. -P. 59-89. 4. Astr6m K. J. Theory and Applications of adaptive control - a survey // Automica, 1983. -
19. - № 5. - Р. 471^86. 5. Цыпкин Я. 3., Кельманс Г. К. Дискретные адаптивные системы управления // Итоги науки и техники. Техн. кибернетика. - Т. 17. - М.: ВИНИТИ, 1984. - С. 3-73. 6. Navendra К. S., Annaswamy A. M. Recent trends in adaptive control theory // J. Soc. Instrum. and Control Eng. - 1984. - 23. - № 5. - P. 27-34. 7. Kumar P. R. A survey of some results in stochastic adaptive control // SIAM J. Control and Optim. - 1985. - 23. - № 3. - Р. 329-380. 8. Unbehauen H. Theory and application of adaptive control // Ргос. 7th IFAC/ IMACS Conf. - Vienna. - 1985. - P. 1-17. 9. Иванов В. А., Шапировский M. P. Адаптивные системы управления с моделями // Итоги науки и техники. Техн. кибернетика. - Т. 18. - М.: ВИНИТИ, 1986. - С. 210-240. 10. King-Sun Fu. Learning control systems - Review and outlook // IEEE Trans. on Pattern Anal. and Mach. Intel. - 1986. - 8.-№ 3. - P. 327-342. 11. De Keyser R. M. C. Applying adaptive control problems and solutions // Journal A. - 1986. - 27. - № 3. - Р. 111-119. 12. Martin Sanchez J. M. Adaptive control for time - variant processes // Int. J. Contr. - 1986. - 44. - № 2. - Р. 315-329. 13. Кунцевич В.М. Адаптивное управление: алгоритмы, системы, применение. - К.: Выща шк., 1988. - 64 с. 14. Александров А. Г. Оптимальные и адаптивные системы. - М.: Высш. шк., 1989. - 263 с. 15. Романенко В. Д., Игнатенко Б. В. Адаптивное управление технологическими процессами на базе микроЭВМ. - К.: Выща шк., 1990. - 334 с. 16. Astr6m К. J., Wittenmark В. On self-tuning regulators // Automatica. -1973. - 9. - P.185-199. 17. Clarke D. W., Gawthrop P. J. Self-tuning controller // Proc. IEE. - 1975. -122. - P. 929-934. 18. Wellstead P. E., Edmunds М. J., Prager D., Zanker P. Self-tuningpole / zero assignment regulators // Int. J. Contr. - 1979. - 30. - № 1. - Р. 1-26. 19. Wellstead P. E., Prager D., Zanker P. Pole assignment self-tuning regulator // Proc. DEE. - 1979. - 126. - D. - P. 781-787.
20. Astrom K. J., Wittenmark B. Self-tuning controllers based on pole-zero placement // Proc. IEE. -1980. - 127. - D. - P. 120-130. 21. Kreisselmeier G., Narendra K. S. Stable MRAC in the presence of bounded disturbances // IEEE Trans. on Autom. Contr. - 1982. - 27. - P. 1169-1175. 22. Clarke D. W., Mohtadi C., Tuffs P. S. Generalized predictive control. Tue basis algorithm // Automatica. - 1987. - 22.
- № 2. - P. 137-148. 23. Samson С. Stability analysis of adaptively controlled systems subject to bounded disturbances // Automatica. - 1983. - 19. - P. 81-89. 24. Narendra K. S., Annaswamy A. М. Robust adaptive control in the presence of bounded disturbances // IEEE Trans. on Autom. Contr. -1986. - 31. - № 4. - P. 306-315. 25. 0rtega R., Lozano-Leal R. A note on direct adaptive control of systems with bounded disturbances // Automatica. - 1987. - 23. - № 2. - P. 253-254. 26. Fogel E., Huang Y. F. On the value of information in system identification - bounded noise case // Automatica. -1982. - 18. - № 2. - Р. 229-238. 27. Lozano-Leal R., Ortega R. Reformulation of the parameter identification problem for system with bounded disturbances // Automatica. - 1987. - 23. - № 2. -P. 245-257. 28. Canudas de Wit C.C., Carrilo J. A modified EW - RLS algorithm for systems with bounded disturbances // Automatica. - 1990. - 26. - P. 599-606. 29. Фомин В. Н. Математическая теория обучаемых опознающих систем. - Л.: Изд. ЛГУ, 1976. - 235 c.
Поступила в редакцию 17.04.04