СИСТЕМЫ И
ПРОЦЕССЫ
УПРАВЛЕНИЯ
УДК 681.513
ИССЛЕДОВАНИЕ РЕКУРРЕНТНЫХ АЛГОРИТМОВ ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ В СРЕДЕ IntelligentPad
БОДЯНСКИЙЕ.В., РУДЕНКО О.Г., ТАНАКА Ю, ШТЕФАНА, АКСАКН.Г, ЛАВРИНЕНКО К.А., РОСИНСКИЙ Д.Н.________________
Рассматривается реализация алгоритмов параметрической идентификации нестационарных объектов на платформе IntelligentPad, допускающей изменение структуры приложения без потери его функциональности в целом.
Введение
Имитационное моделирование играет важнейшую роль, так как позволяет не только проверить теоретические результаты и провести всестороннее исследование методов и алгоритмов, что зачастую невозможно осуществить теоретически, но и определить области их наиболее эффективного применения, а также разработать рекомендации по их практическому использованию. В настоящее время существуют десятки систем имитационного моделирования, как универсальных, так и специализированных, отличающихся своими возможностями. Однако в большинстве своём они плохо приспособлены для моделирования процессов в реальном времени и не позволяют вносить изменения при моделировании. Этих недостатков лишена моделирующая система, использующая в качестве платформы для реализации среду визуального создания приложений IntelligentPad (IP) [1-4].
Особенности IP позволяют эффективно прменять эту систему для решения самых различных задач. Механизмы асинхронного выполнения, простота реализации вычислительных алгоритмов с помощью встроенных языков программирования, высокая производительность и устойчивость работы, низкие требования к объему оперативной памяти обеспечивают широкие возможности моделирования систем, функционирующих в реальном времени, и делают IP более удобной по сравнению с популярной системой MATLAB/SIMULINK.
Следует отметить еще одно значительное преимущество IP - независимость от платформы компьютера (IBM PC или Macintosh).
Краткая характеристика IP приведена в работах [5,6], в которых рассмотрена задача моделирования адаптивных цифровых систем управления в этой среде.
В настоящей работе рассматривается реализация рекуррентных алгоритмов параметрической идентификации на платформе IP.
1. Задача параметрической идентификации
Пусть исследуемый объект описывается уравнениями
y(t) = 6T(t)x(t) + |y(t);
X (1) x (t) = x(t) +1 x(t),
где y(t) — наблюдаемый входной сигнал; x(t)=(x1(t), x2(t),...,xN(t))T — вектор входных сигналов, компоненты которого являются независимыми гауссовыми величинами с нулевым средним и дисперсией
<; е(0 = (ei(t)> 02(t)> ..., eN(t))T - вектор искомых, в общем случае зависящих от времени параметров объекта; X(t) = (X1(t),X 2(t),...,X N(t))T — наблюдаемый вектор входных сигналов; |(t) = (ад),§ 2(t),...,| n (t))T — вектор случайных помех, действующих на входной сигнал; £y (t) — случайная помеха измерения выходного сигнала; t=0,1,2,... — дискретное время.
Задача идентификации заключается в оценивании вектора параметров 0(t) по результатам наблюдений y(t) и X(t) и сводится к минимизации некоторого наперёд заданного критерия идентификации. Наиболее часто в качестве такого критерия используется квадратичный, минимизация которого по t измерениям входных и выходного сигналов приводит к получению оценки [7]
0(t) = X+ (t)Y(t), (2)
где Y(t)=(y(1),y(2),...,y(t))T — вектор t х 1; X+(t) — матрица, псевдообратная к матрице X(t) = (X(l),X(2),...,X(t)).
Конкретный вид оценки (2) зависит от количества имеющихся измерений (ранга матрицы X(t)).
Если матрица наблюдений X(t) является матрицей полного ранга, то оценка (2) принимает вид
0(t) = [X(t)XT(t)fX(t)Y(t), (3)
соответствующий наиболее исследованной в литературе оценке метода наименьших квадратов (МНК-оценке), которая при выполнении определенных условий [8] является оценкой максимального правдоподобия и обладает соответствующими экстремальными свойствами.
Если же количество измерений меньше числа неизвестных параметров, т.е. t < N (X(t) — матрица
РИ, 2002, № 4
43
неполного ранга), оценка (2) записывается следу- информацию, а затем отбрасывающий устаревшую,
ютим образом: описывается соотношениями [ 12]:
0(0 = x(t)[xT(t)x(t)у y(0 • (4)
Обладая рядом несомненных достоинств, данные оценки не свободны от недостатков, одним из которых является неудобство их применения для оценивания параметров в реальном времени. Поэтому при решении задач идентификации в реальном времени используют те или иные рекуррентные формы оценок (3), (4).
2. Рекуррентные алгоритмы идентификации
Рекуррентные формы оценок легко могут быть получены с помощью блочного представления матриц X(t) и вектора Y(t) [9]. Так, РМНК имеет вид
0(t) = 0(t -1) + P(t)x(t)(y(t) -0T(t - 1)x(t)),
P(t - 1)x(t)xT(t)P(t -1) (5)
P(t) = P(t -1) —і—;v' K J v—о (5)
1 + xT(t)P(t - 1)x(t)
P(0) = aI, a >> 0; I — единичная матрица N x N.
— накопление информации
<0+00 = 0l (t - 0+pl+00 ^0(y(0 “ ®T (t “ 0 x(0)’
Pl+00 = Pl (t -1)
P^t - 1)x(t)xT(t)PL(t - Q.
1 + xT (0Pl (t - 1)x(t) ’
(7)
— сброс информации
0(0 = ®l+00 - MO^1 -L - 0 x <(y0 -L - 0-L - 0)’
MQx(t - L - QxT(t - L + QPl+00
pOO=Pl+00+-
1 + xOt-L-0PL+O0^t-L-0 (8)
Здесь pl+00 = [xT+00xl+00 T; xl+00 =
= (Ot-L-O’Ot_— матрица N0L + 0;
POO = [xOOxOO]'°; xl (0=И1-L’ ’^0) -
матрица N x L; L > N — фиксированное окно.
В асимптотике оценка (5) совпадает с оценкой (3).
Уменьшение значений элементов ковариационной матрицы P(t) с течением времени и ее стремление в асимптотике к нулевой не позволяет использовать алгоритм (5) для идентификации нестационарных объектов. Для обеспечения алгоритму необходимых следящих свойств в (5) применяют механизм учета ценности поступающей и имеющейся информации либо в виде экспоненциального взвешивания, либо в виде скользящего окна [10, 11].
РМНК с экспоненциальным взвешиванием информации описывается следующими соотношениями:
0(t) = 0(t -1) + P(t)x(t)(y(t) -0T (t - 1)x(t))’
P(t)
1
X
P(t -1)
P(t - 1)x(t)xT(t)P(t -1) X + xT(t)P(t - 1)x(t)
(6)
Аналогично могут быть выписаны соотношения для алгоритма, работающего по типу “сброс-накопление”, а также другие модификации РМНК со скользящим окном [12].
Если в алгоритме (6) свободно выбираемым параметром является коэффициент X, то в (7), (8) — ширина скользящего окна L. Некоторые рекомендации по выбору L даны в [13].
Может быть получено несколько рекуррентных форм оценки (4), одна из которых, имеющая вид
0ІН-0Н Н і RL-0t 0x(0 w
0( '>-9<1 - 1}+xT(,)Rl - ОДОх
х( О0-0(t-0^0)’
Rt-L+00 _ Rt-L+i-0і _ 0 _ (9)
_ Rt -l+. 0і - QQt - L+QxQ1 - L+QRt-l+. 0і - 0 xT(t - l+ORt-L+i-0. - ORt-L+.-Oi-0 ’
где X є (0’ 1] — весовой параметр или параметр взвешивания (обычно выбирают 0,995 < X < 0,999).
Если в (6) ценность устаревшей информации уменьшается экспоненциально, но алгоритм использует все поступившие измерения, то РМНК со скользящим окном учитывает некоторое ограниченное
фиксированное число измерений L > N (L называют также памятью алгоритма). В зависимости от того, как организуется учет информации (добавляется ли сначала новая информация, а затем исключается устаревшая, либо же сначала исключается устаревшая, а затем добавляется новая), возможны две рекуррентные формы алгоритма. Так, РМНК со скользящим окном, работающий по типу “накопление-сброс”, т.е. сначала включающий новую
R, l(0) = I; і= 1’2’ - ’L; L <const < N , была приведена в работе[14].
Алгоритм (9) предполагает, что на каждой итерации матрица Rt _L+i (0 вычисляется L раз и после этого используется в формуле для уточнения оценки
0(0.
Более удобные алгоритмы, учитывающие накопление и сброс устаревшей информации и то, что L = c0nst < N , могут быть получены, если воспользоваться тем же приемом, который применялся при получении (7)-(8).
Как и алгоритмы (6), (7)-(8), алгоритм (9) является эффективным при идентификации нестационарных объектов.
44
РИ, 2002, № 4
Parametric Identification Algorithms
К
Щ MHK a
Kaczmarz algorithm MNK algorithm
MNK algorithm with exponential smoothing
■©
Parameter vector dimension: Noise:
Number of iterations:
©
0.10
30
GENERATOR CHOISE
if if i!
CONTROL BUTT
Oi
Count
J
tops I
Reset
2) блок выбора алгоритма;
3) генераторы параметров и входа алгорит-
ма;
Рис.1. Композитный компонент Parametric Identification Algorithms
Приведенные выше алгоритмы использовали либо всю имеющуюся в наличии информацию (алгоритмы (6) и (7)), либо часть ее, определяемую величиной скользящего окна L (алгоритмы (8) и (9)), поэтому их реализация требовала соответствующих матричных вычислений. Наиболее же простым в вычислительном отношении является оценка (2), использующая псевдообращение вектора х, что приводит к алгоритму Качмажа [10]:
0(1) = 0(1 -1) +
y(t) -6T(t -1)x(t)
l|x(t)||2
x(t),
(10)
где
ЮГ =£ хдо.
Хотя динамические свойства (6) уступают свойствам алгоритма РМНК (5), вычислительная простота алгоритма Качмажа играет иногда решающую роль и делает его зачастую более привлекательным. Легко видеть, что алгоритм (10) является частным случаем (9) при L=1. При наличии же помех
измерений |y (t) необходима следующая модификация алгоритма:
y(0-^(t
------х(,)- (11)
КО = 0(t - 0+pJ
4) интерфейс для задания параметров тестирования;
5) блок выбора генератора параметров;
6) блок управления тестированием;
7) индикатор количества итераций.
Компоненты алгоритмов параметрической идентификации были созданы при помощи встроенного языка BASIC без применения дополнительных языков программирования. Создание такого рода компонентов осуществляется путем кодирования стандартного компонента BASIC Programming из пакета IntelligentPad. Для разработанного композитного компонента также были созданы генераторы входных векторов, векторов параметров, переключатели алгоритмов и типов генераторов. Для создания нового компонента необходимо определить, какие слоты он должен иметь, а также типы данных слотов.
Так как большинство аргументов алгоритма является числовыми векторами, то соответствующие им слоты будут иметь тип DICTIONARY. Этот тип составной и может включать в себя данные других типов, в том числе и DICTIONARY. Однако для задания таких параметров, как размерность вектора, количество шагов моделирования и т.п. используются слоты типа NUMBER. Кроме того, существуют управляющие сигналы для алгоритма, которые подаются на слоты типа COMMAND. Имена и типы слотов одного из компонентов алгоритмов параметрической идентификации приведены в таблице. Жирным шрифтом выделен выходной слот.
Работа алгоритмов осуществляется при поступлении на их входы сигналов входного вектора, которые вырабатываются соответствующим генератором по нормальному закону распределения, тактируемым счетчиком итераций. Разработанные компоненты связаны с другими стандартными или
где p є (0, l), и чем выше уровень помех, тем меньшее значение должен иметь параметр p .
З.Практическая реализация алгоритма и результаты моделирования
Разработанный пакет позволяет исследовать скорость сходимости (в стационарном случае) и точность рекуррентных алгоритмов слежения за изменяющимися по заданным законам параметрами исследуемого объекта при различных видах распределений полезных сигналов и помех (как при постоянных, так и при изменяющихся их статистических свойствах), уровня помех, наличия корреляции и т.д.
Реализация композитного компонента Parametric Identification Algorithms, разработанного в среде IntelligentPad, представлена на рис. 1. Данная тестовая система содержит следующие блоки:
1) алгоритмы параметрической идентификации;
Слоты компонента алгоритма идентификации
Имя слота Тип Назначение
Outputs DICTIONARY Выход алгоритма, идентифицированный вектор параметров
errorl DICTIONARY Оценка изменения рассогласования выходных сигналов модели и объекта
error2 DICTIONARY Оценка изменения значения критерия идентификации
reset COMMAND Управляющий сигнал очистки и инициализации данных
num_iter NUMBER Количество итераций алгоритма
dimension NUMBER Размерность вектора параметров
Noise NUMBER Величина зашумления алгоритма
param vect DICTIONARY Вектор параметров
Inputs DICTIONARY Вектор входа
РИ, 2002, № 4
45
разработанными компонентами через соответствующие слоты, с помощью которых осуществляется передача данных от одного компонента к другому.
Результаты моделирования приведены на рис .2. На графиках представлен вектор генерируемых параметров (1) и вектор подстраиваемых параметров (2) алгоритма. По виду графиков можно сделать вывод о том, что алгоритм Качмажа, в данном случае, обеспечивает достаточно высокую степень точности слежения за изменяющимися параметрами.
Рис. 2. График подстройки параметров алгоритма
На рис.3 и 4 приведены соответственно графики изменения рассогласования выходных сигналов модели и объекта по алгоритму Качмажа и значения относительного критерия идентификации:
, IKQ-e(t)||‘
И б-ё(о)||!'
Для построения графиков использован стандартный компонент Graph.
Рис. 3. График изменения рассогласования выходных сигналов модели и объекта
Рис. 4. График изменения значения критерия идентификации
Литература: 1. Tanaka Y. Meme Media Meme Market Architectures for the Reediting and Redistribution of Knowledge Resources // International Conference on Multimedia Modeling’ 98. Lausanne. 1998. 2. Tanaka Y. Meme Media and a World-Wide Meme Pool // The Fourth ACM International Multimedia Conference. Nov. Boston. 1996. P. 175-186. 3. Tanaka Y. From Augmentation to Meme Media: IntelligentPad and the World-Wide Repository of Pads // Proc. of European Japanese Seminar on Information Modeling and Knowledge Bases. Kista, Sweden. June, 1994. 4. Tanaka Y., Nagasaki A., Akaishi M, Noguchi T. A synthetic Media Architecture for an Object-Oriented Open Platform / / Personal Computers and Intelligent Systems, Information Processing (ed. F.H. Vogt). 1992. Vol. III. P. 104-110. 5. Bodyanskiy Ye., Rudenko O, Tanaka Y, Stephan A., Popov S. Investigations Regarding Adaptive PID Controllers and their Implementation in Intelligent-Pad. Meme Media Laboratory, Hokkaido-University, 1999. 6. БодянскийE.B., Руденко О.Г, Танака Ю, Штефан А, Колодяжный B.B., Попов C.B. Адаптивный регулятор в среде IntelligentPad // Радиоэлектроника и информатика. 2000. 7. Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука, 1977. 224 с. 8. Рао С.Р. Линейные статистические методы и их применение. М.: Наука, 1968. 547 с. 9. Лъюнг Л. Идентификация систем. Теория для пользователя. М.: Наука, 1991. 432 с. 10. Райбман Н. С., ЧадеевB.M. Построение моделей процессов производства. М.: Энергия, 1975. 375 с. 11.Перелъман И.И. Оперативная идентификация объектов управления. М.: Энергоиздат, 1982. 272 с. 12.Ру-денко О.Г, Теренковский ИД, Штефан А, Ода ГА Модифицированный алгоритм текущего регрессионного анализа в задачах идентификации и прогнозирования // Радиоэлектроника и информатика. 1998. №4 (05). С.58-61. 13.Либеролъ Б.Д, Руденко О.Г. Выбор ширины окна в алгоритме текущего регрессионного анализа // Доп. НАН України. 1996. №3. С.69-73. 14.Ищенко ЛА, Либеролъ Б.Д., Руденко О.Г. О свойствах одного класса многошаговых адаптивных алгоритмов идентификации // Киберне -тика. 1985. №1. С.92-96.
Поступила в редколлегию 11.04.2002
Рецензент: д-р техн. наук, проф. Петров Э.Г.
Бодянский Евгений Владимирович, д-р техн. наук, профессор кафедры искусственного интеллекта, научный руководитель ПНИЛ АСУ ХНУРЭ, член IEEE. Научные интересы: адаптивные системы, нейрофаззи-системы. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90. E-mail: [email protected]
Руденко Олег Григорьевич, д-р техн. наук, профессор, заведующий кафедрой ЭВМ ХНУРЭ, член IEEE. Научные интересы: идентификация систем, искусственные нейронные сети. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-93-54. E-mail: [email protected]
Танака Юзуру, доктор, профессор, директор Meme Media Laboratory, университет Хоккайдо, Саппоро, Япония. E-mail: [email protected]
Штефан Андреас, доктор-инженер, почетный профессор ХНУРЭ, глава фирмы Dr.Stephan & Partner, Ильме нау, Германия. E-mail: [email protected]
Аксак Наталья Георгиевна, канд. техн. наук, доцент кафедры ЭВМ ХНУРЭ. Научные интересы: идентификация систем. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-93-54.
Лавриненко Константин Анатольевич, аспирант кафедры ЭВМ ХНУРЭ. Научные интересы: идентификация. Адрес: Украина, 61166, Харьков, пр. Ленина, 14.
Росинский Дмитрий Николаевич, инженер кафедры ЭВМ ХНУРЭ. Научные интересы: искусственные нейронные сети. Адрес: Украина, 61166, Харьков, пр. Ленина, 14.
46
РИ, 2002, № 4