Научная статья на тему 'ИССЛЕДОВАНИЕ РЕКУРРЕНТНЫХ АЛГОРИТМОВ ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ В СРЕДЕ IntelligentPad'

ИССЛЕДОВАНИЕ РЕКУРРЕНТНЫХ АЛГОРИТМОВ ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ В СРЕДЕ IntelligentPad Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
180
43
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бодянский Евгений Владимирович, Руденко Олег Григорьевич, Танака Юзуру, Штефан Андреас, Аксак Наталья Георгиевна

Рассматривается реализация алгоритмов параметрической идентификации нестационарных объектов на платформе IntelligentPad, допускающей изменение структуры приложения без потери его функциональности в целом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бодянский Евгений Владимирович, Руденко Олег Григорьевич, Танака Юзуру, Штефан Андреас, Аксак Наталья Георгиевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Researching recursive parametric identification algorithms in IntelligentPad environment

Recursive algorithms of non-stationary parameters estimation based on least-squares methods were presented and simulating system on IntelligentPad platform for similar algorithms was described.

Текст научной работы на тему «ИССЛЕДОВАНИЕ РЕКУРРЕНТНЫХ АЛГОРИТМОВ ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ В СРЕДЕ IntelligentPad»

СИСТЕМЫ И

ПРОЦЕССЫ

УПРАВЛЕНИЯ

УДК 681.513

ИССЛЕДОВАНИЕ РЕКУРРЕНТНЫХ АЛГОРИТМОВ ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ В СРЕДЕ IntelligentPad

БОДЯНСКИЙЕ.В., РУДЕНКО О.Г., ТАНАКА Ю, ШТЕФАНА, АКСАКН.Г, ЛАВРИНЕНКО К.А., РОСИНСКИЙ Д.Н.________________

Рассматривается реализация алгоритмов параметрической идентификации нестационарных объектов на платформе IntelligentPad, допускающей изменение структуры приложения без потери его функциональности в целом.

Введение

Имитационное моделирование играет важнейшую роль, так как позволяет не только проверить теоретические результаты и провести всестороннее исследование методов и алгоритмов, что зачастую невозможно осуществить теоретически, но и определить области их наиболее эффективного применения, а также разработать рекомендации по их практическому использованию. В настоящее время существуют десятки систем имитационного моделирования, как универсальных, так и специализированных, отличающихся своими возможностями. Однако в большинстве своём они плохо приспособлены для моделирования процессов в реальном времени и не позволяют вносить изменения при моделировании. Этих недостатков лишена моделирующая система, использующая в качестве платформы для реализации среду визуального создания приложений IntelligentPad (IP) [1-4].

Особенности IP позволяют эффективно прменять эту систему для решения самых различных задач. Механизмы асинхронного выполнения, простота реализации вычислительных алгоритмов с помощью встроенных языков программирования, высокая производительность и устойчивость работы, низкие требования к объему оперативной памяти обеспечивают широкие возможности моделирования систем, функционирующих в реальном времени, и делают IP более удобной по сравнению с популярной системой MATLAB/SIMULINK.

Следует отметить еще одно значительное преимущество IP - независимость от платформы компьютера (IBM PC или Macintosh).

Краткая характеристика IP приведена в работах [5,6], в которых рассмотрена задача моделирования адаптивных цифровых систем управления в этой среде.

В настоящей работе рассматривается реализация рекуррентных алгоритмов параметрической идентификации на платформе IP.

1. Задача параметрической идентификации

Пусть исследуемый объект описывается уравнениями

y(t) = 6T(t)x(t) + |y(t);

X (1) x (t) = x(t) +1 x(t),

где y(t) — наблюдаемый входной сигнал; x(t)=(x1(t), x2(t),...,xN(t))T — вектор входных сигналов, компоненты которого являются независимыми гауссовыми величинами с нулевым средним и дисперсией

<; е(0 = (ei(t)> 02(t)> ..., eN(t))T - вектор искомых, в общем случае зависящих от времени параметров объекта; X(t) = (X1(t),X 2(t),...,X N(t))T — наблюдаемый вектор входных сигналов; |(t) = (ад),§ 2(t),...,| n (t))T — вектор случайных помех, действующих на входной сигнал; £y (t) — случайная помеха измерения выходного сигнала; t=0,1,2,... — дискретное время.

Задача идентификации заключается в оценивании вектора параметров 0(t) по результатам наблюдений y(t) и X(t) и сводится к минимизации некоторого наперёд заданного критерия идентификации. Наиболее часто в качестве такого критерия используется квадратичный, минимизация которого по t измерениям входных и выходного сигналов приводит к получению оценки [7]

0(t) = X+ (t)Y(t), (2)

где Y(t)=(y(1),y(2),...,y(t))T — вектор t х 1; X+(t) — матрица, псевдообратная к матрице X(t) = (X(l),X(2),...,X(t)).

Конкретный вид оценки (2) зависит от количества имеющихся измерений (ранга матрицы X(t)).

Если матрица наблюдений X(t) является матрицей полного ранга, то оценка (2) принимает вид

0(t) = [X(t)XT(t)fX(t)Y(t), (3)

соответствующий наиболее исследованной в литературе оценке метода наименьших квадратов (МНК-оценке), которая при выполнении определенных условий [8] является оценкой максимального правдоподобия и обладает соответствующими экстремальными свойствами.

Если же количество измерений меньше числа неизвестных параметров, т.е. t < N (X(t) — матрица

РИ, 2002, № 4

43

неполного ранга), оценка (2) записывается следу- информацию, а затем отбрасывающий устаревшую,

ютим образом: описывается соотношениями [ 12]:

0(0 = x(t)[xT(t)x(t)у y(0 • (4)

Обладая рядом несомненных достоинств, данные оценки не свободны от недостатков, одним из которых является неудобство их применения для оценивания параметров в реальном времени. Поэтому при решении задач идентификации в реальном времени используют те или иные рекуррентные формы оценок (3), (4).

2. Рекуррентные алгоритмы идентификации

Рекуррентные формы оценок легко могут быть получены с помощью блочного представления матриц X(t) и вектора Y(t) [9]. Так, РМНК имеет вид

0(t) = 0(t -1) + P(t)x(t)(y(t) -0T(t - 1)x(t)),

P(t - 1)x(t)xT(t)P(t -1) (5)

P(t) = P(t -1) —і—;v' K J v—о (5)

1 + xT(t)P(t - 1)x(t)

P(0) = aI, a >> 0; I — единичная матрица N x N.

— накопление информации

<0+00 = 0l (t - 0+pl+00 ^0(y(0 “ ®T (t “ 0 x(0)’

Pl+00 = Pl (t -1)

P^t - 1)x(t)xT(t)PL(t - Q.

1 + xT (0Pl (t - 1)x(t) ’

(7)

— сброс информации

0(0 = ®l+00 - MO^1 -L - 0 x <(y0 -L - 0-L - 0)’

MQx(t - L - QxT(t - L + QPl+00

pOO=Pl+00+-

1 + xOt-L-0PL+O0^t-L-0 (8)

Здесь pl+00 = [xT+00xl+00 T; xl+00 =

= (Ot-L-O’Ot_— матрица N0L + 0;

POO = [xOOxOO]'°; xl (0=И1-L’ ’^0) -

матрица N x L; L > N — фиксированное окно.

В асимптотике оценка (5) совпадает с оценкой (3).

Уменьшение значений элементов ковариационной матрицы P(t) с течением времени и ее стремление в асимптотике к нулевой не позволяет использовать алгоритм (5) для идентификации нестационарных объектов. Для обеспечения алгоритму необходимых следящих свойств в (5) применяют механизм учета ценности поступающей и имеющейся информации либо в виде экспоненциального взвешивания, либо в виде скользящего окна [10, 11].

РМНК с экспоненциальным взвешиванием информации описывается следующими соотношениями:

0(t) = 0(t -1) + P(t)x(t)(y(t) -0T (t - 1)x(t))’

P(t)

1

X

P(t -1)

P(t - 1)x(t)xT(t)P(t -1) X + xT(t)P(t - 1)x(t)

(6)

Аналогично могут быть выписаны соотношения для алгоритма, работающего по типу “сброс-накопление”, а также другие модификации РМНК со скользящим окном [12].

Если в алгоритме (6) свободно выбираемым параметром является коэффициент X, то в (7), (8) — ширина скользящего окна L. Некоторые рекомендации по выбору L даны в [13].

Может быть получено несколько рекуррентных форм оценки (4), одна из которых, имеющая вид

0ІН-0Н Н і RL-0t 0x(0 w

0( '>-9<1 - 1}+xT(,)Rl - ОДОх

х( О0-0(t-0^0)’

Rt-L+00 _ Rt-L+i-0і _ 0 _ (9)

_ Rt -l+. 0і - QQt - L+QxQ1 - L+QRt-l+. 0і - 0 xT(t - l+ORt-L+i-0. - ORt-L+.-Oi-0 ’

где X є (0’ 1] — весовой параметр или параметр взвешивания (обычно выбирают 0,995 < X < 0,999).

Если в (6) ценность устаревшей информации уменьшается экспоненциально, но алгоритм использует все поступившие измерения, то РМНК со скользящим окном учитывает некоторое ограниченное

фиксированное число измерений L > N (L называют также памятью алгоритма). В зависимости от того, как организуется учет информации (добавляется ли сначала новая информация, а затем исключается устаревшая, либо же сначала исключается устаревшая, а затем добавляется новая), возможны две рекуррентные формы алгоритма. Так, РМНК со скользящим окном, работающий по типу “накопление-сброс”, т.е. сначала включающий новую

R, l(0) = I; і= 1’2’ - ’L; L <const < N , была приведена в работе[14].

Алгоритм (9) предполагает, что на каждой итерации матрица Rt _L+i (0 вычисляется L раз и после этого используется в формуле для уточнения оценки

0(0.

Более удобные алгоритмы, учитывающие накопление и сброс устаревшей информации и то, что L = c0nst < N , могут быть получены, если воспользоваться тем же приемом, который применялся при получении (7)-(8).

Как и алгоритмы (6), (7)-(8), алгоритм (9) является эффективным при идентификации нестационарных объектов.

44

РИ, 2002, № 4

Parametric Identification Algorithms

К

Щ MHK a

Kaczmarz algorithm MNK algorithm

MNK algorithm with exponential smoothing

■©

Parameter vector dimension: Noise:

Number of iterations:

©

0.10

30

GENERATOR CHOISE

if if i!

CONTROL BUTT

Oi

Count

J

tops I

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Reset

2) блок выбора алгоритма;

3) генераторы параметров и входа алгорит-

ма;

Рис.1. Композитный компонент Parametric Identification Algorithms

Приведенные выше алгоритмы использовали либо всю имеющуюся в наличии информацию (алгоритмы (6) и (7)), либо часть ее, определяемую величиной скользящего окна L (алгоритмы (8) и (9)), поэтому их реализация требовала соответствующих матричных вычислений. Наиболее же простым в вычислительном отношении является оценка (2), использующая псевдообращение вектора х, что приводит к алгоритму Качмажа [10]:

0(1) = 0(1 -1) +

y(t) -6T(t -1)x(t)

l|x(t)||2

x(t),

(10)

где

ЮГ =£ хдо.

Хотя динамические свойства (6) уступают свойствам алгоритма РМНК (5), вычислительная простота алгоритма Качмажа играет иногда решающую роль и делает его зачастую более привлекательным. Легко видеть, что алгоритм (10) является частным случаем (9) при L=1. При наличии же помех

измерений |y (t) необходима следующая модификация алгоритма:

y(0-^(t

------х(,)- (11)

КО = 0(t - 0+pJ

4) интерфейс для задания параметров тестирования;

5) блок выбора генератора параметров;

6) блок управления тестированием;

7) индикатор количества итераций.

Компоненты алгоритмов параметрической идентификации были созданы при помощи встроенного языка BASIC без применения дополнительных языков программирования. Создание такого рода компонентов осуществляется путем кодирования стандартного компонента BASIC Programming из пакета IntelligentPad. Для разработанного композитного компонента также были созданы генераторы входных векторов, векторов параметров, переключатели алгоритмов и типов генераторов. Для создания нового компонента необходимо определить, какие слоты он должен иметь, а также типы данных слотов.

Так как большинство аргументов алгоритма является числовыми векторами, то соответствующие им слоты будут иметь тип DICTIONARY. Этот тип составной и может включать в себя данные других типов, в том числе и DICTIONARY. Однако для задания таких параметров, как размерность вектора, количество шагов моделирования и т.п. используются слоты типа NUMBER. Кроме того, существуют управляющие сигналы для алгоритма, которые подаются на слоты типа COMMAND. Имена и типы слотов одного из компонентов алгоритмов параметрической идентификации приведены в таблице. Жирным шрифтом выделен выходной слот.

Работа алгоритмов осуществляется при поступлении на их входы сигналов входного вектора, которые вырабатываются соответствующим генератором по нормальному закону распределения, тактируемым счетчиком итераций. Разработанные компоненты связаны с другими стандартными или

где p є (0, l), и чем выше уровень помех, тем меньшее значение должен иметь параметр p .

З.Практическая реализация алгоритма и результаты моделирования

Разработанный пакет позволяет исследовать скорость сходимости (в стационарном случае) и точность рекуррентных алгоритмов слежения за изменяющимися по заданным законам параметрами исследуемого объекта при различных видах распределений полезных сигналов и помех (как при постоянных, так и при изменяющихся их статистических свойствах), уровня помех, наличия корреляции и т.д.

Реализация композитного компонента Parametric Identification Algorithms, разработанного в среде IntelligentPad, представлена на рис. 1. Данная тестовая система содержит следующие блоки:

1) алгоритмы параметрической идентификации;

Слоты компонента алгоритма идентификации

Имя слота Тип Назначение

Outputs DICTIONARY Выход алгоритма, идентифицированный вектор параметров

errorl DICTIONARY Оценка изменения рассогласования выходных сигналов модели и объекта

error2 DICTIONARY Оценка изменения значения критерия идентификации

reset COMMAND Управляющий сигнал очистки и инициализации данных

num_iter NUMBER Количество итераций алгоритма

dimension NUMBER Размерность вектора параметров

Noise NUMBER Величина зашумления алгоритма

param vect DICTIONARY Вектор параметров

Inputs DICTIONARY Вектор входа

РИ, 2002, № 4

45

разработанными компонентами через соответствующие слоты, с помощью которых осуществляется передача данных от одного компонента к другому.

Результаты моделирования приведены на рис .2. На графиках представлен вектор генерируемых параметров (1) и вектор подстраиваемых параметров (2) алгоритма. По виду графиков можно сделать вывод о том, что алгоритм Качмажа, в данном случае, обеспечивает достаточно высокую степень точности слежения за изменяющимися параметрами.

Рис. 2. График подстройки параметров алгоритма

На рис.3 и 4 приведены соответственно графики изменения рассогласования выходных сигналов модели и объекта по алгоритму Качмажа и значения относительного критерия идентификации:

, IKQ-e(t)||‘

И б-ё(о)||!'

Для построения графиков использован стандартный компонент Graph.

Рис. 3. График изменения рассогласования выходных сигналов модели и объекта

Рис. 4. График изменения значения критерия идентификации

Литература: 1. Tanaka Y. Meme Media Meme Market Architectures for the Reediting and Redistribution of Knowledge Resources // International Conference on Multimedia Modeling’ 98. Lausanne. 1998. 2. Tanaka Y. Meme Media and a World-Wide Meme Pool // The Fourth ACM International Multimedia Conference. Nov. Boston. 1996. P. 175-186. 3. Tanaka Y. From Augmentation to Meme Media: IntelligentPad and the World-Wide Repository of Pads // Proc. of European Japanese Seminar on Information Modeling and Knowledge Bases. Kista, Sweden. June, 1994. 4. Tanaka Y., Nagasaki A., Akaishi M, Noguchi T. A synthetic Media Architecture for an Object-Oriented Open Platform / / Personal Computers and Intelligent Systems, Information Processing (ed. F.H. Vogt). 1992. Vol. III. P. 104-110. 5. Bodyanskiy Ye., Rudenko O, Tanaka Y, Stephan A., Popov S. Investigations Regarding Adaptive PID Controllers and their Implementation in Intelligent-Pad. Meme Media Laboratory, Hokkaido-University, 1999. 6. БодянскийE.B., Руденко О.Г, Танака Ю, Штефан А, Колодяжный B.B., Попов C.B. Адаптивный регулятор в среде IntelligentPad // Радиоэлектроника и информатика. 2000. 7. Алберт А. Регрессия, псевдоинверсия и рекуррентное оценивание. М.: Наука, 1977. 224 с. 8. Рао С.Р. Линейные статистические методы и их применение. М.: Наука, 1968. 547 с. 9. Лъюнг Л. Идентификация систем. Теория для пользователя. М.: Наука, 1991. 432 с. 10. Райбман Н. С., ЧадеевB.M. Построение моделей процессов производства. М.: Энергия, 1975. 375 с. 11.Перелъман И.И. Оперативная идентификация объектов управления. М.: Энергоиздат, 1982. 272 с. 12.Ру-денко О.Г, Теренковский ИД, Штефан А, Ода ГА Модифицированный алгоритм текущего регрессионного анализа в задачах идентификации и прогнозирования // Радиоэлектроника и информатика. 1998. №4 (05). С.58-61. 13.Либеролъ Б.Д, Руденко О.Г. Выбор ширины окна в алгоритме текущего регрессионного анализа // Доп. НАН України. 1996. №3. С.69-73. 14.Ищенко ЛА, Либеролъ Б.Д., Руденко О.Г. О свойствах одного класса многошаговых адаптивных алгоритмов идентификации // Киберне -тика. 1985. №1. С.92-96.

Поступила в редколлегию 11.04.2002

Рецензент: д-р техн. наук, проф. Петров Э.Г.

Бодянский Евгений Владимирович, д-р техн. наук, профессор кафедры искусственного интеллекта, научный руководитель ПНИЛ АСУ ХНУРЭ, член IEEE. Научные интересы: адаптивные системы, нейрофаззи-системы. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90. E-mail: [email protected]

Руденко Олег Григорьевич, д-р техн. наук, профессор, заведующий кафедрой ЭВМ ХНУРЭ, член IEEE. Научные интересы: идентификация систем, искусственные нейронные сети. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-93-54. E-mail: [email protected]

Танака Юзуру, доктор, профессор, директор Meme Media Laboratory, университет Хоккайдо, Саппоро, Япония. E-mail: [email protected]

Штефан Андреас, доктор-инженер, почетный профессор ХНУРЭ, глава фирмы Dr.Stephan & Partner, Ильме нау, Германия. E-mail: [email protected]

Аксак Наталья Георгиевна, канд. техн. наук, доцент кафедры ЭВМ ХНУРЭ. Научные интересы: идентификация систем. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-93-54.

Лавриненко Константин Анатольевич, аспирант кафедры ЭВМ ХНУРЭ. Научные интересы: идентификация. Адрес: Украина, 61166, Харьков, пр. Ленина, 14.

Росинский Дмитрий Николаевич, инженер кафедры ЭВМ ХНУРЭ. Научные интересы: искусственные нейронные сети. Адрес: Украина, 61166, Харьков, пр. Ленина, 14.

46

РИ, 2002, № 4

i Надоели баннеры? Вы всегда можете отключить рекламу.