Научная статья на тему 'Адаптивный регулятор с активным накоплением информации на основе настраиваемого упредителя'

Адаптивный регулятор с активным накоплением информации на основе настраиваемого упредителя Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
146
51
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Адонин Олег Валерьевич, Бодянский Евгений Владимирович, Котляревский Сергей Владимирович

Рассматривается проблема активно-адаптивного управления в условиях неопределенности динамическим стохастическим объектом с запаздыванием в канале управления с использованием настраиваемого упредителя. Предложенный алгоритм является обобщением известных квазипрямых законов управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Адонин Олег Валерьевич, Бодянский Евгений Владимирович, Котляревский Сергей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The adaptive regulator with active accumulation of the information on the basis of adjusted predictor

Active adaptive control problem for dynamic plant with delay in the control channel in the presence of uncertainties is considered. The proposed algorithm can be considered as generalization of quazidirect control techniques.

Текст научной работы на тему «Адаптивный регулятор с активным накоплением информации на основе настраиваемого упредителя»

УДК 681.513

АДАПТИВНЫЙ РЕГУЛЯТОР С АКТИВНЫМ НАКОПЛЕНИЕМ ИНФОРМАЦИИ НА ОСНОВЕ НАСТРАИВАЕМОГО УПРЕДИТЕЛЯ

АДОНИН О.В., БОДЯНСКИЙЕ.В., КОТЛЯРЕВСКИЙ С.В.

обеспечивающий прогноз на d -шагов с ошибкой

vp(t + d) = F(q-* 1)e(t + d).

Подставляя (2) в (1), получаем форму критерия

iQ = M{(P(q _1)(y(t + d/t) + v(t + d)) -- R(q-1 )y* (t + d))2 3 + Q(q-1 )u(t))2} =

= (P(q-1 )y(t + d/t) - R(q-1 )y*(t + d))2 +

+ (Q(q -1 )u(t))2 + M{(P(q-1 )v(t + d))2

Ft},

Рассматривается проблема активно-адаптивного управления в условиях неопределенности динамическим стохастическим объектом с запаздыванием в канале управления с использованием настраиваемого упредителя. Предложенный алгоритм является обобщением известных квазипрямых законов управления.

Согласно современной классификации, дискретные адаптивные системы управления можно разделить на три класса:

1. Прямые системы, в которых настраиваются непосредственно параметры регулятора, при этом вектор настраиваемых параметров может рассматриваться как оценка коэффициентов некоторого эталонного регулятора. Именно такие системы рассмотрены в предыдущих работах [1-3].

минимизируя которую по u(t), приходим к управлению

5IQ _

6u(t)

- 2(aP(q>^l,;d/l) )(P(q)y(t+d/t) - (3)

- R(q)y(t + d)) + 2Q(0)Q(q)u(t) = 0.

Проводя очевидные преобразования (3)

bo(P(q ДуП + d/t) -R(q 1)y (t + d)) +

+ Q(0)Q(q _1)u(t) = 0;

2. Непрямые системы, или системы с настраиваемой моделью с идентификатором в контуре. В этих системах задача решается в два этапа: идентификация модели, совпадающей по структуре с объектом управления, и вычисление параметров регулятора на основе полученных оценок.

3. Квазипрямые системы, занимающие промежуточное положение между прямыми и непрямыми системами. Эти системы содержат в контуре настраиваемый упредитель, который в общем случае отличается от модели объекта. В [4,5] была предложена группа стохастически эквивалентных квазипрямых систем, а в [6] предпринята попытка синтеза активно-адаптивного регулятора с настраиваемым упредителем при минимуме априорной информации.

В основе синтеза квазипрямых систем лежит минимизация критерия

IQ = M{(P(q-1)y(t + d) - R(q-1 )y*(t + d))2 +

+ (Q(q _1 )u(t))2

Ft},

(1)

b0 (C-1 (q-1 )(F(q)B(q)u(t) + G(q)y(t)) -- R(q-1 )y (t + d)) + Q(0)Q(q-1 )u(t) = 0,

вводя полином Q(q_1) = b0Q(0)Q(q_1) и умножая (4) на C(q_1), получаем уравнение

(F(q _1 )B(q-1) + C(q-1 )Q(q-1 ))u(t) -

- C(q)R(q)y * (t + d) + G(q_1 )y(t) = 0,

совпадающее с выражением упредителя, полученным в [ 1 ], откуда следует, что квазипрямая система обеспечивает то же качество управления, что и прямая.

Вводя далее отфильтрованные переменные

lx(t + d/t) = P(q)y(t + d/t),

|x*(t + d) = r(q)y*(t + d),

перепишем уравнение оптимального упредителя в виде:

где Q(q 1) — полином порядка nQ .

Используя методику преобразований, введенную в [1-3], поставим в соответствие преобразованному уравнению объекта оптимальный многошаговый упредитель выхода:

P(q-1)y(t + d/t) =

= —^ (F(q-1 )B(q-1 )u(t) + G(q-1 )y(t)), (2) C(q-1)

x(t + d/t) = F(q 1)B(q 1)u(t) + G(q 1) x x y(t) + (1 - C(q-1))X(t + d/t)

или

x(t + d/t) = 0T<p(t + d), (5)

где 0 - (nB + d + nA + nC) x 1 — вектор параметров, подлежащих определению,

70

РИ, 2001, № 2

9(t + d) =

= (u(t),...,u(t - пв - d + 1),y(t),...,y(t - nA +1), - x(t + d - 1/t - 1),...,-x(t + d - nc /t - nc))T = = (u(t);V(t^T.

Перепишем далее (5) в форме

X(t + d /1) = 0T9(t + d) = mou(t - d) + l Ty(t - d)

Поэтому в расчетах целесообразно использовать просто вычисляемые характеристики, такие как

ошибка слежения упредителя vM(t), ковариаци-

онная матрица Рф (t + d)

t+d t

Z ф(і)ф1(і)

і=1

-1

G-кри-

терии, применяемый в теории планирования эксперимента, и т.д.

и подставим его в соответствующее уравнение настраиваемого упредителя:

X(t) = 9T (t - 1)<p(t + d) =

= mo (t - 1)u(t - d) + l T (t - 1)y(t - d),

параметры которого настраиваются с помощью какого-либо адаптивного алгоритма идентификации, не использующего значение дисперсии ст2 ,

vp

например, рекуррентного метода наименьших квадратов.

МногошаговыИ настраиваемый прогноз можно получить с помощью прогнозирующей модели

X(t + d) = 0T (t)9(t + d) = mo (t)u(t) + TT (t)y(t),

при этом адаптивная система работает следующим образом:

— вычисление ошибки идентификации;

2i (t) = X(t) -0T(t - 1)(t) = x(t) - X(t);

— вычисление оценок параметров настраиваемого упредителя 0(t);

— вычисление управляющего сигнала u(t);

— вычисление многошагового прогноза:

X(t + d) = 9Tф(t + d).

Качество функционирования квазипрямоИ системні оценивается с помощью четырех видов ошибок: ошибки прогнозирования vP(t) = X(t) - X(t/t - d), ошибки идентификации vI (t) = X(t) - X(t), ошибки слежения упредителя vM (t) = X * (t) - X(t) и ошибки управления vc(t) = X*(t) -X(t). Ошибка vp(t) не наблюдается и не вычисляется, поэтому не может быть использована в расчетах. Ошибка vc(t) является функциеИ коэффициентов полиномов A(q_1), B(q_1), C(q_1), определение которых требует дополнительных вычислении. Использовать ошибки идентификации тоже нецелесообразно, поскольку в этом случае необходимо определять коэффициенты полинома C(q_1) • Заметим, что для ошибки идентификации справедливо соотношение [7]:

M{(C(q-1)(v(t) - e(t)))2

Ft_d} = Ф T(t)P(t)9(t).

Введем критерии

ІІ = M{det Рф (t + d -1)/ det P<p(t + d)|Ft} при ограничениях

M{vM (t + d)|Ft} < VM (t + d), u2 (t) < U2(t) и сформируем лагранжиан:

LQ = -Iі +p((X*(t + d) - X(t + d) - vM(t + d))2 +

+ p(u2(t) - U2(t)) =

= -1 - ф T(t + d)P(p (t + d - 1)(t + d) + p((X * (t + d) --0T(t)9(t + d))2 -

- vM(t + d)) + p(u2(t) - U2(t)) =

=-1 - u2(t)Pffio (t + d -1) - 2u(t)P_ToT (t + d - 1)y(t) -

-Ф T(t)P~(t + d - 1)y(t) +

+ P((x * (t + d))2 + u2 (t)in2 (t) +

+ (TT (t)y(t))2 - 2u(t)x * (t + d)^(t) -

- 2x * (t + d)l(t)(t) - 2u(t)mQ (t)~T (t)y(t) -

- vM(t + d)) +p(u2(t) - U2(t)),

оптимизация которого по u(t) приводит к квази -прямому адаптивному регулятору с активным накоплением информации:

u(t) =

_ P(t)mo (t)(x * (t + d) - ~T (t)y(t)) + Pf^(t + d - 1)y(t)

P(t)m02(t) - Pfo (t + d -1) + p(t) ’

■P(t +1) =

= [P(t) + Гр(t + 1)((x * (t + d) - 0(t)9(t + d))2 - V2(t + d)|, p(t +1) = [(t) + r(t + 1)((uQ (t))2 - U2 (t)|,

совпадающему при x * (t + d) = o с прямым регулятором, введенным в [2].

Таким образом, в настоящей и предыдущих [1-3] работах предложены прямые и квазипрямые адаптивные регуляторы с активным накоплением информации для нестационарных стохастических динамических объектов, возмущаемых “цветным” шумом, с запаздыванием в канале управления. Введенные алгоритмы исследованы с точки зрения

РИ, 2001, № 2

71

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

их оптимальности, показано, что они обеспечивают качество управления выше, чем традиционные стохастически эквивалентные системы.

Литература: 1. Адонин О.В., Бодянский Е.В., Котляревс-кий С.В. Управление динамическими стохастическими нестационарными объектами в условиях неопределенности с активным накоплением информации. 1.Достоверно-эквивалентный подход //Радиоэлектроника и информатика. 1999. N4. С. 76-81. 2. Адонин О.В., Бодянский Е.В., Котляревский С.В Адаптивный регулятор с активным накоплением информации // Радиоэлектроника и информатика. 2000. N3. С.57-60. 3. Адонин О.В., Бодянский Е.В., Котляревский С.В. Управление динамическим стохастическим нестационарным объектом в условиях неопределенности с активным накоплением информации. II. Объект с быстрым дрейфом параметров / / Радиоэлектроника и информатика. 2001. N1. С. 68-7l. 4. Бодянский Е.В., Руденко О.Г. Адаптивные модели в системах управления техническими объектами. Киев: УМВК ВО, 1988. 212 с. 5. Бодянский Е.В., Чайников С.И., Ачкасов А.Е., Воронов-ский Г.К. Адаптивные алгоритмы управления в АСУ ТП и оценка их эффективности на ранних стадиях проектирования. Харьков: ХОУС, 1995. 134 с. 6. Бо-

УДК 681.513.7 "

НЕЙРОСЕТЕВАЯ АДАПТИВНАЯ ФИЛЬТРАЦИЯ ПОЛИГАРМОНИЧЕСКИХ СТОХАСТИЧЕСКИХ СИГНАЛОВ

БОДЯНСКИЙЕ.В., КОТЛЯРЕВСКИЙ С.В, ЧАПЛАНОВ А.П, ШИЛО А.В._________________

Рассматривается задача выделения гармонических компонент произвольных частот из стохастических последовательностей с использованием нейросетевых технологий. Предлагается архитектура искусственной нейронной сети и алгоритмы ее обучения, являющиеся обобщением дельта-правила на случай, если на настраиваемые веса нейронов наложены ограничения. Разработанные алгоритмы оптимальны по быстродействию в классе градиентных процедур и способны отслеживать дрейф параметров отфильтрованных сигналов.

Во многих прикладных задачах, связанных с обработкой сигналов различной природы, достаточно часто возникает проблема выделения периодических компонент, искаженных шумом. Данная проблема обычно сводится к оцениванию параметров гармоник на фоне помех и может быть решена с помощью традиционных методов Фурье - анализа. Здесь, однако, возникает ряд проблем в случае необходимости обработки нестационарных сигналов в реальном времени. В качестве альтернативы Фурье-анализу в последнее время все чаще используются методы адаптивной цифровой фильтрации [ 1 -7], которые в сочетании с нейросетевыми технологиями [8] позволяют реализовать новые возможности компьютерной обработки информации.

дянський Е.В., Борячок М.Д. Оптимальне керування стохастичними об’єктами в умовах невизначеності. Київ: ІСДО, 1993. 164 с. 7. Yoodwin Y. C, Ramadge P.I., Caines P.E., A globally convergent adaptive predictor // Automatica. 1981. 17. N1. Р. 135-140.

Поступила в редколлегию 20.10.2000

Рецензент: д-р техн. наук. проф. Любчик Л.М.

Адонин Олег Валерьевич, инженер 1-й категории кафедры информатики ХТУРЭ. Научные интересы: адаптивные системы управления. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.

Бодянский Евгений Владимирович, д-р техн. наук, профессор кафедры искусственного интеллекта ХТУРЭ. Научные интересы: адаптивные системы, искусственные нейронные сети. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.

E-mail: [email protected]

Котляревский Сергей Владимирович, канд. техн. наук, ведущий научный сотрудник ПНИЛ АСУ ХТУРЭ. Научные интересы: адаптивные системы управления. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.

Предположим, что анализируемая стохастическая последовательность может быть представлена в виде

у =2 (a j cos Wjk+bj sin Wjk)+%(k) =

j=i

= ^Cj sin(®jk+Vj)+%(k), (1)

j=i

где m — количество гармонических компонент в сигнале y(k) (может быть достаточно велико); a, bj, cj, g>j — неизвестные параметры отдельных гармоник; 0< со,=2nfjT0<n — частоты гармонических компонент, в общем случае неизвестные; Т0—период квантования сигнала; k = 1, 2,..., N, ... — текущее дискретное время; Дк)—стохастическая компонента с нулевым математическим ожиданием и ограниченным вторым моментом.

Модели (1) соответствует разностное уравнение

П (1-2cos®,z-1+z-2) y(k)=4(k), (2)

(здесь z-1 — оператор сдвига назад), описывающее формирующий фильтр порядка 2m, образованный цепочкой из m нерекурсивных звеньев второго порядка. Заметим, что на основе уравнения (2) с помощью тех или иных алгоритмов идентификации могут быть восстановлены лишь оценки частот ® j; для нахождения же амплитудных и фазовых характеристик приходится прибегать к достаточно сложным многоэтапным процедурам.

На практике для выделения гармонических компонент из стохастических сигналов наиболее широко распространены нерекурсивные фильтры [3,4,7]. Однако, как отмечалось в [9], подход, основанный на использовании таких фильтров, связан с определенными ограничениями, особенно в случаях,

72

РИ, 2001, № 2

i Надоели баннеры? Вы всегда можете отключить рекламу.