УДК 681.513
АДАПТИВНЫЙ РЕГУЛЯТОР С АКТИВНЫМ НАКОПЛЕНИЕМ ИНФОРМАЦИИ НА ОСНОВЕ НАСТРАИВАЕМОГО УПРЕДИТЕЛЯ
АДОНИН О.В., БОДЯНСКИЙЕ.В., КОТЛЯРЕВСКИЙ С.В.
обеспечивающий прогноз на d -шагов с ошибкой
vp(t + d) = F(q-* 1)e(t + d).
Подставляя (2) в (1), получаем форму критерия
iQ = M{(P(q _1)(y(t + d/t) + v(t + d)) -- R(q-1 )y* (t + d))2 3 + Q(q-1 )u(t))2} =
= (P(q-1 )y(t + d/t) - R(q-1 )y*(t + d))2 +
+ (Q(q -1 )u(t))2 + M{(P(q-1 )v(t + d))2
Ft},
Рассматривается проблема активно-адаптивного управления в условиях неопределенности динамическим стохастическим объектом с запаздыванием в канале управления с использованием настраиваемого упредителя. Предложенный алгоритм является обобщением известных квазипрямых законов управления.
Согласно современной классификации, дискретные адаптивные системы управления можно разделить на три класса:
1. Прямые системы, в которых настраиваются непосредственно параметры регулятора, при этом вектор настраиваемых параметров может рассматриваться как оценка коэффициентов некоторого эталонного регулятора. Именно такие системы рассмотрены в предыдущих работах [1-3].
минимизируя которую по u(t), приходим к управлению
5IQ _
6u(t)
- 2(aP(q>^l,;d/l) )(P(q)y(t+d/t) - (3)
- R(q)y(t + d)) + 2Q(0)Q(q)u(t) = 0.
Проводя очевидные преобразования (3)
bo(P(q ДуП + d/t) -R(q 1)y (t + d)) +
+ Q(0)Q(q _1)u(t) = 0;
2. Непрямые системы, или системы с настраиваемой моделью с идентификатором в контуре. В этих системах задача решается в два этапа: идентификация модели, совпадающей по структуре с объектом управления, и вычисление параметров регулятора на основе полученных оценок.
3. Квазипрямые системы, занимающие промежуточное положение между прямыми и непрямыми системами. Эти системы содержат в контуре настраиваемый упредитель, который в общем случае отличается от модели объекта. В [4,5] была предложена группа стохастически эквивалентных квазипрямых систем, а в [6] предпринята попытка синтеза активно-адаптивного регулятора с настраиваемым упредителем при минимуме априорной информации.
В основе синтеза квазипрямых систем лежит минимизация критерия
IQ = M{(P(q-1)y(t + d) - R(q-1 )y*(t + d))2 +
+ (Q(q _1 )u(t))2
Ft},
(1)
b0 (C-1 (q-1 )(F(q)B(q)u(t) + G(q)y(t)) -- R(q-1 )y (t + d)) + Q(0)Q(q-1 )u(t) = 0,
вводя полином Q(q_1) = b0Q(0)Q(q_1) и умножая (4) на C(q_1), получаем уравнение
(F(q _1 )B(q-1) + C(q-1 )Q(q-1 ))u(t) -
- C(q)R(q)y * (t + d) + G(q_1 )y(t) = 0,
совпадающее с выражением упредителя, полученным в [ 1 ], откуда следует, что квазипрямая система обеспечивает то же качество управления, что и прямая.
Вводя далее отфильтрованные переменные
lx(t + d/t) = P(q)y(t + d/t),
|x*(t + d) = r(q)y*(t + d),
перепишем уравнение оптимального упредителя в виде:
где Q(q 1) — полином порядка nQ .
Используя методику преобразований, введенную в [1-3], поставим в соответствие преобразованному уравнению объекта оптимальный многошаговый упредитель выхода:
P(q-1)y(t + d/t) =
= —^ (F(q-1 )B(q-1 )u(t) + G(q-1 )y(t)), (2) C(q-1)
x(t + d/t) = F(q 1)B(q 1)u(t) + G(q 1) x x y(t) + (1 - C(q-1))X(t + d/t)
или
x(t + d/t) = 0T<p(t + d), (5)
где 0 - (nB + d + nA + nC) x 1 — вектор параметров, подлежащих определению,
70
РИ, 2001, № 2
9(t + d) =
= (u(t),...,u(t - пв - d + 1),y(t),...,y(t - nA +1), - x(t + d - 1/t - 1),...,-x(t + d - nc /t - nc))T = = (u(t);V(t^T.
Перепишем далее (5) в форме
X(t + d /1) = 0T9(t + d) = mou(t - d) + l Ty(t - d)
Поэтому в расчетах целесообразно использовать просто вычисляемые характеристики, такие как
ошибка слежения упредителя vM(t), ковариаци-
онная матрица Рф (t + d)
t+d t
Z ф(і)ф1(і)
і=1
-1
G-кри-
терии, применяемый в теории планирования эксперимента, и т.д.
и подставим его в соответствующее уравнение настраиваемого упредителя:
X(t) = 9T (t - 1)<p(t + d) =
= mo (t - 1)u(t - d) + l T (t - 1)y(t - d),
параметры которого настраиваются с помощью какого-либо адаптивного алгоритма идентификации, не использующего значение дисперсии ст2 ,
vp
например, рекуррентного метода наименьших квадратов.
МногошаговыИ настраиваемый прогноз можно получить с помощью прогнозирующей модели
X(t + d) = 0T (t)9(t + d) = mo (t)u(t) + TT (t)y(t),
при этом адаптивная система работает следующим образом:
— вычисление ошибки идентификации;
2i (t) = X(t) -0T(t - 1)(t) = x(t) - X(t);
— вычисление оценок параметров настраиваемого упредителя 0(t);
— вычисление управляющего сигнала u(t);
— вычисление многошагового прогноза:
X(t + d) = 9Tф(t + d).
Качество функционирования квазипрямоИ системні оценивается с помощью четырех видов ошибок: ошибки прогнозирования vP(t) = X(t) - X(t/t - d), ошибки идентификации vI (t) = X(t) - X(t), ошибки слежения упредителя vM (t) = X * (t) - X(t) и ошибки управления vc(t) = X*(t) -X(t). Ошибка vp(t) не наблюдается и не вычисляется, поэтому не может быть использована в расчетах. Ошибка vc(t) является функциеИ коэффициентов полиномов A(q_1), B(q_1), C(q_1), определение которых требует дополнительных вычислении. Использовать ошибки идентификации тоже нецелесообразно, поскольку в этом случае необходимо определять коэффициенты полинома C(q_1) • Заметим, что для ошибки идентификации справедливо соотношение [7]:
M{(C(q-1)(v(t) - e(t)))2
Ft_d} = Ф T(t)P(t)9(t).
Введем критерии
ІІ = M{det Рф (t + d -1)/ det P<p(t + d)|Ft} при ограничениях
M{vM (t + d)|Ft} < VM (t + d), u2 (t) < U2(t) и сформируем лагранжиан:
LQ = -Iі +p((X*(t + d) - X(t + d) - vM(t + d))2 +
+ p(u2(t) - U2(t)) =
= -1 - ф T(t + d)P(p (t + d - 1)(t + d) + p((X * (t + d) --0T(t)9(t + d))2 -
- vM(t + d)) + p(u2(t) - U2(t)) =
=-1 - u2(t)Pffio (t + d -1) - 2u(t)P_ToT (t + d - 1)y(t) -
-Ф T(t)P~(t + d - 1)y(t) +
+ P((x * (t + d))2 + u2 (t)in2 (t) +
+ (TT (t)y(t))2 - 2u(t)x * (t + d)^(t) -
- 2x * (t + d)l(t)(t) - 2u(t)mQ (t)~T (t)y(t) -
- vM(t + d)) +p(u2(t) - U2(t)),
оптимизация которого по u(t) приводит к квази -прямому адаптивному регулятору с активным накоплением информации:
u(t) =
_ P(t)mo (t)(x * (t + d) - ~T (t)y(t)) + Pf^(t + d - 1)y(t)
P(t)m02(t) - Pfo (t + d -1) + p(t) ’
■P(t +1) =
= [P(t) + Гр(t + 1)((x * (t + d) - 0(t)9(t + d))2 - V2(t + d)|, p(t +1) = [(t) + r(t + 1)((uQ (t))2 - U2 (t)|,
совпадающему при x * (t + d) = o с прямым регулятором, введенным в [2].
Таким образом, в настоящей и предыдущих [1-3] работах предложены прямые и квазипрямые адаптивные регуляторы с активным накоплением информации для нестационарных стохастических динамических объектов, возмущаемых “цветным” шумом, с запаздыванием в канале управления. Введенные алгоритмы исследованы с точки зрения
РИ, 2001, № 2
71
их оптимальности, показано, что они обеспечивают качество управления выше, чем традиционные стохастически эквивалентные системы.
Литература: 1. Адонин О.В., Бодянский Е.В., Котляревс-кий С.В. Управление динамическими стохастическими нестационарными объектами в условиях неопределенности с активным накоплением информации. 1.Достоверно-эквивалентный подход //Радиоэлектроника и информатика. 1999. N4. С. 76-81. 2. Адонин О.В., Бодянский Е.В., Котляревский С.В Адаптивный регулятор с активным накоплением информации // Радиоэлектроника и информатика. 2000. N3. С.57-60. 3. Адонин О.В., Бодянский Е.В., Котляревский С.В. Управление динамическим стохастическим нестационарным объектом в условиях неопределенности с активным накоплением информации. II. Объект с быстрым дрейфом параметров / / Радиоэлектроника и информатика. 2001. N1. С. 68-7l. 4. Бодянский Е.В., Руденко О.Г. Адаптивные модели в системах управления техническими объектами. Киев: УМВК ВО, 1988. 212 с. 5. Бодянский Е.В., Чайников С.И., Ачкасов А.Е., Воронов-ский Г.К. Адаптивные алгоритмы управления в АСУ ТП и оценка их эффективности на ранних стадиях проектирования. Харьков: ХОУС, 1995. 134 с. 6. Бо-
УДК 681.513.7 "
НЕЙРОСЕТЕВАЯ АДАПТИВНАЯ ФИЛЬТРАЦИЯ ПОЛИГАРМОНИЧЕСКИХ СТОХАСТИЧЕСКИХ СИГНАЛОВ
БОДЯНСКИЙЕ.В., КОТЛЯРЕВСКИЙ С.В, ЧАПЛАНОВ А.П, ШИЛО А.В._________________
Рассматривается задача выделения гармонических компонент произвольных частот из стохастических последовательностей с использованием нейросетевых технологий. Предлагается архитектура искусственной нейронной сети и алгоритмы ее обучения, являющиеся обобщением дельта-правила на случай, если на настраиваемые веса нейронов наложены ограничения. Разработанные алгоритмы оптимальны по быстродействию в классе градиентных процедур и способны отслеживать дрейф параметров отфильтрованных сигналов.
Во многих прикладных задачах, связанных с обработкой сигналов различной природы, достаточно часто возникает проблема выделения периодических компонент, искаженных шумом. Данная проблема обычно сводится к оцениванию параметров гармоник на фоне помех и может быть решена с помощью традиционных методов Фурье - анализа. Здесь, однако, возникает ряд проблем в случае необходимости обработки нестационарных сигналов в реальном времени. В качестве альтернативы Фурье-анализу в последнее время все чаще используются методы адаптивной цифровой фильтрации [ 1 -7], которые в сочетании с нейросетевыми технологиями [8] позволяют реализовать новые возможности компьютерной обработки информации.
дянський Е.В., Борячок М.Д. Оптимальне керування стохастичними об’єктами в умовах невизначеності. Київ: ІСДО, 1993. 164 с. 7. Yoodwin Y. C, Ramadge P.I., Caines P.E., A globally convergent adaptive predictor // Automatica. 1981. 17. N1. Р. 135-140.
Поступила в редколлегию 20.10.2000
Рецензент: д-р техн. наук. проф. Любчик Л.М.
Адонин Олег Валерьевич, инженер 1-й категории кафедры информатики ХТУРЭ. Научные интересы: адаптивные системы управления. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.
Бодянский Евгений Владимирович, д-р техн. наук, профессор кафедры искусственного интеллекта ХТУРЭ. Научные интересы: адаптивные системы, искусственные нейронные сети. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.
E-mail: [email protected]
Котляревский Сергей Владимирович, канд. техн. наук, ведущий научный сотрудник ПНИЛ АСУ ХТУРЭ. Научные интересы: адаптивные системы управления. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 40-98-90.
Предположим, что анализируемая стохастическая последовательность может быть представлена в виде
у =2 (a j cos Wjk+bj sin Wjk)+%(k) =
j=i
= ^Cj sin(®jk+Vj)+%(k), (1)
j=i
где m — количество гармонических компонент в сигнале y(k) (может быть достаточно велико); a, bj, cj, g>j — неизвестные параметры отдельных гармоник; 0< со,=2nfjT0<n — частоты гармонических компонент, в общем случае неизвестные; Т0—период квантования сигнала; k = 1, 2,..., N, ... — текущее дискретное время; Дк)—стохастическая компонента с нулевым математическим ожиданием и ограниченным вторым моментом.
Модели (1) соответствует разностное уравнение
П (1-2cos®,z-1+z-2) y(k)=4(k), (2)
(здесь z-1 — оператор сдвига назад), описывающее формирующий фильтр порядка 2m, образованный цепочкой из m нерекурсивных звеньев второго порядка. Заметим, что на основе уравнения (2) с помощью тех или иных алгоритмов идентификации могут быть восстановлены лишь оценки частот ® j; для нахождения же амплитудных и фазовых характеристик приходится прибегать к достаточно сложным многоэтапным процедурам.
На практике для выделения гармонических компонент из стохастических сигналов наиболее широко распространены нерекурсивные фильтры [3,4,7]. Однако, как отмечалось в [9], подход, основанный на использовании таких фильтров, связан с определенными ограничениями, особенно в случаях,
72
РИ, 2001, № 2