УДК 519.6
МЕТОДЫ ПОМЕХОУСТОЙЧИВОГО ОЦЕНИВАНИЯ ПРИ АНАЛИЗЕ ВРЕМЕННЫХ РЯДОВ
ГРИЦЮК в. и
Рассматриваются условия на наборы моделей, необходимые для реализации процедуры численной минимизации. Исследуется метод М-оценок параметров авторегрессии. Предлагается модифицированный алгоритм помехоустойчивого оценивания параметров в авторегрессионных моделях при наличии аддитивных выбросов.
1. Введение
Одно из важнейших решений, принимаемых в процессе идентификации системы, — выбор критерия идентификации. Использование норм, робастных по отношению к неизвестным заранее изменениям плотности вероятности, повышает устойчивость оценивания данных. Метод М-оценок параметров авторегрессии (АР) дает возможность построения оценок, обладающих свойством асимптотической эффективной помехоустойчивости при наличии посторонних резких выбросов, характер которых определяется самой выборкой. В случае, когда возможна небольшая доля больших ошибок в переменных, неограниченный характер кривой влияния может иметь нежелательные последствия. Это особенно проявляется в моделях АР при наличии аддитивных выбросов. В связи с этим необходимо рассмотреть вопросы использования помехоустойчивых оценок применительно к анализу временных рядов при наличии двух различных типов выбросов и разработать алгоритм, обеспечивающий получение помехоустойчивых оценок параметров авторегрессионных моделей с учетом свойств информационной матрицы. Для робастно -го оценивания необходимо выбрать модельную структуру, к которой применяют сформированный критерий.
2. Модели
Предположим, что члены набора М параметризованы конечномерным (n @ -мерным) вектором параметров © , который изменяется в наборе D м . Набор DM -компактный поднабор Rn0 . Данную модель обозначим M(©). Отсюда
M = {М(©)| ©є D м} . (1).
Модель М(©) понимается как правило для вычисления следующего выхода y(t), основанного на наблюдаемых выходах и входах ко времени t -1, которые обозначим yO_1,uO_1. Правило дается детерминированной функцией [1,2]
g м (®;t,yO“1,uO_1). (2)
Модель на практике часто не дается прямо как явная функция старых данных, как в (2). Приведем
ряд примеров наборов моделей, в которых gM определяется как явно,так и неявно.
Обобщенные, линейные стохастические время-инвариантные модели. Линейная инвариантная во времени модель может быть описана как
y(t) = G @ (q _1) u(t - 1 + H @ (q _1) e(t), (3)
где q_1 оператор сдвига назад; оператор q_1u(t) = u(t -1) и G@ (z) и H@ (z) - матричные функции z (z заменяет q_1), так что H@ (о) = I. Переменные e(«) предполагаются независимыми случайными переменными с нулевыми средними величинами. Предсказатель y(t) при этих предположениях (равный линейному оцениванию по методу наименьших квадратов и условному среднему) дается
y мО-1 ®)=[I - H ©1(q 1)]у(-)+
+ H© (q_1)G© (q_1 )u(t - 1).
Раскрытие (4) по степеням последовательности q прямо ведет к явному представлению (2).
Так как Hq1 (о) = I, член y(t) исчезает. В (4) предполагается, что все старые y(t), u(t), t < 0 известны. Это обычно не так, и они принимаются или как известные (наиболее часто полагают, что равны нулю), или как параметризованные соответствующим образом.
Предположим, линейная система не моделируется прямо в терминах функций импульсной реакции G © (z) и H © (z). Часто используется представление в виде векторного дифференциального уравнения (VDE или ARMAX-моделъ)
A © (q _1)y(t) = B @ (q _1 )u(t -1) + C © (q _1) e(t),(5)
где A © (z), B 0 (z), C0 (z) — матричные полиномы. Другое обобщенное представление в виде пространства состояния в форме представления время-инвариантных обновлений
x0 (t +1) = F@x0 (t) + G0u(t) + K0e(t),
y(t) = H©x© (t) + e(t). (6)
Легко видеть, что эти два представления отвечают G© (z) = Aё1 (z)B0 (z); H0 (z) = A01 (z)C0 (z) (7) и G0 (z) = H 0 [I - zF@ ]_1 G 0;
H 0 (z) = zH 0 [I - zF@]-1K @+1 (8)
соответственно.
После этих примеров можно сформулировать условие на модельный набор (2), который может быть использован в результатах ниже. Условие М1:
Предположим, что функция gM(©;t,y0_1,u0_1)
РИ, 2003, № 2
57
дифференцируема по © для всех © є DM. Пусть D м -компакт. Предположим, что
|g м (©; t, a JЛ а 2"1) - gM (®; t, pj_1, Р 2"1 )| ^
< C £ «1(8)-Pi(s) +|а2 (s)-Р2(s^ (9)
s=0
и |^M(0;t,ot_1,ot_1) - C , где 0t_1 = (0,••• ,0) и a t_1 = (a j (t -1), • • •, a j (0)) для всех t, a t_1, р*_1 и © принадлежат открытой окрестности Dm , где C х да и X х 1. Предположим также, что (d / d©)gм (©; y0_1, u0_1) подвержена (9).Из предположений дифференцируемости, которые не являются сильно ограничительными, условие M Іограничивает модельный набор в двух направлениях. Во-первых, факт, что C может не зависеть от aJ или р|, накладывает ограничения на то, как быстро gM может возрастать c y0(s) и U0(s) для нелинейных моделей.
Эффективно, если возрастание не быстрее, чем линейное. Это не рассматривается как серьезное ограничение, так как можно всегда ввести некоторую насыщенность для больших величин.
Следующее ограничение — это то, что модель ( и ее производные по ©) экспоненциально устойчива. Фактически, эти условия позволяют сделать процедуру численной минимизации возможной.
Для VDE-модели (5) видно, что устойчивость этих линейных фильтров определяется C @ (q_1). Если det C @ (z) имеет все нули строго вне единичного круга, тогда экспоненциальная устойчивость фильтров ставится под сомнение. Для модели в пространстве состояний (6) экспоненциальная устойчивость следует, если матрица F@ - K @ H @ устойчива.
Соберем все результаты. Примем VDE-модель (5) или время-инвариантную модель в пространстве состояний (6). Предположим, что элементы этих матриц непрерывно дифференцируемы по © . Пусть Dm— компактный набор, ограниченный так, что
1) для VDE модели (5) det C@ (z) не имеет нулей вне единичного круга для всех © є Dm ;
2) для модели состояния (6) матрица F@ - K @H @ имеет все собственные значения точно внутри единичного круга для всех © є Dm .
Тогда условие М1 выполняется для каждого из этих модельных наборов.
3. Помехоустойчивое оценивание в AP моделях
Рассмотрим варианты помехоустойчивых оценок уравнения авторегрессии [3], являющегося частным случаем уравнения (5). При анализе временных рядов [3,4] выделяют некоторые типы резких выбросов: выбросы, определяемые самой выборкой, и выбросы, связанные с аддитивными ошибками результатов наблюдений. Обобщенные М-оценки — GM-оценки являются одной из возмож-
ностей получения помехоустойчивых оценок параметров в авторегрессионных моделях при наличии как выбросов, определяемых выборкой, так и аддитивных выбросов. Пусть ц — помехоустойчивая оценки параметра сдвига, и пусть задан набор
~ T
z = (Уі_1 -Ц, Уі-2 -д,••• ,yi-p-р) .
Пусть C_1 - неотрицательно определенная помехоустойчивая оценка матрицы C_1, где С - ковариационная матрица размерности p х p авторегрессии p-го порядка. Введем W(zj) = ra(p zj C zj), где та(-) — неотрицательная непрерывная функция такая, что величина W(zi)zj ограничена. Если у является ограниченной и непрерывной функцией, то все сказанное верно для слагаемых в следующих уравнениях, которые определяют GM-оценки параметра р Р gm = (У, ф1, " •, фp):
£ W(zj)zj у
i=p+1
yi _zi РGM
s
= 0;
1 n ~ 2 —2—- £W(Zj)v2
n - 2p - 1i=p+1
yj _ zi PGM
s
= A.
~ 2
Если ц = ц и A = EфW(zj)Eфу (r), то s является состоятельной оценкой стЕ при наличии в IO -модели (выбросов, определяемых выборкой ) распределения Еаусса. С помощью итерационного взвешенного метода наименьших квадратов можно построить приближенные решения этих уравнений — GM-оценки, применяя методы регуляризации, как в [5], позволяющие повысить численную устойчивость, что необходимо в случае недостаточно информативных данных.
Выводы
Таким образом, предлагаемый алгоритм позволяет повысить устойчивость оценивания и получить оценки, являющиеся состоятельными для моделей выбросов, определяемых выборкой (вне зависимости от наличия предположений о распределении Еаусса или ограниченной величине дисперсии). Кроме того, полученные оценки являются качественно помехоустойчивыми относительно аддитивных выбросов.
Литература: 1. Ljung L. On consistency and identifiability // Mathematical Programming Study, 1976. N5.P. 169-190. 2. Caines P. E. Prediction error identification methods for stationary stochastic processes // IEEE Trans. Automat. Contr., 1976. Vol. AC-21. P.500-506. 3. Martin R.D., Zeh J.E. Determining the character of time series outliers // Proceeding of the Amer. Statist. Assoc.,1977. 4. Gastwirth J.L., Rubin H. The behaviour of robust estimation on dependent data // Annals. Statist., 1975. Vol.3, N.5. Р. 10701100. 5. Трицюк В.И. Помехоустойчивые методы оценки параметров // ААЭКС, 2001. №1. С.15-21.
Поступила в редколлегию 17.05.2003 Рецензент: д-р техн. наук, проф. Петров Э.Е.
Грицюк Вера Ильинична, канд. техн. наук, доцент кафедры системотехники ХНУРЭ. Хобби: музыка, литература. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-306.
58
РИ, 2003, № 2