Краткие сообщения
УДК 519.233.3, 519.246.8
РОБАСТНОСТЬ GM-ТЕСТОВ В АВТОРЕГРЕССИИ ПРОТИВ ВЫБРОСОВ
Д. М. Есаулов1
В статье рассматриваются свойства GM-оценок и GM-тестов для проверки линейных гипотез в ЛИ^)-модели в случае, когда наблюдения содержат грубые ошибки (выбросы). В частности, найдено предельное распределение тестовых статистик, что позволяет установить робастность GM-тестов. Рассматривается схема с аддитивными одиночными выбросами интенсивности O(n-1/2), n — объем данных.
Ключевые слова: робастность, проверка гипотез, авторегрессия, GM-оценки, GM-тесты.
The article deals with properties of GM-estimators and GM-tests for linear hypotheses in AR(p)-processes when the observations contain outliers. In particular, we obtain the marginal distribution of test statistics, which allows us to prove the robustness of these GM-tests. The scheme of data contamination by additive single outliers with the intensity O(n-1/2), where n is the data level, is considered.
Key words: robustness, conjecture checking, autoregression, GM-estimators, GM-tests.
1. Введение. В статье рассматривается проверка линейных гипотез в авторегрессии в случае, когда наблюдения содержат грубые ошибки (выбросы). Выбросы предполагаются независимыми, аддитивными, с интенсивностью 7n = min(1, n-l/27), 7 ^ 0, параметр 7 неизвестен. Это локальный вариант известной схемы засорения данных из [1]. Тесты строятся на основе GM-оценок параметров модели. В стандартной ситуации (т.е. при отсутствии засорений) подобные оценки детально изучены в [2].
Робастность тестов будет характеризоваться равностепенной непрерывностью семейства предельных мощностей по переменной 7. Равностепенная непрерывность — ключевой момент в определении робастности статистических оценок и статистических тестов. Качественная робастность оценок для случая независимых данных была определена в [3], затем это понятие было распространено на временные ряды [4]. Качественная робастность тестов для независимых данных была исследована в [5]. В отличие от упомянутых работ мы рассматриваем задачу в локальной схеме засорения данных. Наша постановка задачи родственна исследованию робастности тестов для случая независимых данных с помощью функций влияния (см. [6, гл. 2]).
2. Предварительные сведения и постановка задачи. Рассмотрим модель авторегрессии
Ut = Ut-I + ... + PpUt-p + £t, t e Z . (1)
Здесь {£t, t e Z} — н.о.р. случайные величины E£i = 0, e4 < ж. Обозначим в = (в1,...,вр)T. Будем предполагать, что неслучайные коэффициенты в\, ...,вр таковы, что корни характеристического уравнения
xp = вгхр-1 + ... + вр
по модулю меньше единицы.
Тогда (см. [7, гл. 2]) существует п.н. единственное, строго стационарное решение уравнения (1). По выборке U\-p,U2-p, ...,un из этого решения можно построить GM-оценки параметра в. А именно пусть для заранее выбранных функций ф и ф
n
Lnj (в) := n-1/2J2 <fi(Ut-j )Ф(п - OiUt-i - ... - врЩ-р) t=i
1(1/), ..., Lnp(V)^T
векторного уравнения
и вектор Ln(e) := (Lni(e),..., Lnp(e))T. Тогда последовательность GM-оценок определяется как решение
Ьп(в) = 0 (2)
(детали см. в [2, гл. 7]).
1 Есаулов Даниил Михайлович — асп. каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail: [email protected].
Важным свойством GM-оценок является их асимптотическая гауссовость (см. [2, гл. 7]). А именно пусть (Зп — у^-состоятельное решение (2). Пусть ..., — выборка из строго стационарного решения уравнения (1) при в = во. Обозначим
( Е<?(п_) ... Е^Мп—) \ (В (<р(Щ> Щ) ... Е(<рЩ )п°1-р)\
К := Еф2(ег)
Еф^МЩ,) ...Е<р(п0_1 Мп\_р)
С := Еф1 (ег)
\Е^(п\-р)^(п0) ... Е^(п0-р) ) \Е(<р(Щ-р)п_) ...Е(<р(Щ-р)п\-р
Е(ф0-1)и0) ...Е(ф\ )и_-р) \Е(^(п01-р)п0_) ...Е(^(п°1-р)п°1-р);
М^ := С-*К(С"1 )т. (3)
Тогда
п1/2(@п — вп) ^ N(0, М^), п ^ж.
На основе этих GM-оценок можно построить тест для проверки линейных гипотез относительно вектора в. Если представить вТ = (в(1 , в(2 ), где векторы в(г), Ъ = 1, 2, имеют размерности т и р — т соответственно (1 ^ т < р), то линейная гипотеза имеет вид Н_ : в(2 = . Здесь — известный вектор, а в(1 — неизвестный (мешающий) параметр. Введем локальные альтернативы Н1П(т) : в = вп = в0 + п-1/2т, где вТ = (в(1^Т, ), тт = (т(1)Т, т(2)Т) е Мр — постоянный вектор с подвекторами размерности т и р — т соответственно. Таким образом, мы допускаем, что неизвестный параметр в« при альтернативах Н1п(т) меняется на величину порядка 0(п—1/2).
В работе рассматривается ситуация, когда наблюдения в (1) содержат выбросы, так что в результате имеем вектор наблюдений Yn = (у1-р,..., уп) с
Уь = щ + ¿¡" (ь, t = 1 — р,...,п. (4)
Здесь [г]" } — н.о.р. случайные величины, ¿1" ~ В\(1,^п), уровень засорения 7п = шт(1,п—1/2 7), 7 ^ 0, параметр 7 неизвестен; {(ь} — н.о.р. случайные величины с неизвестным распределением ц из класса М.2 распределений с конечным вторым моментом; последовательности {еь}, {г1" }, {(ь} предполагаются независимыми между собой. Это локальный вариант схемы засорения из [1].
Для схемы (4) GM-оценка вектора в и соответствующий GM-тест строятся по Yn. При этом GM-оценка является решением векторного уравнения
¿П (в) = 0, (5)
где ¿П строится по У1-р, ...,уп так же, как Ьп строится по П1-р,..., пп.
Цель работы — изучить свойства GM-оценок и тестов в схеме (4). Мы найдем асимптотическое при п ^ ж распределение оценок при гипотезе и локальных альтернативах, а также асимптотические мощности соответствующих тестов. Семейство этих предельных мощностей окажется равностепенно непрерывным по 7.
3. Формулировка результатов. Пусть ц — произвольная случайная величина, а ст-алгебра определяется следующим образом:
•Ь—1 := ст{(1—р,(2—р,...,(Ь; г1—р,г2—р,...,г1; ; е1—р, е2—р, . .., еЬ—1}.
Введем функцию фь(п) := Е(ф(еь + ). Обозначим
р
ь3 := Еф0— + (2—3 )ф2 (—Р_з (2—3 ) + Еф°2Ч )Еф(е1 + Ы+ X] Еф^ )Еф(е2 — в_г (2—г),
г=1, г=3
и := (и1 ,...,ир)Т.
Обозначим также := 1 ■ и.
Теорема 1. Пусть верна альтернатива Н1п(т). Пусть выполнены следующие условия:
функции ф и ф ограничены, ф непрерывно дифференцируема с ограниченной производной ф', а ф дважды непрерывно дифференцируема с ограниченными производными; (Ь) Еф(ег) = 0, Еф'(е 1) ф О, ЕЦ < оо7 С ф 0.
Тогда с вероятностью, стремящейся к 1, система уравнений (5) имеет у/п-состоятелъное решение Зп,у, для которого
п1/2фп,у - вп) ^ N(а^ф, М^), п ^ж. Матрица М^ определена в (3).
Представим (Зпу в виде (Зпу = (ЗПУ , ЗпУ ), где ЗПУ ^ = 1 2, имеют размерности т и р — т соответственно. Пусть Т^ — такая матрица размерности (р — т) х (р — т), что
__I
'■= I вт т
а а(2) — вектор размерности р — т, такой, что = (а(1^Т, а(2^Т).
Следствие 1. Пусть выполнены условия теоремы 1. Тогда
n1/2(&& - в™) - N(a(2), J^), n ^ж.
Теперь перейдем к тестам, построенным на основе GM-оценок. Пусть J^ — произвольная состоятельная оценка ковариационной матрицы . В качестве последовательности тестовых статистик возьмем
TY := n • (^ - в02))Т^)-1(J& - в02)).
Обозначим нецентральное распределение хи-квадрат с p-m степенями свободы и параметром нецентральности Л2 через Х2(Р - m, X2), а соответствующую функцию распределения — через Fp-m(x, X2). Следствие 2. Пусть выполнены условия теоремы 1. Тогда
mY d 2/ \2\
Tn ^ Х (p - m,X ), n ^ж,
где параметр нецентральности X2 = \т(2) + a(2^>\2.
Мощность теста, основанного на TY, при альтернативе Hin(т) есть Wn(т,7,ц) = Ppn(TY > xP—m), где XP—m — (1 - а)-квантиль распределения центрального x2 (p - m). В силу следствия 2
lim Wn(T,7,V) = W(т,7,v) = 1 - Fp-m(xP-m,X2),
n—
и тест имеет асимптотический уровень значимости а. Пусть Wn(т) — мощность статистического теста в схеме (1) без засорений. Тогда в силу следствия 2 существует limn—TO Wn(т) = W(т) := W(т, 0,ц). Пусть | — евклидова норма матрицы или вектора. Теорема 2. Пусть выполнены условия теоремы 1. Тогда
sup \W(т, 7, ц) - W(т)\ < (2/п)1/2 |C-1| \и\7.
В силу теоремы 2 при фиксированном т семейство предельных мощностей {W(т,7,Ц)}^еШ2 равностепенно непрерывно по 7 в точке 7 = 0. Полученное свойство равностепенной непрерывности, во-первых, характеризует асимптотическую робастность GM-тестов, а во-вторых, является важным шагом в доказательстве локальной качественной робастности GM-тестов. Локальная качественная робастность тестов в схеме (4) характеризуется равностепенной непрерывностью по 7 семейства мощностей {Wn(т,7,ц)} в точке 7 = 0. Определение локальной качественной робастности см. в [8].
СПИСОК ЛИТЕРАТУРЫ
1. Martin R.D., Yohai V.J. Influence functionals for time series // Ann. Statist. 1986. 14. 781-818.
2. Koul H.L. Weighted empiricals and linear models // IMS Lect. Notes. Monograph Series. Vol. 21. Hayward, CA, 1992.
3. Hampel F.R. A general qualitive definition of robustness // Ann. Statist. 1971. 42. 1887-1896.
4. Boente G., Fraiman R., Yohai V.J. Qualitive robustness for stochastic processes // Ann. Statist. 1987. 15. 1293-1312.
5. Reider H. Qualitive robustness of rank tests // Ann. Statist. 1982. 10. 205-211.
6. Hampel F.R., Ronchetti E.M., Rousseeuw J., Stahel W.A. Robust statistics. The approach based on influence functions. N.Y.: Wiley, 1985.
7. Brockwell P.J., Davis R.A. Time series analysis: Theory and methods. N.Y.: Springer-Verlag, 1991.
8. Boldin M.V. Local robustness of sign tests in AR(1) against outliers // Math. Methods Statist. 2011. 20. 2-22.
Поступила в редакцию 15.12.2010
УДК 519.21
РАВНОМЕРНАЯ ОЦЕНКА ЭКСТРЕМАЛЬНОГО ИНДЕКСА СТОХАСТИЧЕСКИХ РЕКУРРЕНТНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ
А. А. Голдаева1
В работе найдена равномерная оценка сверху экстремального индекса некоторых стохастических рекуррентных последовательностей. Для этого был использован новый подход, который состоит в рассмотрении последовательностей наблюдений (в детерминированные или случайные моменты времени) процесса с непрерывным временем, заданного стохастическим дифференциальным уравнением.
Ключевые слова: экстремальный индекс, индекс хвоста, стохастические разностные уравнения, стохастические дифференциальные уравнения.
A uniform upper bound of the extremal index of some stochastic recurrent sequences is obtained in the paper. We used a new approach consisting in the consideration of sequences of observations (in deterministic or random moments of time) of a continuous time process given by a stochastic differential equation.
Key words: extremal index, tail index, stochastic difference equations, stochastic differential equations.
1. Bведение. Рассмотрим процесс Yn, n ^ 1, удовлетворяющий стохастическому разностному уравнению
Yn = An Yn-1 + Bn, n ^ 1, Yo ^ 0, (1)
где (An,Bn), n ^ 1, — независимые, одинаково распределенные пары неотрицательных случайных величин.
Известно, что стационарные процессы вида (1) при довольно общих условиях обладают двумя важными свойствами, относящимися к поведению их экстремумов: стационарное распределение имеет степенной хвост, а максимум M;^ = max[Y\,..., Yn} при n ^ж растет асимптотически, как максимум [вч\ независимых случайных величин с тем же распределением, где в есть экстремальный индекс процесса Yn.
Напомним [1], что стационарная случайная последовательность Yn с маргинальной функцией распределения G(x) имеет экстремальный индекс в, если для любого т > 0 существует такая последовательность Пп(т), что:
1) nG(un(T)) ^ т при n ^ж;
2) P(MY < Un(T)) ^ ехр(—вт), n ^ж.
Процессы (1) изучаются начиная с работы [2]. В работе [3], которая посвящена исследованию двух числовых характеристик — индекса хвоста к и экстремального индекса в, найдены общие формулы для них, но они не дают ответа в явном виде и результат может быть получен только численно. Так, в [3] доказана
Теорема A [3]. Пусть процесс Yn, n ^ 1, удовлетворяет уравнению (1), пусть
1) существует такое число к > 0, что E Af = 1, E Af ln+ A\ < ж, 0 < E BK < ж;
2) распределение B\/(1 — A\) невырожденное, а распределение ln A\ при условии, что A\ = 0, не решетчатое.
1 Голдаева Анна Алексеевна — ассист. каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail: [email protected].