УДК 519.234.3
В. Б. Горяинов
ЛОКАЛЬНО НАИБОЛЕЕ МОЩНЫЕ РАНГОВЫЕ КРИТЕРИИ НЕЗАВИСИМОСТИ НАБЛЮДЕНИЙ В МОДЕЛИ ПРОСТРАНСТВЕННОЙ АВТОРЕГРЕССИИ
Для процесса пространственной авторегрессии порядка (1,1) построены локально наиболее мощные ранговые критерии для проверки независимости наблюдений. Показано, что при нулевой гипотезе статистики предложенных критериев являются свободными от распределения и асимптотически нормальными.
E-mail: [email protected]
Ключевые слова: пространственная авторегрессия, ранговые методы, локально наиболее мощные критерии.
Введение. В работе проведены исследования случайного авторегрессионного поля Xj, описываемого уравнением
Xij = #10Xi-i,j + #oiXij-i + 9nXi-i,j-i + £ij, i,j = 0, l, 2..., (1) Xj = 0 для любых i < 0 или j < 0,
где 9 = (в10,901,911) — вектор авторегрессионных коэффициентов, а £ij — независимые одинаково распределенные случайные величины с нулевым математическим ожиданием E£j = 0.
Такие поля широко используются в технике, экономике и естественных науках [1]. До недавнего времени существовавшие методы проверки гипотез в модели (1) основывались на принципе максимального правдоподобия в предположении нормальности наблюдений [2, 3]. Как правило, такие методы чувствительны к засорению выборки резко выделяющимися наблюдениями.
В работах [4, 5] были построены локально наиболее мощные (ЛНМ) критерии проверки гипотез о коэффициентах 9, основанные только на знаках наблюдений.
В настоящей работе получены ранговые критерии проверки гипотезы H0 о независимости наблюдений в модели (1). Предполагается, что распределение £ j принадлежит известному параметрическому семейству. Показано, что при H0 распределение статистик построенных ранговых критериев не зависит от распределения £ j и асимптотически нормально.
Постановка задачи. Рассмотрим поле (1), где £j — независимые одинаково распределенные случайные величины с функцией распределения F(x) и плотностью f (x), 9 = (910, 901, 911) — неизвестный вектор параметров.
Пусть а = (а10,а01 ,вц) — некоторый известный вектор. Рассмотрим задачу проверки гипотезы
Н0 : в = 0
против односторонних альтернатив вида
Н+а : в = Да, А > 0,
Н- : в = Да, А < 0,
и двусторонней альтернативы
На : в = Да, А = 0.
Пусть X = {Xу}, г = 1,... ,т,] = 1,..., п — матрица наблюдений поля (1).
Обозначим Яу ранг Ху в последовательности X X X X
^^ 11, . . . , ^^, . . . , ^^ 1п, . . . , Хтп.
Отметим, что матрица рангов наблюдений Я = {Яу} принадлежит множеству М матриц размера т х п, элементы которых являются перестановками множества {1, 2,..., тп}. На основе информации только о матрице Я требуется построить оптимальные критерии проверки гипотез о параметре в. Оптимальность критериев будем понимать в следующем смысле.
Обозначим Ц критическую область рангового критерия, т. е. такое подмножество в М, что если матрица Я принадлежит Ц, то гипотеза Н0 отклоняется. Через Ртп(Я, А) обозначим функцию мощности рангового критерия, определяемую как вероятность отклонения гипотезы Н0, когда Н0 не верна:
Ртп(Я, А) = Р{Я € верна альтернатива в = Да}.
Пусть Ртп(Ц, А) дифференцируема в точке 0 по А. Определим ЛНМ ранговый критерий для проверки гипотезы Н0 против односторонней альтернативы Н+а как критерий, имеющий функцию мощности Ртп(Я, А), наиболее круто возрастающую по переменной А в правосторонней окрестности точки 0. Это означает, что критическая область Ц ЛНМ рангового критерия должна быть выбрана так, чтобы величина д,Ртп(Я, А) д „г- Г
-—- при А = 0 была максимальна. Совершенно аналогично
аА
определим ЛНМ ранговый критерий для проверки гипотезы Н0 против односторонней альтернативы Н— как критерий, имеющий минималь-
аРтп(Я, А)
ное значение-г--- при А = 0.
аА
Локально наиболее мощные критерии. Начнем с построения ЛНМ рангового критерия для проверки гипотезы Н0 против альтернативы Н+. Так как
Д) ^ ^ Рти(Г) Д)
где Ртп(г, Д) = Р{Я = г| верна альтернатива 9 = Да}, то величина
йРтп(Я, Д) „
- будет наибольшей, если в критическую область Ц
Д=0
dA
последовательно, вплоть до достижения заданного уровня значимости,
¿Ртп(г, Д)
включаются матрицы г, имеющие наибольшие значения---в
аД
точке Д = 0. Поэтому искомая критическая область Ц будет равна
dPmn(Q, г)
Q = r
> C
Д=0
аД
где постоянная С определяется уровнем значимости а критерия, т.е. находится из условия Р{Я € Ц} = а при гипотезе Н0.
Для построения ЛНМ рангового критерия нужно знать поведение функции мощности, а значит, и Ртп(г, Д) в окрестности Д = 0.
Для плотности /(ж), удовлетворяющей введенным ниже условиям (8), (9), определим функцию меток
, > /'(ж) (2)
= - Ты (2)
и сами метки
аггт(г,з) = Е^е«)^] = Е[^-1(и«))^-1(и(Л)], (3)
1,3 = 1,..., тп,
где е(1),..., е(тп) и и(1),..., и(тп) — элементы вариационного ряда из распределения с плотностью /(ж) и равномерного распределения на [0,1] соответственно;
^-1(и) = 1п£{ж : ^(ж) > и}. (4)
На множестве матриц М и множестве индексов
I = {(1, 0), (0,1), (1,1)}
определим статистики
т п
Чч. (г) = а.тп(гк1 ,гк-р>1-д), г € М, (р, д) € I, (5)
к=р+11=ч+1
г(г) = аю^ю(г) + ао12ш(г) + аиги(г). (6)
Теорема 1. Пусть плотность f (х) независимых одинаково распределенных случайных величин е^ удовлетворяет следующим условиям:
Ееп = 0; (7)
Е|еп| < (8)
сю
I |Г(х)| йх< гс; (9)
— с
^(х) - f (у)| <С|х - у| для любых х,у из Е, С> 0. (10) Тогда при А ^ 0
Ргпп(г, А) = —Л + Аг(г)) + о(А). (тп)! \ /
Доказательство теоремы 1 приведено в приложении. Из теоремы 1 вытекают следующие теоремы, определяющие вид ЛНМ критериев.
Теорема 2. Пусть выполнены условия (7)-(10) и Я — матрица рангов наблюдений поля (1). Тогда ЛНМ ранговый критерий отклоняет Н0 в пользу Н+, если
г(Я) >С+, (11)
и принимает в противном случае. Постоянная С + определяется уровнем значимости критерия.
Теорема 3. Пусть выполнены условия (7)-(10) и Я — матрица рангов наблюдений поля (1). Тогда ЛНМ ранговый критерий отклоняет Н0 в пользу Н—, если
г(Я) < С—, (12)
и принимает в противном случае. Постоянная С— определяется уровнем значимости критерия.
Теоремы 2 и 3 позволяют естественным образом определить ранговый критерий для проверки Н0 против двусторонней альтернативы На на уровне значимости а как объединение двух односторонних критериев, проверяющих на уровне значимости а/2 альтернативы Н+ и Н—. В этом случае при выполнении условий (7)-(10) гипотеза Н0 отклоняется в пользу Н , если
|г(Я)| >С, (13)
и принимается в противном случае. Постоянная С определяется уровнем значимости критерия.
Для вычисления меток атп(г,]) нужна совместная плотность fij (х, у) порядковых статистик е(г) и е*-^, 1 < г < ] < тп, из распределения с плотностью f (х) и функцией распределения ^(х). Известно
[6, §2.2], что
Kij = —-^-;-^-¡-^-—, 1 < i < j < mn.
(Х,У) =
' К%3^г-1(ж)/(ж)[^(у)—^(ж)р'-*-1/(у)[1—^(у)]тп-, если х < у, 0, если х > у,
где
(тп)!
(г — 1)!(^' — г — 1)!(тп — )!'
Отсюда, в частности, следует, что условия (8), (9) достаточны для существования меток (3).
Отметим, что при Н0 все (тп)! различных значений Я равновероятны. Поэтому распределение ¿(Я) при Н0 не изменится, если матрица рангов Я будет вычисляться по наблюдениям X поля (1) в предположении, что плотность инновационного поля е^ будет отличаться от плотности /(х), порождающей метки (3) статистик (5). При этом мощность критериев (11)-(13), вообще говоря, уменьшится.
Асимптотическая нормальность статистик ЛНМ критериев. Для практического применения критериев (11)-(13) нужно знать распределение статистики ¿(Я) при гипотезе Н0.
Для небольших т и п квантили статистики ¿(Я) можно оценить методом Монте-Карло. Если же т и п велики, то следующая теорема позволяет для распределения г (Я) применить нормальную аппроксимацию.
Теорема 4. Пусть выполнены условия (7)—(10), а2 = Бе^ < то и / имеет конечное количество информации Фишера
2
I (/)=/ (/(х)) / (х) то. (14)
Тогда статистики гр„ (Я) асимптотически нормальны с нуле-
тп
вым математическим ожиданием и дисперсией а2/(/) :
1 гр<1(Я) а N(0, а2/(/)).
^pq
mn
Доказательство теоремы 4 приведено в приложении. Пример 1 (нормальное распределение). Пусть
X
1 Г 1
/(х) = е 2 , ^(х) = Ф(х) = е 2
Тогда <^(x) = x, и для всех 1 < i < j < mn
amn(i, j) = E[A(j)] = Е[Ф-1(и({^)Ф-1(и(j))] =
i i
= Kij J duj Ф-1(и)Ф-1(ь)иг-1[и - u]j-i-1[1 - v]mn-j dv.
0 u
Так как I(f) = 1, то zpq(R) a N(0,1).
Пример 2 (двойное экспоненциальное распределение). Пусть
1 | -ex, если x < 0, f(x) = 2e-|x|, F(x) = { 2 -
2 I 1--e x, если x > 0.
I 2 ' -
Тогда <^(x) = sign x,
F-1(u)=sign(1 - 2u) ln(1 - |2u - 1|), ^(F-1(u))= sign(2u - 1). Поэтому для всех i, j = 1,..., mn,
amn(i,j) = E[sign(e(i))e(j) ] =
= E[sign(2U(i) - 1) sign(1 - 2U(j))ln(1 - |2U(j) - 1|)], и, например, при 1 < i < j < mn 1 1
amn(i,j ) = Kij J duj sign(2u - 1)sign(1 - 2v)ln(1 - |2v - 1|)x
0u
x ui-1[v - u]j-i-1[1 - v]mn-j dv.
Так как I(f) = 1, то = zpq(R) a N(0,1). Пример 3 (логистическое распределение). Пусть
1
f (x) = , F (x) =
(1 + e-x)2' ' 1 + e-x'
Тогда
Ф) = S, F-1(u) = ln i^) , <P(F-1 (u)) = 2u - 1,
amn(i,j) E
1_e_£(j)
1 + e-(i)
=E
(2U(i) - 1) ln '
1 - U j)
i, j = 1,..., mn,
и, например, для всех 1 < i < j < mn
,(i, j) = Kij I du I (2u—1)ln ( ) ui-1[v—u]j-i-1 [1—v]mn-j dv.
Так как I(/) = 1, то (R) a N (o,1 )
~г \ 3/
3 v'mn V 3/
Выводы. Построены локально наиболее мощные ранговые критерии для проверки гипотезы H0 о независимости наблюдений в модели пространственной авторегрессии. Статистики построенных критериев при H0 не зависят от распределения инновационного поля и асимптотически нормальны. Указан явный вид статистик критериев для нормального, двойного экспоненциального и логистического инновационных полей.
Приложение. Доказательство теоремы 1. Для удобства изложения далее всюду для произвольной матрицы C размера m х n тем же символом C будем обозначать вектор C = (c1,...,cN) размерности N = mn, элементы которого совпадают с элементами матрицы C, упорядоченными по столбцам:
C (с1Ъ . . . , cm^ . . . , . . . , cmn)i
так что равенство cst = ck будет означать, что k = m(t — 1) + s, т.е.
Cst = Cm(i-1)+s, s = 1, . . . , m, t = 1,...,n.
Обозначив /д (v), v = (vn, ...,vm1,..., . . . , Vmn) = (V1, ...,Vn ), плотность X при альтернативе 0 = Да, получим
P{R = r} = J /д(v) dv.
R=r
Выразим плотность /д^) через плотность
m n
/0(U) = ПП /(Ust)
s=1t=1
X при гипотезе H0, т.е. через плотность случайного вектора
е = (е1Ъ . . . , emb . . . ,. . . , ^mn) = (£ъ . . . , ^N).
Так как определитель отображения
Ust = vsi — Д(ак^-М + a01vs,i-1 + anvs-1,i-1),
s = 1,..., m, t = 1,..., n; vst = 0 при s < 0 или t < 0 равен единице, то
1
1
а
/д(-у) = Д Д / (vst - A(aioVs-i,t + aoiVs,t-i + anVs-i,t-i)) =
тп
(V) =
в=14=1
тп
= ПП / (м*, Д)),
в=14=1
где для краткости обозначено
Д)) = Нк(*, Д)) = - Д(аю*3-М + О01*3,4-1 + ап*3-М-1),
к = т(£ — 1) + 8.
Поэтому с учетом того, что при Н0 все N! событий {Я = г}, г € М,
равновероятны,
/ш n „ ш n
ПП / (hst(v, A)) dv = ПП / (Mv, 0)) dv+
R=r s=1t=1 R=r s=1 t=1
// ш n ш n \
П П / (hst(v, A)) - ПП / (Mv, 0)) dv
D \s=1 t=1 s=1 t=1 /
R=r
= 1 + A ^ f / (hk (v, A)) - / (hfc (v, 0))
= m+A^J a X
7,_1
k=1R=r
N \ fk-1
П / (hj (v, A)) П/(hi(v, 0))] dv.
Vjj=k+1 / \i=1
Отметим, что почти всюду по v для k = m(t — 1) + s
lim /(hk(v, A)) - /(hk(v, 0)) x д^о A
N \ fk-1
П /(hj(v, A)) П /(hi(v, 0)) j=k+1 / \i=1
= v(vst)(alоVs-l¡t + а01*3,4-1 + аи*з-М-1) П П /
в=1 4=1
Используя (10) и интегрируя сначала по ,..., *к+1 в указанной последовательности, а затем по остальным * за исключением *в-1>4-1, получаем для к = т(£ — 1) + 8
f (hk(v, Д)) - f (hk(v, 0))
Д
N \ /k-1
x ( П f (hj(v, Д)) üf (hi(v, 0))) dv <
Vj=k+1 / \i=1
< с ^ |a»j-1 J |v |f (vs—i,t—j) dvs—i,t—j < ClE|en| < TO.
(м)€1
Следовательно, по теореме Лебега о мажорируемой сходимости при Д ^ 0
Р{Я = г} =
т п „
+ ^^ У] / ((^)(о10^-М + 001^-1 + 0,11^-1,4-1) х
К=т
тп
х ПП/(*«) ^ + о(Д).
г=1¿=1
Делая замену переменных
Узг = , 8 = 1,...,т, £ = 1,...,п,
с якобианом, равным единице, и учитывая, что плотность вариационного ряда
1 *
е(1),..., е(м) равна — ^ /) при < • • • < и нулю в против-
к=1
ном случае, получаем
Р{Д = г} = N1 +
1 т п „
+ дйД^^ (f(wтst )(aloWs-l,t + 0,01^-1 + 011^3-1,4-1) х
в=1 4=1 ■шгК-К-шх
тп
хДП f (Wij) dw + О(Д)
i=ij=i
1
= (1 + Д(ою^1о(г) + О01^01(г) + оиги(г)^ + о(Д).
Теорема 1 доказана.
Доказательство теоремы 4. Так как Х^ = е^, г = 1,...,т, ] = 1,..., п, при Н0, то — ранг ек в последовательности е1,..., е* или, что то же самое, ранг ик = ^-1(ек) в последовательности и1,...,и*. Обозначим — а-алгебру, порожденную случайными величинами {Л1,...,Л*}, = У^>=1 . В работе [7, п.У.4.1] по-
/ я \ 2 1
казано, что Е ( ик — ^ ) < —, откуда следует, что и1,..., им, а значит, и
))^-1(и), к,/ = 1,..., N
являются -измеримыми. Используя теорему Б из [7, п. 11.1.2], получаем
атп(гк ,г,) = Е[^-1 (и)))^-1(и(Г1))] =
= Е[^-1(ик -1(и )|Як = гк,Я/ = г/]. Поэтому для всех к, / = 1,..., N случайная величина
атп(Як ,Я/) = Е[^-1 (ик -1(иг)|^ ] является -измеримой, и по лемме [7, п.У.1.4, с. 201] с учетом (14)
lim E(E[p(F-1(Uk))F-1(U)|Fn] - ^(F-1 (Uk))F-1(U))2 = 0. (15)
N ^^ \ /
Лемма
D[zPq(R)] < mnCE[amn(R2,R^], (p,q) G I,
где постоянная C не зависит от m и n.
Доказательство. Так как слагаемые в zpq (R) одинаково распределены, то
D[zpq(R)] = (m - p)(n - q)D[amn(R2, R^] +
+ (m - 2p)(n - 2q)cov[amn(R2, R1), amn(R3, R2)] + + 2 [(m - p)2(n - q)2 - (m - p)(n - q) - (m - 2p)(n - 2q)] X
X COv[amn(R2,R1),amn(R4,R3)] <
< N^2D[amn(R2,R1)] + Ncov[amn(R2,R1),amn(R4,R3)^ .
Так как при H0 все значения вектора (R1, R2, R3, R4) равновероятны, то
E[amn(R2, R1) , amn (R4, R3)] =
= N(N - 1)(N - 2)(N - 3) ^ ^^ j)amn(k,1) =
1
x
N(N- 1)(N - 2)(N - 3) (
^ ^ amn(i,j)
1<i=j<N
n
^ ^ aшn(k, 1) ^ ^ amn(k, i)
— ^ / / * / —
1<k=1<N k=1
\ k=
k=j
\
^ ^ amn (k j) ^ ^ amn l) ^ ^ amn ( j l)
amn ( k, j ) / v amn ( l)
1=1 1=1 1=1
1=г 1=г 1=i
k=j k=j k=j
/
N(N - 1) _
(N - 2)(N - 3) 1
E [amn(R2, RO]-
2E[amn(R2, R1), amn(Rs, ^2)]+
(N - 3) + E[
(Rs,R1)] + E[ (Rs,R1) (Rs,R2)] .
Поэтому
cov[amn(R2, R1) (R4,R3)]
<
< (N -' 2)(iV - 3) E2[ßmn^ R1)] + (N - 3) ^n^ R0L откуда следует утверждение леммы.
Определим
m n
^ = Е Е (и.))^-1(иг-р^) =
»=р+1?=д+1
тп
= Е Е ((е?)е™-«, €Х. (16)
г=р+1?=д+1
Так как Л1,..., Л* и и1,..., и* при Н0 независимы, то
Е [(^(Л) - )21 и(1) = и(1),..., и) = )
тп
= ^ ] ^ ] 0тп(Л., ),
г=р+1?=д+1
где
Отп(Л».? ) = 0тп(Лг^ , ) - ((^-1(м(^')))^-1(М№—))
Из леммы следует, что
E
(Zpq (R) - tpq )2|U(1) = U(1) ,...,U(N > = U(N >
< mnE
<
2|
(amn(R2,R1) - ^(F—1(U2))F—1(U1^ |U(1) =
= u(1),...,U(N> = u(N)
Поэтому
E(zPq(R) - tpq)2 < mn^amn(R2,Ri) - -1(^2))F-1(U0)2. Отсюда и из (15) следует
1 / \ 2
lim E- Zpq(R) - tpq =0. (17)
n^^ mn V /
Так как в сумме (16) каждое слагаемое зависит только от двух других слагаемых этой же суммы, то по центральной предельной теореме для конечно зависимых случайных величин [8, теорема 7.7.5] статистика tpq является асимптотически нормальной. При этом в силу независимости е11,... , emn и условия (7)
m n
ЕЫ = = 0
i=p+1j=q+1
mn
D[tpq ] = )ei-p>j-q ] +
i=p+1j=q+1
m n m n
+2 ^ ^ cov[^(eiJ, )ea-Pie-,]= mnJ(f )a2.
i=p+1 j=q+1 a=i+1 e=j+1
Отсюда и из (17) следует утверждение теоремы 4.
СПИСОК ЛИТЕРАТУРЫ
1. Ripley B. D. Spatial Statistics (Wiley Series in Probability and Statistics). - Wiley,
1981.
2. TjostheimD. Statistical Spatial Series Modelling // Advances in Applied Probability.
- 1978. Vol. 10. No 1. - P. 130-154.
3. Y a o Q., B r o c k w e 11 P. J. Gaussian Maximum Likelihood Estimation for ARMA
Models II Spatial Processes // Bernoulli. - 2006. - V. 12. No. 3. - P. 403-429.
4. ГоряиновВ. Б., ГоряиноваЕ. Р. Знаковые критерии независимости наблю-
дений в модели пространственной авторегрессии порядка (1,1) // Вестник МГТУ им. Н.Э. Баумана. Сер. Естественные науки. - 2009. - № 2. - C. 115-123.
5. ГоряиновВ. Б., ГоряиноваЕ. Р. Непараметрическая идентификация про-
странственной модели авторегрессии в условиях априорной стохастической неопределенности // Автоматика и телемеханика. - 2010. - № 2. - C. 31-41.
6. Д э й в и д Г. Порядковые статистики. - М.: Наука, 1979.
7. Г а е к Я., Ш и д а к З. Теория ранговых критериев. - М.: Наука, 1971.
8. Андерсон Т. Статистический анализ временных рядов. - М.: Мир, 1976.
Статья поступила в редакцию 31.03.2010
Владимир Борисович Горяинов родился в 1961г., окончил в 1983 г. МГУ им. М.В. Ломоносова. Канд. физ.-мат. наук, доцент кафедры "Математическое моделирование" МГТУ им. Н.Э. Баумана. Автор 23 научных работ в области стохастических дифференциальных уравнений, статистических методов в биологии и медицине.
V.B. Goryainov (b. 1961) graduated from the Lomonosov Moscow State University in 1983. Ph. D. (Phys.-Math.), assoc. professor of "Mathematical Simulation" department of the Bauman Moscow State Technical University. Author of 23 publications in the field of stochastic differential equations, stochastic methods in biology and medicine.
ЖУРНАЛ "ВЕСТНИК МОСКОВСКОГО ГОСУДАРСТВЕННОГО ТЕХНИЧЕСКОГО УНИВЕРСИТЕТА имени Н.Э. БАУМАНА" ИЗДАТЕЛЬСТВО МГТУ имени Н.Э. БАУМАНА
В журнале публикуются наиболее значимые результаты фундаментальных и прикладных исследований и совместных разработок, выполненных в МГТУ имени Н.Э. Баумана и других научных и промышленных организациях.
Журнал издается в трех сериях: "Приборостроение", "Машиностроение", "Естественные науки" с периодичностью 12 номеров в год.
Подписку на журнал "Вестник МГТУ имени Н.Э. Баумана" можно оформить через агентство "Роспечать".
Подписывайтесь и публикуйтесь!
Подписка по каталогу "Газеты, журналы" агентства "Роспечать"
Индекс Наименование серии Объем выпуска Подписная цена (руб.)
Полугодие 3 мес. 6 мес.
72781 "Машиностроение" 2 250 500
72783 "Приборостроение" 2 250 500
79982 "Естественные науки" 2 250 500
Адрес редакции журнала "Вестник МГТУ имени Н.Э. Баумана":
105005, Москва,
2-я Бауманская ул., д.5.
Тел.: (499) 263-62-60; (499) 263-67-98.
Факс: (495) 261-45-97.
E-mail: [email protected]