Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2009, № 1, с. 128-134
УДК 519.2
КРИТЕРИЙ МОНОТОННОСТИ ФУКЦИИ ЭФФЕКТИВНОСТИ В МОДЕЛИ ДОЗА - ЭФФЕКТ
© 2009 г. М.С. Тихое, Д.С. Криштопенко
Нижегородский госуниверситет им. Н.И. Лобачевского [email protected]
Псстуаила в редакцию 28.11.2008
Предложен тест строгой монотонности функции эффективности, который основан на композиции оценки обратной функции эффективности с оценкой Надарая - Ватсона. Эта композиция равна тождественной функции тогда и только тогда, когда «истинная» функция эффективности строго монотонна, и исследован тест, основанный на L2 -уклонении. Установлена асимптотическая нормальность соответствующей статистики теста при нулевой гипотезе строгой монотонности.
Ключевые слсва: зависимость доза - эффект, непараметрическая монотонная оценка, критерий согласия.
В зависимости доза - эффект [1] во многих случаях требуются монотонные оценки функции эффективности. Например, если вводимая доза и уровень отклика являются независимыми случайными величинами, то функция эффективности - монотонная функция зависимой переменной. В статье предлагается статистический тест для проверки монотонности, основанный на композиции монотонной оценки обратной функции эффективности и оценки Надарая - Ватсона. Доказана состоятельность и асимптотическая нормальность этой композиционной оценки при гипотезе Н0 : т (х)- строго возрастает (строго убывает). Результаты исследования докладывались на 15-й Всероссийской школе-коллоквиуме по стохастическим методам [2].
Статистический тест для проверки монотонности функции эффективности
Пусть X = {(Хг ,и), г > 1}- стационарная последовательность независимых пар случайных величин с совместной функцией распределения F (х, у) и плотностью распределения
/(х, у) > 0 . Мы наблюдаем выборку
и (п} = {(и),1 < 1 < п}, где = I(Хг < иг) - индикатор события
(Хг < иг). Требуется оценить функцию эффективности т(х) = Е(Ж\и = х) по выборке и (п).
и, а /(у) =| / (х, у) dy - маргинальная
плот-
ность распределения случайной величины X. Если функция т(х) строго возрастает (например, в случае независимости величин X и и), она равна функции распределения: т (х) = F(х) = Р(X < х)), то определим
1
1 г (
^(г) = у I I К
0 -ад
т(у) - и
\
И
dudv
(1)
-\
в качестве оценки функции т (г), где
т( х) =
^ЩКГ((иг - х)/Иг)
г =1 п
XКг((и -х)/Иг)
(2)
является классической оценкой Надарая - Ватсона (см. [3, 4]).
Условия (А).
(А1) /(х,у) - дважды непрерывно дифференцируема и распределена на компакте [0,1] х [0,1].
(А2) Функция т(х) дважды непрерывно дифференцируема, и третья производная этой функции ограничена.
(А3) Ка и Кг есть неотрицательные симметричные ядра на [-1,1].
(А4) | К^( z) dz <ад, | К2Г( z) dz <ад, и Ий, плотность распределения случайной величины Иг стремятся к нулю при п ^ ад . Ядра Ка (х) и
Пусть g(у) = |/ (х, у) dx - маргинальная
ад
п
г =1
Kr (х) дважды непрерывно дифференцируемы на [-1,1] и Kd (±1) = K'd (±1) = 0, Kr (±1) = = K; (±1) = 0.
(А5) При n > да, nhd, nhr > да,
hr = O(n-1/5), h2h-/2loghr > 0, n-lhd4h1!2 x X (loghr)2 = O(1).
При hd > 0 оценку фй. (t) можно представить в виде
1 1 t f»d (t) = hr J J K
d 0-да
V hd J
t-m(x)
dudx =
= |I{т(х) < г + Иа } | Kd (z) dzdx ^ (3)
0 -ад
1 1 ^ ф(г) = 11{т(х) < ^.х « 11(т(х) < г)dx .
00
1
Отметим, что 11(т (х) < г) dx = т- (г), если
0
выполняется гипотеза Н0 строгой монотонности. В этом случае ф^ о т сходится к функции у (х) = х.
Рассмотрим
Доказательство. Рассмотрим разность
Тп - Т =
1
= I{(Фи. (т (х)) - х)2 - (ф(т (х)) - х)2 }dx =
0
1
= 1 {фИ, ('”(х)) - ф2(т (х)) -
0
- 2 х(ф^ (т (х)) - ф (т (х)))} йх =
1
= I {фи. (т (х)) - ф(т(х)) - 2х} х
0
х {фи. (т (х) - ф (т (х))}<& .
Отсюда
1
\ Тп - Т \ < СI {фи. (т (х) - ф (т (х))} ,х .
0
Покажем теперь, что разность фи. (т(х)) -- ф (т (х)) равномерно по вероятности сходится к нулю. Действительно,
Ъ 1 1 “rV (m(v)-u^ Фй, (m(Х)) = h~ J J Kd
hd 0 -да
h
dudv =
V d J
Tn = J (Фй, (m( X)) - x )2 dx
= —JI{m(v) < m(x) + hd } x
hd 0
(4)
как статистику теста для проверки гипотезы Н0 строгого возрастания функции эффективности.
В следующей лемме показано асимптотическое поведение статистики Тп, когда в качестве
оценки функции эффективности берется оценка (2). Результат этой леммы сохранится и тогда, когда в качестве оценки для функции эффективности берется состоятельная и асимптотически нормальная статистика, которая равномерно сходится по вероятности к своему оцениваемому значению. Например, в качестве оценки для т (х) можно взять £##-оценку (см. [5]).
Лемма 1. Пусть выаслнены аредаслсжения (А) и т(х) равнсмернс схсдится к т(х). Если
п ^ ад, Ил ^ 0, тсгда
mJX) Kd f ^
m(v )-hd V d J
dudv =
= JI{m(v) < m(x) + hd } JKd (u)dudx =
d ~ J d'
m(v )-m( x) hd
= JI{m(v) < m(x) - hd} dv +
0
1
+Ji{m(x) - hd < m(v) < m(x)+hd} x
x J Kd (u) dudx.
m( v )-m( x) hd
Заметим, что
JI {~(v) < m( x) - hd } dv
где
U1
V
> Ф (m (x)) > ф (m (x)) равномерно по вероятности. Для второго сла-
T = J JI{m(v) < m(x)}dv - x
0 V 0
dx. (5)
гаемого имеем:
h
0
0
0
0
11 {т( х) - и. < т(у) < т (х)+и. } х
0
1
х I К. (и )йийх <
т( V )-т( х) иё
1
<! 1{т(х) - и. < т (V) < т(х)+и.}, (6)
0
которое также равномерно стремится к нулю, что и завершает доказательство леммы 1.
Из леммы 1 следует, что если функция эффективности т (х) строго возрастает, то величина Т стремится к нулю. Следующая теорема дает необходимое и достаточное условие для строгой монотонности функции эффективности.
Теорема 1. Пусть т (х) - неарерывная
функция. Величина Т равна нулю тсгда и тслькс тсгда, ксгда функция эффективнссти стрсгс всзрастает на интервале [0,1].
Доказательство этой теоремы в основных чертах повторяет доказательство предложения 2 работы [6], поэтому опущено.
Замечание. Для статистического теста проверки гипотезы строгого убывания рассмотрим монотонную статистику
~ 1 1 ад (т( х) - и ^
фи,(') = у/IК
d 0 t
h
V ‘"d
1
dudx
которая сходится к
вающеи, определим
Tn = J(фhd(m(x)) -x)2dx .
Можно показать, что
dx ,
Tn . Как и раньше, мы ограничимся случаем строгого убывания функции эффективности.
Асимптотическая нормальность статистики теста для проверки монотонности функции эффективности
В этоИ части мы исследуем слабую сходимость статистики, определенную формулои (4). Если hr выбирать асимптотически оптимальным, т.е. hr = уrn_15 (см. [6]) для некоторой константы уr > 0 , тогда предыдущие два условия (А5) преобразуются к требованию
-jnhdlogn > 0 и (logn)2n~l1whd4 = O(1) .
Теорема 2. Пусть выполнены условия (А) и hr = O(n_15), тогда при n > да
nhfh- - h>2( Kd) Bn) —U N (0,а2),
где
/1
a2 = 4k24(Kd) x
2
J m (x )(1 - m (x)) f 2( x)( m'( x)) 12 dx
V о
(7)
Г1Г1 ^ Л
J J K"(x)K"(x + z) dx dz
V 0 V 0 J j
(p(t) = JI {m( x) > t}dx . Для
построения статистического теста проверки гипотезы Н0: т (х) строго убывает, против альтернативы Н1 : т (х) не является строго убы-
hr J * J *?( у )-у
nhr о f (x){m (x)} -1
+
+J -x ,
J0 (m'(x))6
(8)
Тп =!(фи, (т(х)) - х)2йх
0
сходится к
1 (1 у
ТА =| 11{т^) > т(х)}dv - х
0 V 0 )
причем интеграл ТА равен нулю тогда и только тогда, когда т (х) строго возрастает.
Для построения статистического теста проверки нулевой гипотезы Н0 осталось доказать асимптотическую нормальность величин Тп и
а кснстанта к?,(К) саределяется следующим сбразсм:
1 1 2
^( К) = -1V2 К (V) йV.
2 -1
Доказательство. Обозначим через С (А) множество всех непрерывных функций на А с R . Рассмотрим статистический тест Тп как функционал на С(R) х С(R), т.е. Тп = у (фи., т), где
1
У (/,£) = I (/(£(х)) - х)2 йх.
0
Для достаточно гладких функций / и £ мы
имеем разложение в ряд Тейлора (см. [7, с. 214215])
x
x
x
и
О
О
Тп =!{(т(х) - т (х))(т ')'(т(х)) +
1
+ (фи (т(х) -т 1(т(х)))}2йх + —Р(3)(А), (9) й 6
где А* е [0,1] и остаток Р(3) определяется следующим образом:
1
Р(3>(Х) = 6!{й(х)[(т-')' + М'^] х
0
х ([т (х) + М (х))+й1 -1([т (х) + М (х)))} х х {й 2( х )[(т-1) " + М”1Л]({т + Ай ](х)) +
+ 2й (х )й'1_1([т + Ай ](х )}йх +
1
+ 21 {й (х)(т-1)' (£(х)) + Ай1 -1([т + Ай](х))} х
0
х {й 3( х )[(т-1) ''' + Ай1"'_1]([т + Ай ](х)) +
+ 3й2(х)й'_1([т + Ай](х))}йх , (10)
для некоторого ^(х), что
\ £, (х) - т (х) \ < \ т( х) - т (х) \,
где й (х) = т(х) - т (х), а й1 у) = фи, (у) -- т-1( у).
Заметим, из [6] следует, что й (х) =
= Ор(п 12шах(и2,(пиг) 1/2)) и если т(х) тре-
+ Ор (п 12шах(иг2,(пиг) 1/2))} +
+ {Ор (п-1/2шах(и2,(пиг )-12)) + (1)} х
х {ор(п 3/2шах(иг6,(пиг) 3/2)) +
+ ор (п 1шах(и;4,(пиг) 1))} = = Ор (п-1 шах(иг4, (пиг )-1))} =
= ор(и]и2г(пил)-12шах(и2,(пиг)-1/2)).
Тогда
фи, (т(х)) - т -(т(х)).
фи, (т (х)) - т -(т (х)) = = А, (т (х)) + Л(п)(т (х)) +
1
+ - Л„> (т (х))(1 + Ор (1)):
где
Ак, (х) = фи, (т (х)) - т -(т (х)):
(11)
(12)
буемое число раз дифференцируема, то й'(х) =
12 2 1/2
= Ор (п~' шах(иг,(пиг У )), в силу равномерной сходимости по вероятности. Поскольку т (х) сходится к т (х) по вероятности, то
й«( х) = Ор (1), где k = 0, 1, 2, 3 .
Отсюда следует, что Р(3)(А) = {Ор(п-у2 шах(иг2,(пиг)-1/2)) х
х [Ор(1)] + Ор(1)} х {Ор(п-1 шах(иг4,(пиг)-1)) х х [Ор (1)] + Ор (1) +
ЛР (т( х)) = -1К, (V )(т 1 )'(т( х) + vИd) х
-1
х (т - т)(т- (т(х) + vИd ))dv ~
~ -(т- )'(т(х))(т - т))(х) - и& (К.) х х [(т~')'(т(х))]3(т - т)''(х) - Rn(х), (13)
1 1
Лп2)(т(х))=-~г IК (^>(т_1)'(т(х)+и^х
и -1
х (т - т)2(т~'(т(х) + vИd ))dv , (14)
1 1 2
k2(К) = -1V2К(Vй.
2 -1
При этом остаток в (13) равен
Rn(х) = и>2(К,)[(т-1)-(т(х)) х
х (т - т)( х) + 3(т-1) ' (т( х))(т ~') ' х х (т( х))(т - т) ' (х)] +
+ [(т_1) '(т - т) о тч] '''(^(х)) (15)
6
для некоторого Е,п (х) такого, что \ Е,п (х) -
- т (х) \ < \ т (х) - т (х) \.
Из соотношений (9)—(15) получаем
1
Тп = и>2( К.) I [т' (х )]-6{т " (х) - т' (х )}2 йх +
+
I А1ё (т(х))йх + & ,
(16)
где
Qn =| Rn2( х)йх + 4 I (Л(2) (т( х )))2 йх +
0
Применим это же разложение в ряд Тейлора для разности
2{-и^(К. )| [т'(х)] 3(т ' (х) - т' (х)) х
0
1
х А^ (х)йх - й^2(К. )| [т'(х)]-3 х
0
х (т ''(х) - т"(х))Rn (х)йх - (К.) х
0
0
0
0
х I [т'(х)]-3(т ''(х) - т '(х)) Л(2)( х )йх +
0
1 1 1
+1А^ (х ^п (х Г + -1А^ (х)Л(п2) (т( х )),х 2 0
+
1 1 1
+ -1 Rn (х)Л(2)(т( х )),х} + - Р (3)(А*). 26
Как следует из [8] (теорема 3.1),
1 х ( т(/) - и ^
1 1 х фи, (')=г I IК
Г 0 -ад
+ о(Иг2 (пи, )-1/2 шах(и2, (пиг )-1/2)),
,и,г +
у
так как
1 1 х
иг 11К'
ИГ 0 -ад 1
и
Гийг =
Г 0 -ад 1
и
йийг =
V у
= IК, (г ){т- (х + гИ, ),х =
0
= И2^2(К,){т-1(х)}'' + О(И,),
#ГЛ' 2^ следовательно,
фи, (г) = т ) + И^(К, ){т 1(х)} ' +
+ О
Тогда
+ Ор (ИГ2 (пИ,) 12 шах(И2, (пИг) 12)).
I А,2, (т(х)),х ~
0
1
И>2( К, )| {(т -1) '' (т( х))}2 ,х
+
+ Ор (” (пИ, )-12 шах(’2, (пИг)-12)),
(т ') ''(т(х))т'(х) = -
т '(х) {т'(х)}2
и, значит,
1
IА^ (т( х )),х = И>2 (К, ^ {тШ- ,х +
0 {т (х)}
IR2(х),х < СИ,4[Iw1(х),2(х)йх
+
+
I ^2( х)(,'(х ))2 ,х
+
+ И,I([(т-1)'о, от-'](3)(^(х)))2,х] =
0
)-12)^
= О,
( И4 шах(Иг2,(пИг) 1;/)
п^
( И>в И-1 > пИ7
+
+ О,
V Г /
„21„2^.. \-112^^гь2 („и ^-V2^
= Ор(И,И;(пИ,Г2 шах(И;,(пИг)^)). Повторяя рассуждения работы [9], можно убедиться, что (т1'3'1 - т 1'3'1)2(х) имеет порядок
= I Кл (г)т '(х + гИ, ),г,
т(0)-г
ий
поскольку при малых И, неравенство т(0) < / - И, выполняется почти для всех / > 0 в силу монотонности функции эффективности. Поэтому
(^ иг 1 ^
V пИ1 ,
для всех х . Аналогичный резуль-
тат получим для второго и третьего слагаемого в разложении Qn . Именно,
1 1 1 1
I{Л(2)(т(х))}2Гх = Iйх{— IК,(V) х
0 0 -1
х (т ~') ' (т( х) + )Г 2(т~'(т( х) + vhd ))dv}2 =
1
= Ор(п- шах(И4,(пИг)-1))IГх х
0
1 1
х {-1-1 К, (V )(т 4) ' (т( х) + hdv)dv}2 =
-1
= Ор (п-1 шах(Иг4,(пИг )-1)) =
= Ор(И^И^СпИ,)-12 шах(И2,(пИг)-1/2)). Более того,
,1-1 (т (х ))~Г {А,, (т (х)) +
так как (т ') ' (т(х)) =--------------------, поэтому
т'(х)
+ Ор(И2И>И,)-12 шах(И2,(пИг)-1/2)). (17) Теперь оценим слагаемое Qn . Имеем:
+ Лр(т (х)) +1 Л(п2)(т (х))} .
Так как Л(2)(т(х)) ~ Ор(1),(х) -Ор(1) х
х И2,, '(х), то в силу равномерной сходимости т (х) к т (х) по вероятности, получаем, что
Г Лп)(т( х)) = Ор (И<2).
ох
Г 2
Аналогично, —Аи (т(х)) = Ор(И,) и
йх Г
Г Л(п2)(т( х)) = Ор (И,)-
Таким образом,
,-1 (т( х)) = Ор (И,)
(18)
0
0
0
0
О
р
0
0
и, интегрируя по частям, получим
і
| Н2й| [т'(х)]-3(т " (х) - т "(х))(х)ёх |<
о
<1 И\[т'(х)]-3(т '(х) -т'(х))Л(х) |0 | +
1
+1 И] | т(х) - т'(х)) X
о
X [(т' (х))-3 ЛЪс1 (х)] ' ёх | =
= Ор (Н> ~12 шах(Нг2, (пНг )-1/2) =
= 0р(И2и2(пИй)-12 шах(И2,(пИг)-1/2)).
Остальные части Qn оцениваются аналогично. Следовательно,
Qn = Ор(ИУ](пИё)-12шах(И2,(пИг)-12)). (19)
1
Пусть Zn = |(т'(х))-б(?и "(х) - т"(х))2ёх.
о
Докажем теперь асимптотическую нормальность Zn .
Повторяя рассуждения работы [10], можно доказать следующий результат.
Теорема А1. Пусть k є {0,1, 2} и обозначим через w(x) неотрицательную весовую функцию. Допустим, что Л с R является компактным множеством, и положим
Лг = { х є R: і^ | х - а | < в } .
аєЛ
Предположим, что w(х) ограничена и непрерывно дифференцируема (к + 2) раз на Лв, а g(х) (к +1) раз непрерывно дифференцируема на Ле. Если Н ^ 0, пН ^ да ,
Вп^ =
1 , С (х) w(х) ' 21 ч
—|---------гг--------ёх | К г (у) ёу +
пИг
g (х)
+н 4 к 2( кг ) х
1 (т" (х) g (х) - т( х) g " (х)) w( х)
g 2( х)
если k = 0,
пИ
1 }(к«(у))2- ёу.
2k+1 г 0
g(x) -1
если k = 1,2,
11
2 ( К) = - | V 2 К (V ) ^ , у к ( х ) = к 2 ( Кг ) X
2 -1
х (т( к+2)( х) g (х) + 2т(1)( х) g(х) +
+ I— к-^+- т1 ‘+2-- >( х) g1 -"(х)),
- = 0
к- -
а2,к =
4|с2(х)у^(х)w2(x)g 4(х)ёх,
если к = 0, в противном случае.
Нам понадобится также следующий резуль-
тат.
что
Теорема А2 ([11, р. 121]). Пусть J = J (5) = [ т(0) + 5, т(1) -5 ],
где 5 = 5(Нё) > 0 выбрано так, ґ + Н^ є{т(0), т(1)] для всех ґ є J(5) всякий раз, как только V є [-1,1]. Пусть условия теоремы 2 выполнены. Тогда с вероятностью 1,
sup|(ф, )(*\і) - (т ‘)(*>(ґ)| =
пИ
3/2+к
^ да, Нг = О(п 1/5), то для к = 0,1,2
Т(к) = (п-1к -4к-1аи + п-1к 2гк-4а2,к)
|(т(к)(х) - т(к)(х))2 w(х)ёх - Вг
-1/2
V Лв
где
х1,к = 21 |с4(x)w2(х)g 2(х)ёх
V Лв
х([ (| К (гк)(х) К (гк)(х + у) ёх )2 ёу )
С2(х) = її(х)(1 - її(х)),
= О
Ґ -^1/2
(log Н г ^
пИ 2*+1
+ О(Нё) для * = 0,1,2,
sup|(ф, )(3)(ґ) - (т 1)(3)(ґ)| =
= О
+ о(На).
Из теорем А1 и А2 выводим:
ё
п1ПН9/2(Zn -Вщ) ^ N(0,с2);
где
с2 = 4к4( Ка) х
0
Л
0
г
X
>
X
к
п
xj m (х)(1 - m(x)) f2( x)( m'(x)) 12 dx x
f i f i
j j K""(x)K"" (x + z)dx
V 0 V 0
B =
nl~ nh5r j f (x){m '(x)}6
\ > dz
J )
rr\2
h- j mfvFm§- dx J(k;)2( у W.
Следовательно,
nh9J2hd4(Tn -h>2(K)Bn) ^ N(0,a2),
hdk2 (Kd )Bn ) ^
n
где
1 (m "(x ))2
п п Г (т (х ))
Вп = Вп1 + I--------- Гх . Это завершает до-
00 (т'(х))6
казательство теоремы 2.
Саисск литературы
1. Криштопенко С.В., Тихов М.С, Попова Е.Б. Доза - эффект. М.: Изд-во «Медицина», 2008. 288 с.
2. Тихов М.С., Криштопенко Д.С. Тестирование монотонных функций эффективности по неполным выборкам в случае непрямых наблюдений // Журн. «Обозрение прикладной и промышленной математики». 2008. Т. 15. В. 4. С. 648-649.
3. Надарая Е.А. Об оценке регрессии // Теор. ве-роятн. и ее примен. 1964. Т. 9. В. 1. С. 157-159.
4. Watson G.S. Smooth regression analysis // Sank-hya, 1964. V. 26. P. 359-372.
5. Тихов М.С., Ярощук М.В. Асимптотическая нормальность kNN-оценок в зависимости доза - эффект // Вестник Нижегородского университета. Серия Математика. Н. Новгород: Изд-во ННГУ, 2006. Вып. 1(4). С. 129-137.
6. Tikhov M.S. Statistical estimation on the basis of interval-censored data // J. Math. Sciences. 2004. V. 119, No 3. P. 321-335.
7. Serfling R.J. Approximation theorems of mathematical statistics. Wiley, New York, 1980. 371 p.
8. Dette H., Neumeyer N., Pilz K.F. A simple non-parametric estimator of a monotone regression function // Bernoulli. 2006. V. 12. P. 469-490.
9. Mack Y.P. and Silverman B.W. Weak and strong uniform consistency of kernel regression estimates // Z. Wahrsch. Verw. Gebiete. 1982. V. 61. P. 405-415.
10. Hall P. Integrated square error properties of kernel estimators of regression functions // Annals of Statis-tics.V. 12, No. 1. P. 241-280.
11. Birke M. and Dette H. Testing Strict Monotonicity in Nonparametric Regression // Mathematical Methods of Statistics. 2007. V. 16, No. 2. P. 110-123.
0
x
MONOTONICITY CRITERION OF THE EFFECTIVENESS FUNCTION IN A DOSE-EFFECT MODEL
M.S. Tikhov, D.S. Krishtopenko
A test of the effectiveness function strict monotonicity has been proposed which is based on the composition of an estimate of the inverse effectiveness function with the Nadaraya-Watson estimate. This composition is equal to
identity if and only if the «true» effectiveness function is strictly monotone, and a test based on an L — distance has been investigated. The asymptotic normality of the corresponding test statistic is established under the null hypothesis of strict monotonicity.