Оценивание распределений в зависимости доза эффект при фиксированном плане эксперимента в случае непрямых наблюдений

Тихов М.С.; Криштопенко Д.С.

Математика

Вестник Нижегородского университета им. Н.И. Лобачевского, 2007, № 2, с. 158-164

УДК 519.2

ОЦЕНИВАНИЕ РАСПРЕДЕЛЕНИЙ В ЗАВИСИМОСТИ ДОЗА - ЭФФЕКТ ПРИ ФИКСИРОВАННОМ ПЛАНЕ ЭКСПЕРИМЕНТА В СЛУЧАЕ НЕПРЯМЫХ НАБЛЮДЕНИЙ

М.С. Тихое, Д.С. Криштопенко

Нижегородский госуниверситет им. Н.И. Лобачевского

[email protected]

Пбступила в редакцию 16.02.2007

Целью настоящей работы является установление свойств оценок Надарая - Ватсона функции распределения в зависимости доза - эффект, когда вводимые дозы не являются случайными величинами, а фиксированы заранее и измеряются с ошибкой, накладываемой аддитивно. Доказана асимптотическая нормальность интегрированных квадратичных ошибок рассматриваемых оценок, построенных по непрямым наблюдениям. Изучение таких статистик представляет интерес в токсикометрии при определении среднеэффективных доз. Эти результаты могут быть использованы для построения критериев проверки гипотез согласия и однородности в зависимости доза - эффект.

1. Непараметрические оценки функции распределения

Пусть X!,X2,...Xп - независимые и одинаково распределенные случайные величины с неизвестной непрерывной функцией распределения F(х) Дх)=Е(х). Мы вводим неслучайные

дозы и., которые имеют ошибку 8., налагаемую аддитивно, и наблюдаем эффект от введенных доз, т.е. мы получаем выборку {(Щ У), 1 = 1,..., п }, где Уг = и + 8. ; е1,Б2,...,Бп

- независимые и одинаково распределенные случайные величины с плотностью распределения q(х) > 0 , х е К, независимые от

{ X.,1 < 1 < п } ; Щ = I (X. < и. ) - индикатор события (X. < и.). Рассматривается задача оценивания функции распределения Е(х) по выборке {(Щ,У.), 1 = 1,...,п}, а также задача проверки гипотез согласия и однородности. В токсикометрии (см. [1]) данная модель интерпретируется как зависимость доза-эффект, где X - минимальная доза, с которой начинается реакция организма, и. - вводимые в организм

неслучайные дозы, а У. - измеренные с неизвестной ошибкой дозы.

Для оценки Е (х), следуя Надарая и Ватсону (см., например, [2, 3]), используют статистики

где

Fn (x) =

S2n (x) Srn ( x)

Sm (x) = - £ Kh (Y - x),

n i=1

1 n

S2„(x) = -ZWtKh(Yi -x),

n i=1

(1)

ядро K(•) > 0 задано на R , h > 0 - параметр сглаживания (детерминированная числовая последовательность, такая, что h —— — w——0, но

nh — — w — w X Kh (х) = (Vh)K (x/h) •

Рассмотрим следующие условия (А).

(А0) max | щ -ut-V |= O(n l) при n — w.

(А1) K (x) > О - ограниченная четная функ-

ция.

(А2) К(х) = 0 для X £ [-1,1].

(А3) | К (x)dx = 1.

(А4) Функция /(х)- непрерывно дифференцируема, |(/'( х))2 ^ < ж , а вторая производная /"(х)- ограниченная функция.

(А5) Четвертая производная q 1¥(х) есть ограниченная функция.

При сделанных предположениях

|| К ||2 = |К2(z)dz < ж, у2 =|z2К(z)dz < ж .

Асимптотическое поведение эмпирического процесса 4^(к(х) - F (х)) , когда вводимые дозы были случайными величинами, исследовалось в работе [4], где установлена асимптотиче-

ская нормальность статистик Еп (х) . В работе

[5] доказана асимптотическая нормальность

статистик Еп (х) для фиксированных планов

эксперимента, когда вводимые дозы измеряются без ошибок, и установлена в этих условиях асимптотическая нормальность интегрированных квадратичных ошибок. Здесь мы рассматриваем случай, когда вводимые дозы измеряются с ошибкой. Результаты данной работы докладывались на 9-й Вильнюской Международной конференции по теории вероятностей и математической статистике (см. [6]).

Исследуем поведение указанных статистик

для данной ситуации. Начнем с суммы $1п (х) .

Имеем

■<«=пИ I«()=

1

х - и. - у И

Ыу.

х - г - у И

Е (5,п (х)) = 11Л | q( у) К\ + 0^ 1 ^ = j Ыг | q( х - (+ zh) К (г) Ыг +

+ 0| 1 У = j Ыг j { q(х - г) + q'(х - г) гИ

+

2/ 2 г И

2

+ q"(х - г)^22г \К(г)Ыг + 0(И4) + 0^1

Заметим, что j q(х - г)Ыг = 1, откуда получаем j q"(х - г)Ыг = 0.

Из условий (А1)-(А3) заключаем, что

Е (£1п (х)) = jq(х - г)Ыг + в(И4) +

1

+ 01 -) = 1 + 0(И*),

если, например, И = 0(п ) .

Рассмотрим D (81п (х)) . Имеем

(К( х - иг -8г ^ V V

j Ыг j q(x - г )К2 (г )Ыг

И

\К\\

пИ

Поскольку пИ ^ Ж при п ^ Ж , то

D №п(х)) ^ ^ поэтому (х) =1 + 0р (и4)

при п ^ ж .

Обратимся теперь к сумме $2п (х) . Ее математическое ожидание при п ^ ж имеет следующее представление

Е№ п (х)) = -И IЕ (и,) ЕК ( х - п'~е< ^ =

х - г - у И

к+о( п 1=

В силу условия (А0), полученное выражение является интегральной суммой, причем погрешность аппроксимации не превосходит С/п (см. [5]).

Таким образом,

+ -

1 j Е (г Ы j q( у) К (

^ Е (г Ы j q( х - (+ гИ)К (г) Ыг + 0^ 1

j Е(г)д( х - г)Ыг +

j Е(г)q"(х - г)Ыг + 0(И4) + о( 1 |.

+ °~п ) =

V2 И2

2

Обозначим Ф(х) = j Е(г)д(х - г)Ы. Тогда Ф"(х) ^ Е(г)д"(х - г)сИ = = j Е"(г)д(х - г)Ыг.

С учетом последнего замечания

Е ($2п (х)) = Ф(х) + Ф"(х) + 0^п1 У.

Дисперсия суммы $2п (х) равна

( 1 п ( х — и — Р D (Б2я (х)) = D — I ЩгК (-----^

V пИ .=1 V и = 1 ID (ЩкГ х - и-Р "

п2И21-г

1 п (

И

22 п И .=1

1

ЩК 2 Iх - и-Р

Л

И

22 п И .=1 ~\К\

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

пИ

V V " уу

( ( х - и - р \\

Щ1К

V V

х - и1 - р1

И

j Е(г)q(х - г)Ыг

2

Иг 2 2 | \ К 112 Ф^ х) ции распределения Кп (х), которая задается

Г К 2 (і)q 2(х - і)d^ . , „

пИ^ пИ формулой

Такирі образом, 1п =/(К(х) - Ф(х))2® (х)* =

D«' (х)) IIК||2 Ф(х) =/(Кп(х)-Е(КП(х)))!®(х)^ +

2п х пИ ' +Г (Е (Кп (х)) -Ф(х))2®(х)ох +

Поскольку ^ п(х) =1 + Ор (и4) , то в качест- + 2Г (кп (х) - Е (¥п (х)))(Е (¥п (х)) -

ве оценки усредненной функции распределения

Ф(х) мы будем рассматривать Fn(х) = 82п(х). (х))ю(х) х.

Здесь функция (о(х) играет роль весового Теорема 1. Пусть выполнены условия (А) и множителя. Не умаляя общности, будем считать

И = сп-15. Тогда 0)(х) = 1. Изучим каждое слагаемое этого вы-

I-- а ражения в отдельности. Заметим при этом, что

ЛІпИ (К (х)-Ф (х)) >^є величина Г (Е (Кп (х))-Ф(х))20(х)йх являет-

є N(а(х),ст (х)), ся неслучайной.

Пусть

где а( х) = (1/2)с5/2у2Ф"(х) и а2(х) = .

= || К ||2 Ф( х). =Г (К"(х) - К(х))А.

- 1 п

Доказательство. Асимптотическая нор-

( ) «і «і, «і п12 и з 2 ,

мальность Кп (х) следует из предыдущих рас- где

суждений и ограниченности слагаемых .Г С х - и - є

ЖК

С х - иі - єі

^=А I И

(см. [7], с. 291-292) с ис- Iі И

г г

—

пользованием центральной предельной теоремы - Е Линдеберга - Феллера.

ЖК\

I I И

{ Е (Кп (х)) -Ф(х)}^-

2. Интегрированные квадратичные ошибки Лемма 1. Пусшъ въттнены уствш (А). То-

непараметрических гда при п ^ ж последовательность 3п1

оценок функции распределения асимптотически нормальна с параметрами

Пусть X!,X2,...,Xn- независимые и одина- (0,°"1 )’ где ково распределенные случайные величины с

Ст12 = (И/4) { [ Ф( х)(ф"( х) )2 Ых -

неизвестной непрерывной функцией распределения Е (х). Мы наблюдаем выборку - j Е2(г) Ыг ЦФ>)q(u

{( Щ, У. X . = 1,-, n}, Уг = и +Р , где иг - вводимые неслучайные дозы, измеряемые с ошиб- Доказательство. Нетрудно видеть, что

п

кой Р., налагаемой аддитивно, с плотностью е (X 1.) = 0 Пусть ^ =1Е^;,). Рассмот-

распределения q(y), Щ = I(X. < и.) - инди- 1=1

рим условие Линдеберга [8]: катор события (X. < и.). Рассмотрим последо- 1 п

вательность оценок функции распределения ~ IЕ{х

пП I (I Хпи |> Рп )} <

вида ^п .=1

1 п 1 п

Еп (х) = -1 Щ.Ки (х - У,). < -г-т I (| ^ 1> Рп)! <

г =1 п

Мы будем исследовать поведение интегри- <--------2 Е(24 )

_ 1 4 2 ^ пИ '

рованных квадратичных ошибок оценок функ- зпє г=1

Справедливость данной теоремы будет доказана, если показать, что D (Уп1)--------— с2, а

’ ’ V п1/ п——ж 1 ’

Е ( хщ. )=0(и12) .

Определим ХпЪ = УпЦ - Е (УпП ) , где

У„п =j Щ.к

х - и. - Р.

И

птотически при п — ж нормальна с параметрами (0, с2).

Рассмотрим теперь первое слагаемое в 1п. Имеем:

j (Еп (х) - Е( Е; (х)))2 Ых =

2 (

п2 И2

I j {ЩК

х{ Е (Рп (х)) -ф( х)}Ых.

КЧ у <п

х

И

—

Для целого k > 1 обозначим гп = Е (Уп11). Тогда

И

г;с) = Е-

щ jК (

И

х [ Е (Еп(х)) -ф( х)] Ых } =

Е(иг )j q(y)dy {j КVх и у

22

V И

Ф( х) + СИ2)

И

Ых

21с и3k

V И 2с

Е (и) j q( у)(фЧ у+и ))СФ.

В силу того, что

ЕX2,) = г™ -(г^)2

Е (X4. ) = г(4) - 4г(3)г(1) +

V иЬ/ п п п

+ 6гП2|(гП‘>)2 - 3(гП1>)4,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

получаем Е(ХПТ )= 0(И12) . Кроме того,

V

4

1

D (У;1) = -тг IЕ )~

пИ „1

{jj Е (г М у)(Ф'( у+г ))2 ЛЫу-j Е2(1 ^ q( у)Ф"( у+г Ж2} = {| | Е(г^(и - г)(Ф"(и))2 ЫгЫи -j Е’(г )Ыг{| qС у - г )Ф"( у)Ыу}2} = = ^{|ф(и )(Ф> ))2 Ыи -

Е2(г q( у - г )ф"( уЖ2}.

V

г

ЩуК

И

+ -

п 2И2

Ых +

—

И

(11)

- Е (и.) ЕК)} Ых.

1п 2 = П И Уп 2 ,

х - и -Р

пИ '“1 ■»

—

И

Лемма 2. Пусть выполнены условия (А). Тогда

У*-—— С22, где ^ = II К II2 |Ф(х)Ых.

п—ж у

Доказательство. Имеем:

Е( 2)=пИ |j Е{Щ.К (

- Е (и ) ЕК

х-и-Р Ь 2

И

ЕК (х - и-Р

—

И

}Ых -

1

п=1

Отсюда по центральной предельной теореме (см. [8], с 237), последовательность Уп1 асим-

-Ц{Еи)!! к II2 q(x- и,)-

.=1

- ИЕ2 (и. ^2 (х - и1 )}Ых ~

-ЦК Ц21 Ф( х)Ых - И Л Е2 (г ^2 (х - г )ЫхЫг.

Пусть

г (

X = | ЩК

( х - ui - Р.

И

\Ых.

Тогда

х

х - и -Р

х

с

х

2

и

х - и -Р

( 1 п I

D(У;2) = D — I(2 - ЕХ)

1

п2И2

ID (2,- ЕХ) =

. =1 1п

Пусть Fk = с(X1,X2,...,Xk) - с-алгебра, порожденная величинами X1, X2Xk . Для того, чтобы доказать асимптотическую нормальность величин Уп3, необходимо показать (см. [9, 10]) , что

п 2И2

IЕ^- Е2, )4 -

. =1

^1 ( Е(2 - Е2 )2)

п2И2

<

. =1

(а)

(б)

1

п2 И3

IЕ(а2 I ^)-г— с2;

п—ж

2=1

1 п-1 2

5-з IЕ^2/ (4^ >

п И г = 1

■IЕ^.- Е2)г.

п2И'

Но (а + Ь)4 < 8(а4 + Ь4), поэтому 8 п

D(У;2) <^77I (Е2.4 + (ЕХ )4) <

п И ~~1

8 п Г . . 1 г г^4 ( х - иг - у I . . , I

~ —1 Е(иг )~ |К | ---------------Т----- ку)Ф

> 8пИг12) I ^-1) -—— 0, £ е (0,1).

У

п Иг=1 у ~ 8 пИ

в силу условия (А1).

Из неравенства Чебышева следует утверждение леммы.

(111) 1 п3 = П -И^Уп3 ,

2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

уп 3 = —ш I I П(х)п}(х )Ых, пИ 1<г< ,<п

Заметим, что

II2 Е(а2) =Щ:1 Е(4).

Имеем:

Е(4п2г) = е(||П(х)П(у) I п,(х)П(у)ЫхЫу)

У=г +1

~ И2гЕ(иг)д(х - и) IЕ(и,)д(х - и,)Ых;

У=г +1

х | Ыу (| К (и)К (и + у)Ыи )2. Следовательно, при п — ж,

1 п 1 п-1

ПИ31Е(а)=7^2 Е Е«х

п( х) = ЩК|

- Е (и )ЕК I х ии Р

Лемма 3. Пусть выполнены условия (А). Тогда при п — ж последовательность Уп3 асимптотически нормальна с параметрами (0, с32), где

с32 = 21| Б* Сx)q 2 (у- х)^У х

х|Ыу (|К(и)К(и + у)Ыи) . Доказательство. Определим величины

п п-1

4 = Пг (х) I П, (х) , апг = Пг (x)I П, (х) .

У^1 ] =

С учетом последнего

2 п -1 2 п

Уп3 = ПИ32 Ц 4пг= ПИ32 апг'

х|Ыу (|К(и)К(и + V)Ыи) IF(uj)>

У=+1

х I ^х - иг Жх - иу ) Ых п—ж — IЕ(г) :

х | Е(г)| м(х - г)м(х - г) ЫхЫгЫг х

г

х|dv (|К(и)К(и + v)du) ~

~ IIЕ2(х)М2(у - х)ЫхЫу х

х | Ыу (| К (и )К (и + v)du ) = с32. Далее,

Е(а4г) = Е{||IIПг (х)Пг (у)Ц (и)Пг (у) :

г-1 г-1 г-1

х IП (x)I П(у£ П (и) х

т=1

У=1

с=1

х IП (у)ЫхЫуЫиЫу} ~

1=1

г -1

^И51Е(иг) м(х - иг )I Е(и)м(х - и. )Ых,

у=1

2

1

п—ж

х - и. - р,

И

+ж

где

А = ||| ЫуЫиЫу{ | К(г )К( г + у) х х К(г + и)К(г + у)Ыг}2 < ж.

Тогда,

п2И

IЕ(а21 (I ат\> 5пИъ'2)) <

г=2

<

0*2, 4 7 6 О 7 И г=2

I Е(а4()

А

?2 4;

I/¥ (иг ) М( х - иг ) х

51пЛИ.=2

г-1

х I¥(и,) м(х - и,) Ых -

У=1

52п2И

и

| Ыи| Ыу|¥(и)д(х - и) х

х ¥(у)м(х - V)Ых =

| Ф2 (х) Ых -

->0,

251п1И

что доказывает (б).

Пусть

"в", =! 7=1 Е(а,=), К = Е(а,; I ^.-1),

=£ 7=1 Ь..

Из леммы 1 следует, что

(21- п2И¥21 Ф2 (х)(1 - Ф( х))2Ых. Если С1 подходящая константа, то

Е(К4) = 2 V ЬЬ + УЬ2 <

V п ' пг п / 2 пг

2<г<у<п г=1

< п • ^ А ||Ф2 (х) м(х - г) ЫхЫг,

- 2 < х < 0.

=|К22(х)Ых = |Ыу (|К(и)К(и + у)Ыи) =

= 167/387 « 0.434.

Замечание 2. Для фиксированного плана эксперимента (см. [5]) дисперсия с3 равна

с32 = (1/2)/¥2(х)(1 - ¥(х))2о :2(х) Ых. Если в качестве плотности м(х) взять плотность нормального распределения N(0, у2') при у — 0, то получим Ф(х) — ¥ (х), тогда

как в нашем случае с32 = V21¥2(х)о2(х)Ых.

Увеличение дисперсии связано с большей неопределенностью данных, а именно, в нашем случае присутствуют ошибки измерений.

(IV) Имеем

Iп -1 (Е(¥; (х)) - Ф(х))2 Ых = 21Л +1п2 +1",.

Пусть

„(п) = |Е(¥п(х) - ф(х))2 Ых =

= | (Е (¥п (х)) - Ф(х))2Ых + п1И1с22.

Заметим, что случайные величины !п1 и I п 2 являются асимптотически некоррелированными случайными величинами и при п — ж распределена! по нормальному закону. Из лемм 1-3 получаем представленный ниже результат.

Теорема 2. При указанных условиях на (А) и в предположении И — 0 и "И — ж при п — ж имеем:

Если пИ5 — ж,

(1)

то

п1,2Г!(I;-„(")) ——— 6 е N(0,с2).

в7Е(У;-в;) — 0 и — 1, (2)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

по вероятности при п — ж, что доказывает пункт (а). Из (2) и теоремы 1 [9] следует лемма 3.

Замечание 1. Для ядра Епанечникова К(х) = (3/4)(1 - х2)!(I х < 1) свертка равна

(К * К)( х) =

{(3/360X32 - 40х2 + 20х3 - х5),

0 < х < 2;

(3/360)(32 - 40х2 - 20х3 + х5), ’

(и) Если пИ5 — 0, то

"И-^(Ь - „("))-—-— 62 е N(0,2^2).

п — ж

(ш) Если пИ5 — Л, Л е (0,1), то пИ-1,, !(/; - „(п)) ——

Для нее

63 е N(0, Л4/5с12 + тЛ^V5с32).

Таким образом, в данной работе установлена асимптотическая нормальность интегрированных квадратичных ошибок для оценок Надарая -Ватсона в случае фиксированных планов эксперимента и непрямых наблюдений. Для прямых наблюдений и фиксированных планов аналогичные результаты получены в [5]. Полученные результаты обобщают их, что позволяет строить критерии согласия функции распределения и однородности двух выборок в зависимости доза-эффект и по непрямым наблюдениям.

1

0

п — ж

Список литературы

1. Криштопенко С.В., Тихов М.С. Токсикометрия эффективных доз. - Н. Новгород: Изд-во ННГУ, 1997. - 156 с.

2. Надарая Е.А. Об оценке регрессии // Теор. ве-роятн. и ее примен. 1964. Т. 9. В. 1. С. 157-159.

3. Watson G.S. Smooth regression analysis // Sank-hya. 1964. V. 26. P. 359-372.

4. Tikhov M.S. Statistical Estimation on the Basis of Interval-Censored Data // J. Math. Sciences. 2004. V. 119, No 3. P. 321-335.

5. Тихов М.С., Криштопенко Д.С., Ярощук М.В. Оценивание распределений в зависимости доза-

эффект при фиксированном плане эксперимента // Стат. методы оценивания и проверки гипотез: Меж-вуз. сб. - Пермь, 2006. С. 66-77.

6. Tikhov M.S., Krishtopenko D.S. Asymptotic distribution for integrated square error at the fixed plan of experiment // 9th Intern. Vilnius Conf. on Prob. Theor. and Math. Stat.: Abstract of Communications. Vilnius: Inst. Math., 2006. P. 312-314.

7. Лоэв М. Теория вероятности. - М.: ИЛ, 1962. 720 с.

8. Гнеденко Б.В. Курс теории вероятностей. -М.: Едиториал УРСС, 2005. - 448 с.

9. Липцер Р.Ш., Ширяев А.Н. Теория мартингалов. - М.: Наука, 1986. - 512 с.

ESTIMATION OF DISTRIBUTIONS IN DOSE - RESPONSE DEPENDENCE AT THE FIXED PLAN OF EXPERIMENT FOR INDIRECT OBSERVATIONS

T.S. Tikhov, D.S. Krishtopenko

This paper is aimed at determining the properties of the Nadaraya - Watson estimators for the distribution functions in the dose - response dependence in the case where the input doses are not random quantities, but fixed a priori and measured with some additive error. We prove the asymptotic normality of the L2 -deviation of the considered estimators constructed for indirect observations. Studying such statistics is of interest for determination of mean effective dose in toxicometry. The results can be applied to construct the criteria for testing goodness-of-fit and homogeneity hypotheses in the dose - response dependence.

Аннотация научной статьи по математике, автор научной работы — Тихов М. С., Криштопенко Д. С.

Похожие темы научных работ по математике , автор научной работы — Тихов М. С., Криштопенко Д. С.

ESTIMATION OF DISTRIBUTIONS IN DOSE RESPONSE DEPENDENCE AT THE FIXED PLAN OF EXPERIMENT FOR INDIRECT OBSERVATIONS

Текст научной работы на тему «Оценивание распределений в зависимости доза эффект при фиксированном плане эксперимента в случае непрямых наблюдений»