ISSN 2074-1863 Уфимский математический журнал. Том 5. № 2 (2013). С. 94-108.
УДК 519.2
НЕПАРАМЕТРИЧЕСКОЕ ОЦЕНИВАНИЕ ЭФФЕКТИВНЫХ ДОЗ ПО ДАННЫМ БИНАРНЫХ ОТКЛИКОВ
Аннотация. Для модели бинарного отклика мы предлагаем новый прямой способ непараметрического оценивания эффективной дозы ЕОюоа (0< А < 1). Этот метод приводит к простой и надежной монотонной оценке эффективной дозы зависимости А ^ ЕОюоа и удобен для пользователей традиционных методов сглаживания ядерных оценок. Кроме того, он эффективен в вычислительном отношении, потому что не требует численной инверсии оценки кривой квантильной функции. Мы доказываем асимптотическую нормальность этой новой оценки и сравниваем ее с DNP-оценкой.
Ключевые слова: модель бинарного отклика, эффективная доза, непараметрическая оценка.
Рассмотрим следующую модель бинарных откликов, которая носит условное название зависимость доза-эффект [1] и которую можно описать следующим образом.
Пусть {(Хг,иг), 1 ^ ^ п} - потенциальная повторная выборка из неизвестного рас-
пределения Р(х) Q(y), Р(х) = Р(Хг < х), Q(y) = Р(и < у), х,у € К, вместо которой наблюдается выборка Ы(п) = {(Ui,Wi), 1 ^ ^ п}, где = x(Xí < иг) есть индикатор
события (Хг < иг). Здесь иг рассматриваются как вводимые дозы, а - как эффект от воздействия дозы иг. Пусть Р(х) = /-оо /(¿) д£, причем /(х) > 0. Эту ситуацию будем называть случайным планом эксперимента.
Наряду со случайным планом рассматриваются фиксированные планы эксперимента. Именно, будем полагать вводимую дозу и неслучайной и положим иг = иг, % = 0,1,..., п+1, где 0 = и0 < и1 < ... < ип < Пп+1 = 1.
Одной из основных задач зависимости доза-эффект является оценка эффективных доз ЕВ\00А = Р-1(А) = ха, 0 < А < 1, по выборке Ы(п). Для фиксированных планов эксперимента мы рассмотрим несколько непараметрических оценок и найдем их асимптотические (при п ^ то) распределения.
Непараметрический подход к оцениванию предполагает наличие ядерных функций Кг (х), К^(х), фактически четных и финитных плотностей распределения с носителем на [-1,1], и величин Нг, Н^ - сглаживающих параметров, которые неслучайны, зависят от объема выборки п и которые сходятся к нулю, когда п ^ то, но пНг ^ то, пН^ ^ то при п ^ то. Положим также Н^(и) = / К^(х) дх.
Для оценки функции Р(х) будем использовать статистику
M.S. Tikhov, Nonparametric estimates of the effective doses at quantal response. © Тихов М.С. 2013.
Поступила 16 февраля 2012 г.
М.С. ТИХОВ
Mathematics Subject Classification: 62G05, 62G08, 62G20, 62P10.
1. Введение
В данной работе для фиксированных планов эксперимента в зависимости доза-эффект мы доказываем асимптотическую нормальность оценки
х1,А
КА РпКЩи) - и| Л
и
¿=1
А - РпНг (г/га) Ая
эффективной дозы хА , которую мы называем БМР- оценкой.
Мы также изучим асимптотическое поведение оценки для Ха вида
Е-т/Док
х2,А
¿=1 и
ЕЛ к я
¿=1
И - Кк (г/и) Ая
™ 2!^ ( А - ^(г/и)
¿=1 и \
^ Н А - ^ (г/иЛ ’
£М—ая—;
которая была предложена в работе [2]. Мы показываем, что оценка Х2,а имеет предельное распределение, что и оценка Х1,а.
Рассматривается также асимптотическое поведение оценки
такое же
Хз,а _ у^А - Ь(Аг ,Ая) ,
где
Б,
2,А
1
Е
2! Г к
и
(г/и) - и Ая
йи _ 1 е -%
ии
¿=1
А - Рга^г (г/и) Ая
а Ь(Аг, Ая) - некоторые константы, зависящие от Аг, Ая (см. теорему 4.1), и показываем, что оценка Хз,а является состоятельной оценкой Ха, а ее предельная дисперсия меньше, чем предельная дисперсия оценок Х1,а, Х2,а.
Отметим, что в работе [3] для регрессионной модели
У; _ т(Х;) + ст(Х;)е;, г _ 1, 2,..., и,
(3)
где (Х;,У;}™=1 есть двумерная выборка независимых одинаково распределенных (н.о.р.) случайных величин (с.в.), причем с.в. X; имеет плотность распределения f (х) > 0, а её значения расположены на отрезке [0,1], с.в. е; также предполагаются н.о.р. с нулевым ожиданием и имеют четвертый момент (причем |е;}П=1 независимы от {Х;}™=1), а регрессионная функция т(х) предполагается строго монотонной, была предложена оценка т- (А) для функции т-1(А) вида (1). Там же было показано, что оценка т- (А) является асимптотически нормальной. В [3] для доказательства асимптотической нормальности оценки т7_1(А) существенно использовалась независимость величин {е;}™=1. В зависимости доза-эффект величины являются бинарными величинами, поэтому мы не можем использовать представление (3). Здесь для доказательства асимптотической нормальности требуется несколько иной подход.
1
2. Основные условия
Пусть {Xi, г = 1,...,п} - последовательность независимых одинаково рас-
пределенных с X на отрезке [0,1] случайных величин с функцией распределения Р(ж); Р = («0,^1, ..., ип,ип+1} - упорядоченное разбиение отрезка [0,1],
и0 = 0 < и1 < ... < ип < 1 = ип+1.
Сформулируем условия на параметры кг и ка.
Условия (И).
( Иі) кг = кг (п), ка = ка(п), причем кг
0, ка
но пкг
то, пка ^ то при п ^ то.
( Н2) ка/кг —► 0.
П—
( Н3) пк^ = 0(1) при п ^ то.
( Н4) пкгк^/3 —> то.
п—^
В качестве примера рассмотрим кг = п-1/5, ка = п-1/4. Очевидно, что для этих последовательностей условия (Н) будут выполнены.
Положим || К ||2 = /_1 К2(ж) ^ж.
Условия на ядерные функции Кг(ж) и Ка(ж).
Условия (К).
( К1) Кг(а)(ж) > 0, причем Кг(а)(ж) = 0,ж </ [-1,1].
1 1
( К2) / Кг(ж) ^ж = 1, / Ка(ж) ^ж = 1.
-1 -1
( Кз) Кг(а)(ж) Кг(а)( ж),ж £ К-.
( К4) Существуют непрерывные ограниченные производные функций Кг(ж),
Ка (ж) до третьего порядка включительно на отрезке [-1,1].
( К5)
К || = вир | К2 (ж) | = к2 < то для І = г, ^.
Замечание 2.1. При условиях (К) существуют четверные моменты у распределений с плотностями Кг(ж), Ка(ж), причем
V.
ж2Кг(ж) ^ж, V
ж2Ка(ж) ^ж,
ж4Кг(ж) ^ж, ^ = ж4Ка(ж) ^ж.
Определим вариацию функции K (см. [4], с. 234).
Пусть K : [а, 6] ^ К. Вариацией функции К = К (и) на отрезке [а, 6] называется сле-
ь ш
дующая величинам У (К) = \] а(К) = эир | К (м^+1) — К («к) |, т.е. точная верхняя грань
Р к=0
по всем упорядоченным разбиениям Р отрезка [а, 6]. Всюду в работе мы рассматриваем вариации функций на отрезке [0,1].
Замечание 2.2. Из условия ограниченности производных функций Кг(ж), Ка(ж) на отрезке [—1,1] (условие К4 ) следует, что их вариации ограничены (см. [4], с. 235), т.е. У(Ка(г)) < то.
0
Условие (Е).
( Е1) Существует третья непрерывная ограниченная производная плотности распределения / (ж) = Р'(ж), причем / (ж) > Со > 0 для 0 ^ ж ^ 1, т.е. плотность / (ж) на отрезке [0,1] отделима от нуля.
Условие (Р).
( Р1) При п ^ то
тах тах
к=0,1,...,п
к к
ик , ик+1
п п
тж к /1 \ /к
Из условия (Р) следует, что Пк =---+ о — , причем последовательность п Пк--------
п п п
равномерно по 0 ^ к ^ п ограничена константой С.
Всюду в работе будем предполагать, что выполнены (основные) условия (Н), (К), (Е), (Р).
3. Вспомогательные результаты
В этом разделе представлены вспомогательные результаты, необходимые для изучения асимптотики введенных выше оценок Ж1,А, Ж2,А, Жз,А.
Приведем сначала неравенство Koksma-Hlawka (см. [5], с.18), которое позволяет оценить скорость сходимости интегральных сумм к соответствующему интегралу.
Пусть В - лебегова а-алгебра на I = [0,1] и р - лебегова мера на В. Для
Р = {и0, и1, ..., ип, ип+1} с и0 = 0 <и1 < ... < ип < 1 = ип+1 и В € В определим
А(В; Р) = ^ Хв(иг), Пп(В; Р)
г=1
вир
БеБ
А(В; Р)
п
- р(в)
где Хв (ж) - индикатор множества В. Положим Р*п(Р) = Дп(/*, Р), где есть подмноже-
ства на I вида [0,иг].
Для любой ограниченной функции ф : К ^ К положим || ф ||/ = 8ирже/ | ф(ж) |.
Теорема 3.1 [5] (Неравенство Koksma-Hlawka). Если функция / (и) (0 ^ и ^ 1) имеет ограниченную вариацию \/(/) на [0,1], то для любых 0 < и1 < и2 < ... < ип < 1 мы имеем
г 1
1
п
^2/(иг) - /(и) ^и
г=1
\/(/)Дп (и1,...,ип).
Приведем также еще две леммы из [5].
Лемма 3.2. Если ж1,..., жп, у1,..., уп € [0,1] удовлетворяют неравенствам | жг — уг | ^ е для 1 ^ г ^ п, то
1 ^п(ж1,...,жп) — ^п(У1,...,Уп) 1 ^ е
Замечание 3.1. Из леммы 3.2 следует, что Р*п(ж1,...,жп) есть непрерывная функция переменных (ж1,...,жп).
Лемма 3.3. Если 0 < и1 < и2 < ... < ип < 1, то
Р*п(и1, ...,ип) = 71 + тах 2п 1^г^п
г 2г - 1 1
иг _
2г — 1 2п
Замечание 3.2. Если и,- = —, то-
п п 2п 2п
= ТТ“ и Р*п(и1, ...,ип) = -.
п
Теорема 3.2 ([6], с.337; [7], с. 299). Если <р(п) ^ то при п ^ то, и
^(п)(Тп - в) -N(0, т2)
П
то
ц>(п)(д(Тп) - д(в)) N(0, т2(д'(в))2).
П
при условии, что существует непрерывная не равная нулю производная д'(в) функции
Для дальнейшего нам понадобится также следующий вспомогательный результат. Рассмотрим функцию
где супремум берется по всем возможным упорядоченным разбиениям 0 < и1 < и2 < ... < < иг < 1 отрезка [0,1].
Доказательство. Пусть 0 < щ < и2 < ... < иг < 1 есть произвольное упорядоченное разбиение отрезка [0,1]. Тогда
где 1\ и 12 таковы, что
Р(щ1) ^ А — , Р(и^1+1) > А — hd,
Р(иг2+1) < А + hd, Р(иг2 +2) ^ А + А<1.
Поскольку К^(х) = 0 для | х | > 1, то сумма ^^1_1 + ^2^_2+2 будет равна нулю, а
д(в).
и оценим ее вариацию на отрезке [0,1].
Лемма 3.4. Если выполнены основные условия, то
) = А'„(-1) + К «)(
П^Ж
0,
Р(иіі+і) - А
Аналогично можно показать, что Ка
П^Ж
0.
тэ - Р (и,) - А
В оставшейся сумме все точки ------------------
Ка
принадлежат отрезку [-1,1], и поэтому
Кі
£
,—11+2
Кі
Кі
Кі
£ IК К,
,—¿1+2
Кі
2МКа 2М
К2
Кі
К2
Кі
Кі
где Є [-1,1], |К(£,)| ^ М и М не зависит от п. Отсюда следует результат леммы.
1
1
4. ОСНОВНЫЕ РЕЗУЛЬТАТЫ
4.1. Асимптотика оценки Х1,д. Представим статистику Х1,л в следующем виде:
п Л
- 1 ^ [ ТҐ ( РпНг (І/п) - и \ Л , д
Х1,Л = У К^--------------------------------------К- ^ *и = Хл,п + а,
і—1-оо
где
л
п
Хл,п = тг £/ К^ Р(г/п) - <1и,
пКл^ І V Кл
г—1-^
Л
п
а = пКі £/Н -К-(
—сю
/ , І і I 7 І і І 7
п ^ V V Кі \ к,
г—1 44 7
Асимптотическое поведение Хл,п представлено в следующей лемме. Лемма 4.1. При п ^ то
где
Хл,п = Хл + Й2,іКІ + о(КІ),
Хл = Р-1(А), а2,і = ^(Р-1)" (А)^2 = - '(хл)
2Ч ' 4 ' 1 2/3(хл)
Доказательство. Используя неравенство Koksma-Hlawka, лемму 3.4 и замечание 3.2, получаем:
1 л
1 і' і' т, (Р (х) - и\ , , гл( 1
хл п = — К ------------------- аиах + О
Кі і Кі пКі
0 -ж
1 1 ах I Ка(г) йг + О '
0 Р (х) —Л
нв.
пКі
Поскольку Р(^) Л ^ —1 при х ^ Р 1(А — Л^) ^ 1, то
^—х(л-ад 1 1 1
хЛ,п = J ¿х ^ К^(г) ¿г + J ¿х J К^(г) ¿г + О ^ ——
0 -1 ^-1(Л-^^) Р (х) —А
Первый интеграл равен Р-1(А — Л^), а во втором сделаем замену у = Р(^) Л и замечая, что А < Р(1) = 1, а Р € С2, f (х) > СО > 0, получим
Р (1) —А
^ 1 . хл,п = Р-1(А — Л^) + I /к^(г)(Р-1)'(А + Л<*у) ¿г + О 1
nhd
-1 у
1 1
’-1м г. \ I г. I л„. I ts ('„Л г i'с1-1W \ \ I i' 17-1\" (\i ~ ' 1
P-1(A - hd) + hd / dy / Kd(z){(P-1 )'(A) + (P-1)" (A)yhd + O(hd)} dz + O
nhd
-1 у
Так как
11 11
J dy j Kd(z) dz =1 JydyJ Kd(z) dz = ° vd-1,
-1 У -1 У
sup |(P-1)'(t) - (P-1 )/(ж) - (t - x)(p-1)"(x)| ^ 1 sup |(P-1 )/"(x)
*,ж€[0,1] 2 ж€[0,1]
(p-1)W(x) = 3(/'(P-1(x)))2 /''(P-1(x))
(f(P-1(x)))5 (/(P-1(x)))4’
то в силу отделимости плотности от нуля и ограниченности производных функции распределения получаем, что
sup |(P-1)'(t) - (P-1)'(x) - (t - x)(P-1 )''(x)| ^ C.
*,ж€[0,1]
Таким образом,
xA,n = P 1 (A - hd) +
+hd I (P-1)'(A) + (P-1)''(A)hd / y dy / Kd(z) dz + O(hd) I + O ^ 1
-1 У
P 1(A) + оh2(P 1)//(A)vd + °ih3 +
nhd
2^ ) (А)^ + ор* . ^ что завершает доказательство леммы 4.1.
Рассмотрим величину А и представим ее в следующем виде:
1 Л 1 Л
А = А1 + -А2 + -Аз.
2 6
Здесь
Aj = -^ it Kdf A P(i/n^ (Pnhr(i/n) - P(i/n)),
d i=1 \ d /
A2 = nhj t Kd' (A-^/n)) (Pnhr (i/n) - P(i/n))2,
а
Д3 = -4 ¿ K"(^-т) (F* (i/n) - F(i/n))8.
1 £ (A-- ) (Fnhr(i/n) - F(i/n)'8
где | C - F(i/n) | ^ | F(i/n) - Fnhr (i/n) |.
Лемма 4.2. При n ^ то
yñhT(Ai - a2,rhd) N(0,g2),
где
<*, = - f F ''(F-1(A))(F-1) '(A) = - ífgí.
g2 = A(1 - A)И K, ||2 [(F-1)'(A)]2 = f-^|| K, ||2. Доказательство. Определим величины
Ai,i = -^ Ё kJ F(i/h;) - A) (FnhT(i/n) - E(F„hr (i/n))).
d j=1 \ d /
Ai,2 = -¿ Kd ( F(i/n) - A) (E(F„hr(i/n)) - F(i/n)).
d i=1 \ d /
Тогда A1 = A1,1 + A1,2, причем величина A1,2 неслучайна.
Из [8], с. 68, следует, что
^ 2 2 I w/ N | / M1h2V2
sup | E(F„hr (ж) - F(ж)) | ^ -hrvr sup | f '(ж) | ^
2-г- , - —х- i ^ , i 2
Используя это замечание, получаем, что
E(A1) = E(A1,2) = -g £ Kd () F''(i/n)(1 + 0(1))
í=1 x '
1
_ ^ f Kd / FW - П F''(ж) dx(1 + o(1)) + q( h2
2hd У V hd / \ nhd
0
1
h2 r í h2
r r / ^ f „Л ( Tpi — 1\ !( \ ! „г. \ T?H( T? — 1 / ' ’ 4 4 ’ ^ /-44 ^ ' r
Kd(z)(F-1)'(A + zhd)F''(F-1(A + zhd)) dz (1 + o(1)) + O
2 J V nhd
-1
V 2
= - y h?(F-1) '(A)F ''(F-1(A)) + o(h2).
Далее, подсчитаем дисперсию величины A1. Имеем:
D(A1) = D(AM) =
\ 2
F(i/n) - A\ /i/n - u
n4fcdh? j=1 F (“j)(1 - F (“j” { £ 4 ) КП h,
£ F(“j)(1 - F(“j)) У K K (ПГ ) dx + O ©
j=1 l 0
Сделаем замену г = ——----------и применим неравенство Кокэша-Шаука. Тогда
11
О(А > = пящ/ Р (у)(1 — Р (у))х
О
х < / К (Р^)К (у) ¿х+О (п)} ¿у+О (п/
Кроме того, при п ^ то
К (Р-1 (А ^ — У) = Кг (Р^) + 0(1).
Р-1(А) — у
Учитывая последнее и делая замену Ь =-----------, получаем окончательно
Яг
С(А,) = А(1,— А)" Кг "2 + о ( 1
f 2(хЛ)пЯг \пЯг
Теперь, чтобы доказать асимптотическую нормальность величины А1, достаточно доказать асимптотическую нормальность А11. Для этого представим А11 в виде суммы
А1,1 = ЕГ_1 0, где
С, = — п/к (*№ < “') — Р (и)) % К(Р) К(^) •
Пусть С(и) = Р(и) — 4Р2(и) + 6Р3(и) — 3Р4(и). Тогда
П П - п
% В«, — Е(С,))4 = % В(С)4 = % Е(х(Х, < и,) — Р(и))4х
,_1 ,_1 ^ Г ,_1
х< % К, ( Р(*/п ~ А) к (г/п — и 44
г_1
14
8/4/4 % С(и) и М 4 я, ]М я ^ ¿х + О(
0
1
4
п/ % с(и) у К(у)Мху ¿у + О V п/,
,_1 I, О
1 ( 1
1 /•„, , I . , I , „( 1
С(х — г/ и / К(у)К(г)(Р ) '(А + у) ¿у > ¿г + О -пт = О
п3/3 У г | У г "'аь> ^У^ Vп4У ^ ^п3/3 У "
-1 1-1
Поскольку
Е"_1 е(с, — в(с, ))4 ЕП_1 В(С, — Е(С, ))4 / 1
2 = 2 = О -т- -► 0,
О (Еп 1«.?^ (^(А1)) \п// п
то для последовательности ЕП_1 С, выполнены условия центральной предельной теоремы Ляпунова. Отсюда получаем утверждение леммы 4.2.
1
Лемма 4.3. При п ^ то
А2 + Аз = о
ч/п/
Доказательство. Рассмотрим сначала А2. Имеем:
1
'В(Д2)|«
г_1
Е(Р^Г(г/п) — Р(г/п))2 <
< С/ у.
< п/, ^
г_1 1
_1 К Л А — Р(г/п) Ч
Ср4 /1 К„'(() | л + О ( /4
1
п/2
1
О,&=
Далее,
—Е(А3) = п/3 % К
г_1
А — С
Е((Рп^г (г/п) — Р (г/п))3).
Пусть А(х) = Е((Рп^г(х) — Р(х))3). Тогда
А(х) = Е((Р^Г (х) — Е(Рп^ (х)) + Е(Р^Г (х)) — Р (х))3) =
= Е((Р^Г(х) — Е(Р^Г(х)))3) + (Е(Р^Г(х)) — Р(х)))3 + 3Б(Р^Г) ■ (Е(Р^Г(х)) — Р(х)))
/г
Е((Рп^г(х) — Е(Рп^г(х)))3) + О ( /г6 +
п
причем оценки равномерны по х и, значит,
—2 [
| Е(Аз | < —3- А(х) ¿х.
^ ./-1
Рассмотрим теперь
Е((Р,Л„ (х) — Е(Р„й, (х)))3) = Е((п"^ п, (х))3),
,_1
где
1 / х — и
П,(х) = /г(х(Х, < х) — Р(х))КЛ —
Тогда (см. [9], с. 379)
1 / чч3ч 2^/ 3/ чч Р(х) — 3Р2(х) + 2Р3(х) 3 /х — и\
Е((п-1£ п,(х))3) = п-2Е(п'3(х)) = —---------------------п^------—КМ — ) .
,_1 Г \ г /
Воспользовавшись ограниченностью К('/(Ь) и тем, что
1 I К (и) ¿х < —3 < то,
/Г J _1 \ /г
получим
| Е(Аз) | = О
1
п2/3/^
1
-х/п/Г
Аналогично можно показать, что Е(А2), Е(А2) сходятся к нулю при п ^ то. Значит, из неравенства Чебышева получаем результат леммы 4.3
1
о
Из лемм 4.1 - 4.3 имеем следующую теорему.
Теорема 4.1. При п ^ то
у/пКТ(Х1,л - Хл - &2(Кг,Кі)) Д N(0,д2),
где
ь 2 ^ = а К2 , „ К2 „ = ^2/'Ы „ = ^2/'(хл)
ь2 (Кг , К1) = а2,1Ка + а2,гКг , а2,г =-2/(х ) , а2,1 = - 2/3(х ) ,
2 = А(1 - А) Д К, Д2 д2 / 2(хл) ■
4.2. Асимптотика оценок Х2,л и Х3,л. Для изучения асимптотики оценки Х2,л представим ее в следующем виде:
4л
х2,л
где
Х1,л
Л
2 ^ і Г
&,л = Х2,л + 2Л, Х2,л = -Г- У^~
пКі п
2 £ і_ г к / а„,
пКі п з V Кі
і—1 ^
Л
' = пі £ 1/М - *'(
і—1 -оо
Лемма 4.4. При п ^ то
Х2,л =Хл +К^Хл (- + /(Х!)] +о(Кі)-
Доказательство. Применяя неравенство Koksma-Hlawka, получаем
1 л
2 її т, (Р (х) - и\ , , г,( 1
х2 л = — / / хКа ----- ----- аиах + О
Кі і Кі пКі
0 -Ж
1 1
= 2 і х ах I ка(у) ау + о '
пКа
0 (^(я)-л)/^
^ —!(л-^^) 1 1 1
2 хах / ка(у)ау + 2 / хах / ка(у)ау + о
і
п/,
0 -1 ^—Чл-ад №)-л)/^
Первый интеграл вычисляется непосредственно, а во втором сделаем замену , Р (х) — А Т
с =-----------. Тогда получаем
/,
х2 , Л = (Р 1 (А — /Й))2 +
(^ (1)-Л)/^
+2/з [ (Р-1) '(А + ¿/з)Р-1(А + ¿/3) ¿С / Кз(у) ¿у + О 1
пКі
-1 *
22 Ї 2
Р-1(А) - (Р-1)'(А)Кі + (Р-1) "(А)-2 + о(КІ) +
+2hd(F-1) '(A)F-1 (A) j dtj Kd(y) dy+
-1 t
1 1
+2hd / tdW Kd(y)dy{(F-1)''(A)F-1(A) + [(F-1)'(A)]2} + o(hd).
Так как
-1 t
11 11
dt / Kd(y) dy =1, 2 dt i Kd(y)tdy = vJ - 1,
1 t 1 t
то
Ж2.Л = {(F-1(A))2 + ((F-1)'(A))2hd - 2F-1(A)(F-1)'(A)h„+ +F-1(A)(F-1)''(A)hd } +2(F-1) '(A)F-1(A)hd+ +hd(vd - 1)F-1(A) {(F-1)''(A) + ((F-1)'(A))2} + o(hd).
Последнее завершает доказательство леммы 4.4.
Представим теперь величину Л в виде суммы Л = Л1 + 2Л2 + 6Л8 , где
d
л1=- £к- ( 47м) n(F*(i/n) - F (i/n))
í=1 4 x
A. = nhd £ Kd (F^) n (F- (i/n) - F(i/n)) =- nh¡ ¿Kd' (^) n (F»h.(i/n) - f шл
d :=r V hd y n
1 £ - F (i/n) 1 ^ 1 F(i/n) - Fnhr (i/n) |.
Лемма 4.5 При n ^ то
J nhr (A1 - «1,rh2) Л N(0,g2),
где
= vr2XAf '(жл) 2 = 4A(1 - A)xA|| K i, 2
«1,r f4(ж*л) . g1 f2(жл) " K 11 .
Доказательство. Пусть
A1,1 =- nhd £ 4 Fí^) n(F*(i/n) - E(F*(i/n))),
í=1 n 7
A1,2=- nh¡ ¿ k- (Fí^) n (E(F-r(i/n)) - f (i/n)).
í=1
Тогда Л1 = A1.1 + Ai 2.
v.
h2
Учитывая, что E(Fnhr(ж) - F(ж)) = r r f '(ж) + o(h2) , получим
E(A.)" E(A|J) = - gg Ё *■( ^^F '(i/.)», OI))
í=1 4 7
^ f / F(X) - А\ xF,,(x) dx(1 + 0(1)) + O ^ h2
2hd У V hd y \nhd
0
1
'r hr / I \ 77-1 І \ I 7 \ І Т7'—1\>ґ\і~1, ^77"í' 77-1 M i ~ Z, ^ J-Vl і і ГЛ I hr
Kd(z)F-1 (Л + zhd)(F-1)'(A + zhd)F"(F-1(A + zhd)) dz(1 + o(1)) + O
2 V' • , v і --а,- v i —-------i \ nh
¿di \ I Ы Vfl
-1
vfh2
2
Вычислим теперь дисперсию величины Л1. Имеем:
^ F-1(A)(F-1) '(A)F "(F-1(A)) + o(hd). рсию Б(Л1) = Б(ЛМ) =
n¡k ¿ «■-1(1 - {¿K (^)K (т—1) i }2 ■
£ F(UJ)(1 - F(uj)) { f Kd () Kr (^) xdx + O (i)
2
n2hdh2 ■“ j j W V hdy \ hry \n,
j=1 l, 0
F (x) — A
Делая замену z =--------------- и снова применяя неравенство Koksma-Hlawka, получим
hd
1
В(Л1) = ihfh2 / F(u)(1 — F(u)) dUX 0
x¿ /Kd(z)KJ F 1(A + zhd) — ^F-1(A + zhd)(F-1)'(A + zhd) dx + o(¡> +O
hr y \ny\n2h2
0
Используя то, что при n ^ то
K. ( F-1 (A +¡hdz) — ^ = K (F-1(hA) — y) + 0(1),
r
-1
F-1(A) — u
и делая замену--------------, получим окончательно
hr
Б(Л1) = A(1 — A)(F-1(A)(F-1)'(A))2! K ||2 + o () = A(1 -Kr |2 + J 1
пКг 4 ^ 11 г 11 ' ^пК^ пКг/2(хл) ' ^пК,
Учитывая множитель 2 в определении статистики $2,л, получим результат леммы 4.5.
Лемма 4.6. При п ^ то
1
Л2 + Лз — о
i/nhr
Доказательство. Замечая, что 0 ^ i/n ^ 1, и повторяя доказательство леммы 4.3, получим результат леммы 4.6.
Лемма 4.7. При n ^ то
л/ñh($2,2 — x2 — a1(hr,hd)hd) N(0,gj2),
где
2_ A(1 — A)xA^ ,,2
gl = f 2(xa) 1 Kr 1 ,
_ 2 1 ЖЛf '(жл) 1
«1,d = vd ( +
f 3(жл) f 2(жл)У'
Доказательство этой леммы в основных чертах повторяет доказательство леммы 4.4, поэтому опущено.
Представим оценку ж2 л в виде отношения в, где
а
n л
п i Л 1 f TS (Fnhr(i/n) - j
в = ж2,л + Л1, а = — 2_^ Kd I ------h------- ) du-
Положим
Из представления
^1 жл ^2 жл*
^1 в — ^1 ^1 / ч .
Ж2,Л----—---------------2 — ^2) +
^2 ^2 ^2
+ 0р((в — ^1)(а — ^2)) + °р((а — ^2)) (см. [10], р.327) и учитывая, что при п > то
^2 „2 , 9^2 ос°^ в „2 Л(1 - Л)|| к 112
9 — -2 +------4" - 2с°М _, ~ 9 — “т—ГII К || ,
^2 ^2 \^2 ^2 У /2(жЛ)
получаем следующую теорему.
Теорема 4.2. При п > то
\/ПлГ(Ж2,л - жл - &(Лт, ^)) > N(0,„2),
гОе
&1(Ьг, ^¿) а1,^+ а1,г^
^жл/'(жл) 2 / жл/'(жл) , 1
\^л) 2 ¡ --ло v-л/ ,
«1., =-------------------Ñ---. a1,d = vd------------------------\---+
f4 (жл) ’ 1,d Ч f 3(жл) f 2(жл)У
В лемме 4.7 и в теореме 4.2 присутствуют величины а1.т и a1.d, в которые входят производные от обратной функции F-1(A), а именно, (F-1)'(A), (F-1)''(A), и которые неизвестны. Для их оценки мы предлагаем следующие статистики:
- 1 ^ K (Frahr (i/n) - A) . 1 ^ K' (Frahr (i/n) - A
C1 = nh¡£ K4—hd— и C2 = - nh2 £ K
í=1 4 7 d i=1
Рассуждая аналогично предыдущему можно показать, что при п > то они сходятся по вероятности к (Р-1) '(Л) и (Р-1) "(Л) соответственно. Тогда состоятельной оценкой для
Ы^Г, М будет С1С2 + ^^(¿2 + С^).
Из теоремы 4.2 следует, что дисперсия предельного распределения оценки Ж2,л такая же, как и у оценки Ж1,л, поэтому рассмотрим оценку
Жз,Л — у/^2,Л - Ьх(^г ,М.
Воспользовавшись теоремой 3.1, нетрудно получить следующий результат.
Теорема 4.3. При п > то
л/П^Г(Жз,л - Жл) - > N(0,„|),
где
2 А(1 — Л)хл и и2
g3 = “7—о“"K "■
Так как 0 < жд < 1, то из теоремы 4.3 заключаем, что предельная дисперсия оценки Ж3,д меньше, чем предельная дисперсия оценок Х1,д и ж2,д.
Построенная оценка ж3,д использовалась для нахождения эффективных доз для примеров, взятых из книги [1], а также для примера Finney (см. [11], c.98).
СПИСОК ЛИТЕРАТУРЫ
1. Криштопенко С.В., Тихов М.С., Попова Е.Б. Доза-эффект М.: Медицина. 2008. 288 с.
2. Кочеганов В.М., Тихов М.С. Оценивание эффективных доз в зависимости доза-эффект // Обозрение Прикладной и Промышленной Математики. Т. 18, В. 1. 2011. С. 85-86.
3. H. Dette, N. Neumeyer, K.F. Pilz A note on nonparametric estimation of the effective dose in quantal bioassay // Journal of the American Statistical Association. V. 100. 2005. P. 503-510.
4. Натансон И.П. Теория функций вещественной переменной Лань. М. 2008. 560 с.
5. H. Niederreiter Random number generation and quasi-Monte Carlo methods Society for industrial and applied mathematics. Philadelphia. Pensilvania. 1992. 241 p.
6. E.L. Lehmann Theory of Point Estimation. John Wiley & Sons. NY. 1983. 506 p.
7. Леман Э. Теория точечного оценивания. М.: Наука. 1991. 448 с.
8. Тихов М.С., Криштопенко Д.С., Ярощук М.В. Оценивание распределений в зависимости доза-эффект при фиксированном плане эксперимента // Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. Перм. ун-т. Пермь. 2006. С. 66-77.
9. Крамер Г. Математические методы статистики. М.: Мир. 1976. 648 с.
10. M.S. Tikhov Statistical Estimation on the Basis of Interval-Censored Data // Journal Math. Sciences. V. 119, No. 3. 1974. P. 321-335.
11. D.J. Finney Probit Analysis. Cambridge University Press, NY. 1971. 333 p.
Михаил Семенович Тихов,
Нижегородский государственный университет им. Н.И.Лобачевского, пр. Гагарина, 23,
603950, г. Нижний Новгород, Россия E-mail: tikhovm@mail .ru