Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2012, № 3 (1), с. 170-174
УДК 519.2
ОБ УМЕНЬШЕНИИ ПОГРЕШНОСТИ НАБЛЮДЕНИЙ ПРИ ОЦЕНИВАНИИ ЗАВИСИМОСТИ ДОЗА - ЭФФЕКТ
© 2012 г. М.В. Ярощук
Нижегородский госуниверситет им. Н.И. Лобачевского
Поступила в редакцию 26.03.2012
Рассматривается математическая модель зависимости доза-эффект в случае непрямых наблюдений. Предлагаются и исследуются способы уменьшения погрешности наблюдений для оценивания неизвестной функции распределения.
Ключевые слова: зависимость доза-эффект, непрямые наблюдения, погрешности наблюдений, регрессия.
Введение
В работе рассматривается математическая модель зависимости доза-эффект (см. [1]) для схемы непрямых наблюдений, т.е. когда вводимая в организм доза измеряется с некоторой ошибкой, а реакция организма (эффект) идет на «чистую» вводимую дозу. Рассмотрен случайный план эксперимента, когда вводимая доза является случайной величиной. Данная модель при наличии погрешности измерения в основном отражает применяемую методику проведения клинических испытаний лекарственных препаратов. В схеме непрямых наблюдений, если распределение ошибки неизвестно, устранить ее влияние в определенных случаях можно либо при помощи специальных ядер (см. [2]), либо используя априорные сведения о распределении ошибок. Однако, как показали результаты численного моделирования, указанные методы устранения ошибок работают для оценки плотности, а для оценки функции распределения дают неудовлетворительные результаты. Мы предлагаем и исследуем способы уменьшения погрешности для оценки функции распределения в некоторых случаях, имеющих важное значение для приложений. Так, если распределение с.в. X является нормальным Щ(а, о2) с неизвестными параметрами, распределение ошибки е также
N(0,а2)
подчиняется нормальному закону
22 известной дисперсией а 0, где дисперсия а 0
2
много меньше дисперсии о , мы строим оценку, предельное распределение которой мало зависит от погрешности измерения.
В задаче доза-эффект для случайных планов эксперимента математическая модель в схеме непрямых наблюдений имеет следующий вид. Измерения вводимой дозы и осуществляются с
погрешностью е, имеющей плотность £(х), то есть вместо с.в. и наблюдается с.в. Y. Эта ошибка может накладываться аддитивно, тогда
Y = и + е, при фиксированном значении и = и распределение величины Y имеет плотность д(у - и). В общем случае распределение ошибки описывается условной плотностью ^(у|и).
Имеем: X], X2,...Xn - независимые одинаково распределенные случайные величины (н.о.р.с.в.) с функцией распределения (ф.р.) F(x), и1, и2,...,ип - независимые между собой и одинаково распределенные с.в., независимые от {X,■, 1 < 1 < п}, с неизвестной ф.р. G(x), Yl, Y2,...,Yn -н.о.р.с.в. с неизвестной ф.р. Q(y). Мы наблюдаем повторную выборку Y(n) = {(^-, Щ), 1 < 1 < п}, где Щ = 1(и. >X) есть индикатор события {и > > X}, т.е. Yi - наблюдаемое значение, а реакция организма осуществляется на величину и.
Определим статистики 1 п
(X) = - £ К ^ - X),
пт1 1 п
S2*п(X) = -^ - X), п и
где И = сп15, с - некоторая заданная положительная константа, функция К(х) - ядерная
функция (ядро), К И (х) = И К ^ И ^ .
По выборке {(^ ,Щ )}= построим оценку для F(x) как отношение статистики S2n (х) к Sln (х)
*( X) = ^(х)
Х,п М
полагая ¥*п (X) = 0, если S1*n (X) = 0. Пусть т(X) = |F(у)g(X - у) dy.
Известно (см. [3, 4]), что при некоторых условиях регулярности оценки (1) являются состоятельными и асимптотически нормальными оценками неизвестной функции распределения F(x) и кроме того
4nh (s* (x) - l)—U N (о,| 1*112), (2)
V II II /
( 2 ^ ■Jnhisln(x) -m(x))—N — m"(x),||*112m(x) , (3)
V ^
( 2 ^ 4nh(F.(x) -m(x))——^N — m”(x), ||*||2 o2 (x) , (4)
где ст
k =
J K 2(x) dx .
N1
(о,I |K|| ■)
Tv2 ,, „2
N — /(x), F(x)||K||
V 2 У
g (x) =
l
V2rc
expI
x
2
2а
О У
Пусть с.в. X є N (a, а2), т.е. F(t) = P(X < t)
= ФІ x-a | ,Ф(X) = -^= Je“2 dt .
о
Тогда m(x) = JF(t)g(x -1)dt -
свертка двух
нормальных распределений. Применяя теорему Фубини [5], заключаем, что
m'( x) = J / (t) g (x -1 )dt-
(t-a)2
„•ч/їло
- ( x-t )2
О
-e 0 dt =
(x) = m(x)(l - m(x)), v2 = J x2K (x)dx,
72п(оО + °2)
Следовательно,
x l (t-a)2
m(x) = ^СЁ?
( x-a)
2 (о2 +о2)
(
оЛ/2л(а О + а2)
x - a
Vа
ЧУаО +а2 У
и
Результаты и их обсуждение
Мы рассмотрим задачу устранения погрешности измерений, когда:
1) погрешность е имеет известное нормальное распределение N (о, ст 0), распределение случайной величины X - нормальное N(a, o2), параметры (a, o2) неизвестны;
2) погрешность е имеет известное нормальное распределение N (о, ст 0), функция распределения F(x) случайной величины X неизвестна;
3) погрешность е имеет известное нормальное распределение N (о, ст 0), распределение случайной величины U - нормальное N(a, o2), параметры (a, o2) неизвестны, распределение случайной величины X неизвестно.
1. Если ошибка е имеет нормальное распределение N (о, ст 0), то из соотношений (2) и (3) заключаем, что нормированные разности 4nh (s* (x) -1) и 4nh (s 2*n (x) - F (x)) имеют асимптотически нормальные
( 2 ^ 4nh (S 2*n (x) - F (x))—-^ N — m"( x), m(x)\*2
V ^
Теперь из (4) заключаем, что 4nh (m (x) - F (x))—
N
— т"(X), m(x)(l - т(X))К||
ч у
где т (х) = (x) = .
^п (Х)
Таким образом, установлено, что при нормальном распределении с.в. XЩ(а, о2) и извест-
ной дисперсии о0 с.в. е е N(0,о2) предельное распределение оценок получилось аналогичным тому, что и в схеме прямых наблюдений. Отличие состоит в том, что дисперсии распределений m(x) и F(x) различны.
Чтобы найти оценку т^), вычислим первый и второй начальные моменты ц1 и ц 2:
J xdm (x) = J (l - m (x)) dx - J m (x) dx = |Il,
распределения
I
соответст-
J x2 dm (x) = |I 2.
венно.
Пусть распределение случайной величины U имеет плотность
Положим р2 = ц2 -ц^. Тогда неизвестные
2
параметры а и о найдем из системы уравнений
v —
a + — + m (x) = ц1 .
— 2 2 2 p = а +аО,
v
а = ц- - — т (x\
;;2 „2 —2
а =р -аО.
Функцию yn(x) определим соотношением
m( x+h) - 2m( x)+m(x - h)
Vn(x) = m"(x) =■
h2
l
l
2о
l
и
2
Заметим, что если с.в. X имеет функцию распределения F(x) и функцию времени жизни
да да
5(X) = 1 - F(X), то ^xdF(X) = ^S(X)dx.
0 0
Далее,
1
(у-и )2
dF (X) 5^
g(У, и) = Ч(у1 и) • g(и) = г— е п° • g(u),
V 2ПО0
а маргинальная плотность распределения величины 1 будет равна
да да 1 _(у-и )2
Ч(у) = Г g (у, и) du = Г ,— е 2п“ g(и) du .
-да -да^2п00
Кривая регрессии и по 1 имеет вид:
Г1Г5(и) аи ^=Г1Г5(и) йи
5 2( X)
I-
1
( у-и)2
Г 5(и) du
да да
0 0
Г 5(и) du • S(x) dx -
= -ц2 - 2xj 5(и) du + 2^ xS(x) dx =
X 0 0
дада
= -ц2 + Г 5(X) d (X2) = -ц2 + Г X2 dF(X).
00 Поэтому эмпирические моменты можно считать используя приведенные соотношения и подставляя вместо теоретической функции распределения эмпирическую.
Найденные значения а и а2 подставим в функцию распределения с.в. X и получим оценку этой функции распределения.
2. Пусть 1 = и + е - сумма независимых случайных величин и и е, причем распределение е -нормально с нулевым математическим ожидани-
2
ем и известной дисперсией а 0, а случайная величина и имеет неизвестную плотность g(u) > 0. Для устранения погрешности е мы воспользуемся следующей идеей работы Э. Надарая [6]. Кривая регрессии и по 1 имеет вид:
рМ
и(X) = Е(и 11 = X) =
Ч(х)
где
да ^ (X—и) да
р^) = Г ug(u) е 2а° du, ч(^) = Г g(u)
•' л/2лап
( X -и )
-е 2п° du .
Чу и( у 1 и) = Ч(у 1 и) = -
1
( у-и )2
___ е 2а° g(u) du
u(x) = Е(и 11 = X) = -да 2л°°----------------= ^Ф.
ЧС*} чС*)
С помощью этой кривой регрессии мы будем «исправлять» выборочные данные и использовать их для оценки распределения величины X «без ошибки».
Представим последнее соотношение в другом виде. Для этого рассмотрим производную Ч'^). Она равна
да 1 ч'м = Г-^-
•'л/2ла„
(
X - и
\ - (x-и)2
а
е а0 g (и) du =
0 У
Отсюда
= - xч( X) + р (X).
Ч'( x) Ч(^
Р(x)
а„
а 0 Ч( x)
значит,
Р(^ _2 Ч'(x)
= а---------------+ X.
Ч(x) чМ
Пример 1. Пусть случайная величина 1 имеет нормальное распределение с неизвестным математическим ожиданием а и неизвестной дисперсией о2, ее плотность равна
1
( x-а)2
Тогда
Ч(x) = ^^~ е 2а
л/2^а
ч' (x)
Ч(x)
Ч(x)
= (1п ч( x)), =-
а
2 ч'(X) а -а0 а0
и а 0 / ч + X =------X + а
2
0.
2
д/ 2ла 0
Найдем условное распределение 1 при условии и = и. Имеем
Р (1 < у |и = и) = Р (и + е< у |и = и) =
= Р (и + 8 < у | и = и) = Р (е < у - и), поэтому условная плотность 1 на и равна
аа Поскольку а и о2 неизвестны, то мы оценим их по выборке у1, у2,....уп с помощью следующих статистик:
пп
а = у = - £ у. и а 2 = 52 = - £ (у,. - у)2 .
п и п м
В качестве приближения по выборочным данным мы рассмотрим статистику
ип (x) = а2 ^4“: + x ,
л/0ла 0
Совместная плотность пары (1, и) будет равна
где
Р п (x) =
Чп (x)
1 п
Чп (x) = - £ Ки (у, - x)
пт1
Чп (X + И) - Чп (X - И)
2И '
да / да
да / да
2
1
+
X
+
X
1
2а
и
Имеет место следующий результат.
Теорема 1. Пусть I - произвольный конечный интервал [а, Ъ] на прямой и выполнены следующие условия: K(x) - неотрицательная, нормированная, четная, финитная функция с ограниченной вариацией ц = V(K), nh ^да>, при n^-да, плотность q(x) имеет до третьего порядка непрерывные и ограниченные производные.
Тогда
p
sup |un(x)-u(x)| ^ 0.
xel n
Доказательство повторяет с небольшим отличием идею доказательства работы [6].
Пусть е > 0 и V2n = sup 1 Рn (x) - E(Рn (x))|.
Имеем:
V2n = supI Pn (x) - E(Pn (x))I =
x
sup
q„(x+h) -q„(x-h) Jq„(x+h) -q„(x-h)
2h = sup
2h
au-x-lL | dF_ (u) -
Kl'u-x+L | dF_ (u) -
u-x+h
— J
h2 J
- 2?J ± Jk( ^ ^+£ J 4
i-J(F„(u) - F (u))dK V h
2h J (Fn (u) - F (u)) dKf u - x - h
= sup
x
h
u - x+ h
dFu)
< sup |Fn (x) - F(x)| • — .
x 2h
P
D >
h
< P(sup \Fn (x) - F(x) > є—) < C1e
x ц
-A^nh1
supI E (p n(x)) - q'( x)I =
= sup
у - x - h
2h2 J K1 q(у)Ф -
-1— f K\
>h2 J I
у - x + h
q( у) "у - q '(x)
2h 2 J i h
=sup 2ї J (q( x+(z+1)h) -
— q(x + (z - 1)h))K(z) dz - q(x)
= sup
' 2 ' ' ' 6 x (q "" (^l)+qm (S 2))K (z) d^ q'(x)
(v2 + 2)L3 , 2
з
h2.
Поэтому при и > N1(e) P (sup 1 Pn (x) -
x
- q’(x)| >e) < Ci e^nlf, где Pi = -2 .
Обозначим (ln q(x)) " = V (x), и пусть
"Hj = minq(x) Ф 0 , h2 = max| V(x) |.
xel xel
Тогда
P
sup
xєI
P n(x)
- V (x)
>є
Пусть Dn (x) = sup j Fn (x) - F(x)|, где F(x) -
x
ф.р. с.в. X, а Fn(x) - эмпирическая ф.р. с.в. X. Как показано в [7], для n > N0 существует такая универсальная константа C1, что
( 7 ]
— < с e ^
1— — •
V„ У
Принимая во внимание эти неравенства, заключаем, что для є > О,
P (sup I Рп (x) - E(Рп (x))I > є) <
q„(x)
< P(supb„(x)-V(x)q„(x)I >
xєI
> є(Р- - є)) + P (supI q„(x) - q(x)I > є) <
xєI
< P(supIP„(x)-V(x)qn(x)I >
xєI
> є(Р- - є)) + P (supI q„(x) - q(x)I > є) <
xєI
< P (supIP „ (x) - q’( x) I + supI V (x) (q„ (x) - q( x)) I >
xєI xєI
> є(Ц - є)) + P (supI q„(x) - q(x)I > є) <
xєI
< P(supb„(x) - q"(x)I > є(П- - є)/2) +
xєI
+ P (supI q„(x) - q(x)I > є) +
xєI
+P (supI (q„(x) - q(x)) I > є(п- - є) )) <
гдеР = .
Ввиду того, что плотность ч(x) имеет непрерывные и ограниченные производные до третьего порядка включительно, причем
sup| Ч " (x)| ^ ^,
< C4 (e~P-nh2 + e-p2nh2 + e-рзnh2), 2
, рз =P2 / ^2.
По условию теоремы nh2^-*, поэтому
p
sup I u„ (x) - u(x)I ^ 0.
xєI „^да
Теорема доказана.
x
x
x
x
x
+
x
2
Поскольку a и o2 неизвестны, то возьмем их оценки: а = у, О2 = s2. Поэтому
3. Рассмотрим случай, когда имеются наблюдения 1 = и + е; и, е независимы и имеют нормальные распределения соответственно Щ(а, о2) и N(0,о°), о0 известна. Здесь условная плотность распределения ч(и|у) имеет нормальное распределение N(ц1(у), р2), где Значение Fn (V*) будем использовать в каче-
* s v = x—-----
-- у = x + (x - у)-
а
s -a.
s -a.
Ц-( у) =
aa„
уа
22 а2 + а2
22 а2 + а2
p- =
22 a a 0 2 2 a о +a
т.е.
1
l
, где ф( x) = ^= e v2n
Ч(и 1 у) = — Ф
Р1
пп
Пусть у = - £ у,, 52 = - £(у,- у)2.
п и пт-
Предположим, что случайная величина Z имеет нормальное распределение М^р2) с функцией распределения Ф((x - ц)/р, Ф (X) =
= Г ф(?) dt.
, I x - а
стве оценки ФI--------| в точке x.
Если условие —^ << 1 не выполнено, то v
найдем из уравнения
(
1 + a 0
22 s -a„
(x - у) - у,
где X - заданная точка функции распределения ^).
Список литературы
При n ^ да последовательность {Fn (v), n > 1} сходится к среднему
R(v) = J Ф
u - ц
Л
l
(
p У
f
=Ф
-ф
u - Ц-О!)
Л
Pi
Ц-О!) - ц
du =
V Pl У
U
p2 + Pi2
У
o2 ст 2
Если —2- << 1, то заменим , 1 +—2 на 1 и o V ст
потребуем, чтобы
Ф
aо„
vо
2 2 2 2 о + о о + о
-a
Отсюда
aa„
va
22 а2 + а2
22 а2 + а2
=Ф
x-a
значит,
22 а о + а
v = x--2---a .
а2
1. Тихов М.С. PC-оценки функции распределения в модели доза-эффект по случайным планам эксперимента // Вестник Нижегородского университета. 2012. Вып.1(1). С. 138-143.
2. Fan J., Truong Y. Nonparametric regression with errors in variables // The Annals of Statistics. 1993. V. 21, № 4. P. 1900-1925.
3. Тихов М.С., Ярощук М.В. Статистическое оценивание распределений по интервально цензурированным выборкам в схеме непрямых наблюдений // Нелинейный мир. 2007. Т. 5, №1. 2. С. 4-8.
4. Ярощук М.В. Имитационное моделирование зависимости доза-эффект и статистический анализ оценок функции эффективности // Обозрение прикл. и пром. математики. 2009. Т. 16. В. 6. С. 1148-1150.
5. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1976. 542 с.
6. Надарая Э.А. О непараметрических оценках плотности вероятности и регрессии // Теория веро-ятн. и ее примен. 1965. Т. 10. В.1. С. 199-203.
7. Dvoretzky A., Kiefer J. and Wolfowitz J. Asymptotic minimax character of the sample distribution function and of the classical multinomial estimator // Annals of Mathematical Statistics. 1956. V. 27. P. 642-669.
+
о
2
x
о
*
v=
о
о
+
ON REDUCTION OF OBSERVATION ERRORS IN ESTIMATING THE DOSE-EFFECT DEPENDENCE
M. V. Yaroshchuk
A mathematical model of doze-effect dependence in case of indirect observations is considered. The ways to reduce observational errors for the estimation of an unknown distribution function are proposed and studied.
Keywords: dose-effect dependence, indirect observations, observation errors, regression.