Эффективные и робастные MD-оценки Крамера Мизеса

Шуленин Валерий Петрович

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2010 Управление, вычислительная техника и информатика № 3(12)

УДК 519.24

В.П. Шуленин ЭФФЕКТИВНЫЕ И РОБАСТНЫЕ МБ-ОЦЕНКИ КРАМЕРА - МИЗЕСА

Оценки параметров, построенные методом минимума расстояний, в литературе кратко называют МБ-оценками. Метод минимума расстояний был предложен Вольфовитцем [1] в 1957 году. Обширная библиография работ по МБ-оценкам составлена и опубликована Парром [2]. В данной работе рассматриваются эффективные МБ-оценки параметра сдвига, основанные на использовании взвешенного расстояния Крамера - Мизеса и изучаются их свойства робастности в различных супермоделях, описывающих отклонения от гауссовской модели.

Ключевые слова: оценки параметров, метод минимума расстояний, функция влияния, робастные оценки.

Рассмотрим вариант, когда статистическая модель (X, 3е) задана в параметрической форме. Здесь X обозначает выборочное пространство и 3е = (Е : Е (х, е), ее©} - заданное параметрическое множество допустимых распределений вероятностей. Имеется выборка Х1,...,Хп в виде последовательности н.о.р. случайных величин с функцией распределения Е(х, е) и с плотностью /(х, е), х е В1 , ее© . Функциональный вид распределения задан с точностью до неизвестного параметра 0 (скалярного либо векторного), который принадлежит заданному параметрическому множеству 0. Требуется построить по выборке Х1,...,Хп из распределения Е(х,е) оценку неизвестного параметра ее© .

Метод минимума расстояний состоит в том, что на множестве непрерывных функций распределений 3, для пары распределений Е, О е 3 , задается метрика (или расстояние) р( Е, О). Оценка параметра 0, полученная методом выбранного расстояния р(Е, О), определяется из условия минимума этого расстояния между эмпирической функцией распределения Еп (х), построенной по выборке Х1,...,Хп, и функцией распределения Ее(х) = ЕХ(х,е), принятой в модели (X,3е). Таким образом, для выбранного расстояния р(Е,О), МБ-оценки определяются в виде выражения е = а^шш(р(Еп,Ее)} . Для построения МБ-оценок

е

могут быть использованы различные расстояния (см. [2]). Отметим, что метод максимального правдоподобия основан на использовании расстояния вида р(Еп, Ее) = -| 1п /(х, е)dЕn (х). В данной работе мы рассмотрим МБ-оценки, которые основаны на использовании взвешенного расстояния Крамера - Мизеса, определяемого при О = Еп , в виде

Рш (Еп, Ее) = | [Еп (х) - Ее (х)]2 Wе (х, Ее) dЕе (х), (1)

где Ше = Ш (х, Ее) - заданная весовая функция, которая в общем случае может за-

висеть от ф.р. Ее или плотности /е . Предполагая, что рШ (Еп, Ее) дифференцируемая по параметру 0 функция, обозначим её производную через АЕ (е) = дрш (Еп, Ее)/ де . С учетом этого обозначения, МБ-оценка еп параметра

0, основанная на использовании взвешенного расстояния Крамера - Мизеса вида (1), является решением уравнения АЕ (е) = 0 , где

В данной работе рассмотрим МБ-оценки параметра сдвига 0 в одновыборочном варианте, то есть в этом случае Е9 (х) = Е(х - 9). Введем опорное семейство

распределений в виде 30 = {Е: Е9 (х) = Е0 (х - 9), 9є Я1}, где Е0 - заданное опорное распределение с плотностью /0. Перепишем (1) в виде

Отметим, что выбор весовой функции Ш в виде плотности опорного распределения, то есть в виде Ш (х) = /0 (х), соответствует расстоянию Крамера - Мизеса, выбор весовой функции Ш (х) = /0 (х) / Е0 (х)(1 - Е0 (х)) соответствует расстоянию Андерсона - Дарлинга (см., например, [4, 9]). Предполагая, что рЕп Е(| (е,Ш) из (3)

дифференцируемая по параметру 0 функция, обозначим её производную через АЕ (е) = дрЕ Е0 (е, Ш) / де . Уравнение АЕ (е) = 0 для нахождения МБ-оценки записывается в виде

Асимптотические свойства МБ-оценок изучались различными авторами (см., например, [1, 4, 6, 9]). В данной работе обсуждаются асимптотические свойства МБ-оценок еп параметра сдвига 0, которые при заданной опорной ф.р. Е0, принятой в качестве исходной модели, и заданной весовой функции Ш являются решением уравнения (4). При этом различаются следующие два варианта оценивания параметра 0.

Вариант 1. Функция распределения Е наблюдений Х1,...,Хп известна, и она совпадает с опорной функцией распределения Е0, то есть Е = Е0 (или Е е30).

Вариант 2. Функция распределения Е наблюдений Х1,...,Хп неизвестна, и она не обязательно совпадает с опорной функцией распределения Е0 , то есть Е Ф Е0 (или Е г30).

Отметим, что МБ-оценки еп параметра сдвига 0, которые являются решением уравнения (4), могут быть записаны в виде функционала от эмпирической функ-

дЕ (х) АЕ (9) = -21[Еп (х) - Ее (х)]-^ % (х)^ (х) +

п -1 д9

(2)

Ре„,е0 (9, %) = |[Еп(х) - Е,(х- 9)]2 %(х-9)ёх .

(3)

(4)

где Х(1),..., Х(п) - упорядоченная статистика выборки *1,..., Хп .

1. Асимптотическая нормальность МБ-оценок

ции распределения, то есть в виде еп = е(Еп), где функционал е(Е) определяется выражением шш рЕЕ (е,Ш) = рЕ Е (е(Е),Ш) или, с принятым обозначением

е о ’0

Т(Е) для функционала, этот функционал Т(Е) = е(Е) задается неявно с помощью выражения вида

2| [ Е (х + Т (Е)) - Е0 (х)] /0 (х)Ш (х^х -1 [ Е (х + Т (Е)) - Е0 (х)]2 Ш1 (х^х = 0. (5)

Для изучения асимптотических свойств МБ-оценок еп =е(Еп) параметра

сдвига 0 воспользуемся подходом Мизеса (см. [9, 10]) и рассмотрим разложение вида

е(Еп) = е(Е) + ^ +Вщ , (6)

где ¥1п - аппроксимационная статистика и В1п =е(Еп) -е(Е) - ¥1п остаточный член разложения (6). Сначала конкретизируем аппроксимационную статистику ¥1п и остаточный член В1п. Для этого вычислим дифференциал Гато первого порядка d1T(Е;О-Е) функционала Т(Е), заданного выражением (5). Пусть ЕА = Е + А(О - Е), 0 < А < 1. Заменим в формуле (5) функцию распределения Е на ф.р. Еа , в результате получим выражение

21 (Е (х + Т (Еа )) + А[О (х + Т (Еа )) - Е (х + Т (Ея))] - Е0 (х)}/ (х)Ш (х)dх -

-{(Е(х + Т(Еа )) + А[О(х + Т(Еа )) - Е(х + Т(Ея))] - Е0 (х)}2 /0 (х)Ш' (х)dх = 0 .

Дифференцируя данное выражение по параметру А , полагая А = 0 , и учитывая, что d1T(Е;О-Е) = дТ(ЕА)/дА |А=0 и Т(ЕА) |А=0 = Т(Е) = е, имеем

[[О(х) - Е(х)]([Е(х) - Е0(х - е)]Ш7 (х -е) - /0 (х - е)Ш(х - е)}dr

^Т(Е;О-Е) ------------------------- ---------------------------------/-.

| /(х)/0 (х — е)Ш(х - е^х -1 [Е(х) - Е0 (х - е)]/(х)Ш (х - е^х

Из полученного выражения, в котором следует заменить ф. р. О на эмпирическую ф.р. Еп, получаем формулу для аппроксимационной статистики ¥1п в виде

¥ы = d{T(Е; Еп - Е) = п^ 2 /Е(Хг; Е, Е,, Ш), где /Е(и; Е, Е0, Ш) = d1T(Е; Ди - Е), 0 < и <го, функция влияния для МБ-оценки еп = е( Еп) параметра сдвига 0, которая при заданной опорной ф.р. Е0 и заданной весовой функции Ш является решением уравнения (4). Отметим, что выражение для функции влияния также следует из предыдущей формулы путем замены ф. р. О на вырожденную в точке и функцию распределения Ди . Полученные формулы,

а также разложение (6), служат основой для доказательства асимптотической нормальности МБ-оценок, являющихся решением уравнения (4). Общие условия регулярности, накладывающие ограничения на поведение хвостов ф. р. Е и весовой функции Ш , при которых выполняется выражение >/пВ1п ^р 0 , п и при которых МБ-оценки состоятельны и асимптотически нормальны, приводятся в [4]. Кроме того, рассматриваемые здесь МБ-оценки входят в семейство МБа-оценок, асимптотические свойства которых описаны в [6]. Для формулировки дальнейших результатов обозначим через 35 семейство абсолютно непрерыв-

ных симметричных распределений. Выделим класс WS положительных весовых функций, для которых предполагаем, что они дифференцируемы, являются четными функциями, то есть Ш(-х) = Ш(х), и |(Е(х)(1 - Е(х))}р Ш(х + c)dх < да , c е (-да, + да).

Теорема. Пусть (Е, Е0) е 3_у и Ш еWS . Тогда для неравенств

0 < ст2(Е; Е0, Ш) = | /Е2 (х; Е, Е0, Ш^Е(х) < да, выполняется асимптотическое выражение вида

Ь(4п[е(Еп)-е(Е)]/ст(Е;Е0,Ш)} = N(0, 1), п ^да, где асимптотическая дисперсия МБ-оценки с опорной ф.р. Е0 и весовой функцией Шпри распределении Енаблюдений Х1,...,Хп равна

Б( Е; Е0,Ш) = ст2 (Е; Е0,Ш)/п и функция влияния /Е (и; Е, Е0, Ш) = -/Е (-и; Е, Е0, Ш) МБ-оценки вычисляется по формулам

/Е (и ;Е,Е),Ш) = Ае , е0 (и ;Ш)/Ве,е0(Ш) , 0 < и <да; (7)

и

Ае,е0 (и; Ш) =| Ш(х)dЕ(х) - Ш(и)[Е(и) - Е0 (и)]; (8)

0

да да

Ве,е0 (Ш) = | /0 (х)Ш(х^Е(х) - | [Е(х) - Е0 (х)]Ш7 (х^Е(х). (9)

-да -да

Доказательство этой теоремы может быть найдено в [6] и [9].

Отметим, что для первого варианта оценивания параметра 0, когда Е е30, функция влияния /Е(и; Е, Ш), 0 < и <да, определяется выражением

» +да

Е(х) - /[и < х]}Ш (хШ(х) | о

Г да(Е(х) -/[и < х]}Ш(х^Е(х) Г V(х)dЕ(х)

/Е (и; Е ,Ш) = - ^

Г / 2(х)Ш (х)ах Г / (х)Ш (х)dЕ (х)

Л -да Л -да

и

= 3-1(Е,Ш)| /(х)Ш(х)йх , 0 < и < да, (10)

0

и асимптотическая дисперсия МБ-оценки вычисляется по формуле Г +да( Г +да(Е(у) -/[и < у]}Ш(y)dЕ(у))2 dЕ(и)

-да -да

ст2 (Е ,Ш) =-

(/-да / (х)Ш (х^Е (х) )2

Г(Г,г (у) ^ (у) )2 ^ (х)

(£да/2( х)Ш (х)dх )2

2. Эффективные МБ-оценки

Для первого варианта оценивания параметра 0, когда функция распределения Е наблюденийХ1,...,Хп известна и совпадает с опорной симметричной функцией распределения Е0, в классе МБ-оценок существует эффективная оценка параметра 0, асимптотическая дисперсия которой равна обратной величине информации Фишера /(/0) относительно параметра сдвига 0 распределения Е0(х -е) с плотностью /0. Эта эффективная оценка определяется весовой функцией вида

Ш*(х) = а ^ 1п/0(х)}_^. (12)

dх2 /0(х) ^ }

Данный результат отмечался и ранее в работах [4, 9]. В справедливости этого факта можно убедиться следующим образом. Обозначим у(х) = -/'(х)//(х), тогда у'( х) = d 2{- 1п / (х)}/dх2 и выражение (12) перепишется с учетом того, что Е = Е0, в виде Ш(х) = ау'(х)//(х). Подставляя эту весовую функцию Ш еWS в формулу (11) и учитывая, что для Е еЗS у(0) = 0 , получаем

1-3V(у^Е(у))2 dЕ(х) а2 |-даУ(х^Е(х) /(/) ^

ст2( Е ,Ш) = ■

(_[-да /2(х)Ш(х)йх)2 а2 (Г-дау7(х^Е(х))2 /2(/) /(/)

Пример 1. Отметим, что использование формулы (12) позволяет отыскать функцию распределения Е0, при которой МБ-оценка с весовой функцией

Ш(х) = /0 (х) является асимптотически эффективной оценкой параметра 0.

В самом деле, полагая Ш (х) = /0 (х) и решая дифференциальное уравнение

d2{- 1п/0(х)}/dх2 = а • /2(х),

получаем плотность вида

/0(х) = 2/[п(ех + е~х)] = (1/ л^ес Н(х), х е Я1,

с функцией распределения Е0(х) = (2/ л)агС£(ех), х е Я1, которую называют гиперболический секанс. Отметим, что информация Фишера для параметра сдвига е плотности /0(х) = (1/л)БесН(х) - гиперболический секанс, как и для распределения Коши, равна /(/0) = 1/2 . Следовательно, ст2(Е0, Ш = /0) = 2 . Отметим также, что функция влияния МБ-оценки с весовой функцией Ш = 1 при Е = Е0 является ограниченной и определяется в виде

/Е(х;Е0,Ш.1) = , Е0-(1/2) = (2/-(1/2> =,а^е)-(„2/4), хеЯ1 .

[,/0(Е0-‘(())^( <2/п )

Асимптотическая дисперсия МБ-оценки с весовой функцией Ш . 1 при Е = Е0 совпадает с асимптотической дисперсией оценки ИЬ Ходжеса - Лемана и

для распределения Е0( х) = (2/ л)аг^(ех) вычисляется по формуле

ст2( № = 1) =-

12 ({ 0 /о( Е,-1(0)Л )

12 ((2 / п){ о Бт(л t /2) со8(п / / 2) Ж)

П4 2

- =— « 2,029 = ст2(Е,Я!). 48 0

Пример 2. Рассмотрим супермодель 3 в виде конечного семейства заданных распределений, то есть 3 = (Е^), Е(2), Е(3),Е(4), Е(5)}, где =Ф - стандартное нормальное распределение с плотностью /(1) = ф, информация Фишера I(/(!)) = 1; Е(2) - логистическое, I(/(2)) = 1/3; Е(3) - Лапласа, I(/3)) = 1; Е(4) -Коши, I (/(2)) = 1/2; Е(5) - гиперболический секанс, I (/(5)) = 1/2. Оптимальные весовые функции вида (12) для распределений из 3 приведены в табл. 1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Т аблица 1

Оптимальные весовые функции вида ^ * (х) = а •у/( х)/ / (х)

Е(1) Е(2) Е(3) Е(4) Е(5)

№(*)( х) = 1/ ф( х) №(*2)(х) - 1 №(3)( х) = = 2е|х|5( х - 0) №(4)( х) = (1 + х2) (1 + х ) №(5)( х)=—(еХ+е~х )-1 П

Отметим, что асимптотическая дисперсия МЭ-оценки с опорным распределением Е0(х) = Е(х) и весовой функцией №(х) = 1/ /(х) совпадает с асимптотической дисперсией выборочного среднего X и вычисляется по формуле

С ({0Х №(у)^(У))2 (х) {++- ({0х (1 / /(у))/(у)йу)2(2)

ст2( Е ,№ = 1//) = -

({-да /2 (х) № (х)йх )2 ({-да /2 (х)(1 / / (х))йх )2

ад

= { х2йЕ(х) = ст2(Е, X).

Для весовой функции № (х) = 1/ ф (х), где ф(х) - стандартная нормальная плотность, МЭ -оценка является эффективной оценкой параметра сдвига 0 нормального распределения, однако она, как и выборочное среднее X, имеет неограниченную функцию влияния №(х; Ф, № = 1/ ф) = х, х е Я1, и её чувствительность к грубым ошибкам не является конечной, то есть у* (Ф, № = 1/ ф) = да. Отметим также, что выбор весовой функции №(х) = 1 приводит к асимптотически эффективной МЭ-оценке при логистической ф.р. Е(2) (её дисперсия в данном случае

совпадает с дисперсией Я! -оценки), при этом абсолютная эффективность МЭ-оценки с весовой функцией №(х) = /(2)(х) равна АЭ(Е(2),№ = /(2)) =

1

= [3,036(1/3)]-1 = 0,988. Напомним, что для логистического распределения Е(2) с плотностью /(2) и выполняется равенство /(2) = Е(2) (1 + Е(2) ), поэтому выбор весовой функции в виде №(х) = /0 / Е0(1 + Е0), соответствующий МЭ-оценке, основанной на использовании расстояния Андерсона - Дарлинга, также приводит к эффективной оценке при логистическом распределении. Для распределения Лапласа с плотностью /(3)(х) = (1/2)ехр(+ | х |) , х е Я1, функция у(х) =+ /('3)(х)//(3)(х) =

= sign( х) и, следовательно, оптимальная весовая функция № * (х) = а -у'( х)/ / (х), определяемая формулой (12), при а = 1 принимает вид

№(*)(х) = ^п(х)}' //(3)(х) = 5(х + 0)//(3) (х) = 2е|х| 5(х-0).

Используя данное выражение для оптимальной весовой функции и формулу (11), можно убедится, что асимптотическая дисперсия МЭ-оценки будет совпадать с асимптотической дисперсией выборочной медианы Х1/2, которая является асимптотически эффективной оценкой параметра сдвига 0 для распределения Лапласа. В самом деле, из формулы (11) при весовой функции № (х) = 5( х - 0)/ / (х), получаем

{ +да({ +да(Е(у) -1[и < у]}№(у)СЕ(у))2 СЕ(и)

а2(Е ,№) = ^-> -----------------------------------------^-=

({-да / (х)№ (х)СЕ (х))

+да +да 2 +да

{-да ({-да (Е(у) - ^и < у] }§(у - 0)4у) ЗЕ(и) {-да (Е(0) -1[и < 0] }2 СЕ(и)

({-да/ (х)8( х - 0)с!х )2 / 2(0)

(1/4) - Г+” I[и < 0]СЕ(и) + Г+” 12[и < 0]СЕ(и)

«!-да «!-да -

/ 2(0) 4 / 2(0)

= ^2(е, Хш).

Отметим, что для распределения Коши оптимальная весовая функция №(*4)(х) = а (1 - х2)/(1 + х2) отрицательна вне интервала [-1,1]. Этот факт можно

пояснить следующим образом. Из формулы (10) следует, что весовая функция № выражается через производную функции влияния в виде

№ (и) = 3 (Е, №) Ш1 (и; Е, №) / / (и), 0 < и <да. Таким образом, чтобы «уменьшить» влияние выбросов на МЭ-оценку, нужно, чтобы её функция влияния при больших значениях аргумента убывала и, следовательно, весовая функция должна быть отрицательной, что и наблюдается для оптимальной весовой функции №(*4) (х) = а (1 - х2) /(1 + х2) при распределении Коши.

Пример 3. Рассмотрим семейство распределений Стьюдента 3г е35, для которого плотность распределения /г (х) с г степенями свободы записывается в виде

/г(х) = А(г )(1 + (х2/ г ))-(г+1)/2, х е Я1, А (г) =Г((г +1)/2)/Л/г— Г (г/2).

Используя (11), можно убедиться, что оптимальные весовые функции для распределений этого семейства вычисляются по формуле

№*(х) = а • г<г+1)/2(г +1)А- (г)(г - х2)(г + х2)(г-3)/2 .

Отсюда, в частности, при г = 1 получаем оптимальную весовую функцию для распределения Коши, №* (х) |г=1 = а • 2п (1 - х2) /(1 + х2) = №(4) (х). Случай г соответствует нормальному распределению. Учитывая, что при г выполняются выражения А (г) ^ 1/л/2— и (1 + (х2 /г))-(г+1)2 ^ е~х 2, из общей формулы получаем Итг^ш №* (х) = а • \/2— ехр (х2 /2) = а • 1/ ф (х) = №(* (х).

3. Свойства робастности МБ-оценок

Для изучения свойств робастности МЭ-оценок рассмотрим два типа супермоделей, которые описывают отклонения от гауссовской модели наблюдений. Первая супермодель 3, которая использовалась в примере 2, определяется в виде конечного семейства заданных распределений, то есть

3 = (Ер),Е(2),Е(3),Е(4),Е(5)}. Вторую супермодель 3ет(Ф) называют гауссовской моделью с масштабным засорением и определяют в виде

3е,т(Ф) = (Е:Еет(х) = (1 -е)Ф(х) + еФ(х/т)}, 0<е<1, т> 1,

где Ф(х) - стандартная нормальная функция распределения с плотностью ф(х), е - пропорция засорения выборки и т - масштабный параметр засорения.

3.1. Сначала рассмотрим свойства МЭ-оценок в рамках супермодели 3 при различных вариантах задания опорной ф.р. Е0 и весовых функций №. Для первого варианта оценивания параметра 0, когда функция распределения Е известна и равна опорной функции распределения Е0, то есть Е е 30, функция влияния МЭ-оценки и её асимптотическая дисперсия вычисляются по формулам (10) и (11). Рассмотрим различные варианты задания весовой функции № е №5 .

А) Пусть №(х) = 1 и Е(х) = Е0 (х). При этих условиях МЭ-оценки с весовой функцией №(х) = 1 являются 5-робастными, то есть они имеют ограниченные функции влияния, которые определятся в виде

№(х; Е,№ = 1) = (2Е(х) -1}/ 2{ /2 (х)Сх.

В гауссовском случае, при Е = Ф , функция влияния определяется выражением

^(х; Ф, № = 1) = [2Ф(х) -1].

Чувствительность к грубым ошибкам у*(Е,Т) = sup | Ш(х;Е,Т) | для МЭ-оценки

х

с весовой функцией № (х) = 1 равна у* (Ф, № = 1) = 4— и 1,77.

Б) Пусть весовая функция совпадает с опорной плотностью, то есть № (х) = /0 (х) и Е(х) = Е0(х). При этих предположениях из (11) следует, что асимптотическая дисперсия МЭ-оценки с опорным распределением Е0 (х) = Е (х)

и № (х) = /(х) вычисляется по формуле

({0х/2(у)Су) СЕ(х)

({-+*> /3(х)Сх)

Отметим, что при гауссовском распределении, то есть при Е(х) = Ф(х), и весовой функции №(х) = ф(х) = (1/л/2— )ехр(-х2 /2} из (10) получаем ограниченную функцию влияния МЭ-оценки в виде

Ш(х; Ф, № = ф) = (73— / 2)Ф(х) = (л/3— / 2) [ 2Ф(х>/2) -1], х е Я1, где Ф (х) - функция Лапласа, определяемая выражениями

Ф(х) = (2/л/—){ ехр(-х2}Сх, Ф(х) = 2Ф(хТ2) -1, х > 0,

Ф(х) = (1/л/2—){ ехр(-х2/2}Сх.

Л -да

Чувствительность к грубым ошибкам у* (Е,Т) для МЭ-оценки с весовой функцией №(х) =ф(х) равна у* (Ф, № = ф) =73— /2 = 1,53. В этом случае асимптотическая дисперсия МЭ-оценки равна

да - 1 да

а2 (Ф, № = ф) = 2 {Е 2( х; Ф, № = ф) С Ф( х) = — • -= {Ф 2( х) е“ х'/2 Сх =

0 2 ^2п 0

= (3/2)аг^(2/л/5) = 1,095.

Значения асимптотических дисперсий МЭ-оценок для случаев (А) и (Б) вычислены для следующих распределений: Е(1) - нормальное, Е(2) - логистическое,

Е(3) - Лапласа, Е(4) - Коши, Е(5) - гиперболический секанс. Численные расчеты

по полученным формулам при различных весовых функциях приведены в табл. 2.

Т аблица 2

Асимптотические дисперсии 4п МБ-оценок для супермодели 3^. при .Т(і) є 30 ,

і =

Весовая функция Е(1) =ф Е(2) Е(3) Е(4) Е(5)

№ = 1 №(,)( х) = /.)(х) №(,-)( х) = /(.)/Е(0(1 - Е(0) 1,047 (0,96) 1,095 (0,91) 1,035 (0,97) 3.000 (1,00) 3,036 (0,99) 3.000 (1,00) 1,333 (0,75) 1,200 (0,83) 1,262 (0,79) 3,287 (0,61) 2,573 (0,78) 2,029 (0,98) 2,000 (1,00)

В данной таблице в круглых скобках приведены значения абсолютных эффективностей МБ-оценок, которые вычислены по формуле АЭ (Е ,№) = [ст2( Е ,№) I (/ )]-1. Отметим, что для распределений с «тяжелыми хвостами» (Коши и Лапласа) абсолютная эффективность МБ-оценок в большей степени зависит от выбора весовой функции №. Весовые функции № = 1 и

а2( Е ,№ = /) = -

№(2)(х) = /(2) /Е(2)(1 -Е(2)), оптимальные для логистического распределения Е(2), весовая функция №(5)(х) = /(5)(х), оптимальная для распределения Е(5), - гиперболический секанс.

3.2. Рассмотрим теперь второй вариант, когда Е Ф Е0, Е е 3. В этом случае асимптотическая дисперсия -Ш МЭ-оценок вычисляется по формуле

2{ 00 [Е„(и) - (1/2)]2 ёЕ (и)

а2(Е,Е0,№ - 1) = ^^-----------------------, Е е 3. . (13)

({ /0( х) / (х)Сх )

Численные значения асимптотических дисперсий л/й МЭ-оценок для Е е3. и весовой функции № = 1, вычисленные по формуле (13), приведены в табл. 3.

Т аблица 3

Асимптотические дисперсии -Ш МБ-оценок в(;) = 0(Е0 = - 1>,

I = 1,...,5, для Е е 3.

0\Е Е(1) Е(2) Е(3) Е(4) Е(5) с (0,3.)

0(1) 1,047 (0,96) 3,051 (0,98) 1,383 (0,72) 2,911 (0,69) 2,008 (0,99) 0,42

0(2) 1,016 (0,98) 3,000 (1,00) 1,524 (0,66) 3,679 (0,54) 2,069 (0,97) 0,57

0(3) 1,059 (0,94) 3,048 (0,98) 1,333 (0,75) 2,957 (0,68) 2,006 (0,99) 0,41

0(4) 1,046 (0,96) 3,025 (0,99) 1,385 (0,72) 3,290 (0,61) 2,017 (0,99) 0,48

0(5) 1,031 (0,97) 3,011 (0,99) 1,439 (0,70) 3,276 (0,61) 2,029 (0,98) 0,49

Отметим, что в табл. 3 в круглых скобках приведены абсолютные эффективности оценок, вычисленные по формуле АЭ (Е, 0) = (а2(Е, Е0,№ = 1)! (/)}-1. В крайнем правом столбце таблицы приведены дефекты оценок в супермодели 3*., вычисленные по формулам (14).

Для второго варианта оценивания параметра 0, когда Е Ф Е0 и функция распределения наблюдений Е одна из супермодели 3., то есть Е^ = Е(]-), (],■) = 1,...,5, а весовая функция № равна опорной плотности, то есть № (х) = /(г)(х), ■ = 1,...,5 , в таблице (4) приведены численные значения асимптотических дисперсий МЭ-оценок, вычисленные по формулам

(],■) = 1, . ,5 .

Т аблица 4

Асимптотические дисперсии 4п МБ-оценок 0(і) = 0(ГО = Г(, ),Г = /(, )>,

і = для Г єЗ^

0\Е Е(1) Е(2) Е(3) Е(4) Е(5) * (§, 3)

0 (1) 1,095 (0,91) 3,093 (0,97) 1,273 (0,79) 2,351 (0,85) 2,019 (0,99) 0,28

0 (2) 1,024 (0,98) 3,036 (0,99) 1,447 (0,69) 2,901 (0,69) 2,021 (0,99) 0,44

0 (3) 1,127 (0,89) 3,319 (0,90) 1,200 (0,83) 2,354 (0,85) 2,036 (0,98) 0,27

0 (4) 1,070 (0,94) 3,152 (0,95) 1,301 (0,77) 2,573 (0,78) 2,003 (0,99) 0,33

0 (5) 1,055 (0,95) 3,132 (0,96) 2,573 (0,78) 2,577 (0,78) 2,000 (1,00) 0,32

Отметим, что в этой таблице в круглых скобках также приведены абсолютные эффективности оценок, вычисленные по формуле АЭ(Е, 0ф) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= (ст2(Е,Е0,№ = /(г-))/(/■))}-1 і = 1,..., 5 . При изучении свойств робастности сравниваемых оценок (Э1,..., 0к параметра сдвига 0 в рамках заданной супермодели З, состоящей из конечного набора симметричных распределений 3 = (Е[,...,Ег}, изучают поведение дефективностей оценок на плоскости двух распределений (см. [9]). По оси абсцисс обычно откладывают дефективность для базовой (идеальной модели, обычно гауссовской), а по оси ординат откладывают дефективность для альтернативной модели, входящей в супермодель 3 = {^,...,Ег}. Для заданного

распределения Е є З дефект оценки 0 параметра 0 определяется в виде БЕ(Е, 0) = 1 - АЭ(Е, 0). На рис. 1 приведены дефекты оценок параметра 0 на «плоскости двух распределений Гаусса - Коши». В крайнем правом столбце табл. (4) приведены дефекты оценок 0(1),...,0(5) в рамках супермодели 3^, вычисленные по формулам

( 5 У/2 Г 5 А1/2

* (0 а), з^ ) =

В1 - {а2(Е0> 0 (і))1 (/( і ))}-1]2 = X [1 - АЭ (Риу 6,))]

-і2

V і=1

V1 =1

■ = 1,..., 5. (14)

Согласно этому критерию, среди сравниваемых оценок 0(1),...,0(5) в супермодели 3. , предпочтение следует отдать МЭ-оценке 0(3) с опорным распределением Лапласа, то есть Е0 = Е(3) и весовой функцией равной опорной плотности, то есть №(х) = /(3)(х) = (1/2)еНх|, хеЯ1, так как значение С(0(3),3.) = 0,27 является наименьшим среди значений правого столбца табл. 4. Этот вывод сохраняется и при сравнении оценок 0(1),...,0(5) с МЭ-оценками 0(^,...,0(5), для которых весовая функция № = 1, так как для этих оценок 0(г) =0(Е0 =Е^Г),№ = 1), ■ = 1,...,5, минимальное значение С(0(3),3.) = шш(С(0(),3.), ■ = 1,...,5} = 0,41 (см. правый

столбец табл. 3). Заметим, что для оценки Ходжеса-Лемана ё(ИЬ, 3*5) = 0,47 ; для Ха -винзоризованного среднего ё(Х0 45,3^) = 0,41; для выборочной медианы ё(Х1/2,3^) = 0,51 ; для выборочного среднего ё(X,3^) = 1,14. Отметим также, что «практически» таким же преимуществом обладает и МЭ-оценка 9(1) с опорным нормальным распределением , то есть Е0 = = Ф и весовой функцией

№(х) = (1/л/2л )ехр{-х2/2}, х е Я1, так как для этой оценки ё(9^, 3^) = 0,28

(см. правый столбец табл. 4).

На рис. 1 наглядно видны преимущества МЭ-оценок (они концентрируются

ближе к началу координат) перед семейством Ха -винзоризованных средних и

семейством ИЬа -оценок Ходжеса-Лемана.

Рис. 1. Дефекты оценок для распределений Гаусса - Коши

3.3. Рассмотрим гауссовскую модель с масштабным засорением 3е т (Ф). В качестве опорного распределения выберем нормальное распределение, то есть Е0 =Ф, а распределение Е наблюдений Х1,...,Хп характеризуется нормальным распределением с масштабным засорением, то есть Е е 3е т (Ф). Для принятых

предположений асимптотическая дисперсия л/п МЭ-оценки при №(х) = 1 вычисляется по формуле

I» +да

2[ [Ф(х)-(1/2)] [(1 -е)ф(х) + (е/т)ф(х/т)]ёх

а2 (Ее,т, Ф, № -1) =---------------------------------------------------=

1| ф( х)[(1 -е)ф( х) + (е / т)ф( х / т)]ёх)

[п(1 -е)/6] + [еаг^(т2 ^2х2 +1)]

{[(1 -е)/л/2] + (е/\/ т2 +1 )}2

Для весовой функции № (х) = /0 (х) = ф( х) асимптотическая дисперсия

где В(е,т) и (е,т), / = 1,...,20, заданные функции параметров е и т. Числен-

ные значения асимптотических дисперсий МЭ-оценок для Е еЗ£т (Ф) при различных весовых функциях приведены в табл. 5. На рис. 2 приведены дефекты Ха -оценок и МЭ-оценки с весовой функцией №(х) = 1 (она отмечена звездочкой). На рис. 3 приведены абсолютные эффективности оценок для Е еЗе т(Ф) при т = 3. Из рис. 3 наглядно видно, что МЭ-оценка с опорной функцией №(х) = ф(х), также как и оценка Ходжеса - Лемана, обеспечивают высокую абсолютную эффективность при изменении пропорции засорения е, 0 < е< 0,3. При этом абсолютная эффективность для выборочного среднего X резко падает, а для выборочной медианы Х1/2 она медленно растет, оставаясь на низком уровне.

Т аблица 5

Асимптотические дисперсии МБ-оценок для Г Й 30, Г = Г,, Г =Ф

№ , т \ е 0,00 0,01 0,05 0,10 0,15 0,20 0,25 0,30

т = 3 1,047 (0,95) 1,071 (0,96) 1,171 (0,97) 1,307 (0,97) 1,458 (0,95) 1,625 (0,94) 1,811 (0,93) 2,019 (0,93)

№ = 1, 5 1,047 (0,95) 1,078 (0,95) 1,210 (0,93) 1,395 (0,90) 1,607 (0,86) 1,851 (0,83) 2,132 (0,80) 2,459 (0,78)

т = 3 1,095 (0,91) 1,117 (0,92) 1,209 (0,93) 1,333 (0,94) 1,470 (0,95) 1,620 (0,95) 1,786 (0,95) 1,972 (0,96)

№ = ф , 5 1,095 (0,91) 1,122 (0,92) 1,237 (0,91) 1,393 (0,90) 1,562 (0,89) 1,749 (0,88) 1,956 (0,87) 2,187 (0,87)

В этой таблице в скобках приведены абсолютные эффективности МЭ-оценок, вычисленные по формуле ЛЭ (Еет, 9) = {ст2(Еет ,№ )1 (/ет )}-1, где I (/ет) - информация Фишера относительно параметра сдвига распределений из супермодели

л/й МЭ-оценки вычисляется по формуле

ЭЕ(Фе,т, 9), е = 0,2, т = 0,3

Рис. 2. Дефекты оценок в плоскости двух распределений

Рис. 3. Абсолютная эффективность оценок

Заключение

В работе изучены асимптотические свойства МЭ-оценок параметра сдвига 9, основанные на использовании взвешенного расстояния Крамера - Мизеса. Показано, что эти оценки В -робастны, то есть их функции влияния ограничены и, следовательно, МЭ-оценки «защищены» от наличия выбросов в выборке. Для случая, когда Е е З0 , приведены оптимальные весовые функции, при которых МЭ-оценки асимптотически эффективны. Для гауссовской модели с масштабным

засорением (при т = 3) абсолютная эффективность MD-оценок с весовой функцией W = 1 не опускается ниже 0,93 при 0 < е< 0,3, и при этом она возрастает с 0,91 до 0,98 для весовой функции W = ф .

Подводя итог, отметим, что существуют тесные связи MD-оценок параметра сдвига 0 с другими робастными M, L и R-оценками параметра сдвига 0, (см. работы [5, 9]). Семейство MD-оценок включает в себя в частных случаях многие известные оцени параметра сдвига 0. В частности, оценку Ходжеса - Лемана, выборочные среднее и медиану. Отметим также, что приведенные асимптотические результаты являются вполне приемлемой аппроксимацией свойств MD-оценок при конечных объемах выборки n > 20. Это подтверждают многочисленные результаты моделирования, полученные методом статистических испытаний. Изучение свойств эффективности и робастности MD-оценок открывают (для случая, когда F ?30) возможности использовать адаптивный подход при выборе опорного распределения F0 и весовой функции W в рамках заданной супермодели, основываясь на выборочных оценках функционалов, определяющих «степень за-тянутости хвостов» распределений (см. работу [10] ).

ЛИТЕРАТУРА

1. Wolfowitz J. The minimum distance method // Ann. Math. Statist. 1957. V. 28. P. 75 - 88.

2. Parr W.C. Minimum distance estimation: a bibliography // Comm. Statist. 1981. A10. P. 1205 - 1224.

3. Bickel P. J. Another look at robustness: a review of reviews and some new development // Scand. J. Statist. Theory and App1. 1976. V. 3. P. 145 - 168.

4. Boos D.D. Minimum distance estimators for location and goodness of fit // J. Amer. Statist. Assoc. 1981. V. 76. Ыо. 375. P. 663 - 670.

5. Shulenin V.P., Tarasenko F.P. Connections of MD-estimates with classes of robust estimates of location parameter // 12th Prague Conf. on Inform. Theory. August 29. September 2, 1994. P. 220 - 223.

6. Шуленин В.П. Асимптотические свойства и робастность MD-оценок // Теория вероятностей и её применение. 1992. T. 37. Вып. 4. C. 816 - 818.

7. Шуленин В.П. Границы эффективности оценок, построенных методом минимума расстояния Крамера - Мизеса // Изв. вузов. Физика. 1995. № 9. C. 84 - 89.

8. Серых А.П., Шуленин В.П. Робастные и непараметрические алгоритмы обработки данных физических экспериментов // Изв. вузов. Физика. 1993. № 10. C. 128 - 136.

9. Шуленин В.П. Введение в робастную статистику. Ъзмск: Изд-во Том. ун-та, 1993. 227 с.

10. Шуленин В.П. Свойства адаптивных оценок Ходжеса - Лемана в асимптотике и при конечных объемах выборки // Вестник Томского госуниверситета. Управление, вычислительная техника и информатика. 2010. № 2(11). С. 96 - 112.

11. SerflingR.J. Approximation theorems of mathematical statistics. N.Y.: Wiley, 1980. 371 p.

Шуленин Валерий Петрович Томский государственный университет E-mail: [email protected]

Поступила в редакцию 23 марта 2010 г.

Эффективные и робастные MD-оценки Крамера Мизеса Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Шуленин Валерий Петрович

Похожие темы научных работ по математике , автор научной работы — Шуленин Валерий Петрович

Текст научной работы на тему «Эффективные и робастные MD-оценки Крамера Мизеса»