Математическое моделирование
УДК 519.24
ИСПОЛЬЗОВАНИЕ СПЕЦИАЛЬНЫХ ФУНКЦИЙ ЭРМИТА ДЛЯ ИССЛЕДОВАНИЯ мощностных СВОЙСТВ КРИТЕРИЯ ГРАББСА
Л. К. Ширяева
Самарский государственный экономический университет,
443090, Россия, Самара, ул. Советской Армии, 141.
E-mail: shiryeva_lk@mail. ru
Рассмотрен случай, когда в нормально распределенной выборке имеется выброс. Получено новое представление для. плотности распределения вероятностей стьюдентизированного отклонения выброса от среднего по выборке, основанное на использовании специальных функций Эрмита с отрицательным целым значком. На основе этого представления найдены интегральные соотношения для мер мощности Дэйвида критерия Граббса в случае, когда статистика критерия является статистикой отношения правдоподобия. Найдена величина максимально возможного отклонения вероятности обнаружения присутствия одиночного выброса в выборке от вероятности его точного обнаружения. Определена область критических значений статистики Граббса, в которой меры мощности Дэйвида, предназначенные для точного обнаружения выброса, совпадают. Выполнены модельные расчёты функции мощности критерия Граббса для случая нормально распределенных выборок с выбросом, отличающимся от остальных наблюдений сдвигом вправо. Результаты вычислений оказались близки к теоретически ожидаемым.
Ключевые слова: выброс, критерий Граббса проверки на один выброс, функция Эрмита, меры мощности Дэйвида для критерия Граббса, нормальный закон распределения.
Введение. Пусть Х\, Х2, Хп-\, Хп — случайная выборка из п зна-
чений нормально распределенной случайной величины X; Хщ ^ Х(2) ^ ... ^ X(ra_i) ^ Х(га) —построенный по ней упорядоченный вариационный ряд; X(j)—j-тая порядковая статистика (j = 1,2,..., гг). Проверяемая нулевая гипотеза Н0 состоит в том, что наблюдения Х\, Х2, ...,Xra_i, Хп являются независимыми случайными величинами с нормальным распределением N(a,a2). В качестве конкурирующей гипотезы Н\ рассмотрим случай, когда какие-либо (п — 1) из п наблюдений имеют одинаковое N(a,a2) распределение, а одно из них — выброс Xout — имеет распределение N(a + Ха, иа2). Параметр сдвига А ^ 0 характеризует среднее (ожидаемое) смещение выброса вправо, а параметр масштаба v > 0 определяет изменение дисперсии выброса относительно остальных наблюдений. Гипотеза Н\ моделирует ситуацию, когда вероятность «засорения» выборки аномальными наблюдениями весьма
Людмила Константиновна Ширяева (к.ф.-м.н., доц.), доцент, каф. математической статистики и эконометрики.
мала [1], а сам выброс отличается от «обычных» наблюдений сдвигом вправо своего математического ожидания и измененной дисперсией. В частности, для случая Л > 0 и V = 1 получаем модель, учитывающую только сдвиг вправо математического ожидания выброса, а для Л = 0 и V ф 1 модель учитывает только изменение дисперсии выброса.
Статистика критерия Граббса для проверки на один верхний выброс имеет вид [2]
Сп={Х{п)-Х) /Б, (1)
где X = 1- £™=1 хг и & = ^ т,ыхг - Х)\
Гипотеза Но отвергается, если наблюдаемое значение статистики Граббса превысит критическое С^-а, отвечающее выбранному уровню значимости а.
Для исследования мощностных свойств критерия Граббса будем использовать следующие меры мощности Дэйвида для статистики Граббса [1]:
Рг=Р {Сп > Ссп]а | Щ) ,
Р2 = Р {(ХоиЬ ~ Х)/в > С%.а | Нг) ,
Рз = Р {{Сп > Ссп]а} П {Х(п) = ХопЬ} | Нг) ,
Р4 = Р ({(Хои, - Х)/Б > С%а) П {(Х(га_1} - Х)/в < С%а} | Нг) .
Мера мощности Р\ является, по сути, «классической» функцией мощности критерия Граббса, ибо она равна вероятности не допустить ошибку второго рода. Поэтому мера Рг особенно подходит для задачи выявления выборок с аномальными наблюдениями. Меры Р2-Р4 могут быть использованы для обнаружения выброса в выборке. Заметим также, что вероятность выявления выборки с аномальным наблюдением не совпадает с вероятностью обнаружения выброса, так как [1]
Р\ ^ Р2 ^ Рз ^ Ра- (2)
В работе [3] найдены формулы для вычисления мер мощности Р1-Р4 в случае, когда для выборки объёма п (п ^ 3) справедлива гипотеза Н\\
1,
/ȣ
1 - I п_х Рп-ЛРп^х))/^)^, ^ < г < (з)
Р2&) = <
о,
п— 1.
п— 1 .
п— 1 .
(4)
Рз® = <
(дп(х)) /тп(х)(1х,
1
л/п п — 1
(9п(х)) /уп{х)(1х,
о,
1 ^ < »г-1 •
Л
п—1.
/п
(5)
О,
(Рп(*,X)) ¡тп{х)(1х, < г < (6)
О,
п—1
Здесь £ — критическое значение статистики (1), отвечающее некоторому уровню значимости а (0 ^ а ^ 1); рп{г,х) = ^^ (]- ~ (га"1)2ж2),
1Ж1 < 9п(х) = Рп(х,х)] ^(¿) = Р(Ст < £ | Яо).
Закон распределения случайной величины Ст в условиях справедливой гипотезы Но известен [4,5]:
£ >
/т' гтг—1
т
(7)
т. —4 2 ' 2
где /Т„,М = (=^) /Г (=^2) (1 - ' , м < ГМ =
г+оо
= / £л_1е_*- гамма-функция.
■1о
Для вычисления мер мощности по формулам (3)—(6) следует знать закон распределения случайной величины
Тп = (ХоЫ - X)/в.
(*
Случайная величина Тп является стьюдентизированным отклонением выброса Х0^ от среднего, найденным по выборке объёма п. В работе [3] доказана следующая теорема о законе её распределения.
Теорема 1. Пусть наблюдения Х\, Х2, ■ ■ ■, Хп_\, Х01Й являются независимыми случайными величинами, причём Х\, Х2, ■■■, Хп_\ имеют нормальное распределение Ж(а, а2), а выброс Х0^ имеет нормальный закон распределения N((1 + Ха,иа2), где А ^ 0 и V > 0. Тогда для п ^ 3 плотность распределения вероятностей случайной величины Тп имеет вид
К„
(га— I)2 _ ,2 п
о,'
п — 4 2
Тп(*), |*| < ^
1*1 > тяг
(9)
где
К„ =
(п — I)2
п
1 + у{п — 1) п — 1
, ¡1 А/ ■
п V пг/
(п — I)2
>(*) = Г д($ = + (1 - Ф2.
Уо п
В данной работе найдено новое представление для плотности через специальную функцию Эрмита и показано, что это представление совпадает с формулой (9). Найденное представление было использовано для получения интегральных представлений для мер мощности критерия Граббса, использующих функции Эрмита. Отдельно рассмотрен случай, когда статистика критерия является статистикой отношения правдоподобия.
1. Вывод основных соотношений для плотности вероятностей случайной величины Тп. Чтобы вывести новое представление для плотности распределения вероятностей случайной величины (8), докажем два вспомогательных утверждения.
Лемма 1. Пусть и Z — независимые случайные величины с плотностями распределения вероятностей Ду и и областями значений М+ и М соответственно. Тогда Уг Є М случайная величина 17 = гл/\¥ — Z имеет плотность распределения вероятностей
Доказательство. Интегральная функция распределения случайной
По условию \¥ и Z — случайные величины с областями значений М+ и М соответственно, поэтому
Продифференцировав (11), получим плотность случайной величины 17:
что и требовалось доказать.□
Лемма 2. Пусть случайные величины \¥ и Z являются независимыми, причём величина имеет распределение %2(п — 1), а Z имеет нормальное
(10)
величины 17 = гл/\¥ - ^ \/г Є К следующая:
Ри(и) = Р(У <и) = Р(г\/Ш -г <и) = Р(г > г\Д¥ - и).
Ри(и) = Р{{гл/ш - и < г < оо} П {\¥ > 0}).
Случайные величины IV и 2 независимы, следовательно,
(П)
Jo
/•СО
распределение ІУ(ао,1). Тогда Ш Є
плотность распределения
вероятностей случайной величины Кг(^) = — Z в точке V = 0
следующая:
где
сЬ
= К 1Л9 =^’ С = СОП^ > 0;
V (и — 1) — та^
_га+1 ./2„-4Д Г(та — 1) _ ^ _ (та — 1) + (с — п)¥
Т
Ап = с П+ \ —е 2 ■ ------ ---—; /¿(¿) =
и 7Г Г(^) 17 С2
1 ГОО
Н^ = Т^)1 е-^Г*-Ч, л<0.
Доказательство. Обозначим плотности случайных величин \¥ и 2 через /у2 и соответственно. По условию и 2 — независимые случайные
Х-П — 1
величины с областями значений М+ и М соответственно. Следовательно, Ш € плотность случайной величины Уп(1,) = /?га(^)\//Й^ — ^ можно найти по формуле (10):
ГОО
¡Уп(ф)= / /х2 {х)/2{Рп^)л/х-у)с1х.
.)о
Здесь плотность величины Ш следует вычислять по формуле [6]
{к — 2 _ х
2 > п
2§Г(|) ’ - ’ (13)
0, х < 0,
при к = та — 1, а плотность величины 2 — по формуле
1 (х —ап)2
Мх)= е------------(14)
V 2тг
Далее, в точке V = 0 плотность величины Уп(Ь) есть
ГОО
/Уп(*)(°) = / ¡х2_Лх)/г(Рп(1;)у/х)(]х. (15)
70
Сделав под знаком интеграла в (15) замену переменных £ = ^1+/^”(*)~у/ж, приведём его к виду
^ 2/^(0)Г(та - 1) ( Щ>/Зп(г)
- ----377~^г——Д-П+11
ГОО
где Нк{г) = j е_? ~22:^~к~1г1^ — функция Эрмита с отрицательным
целым значком (А; < 0) [7]. Положим
(та - I)2 + (с2 - п)Ь _-п+1 /20-4 Г(та-1)
Л-(^) =------------5-----------, Ап = с п+ \ — е 2
V > С ’ V тг Г(^)
где с = const > 0.
Легко убедиться, что Vc > 0 справедливы равенства
СШ act 1 С-+‘ [(n_1)2_„i2]»il
\/2(1 +/%(*)) лДЩ’ (Ш +1)^
Отсюда
Л;-(1,(0) = Фц) [(п -1)2 - п*2] ^ НМ-^щ) ■
что и требовалось доказать.□
Используя соотношения (10) и (12), можно найти новое представление для плотности вероятностей случайной величины Тп.
Теорема 2. Пусть выполняются условия теоремы 1. Тогда для п ^ 3 плотность распределения вероятностей случайной величины Тп имеет вид
/г- (¿) = ( Вп' '/1 'п,)- щ < (16) " 1 о. 1*1 >
где Вп = ^Щ- ЩЩ, Г] = Уп&) = Шу/УУ - г-, /у„(4)(0) вычисляется по формуле (12) при с = случайные величины и 2 являются
независимыми; имеет распределение %2(п — 1), ^ имеет нормальное рас-
пределение N(0,0,1), Оо = Ц, Р
Доказательство. Нетрудно проверить, что при п ^ 3 справедливы следующие равенства:
- X = — (хои, - Г) , .?г = ^.?-2+(Х°"‘~Х*)2, (17)
п V / П — 1 п
где X* = Хг и 5*2 = ^32 -X*)2 вычисляются по выборке
объёма (п — 1), не содержащей выброса.
С учётом (17) для случайной величины Тп получим
^ - 1 Sign(Xout - Л") (1
П
I n(n—2)S*2 ~Т V (n-l)(Xout-X*)2 +
Рассмотрим случайные величины
Г = (п-2)5*2Дт2, ^ = ,/—(ХохЛ-Х*)/<т. (19)
V пг0
Согласно теореме Фишера [6] случайная величина У имеет распределение %2(п —2). Легко проверить, что случайная величина 2 имеет нормальное распределение N(/1,1).
С учётом введенных обозначений формула (18) примет вид
n_l sign(Z)
y/n y/l + v~lY/Z2
Пусть t < 0. Найдём интегральную функцию Fÿ (t) = P(Tn < t). С учётом (20) получаем
гА(0 = р({г<0}П{^<^-1}).
Заметим, что для t ^ событие |^2 < ---1 j становится невоз-
можным, следовательно,
71 — 1
Ffn{t)= 0, ---—. (21)
Далее Vt € (—^^;0) имеем
п
V у/(п — I)2 — nt2
Ffr/t) = P[\z< J- ■ ^====VŸ
Как и ранее (см. лемму 2), обозначим (3n(t) = , ct' ==, с = const > 0.
-у/ (га— 1) — rai
Положим с = тогда Ffn(t) = Р ^ jz < /3n(t)\/Yj П {0 < У < oo}j .
Согласно теореме Фишера случайные величины Z и Y являются независимыми [6], следовательно,
rl3n(t)^y
Г °° rPn(t)^y
Ffn(t) = / fr(y)dy / fz(z)dz. (22)
J 0 J — со
Здесь плотность /г{%) случайной величины ^ вычисляется по формуле (14) при условии ао = /х, а плотность /у(у) случайной величины К вычисляется согласно (13) для к = п — 2.
Аналогичным образом можно получить для случая £ ^ 0:
( fOO fy/ÿPn(t)
Fr_ (i) = J è - ф(^) + Уо fY(y)dy Уо fz(z)dz, 0>t<n~l
(23)
r* _£2
где Ф(г) = / e 2 d^ — функция Лапласа.
Объединяя соотношения (21), (22) и (23), получим
О,
гРп(*)у/У
о, г < -М;
] /г(у)(1у ! < £ < 0;
/•оо гРпфт/у
I - ФЫ + / ¡г(у)(1у / ¡г&)<1г, 0 < £ <
1,
Продифференцировав ^ (¿), найдём плотность распределения вероятностей случайной величины Тп:
#»(*) [ у/у/г(у)/г(Рп&)у/у)(1у, 1*1 < М,
/о
где
[(п — I)2 — п£2] 2 Используя соотношение (13), легко проверить, что
^2Г(^)
л/у1г{у) = ^га_2\ 4; 1 (у)- (26)
Тогда сотношение (24) с учётом (25) и (26) примет вид
с оо
, (¡) = ) - ч/[с-1~)‘-^р • I 1*1 <^Г.
». 1*1 ^ тяг-
2п Г(п=1)
где Вп = ^-
Положим, что имеется случайная величина IV, распределённая по закону %2(п — 1); кроме того, будем считать, что \¥ и 2 — независимые случайные величины и величина 2 определена согласно (19). Тогда Ш € (—^7=-; ^7^ ) и
п ^ 3 можно определить случайную величину Кг(£) = Pn.it)л/Й^ — ^ с плотностью /уп(4).
Используя формулу (10), получаем, что интеграл в (27) равен
гоо
/ Лу (у) 1г {Рп (*) л/у) (1У = /к (4) (0) •
■)о
Поэтому соотношение (27) примет вид
что и требовалось доказать. □
Теперь, используя леммы 2 и 3, можно получить представление плотности /2? через функцию Эрмита.
Для этого найдём по формуле (12) плотность /уп(*)(0) для случая, когда
с = иа0 = /л,и подставим полученное выражение в (16). Легко убедиться,
что в результате формула (16) примет вид
__п —1
Dnq 2 (t)
1 -
raí
(га—l)2
О,
я_
t[X
га— 1
\/га га—1
л/га
(28)
га—2
где А, = ^ • (п - 1)) .
Покажем, что соотношения (9) и (28) для плотности (¿) совпадают. Для к = —п + 1 можно записать [7]
Я_
га+1
1
\ =
y/2q(t)' Г(п - 1) J0
ГОО ______^2 _|____2£д ^
Вводя новую переменную интегрирования у = 2<^2/£7(^), можно представить последнее соотношение в виде
п — 1 . .
V в 2—Г(п-1)./о
Поскольку
/•ОО
Jra(í) = /
Jo
(см. теорему 1), то равенство (29) принимает вид
Я_
га+1
72^)/ 2^+ Г(п — 1)
С учётом (30) соотношение (28) можно привести к виду
. га—4
(30)
Dn
га— 1
(га—I)2
о,
Если вернуться к обозначению (см. теорему 1
(п — I)2
Кп П^Т{^)\2 то легко убедиться в справедливости равенства
Поэтому соотношение (31) принимает вид соотношения (9). Откуда следует, что соотношения (9) и (28) совпадают.
2. Интегральные представления для мер мощности в случае, когда статистика критерия является статистикой отношения правдоподобия. Предположим, что выброс имеет сдвиг вправо в математическом ожидании и ту же дисперсию, что и остальные наблюдения в выборке. Это предположение часто считают правдоподобным приближением к действительности, поэтому его исследование наиболее интересно с практической точки зрения. Известно, что в такой ситуации статистика Сп становится статистикой отношения правдоподобия [5]. В этом случае параметр масштаба V = 1, в то время как параметр сдвига Л > 0. Поэтому соотношение (28) примет вид
/fr, (*)
VILf]
= ) n-lar.
1 -
nt
(га— l)2
H_r
■ra+1( 1*1 <V’ (32)
0, |f| > ^
где d,¡
_ Г(га— 1) 2 ,, _
___ (га— l)2
Г(2^2) ^
Подставив (32) в (3)—(6) и выполнив замену переменных х = (р,
получим следующие интегральные представления для мер мощности:
Pi(t) = <
1 — cL
1,
\fnt
/arcsin ——^
-7г/2
х cos™“3 ipH_n+i(On((p))dip, 0,
4= < t < / ,
Vn Vn
t >
л/п ’
n— 1 ^ ^ n— 1 .
\/ra '
n—1 .
П—1 .
1,
P2(i) = <
гтг/2
cos™ 3^Я_га+1(6'га(^))^, (34
/ • \/nt
/arcsin ——7
n —1
0,
dn [ 1 (s„(<p)) x
n —1
x cos™“3 ipH-n+i(en((p))dip,
p3(t) = *
гтг/2
л/гг£ «in -Ä-------
(Sra(^)) X
x cos™ <pH-n+i(9n(<p))d<p, 0,
0,
4 ,
t > *=l: л/п '
t >
гг—1.
гтг/2
p4(i) = <
¿га / (rra(i, ¥>)) X
/ - л/п£
</arcsin ——=-
n —1
X COS™-3 LpH_n+i(en(Lp))dLp, 0,
t >
П— 1
(33)
(35)
(36)
Здесь rn(t,p) = (^+tg^)’ Sra^ М < */2;
On{<p) = -^sin р.
Из соотношений (33) и (36) следует, что Vi € ^г)
Pi(t) = Sn(t, A) + P4(í)-
Здесь
г~
Sn(t, А) = 1 - dn / (rn(í, <£>)) eos™-3 ^Я_п+1(6»п(^))сг^ (37)
— величина отклонения.
Из условия (2) вытекает, что
Р^) - Р2® < Рг$) - Рз(г) < Р^) - Р4(*) = 6П(1, А).
Таким образом, величина ¿га(£, Л) на заданном уровне значимости а определяет максимально возможное отклонение вероятности обнаружить присутствие одиночного выброса в выборке (мера Р1) от вероятности его точного обнаружения (меры Р2~Р±)-
Из формулы (37) следует также, что 5П(Ь, Л) — убывающая функция аргумента t. Поскольку с ростом критических значений уровень значимости критерия уменьшается, то переход, например, от пятипроцентного уровня значимости к однопроцентному приведёт лишь к уменьшению величины 5П(Ь, А).
Легко проверить, что в области
Q=
п — 1 п — 2 ,1 ( 1(п — 1)(п — 2) \
'^^^Г’агс81П\/2(^ту <*><*/2 > (í/ = V-----^----)
имеем
г) 9 г) 9
Гп^, р) ^ —¡=г-1 8П(^)>^=.
\/П ~ 1 л/П - 1
Следовательно, с учётом (7) получим
Р^ЫЪр)) = 1, (¿,р)£<3-,
Pn-i (sn('-p)) = 1 (aresin _2^ < р < тг/2).
^ третья и четвёртая меры мощности совпадают со второй:
Поэтому для критических значений удовлетворяющих условию tf ^ t ^
леры мощности совпа^
Рз(*) = А (*) = Р2(£).
п tf a(n; tf) п tf a(n; tf)
4 0,87 0,8453 19 2,84 0,0109
5 1,10 0,6806 20 2,92 0,0079
6 1,29 0,5334 21 3,01 0,0058
7 1,46 0,4109 22 3,09 0,0042
8 1,62 0,3126 23 3,17 0,0030
9 1,76 0,2356 24 3,25 0,0022
10 1,90 0,1763 25 3,32 0,0016
И 2,02 0,1312 26 3,40 0,0011
12 2,14 0,0972 27 3,47 0,0008
13 2,25 0,0717 28 3,54 0,0006
14 2,36 0,0527 29 3,61 0,0004
15 2,46 0,0387 30 3,68 0,0003
16 2,56 0,0283 31 3,75 0,0002
17 2,66 0,0206 32 3,81 0,0002
18 2,75 0,0150 33 3,88 0,0001
Уровни значимости ск(п;£/) критерия, соответствующие критическим значениям tf, можно найти из условия
a(n;tf) = Р (Gn
> tf I но) = = 1
где значение Fn\tf) может быть найдено численно по формуле (7).
В таблице приведены результаты численных расчётов уровней значимости a(n]tf) для критических значений tf нулевого распределения статистики Gn в случае выборок объёмов п от 4 до 33.
Из таблицы видно, что на пятипроцентном уровне значимости для числа наблюдений 4 ^ п ^ 14 получаем
P2(Gcn]o,o5) = 0)05) = P4(G“0)05).
Для выборок объёмом 15 ^ п ^ 19 имеем
P^Gn-ofii) = P3(Gn;0yoi) = Pi(Gn-o,oi)-Для n ^ 20 можно записать
P^i.Gn;a<0,005) = ^МС^^оОб) = Pi (^га-оКО.ООб) •
Обычно исследователь использует «стандартные» уровни значимости (0,01 ^ а ^ 0,05), поэтому можно быть уверенным, что для выборок объёмом п ^ 20 имеет место строгое неравенство
P2(Gn;a) > P3(GZ,a) > , 0,01 < « < 0,05.
3. Численное моделирование. Полученные интегральные соотношения для мер (33)—(36) могут быть использованы для исследования чувствительности критерия Граббса к наличию в выборке одного выброса. Цель расчётов — продемонстрировать возможности практического применения мер мощности. Для этого был разработан алгоритм вычисления мер мощности по формулам (33)—(36). Определенные интегралы в мерах Р1—Р4 вычислялись приближенно по формуле Симпсона, при этом значения функции распределения F^2i(x) ВЫЧИСЛЯЛИСЬ рекурсивно ПО формуле (7), ПЛОТНОСТИ frp (t) — по формуле (28). Алгоритм вычисления мер мощности Р1—Р4 был реализован на языке программирования Object Pascal.
Численные расчёты мер Р1—Р4, а также отклонения 5п были выполнены для случая нормально распределенной выборки, в которой присутствовал выброс с параметрами Л > 0 и v = 1.
На рис. 1 представлены результаты численных расчётов меры Р\(Ьсг) по формуле (33) для выборок объёмом п от 5 до 100 и значений параметра Л от 1 до 5. Величина ¿сг была выбрана равной критическому значению статистики Сп на стандартном уровне значимости а = 0,05, т. е. ¿сг = С^.005. Мера Pl(íсг)) таким образом, равна вероятности не совершить ошибку второго рода на пятипроцентном уровне значимости. Как и следовало ожидать в соответствии с общей теорией вопроса, для выборки фиксированного объёма с ростом параметра Л наблюдалось увеличение мощности критерия. Из рис. 1 видно, как мера Р\(1;сг) возрастает с ростом параметра сдвига Л для разных значений п. Вероятность не совершить ошибку второго рода, т. е. обнаружить присутствие аномального наблюдения в выборке объёма п, мала для Л ^ 2 и близка к 1 для А ^ 4.
Видно также, что вероятность обнаружить присутствие выброса в выборке из 20 наблюдений практически не отличается от вероятности обнаружить его присутствие в выборке из 100 наблюдений.
Рис. 1. Графики зависимости первой меры мощности Р^сг) от объёма выборки те для значений Л от 1 до 5 (£сг = С“0,об)
Рис. 2. Графики зависимости отклонения <5п(£сг,А) от Л для объёмов выборок те от 5 до 100 (£сг = С^г;о,об)
На рис. 2 представлены результаты численных расчётов по формуле (37) величины отклонения 5n(tCT,X) = Pi (ter) — Pi(icr) для случая, когда в нормально распределенной выборке объёма п имеется выброс с параметром сдвига Л. Видно, что при фиксированных уровне значимости а и объёме выборки п величина отклонения 5п является убывающей функцией параметра сдвига Л. Если не менять параметр сдвига Л и уровень значимости а, то увеличение числа наблюдений п будет приводить к росту отклонения 5п.
Из рис. 2 видно также, что выборка объёма п = 20 может считаться более предпочтительной для исследователя, чем, например, объёма п = 50 или п = 100; при переходе от п = 20 к п ^ 50 мера Р\ меняется незначительно (см. рис. 1), однако отклонения от нее мер -Р2--Р4 могут существенно вырасти.
Заключение. Получено новое представление для закона распределения стьюдентизированного отклонения выброса от среднего в нормально распределенной выборке, основанное на использовании функции Эрмита с отрицательным целым значком. Это представление было использовано для получения интегральных представлений мер мощности Дэйвида Р\-Ра критерия Граббса в случае, когда статистика критерия является статистикой отношения правдоподобия. При этом нулевой гипотезой Hq служило предположение о том, что выборка из п наблюдений случайно извлечена из нормальной N(a]tт2) генеральной совокупности. Конкурирующая гипотеза Н\ состояла в том, что в выборке имеется одно аномальное наблюдение Xout с распределением N(a + Xa] а2). Определена область критических значений статистики Граббса, в которой меры мощности Дэйвида Р2-Р4, предназначенные для обнаружения выброса, совпадают. Получена формула для вычисления максимально возможного отклонения мер мощности Дэйвида, предназначенных для обнаружения выброса, от классической функции мощности критерия. Выполнены модельные расчёты классической функции мощности критерия для случая нормально распределенной выборки с выбросом, отличающимся от остальных наблюдений сдвигом вправо. Результаты вычислений оказались близки к теоретически ожидаемым.
Автор выражает искреннюю благодарность профессору Олегу Александровичу Репину за помощь и поддержку, оказанные им при работе со специальными функциями.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. David Н. A. Order Statistics: 2nd ed. / Wiley Series in Probability and Mathematical Statistics. New York: John Wiley & Sons, 1981. xiii+360 pp.; русск. пер.: Дэйвид Г. Порядковые статистики. М.: Наука, 1979. 336 с.
2. Grubbs F. Е. Sample criteria for testing outlying observations // Ann. Math. Statistics, 1950. Vol. 21, no. 1. Pp. 27-58.
3. Ширяева Л. К. Вычисление мер мощности критерия Граббса проверки на один выброс // Сиб. журн. индустр. матем., 2010. Т. 13, №4. С. 141-154. [Shiryaeva L. К. Calculation о! power measures ol the Grubbs test for one outlier // Sib. Zh. Ind. Mat., 2010. Vol. 13, no. 4. Pp. 141-154].
4. Zhang J., Kerning Y. The null distribution ol the likelihood-ratio test for one or two outliers in a normal sample // Test, 2006. Vol. 15, no. 1. Pp. 141-150.
5. Barnett V., Lewis T. Outliers in statistical data: 3nd ed. / Wiley Series in Probability and Mathematical Statistics: Applied Probability and Statistics. Chichester: John Wiley & Sons, 1994. xviii+584 pp.
6. Айвазян С. А., Мхитарян В. С. Теория вероятностей и прикладная статистика. Т. 1. М.:
Юнити-Дана, 2001. 656 с. [Aivazian S. A., Mkhitarian V. S. Applied Statistics and Essentials of Econometrics. Vol. 1. Moscow: Yuniti-Dana, 2001. 656 pp.]
7. Лебедев H. H. Специальные функции и их приложения. М.: Физ.-мат. лит., 1963. 358 с. [Lebedev N. N. Special functions and their applications. Moscow: Fiz.-Mat. Lit., 1963. 358 pp.]
Поступила в редакцию 24/VI/2012; в окончательном варианте — 07/IX/2012.
MSC: 56U78
THE USE OF HERMITE SPECIAL FUNCTIONS FOR INVESTIGATION OF POWER PROPERTIES OF GRABBS STATISTICS
L. K. Shiryaeva
Samara State Economic University,
141, Sovetskoy Armii St., Samara, 443090, Russia.
E-mail: shiryeva_lk@mail. ru
We consider a normal sample with a single upper outlier. A distribution of studentized form of outlier’s deviation from, the sample mean is obtained,. This distribution, uses Hermite special functions with, negative integer-valued index. The integral relationships for David’s power measures of Grubbs criteria are obtained,. We discuss the case, when, Grubbs statistic is the likelihood-ratio statistic. We find the maximal deviation of power function for Grubbs criteria from, the probability that the contaminant is the outlier and, it is identified as discordant. We receive the region of critical values of Grubbs statistic, where the second power measure of David equals to the third, and, forth power measures of David. We make calculations of power function for Grubbs criteria in the case of normal samples with, a single upper outlier with, the right shift. The results of calculations are similar to the theoretically expected facts.
Key words: outlier, Grubbs statistics, Hermite special function, David’s power measures for Grubbs criterion, normal distribution, law.
Original article submitted 24/VI/2012; revision submitted 07/IX/2012.
Ludmila K. Shiryaeva (Ph.D. (Phys. & Math.)), Associate Professor, Dept, of Mathematic Statistics and Econometrics.