УДК 519.23
Вестник СПбГУ. Сер. 1, 2009, вып. 4
ОБ АСИМПТОТИЧЕСКОЙ ЭФФЕКТИВНОСТИ КРИТЕРИЕВ НОРМАЛЬНОСТИ, ОСНОВАННЫХ НА СВОЙСТВЕ ШЕППА*
К. Ю. Волкова1, Я. Ю. Никитин2
1. С.-Петербургский государственный университет, аспирант, [email protected]
2. С.-Петербургский государственный университет, д-р физ.-мат. наук, профессор, [email protected]
1. Введение
Нормальный закон занимает центральное место в теории вероятностей и математической статистике, а статистические модели, связанные с нормальными наблюдениями, постоянно встречаются в прикладных областях. Поэтому проверка нормальности принадлежит к числу важнейших задач проверки статистических гипотез.
Нормальное распределение имеет множество характеризаций, о которых можно судить по монографиям [1, 2] и [3]. Первая в истории характеризация нормального закона была найдена Пойа [4]: пусть X и У — независимые и одинаково распределенные случайные величины с нулевым средним; X и (Х-\-У)/\/2 имеют одинаковое распределение тогда и только тогда, когда X и У нормально распределены с некоторой положительной дисперсией. Впоследствии эта характеризация была обобщена на линейные комбинации случайных величин [1, 2].
Критерии нормальности, основанные на характеризации Пойа и ее обобщениях, были представлены в [5] и [6], где рассматривался интегральный критерий, а также в [7] и [8], где был предложен критерий типа Колмогорова. Для этих критериев использовалась идея построения и - или У-статистических функций распределения (ф.р.). Оказалось, что их локальная асимптотическая эффективность по отношению к естественным параметрическим альтернативам (сдвиг, скошенность, загрязнение) довольно высока, а критерии перспективны для использования.
В 1964 г. Шепп показал [9], что если X и У —две независимые нормальные случайные величины со средним нуль и некоторой дисперсией т2 > 0, то и случайная величина '¿ХУ/^/Х2 + У2 имеет снова распределение Л/"(0, г2). Это утверждение обычно называют свойством Шеппа. В 2003 г. было доказано [10], что с указанным свойством связана характеризация нормального закона в широком классе распределений. Рассмотрим ф.р. Г из класса Т, определяемого условиями 0 < Г(0) < 1 и тем, что Г(х) — Г( — х) регулярно меняется в нуле с показателем 1. Доказано [10] следующее утверждение.
Пусть X и У — независимые случайные величины с общей ф.р. Г из класса Т. Тогда равенство по распределению
2 ХУ/\/Х2 + У2 = X
имеет место в том и только том случае, когда X £Е N(0, т2) для некоторой дисперсии т2 > 0. Эта характеризация позволяет нам построить новые критерии нормальности, основанные на свойстве Шеппа.
* Работа выполнена при финансовой поддержке РФФИ (грант №07-01-00159) и Совета по грантам Президента РФ для государственной поддержки молодых российских ученых и ведущих научных школ (грант № НШ-638.2008.1).
© К. Ю. Волкова, Я. Ю. Никитин, 2009
Пусть Х\,... , Xn —независимые наблюдения с нулевым средним и ф.р. а — обычная эмпирическая ф.р., построенная по этим наблюдениям. Нас интересует проверка сложной гипотезы Но : ^ £ N(0,т2) против альтернативы Н\, при которой ^ еТ, но гипотеза Но неверна. Обозначим для краткости к(х, у) = 2ху/^х2 + у2 и построим ^-эмпирическую ф.р. Оп и и -эмпирическую ф.р. Нп [11, § 1.4], [12] с помощью формул
п
сп(£) = п-2^ X,) <г}, t е д1, Нп(г) = (сП)-1 £ 1{к(хихй) <*}, * е д1.
1<г<3<п
Построим две новые статистики для проверки нормальности. Первая из них 1ип — интегральная, имеет вид
Шп = / (Оп(£) - Fn(t))dFn(*). (1)
Эта статистика, как легко видеть, асимптотически эквивалентна и -статистике степени 3 с центрированным ядром
у, г) = ^ (1 {к{х, у) <г} + 1{к(х, г) < у} + 1{к{у, г) < х}) - (2)
Другая статистика колмогоровского типа Вип основана на равномерном расстоянии:
Вип = вир |Нп(*) - Fn(t)|. (3)
геп1
Она является супремумом семейства и-статистик и устроена сложнее. Представляет интерес асимптотическое исследование новых критериев нормальности, основанных на последовательностях статистик 1ип и Вип.
Мы опишем предельные распределения и большие уклонения обеих последовательностей статистик при гипотезе Но и вычислим их локальную бахадуровскую эффективность при ряде альтернатив. При этом будем пользоваться необходимыми сведениями из теории и -статистик и теории асимптотической эффективности по Бахадуру [11, 13].
2. О предельных распределениях
Обе статистики 1ип и Пип при нулевой гипотезе инвариантны относительно изменения масштаба, и поэтому мы вправе считать, что т =1. Обозначим через Ф функцию распределения стандартного нормального закона.
Как известно [11], невырожденные и - и ^-статистики асимптотически нормальны. Вычислим прежде всего проекцию ядра (2). Зафиксируем x. Тогда
'ф(х) : = E(Ф(X,Y,Z)|Х = х) =
= ^ (Р(к(х, У) < г) + Р(к(х, г) < У) + ¥(к(У, г) <х))-^.
Поскольку функция к^, у) нечетна по у, первые две вероятности в правой части одинаковы и легко вычисляются:
¥(к(х,г) < У) = ¥(к(х,У) < г) = 1 - [ ф(к(х,у)))(1ф(у) = -.
./п1 2
Далее, Р(к(У, Z) < x) = Ф(х) по свойству Шеппа. Поэтому проекция ядра Ф имеет вид ф(х) = 1/3(Ф(х) — 1/2). Следовательно, дисперсия этой проекции есть а2 = /Д1 ф2(х)3,Ф(х) = 1/108.
Таким образом, ядро (2) невырождено. По теореме Хёффдинга (см. [11, Теор. 4.2.1])
л/12п (^1ип — ^ ^ЛА(ОД).
2
Теперь рассмотрим статистику колмогоровского типа (3). В этом случае при фиксированном Ь разность Нп(Ь) — Гп(Ь) есть и-статистика с ядром
Е(х,у-г) = 1{к{х,у) <г}~ 1-(1{х < г} + 1{у < *}),
зависящим от Ь £ Я1. Проекция этого ядра имеет вид
£(ж;г) := Е(Е(Х,У;г)\Х = х) = Р(к(х,У) < ¿) - ^(1{х < ¿} + Ф(»).
Далее, найдем Р(к(х, У) < Ь). Для любых х,Ь £ Я1 получаем
0, если Ь < —2|х|; Ф (¿|ж|/л/4ж2 - г
1, если Ь > 2|х|.
Р ^ ^у2 < *) = | Ф > если " 2\х\ ^ t ^ 2|х|; (4)
Таким образом, при фиксированном Ь проекция ядра ^(х, у; Ь) выглядит следующим образом:
{ —1/2(1{х <Ь} + Ф(Ь)), если Ь < —2|х|;
Ф (¿|ж|/л/4ж2 - г2) - 1/2(1{ж < ¿} + Ф(»), если - 2\х\ < г < 2|ж|;
1 — 1/2(1{х <Ь} + Ф(Ь)), если Ь > 2|х|.
Математическое ожидание проекции E£(X; Ь) равно нулю при любом Ь. Отсюда получаем два полезных тождества:
■С Ф (у/4^- С ) *'Ф(1) = + Ф(" " 2Ф(</2))' ' (5)
Используя (5) и (6), вычислим теперь дисперсию проекции а|(Ь) := E£2(X;Ь) отдельно для Ь > 0 и Ь < 0,. Получим
'2 Ф2 (¿ж/л/4ж2 -г2) ¿Ф(х) - ¡*/2 Ф (¿ж/л/4ж2 -¿2) сЩх)-— 1/4Ф(Ь) — 1/4Ф2(Ь) + Ф(Ь/2) — 1/2, если Ь > 0; 2 /~/2 Ф2 (¿ж/л/4ж2 -г2) ¿Ф(х) - Ф (¿ж/л/4ж2 -¿2) ЙФ(ж)+ +1/4Ф(Ь) — 1/4Ф2(Ь), если Ь < 0.
(Ь) =
С помощью (5) и (6) нетрудно показать, что функция <r|(t) —четная. На рис. 1 показан график функции <r|(t) при t > 0, откуда видно, что функция всюду положительна и монотонно убывает.
Поэтому наше семейство ядер S(x, y; t) невырождено в смысле [7, 8], и supieR (t) = о"|(0) = 1/16. Это значение понадобится нам ниже для вычисления асимптотики больших уклонений.
Предельное распределение статистики DUn не известно. Опираясь на методы работы [14], можно показать, что U-эмпирический процесс
Vn(t) = V^(#„(*) - Fn(t)), teR\
слабо сходится при n ^ ж к некоторому центрированному гауссовскому процессу n(t) со сложной ковариацией. Тогда последовательность статистик \fn,DUn сходится по распределению к величине supt |n(t)|, найти распределение которой не представляется возможным. Поэтому критические значения для статистик DUn целесообразно искать с помощью моделирования их выборочного распределения.
3. Большие уклонения и локальная эффективность статистик IUn
Переходим к анализу логарифмических больших уклонений последовательностей статистик (1). Ядро Ф не только центрировано и невырождено, но и ограничено. Поэтому по теореме о больших уклонениях невырожденных U -и V-статистик из [15] получаем при а > 0
lim n-1 lnP(IUn > а) = —f (а),
n—
где функция f непрерывна при достаточно малых а > 0, причем
f (а) = 6а2(1 + o(1)) при а ^ 0.
Теперь предположим, что альтернатива сдвиговая, так что при Hi наблюдения меняются на Xi + в с ф.р. Ф(х — в), в > 0. По закону больших чисел для U-статистик [11]
предел по вероятности статистик IUn при альтернативе имеет вид
Ьш(в) = Р e(k(X,Y) < Z)- \ = \- ( [ Ф (к(х,у) - в)сЩх - в)сЩу
2 2 Jrn J д1
Поскольку Ф(t — в) = Ф(t) — e^(t) + о(в), а y(t — в) = y>(t) + %>(t) + о(в), biu(в) — в / y))^(x)<£>(y)dxdy.
JrW R1
Последний интеграл легко вычисляется с помощью перехода к полярным координатам и равен Таким образом, локальный точный наклон [13, Гл. 1] последовательности статистик IUn при в ^ 0 допускает представление ciu (в) — 12b|u (в) — 3/пв2 - 0.955 в2.
Точный наклон в теории Бахадура является мерой асимптотической эффективности. Для точных наклонов имеется теоретическая верхняя граница 2K(в) в терминах расстояния Кульбака—Лейблера K(в) между Ho и Hi, (см. [13, Гл. 1]). Эта граница при проверке сложной гипотезы нормальности для альтернативы сдвига вычислена в [5]. Оказывается, что 2K(в) — в2 при в ^ 0. Следовательно, локальная точная бахадуров-ская эффективность нашего критерия весьма высока:
eS(IU) := lim ( = - « 0.9549.
v у е^о \ 2 К (в) J 7г
Теперь рассмотрим скошенную альтернативу в смысле Аззалини [16]. В этом случае наблюдения имеют плотность 2<^>(х)Ф(вх), в > 0, х £ Д1. Вычисления дают
Рв(Л(Х,У) <Z)-\ = \-
г г ( г k(x,v) \
— [ 2^(,г)Ф(в,г)Лг 2^(х)Ф(вх)2^(у)Ф(ву)йхйу.
J R1 J R} \J-<x J
Поскольку 2Ф(6>х) = 1 + у/2/тгхв + о(6>), при 6^0 получаем
Щк(Х, Y)<Z)-±~J- [ [ ф{х, y)MxMy)dxdy в. 2 V п JriJ R1
Интеграл в правой части был вычислен выше. Таким образом, Ь/[/(0) ~ 1/{ил/2)в, так что локальный точный наклон допускает представление ciu (в) — 6/п2в2, в ^ 0. Верхняя граница 2K(в) для точных наклонов при скошенной альтернативе известна из [5], где доказано, что 2K(в) — 2/пв2. Следовательно, локальная бахадуровская эффективность нашего критерия для скошенной альтернативы снова равна 3/п « 0.9549.
В качестве третьего примера вычислим локальную эффективность для альтернативы загрязнения с функцией распределения наблюдений
G(x, в) = (1 — в)Ф(х) + вФ2(х). (7)
Опуская вычисления, которые похожи на вычисления в двух предыдущих примерах, но требуют численного интегрирования, получаем, что biu (в) — 0.1667 в. Следовательно,
локальный точный наклон при в ^ 0 допускает представление вщ(в) ~ 0.3334 в2. Известно [17], что 2K(в) ~ 4/5 в2. Поэтому локальная бахадуровская эффективность нашего критерия для альтернативы загрязнения равна 0.4167.
4. Большие уклонения и локальная эффективность статистик DUn
Очевидно, что семейство ядер |S(x, y; t)},t G R1, не только центрировано, но и ограничено. Поэтому по теореме о больших уклонениях супремума семейства U-статистик (см. [7, Теор. 2.4], [8, Теор. 5]) получаем
lim n-1 lnP(Dn > а) = -f (а),
n—
где функция f непрерывна при достаточно малых а > 0, причем
f (а) = 2а2(1 + o(1)) при а ^ 0.
Теперь снова предположим, что альтернатива сдвиговая. По теореме Гливенко— Кантелли для U-статистических ф.р. [12] предел DUn по вероятности равен Ь^и(в) = supt |Рg(k(X,Y) < t) — - 0)|. Формула для Рe(k(X,Y) < t) при сдвиге выглядит сложнее, чем (4). Обозначим для краткости Г(ж, t; <5) = Ф (ix/V4ж2 — t2 + 5) . Тогда можно записать
Pe(k(X,Y) < t) = Ф(t/2 - в) - Ф(—1/2 - в)+
+ J Q (Г(х, t; в) + Г(ж, t; -в)) + Ф(-в) - ^ dФ(х - в)+
+ J t/2
Выделяя главную часть этого выражения при в ^ 0 и фиксированном t, получаем с учетом (5) и (6), что Рe(k(X,Y) < t) = $(i) + о(в), в —>■ 0. Стало быть, при в —> 0 имеем Ъии{д) ~ в/(^/2тг). Поэтому локальный точный наклон допускает представление спи (в) ~ 2/пв2 ~ 0.6366 • в2. Как и в случае интегральной статистики, для альтернативы сдвига 2K(в) ~ в2 при в ^ 0. Следовательно, локальная бахадуровская эффективность нашего критерия равна 2/п к 0.6366.
Для скошенной альтернативы вычисления очень похожи. Получаем, что при любом t и в ^ 0
Рe{k{X, Y) <t) — ф(г - 0) ~ -e-i2/2,
п
так что Ьпи(в) ~ в/п, в ^ 0. Поэтому локальный точный наклон при в ^ 0 имеет вид CDU (в) ~ 4/п2в2. Как и в случае интегральной статистики, для альтернативы Аззалини 2K(в) ~ 2в2/п при в ^ 0. Следовательно, локальная бахадуровская эффективность нашего критерия снова равна 2/п к 0.6366.
В случае альтернативы загрязнения с функцией распределения наблюдений (7) имеем после ряда вычислений
Pe(k(X,Y) <t) - Ф(t - в) = в (Ф^) - Ф2(t)) + о(в),
в результате чего получаем Ьпи(в) ~ в/4, в ^ 0. Поэтому для локального точного наклона справедливо соотношение cdu(в) ~ в2/4. Как и в случае интегральной статистики, для альтернативы загрязнения 2K(в) ~ 4/5в2 при в ^ 0. Следовательно, локальная бахадуровская эффективность нашего критерия равна 0.3125.
Интересно отметить, что эффективности наших двух критериев для сложной гипотезы Ho о нормальности при сдвиговой альтернативе (соответственно 3/п и 2/п) совпали с эффективностями при той же альтернативе классических критериев, основанных на статистиках и статистике Колмогорова, при проверке простой гипотезы о стандартной нормальности [13, §2.6]. Было бы интересно найти теоретическое объяснение этого эмпирического наблюдения.
Литература
1. Bryc W. Normal distribution: characterization with applications // Lecture Notes in Statistics. Vol. 100. Springer, Berlin. 1995. 122 p.
2. Каган А. М., Линник Ю. В., Рао С. Р. Характеризационные задачи математической статистики. М.: Наука, 1972. 656 с.
3. Mathai A. M., Pederzoli G. Characterizations of the Normal Probability Law. New York: Wiley, 1977. 150 p.
4. Poly a G. Herleitung des Gauss'schen Fehlergesetzes aus einer Funktionsalsgleichung // Math. Zeitschrift. 1923. Vol. 18. P. 96-108.
5. Muliere P., Nikitin Ya. Yu. Scale-invariant test of normality based on Polya's characterization // Metron. 2002. Vol.60. N1-2. P. 21-33.
6. Литвинова В. В., Никитин Я. Ю. Два семейства критериев нормальности, основанных на характеризации Пойа, и их асимптотическая эффективность // Записки научных семинаров ПОМИ. 2005. Т. 328. С. 147-159.
7. Nikitin Ya. Yu. Large deviations of U-statistical Kolmogorov-type tests and their efficiency // Journ. Nonparam. Statistics. 2009. В печати.
8. Nikitin Ya. Yu. U-statistical Kolmogorov—Smirnov tests: large deviations and asymptotic efficiency// Proceedings of ISNI2008 (International Seminar on Nonparametric inference) / Ed. by J. C. Fernandez-Pardo and J. de Una-Alvarez. Vigo, 2008. P. 138-142.
9. Shepp L. Normal functions of normal random variables // SIAM Rev. 1964. Vol. 6. P. 459-460.
10. Galambos J., Simonelli I. Comments on a recent limit theorem of Quine // Statistics and Probability Letters. 2003. Vol. 63. P. 89-95.
11. Королюк В. С., Боровских Ю. В. Теория U-статистик. Киев: Наукова Думка, 1989. 384 с.
12. Janssen P. L. Generalized empirical distribution functions with statistical applications. Limburgs Universitair Centrum. Diepenbeek. 1988. 154 p.
13. Никитин Я. Ю. Асимптотическая эффективность непараметрических статистических критериев. М.: Наука, 1995. 240 c.
14. Silverman B. W. Convergence of a class of empirical distribution functions of dependent random variables // Ann. Probab. 1983. Vol. 11. P. 745-751.
15. Никитин Я. Ю., Поникаров Е. В. Грубая асимптотика вероятностей больших уклонений черновского типа для функционалов Мизеса // Труды С.-Петерб. матем. об-ва. 1999. Т. 7. С. 124-167.
16. Azzalini A. A class of distributions which includes the normal ones // Scand. J. Stat. 1985. Vol. 12. P. 171-178.
17. Литвинова В. В. Асимптотические свойства критериев симметрии и согласия, основанных на характеризациях. Дис. ... канд. физ.-мат. наук. С.-Петерб. гос. ун-та. 2004. 138 c.
Статья поступила в редакцию 14 апреля 2009 г.