Научная статья на тему 'О распределениях рекордных размахов в нестандартных ситуациях'

О распределениях рекордных размахов в нестандартных ситуациях Текст научной статьи по специальности «Математика»

CC BY
53
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕКОРДНЫЕ ВЕЛИЧИНЫ / ВЫБОРОЧНЫЕ РАЗМАХИ / РЕКОРДНЫЕ РАЗМАХИ / ЭКСПОНЕНЦИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / РАСПРЕДЕЛЕНИЕ ЛАПЛАСА / ГЕОМЕТРИЧЕСКОЕ РАСПРЕДЕЛЕНИЕ / RECORD VALUES / SAMPLE RANGES / RECORD RANGES / EXPONENTIAL DISTRIBUTION / LAPLACE DISTRIBUTION / GEOMETRIC DISTRIBUTION

Аннотация научной статьи по математике, автор научной работы — Бельков Игорь Владимирович

Исследуются распределения и свойства рекордных размахов, построенных по исходным последовательностям случайных величин, имеющих распределение Лапласа или смесь геометрических распределений на положительной и отрицательной полуосях. Получены соответствующие характеризации этих распределений. Библиогр. 9 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON DISTRIBUTIONS OF RECORD RANGES IN NONSTANDARD SITUATIONS

The record theory is an important part of the probability theory and mathematical statistics and has many applications in various fields of knowledge. Most of the known methods deal with the standard model (when the initial random variables are independent and identically distributed). However, various nonstandard models also show some practical interest. In this article, a number of results for distributions and properties of record ranges and sample ranges are obtained for initial sequences of random variables in some nonstandard situations, namely when the variables of the initial sequence have the Laplace distribution or the mixture of two geometric distributions on the positive and negative semi-axes. The converse problem is also investigated, namely: the aforementioned distributions can be characterized by independency of W (1) and W (2) W (1), where W (1), W (2),... are sample ranges in the sequences of initial random variables, if the constant X0 = 0 is added before the initial sequence. Refs 9.

Текст научной работы на тему «О распределениях рекордных размахов в нестандартных ситуациях»

УДК 519.2 МЯО 62030

Вестник СПбГУ. Математика. Механика. Астрономия. 2017. Т. 4 (62). Вып. 3

О РАСПРЕДЕЛЕНИЯХ РЕКОРДНЫХ РАЗМАХОВ

В НЕСТАНДАРТНЫХ СИТУАЦИЯХ

И. В. Бельков

Санкт-Петербургский государственный университет,

Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7—9

Исследуются распределения и свойства рекордных размахов, построенных по исходным последовательностям случайных величин, имеющих распределение Лапласа или смесь геометрических распределений на положительной и отрицательной полуосях. Получены соответствующие характеризации этих распределений. Библиогр. 9 назв.

Ключевые слова: рекордные величины, выборочные размахи, рекордные размахи, экспоненциальное распределение, распределение Лапласа, геометрическое распределение.

Введение. Рассмотрим последовательность независимых случайных величин (с. в.) Х1, Х2,... с общей функцией распределения (ф. р.) — (ж). В этой последовательности можно определить порядковые статистики:

Х1,п < Х2,„ < ... < Х„,П) п =1, 2,....

Верхними рекордными моментами называются величины, которые задаются следующим образом [1-3]:

Ь(1) = 1, Ь(к + 1) = тт{.? > £(к) : Х^- >М(£(&))}, к = 1, 2,...,

где М(п) = Х„,„ = тах{Х1, Х2,..., Хп}, п =1, 2,...

Аналогично определяются нижние рекордные моменты:

1(1) = 1, /(к + 1) =тт{.? >/(к) : Х^- < ш(/(к))}, к = 1, 2,...,

где т(п) = Х;[,п = т1п{Х1, Х2,..., Хп}, п =1, 2,...

Рекордными величинами называются величины Х(п) = Хд„) = М(Ь(п)),п = 1, 2, ... (верхние рекордные величины) и ж(п) = жг(„) = т(/(п)), п = 1, 2,... (нижние рекордные величины). Исследование рекордных величин началось с работы Чендле-ра [4] в 1952 году.

В 1925 году в работе [5] было введено понятие выборочного размаха, а в 1984 году в работе [6] — понятие рекордных размахов. Выборочным размахом называется разность верхней и нижней порядковых статистик среди т величин: Шт = Хт,т — Х1,т; увеличенным выборочным размахом [7] — выборочный размах в последовательности, к которой в качестве первого члена присоединена величина Хо = 0. Рекордными размахами Ш(п), п = 0,1, 2,..., называются строгие верхние рекорды в последовательности выборочных размахов.

В работе [6] и монографиях [2, 8] используется нумерация рекордных размахов с нуля: Ш(0) = Ш1 = 0. В этом случае плотность распределения рекордного размаха Ш(п) для абсолютно непрерывного распределения с плотностью /(ж) и ф.р. —(ж)

(¡5 Санкт-Петербургский государственный университет, 2017 БОТ: 10.21638/11701/врЪи01.2017.303 387

имеет вид

2п

1ш(п)Н= / /(т + и)/(и)[-\п(1 -Р(т + и) + Р(и))]п-Чи.

(п ^ „/

В данной статье рассматриваются некоторые вопросы, связанные с распределениями рекордных размахов. При этом выборочные размахи предполагаются увеличенными: перед последовательностью ставится величина Хо = 0. Тогда можем записать Ш(0) = 0, Ш(1) = |Х^.

Известны следующие соотношения для экспоненциального распределения.

Пусть независимые с. в. 2., 22,... имеют ф.р. И.(х) = тах{0,1 — е-х}. Обозначим через Z(1) < Z(2) < ... верхние рекордные величины в этой последовательности. Тогда при любом п = 1, 2,... для величин Z(1), Z(2),... справедливо соотношение

{2(1), 2(2),..., 2(п)} = & + £2,..., & + 6 + ... + £п-1 + £п},

где £1, £2,..., £п — независимые с. в., имеющее стандартное экспоненциальное распределение с ф. р. ^(х) = 1 — х > 0.

В статье [9] получены аналогичные результаты для рекордных размахов в последовательности случайных величин с функцией распределения Ир(х), где

Ир(х) = (1 — р)ех при х < 0 и Ир(х) = 1 — ре-х при х > 0.

В частности, при р = 0,5 имеем стандартное распределение Лапласа с плотностью

/ (х) = е-|х|/2.

Утверждение 1. Пусть величины Х1, Х2,..., Хп,... имеют 'распределение с ф.р. Ир(х). Пусть Ш(0),Ш(1),Ш(2),... —строгие верхние рекорды в последовательности увеличенных выборочных размахов. Тогда разности рекордных размахов Ш(к +1) — Ш(к), к = 0,1,..., независимы и имеют стандартное экспоненциальное Е( 1 )-распределение.

Основные результаты. Рассмотрим теперь задачу, обратную предыдущей. Известно, что разности размахов независимы. Каковы распределения исходных величин?

Утверждение 2. Пусть известно, что Х1,Х2,... —независимые одинаково распределенные с. в., имеющие симметричное распределение, плотность р(х) = р(—х) и непрерывную ф.р. ^(х). Пусть Ш(0),Ш(1),Ш(2),... —рекордные размахи (увеличенные) в последовательности {Хи}. Если Ш(1) и Ш(2) — Ш(1) независимы, то Хи имеют распределение Лапласа со следующей ф. р.:

V, х <0.

Величину в-Х будем обозначать через

Доказательство. Величина Ш(1) = |Х1| имеет распределение с плотностью 2р(х), х > 0.

Ввиду симметрии распределения величин Хи можно, не умаляя общности, считать, что Х1 > 0.

Пусть величина Х1 имеет значение и > 0. Тогда Ш(1) = и, и Ш(2) зависит от первой величины в последовательности, не входящей в отрезок [0;и]. Обозначим ее через У. Тогда Ш(2) = У, если У > и, и Ш(2) = и — У, если У < 0.

Найдем распределение величин Y и W(2). Плотность распределения Y составляет

p(x)

если ж < 0 или х > и. (2)

Знаменатель дроби (2) представляет собой вероятность того, что значение величины Х1 не принадлежит промежутку [0; и].

Отсюда можно найти плотность распределения Ш(2) при фиксированном и. Она имеет вид

р(ж) + р(ж — и)

--т^-1 если х > и.

Плотность распределения Ш(2) — Ш(1) при фиксированном Ш(1) = и составляет р(ж) + р(ж + и)

-:-, если ж > 0.

Чтобы убедиться в независимости Ш(1) и Ш(2) — Ш(1), следует проверить равенство

Р{Ш(1) < а, Ш(2) — Ш(1) <6} = Р{Ш(1) < а}Р{Ш(2) — Ш(1) < 6} или доказать справедливость соотношения

Р{Ш(2) — Ш(1) < 6|Ш(1) = а} = Р{Ш(2) — Ш(1) < 6}, (3)

где а, 6 > 0.

Находим левую часть (3):

, s -, Гп (p(x) + p(x + a))dx / %

Р{1У(2) - < 6|^(1) = а} = Jo ^ J 2 ' - (4)

2 + Ja Р(Ч<Я

Правая часть (4) не должна зависеть от а. Устремим а к нулю; тогда в пределе получим 2 /0р(ж)^ж.

Отсюда для любого а > 0 имеем равенство

^ (р(ж) + р(ж + а))йж

70 ' —^—-— = 2 / »(жЫж. i + /a+Mp(i)A Уо

Это равенство можно преобразовать следующим образом:

/• b /•/• b

/ p(x + a)dx = 2 / p(i)dH p(x)dx. ./0 A -/о

Приходим к соотношению

Р(а + 6) - Р(а) = 2(1 - Р(а)) (р(Ь) - ,

что равносильно равенству

1 — Р (а + 6) = 2(1 — Р (а))(1 — Р (6)),

справедливому для любых а > 0, 6 > 0. Обозначим С(х) =2 — 2Р(х), тогда можем записать С(а + 6) = С(а)С(6). Известно, что среди непрерывных функций этим свойством обладает только показательная функция: С(х) = где ^ > 0.

Отсюда можно вывести равенство Р(х) = 1 — для неотрицательных х, где 0 < ^ < 1. По симметрии распределения имеем соотношение Р(х) = ^,-х/2 для отрицательных х. Обозначим Л = — 1п Тогда будем иметь = е-Лх. Получаем, что Р(х) — функция распределения Лапласа, определенная формулой (1), что и требовалось доказать.

Рассмотрим теперь случай дискретных распределений.

Утверждение 3. Пусть величины Х1, Х2,..., Хп имеют смесь двух распределений—геометрического (с весом в € [0; 1]) и геометрического на отрицательной полуоси (с весом г = 1 — в), а именно:

Р {Хй =0} =0, Р {Хй = п} = дрп-1в Р {Хй = —п} = дрп-1г

(п € Ы, р + д = 1, г + в = 1).

Пусть Ш(0),Ш(1),Ш(2),... —строгие верхние рекорды в последовательности увеличенных выборочных размахов.

Тогда разности рекордных размахов Ш(к + 1) — Ш(к), к = 0,1,..., независимы и имеют геометрическое распределение:

Р{Ш(к +1) — Ш(к) = 1} = др1-1, 1 = 1, 2,...

Доказательство. Очевидно, что величина Ш(1) = |Х1| имеет геометрическое распределение: Р{Ш(1) = п} = дрп-1, п =1, 2,...

Обозначим Ми = тах(0, Х1,..., Х^{н)), ти = тт(0, Х1,..., Х^{н)), где Р(к), к = 1, 2,..., — соответствующие рекордные моменты.

Рассмотрим условное распределение разности Ш(к +1) — Ш(к) при условии, что Ми = М и = т, —то < т < М <

Пусть Уи — случайная величина, значение которой равно значению первой из случайных величин в последовательности, не попадающей в отрезок [т, М]. Очевидно, что вероятность того, что величина Хт не попадает в этот отрезок, имеет следующий вид:

1 — д(1 + . . . + рМ-1)в — д(1 + . . . + р-т-1)г =

= 1 — в(1 — рМ) — г(1 — р-т) = врМ + гр-т.

Вероятность Р{У^ = х} задается равенствами

если X < то, Р{Уи = х} = {0, если т < х < М,

. если х> М.

Получаем соотношение

Р{Ш(к + 1) — Ш(к) = /|Мк = М, тк = т} =

„(г„—т+1 —1 + М +1-1)

= Р{ук = т-1} + Р{Ук = М + 1} = Ш-—рР ->=дг/-К

Видим, что данная вероятность не зависит от М и т. Следовательно, можем записать Р{Ш(к +1) — Ш(к) = /} = дрг-1 (/ = 1, 2,...), что и требовалось доказать.

Таким образом, рекордные размахи Ш (п) могут быть представлены в виде суммы п независимых геометрически распределенных величин:

Ш(п) = П1 + П2 + ... + Пп, п =1, 2,...,

где Р{пк = /} = (1 — рУ-1, / = 1, 2,...

Утверждение 4. Пусть известно, что Х1,Х2,... —независимые одинаково 'распределенные с. в., имеющие симметричное дискретное 'распределение с функцией вероятности р(п) = Р{Х = п}, п € Ж, при этом р(0) =0 и р(—п) = р(п). Пусть Ш(0), Ш(1), Ш(2),... — рекордные размахи (увеличенные) в последовательности {Хк}. Если Ш(1) и Ш(2) — Ш(1) независимы, то Хк, к =1, 2,..., имеют смесь геометрических распределений на положительной и отрицательной полуосях:

р(1) = д, р(п+ 1)=д(1-2д)п, где 0 < ц < (5)

Доказательство. Величина Ш(1) = Х1 имеет распределение Р{Ш(1) = п} = 2р(п), п > 0.

Ввиду симметрии распределения величин Хк можно, не умаляя общности, считать, что Х1 > 0.

Пусть величина Х1 имеет значение и > 0. Тогда Ш(1) = и, и Ш(2) зависит от первой величины в последовательности, не входящей в отрезок [0;и]. Обозначим ее через У. Тогда Ш(2) = У, если У > и, и Ш(2) = и — У, если У < 0.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Найдем распределение величин У и Ш(2).

Вероятности величины У составляют (всюду п € N1)

р{у = -„} = р(п)

1 — Р(1) — ... — Р(и)' Р {У = 0} = ... = Р {У = и} = 0,

пгу , ! + п)

Р{У = и + п} = --—-—.

1 — р(1) — ... — р(и)

Вероятности Ш(2) задаются равенством

р(и + п) + р(1)

Р {Ш (2) = и + п|Ш (1) = и} =

1 — Р(1) — ... — Р(и)' вероятности Ш(2) — Ш(1) — равенством

р(и + п) + р(1)

Р {Ш (2) — Ш (1) = п|Ш (1) = и} =

1 — Р(1) — ... — Р(и)'

Вестник СПбГУ. Математика. Механика. Астрономия. 2017. Т. 4(62). Вып. 3 391

Далее, получаем

P{W[2) — W[l) < n|W[l) < m} =

p[l) + ... + p[n — 1) + p[m + 1) + ... + p[m + n — 1) l — p[l) — . . . — p[m)

. (б)

Чтобы убедиться в независимости W[l) и W[2) — W[l), следует проверить равенство

P{W[1) < m, W[2) - W[1) < n} = P{W[1) < m}P{W[2) - W[1) < n} или доказать справедливость соотношения

P{W[2) - W[1) < n|W[1) = m} = P{W[2) - W[1) < n},

где m, n G N.

Устремив в правой части (б) число m к бесконечности, получим выражение 2[p[l) + ... + p[n — 1)). Приравниваем его к правой части (б):

p[l) + ... + p[n — 1) + p[m + 1) + ... + p[m + n — 1) =

= 2[p[l) + ... + p[n - l))[l -p[l) - ... -p[m)). (Т)

Подставим в равенство (Т) число [n + 1) вместо n:

p[l) + ... + p[n) + p[m + 1) + ... + p[m + n) =

= 2[p[l) + ... + p[n))[l -p[l) - ... -p[m)). (S)

Вычтем (Т) из (S). Получим

p[n) + p[m + n) = 2p[n)[l — p[l) — ... — p[m)). (9)

Подставив в (9) m =1, получаем

p[n) + p[n + 1) = 2p[n)[l — p[l)),

откуда следует

n —|— 1 )

-——— = 1 — 2p(\) для любых n G N.

p[ n)

Обозначим q = p[l). Тогда можем записатьp[n +1) = q[l — 2q)n. Получаем, чтоp[x) — функция, определенная формулой (5), что и требовалось доказать.

Автор благодарен рецензентам за замечания и советы, позволившие улучшить текст статьи.

Литература

1. Невзоров В. Б. Рекорды. Математическая теория. М.: Фазис, 2000. 244 c.

2. Arnold B. C., Balakrishnan N., Nagaraja H. N. Records. New York: John Wiley & Sons, 1998. 314 p.

3. Nevzorov V. B., Ahsanullah M. Record Statistics. International Encyclopedia of Statistical Sciences. Berlin, Heidelberg: Springer-Verlag, 2011. P. 1195—1202.

4. Chandler K. N. The Distribution and Frequency of Record Values // J. R. Stat. Soc., Ser. B. 1952. Vol. 14. P. 220-228.

5. Tippett L. H. C. On the extreme individuals and the range of samples taken from a normal population // Biometrika. 1925. Vol.17. P. 364-387.

6. Houchens R. L. Record Value Theory and Inference. Ph.D. Dissertation, University of California, Riverside, California. 1984.

7. Tukey J. W. Comparing individual means in the analysis of variance // Biometrics. 1949. Vol. 5, No. 2. P. 99-114.

8. Arnold B. C., Balakrishnan N., Nagaraja H. N. A First Course in Order Statistics. In Ser. Society of Industrial and Applied Mathematics. Philadelphia, 2008. xxiv+280 p.

9. Бельков И. В., Невзоров В. Б. О рекордных величинах в последовательностях выборочных размахов // Вестн. С.-Петерб. ун-та. Математика. Механика. Астрономия. 2017. Т. 4(62) [в печати].

Статья поступила в редакцию 9 февраля 2017 г.; рекомендована в печать 30 марта 2017 г. Сведения об авторе

Бельков Игорь Владимирович — аспирант; [email protected]

ON DISTRIBUTIONS OF RECORD RANGES IN NONSTANDARD SITUATIONS

Igor V. Belkov

St. Petersburg State University, Universitetskaya nab., 7-9, St. Petersburg, 199034, Russian Federation; [email protected]

The record theory is an important part of the probability theory and mathematical statistics and has many applications in various fields of knowledge. Most of the known methods deal with the standard model (when the initial random variables are independent and identically distributed). However, various nonstandard models also show some practical interest. In this article, a number of results for distributions and properties of record ranges and sample ranges are obtained for initial sequences of random variables in some nonstandard situations, namely when the variables of the initial sequence have the Laplace distribution or the mixture of two geometric distributions on the positive and negative semi-axes. The converse problem is also investigated, namely: the aforementioned distributions can be characterized by independency of W(1) and W(2) — W(1), where W(1), W(2),... are sample ranges in the sequences of initial random variables, if the constant Xo =0 is added before the initial sequence. Refs 9.

Keywords: record values, sample ranges, record ranges, exponential distribution, Laplace distribution, geometric distribution.

References

1. Nevzorov V. B., Records. Mathematical theory. In Ser. Translations of Mathematical Monographs (American Math. Society, 194, 2001).

2. Arnold B.C., Balakrishnan N., Nagaraja H. N., Records (John Wiley & Sons, New York, 1998, 314p.).

3. Nevzorov V. B., Ahsanullah M., Record ¡Statistics. International Encyclopedia of ¡Statistical Sciences (Springer-Verlag, Berlin, Heidelberg, 2011, 1195-1202).

4. Chandler K. N., "The distribution and frequency of record values", J. R. Stat. Soc., Ser. B 14, 220-228 (1952).

5. Tippett L. H. C., "On the extreme individuals and the range of samples taken from a normal population", Biometrika 17, 364-387 (1925).

6. Houchens R. L., Record Value Theory and Inference (Ph.D. Dissertation, University of California, Riverside, California, 1984).

7. Tukey J.W., "Comparing individual means in the analysis of variance", Biometrics 5(2), 99-114 (1949).

8. Arnold B. C., Balakrishnan N., Nagaraja H. N., A First Course in Order ¡Statistics. In Ser. Society of Industrial and Applied Mathematics (Philadelphia, 2008, xxiv+280 p.).

9. Belkov I. V., Nevzorov V. B., "On record values in sequences of sample ranges", Vestnik of Saint Petersburg University. Mathematics. Mechanics. Astronomy 4(62) (2017) [in press] [in Russian].

Для цитирования: Бельков И. В. О распределениях рекордных размахов в нестандартных ситуациях // Вестник СПбГУ. Математика. Механика. Астрономия. 2017. Т. 4(62). Вып. 3. С. 387393. DOI: 10.21638/11701/spbu01.2017.303

For citation: Belkov I. V. On distributions of record ranges in nonstandard situations. Vestnik SPbSU. Mathematics. Mechanics. Astronomy, 2017, vol. 4(62), issue 3, pp. 387-393. DOI: 10.21638/11701/spbu01.2017.303

i Надоели баннеры? Вы всегда можете отключить рекламу.