УДК 519.2 МЯО 62030
Вестник СПбГУ. Математика. Механика. Астрономия. 2017. Т. 4 (62). Вып. 3
СРАВНЕНИЕ ЧИСЕЛ РЕКОРДОВ В ПОСЛЕДОВАТЕЛЬНОСТЯХ ДИСКРЕТНЫХ И НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН*
4=
В. Б. Невзоров
Санкт-Петербургский государственный университет,
Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7—9
В ряде областей человеческой деятельности фиксируются различные рекордные достижения. Часто при этом происходит некоторая дискретизация с различной точностью (до секунды, до метра, до тысячи индивидуумов) получаемых результатов наблюдений. На примере экспоненциальных и геометрических распределений показано, как такого рода переход от непрерывных к дискретным вероятностным распределениям меняет число рекордных значений в соответствующих последовательностях случайных величин. Библиогр. 4 назв.
Ключевые слова: экспоненциальные распределения, геометрические распределения, рекордные моменты, рекордные величины.
1. Введение. В теории вероятностей и в ее многочисленных приложениях важное место отводится экспоненциально и геометрически распределенным случайным величинам. Во многом этот факт связан с присущим этим величинам так называемому свойству отсутствия последействия, которое позволяет в ряде случаев существенно упростить получение различных теорем. Многие важные результаты, связанные с этими распределениями, представлены, в частности, в теории порядковых статистик и в теории рекордов. Ниже мы обсудим ряд соотношений, связывающих рекордные величины для этих двух родственных (дискретных геометрических и непрерывных экспоненциальных) семейств случайных величин, обладающих указанным выше свойством.
2. Определения и обозначения. Рассмотрим последовательность независимых одинаково распределенных (н. о. р.) случайных величин (с. в.) Х\, Х2, .... Определим для этой последовательности рекордные моменты Ь(и), п = 1, 2, ... , и рекордные величины X(1) < X(2) < ... следующим образом:
Аналогичным образом можно определить для исходной последовательности {X} слабые рекордные моменты 1(п) и слабые рекордные величины Х(п):
Слабые рекорды отличаются от введенных в (1) рекордов лишь тем, что в этом случае повторение (не обязательно превышение!) предыдущего рекордного значения также засчитывается как новое рекордное достижение. Имеет смысл рассматривать
* Работа выполнена при финансовой поддержке РФФИ (грант № 11-01-00769-а). (¡5 Санкт-Петербургский государственный университет, 2017
Ь(1) = 1, X(1) = XI, £(п + 1) = шт{.? : X. > Хь(и)}, п = 1, 2,.. X (п) = XL(n), п =1, 2,...
(1)
1(1) = 1, Х(1) = XI, 1(п + 1) = шт{.? > 1(п) : X.,- > ^„^ п = 1, 2,.. ВД = ^(п), п =1, 2,...
(2)
слабые рекорды только для дискретных случайных величин, так как в случае непрерывных распределений совпадение каких-то двух с. в. Х1, Х2,... в исходной последовательности имеет нулевую вероятность.
Если быть более точными, то следует указать, что в (1) и (2) приведены определения верхних рекордных моментов Ь(п), верхних рекордных величин X(п), слабых верхних рекордных моментов 1(п) и слабых верхних рекордных величин X (п). Дело в том, что аналогичным образом определяются и соответствующие нижние рекордные моменты и нижние рекордные величины. Для этого в соотношениях (1) и (2) знаки неравенств > и > достаточно заменить, соответственно, знаками < и <. Результаты, полученные для верхних рекордов в последовательностях Х1, Х2, ... , практически сразу переносятся на нижние рекорды для последовательностей = —Х1,
= — Х2, ... Поэтому, как правило, если речь не идет о какой-то специальной ситуации, когда интерес представляют исключительно нижние рекордные величины, ограничиваются исследованием различных схем, связанных с верхними рекордными моментами и верхними рекордными величинами, которые и называют, как правило, просто рекордными моментами и рекордными величинами.
Ниже мы будем иметь дело с последовательностями н.о.р. случайных величин £1, £2, ... и ^1, ^2, ... , имеющих стандартное Е(1)-экспоненциальное распределение с функцией распределения (ф.р.) Р(х) = тах{0,1 — ехр(—х)}, —то < х < и с последовательностями У1, У2, ... и V, У2, ... независимых величин, имеющих геометрическое Сеот(р)-распределение, для которых
Р {Ук = т} = Р {Ук = т} = (1 — р)рт, т = 0, 1, 2, . .. , 0 <р < 1.
В дальнейшем параметр р рассматриваемых геометрически распределенных случайных величин будет уточнен.
Наряду с последовательностями с. в. ^1,^2, ... и У1, У2, ... будем рассматривать соответствующие им последовательности рекордных величин 2(1) = ^ < 2(2) < ... и У(1) = У1 < У(2) < ..., а также будем иметь дело со слабыми рекордными величинами У(1) = У1 < У(2) < ... , построенными по последовательностям {У}.
К классическим результатам теории рекордов (см., например, работы [1-4]) относятся следующие представления последовательностей заведомо зависимых рассматриваемых нами рекордных величин 2(п), У(п) и У(п) в виде сумм независимых случайных слагаемых:
да),2(2), ... ,2(п)} = {£1, £1 + £2, ... ,£1 + £2 + ... + £п}, П =1, 2, ... ; (3)
{У (1),У (2),..., У (п)} = {У1,У1 + V + 1, ... ,У1 + ^2 + ... + К + п — 1}, п = 1, 2, ... ;
(4)
{У(1),У(2), ...У(п)} = {УЬУ1 + ...V + У2 + ... + К}, п =1, 2,... (5)
В соотношениях (3)-(5) имеем дело с равенствами по распределению соответствующих векторов. Учитывая эти соотношения, получаем, что математические ожидания приведенных здесь рекордных величин задаются равенствами
(п) = Е(£1 + £2 + ... + £п)= п, п =1, 2,...; (6)
ЕУ(п) = ВД + У2 + ... + К + п — 1)= п/(1 — р) — 1, п =1, 2,..., (7) ЕУ(п) = ВД + У2 + ... + Уп ) = пр/(1 — р), п = 1, 2,... (8)
Отметим также, что из соотношений (3)—(5) получаем при п ^ то сходимость к стандартному N(0,1)-нормальному закону с функцией распределения
Ф(ж) = —= / exp(—t2/2)dt
следующих случайных величин:
Z(n)-n / (у(п)~ пР \ / f пР 41/2
1 — р) / \ 1 — р / \ 1 — р; / у 1 — р
Ниже будут рассматриваться, наряду с экспоненциально распределенными с. в. ^2, ..., и величины, представляющие их целые части. Отметим несколько фактов для целой У = ] и дробной Ш = Z — ] частей с. в. Z, имеющей Е(1)-экспоненциальное распределение. Нетрудно убедиться, что
P{Y = т} = Р{т< Z < т + 1} = e"m 1 - - , m = 0,1,2,..., (9)
т. е. целая часть Z имеет геометрическое Сеот(1/е)-распределение. Дробная часть Z (величина Ш) сосредоточена на интервале [0,1) и имеет ф. р.
Fw(х) = (1 — е-х)/(1 — 1/е), 0 < х< 1, (10)
т.е. Р {Ш < х} = Р ^ < х^ < 1}. Нетрудно также убедиться, что с. в. У и Ш независимы, поскольку
_ -т _ ~{т+х) _
Р{У = т, Ш < х} = Р{т < Z < т + х} = е "" — е
= Р{У = т}Р{Ш<х}, т = 0, 1, 2,..., 0 < х< 1. (11)
Таким образом, получили, что с. в. Z представима в виде суммы Z = У + Ш независимых случайных слагаемых, распределения которых определяются соотношениями (10) и (11).
3. Рекордные достижения в различных областях человеческой деятельности. Всевозможные рекорды трактуются населением нашей планеты как личные достижения, как результаты, свидетельствующие о прогрессе человеческой цивилизации, как стимул совершенствоваться в своей деятельности, чтобы выйти на новый рекордный уровень. Поэтому вполне понятен интерес к различным сообщениям о преодолении тех или иных рекордных рубежей. Многочисленные статьи в газетах, сообщения в Интернете, телепередачи немедленно дают знать о рекордах (даже, порой, экзотических), установленных в родной стране, в Европе, в мире или на космической орбите. Одной из самых популярных во всем мире является переводимая на многочисленные языки и регулярно (начиная с 1955 года) переиздаваемая книга, носящая названия «Книга рекордов Гиннесса» или «Гиннесс. Мировые рекорды».
Рассмотрим некоторые статистические проблемы, связанные с фиксацией рекордных результатов. Речь идет о тех ситуациях, когда могут расходиться предсказания о возможных будущих рекордных значениях, основанные на теоретических расчетах, и реальные сообщения о новых рекордных достижениях в том или ином
х
виде человеческой деятельности. На примере упомянутых выше экспоненциальных и геометрических вероятностных распределений проанализируем, как процесс дискретизации исходных величин влияет на число рекордов в рассматриваемых последовательностях случайных величин. Вначале приведем взятые из Интернета некоторые рекордные (на момент начала 2017 года) достижения, фиксируемые жителями нашей планеты.
1. Уровни Невы выше ординара (приводимые в различных источниках с точностью до сантиметра) всегда волновали не только реальных жителей города на Неве, но и некоторых литературных героев. Ее последний рекордный уровень, составивший 421 см выше ординара, был зафиксирован 19 ноября 1824 года. Он заметно превзошел предыдущее рекордное значение, равное 310 см, которое было отмечено в 1777 году.
2. С июня 2013 года рекордное достижение по продолжительности жизни мужчин на Земле принадлежит японцу Кимуре. Он прожил 116 лет и 54 дня. Предыдущий рекорд, составивший 115 лет и 252 дня держался с 1998 года. В этой ситуации не было возможности, да и это не требовалось, уточнять рекордную продолжительность жизни с точностью, скажем, до часа.
3. Предыдущий рекордный результат из отмеченных в различных записях за последнее столетие, полученный при измерении роста человека, был зафиксирован в США в 1921 году и равнялся 248 см. Этот рекорд был превышен на 24 сантиметра другим американским великаном в 1940 году. Видим, что и в этом случае не было необходимости измерять рост с точностью до миллиметра.
4. Самая низкая температура на Земле (с момента, когда началась ее запись) была зафиксирована в 1983 году на станции Восток в Антарктиде. Она составила —89, 2 градуса. В Европе как рекордно жаркая за все времена измерений была отмечена в 1881 году температура воздуха +50, 0 в испанской Севилье. В этих случаях уже была возможность фиксировать измерения с точностью до одной десятой доли градуса.
Видим, что в приведенных примерах появление нового рекордного достижения представляет собой весьма редкое событие. Округление наблюдаемых величин до одного дня, одного сантиметра, десятой доли градуса совсем не отразилось на числе рекордных значений. Совсем другая ситуация наблюдается, если перейти к спортивным результатам. Здесь громадное число участников многочисленных соревнований приводит к большой плотности результатов. В некоторых видах легкой атлетики решающей бывает разница в несколько сантиметров или сотых долей секунды. В качестве примеров можно взять результаты спортсменов на спринтерских дистанциях.
Рассмотрим, например, таблицу мировых рекордов на стометровой дистанции у мужчин. До 1975 года использовался ручной хронометраж. Секундомеры позволяли фиксировать результаты бегунов с точностью до десятых долей секунды. В этой ситуации результат 10,0 секунды с 1960 по 1968 год был зафиксирован как рекордный 14 раз. Затем очередные 8 лет привели к установлению и вслед за этим 15-кратному повторению рекордного значения 9,9 секунды, что дало миру большое число соре-кордсменов на этой дистанции. Переход с 1 января 1975 года на электронный хронометраж, позволивший уже с точностью до сотых долей секунды фиксировать результаты спортсменов, снизил число «слабых» рекордсменов, увеличив число обладателей классических рекордов. Среди новых рекордных значений были, в частности, последовательно зафиксированы результаты 9,86, 9,85, 9,84, 9,79, 9,77 (4 раза!),
9,74, 9,72, 9,69. Наконец, в 2009 году Усэйн Болт, представлявший Ямайку, немного оторвался от предыдущего результата и показал остающийся рекордным уже 8 лет результат 9,58 секунды. Видим, что даже и такой более точный хронометраж привел к появлению слабых рекордных значений. Уже даже сделаны (пока еще неофициальные) попытки фиксировать в этом виде легкой атлетики результаты, округленные до тысячных долей секунды. В частности, приводится и более точное значение результата Болта — 9,578 секунды. Интересно, что в некоторых видах спорта уже официально перешли на точность, составляющую тысячные доли секунды. Например, в велогонках на треке рекордный результат Франсуа Первиса на дистанции 200 метров с хода равен 9,347 секунды.
Во всех приведенных выше примерах, по сути дела, вместо наблюдаемых значений абсолютно непрерывных случайных величин рассматриваются их дискретные аналоги, полученные использованием того или иного варианта округления истинных величин. Ниже на примере экспоненциальных и полученных в результате их дискретизации геометрических распределений будут проанализированы возможные взаимоотношения рекордных величин, возникающие при переходе от непрерывных распределений к дискретным.
4. Соотношения между рекордами при переходе от экспоненциальных к геометрическим случайным величинам. Рассмотрим в качестве исходной последовательность н.о.р. случайных величин ^2, ..., имеющих стандартное Е(1)-экспоненциальное распределение с ф. р. Р(х) = тах{0,1 — ехр(—х)}, —то < х < то. Переход от этих величин к соответствующим дискретным аналогам можно провести различными способами.
Начнем с ситуации, когда вместо исходных величин рассматриваются их целые части У1 = У2 = [^2], ... Эти случайные величины принимают целые значе-
ния 0,1, 2,... и имеют геометрическое Сеот(р)-распределение с параметром р = 1/е. Наряду с рекордными в последовательности ^1, ^2, ... случайными величинами Z(1) = < Z(2) < ... будем рассматривать также рекорды У(1) = У < У (2) < ... и слабые рекордные величины У(1) = У1 < У(2) < ..., порожденные последовательностью целочисленных с. в. У1 , У2 , . . .
Простые рассуждения позволяют убедиться, что между тремя приведенными здесь наборами рекордных величин справедливы следующие соотношения:
У (п) < Z (п) < У (п), п = 1, 2,...,
и
ЕУ (п) < EZ (п) < ЕУ (п), п = 1, 2,...
Зная из равенства (6), что EZ(п) = п, интересно сравнить это значение с математическими ожиданиями рекордных величин У(п) и У(п). Для этого нужно воспользоваться соотношениями (7) и (8) при р = 1/е. Получаем
п е
ЕУ(п) =--1, п = 1,2, ... ,
е—1
и
п
ЕУ(п) =-п = 1,2, ... ,
е — 1
т. е. при больших значениях п величина ЕУ (п) примерно в 1,72 раза больше математического ожидания EZ (п), а значение ЕУ (п) примерно в 1,58 раза меньше среднего значения рекордной величины Z(п).
Если рассмотреть в этой ситуации с. в. Д1 (п), представляющие собой числа рекордов в наборах Zl, Z2, ..., Zn, а также с. в. Д2(п) и Дз(п), совпадающие с количеством рекордов и слабых рекордов среди величин У1, У2, ... , Уп, п =1, 2,..., то можно показать, что при п ^ то распределения отношений Д2(п)/Д1(п) и Дз(п)/Д1 (п) сходятся, соответственно, к вырожденным в точках 1/(е — 1) и е/(е — 1) распределениям.
Замечание. Более значительные взаимоотношения между рассматриваемыми рекордами можно наблюдать, если в качестве исходной взять последовательность н.о.р. с. в. Zl, Z2, ... , имеющих произвольное Е(Л)-распределение с ф. р. F (х) = 1 — ехр(— х/Л), х > 0, в ситуации, когда параметр Л > 0 принимает большие значения. В этом случае соответствующие распределения отношений Д2(п)/Д1(п) и Дэ(п)/Д1(п) будут сходиться к вырожденным распределениям в точках 1/(е1/Л — 1) и е1/л/(е1/л — 1). Чем больше значение параметра Л, тем существеннее различия между величинами Д1 (п), Д2 (п) и Дз(п). Поскольку (е1/Л — 1) ~ 1/Л при стремящихся к бесконечности значениях Л, то видим, что за счет выбора уровня дискретизации можно получить сколь угодно большие значения отношений Д2(п)/Д1(п) и Дз(п)/Д1(п). Получаем, что рассмотренный процесс дискретизации случайных величин может привести к существенным изменениям числа рекордов, которые могли бы быть зафиксированными в исходной последовательности величин.
Рассмотрим еще одну ситуацию, когда вместо с. в. Zl Z2, ... будем брать не их целые части, а их округления до ближайших к ним целым значениям. Для того чтобы иметь дело с более простыми выкладками, вместо этих величин будем рассматривать в качестве исходной последовательность с. в. Тп = Zn — 1/2, ... , п =1, 2, ... , что не изменит соответствующего числа рекордов, фиксируемых среди с. в. Zl, Z2, ... Если обозначим через Т(1) = Т1 < Т(2) < . . . соответствующие рекордные величины, для которых справедливы равенства Т(п) = Z(п) — 1/2, п =1, 2,... , то из соотношения (3) получаем
{т(1),т(2),......п=1,2,...
В этой ситуации ЕТ(п) = п — 1/2, п = 1, 2, . . .
Обозначим через Хп случайную величину, полученную округлением Тп до ближайшего целого числа. Пусть X(1) = Х1 < X(2) < ... представляют рекордные значения в последовательности с. в. Х1,Х2, ... Видим, что
Р{Хп = т}=Р{т-^<Тп<т+^\ =
= Р{т < гп < то + 1} = е-"1 1 - - , то = 0,1, 2,. ..:
т.е. при каждом п = 1, 2, ... с. в. Хп имеют такое же геометрическое Сеот(1/е)-распределение, что и с. в. Уп = [Zn], представленные выше. Получаем, вспоминая, в частности, равенство (4), что справедливы следующие соотношения:
{Х(1), Х(2), ... , Х(п)} = {Х1, Х1 + Х2 + 1,..., Х1 + Х2 + ... + Хп + п — 1},
пе
ЕХ(п) =---1, п= 1,2,...
е1
Отметим также, что при n ^ то последовательность с. в.
сходится по распределению к стандартному N(0,1)-нормальному закону.
Таким образом, и такой способ получения дискретных величин, близких к исходным, имеющим непрерывные функции распределения, существенным образом сказывается на числе рекордных значений.
Литература
1. Arnold B. C., Balakrishnan N., Nagaraja H.N. Records. New York: John Wiley & Sons, 1998.
312 p.
2. Ohandler K.N. The distribution and frequency of record values // J. R. Stat. Soc., Ser. B. 1952. Vol. 14. P. 220-228.
3. Невзоров В. Б. Рекорды. Математическая теория. М.: Фазис, 2000. 244 c.
4. Vervaat W. Limit theorems for records from discrete distributions // Stochast. Process. Appl. 1973. Vol.1, N2. P. 317-334.
Статья поступила в редакцию 6 февраля 2017 г.; рекомендована в печать 30 марта 2017 г. Сведения об авторе
Невзоров Валерий Борисович — доктор физико-математических наук, профессор; [email protected] COMPARISON OF NUMBERS OF RECORDS IN
THE SEQUENCES OF DISCRETE AND CONTINUOUS RANDOM VARIABLES
Valery B. Nevzorov
St. Petersburg State University, Universitetskaya nab., 7-9, St. Petersburg, 199034, Russian Federation; [email protected]
Different record achievements are fixed in many domains of human activities. Very often this process happens with some rate of discretization (up to seconds, up to meters or up to thousands of individuals) of observed results. Using the examples of exponential and geometrical distributions, it is shown how such type of transition from continuous to discrete distributions can vary the numbers of record values in corresponding sequences of random variables. Refs 4.
Keywords: exponential distributions, geometrical distributions, record times, record values.
References
1. Arnold B.C., Balakrishnan N., Nagaraja H. N., Records (John Wiley & Sons, New York, 1998, 312 p.).
2. Chandler K.N., "The distribution and frequency of record values", J. R. Stat. Soc., Ser. B 14, 220-228 (1952).
3. Nevzorov V. B., Records. Mathematical Theory. In Ser. Translations of Mathematical Monographs (American Math. Society, 194, 2001).
4. Vervaat W., "Limit theorems for records from discrete distributions", Stochast. Process. Appl. 1(2), 317-334 (1973).
Для цитирования: Невзоров В. Б. Сравнение числа рекордов в последовательностях дискретных и непрерывных случайных величин // Вестник СПбГУ. Математика. Механика. Астрономия. 2017. Т. 4 (62). Вып. 3. С. 459-465. DOI: 10.21638/11701/spbu01.2017.308
For citation: Nevzorov V. B. Comparison of numbers of records in the sequences of discrete and continuous random variables. Vestnik SPbSU. Mathematics. Mechanics. Astronomy, 2017, vol. 4(62), issue 3, pp. 459-465. DOI: 10.21638/11701/spbu01.2017.308