Теория вероятностей
УДК 519.217.7
К ВОПРОСУ О ПРЕДЕЛЬНОМ РАСПРЕДЕЛЕНИИ СЕРИЙ В СЛУЧАЙНОЙ ДВОИЧНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
В. А. Барвинок, В. И. Богданович, А. Н. Плотников
Самарский государственный аэрокосмический университет им. ак. С. П. Королёва (национальный исследовательский университет),
443086, Россия, Самара, Московское ш., 34.
E-mails: barvinok®ssau.ru, bogdanovicMSssau.ru, [email protected]
Исследуются предельные формы распределения длины максимальной серии «успехов» в двоичных случайных последовательностях, образуемых в цепи Бернулли—Маркова и в одной схеме Пойа, эквивалентной локальным трендам временного ряда строго стационарного процесса. Предлагается упрощённое и дополненное доказательство предельных теорем для серий обоих типов. Для серий второго типа установлен эффект циклического биморфизма предельного закона с вырождением на одной из фаз и сходимость по вероятности на множестве не более четырёх соседних значений натурального ряда.
Ключевые слова: случайная последовательность, максимальная серия успехов, предельные теоремы, сходимость по распределению, сходимость по вероятности.
Введение. Структура серий, устойчиво воспроизводимая в случайной последовательности, является, по всей видимости, наиболее информативной статистикой критериев случайности, которые, в свою очередь, представляются актуальными для статистической физики, генетики, информационных технологий и других приложений теории вероятностей [1-6]. В указанных работах, а также в [7-9] рассматриваются двоичные последовательности и образующиеся в них серии успехов (неудач). При этом полученные результаты применимы к значительно более широкому классу последовательностей. В частности, последовательные попадания значений временного ряда стационарного процесса в межквантильный интервал, соответствующий вероятности р, совпадают с успехами в последовательности испытаний Бернулли с вероятностью р. Знаки последовательных разностей того же временного ряда образуют симметричную двоичную последовательность типа Пойа, и серия успехов в ней эквивалентна локальному восходящему тренду в исходном временном ряду. В последующем изложении будем рассматривать двоичные последовательности двух типов: марковскую, включающую в себя как
Виталий Алексеевич Барвинок (д.т.н., проф., член-кор. РАН), зав. кафедрой, каф. производства летательных аппаратов и управления качеством в машиностроении.
Валерий Иосифович Богданович (д.т.н., проф.), профессор, каф. производства летательных аппаратов и управления качеством в машиностроении.
Андрей Николаевич Плотников (к.т.н., доц.), доцент, каф. производства летательных аппаратов и управления качеством в машиностроении.
частный случай Бернулли, и образованную повыше указанной схеме Пойа, эквивалентной локальным трендам временного ряда.
Подсчет серий условимся производить двояко. При установлении асимптотических законов и доказательстве предельных теорем серией успехов длиной I будем считать отрезок вида 0 1... 1 0. В качестве статистик будем рас-
I
сматривать число серий длиной I — К^ (гг — длина последовательности) и длину максимальной серии Ьп. При установлении точных законов распределения Ьп в коротких и умеренно длинных последовательностях (п ~ 103) будем рассматривать рекуррентные (феллеровы [5]) серии — непересекающи-еся отрезки вида 1... 1. В дополнение к результатам работ [1-9] будет ис-I
следована сходимость по распределению длины максимальной серии успехов для последовательностей обоих типов. Для предельного распределения длины максимального локального тренда установлен эффект «циклического биморфизма», заключающийся в том, что с увеличением длины последовательности форма распределения циклически эволюционирует от симметричного бинарного на множестве Ьп € {1*(п),1*(п) + 1} до полностью вырожденного Р{Ьп = 1*{п)} = 1.
Закон больших чисел в смысле сходимости по вероятности будет получен в виде интервала 1\{п) ^ Ьп ^ /г(и). Для марковской цепи будет показано, что полученный в [1] закон тройного логарифма, обобщенный впоследствии в [3], соответствует нижней границе интервала. Верхняя граница определяется двойным логарифмом. Для максимального локального тренда доказывается, что интервал содержит не более четырёх соседних значений натурального ряда. Причём четыре значения соответствуют фазе полного вырождения предельного распределения. В остальное «время» интервал сокращается до трёх значений.
1. Асимптотические законы для максимальной длины и числа серий в марковской последовательности. Рассмотрим произвольную марковскую цепь с двумя состояниями. Используя обозначение [1,3], запишем матрицу цепи в виде
А - ( а 1 “
и-/5 I3 )'
где а = Р{хп+1 = 0 I Хп = 0}, /3 = Р{Хп+1 = 1 | Хп = 1}, Хп € {0,1}, п ^ 0. Начальное условие при исследовании асимптотики распределения на основании общеизвестного свойства марковских цепей, положим стационарным:
«, = ВД = К =
Данное условие можно интерпретировать таким образом, что начало сканирования последовательности расположено значительно правее её собственного начала. Серией успехов длины I будем считать отрезок вида 0 1... 1 0. Далее
I
речь пойдет о предельном при п —> оо распределении числа таких серий —
Предлагаемый и являющийся, по-видимому, наиболее простым вывод предельного закона, основанный на индикаторных переменных В. Феллера, будет опираться на следующую лемму.
Лемма. Для любых двух отрезков марковской последовательности х\,..., хт, у\,..., уП1 тп 1, п 1, Р{х 1,..., хт,0, у\,..., уп и Х\,..., хт, 1, У1,...,Уп} = Р{Х1,...,Хт}Р{уг,...,уп}.
Доказательство. Поскольку в левой части равенства фигурируют два несовместных события, вероятность составного события равна сумме вероятностей. Слагаемые представляют собой цепочки сомножителей, такие, что на т + 1 месте стоят величины, в сумме составляющие 1, а остальные сомножители обеих цепочек попарно совпадают. Вынося общие множители, убеждаемся, что оставшийся равен 1, и лемма доказана. □
Естественным следствием данной леммы является её обобщение на случай произвольной длины разделяющей цепочки. Для краткости примем симво-
личную запись следующего вида: Р{х\,...
Хп
,2/1,
Р{у 1,..., уп}, где под «*» будем подразумевать цепочку произвольной длины к ^ 1 и объединение по всем её возможным комбинациям.
Далее введём в рассмотрение рекуррентные вероятности образования на
- 7 (0 гг(0
п-ном шаге серии успехов длинои I: и,п и индикаторные переменные , принимающие значения 1, если событие наступило, и 0 — в противном случае. Число серий и индикаторные переменные связаны между собой:
Е,(га) =
Т.1'.
(О к *
(і)
к=О
В силу центральной предельной теоремы сумма (1) сходится по распределению к нормальному закону. Для вычисления параметров нормальной
(О и
асимптотики установим структуру ряда и>п . На основании следствия из леммы 1, перемножая вероятности переходов в цепочке-серии, получим
ип = <
1, п = О,
О, 1 ^ п ^ I,
7/Зг_1, п = I + 1,
7/?г_1(1 — /3), п^1 + 2,
(2)
где сохранено обозначение [1, 3] 7 = (1 — ск)(1 — /3)(2 — а — /3) . Поскольку
среднее и дисперсия величины К^ пропорциональны п с точностью до аддитивной константы, удобнее перейти к пределам:
щ = Ит — Е
п—)>оо и
к=О
ел2 = Ит —И
п—)>оо п
к=О
Непосредственными вычислениями находим
Е
к=О
= 1 + 7(З1-1 + {п-1- 1)7/5'“1(1 - /?)•
-і/
(3)
Соответственно, предел составит
щ = 7/Зг_1(1 -/3).
(О
21
(4)
. Перемно-
Для вычисления дисперсии потребуется найти Е ^^/с=о ^ жение индикаторных переменных эквивалентно совместному осуществлению событий:
Е[и®и$] = Р{и£ = 1,17® = 1},
поэтому при непосредственном вычислении необходимо выделять цепочки и соответствующие им вероятности следующего вида:
Р{*0 1... 1 0 1... 1 0*} = 7/32г_2(1 - /3)2(1 - о),
I I
Р{*01... 1001... 1 0*} = 7/32г_2(1 - /3)2(1 - а)а.
(5)
Серии, разделенные хотя бы одним знаком, на основании леммы 1 факторизуются, т.е.
Р{*01...10*01...10*} =
I I
Используя (5), а также очевидное соотношение
Е[(и®)2] = Е[17®] = ип,
получаем
2п
Е
к=О
+ 2 (V'1 + {п-1- 1)7/Зг“1(1 - /?)) +
+ 2 ^(п — 21 — 3)7/32г_2(1 — /3)2(1 — а) + (п — 21 — 4)7/32г_2(1 — /З)2(1 — а)а^ +
+ (п - 21 - 3)(п - 21 - 4)72/32г_2(1 - /З)2. (6)
Возводя (3) в квадрат, вычитая из (6) и выделяя член порядка п, окончательно получаем
<т2 = 7/Зг—1 (1 - /3) (1 - /Зг—1 (1 - /3) ((2/ + 5)7 - 2(1 - а2))) . (7)
Таким образом, параметры нормальной асимптотики для К^ имеют вид
(4), (7):
Ег(га) ~ N(71111,01^/71).
Для перехода к цепи Бернулли с параметром р следует положить в (4), (7) /3 = р, а = 1 -р, 7 = р(1 -р).
Устремив в (7) I —> оо, замечаем, что <т2 —> щ ((щ — ст2)/^-1 ~ 0(1(31)) .
Для исследования взаимодействия (зависимости) между величинами К^, I = 1,2,... гг, воспользуемся нормальной асимптотикой. Взаимосвязь в системе нормальных величин, как известно, исчерпывается линейной, которую удобнее всего представлять в виде ковариационной либо корреляционной матрицы. По аналогии с дисперсией (7) введём в рассмотрение величины
2
Нт —И
п—^оо П
I > к.
Ряд ип для составного события (аналог (2)) в силу несовместности комбинируемых событий будет иметь вид
ип ^ 1, 0, • • •, 0, , • • •, , • • •,
0 1 к к+1 к+2 1+1 1+2
где для краткости обозначено ц°к = 7/?#г_1, = ^(Зк~1(1 — (3).
Производя цепочку вычислений, аналогичную (1)—(7), и обозначая для
краткости Ни = Е ^т=о ит , Ці/2 = Е (^т=о > получим
Ни = 1 + Н°к + /4* — (к + 1)/4 — (I + 1)/х/ + п(/4 + ц\), (8)
/Х[72 = Ни + 2 + $ + (та - к - 1)/4 + (п - I - 1)ц1 +
+ А$((та - 2/с - 4)/4 + (та - к - I - 4)/х/)) +
+ 2 (а4* ((« - 21 - А)ц] + (п — к — I — 4)4) +
+ (п - к - I - 3)(Р{01_^Л 01_^_1 0}+Р{01_^_1 01_^_1 0})) +
к І I к
+ 2^(п- к -I -4)(Р{01_^_1 001_^Л 0} +Р{01_^_1001_^_1 0})) +
к І I к
+ 2^(п — 2 к — 3)^/32к~2(1 — /3)2( 1 — а) + (п — 2к — 4)^/32к~2(1 — /3)2( 1 — а)а+
+ (п — 21 — 3)7/52г_2 (1 — /3)2( 1 — а) + (п — 21 — 4)7/52г_2 (1 — /?)2(1 — а)а^ +
+ (п — 2к — 3 )(п — 2 к — 4)(/4)2 + (п — к — I — 3 )(п — к — I — 4)/4/х/ +
+ (п — 2/ — 3)(п — 21 — 4)(/х/)2. (9)
Возводя (8) в квадрат, вычитая из (9) и выделяя член порядка п, находим
сг^,г = + 47/?#г+г_2(1 — /?)2(1 — а2) + 27(1 — (3)2(1 — а2)(/32к~2 + /321~2) —
— (2к + 5) (/4) — 2(к + I + 5— (21 + 5) (/і/) .
И, наконец, с учётом (7) окончательно получаем
2 2 2
г 1 Го(га) Е>(га)і ак,1 ~ ак ~ а1
ІШ1 -СОУ \Щ = -!------------------
га—>■ оо П 1 К і і 2
= ^(Зк+1~2
(1 — Р)2 (2(1 — си2) — 'у (к + I + 5)), (10)
рк,1= Ит ~рШк
п—>оо П
(га) ^(га) п
-иг- <7;
2(7 Д;<71
(1 - ^^(<=+0/2-1 (2(1 _ а2) -7(к + 1 + 5))
\
(1 - рк~1{1 - /3)((2к + 5)7 - 2(1 - а2))) х х (1 - Р1~\1 - 0) ((21 + 5)7 - 2(1 - а2)))
(П)
I оо, рк,1 < 0, \рк>1\ = О ((к + 1)^к+1)/2).
дают основания сформулировать следующую тео-
Как видно из (11), при к,
Соотношения (1)—(11) рему.
Теорема 1. Распределение числа длинных серий успехов в двоичной марковской последовательности имеет нормально-пуассоновскую асимптотику и образует взаимно независимую систему величин.
Доказательство. Нормальность величин при п —> оо следует из представления (1) на основании центральной предельной теоремы и ограниченности последействия. Взаимная независимость я[п\ I = 1\,1\ + 1,... при 1\ —> оо, в свою очередь, равносильна их асимптотической некоррелированности согласно (11). И, наконец, асимптотическое равенство параметров нормального закона согласно (7), (4), а так же применимость нормальной асимптотики для распределения Пуассона [5] доказывает справедливость
?(«)
при I —> оо, п/1 —> оо: р(п, I) = <72(п, I) =
пуассоновской асимптотики для щ = Х(п, I) = п7/?г-1(1 — /3). □
Следует отметить тот факт, что знак корреляции коротких серий определяется согласно (11) величиной 2(1 — а2) — 7(к + I + 5), так что при к + 1 < <2(1 — а2)/7 — 5 корреляция положительная, при смене знака неравенства —
отрицательная, а в случае равенства Кк и Щ независимы. Переход к цепи Бернулли осуществляется ранее указанным образом. В качестве иллюстрации ниже приведен начальный фрагмент матрицы р/у, к, I € {1,2,... ,7} для симметричной (р = 1/2) цепи Бернулли:
/ 1 -0,21 -0,218 -0,2
-0,184 -0,153 1
-0,097 -0,076 -0,059
На основании теоремы 1 можно установить предельную при п —> оо форму распределения величины Ьп, аналогичную полученной в [7] для симметричной цепи Бернулли. Для этого воспользуемся пуассоновской асимптотикой с
параметром Аг = п^[51~1(1 — /3) и взаимной независимостью к\а\ I = 1\, Ь, ■ ■ ■ Вероятность ьп(1) = Р{Ьп = 1} на основании двух вышеуказанных условий можем представить в виде
ьп(1) = Р{П\:п) > 0, = 0, Ут > 1} = (1 - е-Л0 Ц е~Ат.
т>1
р
1
-0,21 -0,218 -0,2 -0,173 -0,145 V—0,118
-0,21
1
-0,214
-0,184
-0,153
-0,124
-0,099
-0,218
-0,214
1
-0,153
-0,123
-0,098
-0,078
-0,173
-0,153
-0,123
-0,097
1
-0,059
-0,045
-0,145
-0,124
-0,098
-0,076
-0,059
1
-0,034
—0,118\ —0,099 —0,078 -0,059 -0,045 -0,034 1 )
После элементарных преобразований искомую вероятность получим в виде
Пренебрегая бесконечно малой и переходя к действительной переменной
получаем континуальный аналог независящей от п предельной формы распределения Ьп:
Предельная форма (14) положительно определена, удовлетворяет условию нормировки на —оо < Ь < оо, унимодальна и положительно асимметрична. Применяя при вычислении числовых характеристик (14) прием, использованный для симметричной цепи Бернулли [7], получаем
(12)—(16) справедливы и для цепи Бернулли. Переход осуществляется так же, как и в предыдущем случае.
2. Закон больших чисел для максимальной серии успехов в марковской
цепи. Предельная форма распределения (14), составляющая содержание закона больших чисел в смысле сходимости по распределению, несмотря на весьма простой и удобный для анализа вид, тем не менее, насколько можно судить по литературе, до сих пор не введена в широкий научный обиход. Закон больших чисел для Ьп в смысле сходимости по вероятности получил гораздо более широкое освещение в литературе. Вместе с тем опубликованные результаты, как представляется, могут быть получены более простым путём и в некоторой мере дополнены либо уточнены.
Поскольку длина максимальной серии успехов Ьп натурально определена и не предполагает, в отличие от числа успехов Бп, центрирования и нормировки, понятия нижняя и верхняя границы можно сформулировать в элементарном виде. Зададим интервал практически реализуемых значений в виде нестрогого неравенства 1\(п) ^ Ьп ^ ^(п) и для установления верхней границы рассмотрим правый хвост Ьп: Р{Ьп ^ I}. На основании взаимной независимости и пуассоновской асимптотики искомую вероятность можно представить и оценить сверху следующим образом:
уп(1) = (ехр(—п^/31) — ехр(—п^/31 1)){1 + 0(п^[5п 1)). (12)
і = 1-1 + 1сщ п,
(13)
/(*) = ехр(—7(Зі+1) - ехр(—7/?*).
(14)
1*Ьп
С\ ІП7 1 1оМ") - щ - щ + 2
. Сг-С? 1
1п2 /3 12 ’
(15)
(16)
где
г
Ск = (-1)‘ /
е Х1пкхйх, к = 1,2 — интегралы Эйлера. Результаты
П
Р{Ьп ^1} = 1 —\\ ехр(—ггу(1 — /3)13т :) < 1 — ехр(—п^[31 <
т=1
Согласно первой лемме Бореля—Кантелли, вероятность «меры 0» распределения Ьп соответствует области сходимости ряда, члены которого имеют вид (17). В качестве мажоранты (17) возьмем ряд 1 /11+£, который сходится при любом £>0и расходится при е ^ 0. Таким образом, область слишком больших значений Ьп будет определяться неравенством п^(31~1 < 1/1, которое заменой переменной (13)) и последующим логарифмированием преобразуется к виду
1п7 + £ 1п/3 < — 1п(1 + £ — к^п). (18)
Учитывая, что £ > 0, 1п/5 < 0, 1сЩрП < 0, £(1 — \og|3n)~l = о(1), заменим (18) более строгим неравенством
г > 1п“1/3(-1п(1 -\ogpn) -г(1 - \ogpn)-1 -1п7),
откуда после элементарных преобразований и обратной замены (13) окончательно получаем
, . , (1 — 1оё/3гг) 1п/3 ( 1п7^
' > -1088" - (1 — 1овд «> м +1 К(1 -1о8в п) + м) +1
1п7'
(19)
Поскольку события в пространстве величин К^ при п, I —> оо независимы, и смена знака неравенства (18) влечет расходимость ряда (17) (простейший случай второй леммы Бореля—Кантелли), верхней границей Ьп будет наибольшее натуральное число, удовлетворяющее неравенству, противоположному (19), т.е.
к{п) =
1п7ч
+ 1, (20)
где [ • ] означает целую часть.
При установлении 1\(п) по аналогии с (17) получим
П
Р{Ьп ^ 1} = ]^[ ехр(—ггу(1 — [3)[3т~1) < ехр(—п'у/З1
пг=1+1
(21)
Следовательно, область малых значений Ьп будет определяться решением неравенства ехр(—п^(31) < 1/1. Используя вместо (13) £ = I + \о%рП (при этом следует учесть, что £ < 0) и преобразуя (21), аналогично предыдущему случаю окончательно получаем
(1п 1п п — 1п(— 1п /?)) 1п п < °ё/3 п + (|п1пп — 1п(— 1п/3)) 1пп + 1
X (^(-к^Д-к^п)) +
1п(— 1п /5) 1п7
1п [3
1п /3
(22)
Нижнюю границу определим как минимальное натуральное I, удовлетворяющее неравенству, противоположному (22):
Іі(п) =
(1п 1п?г — 1п(— 1п/3)) 1п?г °§/зп + |пп _ |п ^ |пп _|_ ^
1п(— 1п/3) ІП7
1п (3
1п (З
+ 1. (23)
Таким образом, вывод соотношений (20), (23) служит доказательством следующей теоремы.
Теорема 2. Длина максимальной серии успехов в марковской цепи при
оо «почти всюду» заключена в границах 1\(п) ^ Ьп ^ £2 (и), вычисляе-
п
мых согласно (23), (20)
8 10 -Іс^п)
В качестве иллюстрации на рис. 1 приведён отрезок смоделированной методом Монте—Карло траектории длины максимальной серии успехов в марковской цепи с параметрами ро = 1/2, а = (3 = 1/3. Средняя линия представляет собой (15), нижняя и верхняя границы — графики зависимостей (23), (20). Для лучшей наглядности использован логарифмический масштаб оси абсцисс.
3. Длина максимальной серии успехов в марковской цепи. Точное распределение. Точное распределение Ьп в симметричной цепи Бернулли
Рис. 1. Отрезок траектории случайного блуждания длины максимальной' серии успехов (в виде рекуррентной схемы) приведено в [8]. Для в двоичной марковской цепи обобщения на случай марковской цепи с произвольными параметрами ро, а, (3 введем в рассмотрение две последовательности вероятностей
о(°} = Р{Ьп < I, Хп = 0}, а1/; = Р{Ьп < I, Хп = 1}, п ^ 1, I < п. (24)
,(1)
Согласно формуле полной вероятности для последовательностей (24) будем иметь систему рекуррентных уравнений:
(0)
V/
1-й), п = 1;
аЛ,/ + (1-/%1-и, п>
0,
(0)
п = 1; 1 < п < I;
При I = 1 очевидно будет тождественным нулем. Точный ряд распределения на основании (24) получаем в виде Р{Ьп = 1} = уп{1) = <?«,/+1 — <?«,/, п ^ 1, 1 ^ I ^ п.
4. Асимптотическое распределение максимальной длины и числа локальных монотонных трендов во временном ряду строго стационарного процесса.
Предельная форма распределения комбинированных трендовых серий £п = = тах{Ь^,Ь~} была приведена (без вывода) и исследована в [7]. Вывод опирается на представление цепи отношений порядка (> / <) в виде схемы Пойа и интегральный способ вычисления вероятностей. Доказательство нормально-пуассоновской асимптотики и взаимной независимости величин длинных серий схемы Пойа по аналогии с цепью Маркова заключается в следующем.
Справедливость аналога леммы из п. 1 для цепи кодированных последовательных разностей легко доказывается с помощью интегрального способа вычисления вероятностей. Повторяя вывод и ограничиваясь для краткости малыми цепочками, в качестве исходного примем равенство, очевидное в силу несовместности комбинируемых событий
Р{х 1,Ж2,Жз,0,Ж4,Ж5 иЖ1,Ж2,Жз,1,Ж4,Ж5} =
= Р{Ж1,Ж2,Жз,0,Ж4,Ж5} + Р{Ж1,Ж2,Жз,1,Ж4,Ж5}.
Вероятности комбинируемых событий, как показано в [8,9], вычисляются через повторные интегралы, которые в символической записи имеют следующий вид:
/*1 /** /** /** /*1 /** /**
Ро= (1х (1х (1х (1х (1х <1х,
3 о </* </* </* х о * </* Г25)
/*1 /** /** /** ГХ /** /** ' '
Рг= (1х (1х (1х (1х (1х (1х <1х,
J О <7* J * J * J О «/ *
где каждый из интегралов на интервале 0 < ж < 1 берется в пределах / ,
</ X
гх
если соответствующее звено цепи равно 0, и / —если 1. С помощью эле-
■1о
ментарных преобразований убеждаемся, что при сложении ро + р\ третий по счету справа интеграл в (25) становится полным следовательно, пра-
вый тройной интеграл становится не зависящей от ж константой. Тем самым
/*1 /** /** /** /* 1 /•* /**
Р0+Р1 = / Лх (1х / (1х / С?ЖХ / (1х / (1х / с?ж = Р{жь ж2, ж3}Р{жь ж2}, J О «/ * «/ * ^ 0 «/ *
и аналог леммы из п. 1 для цепи кодированных последовательных разностей доказан.
Данная схема рассуждений естественным образом обобщается на произвольную длину как разделяемых, так и разделяющей цепочек, если имеет место полная сумма по всем комбинациям разделяющей цепочки. Справедливость полученного результата для стационарного процесса при любом законе распределения следует из общеизвестного факта о существовании взаимно однозначного универсального автопреобразования любой непрерывной величины в стандартную равномерную.
Уп. — <
Для доказательства асимптотики и анализа числовых характеристик К^ в рассматриваемой схеме Пойа используем тот же прием, что и при анализе цепи Маркова в п. 1. При этом во избежание разночтений относительно длины восходящего тренда и соответствующей битовой серии в цепи кодированных последовательных разностей условимся оперировать длиной исходного временного ряда, т.е. битовому отрезку вида 01... 10 будет соответствовать
1-1
восходящий локальный тренд длиной I. Далее на основании леммы для цепи кодированных последовательных разностей, произведя непосредственный подсчёт вероятностей по аналогии с (2), получим
'1, п = 0;
0, 1 ^ п ^ I — 1;
(7+1)! ’ п = I;
12+1~1 п > 7 I 1
. (1+2)! ’ П ^ 1 +
Произведя вычисления, аналогичные п. 1, находим
щ = Иш 1 = (26)
^ га—>оо П 1 1 1 (I + 2)! У 7
°1 = Иш ~В[Е1П)] =ш(1 + 77ТТЙ “ (21 + “ 2^21 ~ ^+1), (27)
п->ОО П V (/ + 1)! /
а2к1 = Иш ±£>[Д<га) + Дг(га)] =
’ п^оо п
/ 4 к 41 \
= (нк + ш) (^1 + + (Г+Т)1~~ ^ + к ~ ^ + ~~
— 4 (Рк+1 — Рк+1+\) — 2(/Х2 к — Ц-2к+1 + Р-21 — Р21+\)- (28)
Сравнивая (27) с (26), убеждаемся, что при I —> оо <т2 —> щ так, что
Щ-о? _0/ 13
Ш \(1 + 2)\,
Коэффициент парной корреляции рщ на основании (27), (28) составит
ак.1 ак а\ рк,1 = -
2(Тк(г 1
{ к I \
= \(& + 1)!(I + 1)\^к ~ ^к+1 ^к+1+1) — (^ + ^ + 3)ркРь (29)
Как видно из (29), (26), коэффициент корреляции строго отрицателен и при больших к, I имеет оценку
■к + 1
>у/Ш
(ЭД
Начальный фрагмент матрицы р^д, к, I € {2,3,... ,7} трендовых серий имеет вид
/ 1 -0,533 -0,352 -0,199 -0,1 -0,045 \
-0,533 1 -0,321 -0,172 -0,084 -0,037
-0,352 -0,321 1 -0,097 -0,046 -0,02
-0,199 -0,172 -0,097 1 -0,023 -9,862 • 10" -3
-0,1 -0,084 -0,046 -0,023 1 -4,491 • 10" -3
V- -0,045 -0,037 -0,02 -9,862 • 10“3 -4,491 • 10“3 1 /
Таким образом, соотношения (26)—(30) завершают доказательство теоремы 1 для схемы Пойа, соответствующей цепи кодированных последовательных разностей временного ряда строго стационарного процесса с непрерывным состоянием.
Далее, воспроизведя схему рассуждений, использованную при выводе (12), получаем предельную форму распределения вида
vn(l) =ехр(~(та~1) ~exp(-(w~1)(Z + i)i)> (31)
Положим в (31) n — 1 = a(l +1)!, где a — константа порядка 1. Соседние члены (31) с номерами I и I + 1 представим в виде
vnil) = ехр(-aj-±-^) -exp(-aZ), vn(l + 1) = exp(-yqjg)
Учитывая, что vn(l) = vn(l + 1) = 1/2, получаем a = In 2. Таким образом, последовательность
n2(l) = [1 + (I + 1)! In2] w [(I + 1)! In 2] (32)
соответствует фазе симметрично расщепленной двойной изолированной моды:
Р {Ln2 = 0 ~ Р {Ln2 = ^ + 1} ~ 1/2.
Оценки первых отброшенных членов составляют:
V2(I — 1) = ехр(—I In 2) — ехр(-(/2 — 1) In 2) = 0(2_г);
„2(< + 2) = ехр((( + ч‘"(2+4)) - ехр(^) = 0(1п2/().
Другую последовательность характерных значений п представим в виде
гц(1) = [(I + 1)!/?(/)]
и определим fj(l) из условия V\(l) —> шах. Подставляя П\(1) в (31), получаем vi (I) = exp (-/jj-jtl) - exp (-pi) и ехр(—/3) - exp (-131).
Заменой переменной £ = ехр(—(3(1)) приходим к функции вида </?(£) = £ — максимум которой достигается в точке £ = Обратной подстановкой
находим
(33)
После подстановки п\(1) в (31) получаем оценку
(I) = 1 — 0(1п 1/1).
Следовательно, последовательность значений длины временного ряда (33) соответствует фазе изолированной моды, т.е. предельной формой распределения в этой фазе является вырожденное: Р {ЬП1 = 1} ~ 1. Оценки максимальных отброшенных членов составляют:
Таким образом, можно считать установленным фактом «атипичность» предельной формы распределения длины максимального локального тренда в стационарном временном ряду. Её особенность заключается в том, что с возрастанием п она циклически эволюционирует от симметричного бинарного до полностью вырожденного распределения. При этом её ареал последовательно пробегает все значения натурального ряда. Точный закон распределения Ьп в виде рекуррентной схемы получен в [8].
5. Закон больших чисел для максимальной длины локального тренда. При установлении закона больших чисел для длины максимального локального (монотонного) тренда во временном ряде «белого шума» воспользуемся пуас-соновской асимптотикой и взаимной независимостью величин К^ трендовых серий, а также схемой рассуждений, аналогичной п. 2, заменив нестрогие неравенства на строгие. Для верхней границы будем иметь
Ряд рі сходится. Следовательно, при п ^ (I + 1)! 1п //(^ — 1) верхняя граница интервала допустимых значений не превосходит I + 1. Для нижней границы по аналогии с (22) будем иметь
VI (I — 1) = О (1//), VI (I + 1) = О (1п 1/1).
Подставив в (34) п\(1) вместо пи1 + 1 вместо I, получаем оценку
Р{Ьп < 1} = ехр ^ (п - 1)
171^1
(ш + 1)! (ш + 2)!
т т + 1
Подставляя (32) в (36), получаем оценку нижней границы
Р{п > п2(1),Ьп <1} ~ 2~1. (37)
Объединяя (35), (37), убеждаемся, что при 1\ = I, 12 = I + 2 интервалы
(г + 1)! 1п 2 <п-1 < (1 + 3)!1п(г + 2)
I 1
покрывают все множество М, пересекаясь между собой. Следовательно, согласно лемме Бореля—Кантелли при любом достаточно большом п множество практически реализуемых значений максимальной трендовой серии состоит не более чем из четырёх подряд стоящих значений: Ьп € {1(п), 1(п) + 1, 1(п) + 2,1(п) + 3}.
При 12 = 1\ + 1 интервалы
[I + 1)! 1п 2 < п - 1 < [I + 2)!Ь^+1)
не пусты. Следовательно, внутри каждого такого интервала множество реализуемых значений сокращается до трёх: Ьп € {1{п), 1(п) + 1,1(п) + 2}. Таким образом, длина максимальной трендовой серии гораздо «менее случайна», чем серия успехов в цепи Бернулли—Маркова, и можно считать доказанной теорему, аналогичную предыдущей.
Теорема 3. Длина максимального монотонного тренда во временном ряду белого шума при п —> оо лишь конечное число раз может выйти за границы множества четырёх подряд стоящих значений; на интервале
(1 + 1)Пп2<п-1<(1 + 2 )!1п(*+ 1)
множество практически реализуемых значений сокращается до трёх:
Ьп € {1{п), 1{п) + 1,1{п) + 2}.
Очевидным следствием теоремы 3 является её справедливость при переходе от временного ряда белого шума к последовательной выборке из совокупности с любым непрерывном распределением. Иллюстрацией данного закона может служить показанный на рис. 2 отрезок траектории случайного блуждания длины максимального восходящего тренда во временном ряду белого шума, полученного путем статистического эксперимента.
В заключение представляется интересным отметить следующий факт. Если битовый поток, образуемый в результате кодирования последовательных разностей во временном ряду белого шума, «рассчитать на первый — второй», то образующиеся две взаимодействующие «шеренги» каждая внутри себя будет состоять из невзаимодействующих битов, т.е. будет совпадать с результатами последовательных опытов с симметричной монетой. Доказательство данного факта очевидно. Во-первых, симметричность следует из равновероятности отношений порядка между любыми двумя соседними членами временного ряда, во-вторых, независимость следует из того, что последовательные разности, номера которых отличаются более чем на «1», не содержат общих членов исходного временного ряда.
Рис. 2. Отрезок траектории случайного блуждания максимальной длины локального восходящего тренда в стационарном временном ряду
Одним из непосредственных и актуальных приложений приведенных в статье результатов, как можно заключить, например, по содержанию [6], а также по информации, размещенной в Интернете, является тестирование алгоритмических генераторов псевдослучайных чисел. В контексте подобных приложений речь идет фактически о теоретико-вероятностном обосновании и алгоритме трёхступенчатой мониторинговой фильтрации генерируемой (или любой исследуемой) последовательности. Параллельный анализ серий неудач, очевидно подчиняющихся тем же законам, удваивает количество фильтрующих ступеней, доводя его до шести.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Самарова С. С. О длине максимальной серии «успехов» для марковской цепи с двумя состояниями // ТВП, 1981. Т. 26, №3. С. 510-520; англ. пер.: Sam.arova S. S. On the length of the longest head-run for a Markov chain with two states // Theory Probab. Appl., 1982. Vol. 26, no. 3. Pp. 498-509.
2. Успенский В. А., Семёнов А. Л., Шенъ A. X. Может ли (индивидуальная) последовательность нулей и единиц быть случайной?// УМН, 1990. Т. 45, №1(271). С. 105-162; англ. пер.: Uspenskiy V.A., Sem.enov A.L., Sheri A.Kh.. Can an individual sequence of zeros and ones be random? // Russian Math. Surveys, 1990. Vol. 45, no. 1. Pp. 121-189.
3. Въюгин В. В. О длине максимальной серии «успехов» в индивидуальной случайной последовательности // ТВП, 1997. Т. 42, №3. С. 608-615; англ. пер.: V’yugin V. V. On the longest head-run in an individual random sequence// Theory Probab. Appl, 1998. Vol. 42, no. 3. Pp. 541-546.
4. Савельев Л. Я., Балакин С. В. Совместное распределение числа единиц и числа 1-серий в двоичных марковских последовательностях // Дискрет, матем., 2004. Т. 16, №3. С. 43-62; англ. пер.: Savelyev L. Ya., Balakin S. V. The joint distribution of the number of ones and the number of 1-runs in binary Markov sequences// Discrete Math. Appl, 2004. Vol. 14, no. 4. Pp. 353-372.
5. An introduction to probability theory and its applications. Vol. 1. New York: Wiley & Sons, 1968. 509 pp.; русск. пер.: Феллер В. Введение в теорию вероятностей и её приложения. Т. 1. М.: Мир, 1984. 499 с.
6. Knuth D. The Art of Computer Programming. Vol. 2: Seminumerical Algorithms. Reading, Massachusetts: Addison-Wesley, 1997. xiv+762 pp.; русск. пер.: Кнут Д. Искусство программирования. Т. 2: Получисленные методы. М.: Вильямс, 2007. 832 с.
7. Плотников А. Н. Об одном парадоксе закона больших чисел для максимальных серий в последовательной выборке // Известия Самарского научного центра РАН, 2009. Т. 11, №5. С. 122-126. [Plotnikov А. N. On the paradox of the law of large numbers for the maximum series in sequential sampling // Izvestiya Sam.arskogo nauchnogo tsentra RAN, 2009. Vol. 11, no. 5. Pp. 122-126].
8. Плотников A. H. Закон распределения длины максимальной серии и его статистические приложения// Известия Самарского научного центра РАН, 2006. Т. 8, №4. С. 1047-1056. [Plotnikov A.N. Law distribution of length for maximal series and its statistical applications // Izvestiya Sam.arskogo nauchnogo tsentra RAN, 2006. Vol. 8, no. 4. Pp. 1047-1056].
9. Барвинок В. А., Богданович В. И., Плотников А. Н. О спектральной структуре серий в последовательной выборке стационарного процесса, Тезисы докладов XVII Всероссийской школы-коллоквиума по стохастическим методам (Кисловодск, 1-8 мая 2010 г.) //
ОПиПМ, 2010. Т. 17, №3. С. 382-384. [Barvinok V.A., Bogdanovich V.I., Plotnikov А. N. On the spectral structure of the series in sequential sampling for stationary process // Obozr. Prikl. Promyshl. Matem., 2010. Vol. 17, no. 3. Pp. 382-384].
Поступила в редакцию 20/VII/2012; в окончательном варианте — 23/XI/2012.
MSC: 60J10; 60G50, бОЕхх
ON A QUESTION OF LIMITING DISTRIBUTION OF SERIES IN RANDOM BINARY SEQUENCE
V. A. Barvinok, V. I. Bogdanovich, A.N. Plotnikov
S. P. Korolyov Samara State Aerospace University (National Research University),
34, Moskovskoe sh., Samara, 443086, Russia.
E-mails: barvinok®ssau.ru, bogdanovicMSssau.ru, [email protected]
Limiting forms of distribution of length of the maximum series of successes in random, binary sequences, formed in Bernulli-Markov’s chain and in Polya’s scheme which is an equivalent to local trends of a time series of strictly stationary process are investigated. More simple and added proof of theorems of the law of the big numbers for series of both types is offered. For series of the second type the effect of the cyclic bimorphism of the limiting law with degeneration on one of the phases and the convergence according to the probability on set no more, than four consequent values of the natural series is established.
Key words: random, sequence, the maximum series of successes, limiting theorems, convergence on distribution, convergence on probability.
Original article submitted 20/VII/2012; revision submitted 23/XI/2012.
Vitaly A. Barvinok (Dr. Sci. (Tech.), Corresponding member of RAS), Head of Dept., Dept, of Manufacture of Flying Machines and Quality Management in Mechanical Engineering. Valery I. Bogdanovich (Dr. Sci. (Tech.)), Professor, Dept, of Manufacture of Flying Machines and Quality Management in Mechanical Engineering.
Andrey N. Plotnikov (Ph. D. (Tech.)), Associate Professor, Dept, of Manufacture of Flying Machines and Quality Management in Mechanical Engineering.