2015 Псевдослучайные генераторы № 1(27)
УДК 519.214.5
О РАСПРЕДЕЛЕНИИ ЧИСЛА ЕДИНИЦ В ДВОИЧНОЙ МУЛЬТИЦИКЛИЧЕСКОЙ ПОСЛЕДОВАТЕЛЬНОСТИ1
Н. М. Меженная
Московский государственный технический университет им. Н. Э. Баумана, г. Москва,
Россия
Работа посвящена исследованию устойчивости теоретико-вероятностной модели, описывающей генератор Пола. Для этого изучено распределение случайной величины, равной числу единиц в выходной последовательности мультициклического генератора над полем GF(2) в случае, когда двоичные случайные величины, заполняющие регистры, независимы, а вероятности появления единиц в регистрах отличны от 1/2 и могут меняться с ростом длин регистров. Получены точные выражения математического ожидания и дисперсии для этой случайной величины. В случае когда число регистров фиксировано, получены условия, при которых распределение нормированного числа единиц сходится к распределению произведения независимых случайных величин, каждая из которых распределена по стандартному нормальному закону. Доказана нормальная предельная теорема для нормированного числа единиц в случае, когда число регистров стремится к бесконечности. Результаты показывают, что нарушение свойства равновероятности распределения знаков в регистрах приводит к существенным изменениям свойств указанных предельных распределений по сравнению с равновероятным случаем.
Ключевые слова: мультициклическая последовательность, генератор Пола, центральная предельная теорема.
ON DISTRIBUTION OF NUMBER OF ONES IN BINARY MULTICYCLE SEQUENCE
N. M. Mezhennaya Bauman Moscow State Technical University, Moscow, Russia E-mail: [email protected]
The work is devoted to studying the stability of probability-theoretical model which describes Pohl generator. For the purpose, we investigate the distribution of random variable equalled to the number of ones in the outcome sequence of a multicycle generator over the field GF(2) in the case when binary random variables filling the registers are independent and the probabilities of one's occurrences in registers differ from 1/2 and can change with growing the registers lengths. The exact expressions for expectation and variance of the random variable are given. For the case when the number of registers is finite, we derive the conditions under which the distribution of normalized number of ones converges to the distribution of the product of independent random variables each of which is distributed by standard normal law. We prove the
1 Работа выполнена при финансовой поддержке Министерства образования и науки РФ (тема №1.2640.2014).
central limit theorem for normalized number of ones when the number of registers tends to infinity. It is shown that breaking the property of equiprobable distribution for binary characters in registers results in significant differences of properties of the limit distributions compared to equiprobable case.
Keywords: multicycle sequence, Pohl generator, central limit theorem.
Введение
Пусть X« = , i = l,...,r;
PIX« = 1} = l - P{X« = 0} = рг, j = 0,...; иг — l, (1)
случайные величины, образующие наборы X(1),... , X(r), независимы в совокупности. При этом знаки X(), j = 0,... ,иг — 1, представляют собой заполнения i-го регистра X (г), i = 1,... , r. Обычно считается, что числа и1,... ,иг попарно взаимно просты.
Пусть последовательность Zt, t = 0,... ,и1,... иг — 1, образована по правилу
Z = 0 X«), (2)
г=1
где t(H) = t mod и. Последовательность Zt, построенную по формуле (2), принято называть мультициклической [1, 2].
Если случайные величины, представляющие заполнения регистров, независимы в совокупности и распределены равновероятно, то последовательность представляет собой естественную теоретико-вероятностную модель выходной последовательности мультициклического генератора с r регистрами (генератора Пола).
Свойства мультициклической последовательности Zt при равновероятном распределении знаков в наборах X(1),... ,X(r) изучены в работах [2-5]. В [2] отмечено, что если выходная последовательность Zt имеет длину порядка у/и1... иг и менее, то она обладает свойствами, аналогичными свойствам последовательности из независимых равновероятно распределённых двоичных случайных величин. Это позволяет использовать генератор Пола в качестве генератора псевдослучайных чисел с большой длиной цикла (примеры других генераторов с большой длиной цикла можно найти в [6, 7]).
В работах [3-5] изучен случай, когда длина выходной последовательности равна длине полного цикла и1 • ... • иг. В [3] в предположении, что регистры заполнены равновероятными независимыми случайными величинами, получены оценки точности аппроксимации распределения числа единиц в мультициклической случайной последовательности логнормальным распределением и распределением произведения r независимых нормальных случайных величин.
Интересным представляется вопрос, как изменится предельное распределение числа единиц в выходной последовательности при нарушении условий модели, связанных с независимостью случайных величин, представляющих заполнения регистров. В [5] показано, что замена условия независимости знаков, образующих заполнения регистров, на условие их конечной зависимости не меняет вид предельных распределений.
В настоящей работе проведено исследование устойчивости данной модели для случая, когда двоичные знаки, образующие наборы X(1), . . . , X(r), независимы, а их вероятности могут меняться с ростом длин регистров. Оказывается, что в этом случае предельные распределения числа единиц в выходной последовательности могут существенно отличаться от предельных распределений, приведённых в работах [3, 5].
1. Основные результаты
Обозначим
«;-1 «,1...гаг-1
Si = Е Х«,г = 1,...,г, Сг = Е ^. ¿=0 ¿=0
Известно [3], что
п1... пг — 2£г = (п1 — 251)... (щ — 25г). (3)
Теорема 1. Пусть случайные величины в наборах X(1),... , X(г) независимы в совокупности и имеют распределения (1). Тогда
Е£, = 1 щ ...щ — П (1 — 2р)); (4)
Об- = 1 ^П (п?(1 — 2р*)2 + 4щр(1 — р)) — (щ ... щ П (1 — 2р)) ^ . (5)
Доказательство. Вычислим математическое ожидание случайной величины £г. Из (3) следует, что
Е£г = 1 (п1... щ — Е(п1 — 251)... (щ — 25г)) = = 1 (щ ... щ — (п1 — 2Е^)... (щ — 2Е5г)) =
= 1 (п1 . . . Пг — (п1 — 2П1Р1) ... (щ — 2пгрг)) = 2П1 . . . Пг ^ 1 — П (1 — 2рг.
Теперь вычислим дисперсию. Из (3) получим
Б^г = 1Б ((щ — 2^)... (щ — 25)) =
= 1 (Е ((щ — 2^)2 ... (щ — 25)2) — (Е(щ — 25)... (щ — 25))2) = 1
- (Е(щ — 251) ... Е(щ — 25) — ((щ — 2щ1р1)... (щ — 2щгрг)) )
Так как
Е(щ — 25)2 = Е(щ — + 2^ — 25)2 = (щ — 2^»^»)? + 4Е(щр — 5)2 = щ2(1 — 2рг)2 + 4Б5 = щ2(1 — 2рг)2 + 4^(1 — р),
то
БСг = 4 ^П (щ2(1 — 2р)2 + 4щр(1 — р)) — ... щ П (1 —
Теорема доказана. ■
Замечание 1. При р1 = ... = рг = 1/2 формулы (4) и (5) совпадают с формулами (4) работы [3].
5*-_щ р -
Пусть 5* = г г г , г = 1,..., г. Тогда
— р-)
И» — 25 = щ(1 — 2р) — 2^,^(1 — Рг)5* = 2^,^(1 — р^ ( щг(1 ^ 2р^ — £*
\ 2^/ щ^р^ (1 — р^)
п,(1 - 2рг) г п1 . . . пг - 2£г
Обозначим а, =---, = -—-. Из (3) следует, что
гда-гы 2, ^ пМ1 -
& = П (а - 5,*). (6)
,= 1
Перенумеруем векторы X(1),..., X(г) так, что |а1| ^ |а2| ^ ... ^ |аг|. Теорема 2. Пусть случайные величины в наборах X(1),... , X(г) независимы в совокупности и имеют распределения (1). Пусть п1,...,пг Л то и вероятности р, = = р,(п,), г = 1,... , г, меняются так, что п,р,(1 — р,) Л то, г = 1,... , к. Тогда если
а, Л с, € К, г = 1,..., к, |а,| Л +то, г = к + 1,..., г, 1 ^ к ^ г — 1,
е- а Л
то - Л Ц П,, где случайные величины п1,... , Пг независимы и имеют нор-
а*+1 ... аг ,= 1
мальный закон распределения со средними с1,... , сг соответственно и единичными дисперсиями.
Доказательство. Заметим, что при указанных условиях выполнены условия теоремы Муавра — Лапласа для случайных величин 5*, г = 1,... , к [8, гл. I, § 6], значит, при к = г утверждение теоремы очевидно. Пусть к ^ г — 1. Из (6) следует, что
г 1 г ---=-П (а, - 5*) =
а*+1 . . . аг а*+1 . . . аг ,= 1 (7)
= (а1 - 5*)... (а* - 5*) - — ...(1 - -5*) .
V а*+1 + / V аг )
При г = к + 1,..., г из неравенства Чебышева имеем Р
1 - - 5* - 1 а,
> х\ = Р {|5*| > |а,|х} ^ ^^ = —^.
(а,х) (а,х)2
Так как правая часть в неравенстве (8) стремится к нулю в условиях теоремы, то из (7) и (8) следует, что
а, - 5* Л п,, а, Л с,, г = 1,..., к, 1 р
1--5* Л 1, |а,| Л +то, г = к + 1,...,г.
а,
Тогда из (7) и независимости случайных величин 5*,..., 5* получаем утверждение теоремы. ■
Замечание 2. Условия теоремы 2 выполнены, если, например,
1 с, 1 А,
р, =---, г = 1,...,к, р, =---—, г = к + 1,...,г,
2 л/ п, 2 Л/ п,
где с1,..., с* — постоянные, а А*+1,... , — бесконечно большие величины, такие, что А/^/п, Л 0 при п1,... , пг Л то. В этом случае главный член дисперсии случайной величины (см. (5)) равен
4г Е П пА2 П п!с?.
,=*+1 ^'=*+1,...,г; 1=1
Следствие 1. Пусть выполнены условия теоремы 2 и а — 0 Е К, г = 1,... , г. „ ^ г
Тогда £г П П, где случайные величины п1,... , пг независимы и имеют стандартный 1=1
нормальный закон распределения.
Замечание 3. Следствие 1 указывает условия на характер изменения вероятностей р1,... , рг, при выполнении которых сохраняет свой вид предельное распределение следствия 2 работы [3].
Теорема 3. Пусть случайные величины в наборах X(1),... , X(г) независимы в совокупности и имеют распределения (1). Пусть при ^1,...,^ — вероятности р^ = рД^), г = 1,... ,г, меняются так, что — р^) — то. Если |а»| —
Сг — «1... аг
1,
г, то закон распределения случайной величины
сходится к стандартному нормальному закону. Доказательство. Из (6) имеем
1 г 1 -П(« — ) = («1 — 5*) 1 — -
а2 ... аг»=1 V а2
а2 ... аг
а1 ...ам/а1 + а2 +... + а2
1 — — 5г
«г
г С* г 5* 5*
«1| 1 — Е - + ЕЕ (—1Г л...
1=1 1=2 КЛ<...<Л ^г
«Л ... «Л
= — Е ^ + Е Е (—1)'
1=1 1=2 1<^1<...<^;<г «л — «л
Заметим, что при х > 0 в силу неравенства Чебышева
Р
Е Е (—1)»
1=2 Кл<...<л^г 1
^ А б( ЕЕ (—1)»^ 1 £
х2
^Е Е Е Е (—1)ж/ ссу
^=2 1<П1<...<П;<г
а^П ... 5?* а^ ...
«Л . . . «Л
Л
х2
1=2 1? <...<Пг<г »' = 2 1^1 <..<,/ ^г
^ ...
ПО)
1
^Е Е Е
Е
я1
«Л . . . «Л
Й1
Яки
Як.-.
х" 1=2 Кл<...<л^г »'=2 1<Й1<...<кг/ ^г
Заметим, что
Б (5*1 ...?)=Е(5*1 ...? )2 = Е(5*1 )2... ек)
Если существует /, для которого ^ Е {к1,... , к»/}, то
ссу I Л . . . ' ... ^
Б5* ... ББ*.
?1 ?г
1.
ссу (
о* о* с* °Л ' ...
тр / о* С* С* С* \ _
Е 1 ? ... 5 л . . . ^ 1 =
_ тт\ о* рл ( с* С* С* С* С* С* \ _ а
= EБЛЕ ^л . . . ^г-1^*1+1 . . . 5 л. . . = 0.
Значит, ссу ... 5*., ... = 0 только при г = г', ^ = ..., ^ = к
_ / с** С* С* С* \ I Л / \ л
ссу . . . ?, ? . . . ? = Б (5? 1 . . . ? = 1. Подставляя последнюю оценку в (10), получаем
/и
Р
Е Е М)*^
1=2 1<л<...<*г<г «л .
>х
1г
^ -2 Е
х
Е
'=2 Кл<...<л^г
Й1
П1)
«л ... «л
2
2
«л . . . «л
Так как-1--> 0 при любом г ^ 2, правая часть формулы (11) стремится к нулю.
Значит,
ал ... а,?г
е а1 ...аг - / £--+- - п I , (12)
Д +... + а12 \,=1 а,\Д +... + 4 ^ +... + *
где
п = Е Е (-l),Л 0. (13)
,=2 1<л<...<?г<г ал . . . ал
Далее из свойств нормального распределения, ограниченности коэффициентов
1 г
1 • 1 ^
--при всех г = 1,... , г выражения ^--, независимости
а, у а* + ... + а^р ,=1 а,/1* + ... + 4
случайных величин 5*,... , 5* и сходимости их распределений к стандартному нор-
г с *
,
мальному закону получаем, что случайная величина -, имеет в пре-
,=1 а,/1 +... + ъ
деле стандартный нормальный закон распределения. Значит, из формул (12), (13) и симметричности плотности распределения стандартного нормального закона следует утверждение теоремы. ■
Замечание 4. Условия теоремы 3 выполнены, если, например, случайные величины в наборах X(1),...,X(г) независимы в совокупности, п, Л +то при всех г = 1,... , г, а вероятности р, остаются постоянными.
Теперь обратимся к случаю, когда число регистров г при переходе к пределу стремится к бесконечности.
Теорема 4. Пусть случайные величины в наборах X(1),... , X(г) независимы в совокупности и имеют распределения (1), р, = р,(п,), г = 1,... , г. Пусть при г Л +то величины п1,... , пг и р1,... ,рг меняются так, что
г , \ 2 £ |а,|—3(р,(1 - р,))-3/4
Е Е ^аV Л0 и ,=1 / г 1 чз/2--►0. (14)
^ а
гр „ - а1 . . . аг
Тогда закон распределения случайной величины --сходится
а1 ...^уа? + ... + а*
к стандартному нормальному закону.
Доказательство. Воспользуемся представлением (9). Из оценки (11) и первого из условий (14) следует соотношение (13). Значит, остаётся показать, что при г Л то
Г О *
,
случайная величина V = -/ сходится по распределению к стандарт-
ному нормальному закону.
,=1 а,л/а* + ... + а*
Для этого воспользуемся неравенством Берри — Эссеена [8, с. 356], согласно которому при любом ж € К
(ж) - Ф(ж)| ^ С-
г Е а 15* 3
,=1 а,
1+1 + ... + (Х^3/2 а2 Чаи
С
г 3
Е
,=1 а,
1
1
2 + ... + "2 а1 аг
3/2
15)
Оценим отдельно каждое слагаемое в числителе правой части последней оценки. В силу неравенства Ляпунова [9, с. 48] имеем
з
Е
*
5
Ы
1 Е|5*|3 ^(Е(5*)4^3/4
Ы3
Для вычисления Е(5*)4 воспользуемся производящей функцией моментов для биномиальной случайной величины 5,. Обозначим через (¿) = Ее4Х производящую функцию моментов случайной величины X. Имеем
.-пр. (¿) = Ее^—= е-Ее"* = е-^ (¿) = е-1 - р, + р,е*)п
Тогда
Е(5*)4
1
¿4
(п,р,(1 - р,))2
ад
4=0
п,р,(1 - р,)
(п,р,(1 - р,)) 24 1
(1 + 3(п, - 2)р,(1 - р,))
24п,р,(1 - р,)
(1 + 3(п, - 2)р,(1 - р,)) ^
1
3
1 + т(п, - 2) ^
1
3
--п,
1
24п,р,(1 - р,) V 44 , 7 24п,р,(1 - р,)4 , 32р,(1 - р,)' Поэтому в правой части неравенства (15) получим
С £ |а,|—3(р,(1 - р,))-3/4
(ж) - Ф(ж)| ^ —3/4^-
(32)3
1
1
а2 + ... + 02 а1 аг
3/2
В условиях теоремы правая часть последней оценки стремится к нулю при г Л то. ■
Замечание 5. Условия теоремы 4 выполнены, если, например, случайные величины в наборах X(1),...,X(г) независимы в совокупности, г Л +то, п, Л +то, а
вероятности р, остаются постоянными, Е Е
п1
0и
п
,=1
-3/2
,=2 Кл<...<.7;^г п.1 . . .
г 1
Е -
,= 1 п,
3/2
0.
Замечание 6. Вместо условий (14) теоремы 4 можно написать более простые, но несколько более грубые условия:
3
- Л 0, шах{(р,(1 - р,))—3/4)-0- Л 0. а2 а21 г
а
1
Действительно,
Е Е
i=2 1<ji<...<ji<r
ai
"л
<Е Е
i=2 1<ji<...<ji<r
a1
ai aj2
< E Cr a2 ( ) = a2 E Cr a2 2i
i=2
i=2
(1 + a-2)r - 1 - О*) < a2 ( er/a2 - 1 - 0* ) < a2 ^ er/a2 =
Значит, если r/a2 ^ 0, то выполнено первое из условий (14) Аналогично
<
2a2
er/a2.
E|ai|"3(Pi(1 - Pi))"3/4
i=1
t A
i=1 ai
3/2
max|(p^1 - pi))
, t H-3
-3/4 \ _ <
t A
i=1 ai
3/2
< max|{pi(1 - Pi)) 3/41
|a1|3(ra-2)3/2
max|(Pi(1 - Pi)) 3/41
|a1|^v/r'
Значит, если правая часть последней формулы стремится к нулю, то выполнено второе условие в (14).
Заключение
Проведено исследование устойчивости модели, описывающей генератор Пола. Для этого изучены вероятностные свойства числа единиц в выходной последовательности мультициклического генератора над полем GF(2) в случае, когда двоичные случайные знаки, заполняющие регистры, независимы, а вероятности появления единиц в регистрах отличны от 1/2 и могут меняться с ростом длин регистров. Для случая фиксированного числа регистров доказана предельная теорема о сходимости распределения нормированного числа единиц к распределению произведения независимых случайных величин, каждая из которых распределена по стандартному нормальному закону. Доказана также нормальная предельная теорема для нормированного числа единиц в случае, когда число регистров стремится к бесконечности. Результаты показывают, что нарушение свойства равновероятности распределения знаков в регистрах приводит к существенным изменениям свойств указанных предельных распределений по сравнению с равновероятным случаем.
Автор выражает признательность В. Г. Михайлову за ценные замечания и постоянное внимание к работе.
ЛИТЕРАТУРА
1. Pohl P. The multicyclic vector method of generating pseudo-random numbers. I. Theoretical background, description of the method and algebraic analysis. Report TRITA-NA-7307. Stockholm, Sweden: Royal Inst. of Technology, 1973. 36 p.
2. Pohl P. Description of MCV, a pseudo-random number generator // Scand. Actuarial J. 1976. No. 1. P. 1-14.
3. Меженная Н. М., Михайлов В. Г. О распределении числа единиц в выходной последовательности генератора Пола над полем GF(2) // Математические вопросы криптографии. 2013. Т. 4. №4. С. 95-107.
2
2
a
л
2
2
2
a
2
2
2
3
r
a
r
4. Меженная Н. М. Предельные теоремы для числа плотных серий с заданными параметрами в выходной последовательности генератора Пола // Инженерный журнал: наука и инновации. 2013. №4(16). С. 1-8.
5. Mezhennaya N. M. Convergence rate estimators for the number of ones in outcome sequence of MCV generator with m-dependent registers items // Siber. Electr. Math. Rep. 2014. V. 11. P. 18-25.
6. Douglas W. M. A nonlinear random number generator with known, long cycle length // Cryptologia. 1993. V. 17(1). P. 55-62.
7. Deng L.-Y. and Xu H. A system of high-dimensional, efficient, long-cycle and portable uniform random number generators // ACM Trans. Modeling Comp. Simul. 2003. V. 13(4). P. 299-309.
8. Ширяев А. Н. Вероятность. М.: Наука, 1989. 581с.
9. Севастьянов Б. А. Курс теории вероятностей и математической статистики. М.: Наука, 1982. 256 с.
REFERENCES
1. Pohl P. The multicyclic vector method of generating pseudo-random numbers. I. Theoretical background, description of the method and algebraic analysis. Report TRITA-NA-7307. The Royal Institute of Technology, Department of Information Processing and Computer Science, Stockholm, Sweden, 1973. 36 p.
2. Pohl P. Description of MCV, a pseudo-random number generator. Scand. Actuarial J., 1976, no. 1, pp. 1-14.
3. Mezhennaja N. M., Mihajlov V. G. O raspredelenii chisla edinic v vyhodnoj posledovatel'nosti generatora Pola nad polem GF(2). Matematicheskie Voprosy Kriptografii, 2013, vol.4, no.4, pp. 95-107. (in Russian)
4. Mezhennaja N. M. Predel'nye teoremy dlja chisla plotnyh serij s zadannymi parametrami v vyhodnoj posledovatel'nosti generatora Pola. Inzhenernyj Zhurnal: Nauka i Innovacii, 2013, no. 4(16), pp. 1-8. (in Russian)
5. Mezhennaya N. M. Convergence rate estimators for the number of ones in outcome sequence of MCV generator with m-dependent registers items. Siber. Electr. Math. Rep., 2014, vol. 11, pp. 18-25.
6. Douglas W. M. A nonlinear random number generator with known, long cycle length. Cryptologia, 1993, vol. 17(1), pp. 55-62.
7. Deng L.-Y. and Xu H. A system of high-dimensional, efficient, long-cycle and portable uniform random number generators. ACM Trans. Modeling Comp. Simul., 2003, vol. 13(4), pp. 299-309.
8. Shirjaev A. N. Verojatnost'. Moscow, Nauka Publ., 1989. 581 p. (in Russian)
9. Sevast'janov B. A. Kurs teorii verojatnostej i matematicheskoj statistiki. Moscow, Nauka Publ., 1982. 256 p. (in Russian)