Научная статья на тему 'Критерий значимой однородности двоичных последовательностей'

Критерий значимой однородности двоичных последовательностей Текст научной статьи по специальности «Математика»

CC BY
163
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКАЯ НЕРАЗЛИЧИМОСТЬ / КРИТЕРИЙ СТАТИСТИЧЕСКОЙ ОДНОРОДНОСТИ / СЛУЧАЙНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / ПСЕВДОСЛУЧАЙНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / ДЛИНА ВЫБОРКИ / ИМИТАЦИОННАЯ МОДЕЛЬ / ДОВЕРИТЕЛЬНЫЙ ПОЛУИНТЕРВАЛ / ВЕРОЯТНОСТНЫЙ МОМЕНТ / ОЦЕНКА ВЕРОЯТНОСТНОГО МОМЕНТА / STATISTICAL INDISTINGUISHABILITY / CRITERION OF STATISTICAL HOMOGENEITY / RANDOM SEQUENCE / PSEUDORANDOM SEQUENCE / LENGTH OF SAMPLE / SIMULATION MODEL / TRUST HALF-INTERVAL / PROBABILISTIC MOMENT / PROBABILISTIC MOMENT ASSESSMENT

Аннотация научной статьи по математике, автор научной работы — Ширшова Дарья Вадимовна

Целью данной статьи является формирование комплекса алгоритмических процедур, образующих критерий статистической однородности двух последовательностей на всех длинах частных выборок до заданной максимальной, или критической. Актуальность данного комплекса обусловлена задачей замены всех или ряда последовательностей, используемых при имитационном моделировании, более простыми в алгоритмическом отношении их эквивалентами, т.е. альтернативными реализациями для освобождения части аппаратных ресурсов ЭВМ. Рассмотренные подходы к применению двухэтапного вида критерия статистической однородности выборок случайных или псевдослучайных последовательностей по вероятностным моментам первого и второго порядков реализованы в многоцикловом варианте, что является отличительной особенностью данного метода. В качестве основного аргумента используется длина выборки. Приведены примеры работы критерия для зон статистической однородности и неоднородности псевдослучайных последовательностей (ПСП). Разработанный критерий позволяет дать оценку статистической однородности последовательностей на выборках, не кратных периоду. Особенность рассмотренного подхода заключается в его двухэтапности, подразумевающей сравнение по АКФ для последовательностей, имеющих внутренние корреляционные зависимости. Применение данного критерия в имитационных моделях позволит сократить аппаратные, временные или алгоритмические затраты, что достигается путем замены одной последовательности другой, но более простой в плане реализации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CRITERION OF SIGNIFICANT HOMOGENEITY OF BINARY SEQUENCES

The purpose of this article is to form a complex of algorithmic procedures, forming a criterion of statistical homogeneity of two sequences at all lengths of partial samples to a given maximum or critical. The relevance of this complex is due to the task of replacing all or a number of sequences used in the simulation with their simpler equivalents in algorithmic terms, that is by alternative implementations for the release of computer hardware resources. The considered approaches to the use of a two-stage type of statistical homogeneity criterion for random or pseudo-random sequences samples by the probabilistic moments of the first and second orders are implemented in a multi-cycle version, which is a distinctive feature of this method. The main argument is the length of the sample. Examples of work of criterion for zones of statistical homogeneity and heterogeneity of pseudo-random sequences (PRS) are given. The developed criterion allows us to assess the statistical homogeneity of sequences on samples that are not multiples of the period. The peculiarity of the considered approach is its two-stage character, implying a comparison by ACF for sequences with internal correlation dependencies. The use of this criterion in simulation models will reduce hardware, time or algorithmic costs, by replacing one sequence with another, which is easier to implement.

Текст научной работы на тему «Критерий значимой однородности двоичных последовательностей»

УДК 519.24:681.3 ББК 32.971

Д.В. ШИРШОВА

КРИТЕРИЙ ЗНАЧИМОЙ ОДНОРОДНОСТИ ДВОИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ*

Ключевые слова: статистическая неразличимость, критерий статистической однородности, случайная последовательность, псевдослучайная последовательность, длина выборки, имитационная модель, доверительный полуинтервал, вероятностный момент, оценка вероятностного момента.

Целью данной статьи является формирование комплекса алгоритмических процедур, образующих критерий статистической однородности двух последовательностей на всех длинах частных выборок до заданной максимальной, или критической. Актуальность данного комплекса обусловлена задачей замены всех или ряда последовательностей, используемых при имитационном моделировании, более простыми в алгоритмическом отношении их эквивалентами, т.е. альтернативными реализациями для освобождения части аппаратных ресурсов ЭВМ. Рассмотренные подходы к применению двухэтапного вида критерия статистической однородности выборок случайных или псевдослучайных последовательностей по вероятностным моментам первого и второго порядков реализованы в многоцикловом варианте, что является отличительной особенностью данного метода. В качестве основного аргумента используется длина выборки. Приведены примеры работы критерия для зон статистической однородности и неоднородности псевдослучайных последовательностей (ПСП). Разработанный критерий позволяет дать оценку статистической однородности последовательностей на выборках, не кратных периоду. Особенность рассмотренного подхода заключается в его двухэтапности, подразумевающей сравнение по АКФ для последовательностей, имеющих внутренние корреляционные зависимости. Применение данного критерия в имитационных моделях позволит сократить аппаратные, временные или алгоритмические затраты, что достигается путем замены одной последовательности другой, но более простой в плане реализации.

Из года в год сложность имитационных моделей растет, возникает необходимость в формировании все большего числа последовательностей, имитирующих внешние воздействия на объект моделирования. Алгоритмически сложные, они перегружают ресурсные возможности ЭВМ, что приводит к невозможности реализации многомерных моделей при традиционных алгоритмических формированиях двоичных чисел. Поэтому актуальной является задача замены всех или ряда последовательностей более простыми в алгоритмическом отношении их эквивалентами, т.е. альтернативными реализациями.

Идеальное решение состоит в попарной проверке последовательностей по всем вероятностным моментам, основываясь на соблюдении стационарности в узком смысле. Однако такое решение в рамках конечной размерности невозможно. Практически для ограниченных временных фрагментов имитирующих процессов достаточно обеспечить их стационарность в широком смысле. Это означает неизменчивость моментных функций до второ-

* Работа поддержана грантом РФФИ, проект № 18-47-160001.

го порядка, чем для двоичной последовательности являются вероятность и корреляция.

Таким образом, требуется создать такой инструмент взаимного сравнения последовательностей, который бы выявлял значимую сопоставимость основных параметров вероятностных распределений на заданных выборках. Основания для формулировки сходства последовательностей следует искать на основе критериев согласия или интервального оценивания [3, 5, 7].

Цель статьи - сформировать комплекс алгоритмических процедур, образующих критерий статистической однородности двух последовательностей на всех длинах частных выборок до заданной максимальной, или критической. В качестве кратно реализуемых процедур критерия уместно воспользоваться известными решениями задач определения значимой однородности числовых последовательностей при фиксированной длине выборки.

Отметим особенность выражения начальных вероятностных моментов к-го порядка для случайных событий бинарного типа через вероятности совпадений к событий. Эти события могут быть как однородными (например, появление единиц на к различных временных позициях относительно друг друга), так и смешанными (единицами и нулями). Для двоичных последовательностей, стационарных в широком смысле, достаточно, например, воспользоваться в качестве начального момента первого порядка вероятностью появления единицы, а второго порядка - вероятностью появления двух единиц, разнесенных интервалом времени т. Первое представление соответствует математическому ожиданию, а второе вместе с первым - корреляционной функции от аргумента т. Следовательно, выбор параметров критериального поиска статистической однородности в любом смысле можно свести к набору соответствующих вероятностей.

Назовем случайную последовательность, удовлетворяющую условиям имитационного эксперимента, базовой (БП), а претендента на эквивалентную обозначим как альтернативную (АП). Двоичные последовательности признаются статистически однородными, если дисперсионный разброс оценок выбранных вероятностей не позволяет их значимо различить как на заданной длине частных выборок, так и на всех предыдущих меньших.

Признаком отличия псевдослучайных последовательностей (ПСП) как моментом первого порядка является математические ожидания базовой (БП) и альтернативной (АП) последовательностей. Фактом значимого отличия является возможность статистически наблюдать оригинальные вероятностные свойства каждой последовательности. Существующие классические критерии проверки гипотез о виде распределения или однородности выборок использовать для решения данной задачи нельзя ввиду невозможности аппроксимации реального распределения практически апробированными распределениями по генеральной выборке, а также ввиду наличия внутренних зависимостей исходных исследуемых выборок [1, 2, 4, 6].

Эти зависимости подразумевают создание нового двухэтапного критерия, основная часть которого - сравнение исследуемых выборок на предмет

схожести по моментам первого порядка, а дополнительная часть - по моментам второго порядка с использованием в качестве «калибровки» функции СКО оценок автокорреляционной функции (АКФ), определяющей внутренние зависимости ПСП [8].

Общий вид критерия значимой однородности ПСП. Постановка критерия определяется задачей нахождения максимальной длины двоичных последовательностей <а> и <Ь> при условии их статистической однородности с заданным уровнем значимости а. Пусть а,, Ь , е {0, 1} - элементы этих последовательностей, <а> - БП, удовлетворяющая условиям имитационной модели; <Ь> - заданная тестируемая АП. В общем случае элементы последовательностей зависимы, что выражается необходимой для имитационной модели формой АКФ.

Признак однородности - это математические ожидания Р и Р БП и АП, соответственно. В качестве признака однородности выберем средние значения последовательностей, которые при указанном двоичном алфавите совпадают со средней частотой появления символа 1. На генеральных выборках они представляются вероятностями Ра и РЬ, где индексы обозначают принадлежность к соответствующей последовательности. Основная независимая переменная, максимальное значение которой надо найти, п - длина (размер, объем) частной выборки, заданная независимо от периодических свойств БП и АП. Глубина корреляционного анализа по аргументу сдвига ттах. Величина птах ограничивает п в тестовом эксперименте (п = 1, птах). Заданный уровень значимости критерия а - вероятность ошибки первого рода. Для выборок, состоящих из зависимых элементов, тестируемым параметром однородности служит автокорреляционная функция АКФ. В общем случае для двух выборок, в том числе и зависимых, определение их однородности по математическому ожиданию можно осуществить на основе статистики, пропорциональной эмпирическому расхождению средних значений обеих последовательности и обратно пропорциональной стандартному отклонению этих расхождений вида

, =м "И (1)

"'* и Т *

ЛР *

ности.

Завершается процедура одной итерации статистического критерия однородности сравнением полученной эмпирической статистики 4мп с критическими значениями ¿кр(а) на основании принятия подходящего закона распределения случайных величин ЛР* и уровня значимости а. Тогда

, (< (аХ то ^

если Ч> ^(а), то Н°, (2)

где Но - принятие нуль-гипотезы об однородности с вероятностью ошибки а; Н1 - отклонение Н0, т.е. принятие альтернативной гипотезы о неоднородности.

В предлагаемой постановке задачи необходимо проследить на заданном уровне значимости а многократные факты принятия нуль-гипотезы Н0 при

... ^ где ЛР* = Р* - РЬ и Т * - разности средних значений и дисперсия этой раз-

всех значениях п от 1 до пкр, где пкр < птах. Полученная величина пкр - 1 характеризует размерность имитационной модели в отношении использования данной имитирующей последовательности.

При традиционном статистическом подходе рабочие для (1) признаки однородности по математическому ожиданию выражены для обеих двоичных

Г>* и*

последовательностей оценками Ра и Ръ, придающих статистике эмпирический характер. Тогда все компоненты выражения (1) находятся численными методами математической статистики на основании заданных для испытания на однородность частных выборок последовательностей <а> и <Ъ>. Пусть <С> = <а> - <Ъ>. Тогда образуем из выборки

'С2Сз ...dj , (3)

полученной разностной последовательности <С> множества Бп в количестве птах, состоящие из N частных выборок по п элементов согласно следующей схеме (фрагмент из начальных элементов С1 ... С7):

Си

С5

&>

С7

Тогда

Б = {(СД^),^),^),...,^)},

Б2 = {(С1С2),(С2Сз),(СзС4),(С4С5),...,(С^ Сщ+1)},

Бз = {(С1С2Сз),(С2СзС4),(СзС4С5)5(С4С5Сб)5...5(С^ С^+2)},

Б4 = {(d1 d2dзd4),(d2Сзd4С5), (Сзd4С5d6),(d4d5d6d7),...,

(' N0 dN0 +1 ' N0 + 2' N0 + з )},

Бп = ...Сп ),(С2СзС4 ...Сп + Л

птах 1 2 з птах 2 з 4 птах + 17

^N0 +^N0 + 2 ... + птах -1)}.

iзd4d5 ...Сптах + 2

Для полного использования заданной выборки необходимо обеспечить

N = N0 + птах "1. (4)

Из алгоритмических соображений реализации описанной схемы заданную выборку (з) представим матрицей птах х N0:

с11 С2 сз . с,. • 'N0

d2 сз с4 • с,+1 • СМо+1

Сз с4 С5 • ',+2 • СЫ0+2

'п Сп+1 Сп+2 • • С,+п-1 • ■ С^+п-1

'пт.х+1 Спт,х+2 • * • СМ

С1 1 С12 С1 з ••С1 , •С1 N0

С21 '22 С2 з ••С2 , •С2 N

Сз 1 Сз 2 Сзз •••'з N0

¿п 1 ¿п 2 ¿п з • •■■СпМ„

'птах 1 ^х 2 'птахз • •■■'п^о

Образуя суммы вида тп = = ¿ы , нетрудно выразить оценки погрешности совпадения по вероятности АР* = Р* — Р1■ * = тгй/п для каждого

п = 1, птах . Слагаемыми в сумме являются элементы частных выборок длиной п. В качестве примера для тц и тп, связь этих сумм с элементами матрицы ¿|| как слагаемыми показана на следующей схеме:

¿11 ¿12 ¿13 1 ¿2

¿2

¿31 ¿32 ¿33

¿п 1 ¿п

.¿2 .¿3

■■■¿1Ы

■ ..¿3

¿ , ¿ 2 ¿ 3 ____¿

птах 1 птах 2 птах 3 птах 1 п.

т31 т32 т33 ■т31 ■■■т3Щ

"птах 1"'птах 2 "'птах 3 •

(6)

Обозначим матрицу сумм ||тпг||.

Несмотря на то, что величины Р и Р являются непрерывными, их оценки Р* и Р*, строго говоря, при конечном п дискретны. Дискретной является и их разность АР* как оценка абсолютной погрешности совпадения вероятностей, которую в усредненном виде АР* удобно использовать в роли функции различия (неоднородности) в числителе формулы статистики (1) Мтл . Дробно-рациональные значения перечисленных оценок определяются алфавитом ¿п1 е {— 1, 0,1}, формирующим алфавиттп е {— п, — (п — 1),..., О, (п — 1), п} независимо от эмпирических данных.

Однако для выражения знаменателя этой статистики через дисперсию Птв большинстве практических случаев достаточных аналитических оснований найти не удается. Ограничимся заменой дисперсии на ее оценку ,

превращающую знаменатель (1) также в эмпирическую функцию. Рабочий вариант критериальной статистики представим в следующей форме:

Мт

" (7)

^эмп

тс1

1

тё

Возможность выполнения нуль-гипотезы Н0 реализуется при несмещенном от нуля математическом ожидании числителя. Если выполнено аналогичное требование к знаменателю через исправленную выборочную дисперсию в виде

тё

Ы0 — 1 т

(8)

то эта статистика входит в класс методов статистической проверки гипотез по критерию Стьюдента.

т

т

...т

11

12

т

т

т

21

22

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

23

21

¿

т

т

т

...т

п3

п 1

п 2

пЫ

Закон распределения последовательностей на выборках, не кратных периоду, однозначно определить нельзя. Типичный подход в известных конструкциях критериев безальтернативно подразумевает применение критерия Стьюдента при неизвестной дисперсии оценки числителя критерия.

Общее описание тестовых испытаний критерия значимой однородности ПСП. В процессе проведения тестовых испытаний каждое значение аргумента п предполагает фактическое формирование нескольких одинаковых сумм тп.Число таких сумм обозначим V т , для которого справедливо равенство Уп V т = М0.

тп =-п тп 0

Количественное распределение

для каждого п = 1, птах (9)

представлено в общей форме табл. 1.

Численные значения средней разности и выборочной оценки ее дисперсии выражаются через усреднения сумм частных выборок. Как функции от п они представлены в табл. 2 эквивалентными математическими формулами на основе элементов матрицы \\тт\\ и табл. 1. Выбор конкретной вычислительной формулы производится с учетом алгоритмических предпочтений при программной реализации критерия.

Таблица 1

Общий вид количественного распределения сумм элементов частных выборок

V -п V -п+1 V -1 VI) VI ^-1 Vn

тп -п -п+1 -1 0 1 п-1 п

Таблица 2

Варианты выборочной средней разности и оценки ее дисперсии

Выборочные оценки По строкам матрицы \\тп1\\ По табл. 1

Мт, (п) 1 Мп -М- У т»' Мп '=1 1 У ^ У ^ тп Jvп тп=-п

^ (п) 1 Мп Г _ Ъ тт У \Пш - МП„ (п)\ М п '=1 М- У [тп - Мп„ (п)\2 Vтп JVп тп =-п

< (п) = а2(п) -М2^ (п) 1 М0 2 а2(п) = Т~Х тп' Мп '=1 1 п а 2 (п) = — У m„2v тп М0 тп=-п

С учетом (8) формула статистики (7) примет вид

>1

¿змп (п) = Мтё (п)

Мп -1

N0 (п)

Используя элементы матрицы \\тпг\\ и запись выборочной оценки дисперсии через оценку второго начального момента а2(п), получаем расчетную формулу статистики, выражающую случайную величину для сравнения с границами двусторонней критической области:

N 0

Е тп

(эмп (п) =-

N0

N о -1

(м о

^ Е тп, - Е .

г=1

,=1

N0

(10)

N -

о

1

N0 2 г -2.

Математически эквивалентную форму статистики также можно получить на основе распределения (9) по табл. 1 через переменные тп и V .

тп

Цепочка алгоритмических процедур нахождения максимальной длины выборок обеих последовательностей, обладающих значимой однородностью по вероятности, в общем виде следующая:

« П = 1 Птах , N 0, N , < а >-< Ь >=< Л |К

^ 2. , 2.2 , 2. ^

N 0

N 0

1< (кр ^ н0, ттп (|

^ N0

где 2т = Ет. , 2 2 = Ет„

^ т ¿—< п, ^ т2 ¿—! п

22 = т

"кр ' ^ 0'

V

11тп^1 ^

|< (кр ) = пкр ,

(11)

,=1

г=1

Е тп

¿ш^ п

=1

целочисленные переменные,

образованные элементами матрицы ||тп,|| и представляющие в (10) исходные

«2 и Мт

из табл. 2, соответственно.

переменные Мт

Пример. Пусть даны две двоичные последовательности

<а> = 111100010011010, ... и <Ь> = 000000001100010, ..., тогда результирующая последовательность (РП) будет сформирована вычитанием элементов АП из элементов БП <Л> = <а> - <Ь>:

№ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 БП 11110001001 1 0 1 0 АП 00000000110 0 0 1 0 РП 1 1 1 1 0 0 0 1 -1 -1 1 1 0 0 0 По результирующей последовательности строится матрица выборок Л по формуле (3), представляющая собой последовательность, сдвинутую на количество тактов, равное порядковому номеру строки, в которой записана последовательность (рис. 1):

Рис. 1. Фрагмент матрицы выборок ^ для первых восьми разрядов последовательности по формуле (3)

, =1

2

И

Полученный материал используется при формировании матрицы mj по формуле (6), элементы которой получаются путем суммирования соответствующего элемента матрицы йц и всех вышестоящих элементов данного столбца указанной матрицы (табл. 3):

Таблица 3

Матрица Ш/, полученная по формуле (5) для первых восьми разрядов последовательности <й>

Номер разряда последовательности <й>

1 2 3 4 5 6 7 8

1 1 1 1 0 0 0 1

2 2 2 1 0 0 1 0

3 3 2 1 0 1 0 -1

4 3 2 1 1 0 -1 0

4 3 2 2 0 -1 0 1

4 3 3 1 -1 0 1 1

4 4 2 0 0 1 1 1

5 3 1 1 1 1 1 1

По результирующей последовательности строится матрица ут для после -дующего нахождения математического ожидания и среднеквадратического отклонения с целью построения статистики критерия (табл. 4):

Таблица 4

Матрица частот vШ для первого этапа критерия

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п Ш

-2 -1 0 1 2 3 4 5 6 7

1 0 2 6 7 0 0 0 0 0 0

2 1 0 6 4 4 0 0 0 0 0

3 0 2 3 5 3 2 0 0 0 0

4 0 1 3 5 3 2 1 0 0 0

5 0 1 3 2 5 2 2 0 0 0

6 0 1 2 4 0 5 3 0 0 0

7 0 0 3 3 2 0 7 0 0 0

8 0 0 0 7 0 2 3 3 0 0

9 0 0 0 3 5 0 4 2 1 0

10 0 0 0 2 2 5 2 3 1 0

11 0 0 0 1 2 3 5 3 1 0

12 0 0 0 0 2 3 5 3 2 0

13 0 0 0 0 0 4 4 6 0 1

14 0 0 0 0 0 0 7 6 2 0

15 0 0 0 0 0 0 0 15 0 0

В табл. 5 приведены математические ожидания, дисперсии, а также эмпирические статистики критерия, вычисленные по формуле (1) и соответствующие длинам выборки п для табл. 2.

Полученная эмпирическим путем статистика сравнивается со статистикой критерия Стьюдента на предмет успешного прохождения для ошибки первого рода а = 0,05. На рис. 2 представлены графики исследуемой эмпирической статистики и статистики критерия Стьюдента.

Таблица 5

Математическое ожидание, дисперсия, эмпирическая и теоретическая статистики для первого этапа критерия

п мт М 2 1у1т От ¿эмп ^Стьюд

1 0,33 0,11 0,49 0,48

2 0,67 0,44 1,16 0,62 12,7

3 1,00 1,00 1,47 0,83 4,3

4 1,33 1,78 1,69 1,03 3,18

5 1,67 2,78 2,09 1,15 2,78

6 2,00 4,00 2,53 1,26 2,57

7 2,33 5,44 2,76 1,41 2,45

8 2,67 7,11 2,76 1,61 2,36

9 3,00 9,00 2,53 1,89 2,31

10 3,33 11,11 2,09 2,31 2,26

11 3,67 13,45 1,69 2,82 2,23

12 4,00 16,00 1,47 3,30 2,2

13 4,33 18,77 1,16 4,03 2,18

14 4,67 21,78 0,49 6,67 2,16

15 5,00 25,00 0,00 да 2,14

Икршп — 1 О

Рис. 2. Графики эмпирической статистики критерия и статистики критерия Стьюдента

Как видно из рис. 2, для соответствующего уровня значимости и степеней свободы значение теоретической статистики Стьюдента получилось 2,26.

Эмпирическая статистика удовлетворяет выбранным условиям не на всем диапазоне выборки. Так, начиная с п = 10, критерий показывает существенное статистическое различие по вероятности двоичных последовательностей.

Для проверки последовательностей по второму этапу необходимо для исходной базовой М-последовательности <а> = 111100010011010, ..., сформировать дополнительную, сдвинутая на один такт <ат=1> = 111000100110101, ... . Тогда вспомогательная последовательность, характеризующая свойство момента

второго порядка для анализируемой БП, будет сформирована умножением этих двух последовательностей:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

111 10 0 01001 1 0 1 0

111 00 0 1001 1 0 1 0 1

111 00 0 0000 1 0 0 0 0

Аналогичная процедура проводится и для АП, после чего будет сформирована итоговая последовательность вычитанием элементов АП из элементов

БП < а >т=1 = < а >т=1 -< Ь >т=1:

№ БП БП =

РПБПт=1

№ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

БП Т=1 1 1 1 0 0 0 0 0 0 0 1 0 0 0 0

АП т=1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0

РП т=1 1 1 1 0 0 0 0 0 -1 0 1 0 0 0 0

По полученной последовательности для данного сдвига также строится матрица \т для последующего нахождения математического ожидания и среднеквадратического отклонения, с целью построения статистики критерия для момента второго порядка (табл. 6):

Таблица 6

Матрица частот гт для второго этапа критерия

п т

-1 0 1 2 3 4

1 1 10 4 0 0 0

2 2 7 4 2 0 0

3 2 6 4 2 1 0

4 2 5 4 2 2 0

5 2 4 4 2 3 0

6 2 4 2 3 4 0

7 1 6 0 2 6 0

8 0 6 2 0 6 1

9 0 4 3 2 4 2

10 0 3 2 4 4 2

11 0 2 2 4 5 2

12 0 1 2 4 6 2

13 0 0 2 4 7 2

14 0 0 0 4 10 1

15 0 0 0 0 14 1

В табл. 7 приведены математические ожидания, дисперсии, а также эмпирические статистики критерия, вычисленные по формуле (1) и соответствующие длинам выборки п.

Как и на предыдущем этапе, была выбрана ошибка первого рода а = 0,05. На рис. 3 представлены графики эмпирической и теоретической статистики критерия Стьюдента.

Для соответствующего уровня значимости и степеней свободы значение теоретической статистики получилось 2,22.

Рис. 3 демонстрирует согласие не на всем диапазоне выборки. Так, начиная с п = 12 критерий показывает существенное статистическое различие двоичных последовательностей по моменту второго порядка.

Таблица 7

Математическое ожидание, дисперсия, эмпирическая и теоретическая статистики критерия для второго этапа критерия

п мт м 2 т От ^эмп ^Стьюд

1 0,20 0,04 0,29 0,37

2 0,40 0,16 0,77 0,46 12,70

3 0,60 0,36 1,17 0,55 4,30

4 0,80 0,64 1,49 0,66 3,18

5 1,00 1,00 1,73 0,76 2,78

6 1,20 1,44 2,03 0,84 2,57

7 1,40 1,96 2,24 0,94 2,45

8 1,60 2,56 2,24 1,07 2,36

9 1,80 3,24 2,03 1,26 2,31

10 2,00 4,00 1,73 1,52 2,26

11 2,20 4,84 1,49 1,80 2,23

12 2,40 5,76 1,17 2,22 2,20

13 2,60 6,76 0,77 2,96 2,18

14 2,80 7,84 0,29 5,17 2,16

15 3,07 9,41 0,06 12,32 2,14

2 4 5 Й 10 12 14

Рис. 3. Графики эмпирической статистики критерия и статистики критерия Стьюдента для РПТ=1

Выводы. 1. Разработанный критерий позволяет дать оценку статистической однородности последовательностей на выборках, некратных периоду. Особенность данного подхода заключается в его двухэтапности, подразумевающей сравнение по АКФ для последовательностей, имеющих внутренние корреляционные зависимости. Возможное применение критерия - в имитационных моделях, для сокращения аппаратных, временных или алгоритмических затрат, что достигается путем замены одной последовательности другой, но более простой в плане реализации.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Рассмотрен подход к применению двухэтапного вида критерия. Определена задача нахождения максимальной длины двоичных последовательностей

и <Ь> при условии их статистической однородности с заданным уровнем значимости а. Дано понятие статистики, на основе которой осуществляется определение однородности двух выборок, в том числе и зависимых. Эта статистика пропорциональна эмпирическому расхождению средних значений обеих последовательности и обратно пропорциональной стандартному отклонению этих расхождений. Дается определение критических зон, позволяющих принять или отклонить нуль-гипотезу об однородности с вероятностью ошибки а.

3. Сформирован комплекс алгоритмических процедур, образующих критерий статистической однородности на всех длинах частных выборок до заданной максимальной, или критической. Приведен общий вид количественного распределения сумм элементов частных выборок.

4. Рассмотрены примеры получения эмпирической статистики критерия и представлены графики сравнения ее со статистикой критерия Стьюдента.

Литература

1. Ватутин В.А., Ивченко Г.И., Медведев Ю.И., Чистяков В.П. Теория вероятностей и математическая статистика в задачах. М.: Дрофа, 2003.

2. Вентцель Е.С. Теория вероятностей. М.: Физматлит, 1962.

3. Иванов М.А., Чугунков И.В. Теория, применение и оценка качества генераторов псевдослучайных последовательностей. М.: КУДИЦ-ОБРАЗ, 2003.

4. Кремер Н.Ш. Теория вероятностей и математическая статистика. М.: ЮНИТИ-ДАНА,

2002.

5. Кузнецов В.М., Песошин В.А. Генераторы случайных и псевдослучайных последовательностей на цифровых элементах задержки. Казань: Изд-во Казан. гос. техн. ун-та, 2013.

6. Ниворожкина Л.И., Морозова З.А. Теория вероятностей и математическая статистика. М.: Эксмо, 2008.

7. Песошин В.А., Кузнецов В.М. Генераторы псевдослучайных и случайных чисел на регистрах сдвига. Казань: Изд-во Казан. гос. техн. ун-та, 2007.

8. Песошин В.А., Кузнецов В.М., Ширшова Д.В. Генераторы равновероятностных псевдослучайных последовательностей немаксимальной длины на основе регистра сдвига с линейной обратной связью // Автоматика и телемеханика. 2016. № 9. С. 136-149.

ШИРШОВА ДАРЬЯ ВАДИМОВНА - старший преподаватель кафедры компьютерных систем, Казанский государственный технический университет имени А.Н. Туполева (КНИТУ-КАИ), Россия, Казань ([email protected]).

D. SHIRSHOVA

CRITERION OF SIGNIFICANT HOMOGENEITY OF BINARY SEQUENCES

Key words: statistical indistinguishability, criterion of statistical homogeneity, random sequence, pseudorandom sequence, length of sample, simulation model, trust half-interval, probabilistic moment, probabilistic moment assessment.

The purpose of this article is to form a complex of algorithmic procedures, forming a criterion of statistical homogeneity of two sequences at all lengths of partial samples to a given maximum or critical. The relevance of this complex is due to the task of replacing all or a number of sequences used in the simulation with their simpler equivalents in algorithmic terms, that is by alternative implementations for the release of computer hardware resources. The considered approaches to the use of a two-stage type of statistical

homogeneity criterion for random or pseudo-random sequences samples by the probabilistic moments of the first and second orders are implemented in a multi-cycle version, which is a distinctive feature of this method. The main argument is the length of the sample. Examples of work of criterion for zones of statistical homogeneity and heterogeneity of pseudo-random sequences (PRS) are given. The developed criterion allows us to assess the statistical homogeneity of sequences on samples that are not multiples of the period. The peculiarity of the considered approach is its two-stage character, implying a comparison by ACFfor sequences with internal correlation dependencies. The use of this criterion in simulation models will reduce hardware, time or algorithmic costs, by replacing one sequence with another, which is easier to implement.

References

1. Vatutin V.A., Ivchenko G.I., Medvedev Yu.I., Chistyakov V.P. Teoriya veroyatnostei i matematicheskaya statistika v zadachakh [Probability theory and mathematical statistics in problems]. Moscow, Drofa Publ., 2003.

2. Venttsel' E.S. Teoriya veroyatnostei [Probability theory] Moscow, Fizmatlit Publ., 1962.

3. Ivanov M.A., Chugunkov I.V. Teoriya, primenenie i otsenka kachestva generatorov psevdosluchainykh posledovatel'nostei [Theory, application and quality evaluation of pseudorandom sequence generators]. Moscow, KUDITs-OBRAZ Publ., 2003.

4. Kremer N.Sh. Teoriya veroyatnostei i matematicheskay astatistika [Probability theory and mathematical statistics]. Moscow, YuNITI-DANA Publ., 2002.

5. Kuznetsov V.M., Pesoshin V.A. Generatory sluchainykh i psevdosluchainykh posledovatel'nostei na tsifrovykh elementakh zaderzhki [Random and pseudo-random sequence generators on digital delay elements]. Kazan, Kazan Technical University Publ., 2013.

6. Nivorozhkina L.I., Morozova Z.A. Teoriya veroyatnostei i matematicheskaya statistika [Probability theory and mathematical statistics]. Moscow, Eksmo Publ., 2008.

7. Pesoshin V.A., Kuznetsov V.M. Generatory psevdosluchainykh i sluchainykh chisel na registrakh sdviga [Генераторы псевдослучайных и случайных чисел на регистрах сдвига]. Kazan, Kazan Technical University Publ, 2007.

8. Pesoshin V.A., Kuznetsov V.M., Shirshova D.V. Generatory ravnoveroyatnostnykh psevdosluchainykh posledovatel'nostei nemaksimal'noi dliny na osnove registra sdviga s lineinoi obratnoi svyaz'yu [Generators of the equiprobable pseudorandom nonmaximal-length sequences based on linear-feedback shift registers]. Avtomatika i telemekhanika, 2016, no. 9, pp. 136-149.

SHIRSHOVA DARIA - Senior Lecturer of Computer Systems Department, Kazan State Technical University named after A. Tupolev (KNITU-KAI), Russia, Kazan (Ein-stein_Darya@mail. ru).

Формат цитирования: Ширшова Д.В. Критерий значимой однородности двоичных последовательностей // Вестник Чувашского университета. - 2018. - № 3. - С. 243-255.

i Надоели баннеры? Вы всегда можете отключить рекламу.