Красильников Михаил Петрович - научный сотрудник лаборатории Геоинформатики и моделирования процессов Тувинского Института Комплексного освоения природных ресурсов СО РАН, E-mail: [email protected]
Krasil'nikov Michail - research associate of Laboratory of Geoinformatics and modeling processes Tuvinian Institute for Exploration of Natural Resources of Siberian Branch of the Russian Academy of Sciences (TuvIENR SB RAS), E-mail: [email protected]
УДК 519.24
СТАТИСТИКА ТРАЕКТОРИЙ ЛИНЕЙНОЙ АВТОРЕГРЕССИОННОЙ ПОСЛЕДОВАТЕЛЬНОСТИ С СИГНАТУРНЫМ УПРАВЛЕНИЕМ
Савельев Л.Я.
Новосибирский государственный университет, Новосибирск Тувинскийгосударственныйуниверситет, Кызыл
STATISTICS TRAJECTORIES LINEAR AUTOREGRESSIVE SEQUENCE WITH SIGNATURE MANAGEMENT
Savelyev L. Y.
Novosibirsk state university, Novosibirsk Tuvan state university, Kyzyl
В работах А.И. Жданка [1,2] подробно описываются свойства специального осциллирующего случайного блуждания.Результаты компьютерного моделирования асимптотического поведения этого блуждания описаны в работе А.И. Жданка и Н.Б. Ивирсиной [3]. Там сформулирован ряд задач и указана обширная литература. В предлагаемой работе выводятся некоторые новые формулы и приводятся результаты дополнительных вычислений, которые подтверждают сделанные в [3] выводы.
Ключевые слова: марковская цепь, авторегрессия, траектория, сигнатурное управление.
In the works of A.I. Zhdanok [1,2] describes in detail the properties of a special oscillating random walk. The results of computer simulation of the asymptotic behavior of this walk are described in the works A.I. Zhdanok and N.B. Ivirsinoy [3]. It made a number of tasks and contains an extensive literature. In this paper, some new formulas are derived and the results of additional calculations, which confirm in [3] conclusions.
Key words: Markov chain, autoregression, trajectory, a signature management.
1. Постановка задачи и результаты. В общем виде рассматриваемая рекуррентная последовательность случайных переменных х = (x[n]), n е N определяемая равенствами
x[n] = x[n -1] + y[n] (х[0] = 0)
y[n] = a[n - 1](X[n]a + (1 - £[n])b) + (1 - a[n - 1])(£[n]c + (1 - £[n])d)
где X = (X[n]) - последовательность Бернулли независимых случайных переменных, принимающих значения 0 и 1 с вероятностью 1/2 и a, b, c, d - различные вещественные числа. Сигнатурное управление задается последовательностью случайных
переменных а = (а[п]), определяемой равенствами а[п] = 1, если х[п] > о, и а[п] = 0, если х[п] < 0. Для простоты считается, что х[0] = 0.
Значение х[п] получается сложением х[п -1] с числами а или Ь при х[п -1] > 0 и с числами с или ё при х[п -1] < 0 . Числа а, Ь, с, ё в каждой паре выбираются случайно с вероятностью 1/2 .
Такие последовательности естественно называть линейными авторегрессионными с внутренним сигнатурным управлением. Они могут описывать широкий класс различных процессов. Траектории последовательности х = (х[п]) определяются реализациями последовательности Бернулли X = (£[п]). Верно равенство
х[п] = х[п -1] + ё + (с - ё)Х[п] + а[п - 1](Ь - ё + (а - Ь - с + ё)£[п]) Значениями переменных служат линейные комбинации чисел а,Ь,с, ё с натуральными коэффициентами:
х[п] е X = Ыа + ЫЬ + Ыс + М
Последовательность х = (х[п]) марковская. Ее ненулевые переходные
вероятности выражаются равенствами
Рг[х[п] = х[п -1] + а | х[п -1] > 0] = 1/2 Рг[х[п] = х[п -1] + Ь | х[п -1] > 0] = 1/2 Рг[х[п] = х[п -1] + с | х[п -1] < 0] = 1/2 Рг[х[п] = х[п -1] + ё | х[п -1] < 0] = 1/2
Переходные вероятности составляют 2x2 - матрицу (), в каждой строке которой ровно два элемента 1/2, а остальные равны 0. По-видимому, в общем виде описать структуру переходной матрицы (), ее степеней и свойства полученной марковской последовательности сложно. Структурная сложность определяется прежде всего тем, что управляющие коэффициенты зависят от знаков предыдущих значений последовательности, распределение которых неизвестно и тоже имеет сложный характер. Представляют интерес частные случаи различных конкретных чисел а, Ь, с, ё . В
работах [1,2] рассматривается случай а = 1,Ь = -л/2,с = -1,ё = л/э и в [3] ставятся задачи о распределении последовательности х = (х[п]) со значениями х[п] = х[п -1] + Х[п] - (1 -£М)л/2, если х[п -1] > 0 (1)
х[п] = х[п -1] - Х[п] + (1 - £[п])л/э, если х[п -1] < 0 (2)
Моделируются ее траектории. Приведены результаты вычислений моментов, гистограммы эмпирических распределений и их графическое сравнение с нормальным. Отмечается важность изучения асимптотического поведения случайных блужданий
рассматриваемого типа. Заметим, что иррациональность чисел 72,л/з и 4243 = 46 исключает нулевые значения переменных х[п] при п > 1. Из общей формулы для х[п] следует равенство
х[п] = х[п -1] + 43 - (1 + 43)%[п] - (л/2 + 43)а[п -1] + (2 + 42 + 43)а[п - 1]£[п| (3)
где X = (£М) - последовательность независимых одинаково распределенных случайных переменных, принимающих значения 0 и 1 с вероятностью 1/2, а а[п] = 1, если х[п] > 0, и а[п] = 0, если х[п] < 0 .
Отметим, что в работах [1,2,3] такие последовательности, следуя уже существующей традиции, называются «осциллирующими случайными блужданиями с иррациональными шагами».
В предлагаемой работе приводятся результаты дополнительного статистического анализа такой авторегрессионной последовательности с теми же числами аДсД что и в работах [1,2,3]. По найденным полным множествам значений х[п] при п < 60 описывается динамика распределений ее значений в первые 60 моментов. Она позволяет делать некоторые предположения об асимптотике.
2. Траектории. Множеством значений последовательности х = (х[п]) в рассматриваемом случае служит множество
X = (г - )42 + кл/3 1ге г, ] е ,к е Z+\
Значения г - ^42 + к43 можно отождествить с тройками коэффициентов (г, у, к} и рассматривать последовательности таких векторов с целочисленными координатами. Это возможно благодаря иррациональности чисел 42,43 и 4243 =46 (см. [4]).
Пемма.Единственным целочисленным решением
уравнения х - у42 + гл/э = 0 является нулевое решение х = у = г = 0.
■ Пусть х - ул/2 + г43 = 0 и числа х, у, z целые. Возможно одно из двух: либо все числа х, у, г не равны нулю, либо хотя бы одно из них равно нулю.
Пусть х ф 0, у ф 0, г ф 0. Тогда х2 = 2у2 + 3г2 - 2ху46 и 46 = (2у2 + 372 - х2 )/(2ху) что противоречит иррациональности 46.
Если х = 0, то ул/2 = г43 и 2у = г46 ; если у = 0, то гл/3 = -х; если
г = 0, то у42 = х. Так как числа 42^43^46 иррациональны, то любое из этих равенств возможно только тогда, когда х = у = г = 0 . ■
Следствие. Если г - + кл/3 = I - т42 + пл/3, то г = I, у = т, к = п.
■ Если г - ул/2 + к43 = I - т42 + «л/3, то х - ул/2 + г43 = 0 при х = г -1, у = у - т, г = к - п. По лемме х = у = г = 0 и г = I, у = т, к = п. ■
Кроме того, из леммы и равенств (1-2) следует, что все точки каждой траектории случайной последовательности х = (х[г]) лежат на разных горизонтальных прямых.
Теорема.б каждой последовательности х = (х[г]), определяемой равенствами (1,2) и двоичной последовательностью X = (£[п]), нет одинаковых значений.
■ Рассмотрим значения х[р] = г - ул/2 + кл/3, х[#] = I - тл/2 + п43 такой последовательности для произвольных номеров # > р > 0.
Так как коэффициенты при корнях могут только возрастать, то из равенств у = т,к = п следуют равенства £[р +1] =... = £[д] = 1, при которых эти коэффициенты
равны нулю. Если х[р] > 0,то тогда по (1) I = I + (д - р) > I и х[д] > х[р], а если х[ р] < 0, то по (2) I = г- (д - р) < г и х[д] < х[ р].
Если хотя бы одно из равенств у = т, к = п неверно, то по следствию леммы х[д ] Ф х[ р ].
Таким образом, во всех возможных случаях х[д] Ф х[р] при всех д > р > 0. Следовательно, среди значений последовательности х = (х[ г ]) нет одинаковых. ■
Замечание. Это утверждение (теорема) по существу совпадает с утверждением теоремы 1, доказанной в работе А.И.Жданка [1].
Из теоремы следует, что между последовательностями х = (х[п ]) и Х = (Х[п]) есть взаимно однозначное соответствие. Пусть / = (/[п]) - последовательность Бернулли независимых случайных переменных, принимающих значения 0 и 1 с вероятностью 1/2, такая, что
х[п] = х[п -1] + 7][п] - (1 - д[п])л/2, если х[п -1] > 0 (4)
х[п] = х[п -1] - 7][п] + (1 - д[п])73, если х[п -1] < 0 (5)
Следствие. Если для всех номеров п верны равенства (1-2, 4-5) , то последовательности X = (Х[п]) и г = (г[п]) совпадают.
■ Пусть х[п -1] > 0. Тогда из равенств (1) и (4) следует, что х[п] = х[п -1] +1, Х[п] = г[п] = 1 или х[п] = х[п -1] - 42, Х[п] = г[п] = 0.
Пусть х[п -1] < 0. Тогда из равенств (2) и (5) следует, что х[п] = х[п -1] -1, Х[п] = г[п] = 1 или х[п] = х[п -1] + 43, Х[п] = г[п] = 0.
Равенства Х[п] = г[п] верны для всех номеров п. ■
Таким образом, двоичные последовательности могут служить исходами для вероятностного пространства траекторий последовательности х = (х[п]).
Замечание. Отождествление значений I - уч/2 + к43 с тройками коэффициентов (г, у, к} позволяет свести дело к специальному блужданию по векторной 3Б - решетке. Марковские блуждания по нестандартным решеткам и по пространственным решеткам активно изучаются вместе с марковскими процессами и их приложениями [5,6] .
3. Множества значений. Опишем подробно структуру множества и[5] значений переменной х[5] и кратко структуру множеств и[п] значений переменных х[п] в моменты п = 5,10,15,20,25,30,35,40,45,50,55,60 . Семейство 32-х значений х[5] для всех траекторий имеет вид:
х[5] = |-3л/2 + 2л/3,1 - 242 + 2-У3-1 - 242 + 2-У3-2 - 242 + 43, 1 - 2^2 + 2л/З,-2Т2 ^Л/З,2- 2^2 + л/3,3+ >/3,-1 - 2^2 + 2у[3, -42+243,-2-42+243,З-42+43,2-42+2л/3,-З-42+43, - з-42+л/З,-4 -421 - 242 + 243,-242+43,2 - 242+43, з-42 ^ л/э,-^л/2+л/э,1 -42 ^л/э,-1 -42 ^л/э,1 - 2-42
2 - 272 + 73,1 - 272,3 - 272,4 - 72,3 - 272,4 - 72,4 - 72,5} Среди них всего 18 различных:
и[5] = {-4 - 72,-2 - 272,-2 - 242+73,3 - 72+73,1 - 272,-272+73, - У2+273,-1 - 72+273,-1 - 272+273,-2 - 72+273,3 - 272,2 - 272+73, 1 -72+73,1 - 272+273,-72+273,4-72,3-72+73,5};
Структуру семейства х[5] и множества и [5] можно пояснить графиками:
Наблюдаются определенные симметрия и пропорциональность. Представление о характере траекторий дают графики:
Замечание. На графиках видно разнообразие характеров траекторий, чередование возрастающих и убывающих отрезков, их различные длины. Составленная программа позволяет выписать и более длинные траектории, но они имеют такие же свойства. На последнем графике изображена средняя траектория длины 1000, вычисленная по 100 случайно выбранным таким траекториям. Теоретическое описание распределений этих длин и направлений представляет особый интерес.
Отметим также, что из определения последовательности х = (х[п]) следуют
равенства тш[и[п]] = -72 - (п -1), тах[и[п]] = п для наименьшего и наибольшего
значений переменной х[п]. Причем эти значения единственные: они определяются
двоичными последовательностями 011...1 и 111...1 длины п при начальном значении
х[0] = 0. Не выписывая сами множества и [п] различных значений переменной х[п],
приведем числа элементов в них:
п 5 '.0 15 20 25 30 35 ¿0 45 50 55 60 и -.3 35 229 430 369 1427 2132 3164 4401 5522 7760 9940 Числа элементов в семействах Х[п] значений для всех траекторий в момент п
существенно меньше. Они получаются по формуле {х [п]} = {и [п - 1]}х 32:
32,576,2720,7328,15360,27808,45664,69824,101248,140832,189504,248320. Доли приближаются к 0.04:
0.562,0.148,0.084,0.066,0.057,0.051,0.048,0.045,0.043,0.042,0.041,0.040. Представляет интерес исследование структуры множеств и[п] и асимптотики
отношения {и[п]}/{Х [п]}.
Заметим, что если не вычислять множества и [ п ] и не выбирать через каждые 5 моментов только различные значения переменных х[п], то пришлось бы рассматривать
множества из 2п элементов, что для больших п нереально.
4. Распределения. Распределение значений переменной х[5] выражает семейство Р[5] долей элементов множества и[5] в семействе Х[5] записывается таблицей:
:= {32'32'32'32'32'32'32'32'16'16'16'32'32'32'32'16'32}
В следующей таблице выписаны максимальные значения распределений переменных х[п] в моменты п = 5,10,15,...,55,60 (моды распределений):
п 5 10 15 20 25 30
max 0.09375 0.041667 0.01507 0.00751 0.00378 0.00227
п 35 40 45 50 55 60
max 0.0014 0.00092 0.00063 0.00045 0.00034 0.00026
Моды медленно убывают. Из-за их малости размах распределения не играет большой роли, хотя его легко вычислить.
Представляет интерес исследование асимптотики распределений значений переменной х[п]. Критерий хи-квадрат Пирсона практически достоверно отвергает гипотезы о согласии полученных эмпирических распределений на начальных отрезках с нормальным распределением, имеющим те же моменты. Возможно, судя по характеру траекторий и полученным графикам, эмпирические распределения близки некоторым смесям нормальных распределений.
5. Моменты. Средние значения т[п], стандартные отклонения s[n] от них, коэффициенты асимметрии а[п] и эксцесса е[п] для переменных х[п] в моменты п = 5,10,15,...,55,60 выписаны в таблице:
5 10 15 20 25 30 35 40 45 50 55 60
0,111 0.2181 0.346 0.398 0,419 0,435 0,452 0,469 0,487 0,503 0,518 0.53
2.261 2.973 4.009 5.326 6.754 3.231 9.734 11.26 12.301 14.353 15.913 17.475
-0.203 -0.165 -0.128 -0.073 -0.041 -0.025 -0.019 -0.016 -0.014 -0.013 -0.011 -0.01
2,781 3,386 3.575 3.474 3,368 3,289 3,232 3,185 3,147 3,116 3,089 3,069
На первом из следующих составленных по этой таблице графиков показана динамика средних значений и стандартных отклонений от них, на втором - динамика
коэффициентов асимметрии и эксцесса (цифры на горизонтальной оси обозначают пятерки номеров):
»ч»чмм»
2 4 6 8 10 12
-2 4 6 8 10 12
5
Средние значения m[n] и стандартные отклонения s[n] от них медленно возрастают. Коэффициенты асимметрии a[n] и эксцесса e[n] приближаются к коэффициентам асимметрии a = 0 и эксцесса e = 3 нормального распределения.
Положим mn] = E[a[n]]. Так как случайные переменные Х[n],a[n -1] независимы, то из равенства (3) следует рекуррентное равенство для средних значений m[n] = E[x[n]]:
m[n] = m[n-1] +1 [V3-1)-i:/2^3. - 1\m[n-1] (6)
2 У 2
Пусть mn] = Yl-mik -1] и Dm[n] = m[n +1] - m[n]. Из равенства (6) следуют равенства
m[n] = m[0] + -1 -1^2^3 - хЪ„] (7)
Mn] = -1)-Dm[n] (8)
По предположению x[0] = 0 и поэтому m[n] = 0. Знание или оценка среднего ß[n] = E[a[n]] переменной a[n] позволяет по этим равенствам вычислять или оценивать средние значения m[n] = E[ x[n ]] переменной x[n] и обратно. Аналогичные равенства можно выписать для дисперсий.
Такие же равенства можно получить в общем случае. Введем обозначения для сумм случайных переменных %[к],a[k - 1],ß[k -1] = a[k - 1]X[k] и их средних значений:
SXn] = ¿X[k ],Sa[n] = Ja[k - 1],Sß[n] = J ß[k -1]
к=1 k=1 k=1
n n n
m£[n] = E JX[k ],ma[n] = E Ja[k - 1],mß[n] = E Jß[k -1]
k=1 k=1 k=1
Заметим, что для среднего значения биноминального распределения S£[n] с параметрами (1/2, n) верно равенство m£[ n ] = n /2. А так как переменные a[k -1] и X[k ] независимы, то E[ß[k ]] = E[a[k - 1]]E[X[k ]] = E[a[k -1]]/2 и поэтому mß[n] = ma[n] / 2 . Отсюда и из определений легко выводятся равенства
x[n] = nd + (c + d )SX[n] + (b - d )Sa[n] + (a - b - c + d )Sß[n] (9)
Тувинский государственный университет
m[n] = (1 / 2)(n(c + d) + (a + b - c - d )ma[n]) (10)
Распределение случайной переменной x[n] является линейной комбинацией SX[n] и связанных с ним распределений Sa[n], Sfi[n] знаков переменных x[k], к < n.
Замечание. Исследование распределений случайных переменных Sa[n], Sb[n], моментов ma[n], их асимптотики при подходящем центрировании и нормировании представляет и самостоятельный интерес. Равенства (9 - 10) устанавливают их связь с распределениями и моментами случайных переменных x[n]. В частности из (10) следует равенство
m[n]/n = (1/ 2)((c + d) + (a + b - c - d)(ma[n]/n))
Для исследования рассматриваемых случайных блужданий естественно также использовать счетные марковские цепи и мартингальную технику, подробно описанные в [5, 6].
Благодарность. Благодарю Александра Ивановича Жданка за конструктивную критику и полезные советы.
Библиографический список
1. Жданок, А.И. Фазовое пространство одного осциллирующего случайного блуждания.// Научные Труды ТывГУ. Выпуск I, Кызыл, изд-во ТывГУ, 2003, стр.86-91.
2. Жданок, А.И. Плотность положительных траекторий одного осциллирующего случайного блуждания на числовой прямой.// Научные труды ТывГУ, Выпуск I, Том II, Кызыл, изд-во ТывГУ, 2005, стр. 28-32.
3. Жданок А.И., Ивирсина, Н.Б. Компьютерное моделирование асимптотического поведения одного осциллирующего случайного блуждания. Вестник Тувинского государственного университета. Технические и физико-математические науки. Выпуск 3, Кызыл, изд-во ТувГУ, 2014. С. 131-149.
4. Хассе, Г. Лекции по теории чисел. Москва, ИЛ, 1953.
5. Зенюк, Д.А., Митин, Н.А., Орлов, Ю.Н. Моделирование случайного блуждания на Канторовом множестве // Препринты ИПМ им. М.В.Келдыша. 2013. № 31. 18 с.
6. Баруча-Рид, А.Т. Элементы теории марковских процессов и их приложения. Москва, Наука, 1969.
Bibliographicheskiy spisok
1. Zhdanok, A.I. The phase space of one oscillation random wolkes.//Scientific Proceedings TuvGU, Issue I.- Kyzyl, TuvGU, 2003. P. 86-91.
2. Zhdanok, A.I. The density of positivi trajectory of one oscillation random wolkes on real line.//Scientific Proceedings TuvGU, Issue II, Volume II.- Kyzyl, TuvGU, 2005. P. 28-32.
3. Zhdanok, A.I., Ivirsina, N.B. Computer modeling asymptotic bahavior of onе osciiliating random walk. Bulletin of the Tuva State University. Technical and physical and mathematical sciences. Issue 3.- Kyzyl, TuvGU, 2014. Р. 131-149.
4. Hasse, G., Lectures on the theory of numbers. Moscow, IL, 1953.
5. Zenyukov, D.A., Mitin, N.A., Orlov, Y.N. Simulation of random walk on the Cantor set // Preprint IPM Keldysh. 2013. №
31. 18р.
6. Barucha-Read, A.T., Elements of the theory of Markov processes and their applications. Moscow, Nauka, 1969.
Савельев Лев Яковлевич - кандидат физико-математических наук, профессор, профессор Новосибирского государственного университета, профессор Тувинского государственного университета, старший научный сотрудник Института математики им. С.Л. Соболева. E-mail: [email protected]
Savelyev Lev - Candidate of Physical and Mathematical Sciences, Professor, professor of Novosibirsk State University, professor of Tuvan State University, senior researcher at the Institute of Mathematics Sobolev. E-mail: [email protected] 19/09/15