ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2009 Управление, вычислительная техника и информатика № 3(8)
УДК 519.2
Ю.Б. Буркатовская, С.Э. Воробейчиков
ВЗВЕШЕННЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ ГАРАНТИРОВАННОГО ОЦЕНИВАНИЯ ПАРАМЕТРОВ ПРОЦЕССА ARCH(l)1
Предложена последовательная процедура оценивания параметров процесса ARCH(1), основанная на методе наименьших квадратов. Выбор весовых коэффициентов и правила остановки гарантирует точность оценивания. Работоспособность процедуры подтверждена численным моделированием.
Ключевые слова: процесс ARCH(1), метод наименьших квадратов, гарантированное оценивание.
Некоторым типам данных, в частности финансовым индексам, бывает присущ эффект кластерности, т.е. чередования групп значений с большой и малой дисперсией. Для описания случайных процессов такого типа Р. Энглом была предложена модель авторегрессии с условной гетероскедастичностью (ARCH), в которой дисперсия наблюдений представляет собой случайный процесс авторегрессионного типа. В данной работе рассматривается задача оценивания параметров такого процесса и предлагается последовательный метод, гарантирующий ограниченность среднеквадратического отклонения оценки от истинного значения параметров.
1. Постановка задачи
Рассматривается случайный процесс ARCH(1):
xl = CTl el; (D
2 л 2
CTi =^ + %xi _1.
Здесь (el }l а - последовательность независимых одинаково распределенных случайных величин с нулевым средним и единичной дисперсией. Параметры ц и X неизвестны. Ставится задача по наблюдениям за процессом {xl} оценить вектор неизвестных параметров Л = [ц,Х] с гарантированной точностью.
2. Последовательная оценка параметров
Для оценки параметров процесса (1) применим подход, предложенный в [1] для классификации процессов авторегрессии с неизвестной дисперсией. Чтобы иметь возможность использовать эти результаты, представим процесс (1) в виде
х2 =ст2 +а2(б2 _ 1).
Введем обозначения B = M(s; _ 1) , n = (s; _ 1)/B и, учитывая (1), получим xl = ц + Xx^j + (ц + Xx^j) Bn. (2)
1 Работа выполнена при поддержке РФФИ, грант 09-01-00172а.
Здесь } > - последовательность независимых одинаково распределенных случайных величин с М п = 0, Мп2 = 1. Процесс (2) является процессом авторегрессии первого порядка, дисперсия шумов которого (ц + Ххг2_1)В неизвестна и,
более того, не ограничена сверху. Преобразуем далее процесс (2). Введем обозначения
У1-1 = тах{1> х1 -1 }, 21 = 2 , а1 -1 =
У1-1
2
1
2 ’ 2 .Ум Ум J
(3)
Перейдем теперь к случайному процессу } вида
гг =ла-1 +Ац-1ВП1. (4)
Так как Ла1-1 <ц + Х, данный процесс обладает ограниченной дисперсией шумов.
Поставим задачу оценки вектора параметров Л процесса (4). Используем для построения оценки модифицированный метод наименьших квадратов. Оценка параметров строится в два этапа.
На первом этапе на интервале [1, п] вычисляется статистика Гп, затем она используется для компенсации неизвестной дисперсии помех. Для определения вида Гп преобразуем процесс (2). Введем обозначения
У 2-1 = ™п{1, Х-1 } х 1 = -хг, а 1 -1:
у 1-1
1 х1-1
-2 ’ -2 IУ1-1 У1-1J
В этом определении требуется, чтобы наблюдения х1-1 на промежутке [1, п] были отличны от нуля, иначе можно выбрать первый промежуток, для которого верно это условие. Случайный процесс {X1} имеет вид
х 1 = Ла 1 -й .
Очевидно, что Ла 1-1 >Х + ц. Тогда Гп можно представить как
(5)
Гп = С±х2, С = В2М[£82] .
1=1 11=1 )
На плотность распределения шумов {в1} наложим условие [1]
/е (и) = О (| и |-у) при и ^ 0 для некоторого 0 < у < 1,
которое достаточно для обеспечения конечности множителя п > [2/(1 - у)] +1.
На втором этапе строится собственно оценка параметров:
[ т ^ к
Л*(Н) = х +1а1 А(к) = X у1а1аТ,
Сп
(6)
(7) при
(8)
1=п+1
где т - случайный момент остановки, определяемый следующим образом
т = тт{к > п +1: Vтт(к) > Н}, (9)
Дк) - минимальное собственное значение матрицы А (к). Определим веса У1.
V
Пусть т - минимальное значение к, при котором матрица А(п + к) не вырождена. На интервале [п +1, п + т -1] веса имеют вид 1
V, =
---------, если а, линейно независим с (ап+1,..., а,_1};
(10)
0, иначе.
На интервале [п + т,т_1] веса V, определяются из условия
= І V,2 4 а,, 01)
п 1-п+т
а в момент т - из условий
> І V,2 аТ1а1, Vтт(т) = Н. (12)
п ,=п+т
Теорема 1. Если выполнено условие (7), то момент остановки т(Н) конечен
почти наверное, среднеквадратическое отклонение оценки Л* (Н) от истинного значения параметров оценивается сверху величиной
II * II2 Н +1
М Л*(Н)_Л <------------ . (13)
Н2
Доказательство. Согласно [2], момент остановки т(Н) (9) конечен почти наверное, если
І V2 аг1а1 = ад п-н- (14)
=1
Для сходимости почти наверное ряда в (14) необходимо и достаточно, чтобы выполнялось условие [3]
Vе > 0 : р |і V2аГа, > Е | ^ > 0.
Так как а[ а1 > 1, это условие может выполняться только при у1 ^ 0 по вероятности. Коэффициент vl является одним из положительных корней уравнения
2 ( + а2 ) ) - 2 (2 + а2 ) V2 - 2^{Ап - А22 )2 + 4А]2 V +
+ ((А11 - А22 )(а2 - а1 )- 4 А12 а1а2 + \/(А11 - А22 ) + 4А12 (а1 + а2 )) = 0.
Здесь а1, а2- компоненты вектора аг, а Ап, А12 и А22 - элементы матрицы А (I -1). Нижняя граница положительных корней этого уравнения стремится к нулю, если его свободный член стремится к нулю. Но так как, согласно (3), одна из компонент вектора а1 равна 1, а вторая может принять любое значение на интервале [0,1], получаем, что свободный член уравнения больше нуля с положительной вероятностью.
Рассмотрим среднеквадратическое отклонение оценки Л* (Н) от истинного значения вектора параметров. Используя (4), неравенство Коши - Буняковского, соотношение || Л (к) ||> vmln(k) и (12), получаем
м л* (н )-л = м
X (а1аТ1ВП+1 Л(т)
I=п+1
< м
I
X (а1аГВП1+0
I=п+1
Л- (тЛ <
м
Н 2
X Лу1а1аТ1 ВП,+1
I=п+1
(15)
Рассмотрим второй множитель, учтем, что Ла, <Х + ц, тогда
м
X Лу1а1а1 Вп
I+1
I=п+1
I-1
(16)
< (х + ц)2В21м X V?аIапм + 2м X X уку1а1а1 Пк+1П1+
V I=п+1 I=п+2 к=п+1
Оценим первое слагаемое. Для этого введем усеченный момент остановки т(N) = тт{т, N} . Очевидно, что т(N) ^ т при N ^го. Рассмотрим случайную величину
т( N )
2 Т 2
X у1а1 а1 Пг+1>
I=п+1
отличающуюся от суммы в первом слагаемом в (18) только верхним пределом, и найдем ее математическое ожидание. Пусть р = ст(е1,...,е1) - ст -алгебра, порожденная случайными величинами {е1,.,ег}, тогда т, определенный в (9), - марковский момент относительно {Р,}. Используя свойства условных математических ожиданий, получаем
т( N) N N
м X у1 аТа1 П2+1 = м X у1аТа1 X,<тП2+1 = м X м {а1а1 X,<тПш| } =
I=п+1
I=п+1
I=п+1
т( N )
= м X У1 аТ а1 X,<тм {|} = м X У1 аТ а1 •
I=п+1 I=п+1
Так как т(N) ^ т при N ^го , то отсюда с учетом (10) - (12)
т( N )
м X у1 аТаIП2+1 ■
I=п+1
2
V, а, а, =
I=п+1
= мпX v?aTal + м 'X v?aTal <м[-1- + Н) = мIН+1
I=п+1 I=п+т V п п ) V п
Аналогично можно показать, что второе слагаемое в (16) равно нулю. Подставляя полученные результаты в (16), а затем в (15), получаем
* м2 Н +1 I В2(Х + ц)2
м Л*(Н)-Л <—— м1 1 ^
Н2
2
2
Покажем теперь, что М (В2 (X + ц)2 /Гп) < 1. Согласно (5), имеем
р Iу* 2 < - 1=р Ц (д *,-,)2 < - }< р {У =2 < ^
11=1 J 11=1
Пользуясь этим результатом, получаем
М
( В2 (Х + ц)2 'ї В2 (Х + ц)2 (п Л' °2
си
п ;
э2 / >\ , . \ 2
МУ
2 | = В (Х + ц)
1=1
2
Сп
п
і рїУх2<-\Ч<
0 I1=1 Ч
В2 (Х + ц)2
Сп
Е; <■
1
В2
■1 <-----------------Г— г & = — М I У є1
1=1 1 (Х + ц)2 -1 Сп ^ 1
Отсюда и из (6) следует, что
М
( В2 (Х + ц)2 Л
< 1.
п /
Подставляя этот результат в (19), получаем (13). Теорема доказана.
3. Результаты моделирования
Предложенный алгоритм был реализован на ЭВМ. Для каждого параметра Н проводилось 1000 реализаций процедуры оценивания параметров процесса (1) при д = 0,7 и X = 0,5. Результаты моделирования приведены в таблице.
н ц О Ац Х Ох ^Х т т тах
10 0,7073 0,0179 0,6670 0,4993 0,0327 0,6698 160 221
20 0,7062 0,0093 0,3736 0,5033 0,0172 0,4254 313 415
40 0,7032 0,0048 0,2581 0,5005 0,0110 0,3075 617 761
Здесь X и Д - средние оценки параметров, Бх и - среднеквадратические отклонения оценок от истинных значений параметров, Дх и ДД - максимальные отклонения оценок от истинных значений параметров, т и ттах - среднее и максимальное время оценивания. Среднеквадратическое отклонение оценки от истинного значения параметра убывает с ростом Н , что соответствует теоретическим результатам. Кроме того, среднее и максимальное число наблюдений, необходимое для оценивания, растет линейно относительно Н , что говорит о хорошем качестве процедуры оценивания. Максимальное число наблюдений отличается от среднего не более чем на 40 %, и эта величина уменьшается с ростом Н .
Заключение
В работе предложена последовательная процедура оценивания параметров процесса ЛЯСИ(1). Использование взвешенного метода наименьших квадратов со специальным выбором весовых коэффициентов и момента окончания наблюдений позволяет получать оценки с гарантированным среднеквадратическим уклонением.
ЛИТЕРАТУРА
1. Дмитриенко А.А., Конев В.В. О последовательной классификации процессов авторегрессии с неизвестной дисперсией помех // Проблемы передачи информации. 1995. Т. 31. Вып. 4. С. 51 - 62.
2. Воробейников С.Э., Медер Н.А. On guaranteed estimation of parameter of random processes by the weighted least square method // Preprints of the 15th Triennial World Congress of the International Federation of Automatic Control. Barcelona. Spain, 21 - 26 July 2002. Na 1200.
3. ШиряевА.Н. Вероятность. М.: Наука, 1980.
Буркатовская Юлия Борисовна Воробейников Сергей Эрикович Томский государственный университет
E-mail: [email protected]; [email protected] Поступила в редакцию 19 мая 2009 г.