№ 3 (23) 2011
Д. Фантаццини
Моделирование многомерных распределений с использованием копула-функций. II1
Статья содержит вторую часть консультации, посвященной копула-функциям и их использованию в моделировании многомерных распределений вероятностей. В ней описываются парные копула-функции (включая понятия канонической и D-ветвизации), различные характеристики зависимости анализируемых случайных величин (в том числе меры хвостовой зависимости, особенно актуальные в случае несимметричных распределений), а также параметрические, полупараметрические и непараметрические методы статистического оценивания распределений, представленных с помощью копула-функций.
Ключевые слова: парные копула-функции, ветвизация, меры зависимости, хвостовая зависимость, метод максимального правдоподобия (одношаговый, двухшаговый, канонический, трех-шаговый), полупараметрические и непараметрические методы статистического оценивания.
JEL classification: C69, C49.
Содержание
4. Парные копула-функции
4.1. Введение
4.2. Каноническая ветвизация
4.3. D-ветвизация
4.4. Эмпирические приложения в статистическом пакете R: построение парных копула-функций
5. Меры зависимости
5.1. Коэффициент корреляции
5.2. Коэффициенты ранговой корреляции: р-Спирмена и t-Кендалла
5.3. Хвостовая зависимость
5.4. Эмпирические приложения в статистическом пакете R: меры зависимости
6. Процедуры оценивания: параметрические методы
6.1. Метод максимального правдоподобия (ММП или одношаговый метод)
6.2. Двухшаговый метод максимального правдоподобия
6.3. Эмпирические приложения в статистическом пакете R: процедуры параметрического оценивания
7. Процедуры оценивания: полупараметрические и непараметрические методы
7.1. Канонический метод максимума правдоподобия (КММП)
7.2. Трехшаговый канонический метод максимального правдоподобия (KME-CML метод)
7.3. Методы непараметрического оценивания
7.4. Эмпирические приложения в статистическом пакете R: процедуры полупараметрического оценивания
1 Продолжение. Начало консультации см. в (Фантаццини, 2011). Перевод на русский язык осуществлен А. В. Кудровым под научной редакцией С. А. Айвазяна. Сохранена сквозная нумерация разделов, рисунков, формул, определений и теорем, начатая в первой части. Окончание консультации, посвященное описанию подходов к экспериментальному подбору копула-функции и методов статистической проверки гипотез, связанных с моделями копула-функций, предполагается опубликовать в следующем номере нашего журнала.
I №
3 (23) 2011
4. ПАРНЫЕ КОПУЛА-ФУНКЦИИ 1
I
4.1. Введение §
2 В правой части формулы (11) и некоторых других местах далее для того, чтобы избежать усложнения обозначений, функции условной плотности и условного распределения случайной величины X при условиях на переменные с номерами J1, J2,...,Jkне будут помечаться соответствующими индексами I | J1,J2,...,Jк.
Детальное изучение парных копула-функций было начато в работе (Joe, 1997), а позднее 4 продолжено в (Bedford, Cooke, 2001, 2002; Kurowicka, Cooke, 2006) (моделирование) и (Aas et al., 2009) (статистические выводы). Их использование дает возможность получить значительно более гибкую структуру зависимости, чем структура перестановочных или иерархически вложенных архимедовых копула-функций. При помощи парных копула-функций можно разложить многомерную плотность на произведение n(n — 1) / 2 двумерных копула-функций, из которых n — 1 являются безусловными, а остальные — условными. Важно отметить, что используемые двумерные копула-функции не обязаны принадлежать одному классу.
Рассмотрим n случайных величин (X1,...,Xn) с совместной функцией распределения H (x ,.••, xn), частными распределениями Fi (xt), i = 1,..., n, совместной плотностью f (x,. • •, xn) и плотностями частных распределений f (xt), i = 1,., n. Тогда для точек, в которых все плотности непрерывны и положительны2:
n
f(xi xn ) = f(xn I X1 xn—1 )-f(xixn—1 ) = П f(X 1 X1xi-1 f1 (X1 ) . (11)
Из теоремы Склара известно, что для абсолютно непрерывного «-мерного распределения Н (•), имеющего строго возрастающие непрерывные частные распределения Е1 (•),..., ¥п (•), имеем:
/( Х1хп ) = с1, .,п (% ( х1 X.. Рп ( хп Л ( Х1 /п ( хп X
где с1 п (•,•••,') — п-мерная плотность копула-функции, описывающей анализируемое распределение Н (х1,•.., хп), а Е1( х ),•••, Рп (хп) — значения частных функций распределения рассматриваемых случайных величин в точках х1, •..,хп соответственно. В двумерном случае
/(х , х2) = С12(% (х1), (х2 )) • / (х ) • /2 (х2 ),
откуда следует, что:
/(х1 | х2) = С12 (% (х ), х2)) • /1 (х ). Для трех случайных величин Х1, Х2 и Х3 имеем:
/(х1 1 х2, хз) = С12|3 (х1 1 хз),%(х2 1 хЪ))/(х1 1 хз),
где с12|3 (•) — копула-функция для условных функций распределений ((Х1 | Х3), (Х21Х3)). Кроме того,
/(х1 1 х2, хз) = С13|2 (х1 1 х2),%(хз 1 х2))/(х1 1 х2).
i=2
№ 3 (23) 2011
Последнее соотношение может быть обобщено на «-мерный случай:
I(х | V) = , ((х | У_ ,),^(V, | V-, ))■/(х | V-,), (12)
где V — вектор значений компонент, на которые наложены условия, V, — произвольно выбранная компонента вектора V, а через у_ , обозначен вектор у, из которого исключена ,-ая компонента.
Теперь, если воспользоваться (12), то из (11) получим следующее представление для
/(х1 х1, • • •, х_\):
1 (Х1 1 х1 ,• • •,х_1) = (X | = с—1,г\1,-.,г_2 '1 (Х1 1 х1, —,хг_2), (13)
1 (х—1 \ х1, • • •, Хг—2 )
где для различающихся индексов i,у,ц,-.,ik таких, что i < у и ц <•< ik, можно выразить двумерную условную копула-функцию при значениях аргументов, равных соответствующим условным функциям распределения, а именно:
,-,* = С,Ж ,-л (((X К, •, хк ),(р(X К, •, X ) ).
s Используя (13), можно записать (11) в виде:
I ■fr
n t-i
ct-k ,t|i,...,t-k-i
f(Xi,...,Xn) = f (Xi) • ППCt-k,t|1 . ,t-k-1 • f (xt) = П f X) • ПП'
(14)
=Пf(x)• ППcj,j+iii,^,j-i, где j=t-k, j+j=t.
j=1 i=i
t=2 k=1 r=i t=2 k=1
С §
® n n-i n-j
5 ---
§
§ Представление (14) называют разложением парных копула-функций. Для многомерных о распределений существует много возможностей разложения на парные копула-функции. | В (Bedford, Cooke, 2001, 2002) представлена графическая модель, называемая моделью ре-| гулярной ветвизации. Основной идеей этого метода является представление разложения ¡? на парные копула-функции типа (14) в виде последовательности вложенных деревьев с нео ориентированными ребрами, названными ветвями. В n-мерном случае ветвизация представ-
С5
£ лена n — i деревом так, что j-ое дерево имеет n +1 — j узлов и n — j ребер. Каждое ребро £ отвечает плотности некоторой парной копула-функции, а ребра j-го дерева становятся уз® лами (j + i)-ro дерева. Два узла (j + i)-ro дерева связаны ребром в том случае, если соот-2 ветствующие ребра j-го дерева имеют общий узел. Разложение на парные копула-функции ! определяется n(n — 1) / 2 ребрами, а также плотностями частных распределений. | Сосредоточим внимание на двух примерах регулярной ветвизации, которые на сегодняш-щ ний день привлекли большое внимание исследователей. Речь пойдет о канонической ветви-¡^ зации и D-ветвизации. Для более детальной информации относительно общей теории ре® гулярной ветвизации и ее графического представления рекомендуется работа (Kurowicka, | Cooke, 2006).
100
n t-i
n
№ 3 (23) 2011
Рассмотрение упомянутых выше примеров регулярной ветвизации начнем с двумерных |
условных распределении, которые являются ключевыми элементами этой процедуры.
Условные распределения для наиболее часто используемых двумерных копула- в функций 4
В работе (Joe, 1997) показано, что:
F( | ) dQ,уjKj(((X | V-),F(v- | v_-)) ,
F(x | v) =-—-:--- для любого ] .
dF(v | v_ )
(15)
где Cxv |у_ — условная двумерная копула-функция (формальное определение см. выше). Если V имеет размерность 1 (т. е. V = у ), то (15) принимает вид:
((х),ВД)
F ( x|v) =
dF (v)
Пусть F ( x) = P( X < x) = x и F2 (v) = P(V < v) = v (т. е. f ( x) = f (v) = 1). Введем обозначение:
di ( x vHI
(16)
h( x, v;©) = F ( x | v) =
dCx y ( x, v;Q) dv
где через 0 обозначены параметры копула-функции совместного распределения P(X < x, V < v). Согласно терминологии работы (Aas et al., 2009) функцию h(x,v;0) назовем h-функцией, а h- (u,v;Q) — обратной h-функцией относительно первого аргумента u. Для двумерной нормальной копула-функции h-функция имеет вид:
h(u, U2 ;рп) = Ф
F-1 (ui ) _Pi2F-1 (U2)ö
Г—
2
P12
а обратная h-функция относительно первого аргумента равна:
h-1 (u, u2 ;р12) = ф(ф-1 (щ ^ 1 - pf2 + Д2Ф-1 К)),
где Ф( z) — значение функции распределения стандартного нормального закона в точке z, а р12 — коэффициент корреляции между анализируемыми случайными величинами.
Для двумерной копула-функции Стьюдента с n12 числом степеней свободы h-функция равна:
h(ui,u2;Pl2,П12) = 'v,
( (ui ) _Pl2t_21 (u2))
( + ( (U2))2)(1_P!22)
—1/2 ö
V12 +1
а обратная h-функция относительно первого аргумента равна
101
№ 3 (23) 2011
э-
о
t
о
В приведенных формулах используются следующие обозначения: tv ( z ) — значение функции распределения Стьюдента с v степенями свободы в точке z, а t- (u) — значение обратной к tv ( z ) функции распределения в точке u.
Для двумерной копула-функции Клейтона h-функция имеет вид:
h(uj,u2;a12) = u-ai2_1(u-ai2 + u-"12 -l) 1 1/a'2, а обратная h-функция относительно первого аргумента равна:
\-1/«12
h 1 (u1,u2;a12) = l(u1 •u212+11 42+1 + 1-u
2
Для двумерной копула-функции Гумбеля h-функция принимает вид:
h(u1, u2 ;a12) = C12(u1, u2)---(—ln u2)012—1 •{(- ln u1 )a12 + (—ln u2)a 1 1 12
s где C12(u1 ,u2) — двумерное распределение Гумбеля. К сожалению, в случае копула-функ-
■g ции Гумбеля обратная h-функция может быть вычислена лишь с использованием численных
* методов. В условиях большой размерности целесообразнее использовать копула-функцию
^ Клейтона, см. (Joe, 1997) или (Cherubini et al., 2004). is
<u
! 4.2. Каноническая ветвизация
г? Регулярную ветвизацию, при которой каждое дерево имеет единственный узел, называ-
g ют канонической ветвизацией. Разложение «-мерной плотности, отвечающее канонической
п п—1 « j
f (Х1, x2,..., Хп ) = П f (X )П П Cj, j-+»H.....j—1(F(Xj 1 x1, - , Xj— 1 ^ F(X+ \ X1, - , Xj —1 )). (1 7)
о ветвизации, представлено в формуле (14), т. е.
п п—1 п_ з'
§ _
к=1 /=1 1=1
сч
^ На рисунке 11 показаны канонические ветвизации в 5-мерном случае: £ Представления вида (17) обладают преимуществом в ситуациях, когда можно выделить | одну ключевую переменную, влияющую на другие переменные. Такая переменная может ¡2
быть использована в качестве корня канонической ветвизации (переменная 1 на рис. 11).
s Генерирование многомерных наблюдений
щ В работе (Aas et al., 2009) показано, что алгоритм генерирования n зависимых случайных
¡^ величин является общим как для канонической, так и для D-ветвизации:
<ь • смоделируем независимые равномерно распределенные на [0,1] случайные величины о
102
№ 3 (23) 2011
15 ^ Ti
T„
T,
Рис. 11. Примеры канонических ветвизаций в пятимерном случае
1
и
е et
• возьмем
X = Wj; Х2 = F-1 (w2 | xj); X3 = F-1 (w31 Xj,X2); ...; xn = F-1 (wn | x,-•,x„-j).
Для того чтобы при любом j определить распределение случайной величины (Xj | Xj,X2,...,Xj-1), в работе (Aas et al., 2009) предлагается использовать й-функцию, заданную соотношением (16), и соотношение (15). Отметим, что отличие канонической вет-визации от D-ветвизации состоит в выборе переменной Vj для (15). Кроме того,
F (х | x,., x —) =
dCj,j_1|1. ,j_2(F (xj 1 xi,.--, Xj—2 F (xj~\ 1 xi 5 — , Xj-2 ))
dF(x 1 | Xi,..., x ,-2) '
На основании этих результатов в работе (Aas et al., 2009) предложена следующая процедура генерирования наблюдений, имеющих плотность в форме канонической ветвизации:
Sample w1,...,wn independent uniform on [0, 1] Set x1 =v11 = w1 for i — 2,., n vi,1 = W
for k — i —1,i —2,...,1
vi,1 = h_1(vi,1,vk,k; Qk ,i_k) end for
xi =vi,1
if i = = n then
Stop
end if
for j — 1,...,i —1
j = h(vij v j; Qj,i-j)
end for end for
103
№ 3 (23) 2011
Внешний цикл указанной выше процедуры работает по порядковым номерам компонент моделируемых многомерных наблюдений. Он включает в себя два подцикла: первый из них позволяет вычислить смоделированное значение /-ой компоненты наблюдения, второй — вычислить условные распределения, необходимые для вычисления (i + 1)-ой компоненты. Для вычисления этих условных распределений в работе (Aas et al., 2009) используется h-функция, определенная соотношением (16), для которой в качестве аргументов берутся рассчитанные v{ . = F(xt \ x1,..., xj—1 ). Параметры 0j i для h-функции — это параметры плотности соответствующей копула-функции c] j—1 (-|-).
Оценивание параметров
Копула-функции с канонической ветвизацией могут быть оценены с помощью метода максимального правдоподобия. Для простоты положим, как и в (Aas et al., 2009), что xi = (xi1,..., xiT ), i = 1,., п независимы во времени. Такое предположение не является ограничительным, поскольку при наличии зависимости можно на первом этапе оценить одномерные модели временных рядов, а затем для стандартизированных остатков использовать копула-функцию с канонической ветвизацией. Такой подход к оцениванию можно считать расширением метода максимального псевдоправдоподобия. Для копула-функций он впервые был предложен в работе (Oakes, 1994), а позднее в работах (Genest et al., 1995; Shih, Louis, 1995) были представлены такие асимптотические свойства получаемых оценок, как а состоятельность и асимптотическая нормальность. В (Kim et al., 2007) при помощи мето-'! дов симуляционного моделирования показано, что в условиях, когда частные распределения неизвестны (это довольно распространенная ситуация в прикладных задачах), метод ■fr максимального псевдоправдоподобия дает более точные оценки, чем метод максимального Ц правдоподобия. Кроме того, в (Kim et al., 2008) показано, что в случае многомерных моде-I лей с гетероскедастичностью этот метод дает оценки, являющиеся состоятельными и асим-§ птотически нормальными.
I Однако в случае, когда вместо многомерной копула-функции используется разложение
0 на парные копула-функции, методология оценивания будет отличаться от представленной
1 выше (Aas et al., 2009).
о
g Для копула-функции с канонической ветвизацией логарифм правдоподобия имеет сле-о дующий вид:
ф «—1 «—j T
j,j+i\1,.,j—1 (F ( j \ x1,t,., xj—1,t), F (xj+i,t \ x1,t,., xj—1,t
)) ].
S S
a /=1 i=1 t=1
с J
£ В работе (Aas et al., 2009) предложен следующий алгоритм вычисления логарифмической функции правдоподобия (18)
log-likelihood = 0. for i — 1,...,n
t _
§ " 0,i -""i Q
s end for
t
§ for j -1,...,^-1
o
C;
® log-likelihood = log-likelihood + L( vj._11, vj-1i+1;0ji)
end for
for i — 1,., n — j
104
№ 3 (23) 2011
if j = = n — 1 then
Stop
end if
for i — 1,...,n — j
vji = h( vj—i,i+i> vj—1,1 ;Q ji >
end for end for
Здесь L(x, v;0) — логарифмическая функция правдоподобия выбираемой двумерной ко-пула-функции, параметры которой определены вектором 0, а наблюдения x и v заданы. Кроме того, в упомянутой работе представлена процедура нахождения начальных значений оценок параметров, вычисляемых при помощи численной максимизации логарифмического правдоподобия. Эмпирический анализ показывает, что начальные значения оценок, вычисленных при помощи процедуры из (Aas et al., 2009), и итоговые значения оценок, полученных при одновременном оценивании всех параметров, весьма близки, в то время как значение функции правдоподобия увеличивается незначительно. Это может означать, что процедура вычисления начальных значений оценок параметров дает состоятельную оценку всех параметров, что значительно облегчает вычислительную процедуру. Однако этот вопрос требует более детального исследования.
1
и
е et
4.3. D-ветвизация
Регулярная ветвизация, при которой у любого дерева Т^ не существует узла, соединенного с более чем двумя ребрами, называется D-веmвизацией. Многомерная («-мерная) плотность, отвечающая D-ветвизации, имеет вид:
n 1 n—j
П f (х )ПП
(F(х1 Х+1,..., Х+j—1), F(х+j 1 х1+1,..., Х+j—1 )).
k=1 j=1 i=1 На рисунке 12 показана 5-мерная D-ветвизация:
12
23
34
45
О Т1
13|2
24|3
35|4
Т
32|2
14|23
24|3
25|34
35|4
Т
Т
15|234
Рис. 12. D-ветвизация для пяти переменных
105
n
№ 3 (23) 2011
Генерирование многомерных наблюдений
В работе (Aas et al., 2009) предложена следующая процедура моделирования наблюдений, закон распределения которых представлен с помощью D-ветвизации:
Sample w1,...,wn independent uniform on [0, 1]
Set x1 =v11 = w1
Set x2 = v21 = h-1(w2 ,v11; Q11)
V2,2 = h(v11,v2.1< 0L1)
for i — 3,..., n
vn =wi
for k — i-1,i-2,...,2
vi,1 = h-1(vi,1 >vi-1,2k-2;0k ,i-k) end for
vi,1 = h-1(vi,1 ,vi-1,1; Q1,i-1) xi =vi,1
if i=n then Stop end if vi,2 =h(vi-1,1,vi,1; Q1,i-1) Vi,3 =h(Vi,1 ,Vi-1,1''01,i-1)
ss for i>3 then
5 for j — 2,...,i-2
| Vi2j = h( Vi—1,2j—2 , Vi,2 j—1; Qji-j)
t Vi,2j+1 = h( Vi,2j—1 ,Vi—1,2j—2'' 0ji—j) СЧ
^ end for
0 end if
g Vi,2i—2 = h( Vi—1,2i—4' Vi,2i—3; 0i—1,1)
1 end for w
S5 Как и в случае канонической ветвизации, процедура моделирования D-ветвизации состо-
п
4 ит из одного внешнего цикла, включающего один подцикл для моделирования переменных, § а также один подцикл для вычисления необходимых условных распределений. Тем не ме-
0 нее, с вычислительной точки зрения этот алгоритм является менее эффективным, чем алго-g ритм моделирования канонической ветвизации, поскольку число условных распределений, | которые необходимо вычислить, для D-ветвизации равно (n — 2)2, а для канонической вет-¡? визации — (n — 2)(n — 1) / 2. Отметим, что в случае D-ветвизации параметры 0j , в й-функ-§ ции — это множество параметров соответствующей копула-функции ci i+j,+1. i+j—1 (• | •).
<1
g Оценивание параметров
g В случае D-ветвизации логарифмическая функция правдоподобия имеет следующий вид:
5
Л n 1 n—j T
1 222ln[ CW|i+1,.,+/—1 (F (Xi,i | X+l,tv. X+j—1 ,t X F (X1+J,t | X1+1,tX+j—1,t)) § j=1 ,=1 t=1
® В работе (Aas et al., 2009) предлагается следующий алгоритм вычисления логарифмиче-о
ской функции правдоподобия:
I №
3 (23) 2011
log-likelihood = 0. Ц
for 1 = 1,..., n §
Е
V0,1 = Х1 5
я
end for в
for 1 = 1,., n — 1 ^
log-likelihood = log-likelihood + l(v01, v01+1;Q11) end for
V1,1 ^(v01, V02;Q11) for k = 1,...,n — 3
V1,2k = h( V0k+2, V0k+1; 01,k+1) V1,2k+1 = h( V0,k+1, V0k+2 ; 01,k+1) end for
V1,2n—4 = h( V0,n, V0,n—1 ; 01,n—1)
for j = 2,...,n — 1 for 1 = 1,., n — j
log-likelihood = log-likelihood + l(Vj—121—1, Vj—121 ;Qj1) end for
if j = n — 1 then
Stop
end if
Vj, 1 = h(vj-lд, Vj-1,2; Qj, 1) if n>4 then for 1 = 1,., n — j —2 V j,21 = h( V j—1,21+2 , V j—1,21+1 ; 0 j,1+1) V j,21+1 = h( V j—1,21+1, V j—1,21+2 ; 0 j',1+1) end for end if
Vj,2n—2j—2 = h( V j'-1,2n-2j', Vj—1,2n—2 j—1; 0 j,n—j )
end for
Здесь l (x, v; 0) — логарифмическая функция правдоподобия для выбираемой копула-функции, параметры которой определяются вектором 0, а векторы наблюдений x и v заданы. Отметим, что 0 . i — параметры плотности копула-функции c ..+ ^ & .+ — (-|-).
4.4. Эмпирические приложения в статистическом пакете Я\ построение парных копула-функций
Если нужно смоделировать и оценить копула-функцию, используя ее разложение на парные копула-функции, необходимо воспользоваться модулем процедур сори1аООЕ из пакета R, разработанного Даниэлем Бергом. Так, например, D-ветвизация в четырехмерном случае может быть смоделирована и оценена следующим образом:
x = SimulateCopulae(n=1000,d=4,construction=list(type="dpcc",copula=c("clayton", "gumbel","frank","gumbel","clayton","gumbel")),param=list(c(2,3,6Д.3ДД.4), ^(0,6))) pairs(x)
№ 3 (23) 2011
dpcc.par = EstimateCopulaParameter(x,construction=list(type="dpcc",copula=
с("с1ау^п","дитЬе1",'^гапк","дитЬе1","с1ау^п","дитЬе1")))
dpcc.par
$t [1] 1.951387 2.991580 6.052075 1.343258 0.949556 1.410108 $пи [1] 0
$1одДк [1] 1899.111
Биплоты (диаграммы рассеяния пар компонент) для наблюдений из четырехмерной ко-пула-функции с D-ветвизацией представлены на рис. 13.
0.0 0.4
0.0 0.4
>5
1
Л ^
с §
§
ф »
я и
о
и
л §
С
о
5 О
>¡5 »
Ф §
6
0 я а
Й
2
1
а
ф §
0
1 §
ф $
I
я и
о
8ч ф
5
уаг 1 л -о о
ыш ¿В!*!!? уаг 2 о О о ^
о 0 уагЗ 0
0 уаг4
0.0 0.4 0.8 0.0 0.4 0.8
Рис. 13. Диаграмма рассеяния пар компонент для наблюдений из четырехмерной
копула-функции с D-ветвизацией
5. Меры зависимости
Меры зависимости являются весьма полезными инструментами для описания структуры двумерной зависимости. В этой главе рассмотрим три возможные меры: коэффициент корреляции, коэффициент ранговой корреляции и коэффициент хвостовой зависимости.
Достаточно хорошей мерой зависимости в классе эллиптических распределений является коэффициент корреляции. Этот класс включает в себя, например, нормальное распределение, смеси нормальных распределений. Однако коэффициент корреляции как мера зависимости для многомерных распределений вне класса эллиптических распределений обладает рядом недостатков. В качестве альтернативы предлагаются две другие меры зависимости, которые в некоторых случаях оказываются более приемлемыми.
108
№ 3 (23) 2011
5.1. Коэффициент корреляции |
}
Коэффициент корреляции между случайными величинами X и У, как известно, опреде- £
ляется следующим образом (см., например, (Айвазян, 2010, п. 3.2.2)): в
с?
= ССу( X, У) Р , ^Уаг(X)Уаг(У),
где Соу(X,У) — ковариация между X и У , Уаг(X) и Уаг(У) — дисперсии X и У соответственно. Ниже представлены основные свойства коэффициента корреляции.
1. , У) | < 1.
2. Если X и У независимы, то р(X,У) = 0.
3. | р(X,У) = 1 тогда и только тогда, когда Р(Х = а + ЬУ) = 1 для некоторых а и Ь Ф 0 .
4. р^ + Ь,уУ + б) = sign(ау)р(X,У).
5. Пусть (X ,У) имеет совместное двумерное нормальное распределение с частными стандартными нормальными распределениями. Тогда коэффициент корреляции р между X и У однозначно определяет совместное распределение (X, У).
Обобщение коэффициента корреляции на многомерный случай можно найти во многих учебниках по статистике, например, (Ма^а et а1., 1997).
Пусть р — выборочный коэффициент корреляции. Хорошо известно, что для проверки гипотезы Н0: р = 0 против альтернативы Н1 : рФ 0 может быть использована следующая тестовая статистика:
^ _ п - 2
которая при справедливости нулевой гипотезы имеет ¿п_2 -распределение — см., например, (Айвазян, 2010, с. 78).
Если воспользоваться ^-преобразованием Фишера, то получим:
г=^
/, »\ \+Р
\-р
1 + Р
4п _ 3 (г _ С) ——® N(0,1),
где знаком ——® обозначена асимптотическая сходимость по распределению при бесконечно растущем объеме выборки п (п ®да). Более того, хорошо известно, что если рФ 0, то 4П(р - р) —^N(0,(1- р2)2).
Если X и Y имеют распределения (не обязательно нормальные), для которых конечен четвертый момент и р(X,Y) Ф 0, то
4П (р-Р) N (0, у2)
при некотором g2 (см. (Fang et al., 1987; Rodgers, Nicewander, 1988; Embrechts et al., 2002) и ссылки в этих работах).
109
№ 3 (23) 2011
К сожалению, для многомерных распределений неэллиптического типа коэффициент корреляции обладает рядом недостатков.
1. Равенство коэффициента корреляции нулю эквивалентно независимости в случае многомерного нормального распределения. Однако уже для многомерного распределения Стьюдента это не так.
2. Коэффициент корреляции инвариантен относительно линейных преобразований, но, как правило, не инвариантен относительно более общих преобразований Т (•):
Р(Т(X),Т(7)) Фр{Х,У).
Например, две случайные величины, имеющие логнормальное распределение, имеют коэффициент корреляции, отличный от коэффициента корреляции между их лог-преобразованиями.
3. Частные распределения и корреляционная матрица однозначно определяют лишь только совместное распределение эллиптического типа, но это неверно в общем случае.
4. Дисперсии случайных величин X и У должны быть конечными, иначе корреляция не определена. Это свойство указывает на то, что коэффициент корреляции — далеко не идеальная мера зависимости, которая может быть неопределенной для распределений с «тяжелыми хвостами».
а Рассмотрим пример, иллюстрирующий один из вышеупомянутых случаев. Пусть Х1, '! Х2 — нормально распределенные случайные величины с нулевым средним и дисперсией о2 > 0, а коэффициент корреляции между ними равен р. Тогда коэффициент корреляции случайных величин Уi = ехр( Xi), i = 1,2, имеющих логнормальное распределение, равен
Л
^ 2 § еро -1
* Сспад) =
п
о
е" -1
о При р = 1 всегда получим, что Согг(У1, У2) = 1, но наименьшее возможное (при —1< р< 1)
г? значение Corr(Y¡,Y2) всегда будет больше -1. Например, если о = 1, то Corr(Y1, Y2) Е [-0.368, 1].
§ Кроме того, интервал достижимых значений Согг( У1,У2) будет тем меньше, чем больше о.
о В качестве другого примера, иллюстрирующего недостатки коэффициента корреляции,
| рассмотрим величину Х1 со стандартным нормальным распределением N (0,1) и Х2 = Х12.
| Тогда
| Ссу(Х1, Х2) = Е ((1 • (Х2 — 1)) = Е(Х3) — Е(Х1) = 0.
сч
^ Таким образом, с одной стороны, имеем функциональную зависимость между Х1 и Х2,
! а с другой стороны, нулевую корреляцию между ними. а
| Для того чтобы преодолеть указанные выше недостатки, необходимо обратиться к идее,
5.2. Коэффициенты ранговой корреляции: р-Спирмена и t-Кендалла
¡^ возникшей в теории непараметрических статистик, которая предлагает сосредоточить внимание не на самих данных, а на их рангах. В результате были предложены две важные меры зависимости: р-Спирмена и t-Кендалла (определение и основные свойства этих мер пар-
110 у- =
Консультации •
I №
3 (23) 2011
ной зависимости см., например, в (Айвазян, 2010, с. 96 - 107)). Перед тем, как приступить |
к обсуждению этих мер зависимости, коротко представим понятия согласованности и рас- ^
Е
согласованности. 5
я
Определение 5. Наблюдения (х{, у{) и (х ], у]) называют согласованными, если х{ < х. и в yi < у., или если хг > х. и yi > у.. Аналогично, (хг, yi) и (х], у]) называют рассогласованными наблюдениями, если xi < х. и yi > у. или если xi > х. и yi < у.. Это эквивалентно тому, что (xi, ) и (х],у]) являются согласованными наблюдениями, если (— х.)(уг — у.) > 0, и рассогласованными, если (— х.)(уг — у.) < 0.
Другими словами, согласованность наблюдений возникает в случае, если большие значения одного наблюдения соответствуют большим значениям другого наблюдения, а малые значения также соответствуют малым значениям. Если это не так, то наблюдения называют рассогласованными.
Коэффициент ранговой корреляции Спирмена (р-Спирмена)
Коэффициент р-Спирмена — мера согласованности между двумя случайными величинами, основанная на использовании понятий согласованности и рассогласованности.
Определение 6. Для двух непрерывных случайных величин X и 7 совместное распределение которых имеет копула-функцию С(•), р-Спирмена определяется как
р, (Х, У) = 3Q(C, Р) = 12// uvdC (и, V) — 3 = 12// С (и, V) dudv — 3, (19)
где и = FX (х), V = FУ (у), а Q(•) — разность между вероятностями согласованности и рассогласованности (для более детальной информации см. (ЫеЬеп, 2006)).
Эквивалентное выражение для р-Спирмена может быть дано в форме
(Х ,У) = Согг ((Х), О (У)),
где корреляция (Согг) понимается в классическом смысле, а Е и О — функции частных распределений случайных величин Х и У. Этот результат вытекает из того факта, что ранги и и V являются наблюдениями из равномерно распределенных на [0; 1] случайных величин и = Е(Х) и V = О(У), совместное распределение которых определяется копула-функцией С.
Поскольку и и V имеют среднее 1/2 и дисперсию 1/12, выражение для р, (Х,У) в (18) может быть представлено в следующем виде:
19ГГ ИГ( , , „ъашл -X Ет) — 1 / 4 Е(иУ) — Е(Ц )Е(У) р (Х ,у) = 12//^(и, ^ — 3 = 12Е(иу) — 3 = 1 /12 = ^аг(и)Уаг(У) •
Таким образом, р-Спирмена для пары непрерывных случайных величин Х и У равно корреляции между рангами Х и У.
В многомерном случае р-Спирмена (матрица) определяется как
р, (X) = Согг ((Х1 ),..., Е (Х и )),
№ 3 (23) 2011
где Corr() — корреляционная матрица; компоненты матрицы pS (X) определяются как
ps ( X), = Corr ( ( X, ), F, ( Xj )).
Перечислим основные свойства коэффициента р-Спирмена.
1. pS симметричен.
2. | pS |<1. В частности, для Y = T(X), где T(•) — строго возрастающая функция, pS ( X, Y ) = 1 ; а для Y = T ( X ), где T (•) — строго убывающая функция, pS ( X, Y ) = -1.
3. pS (Tx (X ),Ty (Y)) = pS (X ,Y ) для любых строго возрастающих отображений Tx (•)
и Ty (•).
4. ЕслиX и Y независимы, то pS (X,Y) = 0 .
5. Если ( X ,Y ) имеет нормальное распределение с коэффициентом корреляции р и стандартными нормальными частными распределениями, то
р = 2sin [ (p/6) pS ] или pS =— arcsinÇ1 pj.
Последний результат справедлив также в случае, когда совместное распределение случайных величин X и Y имеет нормальную копула-функцию, а частные распределения непрерывны. К сожалению, соотношение между коэффициентом р-Спирмена и коэффициентом а корреляции не выполняется для всех распределений из эллиптического семейства — см., ! например, (Huit, Lindskog, 2002; Nelsen 2006).
■g Можно показать, что непараметрическая оценка для pS, построенная по наблюдениям
Р S
т (Т -\)(Т - Djn
2 3• sign(Xf -Xj)-sign(Y-Yk)
£ (Xi,Y), i = 1,...,T, имеет вид
I - 6
| и является несмещенной.
о Если X{ и Yi независимы, i = 1,...,T , то распределение yfTps асимптотически сходится к
¡S N(0,1). Более детальную информацию см. в (Айвазян, 2010; Hollander, Wolfe, 1973; Statistics
§ with confidence, 1989; Conover, 1999; van de Wiel, Bucchianico, 2001). s
g Коэффициент ранговой корреляции Кендалла (t-Кендалла)
| Коэффициент t-Кендалла — это также мера связи между двумя случайными величина-¡? ми, основанная на использовании понятий согласованности и рассогласованности и опре-
5 деляемая следующим образом.
С5
£ Определение 7 (заимствовано из (Kruskal, 1958), см. также (Айвазян, 2010, с. 102 - 107)).
Пусть (X1 ,Y1) — случайный вектор с распределением H (x, y), а (X2,Y2) — случайный вектор, такой, что X2 и Y2 независимы, распределение X1 совпадает с распределением X2, распределение Y совпадает с распределением Y2. Коэффициент t-Кендалла для вектора (X, Y), компоненты которого есть непрерывные случайные величины, определяется как разность между
s вероятностью согласованности и вероятностью рассогласованности, т. е.
о
| t(X,Y) = P{(X, - X2)(Y -Y2) > 0}- P{ - X2)(Y — Y2) < 0} = E[sign(Xi - X2)sign(Y — Y2)] t = P{{ > X2, Y, > Y2} + P{{ < X2, Y, < Y2}- P{{ < X2, Y, > Y2}- P{Xl > X2, Yl < Y2}.
112
I №
3 (23) 2011
Тогда для «-мерного случайного вектора X и случайного вектора XX, компоненты которо- | го независимы, а их частные распределения равны частным распределениям соответствую- ^ щих компонент вектора X, матрица г-Кендалла р (X) определяется следующим образом: £
я
е
Рг (X) = Ссу[ sign( X - X) ], ^
где (¡, ])-ый элемент этой матрицы определяется формулой
Рг (X)£ = Cov[sign(X, - X), sign(XJ - Ху)].
В частности, в двумерном случае (п = 2) матрицей г-Кендалла будет
1 г( X, ¥ ^
Pt (X) =
t(X,Y) 1
Следует отметить, что существуют некоторые другие «-мерные обобщения г-Кендалла. Более детальную информацию можно найти, например, в (Clemen, Jouini, 1996) и (Barbe et al., 1996). Основные свойства этой меры зависимости, а также соответствующие доказательства представлены в работах (Embrechts et al., 2002) и (Nelsen 2006).
Как правило, если г-Кендалла положителен, то с большой вероятностью мы имеем положительную зависимость. Если этот коэффициент отрицателен, то следует ожидать отрицательную зависимость. Кроме того, г-Кендалла может быть представлен в терминах копу-ла-функции, что облегчает вычислительную работу.
Теорема 5. Коэффициент г-Кендалла для двумерной случайной величины, характеризующейся копулой C(u, v), определяется формулой
t( X ,Y) = 4/J C (u, v)dC (u, v) -1.
Доказательство см. в (Nelsen, 1999, p. 127 - 129). Основные свойства коэффициента г-Кендалла:
1. г( X ,Y) симметричен.
2. -1<г (X,Y) <1.
3. Если X и Y независимы, то г(Х,Y) = 0.
4. t(Tx(X),Ty (Y)) = г(Х,Y) для любых строго возрастающих отображений Tx(•) и Ty (•). Оценка коэффициента г-Кендалла требует вычисления двойного интеграла, что для распределений эллиптического типа представляет собой довольно непростую задачу. Однако можно показать (см. (Lindskog et al., 2003)), что г-Кендалла для эллиптических распределений определяется следующим образом:
2
г( X, Y) = — arcsin р, p
где р — обычный парный коэффициент корреляции.
Для архимедовых копула-функций ситуация значительно проще, т. к. г( X, Y) может быть оценен с использованием генератора копула-функции. А именно, в работе (Genest, MacKay,
0 0
№ 3 (23) 2011
1986) показано, что х-Кендалла для архимедовых копула-функций определяется соотношением:
t(X,Y) = 1 + 4 Гdt,
где <р() — генератор копула-функции. Например, можно показать, что для копула-функций Клейтона или Гумбеля мы имеем следующие результаты:
а
для копула-функции Клейтона: t(X ,Y) =
a + 2 1
• для копула-функции Гумбеля: t( X ,Y) = 1--,
a
где a — параметр копула-функции.
Можно показать, что непараметрическая оценка для t-Кендалла, построенная по наблюдениям (Xi,Yi), i = 1,...,T и имеющая вид
2 ^
г=" Xj ^^" Yj)
а является несмещенной.
'! Если Xi и Yi независимы, то распределение случайной величины у/Г г сходится к N(0,4/9). Более подробная информация содержится, например, в (Ferguson et al., 2000).
(§ 5.3. Хвостовая зависимость
js Определим понятия верхней и нижней хвостовой зависимости (Joe, 1997).
Определение 8. Пусть (X, Y) — случайный вектор, компоненты которого есть непре-
1U верхней хвостовой зависимости X и Y определяется соотношением:
г? рывные случайные величины с частными распределениями FX и FY. Тогда коэффициент
% tu
'■5 1 + C(u u)
ü 1U = lim P[Y > F- (u) IX > F— (u)] = lim P[X > F- (u) | Y > F- (u)] = lim -—2u-
u®1 u®l u®l 1 — u
S
а
о при условии, что пределы существуют, где C (u, v) — двумерная копула-функция случай-
£ ного вектора (X, Y).
£ При этом случайные величины Xи Y называют асимптотически зависимыми на верхнем
§■ -----------^------------------------------------------------------- ----- 1и
хвосте, если l Е (0,1], X и Y называют асимптотически независимыми, если l = 0. б Другими словами, верхняя хвостовая зависимость существует тогда, когда имеется поло-
| жительная вероятность одновременного возникновения положительные выбросов. 1U широ-
| ко используется в теории экстремальных значений и представляет собой вероятность того,
щ что одна переменная примет экстремальные значения при условии, что другая переменная
¡^ также принимает экстремальные значения. Коэффициент l можно рассматривать как ме-
® ру зависимости квантилей — см., например, (Coles et al., 1999). § Аналогично можно определить нижнюю хвостовую зависимость.
114 I
I №
3 (23) 2011
Определение 9. Пусть (X,Y) — двумерный случайный вектор, компонентами ко- |
торого являются непрерывные случайные величины, частные распределения которых g
равны FX и Fy . Тогда коэффициент 1L нижней хвостовой зависимости между X и Y £
равен: в
et
1L = lim P[Y < F- (u) | X < F-1 (u)] = lim P[X < F- (u) | Y < F- (u)] = lim C(uu)
u®0 u®0 u®0 u
при условии, что пределы существуют.
Случайные величины X и Y называются асимптотически зависимыми на нижнем хвосте, если l Е (0,1] и асимптотически независимыми на нижнем хвосте, если l = 0.
Таким образом, нижняя хвостовая зависимость существует тогда, когда существует положительная вероятность возникающих одновременно отрицательных выбросов.
Поскольку эллиптические распределения являются радиально симметричными, для них коэффициенты верхней и нижней хвостовой зависимости будут равны между собой. Например, для нормальной копула-функции коэффициенты верхней и нижней хвостовой зависимости определяются соотношением
1L = 1U = 2lim[ P(7 > x\X = x)] = 2lim
1 — Ф
r
r
= 0.
Таким образом, вне зависимости от величины парного коэффициента корреляции р (р Ф 1), если рассматривать экстремально большие положительные значения X и ¥ на правом хвосте, то для них получим асимптотическую независимость. Этот факт хорошо известен — см., например, ^Ьиуа, 1961; Resnick, 1987).
Для копула-функции Стьюдента коэффициенты верхней и нижней хвостовой зависимости также совпадают и равны
1L = 1U = 2lim [P(7 > x\X = x)] = 2 — 2tn
Vv + 1-
1
r
VÍ + P
Очевидно, они возрастают по р и убывают по n. В этой формуле через tv+1, как и ранее, обозначена одномерная функция распределения Стьюдента с n +1 степенями свободы. Если число степеней свободы устремить к бесконечности, то 1U будет стремиться к 0 при р< 1.
Рассмотрим коэффициенты 1L, 1U для архимедовых копула-функций. Так, для копула-функции Гумбеля лишь верхняя хвостовая зависимость положительна: 1U = 2 — 2Уа, а 1L = 0; тогда как для копула-функции Клейтона положительна лишь нижняя хвостовая зависимость: 1U = 0, 1L = 2—1/а.
Следует отметить, что хвостовая зависимость для архимедовых копула-функций может быть представлена в терминах генераторов, обратных к ним функций и первых производных, см. (Joe, 1997; Nelsen, 2006). В работах (Coles et al., 1999; Poon et al., 2004) представлены робастные непараметрические оценки для коэффициентов хвостовой зависимости.
№ 3 (23) 2011
5.4. Эмпирические приложения в статистическом пакете R: меры зависимости
В пакете R использование модулей copula и fcopulae дает возможность вычислять упомянутые выше меры зависимости для множества типов копула-функций. Ниже представлены некоторые примеры (заинтересованным читателям рекомендуется ознакомиться с руководством к пакету R).
# EXAMPLES WITH ARCHIMEDEAN COPULAS AND THE "copula" PACKAGE gumbel.cop <- gumbelCopula(3) kendallsTau(gumbel.cop)
[1] 0.6666667 spearmansRho(gumbel.cop) [1] 0.848167 tailIndex(gumbel.cop) lower upper 0.000000 0.740079
# let us compute the sample versions x <- rcopula(gumbel.cop, 200) cor(x, method = "kendall")
'I [,1] [,2]
i
■fr [2,] 0.6592965 1.0000000
[1,] 1.0000000 0.6592965
S^ cor(x, method = "spearman"
15
§ [,1] [,2]
I [1,] 1.0000000 0.8483507
я
[2,] 0.8483507 1.0000000
¡2 # compare with the true parameter value 3 о
§ calibKendallsTau(gumbel.cop, cor(x, method="kendall")[1,2])
о [1] 2.935103 >s
| calibSpearmansRho(gumbel.cop, cor(x, method="spearman")[1,2_
4 [1] 3.001893
w
£ # EXAMPLES WITH ARCHIMEDEAN COPULAS AND THE "fcopulae" PACKAGE
s Tau
t
is -0.3333333 attr(,"control'
o
c;
® rho
calibSpearmansRho(gumbel.cop, cor(x, method="spearman")[1,2] [1] 3.001893
# ellipticalTau Computes Kendall's tau for elliptical copulae
# ellipticalRho computes Spearman's rho for elliptical copulae ellipticalTau(rho = -0.5)
-0.5
116
№ 3 (23) 2011
ellipticalRho(rho = 0.75, type = "t", subdivisions = 100) |
I
0.71 в
attr(,"control") ^
rho type tau
"0.75" "t" "0.5399"
# ellipticalTailCoeff
# Student-t Tail Coefficient:
ellipticalTailCoeff(rho = 0.25, param = 3, type = "t")
lambda
0.1962612
attr(,"control")
rho type param.nu
0.25" "t" "3
6. Процедуры оценивания: параметрические методы
Пусть хи,..., хп1, t = 1, . ..,Т — многомерные наблюдения, где п — размерность наблюдаемой случайной величины, а Т — число имеющихся наблюдений.
6.1. Метод максимального правдоподобия (ММП или одношаговый метод)
Пусть f (•) — плотность совместного распределения случайного вектора (Х1, Х2,..., Хп).
n
f ( ¿i,-
g) = c( F1( х. ; a1 ),•••, F1 ( хп; a n ); g ) - ^ f ( £,. ; at ),
i=i
где f — плотность одномерного частного распределения Х1, Хх1, Х2,..., Хп — некоторые заданные (текущие) значения случайных величин Х1,Х2,...,Хп соответственно, а с() — плотность копула-функции, определяемая следующим соотношением:
д"с (ul, u2,..., ип; у)
с(и1 ип; у) = ———--.
ди ди ...ди
12 п
№ 3 (23) 2011
Пусть 0 = ( a1,..., an ; g) — вектор оцениваемых параметров, где ai, i = 1,..., n — параметры частных распределений F, g — вектор параметров копула-функции. Логарифмическая функция правдоподобия имеет следующий вид:
T T n
1 (0)=2ln(c( Fi( xu ; ai^ - • •, Fn( xn,t ;a n); g))+22ln f ( x ,t ;).
i=1 i=1 i=1
Оценка максимального правдоподобия 0ML для параметров определяется как
О ml = argmax l (0).
Ниже приводится результат, описывающий асимптотические свойства оценки максимального правдоподобия.
Теорема 6 (состоятельность и асимптотическое распределение ММП-оценок). Пусть О ml — ММП-оценка. Тогда при выполнении некоторых стандартных условий регулярности, см. (White, 1994), справедливо следующее: 0ml ■
P > 00 00 = (a1,..., an, g)'
sir (0 ML-00 ) N (0, I-1 (0o )),
а где I (0o ) — информационная матрица Фишера.
>s
э-
■g Доказательство см. в (White, 1994) или (Gourieroux, Monfort, 1995). <з 6.2. Двухшаговый метод максимального правдоподобия3
ф
I В соответствии с этим методом параметры частных распределений оцениваются незави-
о симо от параметров копула-функции. Другими словами, процедура оценивания разделена n
ч на следующие два шага: >s
! г
Шаг 1: ИспользуяММП, оцениваются параметры а,-, , = 1,...,п, частных одномерных распределений Fi (•):
4 аi = arg max l' (а) = arg max Y ln f (xt t; a),
ü а а '
5 t=1
§ где l' — логарифмическая функция правдоподобия для частного распределения F (•).
а g
2 t а
ф §
t s
t
<o
n &
4
Ф
5
Шаг 2: Оцениваются параметры g копула-функции при заданных значениях оценок, полученные на шаге 1:
T
у = arg max lc ( у) = arg max Y ln(c(F ( x t ; Si),..., Fn ( xnt ; an ); у)),
У У ^
где lc — логарифмическая функция правдоподобия для копула-функции.
3 В англоязычном оригинале этот метод назван The Inference Functions for Margins method (IFM-method). 118
№ 3 (23) 2011
Ниже (см. теоремы 7 - 9) описаны асимптотические свойства оценок, получаемых IFM- | методом. Эти результаты представляют собой простые обобщения результатов, полученных g для ММП-процедуры, см. (Newey, McFadden, 1994; White, 1994; Patton, 2006a, b). §
Представленные ниже результаты получены в предположении некоторых стандартных в условий регулярности, которые мы не будем конкретизировать, заинтересованный читатель 4 может ознакомиться с ними в работе (White, 1994). Из соображений простоты рассматривается двумерный случай. Отметим, что обобщения на многомерный случай получаются достаточно просто.
Теорема 7 (состоятельность а\ и а2). Если n , то а\ ■ Доказательство см. в (White, 1994, Theorem 3.13).
p ^ p —* ах и а2-
Теорема 8 (состоятельность параметра g ). Пусть функция
п 121п с( F ( x,t; «1), F> ( x2,t; «2); у)
имеет единственный максимум в точке g0 Е int(r). Тогда у —у0 при n , где Г -область допустимых значений параметра g, а int(F) — внутренность этого множества.
Доказательство см. в (White, 1994, Theorem 3.10).
Перед формулировкой теоремы 9 введем ряд обозначений. Определим штрафы для оцен-
blFM = («1, «2, g) :
su !nf(xy.;a), s2i = -— Inf2(x2 ;a2), s3i =— Inc(Fx(xx ),F2(x2 ;a2);g).
ки
9ai
9a.,
9g
Матрица Гесса (гессиан) Hess (0) для штрафов равна:
t-i2
92ln f (xM;«!)
9a2
t-12
T /92lnf2(x2t;a2)
9a2
t-i2
92 ln c( Fj(Q, F2(-);g)
^ 9at9g
t-i2
92 ln c( F1(0, F2(-);g)
9a 22
t-i2
92 ln c( FI (•), F2(-);g)
. 9g2
Матрица OPG определяется как
T-i2 sit s t=i T 2 Slt S2 t t=i t -i 2 t=i
T T 12 S2t'S1t t=i T T 2 S2t'S2t t=i T t-i2 t=i
T T i2 s3tsit t=i T T 2 S3t'S2t t=i T t -i 2 t=i
119
t=\
t=i
0
0
t=i
t=i
t=i
t=i
T
T
T
№ 3 (23) 2011
Теорема 9 (асимптотика оценок, получаемых IFM-методом). Для IFM-оценок выполняется свойство асимптотической нормальности, а именно
0, Hо~Ч (Hо"1 ) , где H0 = E[Hess(0o)], B0 = E[OPG(ö0)],
т. е. H0 и B0 — средние значения для гессиана штрафов и матрицы OPG. Матрица H"lB0 (H"1)' известна в теории копула-функций как информационная матрица Годамби (Joe, Xu, 1996; Joe, 1997).
Из теорем 7 - 9 вытекает следующий весьма интересный факт.
Равная эффективность IFM-метода и ММП. Пусть x1t и x2t независимы (т. е. совместное распределение (xlt, x2t) имеет копула-функцию C (ux, u2 ;g) = ux-u2, плотность которой c(u, u2 ;g) = 1), и для плотностей частных распределений выполнено информационное равенство. Тогда IFM-метод и ММП дают оценки, имеющие одинаковые асимптотические распределения.
у/г (бIFM -б0) ——® N
>s
5
Í
ti ^
с
Sí s
Ф
s t
w
CD
o
n
я §
с о s о >s s t Ф
s ¡?
6
o w a ä t a
ф §
S
o
t §
®
s t
w
CD O
84
Ф
5
6.3. Эмпирические приложения в статистическом пакете R: процедуры параметрического оценивания
Модуль copula в статистическом пакете R позволяет получать как ММП-, так и IFM-оценки. Ниже представлен пример, взятый из работы (Yan, 2007). Вначале генерируется выборка из двумерного распределения, частные распределения которого — гамма-распределения с параметрами = (2,1,3,2), а копула-функция — нормальная копула-функция с параметром a = 0.5 ; затем по сгенерированной выборке строятся ММП- и IFM-оценки параметров.
# One step EML example from Yan (2007)
myMvd <- mvdc(copula=ellipCopula(family="normal", param=0.5),
margins=c("gamma"
gamma
paramMargins=list(list(shape=2, scale=1)
list(shape=3, scale=2))) n <- 200
dat <- rmvdc(myMvd, n) loglikMvdc(c(2,1,3,2,0.5 [1] -778.3114 mm <- apply(dat, 2, mean vv <- apply(dat, 2, var) b1.0 <- c(mm[1]a2 / vv[1 b2.0 <- c(mm[2]A2 / vv[2 a.0 <- sin(cor(dat[,1], dat
dat, myMvd)
vv[1] / mm[1] vv[2] / mm[2] 2], method
"kendall") * pi / 2)
120
№ 3 (23) 2011
start <- c(b1.0, b2.0, a.0) |
|
fit.eml <- fitMvdc(dat, myMvd, start=start, optim.control=list(trace=TRUE, u
E
maxlt=2000)) *
©
fit.eml ^
The Maximum Likelihood estimation is based on 200 observations. Margin 1 :
Estimate Std. ml.shape 2.127 ml.scale 0.924 Margin 2 :
Error
9360 0.19842701 6803 0.09716286
Estimate Std. m2.shape 3.213 m2.scale 1.778 Copula:
Error
331 0.3061706 994 0.1835066
Estimate Std. Error
rho.1 0.4671964 0.0552821
The maximized loglikelihood is -777.1381
The convergence code is 0 see ?optim.
# IFM method
loglik.marg <- function(b, x) sum(dgamma(x, shape=b[1], scale=b[2], log=TRUE))
ctrl <- list(fnscale = -1)
b1hat <- optim(b1.0, fn=loglik.marg, x=dat[,1], control=ctrl)$par
b2hat <- optim(b2.0, fn=loglik.marg, x=dat[,2], control=ctrl)$par
udat <- cbind(pgamma(dat[,1], shape=b1hat[1], scale=b1hat[2]),
pgamma(dat[,2], shape=b2hat[1], scale=b2hat[2]))
fit.ifm <- fitCopula(myMvd, udat, method="ml",start=a.0)
c(b1hat, b2hat, fit.ifl@estimate) fit.ifl
[1] 2.3494821 0.9395788 3.1645483 2.0540858 0.4782428
fit.ifm
The estimation method is Maximum Likelihood based on 200 observations.
Estimate Std. Error z value Pr(>|z|) rho.1 0.4782428 0.04920972 9.718461 0 The maximized loglikelihood is 25.95508 The convergence code is 0
№ 3 (23) 2011
7. Процедуры оценивания: полупараметрические и непараметрические методы
7.1. Канонический метод максимума правдоподобия (КММП)4
КММП отличается от описанных выше методов тем, что в нем не делается никаких предположений относительно параметрической формы частных распределений. Процесс оценивания в КММП состоит из следующих двух шагов.
1. Преобразуем наблюдения (x1t, x2t,..., xnt), t = 1, ...,T следующим образом:
и it = Fi,T (xit)'
1 X
где FtT (•) =-2%,, <j, i = 1,..., n, а 1{..— индикаторная функция. Другими словами,
T +1 i=i
Fi T (x) — это непараметрическая оценка частной функции распределения переменной Xi.
2. Оценим параметры копула-функции, максимизируя логарифмическую функцию правдоподобия5:
т
У CML = ar§max 2 ln C(FI,T (Xli )'-' Fn,T (xnt); УУ
У t=l
'! Для простоты при описании асимптотических свойств КММП-оценки снова будем рас-■g сматривать только двумерный случай. Пусть l(u1,u2,g) = lnc(u1,u2;g) . Далее индексами ■&■ 1, 2, g будем обозначать частные производные функции l(u1, u2 ,g) относительно u1, u2 ,g Ц соответственно. Кроме того, положим
15
§ л T л T §
5 T rrr / 1 g у 1,1 V 1t" 2,1 V 2t / ■> / J' 1 rp
3 t=1 1 't=1
g Поскольку уCML является решением следующего дифференциального уравнения:
С5
>S iJT rp
! T =1
is
i? то, используя разложение функции ST в ряд Тейлора, получим:
я T
а 1 1
t т ы
2 и, следовательно,
| ^(Усщ.-У) ^^
is ~Hr
I -
® 4 В англоязычном оригинале The Canonical Maximum Likelihood (CML). о 5
§ 5 В дальнейшем предполагается, что анализируемое семейство копул зависит от единственного параметра g.
1 T 1 T
ST = lg(F1,T (x1t), F2,T (x2t Xg^ HT = ^2 lgg(F1,T (x1t X F2,T (x2t); g)
1T
st = T 2 lg (f1,t (x1t), f2,T (x2t );g) = 0
1 T
0 = т 2 lr(FiT(x»)' F2T(x2t); у)
= ST + Нт (У CML -у),
CML
№ 3 (23) 2011
Из работ (Ruymgaart et al., 1972; Genest et al., 1995; Ruud, 2000) отметим, в частности, g
следующие результаты, справедливые при соблюдении некоторых условий регулярности: g
а) 9cml ^ уо (п. н) пРи t ; §
б) ^(Уаш. "Ус) N (0, а 2И~2 ), где *
s2 = Var[/g(X),F2(x2t);у) + Щхи) + W2(x2i)], h = e[(FIX),F2(x2t);g)] ;
выражение для s2 дано здесь для двумерного случая (n = 2 и, соответственно, i = 1,2), а W (xit) определяются соотношениями:
W, (x,t) = -/ (xt )£,} 7уг (, U2t ;g)c (1t, U2t ;g)duidu2;
в) полупараметрическая оценка уCML менее эффективна, чем оценка, полученная с помощью одношагового метода максимального правдоподобия уML (за исключением случая, когда xlt и x2t статистически независимы).
7.2. Трехшаговый канонический метод максимального правдоподобия
(KME-CML метод)6
Начиная с момента выхода работы (Genest et al., 1995), использование полупараметрических методов для копула-функций эллиптического типа стало обычной практикой, см., например, (Cherubini et al., 2004; McNeil et al., 2005). В частности, для копула-функций Стьюдента, после того, как на первом шаге получены непараметрические оценки частных функций распределения, можно получить оценку корреляционной матрицы, вычисленную с использованием метода моментов и оценок ранговых коэффициентов корреляции t-Кен-далла. При этом степени свободы оцениваются с использованием метода максимального правдоподобия. Отметим, что оценка частных распределений на первом шаге не является необходимым условием для оценки корреляционной матрицы, поскольку оценка t-Кендал-ла основана на количестве согласованных наблюдений, которое не зависит от монотонных преобразований. Однако оценивание частных распределений является необходимым при оценке числа степеней свободы.
Ниже дается описание трехшагового KME-CML метода (см. также (Bouye et а1., 2000; McNeil et al., 2005; Fantazzini, 2010)).
Трехшаговый KME-CML метод оценивания параметров копула-функций
1. Преобразуем (x1t, x2t,..., xnt) к нормированным рангам (F1T (x1t), F2T (x2t),..., FnT (xnt)), используя эмпирическую функцию распределения для каждой компоненты вектора наблюдений (здесь и далее n — размерность анализируемой случайной величины, T — общее число ее наблюдений).
2. Для всех пар (j, k) компонент вектора наблюдений оценим t-Кендалла:
Rjk =t[FjT(Xj),FkT(Xk)] = (C2)-1 2 sign(( - xi.Xx2t - x25)).
1<t<5<T
6 В англоязычном оригинале метод называется Kendall-t Moment—Estimator of Canonical Maximum Likelihood
Method.
№ 3 (23) 2011
>5
I
Возьмем оценку корреляции для (], k) компонент вектора наблюдений 2jk = sin(р R^). Поскольку покомпонентное преобразование, осуществленное на первом шаге, не гарантирует положительной определенности матрицы 2 = (2д то для ее обеспечения обычно вносятся некоторые поправки (Rousseeuw, Molenberghs, 1993).
3. Находим оценку степеней свободы Vемь копула-функций Стьюдента с использованием метода максимального правдоподобия:
т
Vсмь = а^тах ^ 1п ст_сори1а (хи),..., ¥пт (хм); 2 , У)
Второй шаг описанной процедуры реализует метод моментов, основанный на оценках q = п(п — 1) / 2 моментов и такого же количества коэффициентов г-Кендалла, оцененных с использованием эмпирических распределений (эта оценка известна как моментная оценка г-Кендалла). Следует еще раз отметить, что нет необходимости использовать оценку г-Кендалла, полученную с использованием именно эмпирических распределений, т. к. г-Кендалла сохраняет одно и то же значение при всех монотонных преобразованиях. Таким образом, можно взять q моментов от некоторой векторнозначной функции у, зависящей от корреляций 00 = (р1,..., р9)', а именно:
I \
Е[у (^,¥2); д(0)]
у( ¥х,..., ¥п; в0\ = '
Е|У*1,¥п); рц(0)
у( ,., рп; бо) = (0,0,., 0)', (20)
| Тогда теоретические моментные тождества могут быть представлены в виде §
4 где в0 — истинное значение оцениваемого векторного параметра. Соответственно, оценка § 0 определится из (20) с заменой теоретических моментов их выборочными аналогами.
>¡5 Для оценки, полученной с помощью метода KME-CML, справедливы следующие теоре-
5 мы (все доказательства представлены в приложении А работы (Fantazzini, 2010)).
^ Теорема 10 (состоятельность 0). Предположим, что (хи,...,х () — независимые (по ¿)
наблюдения п-мерной случайной величины (Х1,...,Хп) со структурой зависимости, задана ной плотностью копула-функции с(ии,...,ип{;20,п0). Предположим, что: || а) пространство параметров 0 является компактным подмножеством М*; | б) *-мерный вектор моментов у(¥1(Х1),...,¥п(Хп);00\ непрерывен относительно 00
§ для любых X.; §
| в) у((Х1),...,¥п(Хп);0) измеримы относительно X. для всех ОЕ0;
| г) у( (Х1),..., ¥п (Хп); 0)* 0 для всех О^0,Ое0;
| д) зирое01| у ((Х1),..., ¥п (Хп); 0) ||<», где || А|| обозначает евклидову норму матрицы А.
§ Тогда 0 ——® 00 при Т .
№ 3 (23) 2011
При условиях теоремы 10, дополненных некоторыми условиями регулярности (Genest |
et al., 1995), доказана и состоятельность оценки vcml (т. е. vcml —v0 при t). g
Асимптотическая нормальность оценок, полученных методом KME-CML, не очевидна, £
,, я
т. к. используется трехшаговая процедура, при которой на втором и третьем шагах исполь- в
зуются разные методы оценивания. Возможным решением является представление оценки 4 на третьем шаге КММП, как оценки специального вида, полученной методом моментов. Отметим, что КММП-оценка определяется путем приравнивания к нулю производной (относительно параметра n) логарифма функции правдоподобия:
Ы (-;у)
dv
T
= 2 lv(FlT (XU FnT ( xnt); 2 , V ) = о.
Разделив обе части на Т, получим определение оценки по методу моментов:
1 Т ~ 1 Т ~ т 21 (fit ( х» FnT (xnt); 2, v) =- 2 fv ( fIt (xit),-, FnT (xnt); 2, v) = о.
T t=1 T t=1
Таким образом, КММП-оценка может быть представлена как оценка, получаемая методом моментов (ММ).
Оценка методом моментов — это то значение в, которое обеспечивает равенство между выборочными моментами (выборочные средние) и их теоретическими аналогами. Поскольку число параметров равно q, то требуются q моментных уравнений с неизвестными в (более подробно см. (Greene, 2002)). Таким образом, можно использовать известные асимптотические результаты, справедливые для метода моментов.
Определим выборочные моменты вектора YKME-CML, зависящего от параметров
S = (pv...pq, v)': f t
T (FT (xn)' F2T (x,2); pj
1 v
^T (xii X---, FnT (xnt ); ")
1 T l \
T 2 ^ (^(п-1).т (x(n-1)t), FnT (xnt); p J 1 t=1
1 T Л
T 2^ (jF1t (x1t I-, FnT(xnt); 2, v)
T
\ t=1
= 0.
(21)
Для определения ковариационной матрицы предельного распределения оценки х необходимо подкорректировать (21) с учетом непараметрических оценок частных распределений и их дисперсий, см. (Genest et al., 1995, §4), а именно
У ((№),F2(X2); А)
А о =
yq[F„-i(X-),Fn(Xn);
n
y,(F (X,),..., Fn (X n); So, По ) + 2W> (Xj)
Yо = Var[Aо ] = KME-CML А KME-CML ],
= 0
125
t=l
t=1
№ 3 (23) 2011
где
W, (Xj) = Л
dvdu
-In c(Ui,..., un )dC (Ui,..., un).
С учетом вышеизложенного справедлива следующая теорема.
Теорема 11 (асимптотическое распределение KME-CML оценок). Пусть выполнены предположения предыдущей теоремы и дополнительные условия из (Genest et al., 1995).
Кроме того, предположим, что матрица
9Y,
as'
имеет ограниченные (по T) эле-
менты и является отрицательно определенной, тогда как X0 также имеет ограниченные (по Т) элементы, но положительно определена. Тогда при Т :
Г п-Л'
VT (S -s0 )-
® N
0, E
aY
as'
-1 -1 /
-CML Y 1 0 E
\
aY
as'
(22)
2
a
Отметим, что последнее асимптотическое свойство выполняется и для многомерных моделей с гетероскедастичностью. Для таких моделей на первом этапе получают состоятельные оценки параметров одномерных частных распределений, а затем рассчитывают соответствующие оценки остатков (так называемые «невязки») которые используются для ^ оценки совместного распределения многомерного вектора остатков при помощи копула-§. функций. Этот результат является прямым следствием теорем 1 и 2 из работы (Kim et al., si 2008), которая, в свою очередь, использует работы (Koul, Ling, 2006; Koul, 2002). Отметим, что похожие результаты представлены также и в (Chen, Fan, 2006), но без доказательств. Со-
^ ответствующий результат формулируется в теореме 12. g
| Теорема 12 (асимптотика KME-CML оценок для многомерных моделей с гетероскеда-
| стичностью). Предположим, что выполнены условия а)-д) теоремы 10, а также А.1-А.9
| из (Kim et al., 2008). Тогда для KME-CML оценки имеет место асимптотическая сходи-
2 мость (22). §
§ Условия (А.1) - (А.4) справедливы для моделей достаточно общего вида. В частности,
0 условия (А.1) - (А.2) требуют, чтобы плотность копула-функций имела непрерывные част-
1 ные производные до третьего порядка включительно. Кроме того, они должны быть конеч-| ными вместе с их вторым моментом. Условие (А.3) — это техническое условие на частные ¡? производные, а условие (А.4) требует, чтобы были выполнены условия (А.1) из (Genest et
0 al., 1995). Условия (А.5)-(А.8) также являются техническими и взяты из работ (Koul, 2002)
С5
^ и (Koul, Ling, 2006). Условие (А.9) не является слишком ограничительным. Например, ес-
g ли условное среднее является функцией исторических значений строго стационарных а
1 и эргодических временных рядов, то каждое слагаемое суммы является строго стационар-
2 ным и эргодическим процессом с нулевым средним, а значит, условие (А.9) выполняется ! (см. (Taniguchi, Kakizawa; 2000, теоремы 1.3.3 - 1.3.5), а также (Kim et а1., 2008)).
<u t
щ Свойства и вычислительные аспекты в условиях малых выборок
¡^ Поскольку основные свойства предлагаемого полупараметрического метода являются
| асимптотическими, то на примерах смоделированных выборок в работе (Fantazzini, 2010)
§ было проведено исследование, показавшее, что в условиях малых выборок и больших зна-
№ 3 (23) 2011
чений п численная максимизация логарифмической функции правдоподобия не сходилась | значительно чаще при использовании КМЕ-СМL оценок, чем при использовании ММП § оценок. В то время как ММП-оценка параметра попадала в 95% доверительный интервал £ примерно для 95% случаев, КМЕ-СМL оценка попадала в соответствующий доверительный в интервал лишь в 30% случаев. Однако такое снижение доли случаев со сходимостью более 4 значительно для двумерных копула-функций Стьюдента по сравнению с копула-функция-ми Стьюдента большей размерности, которые типичны для финансовых портфелей. Кроме того, как ММП, так и KME-CML метод показали весьма существенные значения средних и медиан смещений для оцененных корреляций, когда фактические значения последних принимают значения, близкие к нулю.
Наконец, в работе (Fantazzini, 2010) показано, что метод собственных значений, представленный в (Rousseeuw, Molenberghs, 1993), должен быть использован для получения положительно определенной корреляционной матрицы не только в условиях малых выборок (Т <100 ), но и в условиях, когда описываемому процессу отвечает наименьшее собственное значение, близкое к нулю. Эта поправка влечет положительное смещение оценки параметра п, но ее влияние на сходимость при максимизации для получения параметра п весьма ограничено.
Таким образом, предыдущие результаты показывают, что КМЕ-СМL метод может быть использован в случае малых выборок и при относительно небольших значениях числа степеней свободы, однако ММП является более привлекательной альтернативой. Возможной стратегией при оценке параметров является следующее: на первом этапе использовать КМЕ-СМL метод; если оценка числа степеней свободы больше 20, то следует использовать ММП-оцен-ку, если последняя обеспечивает сходимость при максимизации соответствующей функции правдоподобия. Иначе, в качестве альтернативного решения следует использовать нормальную копула-функцию, к которой стремится копула-функция Стьюдента при п® ¥ (нормальная и стьюдентовская копула-функции достаточно близки уже при п> 20).
7.3. Методы непараметрического оценивания
В работе ^егташап, Scaillet, 2003) предлагается непараметрическая оценка для копула-функций многомерных стационарных процессов, удовлетворяющих условиям сильного перемешивания.
Перед тем, как обратиться к асимптотическим свойствам этой оценки, определим понятие ядерной функции.
Определение 10. Ядерная функция — это действительнозначная функция К (и), -¥< и < + ¥; которая удовлетворяет следующим условиям:
1) симметричность: К (и) = К (-и);
2) в точке и = 0 достигается максимум;
+ ¥
3) / К (и ^и = 1;
— ¥
4) неотрицательность: К (и) > 0;
5) К (и) ограничена;
¥
6) J и2 К (и ^и <¥ .
— ¥
№ 3 (23) 2011
Свойства 5 и 6 необходимы для вывода асимптотических свойств оценок, получаемых на основе ядерных функций. Возьмем «-мерное ядро и его кумулятивную функцию:
Я Я —} я
к(х) = П к} (х,), К(X) = П / к} (х^х = П К (я,),
,=1
,=1 -¥
,=1
где для простоты взяты произведения одномерных ядерных функций. Кроме того, возьмем
я
к (х; Ь) = П к,
,=1
/ \
х, Л (т)/
я
К (X; Ь) = П К,
,=1
/ \ х,
к(т),
где Ь(Т) — диагональная матрица с элементами к ,(Т), ] = 1,...,п на главной диагонали и детерминантом |Ь(Т)|. При этом к ,(Т) положительна и к, ® 0 при Т Ь(Т) обычно называют «шириной окна» ядерной функции.
Определение 11. Ядерная оценка у (•) плотности У ,(•) распределения случайной величины У, в точке у, определяется как
>5
Г
л
с §
§ ф »
га и
о
и
л §
С
о
5 О
>¡5 »
Ф §
¡г
6
о га а
Й
2 »
а
ф §
о §
ф »
га и
о
8ч ф
5
л(у)=^ 2 к
з '=1
I V \
Уз
а ядерная оценка плотности случайного вектора У, в точке у = (у1,...,уп)'равна
1 т
/м - тщтя ?4 (у - ; "<т >)•
Аналогичным образом, ядерная оценка кумулятивной функции распределения случайной величины У, в точке у, равна
^ у, ^
^(У,) = / У,(x)dx,
а ядерная оценка кумулятивной функции распределения случайного вектора У, в точке у равна:
У Уп
Р (у) = / - I Я*)Л-
Например, для гауссовской ядерной функции к, (х) = <р(х) получаются следующие ядерные оценки функций распределения:
гл у,)=Т 2Ф
I V \
у,■<
%)=Т 2Пф
I V \
у,■<
\ /
1=1 ,=1
\ /
где через <р(-) и Ф() обозначены соответственно плотность и функция распределения стандартного нормального распределения.
128
№ 3 (23) 2011
Определение 12 (ядерная оценка копула-функции). В силу следствия из теоремы Скла- s ра C(u) = C(u1,...,un) = H(F1(-V)(u1),...,Fn(_1)(un)), где H(•) — многомерная функция рас- |
пределения. Тогда ядерная оценка C(u) копула-функции C(u) определяется следующим § образом: в
et
C (u) = h (Z) = h (Z 1,., z n),
где Zj = inf,eR {y : Fj (y) > ujj соответствует ядерной оценке квантиля уровня uj для
функции распределения случайной величины Yjt.
В работах (Fermanian, Scaillet, 2003; van der Vaart, Wellner, 1996) доказывается состоятельность и асимптотическая нормальность ядерных оценок C(u).
7.4. Эмпирические приложения в статистическом пакете R: процедуры полупараметрического оценивания
Продолжим рассмотрение примера, начатое в п. 6.3 (см. также (Фантаццини, 2011)). Можно оценить параметр зависимости a при помощи канонического метода максимума правдоподобия (КММП) без спецификации частных распределений.
# CML method
eu <- cbind((rank(dat[,1]) - 0.5)/n, (rank(dat[,2]) - 0.5)/n) fit.cml <- fitCopula(myMvd, eu, method="mpl", start=a.0) fit.cml
The estimation method is Maximum Pseudo-Likelihood based on 200 observations.
Estimate Std. Error z value Pr(>|z|) rho.1 0.4806303 0.05066396 9.48663 0 The maximized loglikelihood is 26.02639 The convergence code is 0
Ниже представлены другие примеры, взятые из copula пакета.
# Example: Gumbel copula gumbel.cop <- gumbelCopula(3, dim=2)
n <- 200 x <- rcopula(gumbel.cop, n) ## true observations u <- apply(x, 2, rank) / (n + 1) ## pseudo-observations ## inverting Kendall's tau
fit.tau <- fitCopula(gumbel.cop, u, method="itau") fit.tau
## inverting Spearman's rho
fit.rho <- fitCopula(gumbel.cop, u, method="irho") fit.rho
№ 3 (23) 2011
## maximum pseudo-likelihood
fit.mpl <- fitCopula(gumbel.cop, u, method="mpl") fit.mpl
## maximum likelihood
fit.ml <- fitCopula(gumbel.cop, x, method="ml") fit.ml
## A multiparameter example
normal.cop <- normalCopula(c(0.6,0.3 6, 0.6),dim=3,dispstr="un" x <- rcopula(normal.cop, n) ## true observations u <- apply(x, 2, rank) / (n + 1) ## pseudo-observations ## inverting Kendall's tau
fit.tau <- fitCopula(normal.cop, u, method="itau") fit.tau
## inverting Spearman's rho
fit.rho <- fitCopula(normal.cop, u, method="irho") fit.rho
## maximum pseudo-likelihood
fit.mpl <- fitCopula(normal.cop, u, method="mpl") fit.mpl
ss ## maximum likelihood
s fit.ml <- fitCopula(normal.cop, x, method="ml")
lÊ fit.ml
Список литературы
Айвазян С. А. (2010). Методы эконометрики. М.: Магистр.
Фантаццини Д. (2011). Моделирование многомерных распределений с использованием копула-функций. I. Прикладная эконометрика, 2 (22), 98 - 134. g Aas K., Czado C., Frigessi A., Bakken H. (2009). Pair-copula constructions of multiple dependence. In-
5
о surance: Mathematics and Economics, 44 (2), 182 - 198. >s
^ Bedford T., Cooke R. M. (2001). Probability density decomposition for conditionally dependent random variables modeled by vines. Annals of Mathematics and Artificial Intelligence, 32, 245 - 268.
a
b Bedford T., Cooke R. M. (2002). Vines — a new graphical model for dependent random variables. An-•в
£ nals of Statistics, 30, 1031 - 1068. <u
§ Bouye E., Durrleman V., Nikeghbali A., Riboulet G., Roncalli T. (2000). Copulas for finance: A reading
g guide and some applications. Groupe de Recherche Operationnelle, Credit Lyonnais, Working Paper. g
щ Chen X., Fan Y. (2006). Estimation and model selection of semiparametric copula-based multivariate
| dynamic models under copula misspecification. Journal of Econometrics, 135, 125 - 154. a Cherubini U., Vecchiato W., Luciano E. (2004). Copula methods in finance. Wiley. | Clemen M. N., Jouini R. T. (1996). Copula models for aggregating expert opinions. Operations Re-
| search, 44, 444 - 457.
Barbe P., Genest C., Ghoudi K., RremiUard B. (1996). On Kendall's process. Journal of Multivariate Analysis, 58, 197 - 229.
№ 3 (23) 2011
Coles S., Heffeman J., Tawn J. (1999). Dependence measures for extreme value analyses. Extremes, 2 s
(4), 339 - 365. t
d n
Conover W. J. (1999). Practical nonparametric statistics. 3r ed. Wiley. E
Embrechts P., McNeil A., Straumann D. (2002). Correlation and dependence in risk management: prop- §
erties and pitfalls. In: M. A. H. Dempster (ed.), Risk Management: Value at Risk and Beyond. Cambridge: ^ Cambridge University Press.
Fang K., Kotz S., Hg K. (1987). Symmetric multivariate and related distributions. London: Chapman
Fantazzini D. (2010). Three-stage semi-parametric estimation of t-copulas: Asymptotics, finite-sample properties and computational aspects. Computational Statistics and Data Analysis, forthcoming.
Ferguson S. T., Genest C., Hallin M. (2000). Kendall's tau for serial dependence. Canadian Journal of Statistics, 28, 587 - 604.
Fermanian J., Scaillet O. (2003). Nonparametric estimation of copulas for time series. Journal of Risk, 5, 25 - 54.
Genest C., MacKay J. (1986). The joy of copulas: Bivariate distributions with uniform marginals. American Statistics, 40, 280 - 285.
Genest C., Ghoudi K., Rivest L. (1995). A semiparametric estimation procedure of dependence parameters in multivariate families of distributions. Biometrika, 82, 543 - 552.
Gourieroux C., Monfort A.. (1995). Statistics and econometric models. Cambridge: Cambridge University Press.
Greene W. (2002). Econometric analysis. Prentice Hall.
Hollander M., Wolfe D. A. (1973). Nonparametric statistical inference. New York: Wiley.
Hult H., Lindskog F. (2002). Multivariate extremes, aggregation and dependence in elliptical distributions. Advances in Applied Probability, 34, 587 - 608.
Joe H., Xu J. (1996). The estimation method of inference functions for margins for multivariate models. Technical Report No. 166. Department of Statistics, University of British Columbia.
Joe H. (1997). Multivariate models and dependence concepts. London: Chapman Hall.
Kim G., Silvapulle M. J., Silvapulle P. (2007). Comparison of semiparametric and parametric methods for estimating copulas. Computational Statistics and Data Analysis, 51 (6), 2836 - 2850.
Kim G., Silvapulle M. J., Silvapulle P. (2008). Estimating the error distribution in multivariate heterosce-dastic time series models. Journal of Statistical Planning and Inference, 138 (5), 1442 - 1458.
Koul H. L. (2002). Weighted empirical processes in dynamic nonlinear models. Lecture Notes in Statistics, V. 166. Springer.
Koul H. L., Ling S. (2006). Fitting an error distribution in some heteroscedastic time series model. Annals of Statistics, 34, 994 - 1012.
Kruskal W. (1958). Ordinal measures of association. Journal of the American Statistical Association, 53, 814 - 861.
Kurowicka D., Cooke R. M. (2006). Uncertainty analysis with high dimensional dependence modelling. New York: Wiley.
Lindskog F., McNeil A., Schmock U. (2003) Kendall's tau for elliptical distributions. In: G. Bol, G. Na-khaeizaden, S. Rachev, T. Ridder, K.-H. Vollmer (eds.), Credit Risk. Measurement, Evaluation and Management, Physica-Verlag, A Springer-Verlag Company, Heidelberg, 149 - 156.
Hall.
№ 3 (23) 2011
Mardia K. V., Kent J., Bibby J. M. (1997). Multivariate analysis. San Diego: Academic Press. McNeil A., Frey R., Embrechts P.. (2005). Quantitative risk management: Concepts, techniques and tools. Princeton Series in Finance, New Jersey.
Nelsen R. B. (1999). An introduction to copulas. Lecture Notes in Statistics. New York: Springer. Nelsen R. B. (2006). An introduction to copulas. Lecture Notes in Statistics, 2nd Edition. New York: Springer.
Newey W. K., McFadden D. (1994) Large sample estimation and hypothesis testing. Handbook of Econometrics, V. 4, 2111 - 2245, Amsterdam: Elsevier Science B. V
Oakes D. (1994). Multivariate survival distributions. Journal of Nonparametric Statistics, 3, 343 - 354. Patton A. (2006a). Estimation of copula models for time series of possibly different lengths. Journal of Applied Econometrics, 21, 147 - 173.
Patton A. (2006b). Modelling asymmetric exchange rate dependence. International Economic Review, 47 (2), 527 - 556.
Poon S., Rockinger M., Tawn J. (2004). Extreme value dependence in financial markets: Diagnostics, models, and financial implications. Review of Financial Studies, 17, 581 - 610.
Resnick S. I. (1987). Extreme values, regular variation and point processes. New York: Springer. Rodgers J. L., Nicewander W. A. (1988). Thirteen ways to look at the correlation coefficient. The American Statistician, 42, 59 - 66.
s= Rousseeuw P., Molenberghs G. (1993). Transformation of non positive semidefinite correlation matrices. Communications in Statistics — Theory and Methods, 22, 965 - 984. :c Ruud P. (2000). An introduction to classical econometric theory. Oxford University Press.
Ruymgaart F. H., Shorack G. R., Van Zwet W. R. (1972). Asymptotic normality of nonparametric tests ^ for independence. The Annals of Statistics, 43, 1122 - 1135.
§ Shih J. H., Louis T. A. (1995). Inferences on the association parameter in copula models for bivariate §
® survival data. Biometrics, 51, 1384 - 1399.
§ Sibuya M. (1961). Bivariate extreme statistics. Annals of Mathematical Statistics, 11, 195 - 210.
0
2 Statistics with confidence. (1989). Eds.: Gardner M. J., Altman D. G. London: BMJ. 5
g Taniguchi M., Kakizawa Y. (2000). Asymptotic theory of statistical inference for time series. New York: * Springer.
'I Van der Vaart A., Wellner J. (1996). Weak convergence and empirical processes. New York: Springer.
1 Van De Wiel M. A., Bucchianico A. (2001). Fast computation of the exact null distribution of Spears
f 1 -21. S
man's rho and Page's L statistic for samples with and without ties. Journal of Statistical Planning and Inference,, 92, 133 - 145.
White H. (1994). Estimation, inference and specification analysis. Cambridge University Press. Yan J. (2007). Enjoy the joy of copulas: With a package copula. Journal of Statistical Software, 21 (4),
132