Об асимптотическом поведении резерва страховой компании
В.Е. Бенинг, Р.В. Пирогов
Аннотация—В работе проведено статистическое моделирование некоторых моделей случайных сумм. Были смоделированы и проанализированны пуассон-биномиальные, пуассоновские, геометрические случайные суммы и случайные суммы с объемом трехточечного симметричного распределения. Результаты проделанной работы актуальны не только для ведения бизнеса страхования, но и для любой другой деятельности, которая подразумевает случайное накопление исходов. От характера распределения случайного объема зависит предельное распределение случайной суммы и скорость её сходимости. Структура предельного распределения играет важную роль в оценке квантилей и проверке гипотез.
Проведено необходимое статистическое моделирование, подтверждающее практическое применение асимптотических моделей. Подчеркнуто различие предельных распределений у класса смешанных пуассоновских сумм. Произведены оценки скорости сходимости некоторых смоделированных случайных сумм к их предельным распределениям. Рассмотрено применение смоделированных случайных сумм в вычислении верхней оценки квантиля случайных сумм. Для оценки пуассон-биномиальных, пуассоновских и смешанных пуассоновских случайных сумм было применено неравенство Бэрри-Эссеена. Для оценки квантиля случайной суммы с объемом трехточечного симметричного распределения было проведено асимптотическое разложение функции распределения ненормированной статистики случайной суммы. Подсчет же необходимого резерва страховой компании заключается в оценке квантиля уровня близком к единице.
Ключевые слова—Пуассон-биномиальная случайная сумма; пуассоновская случайная сумма; смешанная пуассонов-ская случайная сумма; отрицательно биномиальная случайная сумма; геометрическая случайная сумма; функция распределения; выборка случайного объёма; распределение Лапласа; гамма распределение; экспоненциальное распределение; квантиль; необходимый резерв страховой компании; трехточечное симметричное распределение; асимптотическое разложение; неравенство Берри-Эссеена.
I. Введение
В классических задачах математической статистики объем выборки считается известным параметром. На практике же объем выборки чаще всего также неизвестен и является случайной величиной. Обычно задачи с подобной особенностью могут предоставить исследователю временной интервал, в течение которого с определенной вероятностью происходят случайные события, то есть статистические данные накапливаются в течение фиксированного промежутка времени. Примеры выборок со случайным количеством исходов проявляются в страховании, когда страховые случаи случайным образом накапливаются за фиксированный страховой период, и их число варьируется от периода к периоду. Данная особенность может быть справедлива и к другим областям,
таким как медицина, где число пациентов варьируется от года к году, технике, где фиксируется количество отказов, и прочим сферам, где вместо детерминированного объема дан промежуток времени, в течение которого фиксируется наступления случайных событий. Далее без ограничения общности в качестве примера будет использоваться деятельность страховой компании. Таким образом, число наблюдений перестает быть параметром и становится наблюдением, то есть статистикой. В силу указанных обстоятельств вполне естественным становится изучение асимптотического поведения статистик достаточно общего вида, основанных на выборках случайного объёма.
В данной работе рассматриваются суммы наблюдений со случайным объемом, которые подходят для моделирования выплат страховой компании за страховой период. Для выборок случайного объема число слагаемых в таких суммах само становится случайным, и такие суммы называются случайными. В отличие от сумм с детерминированным объемом, асимптотическое поведение статистик типа сумм и статистик типа средних арифметических в суммах со случайным объемом при их неслучайной нормировке оказывается различным, что показано в работе [6], так как случайная нормировка неприменима для построения разумных асимптотических аппроксимаций распределений статистик, то она не рассматривается. Использование же неслучайной нормировки и приводит к возникновению не «чистого» нормального закона, а смешанных нормальных предельных распределений у статистик типа сумм и типа средних арифметических. Различие предельных законов может дать дополнительную информацию о структуре исходных данных. Использование асимптотических оценок случайных сумм(см. [3], [7], [8]) удобно для получения верхних оценок необходимого резерва страховой ком-пании(или квантилей функций распределения статистик, построенных по выборкам случайного объема) с прием-лимой вероятностью неразорения, в случае, если число страховых требований случайно.
II. Оценки точности асимптотических моделей
случайных сумм
А. Оценка пуассон-биномиальных и пуассоновских случайных сумм
Один из самых простых частных случаев случайной суммы является пуассон-биномиальная случайная сумма, дадим ей определение.
Определение 1. Пусть Х\,Х2,... - независимые одинаково распределенные случайные величины на некотором
вероятностном пространстве, Мп,р ~ РВ(п,р), где п £ N и р = (р1,...,рп), рк £ (0,1) Ук е [1,п]. Мпр, Х1,..., Хп - независимы при каждом п и р. Тогда случайная величина
Бп,р(ш) := £ Хг(ш), ш £ П (1)
г=1
называется пуассон-биномиальной случайной суммой, а её распределение - обобщенным пуассон-биномиальным (см. [4] и [5]). Примем, что Б = 0, при N = 0.
В сделанных выше предположениях может быть удобно представить пуассон-биномиальную случайную сумму следующим образом
S,
£k Xk - E[Xk ]Pk
n,p
]Г
k=i ^A (E[X2] - ^(E[X])2)
Эту сумму мы уже можем оценить с помощью нервен-ства Берри-Эссеена с уточненной структурой [2]
где
△n := sup I P(Sn,p <x) - Ф(х)| <
жек
< minCs(S)(L2+s,n + sT2+s,n),
s>0
L
= 1
2+6,n := д2+й
EEM
2+6
k=l
(10)
(11)
Sn,p ^ ^ CiXi i=1
(2)
где € ~ Ввг(рг), с 0 < Рг < 1 Уг £ [1,п], а $1,... ,€п, Х1,..., Хп - независимы.
Справедливость данного представления можно посмотреть в работе [3].
Оценить сверху пуассон-биномиальную случайную сумму можно с помощью неравенства типа Берри-Эссеена с уточненной структурой, при условии, что £ (0,1] : Е[ | Хг | 2+й] < то, для г = Т"п.
Для удобства введем еще одну случайную величину Х, которая имеет то же распределение, что и слагаемые в случайной сумме. Случайные слагаемые имеют следующие моменты:
(3)
E[X], E[X]2, а2 := D[X] = E[X]2 - (E[X])2.
Моменты объема пуассон биномиальной случайной суммы следующие:
T2+,,n := а2+6
k=l
(12)
дробь Ляпунова и неотрицательная величина, где
Yk := 6Xk - E[Xk]pk, El := A(E[X2] - A(E[X])2) =
(13)
]T> (E[X2] - (E[X])2pk) = £E[Yk2] > 0.
k=i
k=l
учитывая, что случайная величина Ук отцентрована, то Е[Ук] =0 и, в силу леммы 2.7 из [3] стр. 59,
E[ | Yk I 2+6] < < E[ I Xk I 2+6]pk(1 + 3.25pk) < œ, Ук £ [1,n].
(14)
-к Г' ]Рк (........... ' " " " ""'
Воспользовавшись 14 точно также оценим дробь Ляпунова
E[Nn,p] = A, где A := ^pk
k=i
(4)
k=i
k=l
Я __Sn,p E[Sn,p]
Sn,p : =
Sn,p - A E[X]
VD[Sn,p] tJa (E[X2] - ^(E[X])2)
L2+s,n < E-(2+s1J2 E[ I Xk I 2+6]pk (1 + 3.25pk ) (15)
D[Nn,p] = Y,pk (1 - pk ) = A - A2, где A2 := ^pI (5)
Используя моменты случайных слагаемых 3 и моменты случайного объема 4, 5 найдем математическое ожидание и дисперсию пуассон-биномиальной случайной суммы:
Е[Бп,р] = А Е[Х ] (6)
D[Sn,p] = A [E[X2] - (E[X])2] + (A - A2)(E[X])2 =
= a(e[X2] - A(E[X])^ (7)
Далее центрируем и нормируем случайную сумму
к=1
Подставив во второе слагаемое Т2+^п выражения 13 получим
п 6
Т2+з,п = В-(2+й) £ [рк (Е[Х2] - (Е[Хк])2р^]1+'
к=1
(16)
Подставив 15 и 16 в неравенство Берри-Эссеена с уточненной структурой, получим следующую оценку сверху для пуассон-биномиальных случайных сумм
1
А„ < minCs(ö)—тг-yX
s^o sV ' еП+6
n
[E[ I Xk I 2+6]pk(1 + 3.25p6k)+ (17)
k=i
+s(pk(E[X2] - (E[Xk])2pk))1+2
(8)
Заметим также, что в силу представления 2, выражение 8 можно представить следующим образом
Из базового курса теории вероятности известно, что если п большое, а А - положительное фиксированное число, то Вгп(п, п) ~ Роге (А). Определим пуассонов-скую случайную сумму.
и
Определение 2. Пусть Х\, Х2,... - независимые одинаково распределенные случайные величины, ~ Ро1в(Х), X > 0 и Х\,..., Хп независимы при каждом X > 0. Тогда
Nx(u)
(18)
называется пуассоновской случайной суммой, а её распределение обобщенным пуассоновским(compound Poisson [5]).
Далее для оценки аппроксимации пуассон-биномиальной суммы пуассоновской суммой нам понадобится расстояние по метрике Колмогорова
рЫ = sup |P(£<x) - P(V<x)\. (19)
хек
В работе [3] доказывается следующая оценка сверху
p(Sn,p,Sx) p2.
(20)
С другой стороны, при А ^ ж пуассоновские случайные суммы, как мы увидим в II-B, асимптотически нормальны, из чего следует сближение пуассон-биномиальных сумм к нормальному распределению с рассматриваемыми условиями.
Дать верхнюю оценку нормальной аппроксимации может следующая теорема, доказательство которой приведено в [3]:
Теорема 1. Пусть E[X2] > 0, E[ | X | 2+s] < ж с некоторым S G (0,1],
Sa :=
L2+S,x
= Sa - E[Sa] = Sa - А E[X]
VDpAI ^ЩЩ :
E[ | X | 2+й]
' AÄ/2(E[X 2])!+й/2 Z — N(0,1). Тогда для всех А> 0
, А > 0,
p(Sa,Z) < M(S)L2+s,a,
где
M (S) := min C(S), 0 < S < 1, C(S) - константы из [7][8].
(21)
(22)
Если ввести случайную величину N\ ~ Pois(X), независимую от Л при каждом X > 0, то можно записать
N = Na
Определение 4. Если Xi, X2,... одинаково распределены, N ~ MP (Л) и N,Xi,X2 независимы на некотором вероятностном пространстве (П, A,P), то случайная величина
S(u):= Xi (и) + • • • + XN (ш)(ш), ш G П, (24)
называется смешанной пуассоновской случайной суммой, а её распределение - обобщенным смешанным пуас-соновским (compound mixed Poisson). Примем, что если N = 0, то S = 0.
п.н.
Пусть теперь Л = Лг > 0 - случайная величина, распределение которой зависит от параметра t > 0, и случайная величина N(t) ~ MP(Л^ такова, что N(t),Xi,X2,... независимы при каждом t > 0. Тогда такую случайную сумму([9], [10], [11]) будем обозначать следующим образом
S(t):= Xi + ••• + Xn (t). (25)
Теорема 2. Пусть Xi,X2,... - одинаково распределенные случайные величины. Предположим, что E[X] = 0, E[X2] = 1 и Лt — ж при t -ж. Тогда для положительной неограниченно возрастающей функции d(t) имеет место слабая сходимость
S(t)
VW)
=> Y
к некоторой случайной величине Y, тогда и только тогда, когда найдется такая случайная величина Л, что при той же функции ¿(Ь)
^ Л и Y = ZVÄ,
d(t)
(26)
где Z — N(0,1).
B. Оценка смешанных пуассоновских случайных сумм
Смешанные пуассоновские случайные суммы охватывают целый класс случайных сумм, где закон накопления случайных слагаемых описывается классом смешанных пуассоновских распределений.
Определение 3. Пусть Л - почти наверное положительная случайная величина с функцией распределения G. Будем говорить, что целочисленная неотрицательная случайная величина N имеет смешанное распределение Пуассона со структурным (смешивающим) распределением Л (или G) и писать N — MP (Л), если
1 [
P(N = k) = — Ake-AdG(A), k = 0,1, 2,... (23)
k! J0
Для оценки скорости сходимости в теореме 2 воспользуемся расстоянием по метрике Колмогорова 19 и теоремой из [3].
Теорема 3. Пусть Е[Х] = 0, Е[Х2] = 1, Е[ | Х | 2+й] < то для некоторого 5 € (0,1], случайные величины Z ~
п.н.
N(0,1), Л > 0, Лt - независимы при каждом Ь > 0, и ¿(Ь) - положительная функция, определенная для всех Ь > 0. Положим
△t := Р
St:= р| z<lwrzvi)'t>
В частности для одинаково распределенных слагаемых
1 ( At — р -,
St < 2Р ( "ТТТТ'Л) , t> 0.
2 d(t) Тогда для всех t > 0
△t < М(5) Е[ | Х | 2+в] E[Лt 5]+ 5и
где константа М(5) выбирается по формуле 22. Доказательство теоремы 3 приведено в [12].
(27)
С. Асимптотическое разложение функций распределения ненормированных статистик, основанных на выборках случайного объема
Пусть N1, N2,... и Х1, Х2,... - независимые случайные величины заданные на некотором вероятностном пространстве (О, А, Р). Случайные величины Х1, Х2,... как и ранее являются слагаемыми, то есть имеют смысл наблюдений, а Nn - случайный объем выборки, зависящий от п £ N. Объемом выборки может быть только неотрицательная величина, то есть Р^п £ N и {0}) = 1.
Для каждого п ^ 1 определим суммарную статистику Тмп, зависящую от выборки случайного объема как
TNn (и) := TNn м (XiM,.. .,XNn и (и)) =
Nn (w)
= Xi(и), и £ О.
(28)
i=i
Для того, чтобы оценить статистику Т^п нам понадобится следующая Лемма.
Лемма 1. Пусть Х1,Х2,... - независимые одинаково распределенные случайные величины такие, что
E[Xi] = 0, E[x2] = 1, E[ I Xi I k+6] < œ, к ^ 3, к £ N, 5 > 0.
(29)
Для каждого n определена следующая нормированная статистика
T :=
n *
1 n
TnY.Xi.
(30)
i=i
Предположим, что случайные величины Xi,...,Xn удовлетворяет условию Крамера
lim sup lE^1 ]| < 1. 1 1
(31)
Тогда
sup
x
P(Tn„ < x) - Ф(х) - £E[N-i/2]Qi(x)
i=i _ k-2 + S
^ Ck,s E[Nn 2 ],
(32)
где функции Qi(x),..., Qk(x) определены в книге [13], например,
Qi (x) = -(x2 - 1^(x)
EJXil 6
Q2(x) = -(x3 - 3x)ф(x)
-(x5 - 10x3 + 15x)ф(x)
e[x4] - 3
24
(e[x 3])
(33)
72
С доказательством этой Леммы можно ознакомиться в [14].
Назовем асимптотической а-квантилью статистики Бп величину са(п), удовлетворяющую асимптотическому равенству
P(Sn ^ c*a(n)) = а + o (n-i), n — œ.
(34)
Применяя к определению 34 разложение Тейлора и Лемму 1 можно вывести асимптотическое разложение для асимптотического а-квантиля статистики Бп.
Лемма 2. Пусть для к = 4, 8 > 0 выполнены условия 29, 30 и 31, тогда для асимптотического а-квантиля с*а(п) справедливо следующее асимптотическое разложение
e[x3 ] ( ca(n) = Ua + "64^
6n
Ua -
0 +
1 ( (e[x 3])2
+
+
12n 3
e[x4] - 3
(5Ua - 2ua) +
(35)
2
(Ua - 3ua) ) + 0(П ^
где ua удовлетворяет уравнению Ф(иа) = 1 — а.
III. Моделирование случайных сумм
Здесь приведены результаты моделирования случайных сумм на языке программирования R([15]).
Для моделирования будет использоваться случайная величина N с E[N] = 100'000, а объем выборки случайных сумм 5'000, если не указано иное.
Также стоит подчеркнуть, что из-за конечного объема выборки в сравнении имперического распределения случайных сумм и теоретического распределения по метрике Колмоговора, появляется погрешность. Поэтому сравнение теоретических оценок точности асимптотических моделей и оценок полученных в результате моделирования далее проводится не будет.
A. Пуассон-биномиальные и пуассоновские случайные суммы
Для простоты моделирования пуассон-биномиальной суммы пусть
рг = p Vi е [1,n], (36)
где n - число возможных исходов. Тогда пуассон-биномиальная сумма является просто биномиальной.
Объем биномиальной случайной суммы Nnp зависит от n е N и p е (0,1). Возьмем n = 1'000'000, p = 0.1, выставим флаг отцентровки о нормировки случайных сумм и получим следующий результат:
> analyze_sample(binom_sum dnorm, rnorm, pnorm, "Binom", TRUE)
Рис. 1. Результат анализа пуассон-биномиальных сумм.
Частотная гистограмма (рисунок 2), нормальный qq-график (рисунок 3), коэффициенты ассиметрии и эксцесса в результате (рисунок 1), указывают на возможность нормальной аппроксимации выборки пуассон-биномиальных сумм. Критерий Шапиро-Уилка не отвергает гипотезу о нормальности выборки.
При сравнении выборки отцентрированных и отнор-мированных пуассон - биномиальных случайных сумм
Рис. 2. Частотная диаграмма выборки пуассон-биномиальных сумм.
Рис. 4. Вероятностная гистограмма выборки пуассон-биномиальных сумм с плотностью распределения Гаусса.
Рис. 5. Диаграммы разброса выборки пуассон-биномиальных сумм и выборки распределения Гаусса.
Рис. 3. Нормальный qq-график выборки пуассон-биномиальных сумм.
получаем
△n ^ min Cs(S)
s<0
(n D[Xi ])1+2
x [E[ | Xi | 2+0]p(1 + 3.25ps) + (p(E[X2] - (E[Xi])2p))
i+2
и нормального распределения, критерий Колмогорова-Смирнова (рисунок 1) не отвергает гипотезу о принадлежности выборки нормальному распределению. Более того, критерий Колмогорова-Смирнова показал расстояние по метрике Колмогорова 0.0065. Вероятностную гистограмму выборки пуассон - биномиальных сумм хорошо аппроксимирует плостность распределения Гаусса (рисунок 4). Диаграммы разброса (рисунок 5) показывают, что распределения имеют одинаковую структуру.
Найдем некоторые теоретические верхние оценки для пуассон-биномиальных сумм. Воспользуемся верхней оценкой 17.
Беря во внимание условие 36 и свойства слагаемых,
1
= min Cs (S)—g- e
n2 (p(1 - p))1+ 2
x |p2 (1 + 3.25/) + s(p(p - p3))1+. При S = 1, min Cs (1) = Co.646 (1) < 0.3031([8]).
s<0
Получим следующую функцию в от n, которая описывает скорость сходимости моделируемых случайных сумм, при условии, что p = 0. 1.
e(n) =
0.3031
n 2 (p(1 — p))1+ 2 +0.646(p(p - p3))1+2
p2 (1 +3.25p) +
0.1559
(37)
Представим некоторые результаты функции 37 в таблице I.
n
х
Таблица I. Некоторые верхние оценки для пуассон-биномиальных сумм.
n 102 103 104 105 106 10'
An 0.0156 0.005 0.0016 0.0005 1.56e-04 4.93e-05
Для моделирования пуассоновской суммы пусть параметр А = n x p, где n - число возможных исходов, а p - вероятность исхода из моделирования пуассон-биномиальных сумм. В результате установим параметр А = 100'000, выставим флаг центрирования и нормирования случайных сумм и получим следующий результат:
> analyze_sample(pois_summes, dnorm, rnorm, pnorm, "Pois", TRUE) mean of Pois = 0 variance of Pois = 1
asymmetry of Pois = 0.00382188227144036 tailedness of Pois = 0.0980154140666785
Shapiro-Wilk normality test
data: summes
W = 0.99953, p-value = 0.2632
One-sample Kolmogorov-Smirnov test data: summes
D = 0.0076864, p-value = 0.9292 alternative hypothesis: two-sided
Рис. 6. Результат анализа пуассоновских сумм.
Частотная гистограмма (рисунок 7), нормальный qq-график (рисунок 8), коэффициенты ассиметрии и эксцесса в результате (рисунок 6), указывают на возможность нормальной аппроксимации выборки пуассонов-ских сумм. Критерий Шапиро-Уилка не отвергает гипотезу о нормальности выборки.
Рис. 7. Частотная диаграмма выборки пуассоновских сумм.
При сравнении выборки отцентрированных и отнорми-рованных пуассоновских случайных сумм и нормального распределения, критерий Колмогорова-Смирнова (рисунок 6) не отвергает гипотезу о принадлежности выборки распределению Гаусса. Более того, критерий показал расстояние по метрике Колмогорова 0.0077. Вероятностную гистограмму выборки пуассоновских случайных сумм хорошо аппроксимирует плотность распределения Гаусса (рисунок 9). Диаграммы разброса (рисунок 10) показывают, что распределения имеют одинаковую структуру.
Найдем некоторые теоретические верхние оценки для пуассоновских случайных сумм. Воспользуемся верхней оценкой 21.
Рис. 8. Нормальный qq-график выборки пуассоновских
сумм.
Рис. 9. Вероятностная гистограмма выборки пуассоновских сумм с плотностью распределения Гаусса.
Рис. 10. Диаграммы разброса выборки пуассоновских сумм и выборки распределения Гаусса.
Беря во внимание условие 36 и свойства слагаемых, получаем
Ад ^ minCs(S) , ,,» p
s<o sV J As/2p1+s/2
Таблица II. Некоторые верхние оценки для пуассоновских случайных сумм.
А 102 103 104 105 106 10 7
Ал 0.0958 0.0303 0.0096 0.003 9.58e-04 3.03e-04
При 8 = 1, ттСв(1) = С0.в4в < 0.3031([8]). Получим
следующую функцию г от А, при условии, что р = 0.1, которая описывает скорость сходимости моделируемых случайных сумм.
£(A) =
0.3031 (0.1A)i/2
(38)
Представим некоторые результаты функции 38 в таблице II.
В. Смешанные пуассоновские случайные суммы
По теореме 2 класс предельных законов для смешанных пуассоновских случайных сумм не ограничивается нормальным распределением. Смешанные пуассонов-ские случайные суммы могут сходиться к распределению с произвольно тяжелыми хвостами, что является весомым свойством для расчета квантилей и проверки гипотез. Как показано в той же теореме 2, предельное распределение зависит от смешивающего распределения. В качестве примера рассмотрим смешанную пуас-соновскую случайную сумму с объемом отрицательно биномиального распределения. Назовем такие суммы -отрицательно биномиальными случайными суммами.
Прежде чем анализировать выборку отрицательно биномиальных случайных сумм, нужно выяснить предельное распределение случайной суммы.
Воспользуемся следующей теоремой из [1].
Теорема 4. Пусть Х1, Х2,... - независимые одинаково распределенные случайные величины с Е[Х2] = 1, Nrp ~ NB(г,р) и N, р,Х1 ,Х2,... независимы на некотором вероятностном пространстве (О, А, Р).
Если Е[Х1 ] = 0, то
Б1 = ^/р^Хг ^ €1 + • • • + €г, р ^ 0, (39)
г=1
где {€}= - независимые одинаково распределенные случайные величины, имеющие распределение Лапласа. Если Е[Х1 ] = 0, то
Б2 = е^Е Хг ^ Г(г, 1) = €1+• • -+€г, р ^ 0, (40)
г=1
где {€}= - независимые одинаково распределенные случайные величины, имеющие экспоненциальное распределение Ехр(1).
Для того, чтобы оценить асимтотическую точность формулой 27, требуется найти смешивающее распределение для объема отрицательно биномиальных сумм. Воспользуемся Леммой из [1].
Лемма 3. Отрицательно биномиальная случайная сумма с N ~ NB (г, , У0,г £ N - смешанная пуассонов-ская случайная сумма со смешивающим гамма распределением Г(г, 0) с плотностью /(х) = хг-1 веТ. Г(г) 1 (х ^ 0), где Г(г) - гамма-функция Эйлера.
Для моделирования отрицательно биномиальных случайных сумм, в качестве распределения объема возьмем геометрическое распределение, то есть N ~ Свот(р) = NB(1,р) с р = п = 10-в и назовем такую сумму геометрической случайной суммой. Смоделируем оба случая из теоремы 4:
1) В качестве слагаемых с нулевым математическим ожиданием возьмем € — 2, где € ~ Вг(4,0.5). Получим следующий результат:
> analyze_sample(geom_summes, dlaplace, rlaplace, plaplace, "Geom")
Test for the Laplace distribution based on a transformation to exponentiality
Рис. 11. Результат анализа геометрических случайных сумм с нулевым математическим ожиданием у слагаемых.
Частотная гистограмма (рисунок 12), нормальный qq-график (рисунок 13), коэффициенты ассиметрии и эксцесса в результате (рисунок 11), указывают на симметричное распределение с тяжелыми хвостами. Критерий Шапиро-Уилка отвергает гипотезу о нормальности выборки.
Сеот Эиттеэ
Рис. 12. Частотная диаграмма выборки геометрических случайных сумм с нулевым математическим ожиданием у слагаемых.
При сравнении выборки геометрических случайных сумм с нулевым математическим ожиданием у слагаемых и распределением Лапласа, тест Ла-пласа(рисунок 11) не отвергает гипотезу о принадлежности выборки распределению Лапласа. Вероятностная гистограмма выборки геометрических случайных сумм с нулевым математическим ожиданием у слагаемых графически аппроксимируется
Geom Summes Q-Q plot
-4 -2 0 2 4
Theoretical Quantiles
Рис. 13. Нормальный qq-график выборки геометрических случайных сумм с нулевым математическим ожиданием у слагаемых.
распределением Лапласа (рисунок 14). На диаграммах разброса (рисунок 15) у выборки пик выражен сильнее, чем у распределения Лапласа. По теореме 4 пик будет сглаживаться при p ^ 0.
Histogram of summes
I-1-1-1-1-1-1
-6 -4 -2 0 2 4 6
attempt approximate Geom Summes
Рис. 14. Вероятностная гистограмма выборки геометрических случайных сумм с нулевым математическим ожиданием у слагаемых, с плотностью распределения Лапласа.
Geom
1 2
Рис. 15. Диаграммы разброса выборки геометрических
случайных сумм с нулевым математическим ожиданием
у слагаемых и выборки распределения Лапласа.
Таблица III. Некоторые верхние оценки для геометрических случайных сумм с нулевым математическим ожиданием у слагаемых.
Найдем некоторые теоретические верхние оценки для геометрических случайных сумм с нулевым математическим ожиданием у слагаемых. Воспользуемся верхней оценкой 27 и Леммой 3.
△р < М(5) Е[ | Х1 | 2+5] Е[Л-2].
При 5 =1, ттСв(1) = С0.в4в < 0.3031([8]), а
Е[ | Х1 | 3] = Е[ | £ - 2 | 3] = § = 1-375. Получим следующую функцию в от р, при условии, что по Лемме 3 Л - Г ^1, ^ = Ехр (.
в(р) = 0.4168 Е[Л- 2 ] (41)
Представим некоторые результаты функции 41 в таблице III.
2) В качестве слагаемых с ненулевым математическим ожиданием возьмем £ — 1, где £ — В1(4, 0.5). Получим следующий результат:
> апа1у2е_Батр1е(деот ехр_сН51:г, exp_pd^stг, "Сеот")
Рис. 16. Результат анализа геометрических случайных сумм с ненулевым математическим ожиданием у слагаемых.
Частотная гистограмма (рисунок 17), нормальный qq-график (рисунок 18), коэффициенты ассиметрии и эксцесса в результате (рисунок 16), показывают ассиметрию и тяжесть единственного хвоста. Критерий Шапиро-Уилка отвергает гипотезу о нормальности выборки.
При сравнении выборки геометрических случайных сумм с ненулевым математическим ожиданием у слагаемых и экспоненциальным распределением, с параметром X =1, критерий Колмогорова-Смирнова(рисунок 16) не отвергает гипотезу о принадлежности выборки распределению Ехр(1). Более того, критерий показал расстояние по метрике Колмогорова 0.0097. Вероятностная гистограмма выборки геометрических случайных сумм с ненулевым математическим ожиданием у слагаемых графически аппроксимируется плотностью от распределения Ехр(1) (рисунок 19). Диаграммы разброса (рисунок 20) показывают, что распределения имеют одинаковую структуру.
p 10"2 10"а 10"4 10"5 10_ö 10"'
Ap 0.02407 0.0043 7.56e-04 1.34e-04 2.39e-05 4.25e-06
Рис. 17. Частотная диаграмма выборки геометрических случайных сумм с ненулевым математическим ожиданием у слагаемых.
Рис. 20. Диаграммы разброса выборки геометрических случайных сумм с ненулевым математическим ожиданием у слагаемых и выборки распределения Ехр(1).
Theoretical Quantiles
Рис. 18. Нормальный qq-график выборки геометрических случайных сумм с ненулевым математическим ожиданием у слагаемых.
attempt approximate Geom Summes
Рис. 19. Вероятностная гистограмма выборки геометрических случайных сумм с ненулевым математическим ожиданием у слагаемых, с плотностью от распределения Exp(1).
C. Случайные суммы с объемом трехточечного симметричного распределения
Пусть число страховых требований Nn имеет симметричное распределение:
Р(^ = п) = 1, Р(^п = п + Нп)= Р(^п = п — Нп) = 1,
где Нп - натуральное число не превосходящее п и удовлетворяющее условию
lim — =0.
n^-xi n
(42)
При моделировании возьмем hn = \[и, выставим флаг отцентровки и нормировки случайных сумм. Получим следующий результат:
> analyze_sample(t^ dnorm, rnorm, pnorm, "three_points", TRUE)
Рис. 21. Результат анализа случайных сумм с объемом выборки трехточечного симметричного распределения.
Частотная гистограмма (рисунок 22), нормальный qq-график (рисунок 23), коэффициенты ассиметрии и эксцесса в результате (рисунок 21), указывают на возможность нормальной аппроксимации выборки случайных сумм с объемом выборки трехточечного симметричного распределения. Критерий Шапиро-Уилка не отвергает гипотезу о нормальности выборки.
При сравнении выборки отнормированных и отцентрированных случайных сумм с объемом трехточечного симметричного распределения и нормального распределения, критерий Колмогорова-Смирнова(рисунок 21) не отвергает гипотезу о нормальности выборки случайных сумм. Более того, критерий показал расстояние по метрике Колмогорова 0.0081. Вероятностная гистограмма выборки случайных сумм графически аппроксимируется нормальным распределением (рисунок 24). Диаграммы разброса (рисунок 25) показывают, что распределения имеют одинаковую структуру.
three_points Summes
Рис. 22. Частотная диаграмма выборки случайных сумм с объемом выборки трехточечного симметричного распределения.
Рис. 23. Нормальный qq-график выборки случайных сумм с объемом выборки трехточечного симметричного распределения.
attempt approximate three_points Summes
Рис. 24. Вероятностная гистограмма выборки пуассон-биномиальных сумм с плотностью распределения Гаусса.
IV. Оценка резерва страховой компании в случае,
если число страховых требований случайно
Деятельностью любой страховой компании является перераспределение рисков. Страхователи выплачивают страховщику страховые премии, взамен страховщик бе-
Рис. 25. Диаграммы разброса выборки пуассон-биномиальных сумм и выборки распределения Гаусса.
рет ответственность за риски на себя и выплачивает компенсации в случае страховых инцидентов. Для того, чтобы деятельность страховщика не была убыточной и страховая компания не разорилась, страховщик должен просчитать размер страховых премий и начальный страховой резерв.
Для расчета вероятности неразорения страховой компании принято использовать следующую сумму
Sn — ^ ^ Xi,
(43)
i=i
где п - объем страхового портфеля, а ХГ1 - случайная величина, характеризующая страховой случай.
Расчет необходимого резерва производится подсчетом нужного квантиля, который должен быть близок к единице настолько, насколько страховая компания может себе позволить.
P(Sn ^ са) = а,
(44)
где 1 — а - вероятность неразорения(— 1), а са -резерв, которым должна обладать страховая компания, который компания не «переступит» с вероятностью 1 — а. Таким образом, зная закон распределения суммы, можно спрогнозировать достаточный резерв.
Но, к сожалению, сумма 43 не всегда применима для моделирования потерь страховой компании в результате страховых случаев. Число страховых случаев обычно разнится от периода к периоду и носит случайных характер.
Получается, что случайных характер количества страховых случаев может внести дополнительную погрешность в асимптотику распределения случайной суммы, либо вообще привести к тому, что предельное распределение будет отличаться от нормального и иметь совсем другую структуру. К примеру, у предельного распределения могут оказаться тяжелые хвосты, а хвосты имеют критически важное значение при вычислении квантилей.
Для страховой компании естественней иметь в качестве модели страховых выплат случайную пуассон-биномиальную сумму 1, 2. Пуассон-биномиальная сумма представляет собой сумму произведений двух независимых случайных величин, где первая случайная величина отвечает за наступление страхового случая, а вторая
случайная величина отвечает за размер страховой выплаты. Отцентрированная и отнормированная пуассон-биномиальная сумма сходится к нормальному распределению. Для оценки страхового резерва достаточно найти квантиль нормального распределения и к нему прибавить верхнюю оценку Берри-Эссеена с уточненной структурой 10. Тогда квантиль SNn p можно оценить следующим образом
са < иа + minCs(S)(L2+s,n + sT2+ö,n), (45)
где S e (0,1], а ua удовлетворяет уравнению Ф(иа) = 1 — а.
Часто вместо пуассон-биномальной суммы удобнее использовать её приближение - пуассоновскую случайную сумму 18. В таком случае, для верхней оценки квантиля случайной величины SNx можно прибавить оценку 21 и получить следующую оценку резерва
Ca < Ua + C(S)L2+S,X,
(46)
От характера накопления страховых случаев может зависеть структура предельного распределения случайных сумм. В II-B и III-B описываются смешанные пуассо-новские случайные суммы, которые сходятся к классу предельных распределений, содержащему распределения с разной степенью тяжестью хвостов. Характер предельного распределения зависит от смешивающего распределения случайного объема. Помимо этого предельные распределения центрированных случайных сумм могут отличаться от предельных распределений не центрированных случайных сумм, что показано в теореме 4 и последующем моделировании геометрических случайных сумм. Таким образом, при оценке квантиля распределения подобных сумм используется сумма квантиля предельного распределения и оценки сходимости.
Некоторые страховые компании имеют недостаточное количество периодов, чтобы предугадать характер распределения накопления страховых случаев. Но на основе небольшой истории компании почти всегда можно отметить разброс количества страховых выплат. Для такого случая подойдет модель описанная в разделе III-C. Воспользовавшись данной моделью, резерв можно оценить с помощью теоремы из [14].
Теорема 5. Если Х1?Х2,... одинаково распределены, Nn - случайная величина с распределением как в примере III-C, Nn,X1,X2,... независимы на некотором вероятностном пространстве (П, A,P) и пусть выполнены условия 29, 30 и 31. Тогда для асимптотического а-квантиля ca(n), соответствующему случайной сумме SNn(w) = 5^Хг(ш), ш e П, справедливо асимптотическое разложение вида
Ca(n) = C*a(n)-
E[X3](ua - 1) f h 24^n
0)
где c*a(n) и ua определены в Лемме 2.
V Заключение
n ) +o(n i), n — œ,
(47)
В работе описаны оценки сходимости случайных сумм к предельным распределениям. Рассмотрены оцен-
ки пуассон-биномиальных, пуассоновских и смешанных пуассоновских случайных сумм.
Были смоделированы и проанализированы пуассон-биномиальные, пуассоновские, смешанные пуассонов-ские случайные суммы и случайные суммы с объемом трехточечного симметричного распределения. Произведены теоретические расчеты оценок их скорости сходимости к предельным распределениям. Рассмотрено применение проанализированных моделей в расчете резерва страховой компании.
Список литературы
[1] Пирогов Р.В. Об асимптотическом приближении статистики, построенной по выборке объема отрицательно биномиального распределения - 2019: International Journal of Open Information Technologies.
[2] Berry A. C. The accuracy of the Gaussian approximation to the sum of independent variates // Trans. Amer. Math. Soc. - 1941. - Vol. 49. - P. 122-136.
[3] Шевцова И.Г. Оценки точности асимтотических вероятностных моделей - 2018.
[4] Johnson, N.L., Kemp, A.W., and Kotz, S. Univariate Discrete Distributions, 3rd Edition, Wiley - 2005.
[5] Huiming, Zhang; Yunxiao Liu; Bo Li. "Notes on discrete compound Poisson model with applications to risk theory". Insurance: Mathematics and Economics. - 2014.
[6] Bening V., Galiyeva N., Korolev V. On concentration functions of regular statistics constructed from samples with random size// XXX International Seminar on Stability Problems for Stochastic Models and VI InternationalWorkshop «Applied Problems in Theory of Probfbilities and Mathematical Statistics Related to Modeling of Information Systems» - 2012. - С.15-18.
[7] Шевцова И.Г. Об абсолютных константах в неравенстве Берри-Эссеена и его структурных и неравномерных уточнениях // Ин-форм. и её примен. - 2013. - Т. 7, № 1. - С. 124-125.
[8] Шевцова И.Г Об абсолютных константах в неравенствах типа Берри-Эссеена // ДАН. - 2014. - Т. 456, № 6. - С. 650-654.
[9] Grandell J. Mixed Poisson processes. - London : Chapman and Hall, 1997.
[10] Bening V. E., Korolev V. Y. Generalized Poisson Models and their Applications in Insurance and Finance. - Utrecht, The Netherlands : VSP, 2002.
[11] Korolev V. Y. A general theorem on the limit behavior of superpositions of independent random processes with applications to Cox processes. Journal of Mathematical Sciences // J. Math. Sci. -1996. - Vol. 81, no. 5. - P. 2951-2956.
[12] Гавриличенко С.В., Королев В.Ю. Оценки скорости сходимости смешанных пуассоновских случайных сумм // Системы и средства информатики. Специальный выпуск. - 2006. - С. 248-257.
[13] Петров В.В. Суммы независимых случайных величин. //М.: Наука, 1972.
[14] Бенинг В.Е. Об асимптотическом поведении необходимого резерва страховой компании в случае если число страховых требований случайно. // М.: Наука, 1972.
[15] https://www.rdocumentation.org RDocumentation - 2018.
Бенинг Владимир Евгеньевич, профессор кафедры математической статистики факультета вычислительной математики и кибернетики Московского государственного университета имени М.В.Ломоносова, старший научный сотрудник ИПИ РАН.
Россия, 119992, г. Москва, ГСП - 1, Воробьёвы горы, МГУ им. М.В. Ломоносова.
E - mail: [email protected].
Пирогов Роман Владимирович, магистрант кафедры математической статистики факультета вычислительной математики и кибернетики Московского государственного университета имени М.В.Ломоносова.
Россия, 119992, г. Москва, ГСП - 1, Воробьёвы горы, МГУ им. М.В. Ломоносова.
E - mail: [email protected].
2
Asymptotic behaviour of insurance company
reserve
V. E. Bening, R. V. Pirogov
Abstract—The paper presents statistical modeling of some random sum models. Poisson-binomial, Poisson, geometric random sums and random sums with volume of three-point symmetric distribution were modeled and analyzed. The results of this work are relevant not only for insurance business, but also for any other business that involves random accumulation of outcomes. From the nature of distribution of random volume will record the limit distribution of the random amount and the speed of its convergence. Structure of the limit distribution plays an important role in the evaluation of quintiles and testing of hypotheses.
The necessary statistical modeling is carried out, which confirms the practical application of asymptotic models. Difference of limit distributions in the class of mixed Poisson sums is underlined. Estimates of the convergence rate of some simulated random sums to their limit distributions are made. To estimate Poisson-binomial, Poisson and mixed Poisson random sums, Berry-Esseen inequality was applied. To estimate quantile of random sum with volume of three-point symmetric distribution, an asymptotic decomposition of distribution function of non-normalized statistics of random sum was carried out. Calculation of the required reserve of insurance company is to estimate the level quintile close to one.
[10] Bening V. E., Korolev V. Y. Generalized Poisson Models and their Applications in Insurance and Finance. - Utrecht, The Netherlands : VSP, 2002.
[11] Korolev V. Y. A general theorem on the limit behavior of superpositions of independent random processes with applications to Cox processes. Journal of Mathematical Sciences // J. Math. Sci. -1996. - Vol. 81, no. 5. - P. 2951-2956.
[12] Gavrilichenko S.V., Korolev V.U. Estimates of the convergence rate of mixed Poisson random sums // Systems and tools of informatics. Special edition. - 2006. - p. 248-257.
[13] Petrov V.V. Sums of independent random variables. - 1972.
[14] Bening V. E. On the asymptotic behavior of the deficiency of some statistical estimators based on samples with random sizes. - 1972.
[15] https://www.rdocumentation.org RDocumentation 2018.
Keywords—Poisson-binomial random sum; Poisson random sum; mixed Poisson random sum; negative binomial random sum; geometric random sum; distribution function; random volume sampling; Laplace distribution; gamma distribution; exponential distribution; quantile; necessary insurance company reserve; three-point symmetric distribution; asymptotic decomposition; Berry-Esseen inequality.
References
[1] Pirogov R.V. Asymptotic approximation of statistics based on the sample of negative binomial distribution - 2019: International Journal of Open Information Technologies.
[2] Berry A. C. The accuracy of the Gaussian approximation to the sum of independent variates // Trans. Amer. Math. Soc. - 1941. - Vol. 49. - P. 122-136.
[3] SHevtsova I.G. Estimates of the accuracy of asymmetric probabilistic models 2018.
[4] Johnson, N.L., Kemp, A.W., and Kotz, S. Univariate Discrete Distributions, 3rd Edition, Wiley - 2005.
[5] Huiming, Zhang; Yunxiao Liu; Bo Li. "Notes on discrete compound Poisson model with applications to risk theory". Insurance: Mathematics and Economics. - 2014.
[6] Bening V., Galiyeva N., Korolev V. On concentration functions of regular statistics constructed from samples with random size// XXX International Seminar on Stability Problems for Stochastic Models and VI InternationalWorkshop «Applied Problems in Theory of Probfbilities and Mathematical Statistics Related to Modeling of Information Systems» - 2012. - C.15-18.
[7] SHevtsova I.G. Absolute constants in the Berry-Esseen inequality and its structural and non-uniform clarifications - 2013. - vol. 7, no. 1. -p. 124-125.
[8] SHevtsova I.G. Absolute constants in inequalities like Berry-Esseen -2014. - vol. 456, no. 6. - p. 650-654.
[9] Grandell J. Mixed Poisson processes. - London : Chapman and Hall, 1997.