К.А. Горбенко КУМУЛЯТИВНЫЙ ПОТОК
Предлагается и исследуется случайный поток, характеризующий эффект саморекламы. Упомянутый эффект проявляется в следующем: наступление события потока увеличивает вероятность наступления следующего за ним события, например, в экономике это связано с эффектом распространения слуха клиентами компании, который увеличивает приток новых клиентов.
В рыночных условиях большинство компаний стремится привлечь к себе как можно больше клиентов. Для этого используются различные методы, в том числе и воздействие компаний на собственных клиентов. Это может быть и система скидок, и индивидуальный подход и т. д. Делается это не только для удержания клиента, но и для стимулирования активности самого клиента - распространения им положительной информации о самой компании и об оказываемых ею услугах, что, конечно, возвышает компанию в глазах потенциальных клиентов и склоняет сделать выбор в ее пользу. В данной работе предлагается и изучается модель описанной ситуации.
Модель потока
Рассмотрим временную ось, на которую нанесены моменты наступления некоторых событий, например моменты поступления клиентов в компанию. Будем предполагать, что события являются однородными, т.е. отличаются друг от друга только моментом наступления. Введем точку отсчета - момент, с которого началось наблюдение. Примем точку отсчета за ноль. Далее введем процесс МЇ), который по смыслу будет означать количество событий, наступивших за время ґ от момента отсчета.
Представим
N (ґ + Дґ ) = N (ґ ) + А^ (ґ),
роятностей Р {Ы, /} [2]. Рассмотрим временной интервал [/, /+Д], где Д достаточно мало. Используя формулу полной вероятности, запишем
р {ы , /+Д/} = = Х°Р { (/ + Д/) = N | N (/) = N - у}р{Ы Р} =
1= 0
= Х°Р{(/) = 1 | N(/) = N - 1}р{Ы - }}. (1)
1=0
Рассмотрим последние Ы-Ы0-1 слагаемых. Прежде всего оценим
Р{ДЫ (/) = ] | N (/) = N -1}<
да
<Х Р{ (/) = п | Ы(/) = N - ;}= о (Д/), 22 ] 2 N - 2.
п=2
Таким образом,
Ы-Ы0 ,
X Р { (/) = 1| N(/) = N - 1рР {Ы - р/}<
1=2 Ы-Ыо ,
< X Р {(/) = 1| N(/) = N - 1р< о (Д/).
1 =2
где A достаточно мало. Далее сделаем предположения относительно AN(t) [1]:
P {AN (t )= 11N (t ) = N}=(X + PN)At + о (At),
P{ (t) = 0 N (t) = N}= 1 -(X + PN )At + о (At),
P{ (t) > l|N (t) = N}= o(At),
где X>0, P>0.
При этом естественно считать, что N(0)=N0, т.е. к моменту отсчета сколько-то событий наступило.
Сделанные предположения отражают смысл названия потока (от англ. cumulate - накапливать): параметр потока X+PN линейно растет с увеличением количества наступивших событий.
С учетом последнего результата и предположений модели соотношение (1) можно записать в виде
р{ы , г + Д/р = (1 -(х + ры )д )р{ы , /}+
+ (х + р(ы - 1))Др{ы -1,/}+о(Д)
После преобразований осуществим в полученном равенстве предельный переход при Д^0. При этом заметим, что предел справа существует, следовательно, существует предел слева.
d P {V, t}
dt
= -(x+pv )P {TV, t} +
(2)
-(X + P(V - 1))P {V -1, t}.
Одномерное распределение вероятностей
Обозначим Р {Ы, /} = Р {ы (/) — N}. Далее, используя Д/-метод, получим уравнения для определения ве-
Решим полученную систему дифференциальных уравнений методом производящих функций [2, 3]. Для этого введем производящую функцию следующим образом:
G (z, t )=^ Z P {, t}, 0 < z < 1.
(3)
Для того чтобы осуществить переход к функции 0(х,/), необходимо (2) умножить на и просуммиро-
вать по N в пределах от Ы0 до ®. Перед тем как записать дифференциальное уравнение для 0(х,/), отметим:
да
X Р {Ы, /} = (х, /),
N=N0
да
X (Ы- 1)Ы Р{Ы-1,/} = х2в: (х,/),
N=N0
да
X Р{Ы -1,/} = хО(х,/).
N=N0
Следовательно, уравнение (2) перепишется в виде
ао (2, г)
ж
■ = -ХО (х, ґ) -РхОх (г, ґ) + ХхО (г, ґ) + РгО (г, ґ),
или
йО (х, ґ) .йО (х, ґ) . . . .
в (г-1)~йг'=Х(г-')О ^')
йґ
О (г,0) =
йґ йг
йО
1 Рх (2 -1) Х(х -1)0
Рассмотрим уравнение
йґ
йг
1 Рх(х -1)’
которое после интегрирования можно переписать в виде
или
- Рґ = 1п(1 - Г)- 1п(х)- 1п(С)
Рассмотрим второе уравнение
ах _ ао р2 ~хо ’
которое имеет следующее решение:
1П (0 ) = --в1П (2 )+ 1П (С2 ). Окончательно можно записать
С2 = Охр.
(4)
Решим полученное дифференциальное уравнение в частных производных 1-го порядка [4]. Для этого составим систему
Запишем общее решение уравнения (4) в виде
С2 = Ф(С1) или Охр = ф|^—1^ ер' I.
Найдем вид функции Ф(и). Сначала, пользуясь начальным условием, получим
Далее обозначим и = — -1, тогда х = (1 + и) 1.
2
Таким образом,
Ф(и ) = (1 + и )-в-Ы0.
На основе полученных результатов запишем вид функции 0(х,/):
р No ---N0
евґ | '
или
О (х,/) = хм° (х-(х - 1)ер') в 0. Преобразуем функцию 0(х,/):
(1 + х (р' -1))
-| —+N |рґ
О (х, ґ) = е 1р J xNo
или, окончательно,
О (х, /) = е-(х+ры°)г (1 -(1 - е-р' )х)Ы0 хЫ0. (5)
Отметим, что 0 < (1 - е р/) х < 1, поэтому функцию можно разложить в ряд Тейлора
О (гґ ) =
_ -(^Р^ )ґ N0
да
1+ Н1 - е-Рґ)” (-х)
(-1)” П (£ + No + *
п і=0 V Р
п!
Таким образом, используя последнее соотношение и определение функции О (х, /), получим
= е-(Х+Р^ )ґ
P{N (ґ ) = N0 } =
Р{ (ґ )= N0 + п}=-
ПІ в+^+*
п!
(6)
и- г
а-(+р^ )ґ
Х
Х
Отметим, что (6) является условным распределением, т.е.
Р{(/) = Ы0 + п} = Р{(/) = Ы0 + п | N(0) = Ы0}, где п = 0, 1, 2, к .
Распределения вероятностей значений длин интервалов между моментами поступления соседних заявок
Исследуем длины т временных интервалов между моментами поступлений двух соседних заявок. Пусть в момент времени ґ поступила N-3 по счету заявка, тогда функция распределения времени между моментом поступления ^й и (N+1)^ заявок будет иметь вид
^ (х | N (ґ) = N) = 1 - Р {т> х | N (ґ) = N} =
Лемма. В предположениях модели
£ І Р І І ґ, N1 = о (А), п = 0,1, 2,
І=2
= 1 - Р { (ґ + х) = N | N (ґ) = N1 = 1 - е
или
^(х | N(ґ) = N) = 1 -(
т.е. получили условную функцию распределения. Получим теперь безусловную, для этого воспользуемся формулой полной вероятности
да
р(х)= X Е( | N(/) = N)р{(/) = Ы} =
=1 -£
-(Х+р( +”)
Р { (ґ ) = N0 + п}.
Найдем вид суммы
£
^-(Х+р(«0 +и))
Р { (ґ ) = N0 + п} =
= е-(Х+Р^0 )(ґ+х)
П |- + N0 + і
, + £ ^-----------------------------1 [е-., (1 - е- )]■
п=1 •
= е-(Х+Р^0 )(ґ+х) (1 - е-Рх (1 - е-вґ) в 0 В результате
^ (х) = 1 - е-((+р"0 )(ґ+х) (1 - е-рх (1 - е-рґ ))^^-^0 Условная интенсивность
Обозначим
Р\(ґ) = І І N(ґ) = ^ = Р{і і ґ, N}.
Доказательство. Воспользуемся методом математической индукции.
0) Заметим, что случай п=0 является условием модели, поэтому для этого случая лемма доказана.
1) Пусть (7) выполнено для п=п-1, тогда, так как 1>1, справедливо
1 <І <І2 <... <Іп-1,
откуда следует, что
£ Іт Р {і І ґ, N} = о (Дґ), т = 0, п -1.
І =2
2) Проверим истинность (7) для п:
да
£ Іп Р {і І ґ, N}= е-(Х+р")Дґ (1 - е-рД')х
І =2
ЛПЇ- + N + і
х£ (І+1)"4 +N+І ] ------і (1 - е ).
Рассмотрим
(+1)п-1 ^ів+N+І !=£ СіІ‘, где С"=1'
Вернемся к интересующей сумме
£ Іп Р {і \ґ, N} =
І=2 п-1 да
- + N |(1 - е-^)-^)ґ £ +
+£Ст£ІтР{і |ґ, N}£ІпР{і \ґ, N}
т=0 І=2 І =2
(1 -е-рА).
Используя пункт 1) рассуждений, получим
да
£ Іп Р {І і ґ, N} = ерДґ (рДґ + о (Дґ))х
І=2
Х
в'
+ N І е-(Х+р")Дґ РДґ £ Сі + о (Дґ)
= о (Дґ).
Получили утверждение леммы.
Лемма доказана.
Введем понятие условной интенсивности
М{Д^ (ґ) І N(ґ) = N}
Дґ
Теорема 1. В предположениях модели = Х + pN.
п=0
і=0
п=0
х
Доказательство. По определению
да
M {AN (t) | N (t) = N}} i P {i | t, N} =
/=0
да
= P {AN (t) = 1 | N (t) = N] + X i P { | t, N}.
/=2
Используя лемму и предположения модели, получим M {an (t) | N (t) = N| = (X + ßN) At + o (At).
Разделив левую и правую части последнего соотношения на At и устремив At^-0, получим
M\(t) |N(t) = N} X u„ = lim —--------------------- = X + ßN.
N At^0 At
Получили утверждение теоремы.
Теорема доказана.
Математическое ожидание
Из-за громоздкости формул (6) откажемся от поиска среднего по определению и воспользуемся менее трудоемким и более наглядным методом [1]. Рассмотрим [t, t+At] и представим
N (t + At ) = N (t ) + AN (t), где N(t) фиксировано и
Г+1, с вер. ( + ßN (t))t + o (At),
N(t) = -- + | Nо +-|e-.
ß
ß
(9)
AN (t ) = -
0, с вер. 1 -( + ßN (t))t + o (At).
Усредним Ы(/+Д/) при фиксированной реализации Ы(/):
М { (/ + Д/) | N (/)} = N (/) + (Х + рЫ (/)) Д/ + о (Д/). Далее усредним по реализации Ы(/):
Ы ( + Д/ >~Ы (/> = х + рЫ (/>+2^
At
At
Осуществим в последнем равенстве предельный переход при Д/—>0, так как предел справа существует, то существует предел слева, т.е. получим дифференциальное уравнение первого прядка с постоянными коэффициентами
dN(t) —
V > - 7 _1_ R М dt
= X + ßN (t), N (0 ) = N0. (8)
Вид математического ожидания говорит о том, что процесс Ы(/) в среднем развивается с экспоненциальной скоростью.
Безусловная интенсивность
Построим безусловную интенсивность д следующим образом:
M (an (t)} ц = lim—i---------^-.
At^0 At
Теорема 2. В предположениях модели |i = (X+ßN0 )eßt. Доказательство. По определению
да
M {AN (t)} = X i P {AN (t) = /} =
i =0
да да
= X i X P A |t, N}P {N (t) = N} =
i =0 N = N0
да да
= X P N (t) = N} i P A I t, N}.
N=N0 i =0
Найдем отдельно
да да
XiPAI t,N} = XiP{n(t + At) = i + n|N(t) = N}±N =
i=0 i=0
да
= X(i + N )P {N (t + At ) = i + N|N (t ) = N}- N =
i=0
да
= X i P {n (t + At) = i| N (t) = n}-N =
i=N
= M {n (t + At )|n (t ) = N}-N = ^ N + Xj(eßAi -1). Подставим
M {AN (t)} = (eßAi -1) X fN + -| P {N (t) = N} =
N = N0
:(eßAi -1)
-+ X NP{n(t) = n|N(0) = N0}
ß N=N0
= (X + ßN0 ) eßt At + o (At).
Приведенное дифференциальное уравнение имеет следующее решение:
Разделив последнее соотношение на Д/ и Д/—0, получим утверждение теоремы.
Теорема доказана.
Дисперсия
Найдем дисперсию вышеизложенным методом, т.е. на интервале [/, /+Д/] представим
N2 (t + At) = N2 (t) + 2AN (t) N (t) + (AN (t))2 где при фиксированной реализации N(t)
Г+1, свер. ( + ßN (t))t + o (At),
(AN (t)) =■
0, свер. 1 -(X + ßN(t))At + o(At).
Далее получим
M {2 (t + At) | N (t)} - N2 (t) =
= 2 (X + ßN (t ))N (t )At + (X + ßN (t)) At + o (At).
Усредним по реализации N(t):
N2 (t + At)-N2 (t)
Ai
= 2ßN2 (t) + (2X + ß) N (t) + X + ■
KA)
Ai '
После предельного перехода
dN2 (t) — . . . . — . .
—-+1 = 2ßN2 (t) + (2X + ß) N (t) + X.
На основе последнего уравнения получим уравнения для дисперсии. Для этого воспользуемся определением дисперсии
Б {Ы (/)} = Ы2 (/)- N2 (/).
Продифференцируем последнее соотношение:
аБ{Ы(/)} = а~2 (/) - 2Ы(/) аЫ(/) а! а! а!
= 2РN2 (/) + (2Х + р) N(/) + Х - 2N(/)(х + РN (/)),
или
dD {N (t)}
dt
= 2ßD {N (t )} + ß N (t ) + X,
N (/1 )Ы (/2 + Д/2) = N (/1 )Ы (/2)+ N (/1 )ДЫ (/2) и усредним равенство при фиксированной реализации Ы02 ={Ы(т):0<т</2} :
М {Ы ()Ы (/2 +Д/2)| N02 }-N (I, )Ы (/2 ) =
= N (^ )(Х + РЫ (/2 ))2 + о (Д /2).
Далее усредним по фиксированным реализациям, разделим левую и правую части на Д 2, Д 2— 0. В итоге получим
dN(t1 )N(t2) dt2
= ßN (ti )N (t2 ) + XN (ti).
Воспользуемся определением ковариации
CN {ti, t2 } = N (ti )N (t2)-N (ti )N (t2) и продифференцируем это равенство:
dCN 2t1, t2 } = dN (ti )N (t2 )- N (t )dN (t2 )
dt2 dt2
dt2
= ßN (ti )N (t2 ) + XN (ti )-N (ti )(X + ßN (t2)). После преобразований
ddcN{rt} = ßCN {ti,t2}, CN {ti,ti} = D{N(ti)}.
Решение полученного уравнения имеет вид
CN {ti, t2 } = D {N (ti)}
Воспользуемся формулой (ii):
,ß(t2-ti )
D {N (0 )} = 0. (i0)
Решая (i0), получим
D {N (t )} = -(]ß + N0 ) eßt + (ß + N0 )
e2ßt. (ii)
Данный результат говорит о том, что колебания процесса относительно своего среднего возрастают с экспоненциальной скоростью.
Ковариация
Рассмотрим моменты ^, t2: ti<t2. Представим на интервале [t2, t2+At2]
Cn {,t2} = |ß + N01eßt2 (eßt- - 1).
Снимем ограничение t]<t2. Для этого введем обозначения
¿min = т1П l2 ) и tmax = maX ( l2 )
тогда окончательно
Cn {,t2} = |ß + N0 jeß^ (eßtmln - 1).
Мода
По определению [5]:
Mo = arg max {p {N (t ) = N0 + n}
Теорема 3. В предположениях модели верно следующее:
1) если выполнено
(X+N0 - d eßt-^ß+N0 ^6 {N0, N0+1, ...},
то
Mo =
n* v n* +1, P{Nt = N0 + n*}> P{Nt = N0}, г v n* +1v N0, P{Nt = N0 + n*} = P{Nt = N0},
N0, P{Nt = N0 + n*}<P{Nt = N0};
2) если выполнено
X+N0 - d eßt-^x+N0 ]«{N0, N0+1, ...},
то
Mo =
n* + 1,P { = N0 + n* +1}> P {Nt = N0}, / + 1vN0, P{Nt = N0 + n* +1} = P{Nt = N0}, N0,P { = N0 + n* +1}< P {Nt = N0},
где
в + Л.-1) е--(£ + Л,
[ ] - взятие целой части.
Доказательство. Рассмотрим п е {1,2,3, к}.
1) Найдем значения п, для которых верно
Р { (/) = N0 + п +1} ^ 1 Р {Л(/) = N0 + п} “ .
Для этого подставим в последнее неравенство определения вероятностей, после сокращений получим
п+г (Х+Л.+п )( -е")г 1
Р {л (/ ) = Л0 + п* +1}
Р {Л (/) = N0 + п*} = .
2) Теперь найдем значения п, для которых верно
Р {л (/) = N0 + п +1} < 1 Р {Л (/) = N0 + п} < .
Аналогичные рассуждения приводят к следующему неравенству:
+ N0j(eßt-1)-eßt <>
т.е. для п = п +1, да вероятности образуют убывающую последовательность, где Р {Л (/) = Л0 + п +1} является
максимальным членом последовательности.
Объединяя результаты пунктов 1), 2) и учитывая вероятность Р {л(/) = Л0}, получим утверждение теоремы.
Теорема доказана.
Приближенное вычисление одномерного распределения
В данном пункте рассмотрим проблему вычисления одномерного распределения вероятностей (6) при «большом» интервале наблюдения [0, /].
Трудности вычисления связаны с тем, что при увеличении длины интервала наблюдения значения процесса Л(/) в среднем увеличиваются - это хорошо видно из формулы (9). Отмеченное увеличение, как видно из формул (6), затрудняет вычисление факториала. Поэтому необходимо каким-то образом модифицировать формулы (6), чтобы они стали вычисляемыми.
Идея вычисления состоит в использовании унимодальности распределения (6) при длительном интервале наблюдения - это следует из теоремы 3 и стремления к нулю вероятности Р {л (/) = Л0} при /—да.
Проведем модификацию для случая Л(0)=0. Для на-
чала отметим тот факт, что
Преобразовывая, получим
s|j + N0 V -1)-e".
Mo =
-X + |X- 1| eßt ß Iß
+1 =
Получили, что для п, удовлетворяющих последнему неравенству, выполнено исходное неравенство, т.е. для
п = 1, п +1 вероятности возрастают. При этом если
величина
X+N -1)-
eßt является целой, то
= [ N (/)-ер' ] +1 = [ N (/)-р/],
т.е. математическое ожидание и мода находятся «достаточно близко друг от друга» при малом значении параметра р. Поэтому при помощи формулы Стирлинга [6]:
____ _е_
п! = л/2пп пп е-пе12п, 0 <9< 1,
модифицируем вероятность Р (ґ) — [N ( )]} [
Цу = Х + р^
(13)
взятие целой части. Для этого запишем, без учета е1
п рв+i ]
Р{Л(/) = N} ±в—1— (1 -е-р')е-х ' л/2лЛ ЛЛ е-Л ' ’
где N = [ N (/)].
Далее, используя представление
N (ґ ) = -в ерґ ґ1 - е-Рґ),
(12)
запишем
NN =
в евґ (1 - е-вґ) е™ (1 - е-вґ).
В (13) ц имеет смысл условной интенсивности,
т.е. количество заявок в единицу времени при условии, что уже поступило N заявок. В качестве единицы времени можно взять год, квартал, месяц, неделю, день. При этом важно отметить, что вся необходимая для исследования информация находится в документах (в частности, для страхования - полюсы), которые фиксируют происходящие события с точностью до дня, т.е. редко можно увидеть, когда на финансовых документах помимо даты ставится еще и время (часы, минуты, секунды) подписания документа или вступления его в силу. Поэтому, без ограничения общности, будем считать единицей измерения один день.
Формализуем вышесказанное. Пусть имеются следующие данные:
Последнее приближенное равенство будет тем ближе к точному равенству, чем ближе значение математического ожидания к какому-либо натуральному числу. Таким образом, можно записать
Р Л (/)=Л ^¿л ПI1+'!] е-Л-'х'" -,
где N = [ N (/)].
N0, Nl, N2,
где - количество клиентов, пришедших в г-й день, Т - количество дней наблюдения.
Таким образом, связь между величинами Лг с учетом модели (13) можно представить следующим образом:
N =Х+р£ Ni.
І =0
Для расчета остальных вероятностей воспользуемся соотношением
Х
—+ п
Р N (ґ ) = п + 1) = -п+Г ґ1 - е-Рґ)Р \ (ґ ) = п}
Для оценивания параметров X и р воспользуемся методом наименьших квадратов, т.е. решим следующую оптимизационную задачу:
Т ( і-1 І
2 = £ N-Х-р£Nj
'=! V 7=0 )
ШІП.
Х,р
на основе которого можно предложить следующее правило:
1) выбираем некоторое натуральное число 5;
2) для і = 1,5 рассчитываем
Х
- + N + і -1
Р\(ґ ) = + ,}=}_+__ ґ1 - е-вґ )p{N (ґ ) = N + і' - ^
P{N(ґ) = N - і}=„¥ 1 +1 (1 - е-рґ) 1 Р {Т^(ґ) = N - і +1}.
Х ЛГ ■
— + N -1
Р
Выражение (12) и последнее правило образуют метод приближенного вычисления одномерного распределения вероятностей
Оценивание параметров интенсивности
Составим систему
й Х й р
Т і-1
= 2£ N - 2ТХ- 2р££ Nj = 0,
і =1 Т і -1
і=1 І=0 Т і -1
= 2£ N £ Ni - 2Х£ £ Ni - 2Р£ £ N
1=1 І=0
ґ=1 І=0
= 0.
После преобразований
1 (_Т і-1
Х=-|£ Nі-Р ££ N}
р =
£ N £ N - - £ Nі ££ N ґ=1 І=0 Т і =1 і=1 І=0
£ (і^ї - Т V £ £ -,ї
і=1\ i—0 У 1 \ і=1 7=0 /
В данном пункте предложим метод оценивания параметров X и р. Ранее было получено соотношение
е
ЛИТЕРАТУРА
1. Змеев О.А. Исследование математических моделей процессов страхования при нестационарных потоках страховых рисков: Дис. ... д-ра
физ.-мат. наук. Томск, 2005.
2. НазаровА.А., ТерпуговА.Ф. Теория массового обслуживания. Томск: Изд-во Том. ун-та, 2004. 226 с.
3. ФеллерВ. Введение в теорию вероятностей и ее приложения. М.: Мир, 1984. Т. 1. 527 с.
4. Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление. 2-е изд. М.: Наука, 1969. 424 с.
5. Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю.В. Прохоров. М.: Большая Российская энциклопедия, 1999. 910 с.
6. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления: В 3 т. Т. II / Пред. и прим. А.А. Флоринского. 8-е изд. М.:
ФИЗМАТЛИТ, 2001. 864 с.
Статья представлена кафедрой теории вероятностей и математической статистики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию «Кибернетика» 29 мая 2006 г.