Научная статья на тему 'Оценка вероятности редких событий в поведении толпы'

Оценка вероятности редких событий в поведении толпы Текст научной статьи по специальности «Математика»

CC BY
315
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ ГРАНОВЕТТЕРА / КОНФОРМНОЕ КОЛЛЕК-ТИВНОЕ ПОВЕДЕНИЕ / УПРАВЛЕНИЕ ТОЛПОЙ / БОЛЬШИЕ УКЛОНЕНИЯ / СТАТИСТИЧЕСКИЕ ИСПЫТАНИЯ / M. GRANOVETTER'S MODEL / CONFORMITY COLLECTIVE BE-HAVIOR / MOB CONTROL / LARGE DEVIATIONS / STATISTICAL SIMULATIONS

Аннотация научной статьи по математике, автор научной работы — Рогаткин Андрей Дмитриевич

Исследуется предложенная в [2] модель поведения толпы, которая является обобщением модели конформного порогово-го коллективного поведения М. Грановеттера [13] на случай неопределённости относительно значений порогов агентов. Вероятность события, состоящего в выходе системы из некоторого множества состояний (т.е. в так называемом возбуждении толпы), оценивается при помощи асимптотиче-ского результата, полученного в [8]. Теоретические оценки типа больших уклонений уточняются при помощи численных оценок, полученных методом статистических испытаний. Полученные результаты дают возможность оценить надёж-ность обеспечения невозбуждения толпы в тех случаях, когда вероятности событий слишком малы для применения метода статистических испытаний. Приведены рекомендации по выбору параметров, обеспечивающих заданную вероятность выхода системы из множества заданных состояний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Estimation of rare events probability in mob behavior

We developе a collective behavior model proposed in [2]. The model is a generalization of the M. Granovetter’s conformity threshold behavior model for the case of uncertainty in agents’ threshold values. We estimate the probability of exit of a system from a given set of states (i.e. in mob excitation) using an asymptot-ic result derived in [8]. Theoretical estimations of large deviations type are refined using numerical estimations obtained with the help of statistical simulations. Obtained results allow us to estimate stability of excitation prevention in the cases when the probabilities of events are too small for using statistical simulations. We give recommendations on the choice of parameters which guarantee a given probability threshold of exit of the system from a given set of states.

Текст научной работы на тему «Оценка вероятности редких событий в поведении толпы»

УДК 51-77 ББК 60.55.372

ОЦЕНКА ВЕРОЯТНОСТИ РЕДКИХ СОБЫТИЙ В ПОВЕДЕНИИ ТОЛПЫ

Рогаткин А. Д.1

(ФГБУН Институт проблем управления РАН, Москва)

Исследуется предложенная в [2] модель поведения толпы, которая является обобщением модели конформного порогового коллективного поведения М. Грановеттера [13] на случай неопределённости относительно значений порогов агентов. Вероятность события, состоящего в выходе системы из некоторого множества состояний (т.е. в так называемом возбуждении толпы), оценивается при помощи асимптотического результата, полученного в [8]. Теоретические оценки типа больших уклонений уточняются при помощи численных оценок, полученных методом статистических испытаний. Полученные результаты дают возможность оценить надёжность обеспечения невозбуждения толпы в тех случаях, когда вероятности событий слишком малы для применения метода статистических испытаний. Приведены рекомендации по выбору параметров, обеспечивающих заданную вероятность выхода системы из множества заданных состояний.

Ключевые слова: модель Грановеттера, конформное коллективное поведение, управление толпой, большие уклонения, статистические испытания.

1 Рогаткин Андрей Дмитриевич, аспирант (andreyrogatkin@gmail. сот).

1. Введение

В работах М. Грановеттера [13] и Т. Шеллинга [14] предложены модели коллективного поведения, которые сегодня лежат в основе множества различных подходов к математическому и физическому описанию социальных явлений [3, 4, 5, 9]. Единой для этих подходов является ситуация, в которой агенты осуществляют бинарный выбор - действовать или бездействовать - в дискретные моменты времени, ориентируясь при этом на действия своего окружения. При этом ключевой характеристикой агента является его порог, при превышении которого обстановкой агент изменяет свое поведение. В течение последних десятилетий пороговые модели получили широкое распространение, в частности, одним из современных направлений исследований является их развитие - решетки связанных отображений (Coupled Map Lattices) [10, 11, 15].

В классических работах М. Грановеттера и Т. Шеллинга не учитывается неполнота информации, которая важна для приложений, в том числе для решения задачи управления надежностью социальных систем. В реальных ситуациях, как правило, пороги агентов не известны точно, а известно их вероятностное распределение. В настоящей работе для описания поведения толпы (раздел 2) используется предложенная в [2] модель, которая является обобщением модели конформного порогового коллективного поведения М. Грановеттера [13] на случай вероятностной неопределенности относительно значений порогов агентов.

В разделе 3 используется полученная автором в [8] асимптотика типа больших уклонений для оценки вероятности редких событий в поведении толпы. В качестве функции распределения порогов агентов используется двухпараметрическое семейство функций, полученное в [1, 6] на основании исследования социальных сетей Facebook, Livejoumal и Twitter. Показано, что грубая логарифмическая асимптотика типа больших уклонений может применяться для численной оценки вероятностей редких событий при помощи «калибровки» оценки методом статисти-

ческих испытаний (раздел 4) на множестве параметров, позволяющих получать оценки статистическим методом.

В разделе 5 решается задача управления надежностью социальных систем. Находится множество значений параметров системы, обеспечивающих на заданном промежутке времени заданную надежность.

2. Описание модели

Рассмотрим конечное множество агентов N = {1, 2, ..., п}. Каждый из агентов имеет некоторый порог сопротивления социальному давлению в{ е [0, 1], 1 е N (далее - порог; под социальным давлением понимается то, сколько других агентов действует). На шаге к агент 1 е N выбирает одно из двух состояний ю1к е {0, 1} (если ю1к = 1, то говорят, что агент «действует», иначе говорят, что он «бездействует»), его состояние на шаге к + 1 определяется по правилу

(1) ®(к+1)=^

1,1 X®о

п 3

о,1 X® < о.

п 3 '

3

Согласно правилу (1), агент действует, если состояние системы хк = 1/п не ниже, чем его порог. Такое поведение называется конформным. Динамика состояния системы во времени при этом подчиняется рекуррентному соотношению

(2) Х+- = Р (хк ) ,

где

1 п

(3) Р (х) = -х).

п '=1

Здесь % обозначает индикатор множества.

В работах [2, 8], был рассмотрен случай, при котором в правой части выражения (1) имеется неопределённость: вместо известных порогов агентов рассматривается последовательность

0\(ш), ..., 9„(ш) независимых одинаково распределённых (с распределением F(•)) случайных величин на вероятностном пространстве Т, Р). Такая ситуация возникает, например, когда пороги агентов не известны точно, но агенты выбраны случайно из множества агентов с известным распределением порогов.

Эмпирическая функция распределения порогов агентов в этом случае запишется как

(4) х,ф) = -х) .

п 1

При фиксированных F и х0 получаем, что выражением

хП (®) = ¥п (Х0>®) >

(5) Х1 (®) = Рп (Хк-1 (®) ,©) ,

XK (®) = Fn (-1 (®)

задана последовательность случайных конечных последовательностей {Х п(ю)=(х1п(ю), ..., Хк"(ю))} - траекторий системы, каждая из которых имеет некоторое распределение Pn на пространстве М^, определяемое как Pn(A) = P{w: хп(ю) е A}. На рис. 1 показан пример одной реализации эмпирической функции распределения и соответствующей ей траектории системы.

В работе [8] была доказана следующая асимптотика для распределений траекторий системы:

(6) liminf^logP (U)>-infH(y)

n^a n и

для любого открытого множества U е В(5),

lim sup1 log P (C) < - inf H (y )

n^a n C

для любого замкнутого множества C е S(S), где

Р(х) Гп(х)

Хк х

0.2

0,4 0,6 х

хк

0,2'

Рис. 1. Реализация случайной траектории, соответствующей функции распределения Р (•) .Диаграмма Ламерея (слева). Траектория системы (справа), п = 30

(7)

Н ( У ) =

+ (- - У,)ш^Ч +

Р (Уо ) 1 - Р (Ук-1)

К-1

+Х( Ук+1 - Ук)1п

к =1

Ук+1 - У к

Р ( Ук )-Р ( Ук -1)

• У е 1,

(! - У1) 1 - У1 ч + Ук 1п Ук

К-1

+Х( У к - Ук+1)1п

У е У2:

- Р ( Уо ) Р ( Ук -1)

У к - У к+1

к=1 Р(Ук-1 )-Р (Ук):

У £ 11 иУ2,

и введены обозначения _у0 = х0, 0-1п(0) = 0,

1 = {У е [0,1]К : Уо < У1 < У2 <... < Ут = Ут+1... = Ук } , т е {0,...,К},

1 = {У е [0,1]К : Уо > У1 > У 2 > ... > Ут = Ут+1... = Ук } , т е {о,...,к} .

Асимптотические результаты типа (6) изучаются в теории больших уклонений [12].

к

В работах [1, 6] показано, что конформное поведение в сетевых структурах имеет эквивалентное модели Грановеттера математическое описание, в котором структура сети заключена в некоторую функцию, имеющую свойства функции распределения. В [1, 6] было проведено исследование социальных сетей Facebook, Livejoumal и Twitter и показано, что реальные социальные сети хорошо моделируются функциями из двухпарамет-рического семейства

(8) f(х,в, Х)= arCtgi(Х -в) + arCtg (Л) ,

arctg^ (1 -в) + arctg (Лв)

где X е (0, +да) - параметр, носящий название «коэффициент неоднородности» и характеризующий степень отличия функции распределения от равномерного распределения, а в е [0, 1]-параметр, называемый «единым относительным порогом» и характеризующий происходящий в сети процесс принятия решения. В [1, 6] показано, что значения коэффициента неоднородности составляют XF = 13,01; XL = 9,18; XT = 7,34 для социальных сетей Facebook, Livejournal и Twitter соответственно. На рис. 2 изображены различные кривые из параметрического семейства (8).

В настоящей работе изучается вероятность события A е Т, состоящего в том, что случайный процесс (5) с заданным начальным условием (например, х0 = 0,2) превысит в некоторый момент времени точку выхода (например, хвых = 0,5) при различных количествах n агентов в системе. Формальное определение данного события запишется как

(9) А" = {а> е П: 3k еП х"к (со) > xj .

Событие An далее называется выходом из области социальной системы, состоящей из n агентов. Вероятность выхода из области в описанной модели зависит только от теоретической функции распределения порогов агентов FQ и их количества n. В случае функций распределения из двухпараметрического семейства (8) введём для нее обозначение

(10) PI (в, Л) = P {а е A"}, F (x) = F (x, в, Л) .

Асимптотическая оценка (6) для вероятности Р"вых(в, X) принимает вид

1

(11) lim - log РЫх (в, Х) = - inf H (F (•,в,Л), у) .

у eA

0,6

F(x, в, 13)

0,4 0,6 x

в = 0.0

в = 0,2

в = 0,4

в = 0,6

в = 0,8

в = 1,0

Рис. 2. Кривые из семейства (8) при X = 9,18 и различных в e [0, 1]

3. Оценка вероятности выхода из области

В данном разделе приведены результаты вычисления Р"вых(в, X) методом статистических испытаний для n = 50, n2 = 100 и n3 = 200 и показано, как с применением асимптотики (11) они могут быть продолжены для более высоких значений n.

Оценка (11) может быть переписана в виде

-n Inf H(F(•,•),у )

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(12) Р2х (в,Х) = c (n,e,Ä) e ^ , где c(n, в, X) удовлетворяет

log c (n,0,X)

(13) lim-= 0 для всех в, X,

т.е. изменяется «меньше чем экспоненциально» по п. Не зная константы с(п, 9, А), нельзя определить значение вероятности Рпвых(9, А) с заданной точностью. По этой причине утверждения типа (11) иногда называют «грубая логарифмическая асимптотика». Асимптотика (11) может применяться для получения численной оценки вероятности Рпвых(9, А) только при наличии дополнительной информации о константе с(п, 9, А). В данной работе значение этой константы определялось приближённо при помощи полученной методом статистических испытаний оценки Р"ьа(в,Л), изображённой на рнс.З. Подробное описание алгоритма проведения статистических испытаний дано в следующем разделе.

Качественные различия в Рпвых(9, А) как функции двух переменных (9, А) при различных п хорошо иллюстрируются линиями уровня (кривыми, на которых Рпвых(9, А) постоянна). На рис. 4 изображены линии уровня Р"ь1Х(в,Л), определяемые как

функции Л (в), ЯП (в) и ЯП (в), удовлетворяющие

(Щ Р:а{в,л;(в)) = т\

Приближенное значение с(9, А) константы с(п, 9, А) находилось на основании данных статистических испытаний следующим образом:

1. При помощи метода численной оптимизации вычислялась оценка 1(9, А) функции

(15) I(в,Л) = Н(•, в, Я),у).

уеЛп

2. Приближенное значение с(9, А) константы с(п, 9, А) находилось по формуле

ч Рп (в,Я)

(16) с в Я) = РЫ01

при п = 200.

Рис. 3. Зависимость вероятности выхода из области от параметров в, X, полученная методом статистических испытаний при п = 50. Сверху - график функции Р"вых(в, X), снизу - цветовое изображение функции Рпы1Х(в, X)

Рис. 4. Кривые равной вероятности выхода (линии уровня) для различного числа агентов социальной сети П1 = 50, П2 = 100 и Пз = 200

Полученное значение с(в, X) для различных (в, X), применялось для того, чтобы записать «совмещённую» оценку в виде

(17) Р (0, Х) = С (0, л) .

Оценка (17) вероятности выхода из области применима при любых значениях п, в том числе тех, для которых невозможно получить результат методом статистических испытаний из-за ограничений на вычислительные ресурсы. Это позволяет оценивать вероятность выхода из области для реальных социальных систем, состоящих из большого числа агентов. Важно отметить, что оценка (17) получена объединением аналитического результата (11) и численных расчётов.

Построенная в данном разделе оценка вероятности для выхода из области (обозначенного выше Ап) может быть также построена и для любого другого события (подмножества допустимых траекторий системы и Г2). Для этого необходимо подставить соответствующее подмножество траекторий в (15) в качестве множества, на котором происходит оптимизация функционала НО). Таким образом, исследователь может оценить вероятность любого возможного события, вычислив ее численно для некоторого значения п и осуществив «калибровку»

(15)—(17).

4. Алгоритм статистических испытаний

В работе [2] показано, что случайные траектории (5) имеют конечную длину, т.е. не более чем за п шагов система достигает некоторого (случайного) конечного состояния, которое не изменяется с дальнейшим течением времени. Этот факт лежит в основе вычислительного эксперимента для определения вероятности Рпвых(в, X), который был реализован в программной среде МЛТЬЛБ и описывается далее. При помощи метода обратного преобразования функции распределения Р(в, X) генерировалась конечная последовательность из п реализаций случайных порогов вь ..., вп, по которым вычислялась эмпирическая функция распределения (4). Далее при начальном условии х0 = 0,2 со-

гласно (5) вычислялись первые п членов последовательности xkn. Считалось, что произошёл выход из области, если выполнялось max{x^} > хвьа., где хвЬ1Х = 0,5. Эта процедура повторялась до

k=1...n

выполнения условия

(18) min {q, (l - ql)} = j,

где

(19) q,=1 max{x"''} ^ )

/ , \k=1...n /

1 1=1

- доля реализаций траектории xkn с выходом из области, l - номер испытания в серии экспериментов. Затем вероятность выхода вычислялась на основании значения l, при котором произошла остановка процедуры, при помощи оценки, описание которой приведено в приложении «Оценка малого параметра геометрического распределения».

В силу ограничений на вычислительные ресурсы, в тех случаях, когда условие (18) не было достигнуто после l = 105 шагов, процедура останавливалась и соответствующая вероятность принималась равной нулю. Таким образом, методом статистических испытаний оценивались вероятности в интервале (10-4, 1 - 10-4). Для остальных значений вероятности Рпвых(в, Л) (очень близких к нулю или единице) статистическая оценка не может быть выполнена за разумное время в связи с ограничением на использованные вычислительные ресурсы. Применяемый для решения этой проблемы в статистических испытаниях метод замены меры в данном случае не применялся в связи с трудностями, возникающими при аналитических преобразованиях семейства мер Pn(A) = х п(ю) е A} (выписанное в явном виде это семейство мер можно найти в работе [2]).

5. Обеспечение надежности социальных систем

Рассмотрим социальную систему (толпу, социальную сеть и т.п.) со стохастическим пороговым поведением (5). Как показано в [2], такая система не более чем за п шагов приходит к

«равновесию» (действия агентов перестают изменяться). В силу случайности порогов агентов, состояние системы, при котором достигается это равновесие (результирующее состояние), случайно. Выше были приведены оценки вероятности события, состоящего в том, что результирующее состояние системы находится вне заданной области (при условии, что первоначально система находилась в заданной области), при различных значениях коэффициента неоднородности и единого относительного порога системы. Вероятность выхода системы из заданной области в общем случае зависит от параметров системы, как было показано выше. Ниже изучается задача обеспечения надёжности социальной системы при условии, что вероятность выхода p известна как функция основных параметров системы p = p(n, в, А) = Рпвых(в, А).

Пусть реализация порогов агентов, и, следовательно, достижение равновесия повторяется многократно через равные промежутки времени т, которые называются «быстрое время». Тогда за время t, называемое «медленное время», достижение равновесия произойдёт m = [t / т] раз, где [•] обозначает целую часть числа. Согласно [7], надёжностью социальной системы называется вероятность сохранения её основных параметров внутри допустимой области. Для социальной системы основным наблюдаемым параметром является среднее действие агентов. Допустимой областью является множество [0, хВ). Так как достижение равновесия многократно повторяется во времени, надёжность зависит от рассматриваемого промежутка времени. Обозначим через R(t) функцию выживания - вероятность того, что за время t система ни разу не выйдет из допустимой области. Функция выживания, согласно определению надёжности, является надёжностью системы на временном интервале t.

Введём бернуллиевскую случайную величину £ е {0, 1}, которая равна единице, если система в момент времени tm = тт вышла из допустимой области, и равна нулю в противоположном случае. Вероятности этих событий равны соответственно p и 1 - p. Функция выживания по определению может быть записана как

R (t ) = P (£ = £ = ••• = 4[t/г]= о), что приводит к результату

(20) R (t) = (l - p)

При малых p, таких что p << 1/m = 1/[t / т], выражение (20) может быть приближено

(21) R (t) = 1 - p -

Задача управления надёжностью социальных систем состоит в том, чтобы найти множество параметров, при которых надёжность системы при заданном времени T окажется не меньше, чем заданный порог S.

Рассмотрим иллюстративный пример. Пусть задача состоит в обеспечении надёжности S = 1 - 10-2 для социальной системы с числом агентов n = 107 на промежутке времени, таком что m = [t / т] = 103. Решение задачи выглядит следующим образом.

1. Подставить данные в уравнение (20) и найти максимально допустимую вероятность выхода p. В данном случае применимо приближение (21), принимающее вид S = 1 - pm, откуда выражается

1-S 102 ,

(22) p =-= — = 10-5.

m 10

-n inf H(F(-,в,Х),y)

2. Решить уравнение c(0,Ä)e J"A = p и найти соответствующую линию уровня Л(в) в пространстве параметров (9, А). Множество параметров (9, А), обеспечивающее надёжность не меньше чем S, лежит «правее и выше» найденной линии уровня, в области, изображённой зелёным цветом на рис. 5.

10

8 6 4 2 -0 -

О 0,2 0,4 0,6 0,8 I

в

Рис. 5. Множество параметров (в, А), обеспечивающее надёжность, не превышающую 3 (зеленым цветом)

6. Заключение

Задача обеспечения надёжности социальной системы - её нахождения в заданном множестве состояний - требует оценки вероятностей редких событий. Зачастую эти вероятности настолько малы, что не позволяют применять для своей оценки метод статистических испытаний. Точные аналитические оценки и метод замены меры не всегда удаётся применить в связи со сложностью исследуемых моделей. В настоящей работе показано, что грубая логарифмическая асимптотика типа больших уклонений может применяться для численной оценки вероятностей редких событий при помощи «калибровки» оценки методом статистических испытаний на множестве параметров, позволяющих получать оценки статистическим методом. Оценку типа больших уклонений, как правило, легче получить аналитически, чем более точные оценки. Применение предлагаемой методики проиллюстрировано на модели конформного коллективного поведения. Построена численная оценка для различных

параметров модели. Приведён пример применения построенной

оценки для задачи обеспечения надёжности - вероятности

нахождения социальной системы в заданном «допустимом»

множестве состояний.

Литература

1. БАТОВ А.В., БРЕЕР ВВ., НОВИКОВ ДА., РОГАТКИН А.Д. Микро- и макромодели социальных сетей. Ч.2. Идентификация и имитационные эксперименты // Проблемы управления. - 2014. - №6. - С. 45-51.

2. БРЕЕР В.В., РОГАТКИН А.Д. Вероятностная модель порогового поведения в многоагентных системах // Автоматика и телемеханика. - 2015. - №8. - С. 56-77.

3. БРЕЕР В.В. Модели толерантного порогового поведения (от Т. Шеллинга - к М. Грановеттеру) // Проблемы управления. - 2016. - №1. - C. 11-20.

4. БРЕЕР В.В. Модели конформного поведения. Ч.1. От философии к математическим моделям // Проблемы управления. - 2014. - №1. - С. 2-13.

5. БРЕЕР В.В. Модели конформного поведения. Ч. 2. Математические модели // Проблемы управления. - 2014. -№2. - С. 2-17.

6. БРЕЕР В. В. , НОВИКОВ Д. А. , РОГАТКИН А. Д. Микро- и макромодели социальных сетей. Ч. 1. Основы теории // Проблемы управления. - 2014. - №5. - С. 28-33.

7. БУРКОВ В Н., НОВИКОВ Д А. Как управлять проектами. - М.:СИНТЕГ, 1997. - 188 с.

8. РОГАТКИН А.Д. Большие уклонения в социальных системах с пороговым конформным поведением // Автоматика и телемеханика (в печати).

9. СЛОВОХОТОВ Ю.Л. Физика и социофизика. Ч. I. Физические основы социальных явлений. Влияние солнечной активности на процессы в обществе. Движение в системе «живых частиц» // Проблемы управления. - 2012. - №1. -С. 2-20.

10. CHAOUIYA C, OURRAD O, LIMA R. Majority Rules with Random Tie-Breaking in Boolean Gene Regulatory Networks // PLoS ONE 8(7): e69626. doi:10.1371/journal.pone.0069626. 2013.

11. CHAZOTTES J, FERNANDEZ B. Dynamics of Coupled Map Lattices and of Related Spatially Extended Systems. - Springer, Lecture Notes in Physics, Vol. 671, 2005.

12. DEUSCHEL J., STROOCK D. Large deviations. - N.Y.: Academic Press, 1989. - 283 p.

13. GRANOVETTER M. Threshold Models of Collective Behavior // American Journal of Sociology. - 1978. - Vol. 83. -P. 1420-1443.

14. SCHELLING T. Micromotives and Macrobehavior. - N.Y.: WW Norton & Co, 1978. - 272 p.

15. VOLCHENKOV D., LIMA R. Random Shuffling of Switching Parameters in a Model of Gene Expression Regulatory Network // Stochastics and Dynamics. - 2005. - Vol. 5(01). -P. 75-95.

ПРИЛОЖЕНИЕ. ОЦЕНКА МАЛОГО ПАРАМЕТРА ГЕОМЕТРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ

Оценка малого параметра геометрического распределения. Изображенные на рис. 6 функции вероятности геометрических распределений с параметром р е (0, 1) имеют вид (23) Рр (к) = р (1 - р)к-1.

Задача состоит в построении статистической оценки параметра р по конечной выборке независимых одинаково распределённых случайных величин с распределением (23). Специфика задачи состоит в том, чтор предполагается малым (р « 1).

Рис. 6. Функции вероятности семейства распределений (23) при различных р

Найдём оценку параметра р при помощи метода максимального правдоподобия. Запишем определение оценки максимального правдоподобия:

п

(24) р = а^шах ^ Ь ( ),

рфл] ,=1

где ..., - последовательность независимых, одинаково распределённых случайных величин с функцией вероятности (23), а Ь(р, к) = Рр(к) - функция правдоподобия. Максимизируя произведение функций правдоподобия, получаем

(25) р = = 1, где 4= 1 £ .

£ 4, 4 п и

,=1

Найдём математическое ожидание оценки р :

ер ■£ пр (?=т |=

т V п

I т -1 ^ т=пт ^ п -1 ,

р (1 - р) =

(1 - - )п

^ п п т-1

т=п т V п-1

где введено обозначение x = 1 - р, а

m -А

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

v n -1

- биномиальный

коэффициент. Для степенного ряда (26) затруднительно найти аналитический предел в элементарных функциях при произвольном п. При п = 1 получаем

(27) Ep = £ü = i-f (-in(1 -x»-¿Ц .

x m=1 m x (1 - p )

Выражение (27) показывает, что оценка максимального правдоподобия при п = 1 «очень плохая» для малых р. Действительно, предел отношения

(28) lim EP = lim ^^ = +<ю

Р ^ 0 p p ^ О 1 - p

равен бесконечности. Случай п = 1 является в этом смысле вырожденным и не рассматривается подробно в настоящей работе. Далее под изучением оценок при малых р будет пониматься изучение их предельных свойств типа (28). В качестве иллюстрации найдём математическое ожидание p при п = 2:

(29)

Ep = £ m-1xm =

x m=2 m

x"-£ ±x-1 =iflzxi

X Vm=2 m=2 m J X 2 (1 - x j2

2 £ xm -£ ^

+ x

V m=0

m

—--(-in (1 - x)) + x

= 2

(1 - x) +

(1 - x )2ln (1 - x) (1 - x)

2

= 2

= 2

2 , 2 p in p p p + —-£r + -

(1 - p)2 (1 - p)

( 2, p 1П p + p

(1 " Г)' (1 - p)

= 2

p2ln p + p (1 - p ) (1" P )2

График Ep при n = 2 изображён на рис. 6.

0,8 0,6 0,4 0,2

р

—Ер

0,2

0,4 0,6 Р

0,8

Рис. 7. График математического ожидания оценки максимального правдоподобия p при n = 2

Как видно из (29) и рис. 7, при n = 2 оценка максимального правдоподобия смещённая: при всех p е (0, 1) математическое ожидание Ep > p. В точках 0 и 1 распределение и математическое ожидание не существуют.

Учитывая тождество lim p ln p = 0, получаем, что при n = 2

p^Q

для малых p оценка p смещена в два раза:

lim — = lim 2

p ^ 0 p p ^ 0

lim p = lim 2 p ln p + (1 - p )

(30)

2 p ln p = lim-- + lim

(1 - p )2

2

p ^ 0

(1 - p)

= 0 + 2 = 2,

* ^0 (1 - р ) что можно также записать в виде

(31) Ер = 2р + о (р) .

Выражение (31) подсказывает вид несмещённой при п = 2 для малых р оценки

(32) р = ^р = р + о(р),

которая имеет в четыре раза меньшую дисперсию, чем оценка максимального правдоподобия p . Оценка (32) изображена на рис. 8.

Рис. 8. Математическое ожидание несмещённой оценки р в сравнении с оценкой максимального правдоподобия p

Оценка (32) «лучше» оценки максимального правдоподобия, так как имеет меньшую дисперсию и является несмещённой при малых p. Поставим перед собой задачу построения статистической оценки p, оптимальной с точки зрения квадратичного риска:

(33) E(p - p)2 ^ min,

p

в классе оценок

(34) р(с) = ср, где р е М.

Оказывается, что задачу нахождения оптимальной в смысле (33) оценки можно решить, не вычисляя риск в явном виде.

Действительно, квадратичный риск можно переписать в виде ^ E(p -p)2 =E(p-Ep + Ep -p)2

= E (p - Ep)2 + 0 + E (Ep - p)2 = Varp + b2 (p),

где b (p) = Ep — p - смещение оценки p . Равенство (35) носит в

англоязычной литературе название bias-variance decomposition, а идея уменьшения риска за счёт уменьшения дисперсии при увеличении смещения известна как bias-variance tradeoff. Если обозначить дисперсию оценки р через

(36) а2 (/>) = Var р,

то можно выразить дисперсию оценки р через а2:

(37) Var р = с2 Var<x2 (i?) = с2а2 (/>) . Смещение оценки p имеет вид

(38) b(p) = Ep — p = cp — p = (c — l)p .

Тогда квадратичный риск оказывается равным

(39) Е(р-р)2 =с2а2 (Р) + (С-\)2 р2.

Оптимизируя по с, находим оптимальную константу

2

(40) c =-p-.

v ' 2-2/4

Р +о- (р)

Подставляя (40) в (39) в качестве с, получаем Е(р-ру = 2+ р2*а(Р) i =

(41) (р2+°{р)) (р2+о2{р))

р2<?2(р) 2 р4 = Р

р2+а2(р) р2+а2(р)

Можно показать, что сг2 {р) = р11п р + о(р21п . а, следовательно, для построенной нами смещённой оценки выполнено ч2

(42) E (p — p)2 = p2 + о (p2) .

Оценка для случая п = 10 в данной работе была построена аналогичным образом численно.

ESTIMATION OF RARE EVENTS PROBABILITY

IN MOB BEHAVIOR

Andrey Rogatkin, Institute of Control Sciences of RAS, Moscow, PhD student ([email protected]).

Abstract: We develope a collective behavior model proposed in [2]. The model is a generalization of the M. Granovetter 's conformity threshold behavior model for the case of uncertainty in agents' threshold values. We estimate the probability of exit of a system from a given set of states (i.e. in mob excitation) using an asymptotic result derived in [8]. Theoretical estimations of large deviations type are refined using numerical estimations obtained with the help of statistical simulations. Obtained results allow us to estimate stability of excitation prevention in the cases when the probabilities of events are too small for using statistical simulations. We give recommendations on the choice of parameters which guarantee a given probability threshold of exit of the system from a given set of states.

Keywords: M. Granovetter's model, conformity collective behavior, mob control, large deviations, statistical simulations.

Статья представлена к публикации членом редакционной коллегии П. Ю. Чеботарёвым.

Поступила в редакцию 30.03.2016.

Опубликована 30.09.2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.