УДК 519.2:004.421.5:004.7
УPABHFНИЯ ДИНАМИКИ fTFriFHFH УЗЛОВ В РАСТУЩИХ СЕТЯХ С ПОТЕРЯМИ СВЯЗЕЙ
В. Н. Задорожнын1, Е. Б. Юцнн:
'Омский сссударстееньый технический университет, с. Омск Рсссм лИкпп:лнут ил»й»этиш им. С. JT. Cn6oitv.ii СО VAU, Омск, Россия
Аннотация - Формулируется а исследуется модель растущих сетей (социальных, телекоммуникационные трррпрпстпчргкпт и т.,1.), учитывают л я случайные потери снячей мсадуучапнпклкп сети я толе ее эволюции. Экспериментально устанавливается существенное влияние потерь ограниченной доли связей на динамику роста сетей п на распределение узлов по степеням связности. На основе теории случайных графов с нелинейным правилом предпочтительного связывания выводятся уравнения динамики, позволяющие с учетом доли теряемых связей адекватно описывать и прогнозировать эволюцию растущих сетей, а также осуществлять целенаправленное влияние па ход их эволюции.
Клюиееыг слом: наука о сетях, теория случайных графов, стационарные и переходные случайные процессы.
Т RRF.tfhhf
Линейное гравию предпочтительного связывания (ЛППС) [1] списывает механизм роста больших сетей в терминах теории графов следующим образом В некоторый момент времени .*, имеется небольшой достаточно произвольный граф (затравка), состоящий кз Л0 = to вершин. 11с каждом шаге времени г > появляется новая кгршинл «■ т исоднящими душми (приращен иг ip;i:Jia) и апждим ич мгик дуг нгчикш'има нмоирлп одну ич игр-
айн графа и связывается с нею. При этом вершин?. /' выбирается с вероятностью рг = к. , где k¡ - степень
связности вершины i [2, 3]. Таким образом, в J11111С вероятность р, связывания с вершиной i пропорциональна степени сзязности этой вершины: р, ce fc. Граф. выращиваемый текнм образом. граф зпраЬаон - Альберт (граф ЬА). имеет свойства, которые согласуются со свойствами многих (хотя и далеко не всех) реальных сетей |Д,4]. Дальнейшее развитие моделей растущих сетей привело к созданию нового раздела статистической механики г серии сетей (Network Scicccc).
Одно иг перспективных направлений развития Network Science нрслстазлсно теорией случайных графов
(fji | ) с: нг.1ИНГЙНК1М ИШКИ.К^М ИрГДИПЧ тшглкнгт скч<ык.1ннч (Ml II |С) [^-9] МнО! иг рГЧуЛК1}Г1>»1, 1ЮЛуЧГННМГ
при использовании других подходов, являются частными случаями результатов, полученных в теории слт. с НППС [6-8]. Ряд задач Network Science решен методами теории сл г. с НППС впервые К таким задачам относится и задала расчета характеристик растущих графов с потерями связей, решаемая в данной статье.
Решаемая задача является шагом к повышению адекватности математического моделирования социальных сетей. бурное разйише которых oiuubutaei серьезное влнхние на oGujccj венные ироиессы. ирсхвляюшесо. через рекламу информационное протичпетояние идеологическую борьбу, госулярстиенную политику и т д
Существующие модели социальных сетей нередко подвергаются обоснованной кршике [10], поскольку не учитывают такие особенности сетей как ограниченность возможного числа связен у любого участника сети и с.т^чпкнос изменение существующих связей между участниками Эта критика снимается моделями, разраоаты-кс'.емылси и исследуемыми в настоящей статье на основе теории сл т. с НППС.
Теория глг f НТТТТС отличаете* от теории глг г Jll II1С двумя основными положениями Во-первых, в теории ел.г. с НППС приращения графа стохастические, т.е. число х дуг каждого приращения является независимой слученной величиной с распределением вероятностей l'C-V: = fc) = rh U < k< Л, (n) = L.
Во-вторых, вероятность p¡ связывания с вершиной i в общем случае пропорциональна некоторой функдин (весу)/отстепени связности этой вершины: p¡ f(k-) :
n__ML, /,/= 1,....2V, (1)
где f(k) - вес вершины, имеющей степень связности b. f(fc) > С1, если 0 <к<М. иначе /(It) = 0 (здесь Mb'ii); .V- число вершин в графе Поскольку аргумент весовой функции /(к) целочисленный, мы будем обо-
ЧНИЧ(Г1Ь ГГ ГЖЖГ ЧГЦГЧ/ь рЖ'.Г.МИ l]IH№X tf при -HI1M KÍ1K ЧИГ.1(1КуК1 I HX"JК-ДПКИГЛЬН1НП"К КГГПК I^IW нригм 1ЮЧК(Ь
лит нам без лишних оговорок работать с весовыми функциями, не выражаемыми в элементарных функциях в замкнутом гиде.
В качестве примера на рис. 1 показаны первые шаги выращивания графа с Hi 111С из треугольного графа-затравки. Приращения с одной или двумя дугами появляются с одинаковой вероятностью, п = п = 1/2. При выборе вершин для присоединения дуг приращения используется правило (1) с весовой функцией f(k) — 1п(/г). Здесь максимальное число дуг в прпращепнн h — 2.
•С
* <! К] ч / у #c<¿ < / \
э
Рис. 1. Пример добавления прнращекнй на первых шагах выращивания сл.г с НППС
Распределение степенен связности (РСС) вершил определяется как дискретное распределение вероятностей {gt} степени связности вершины, случайно 'равновероятно) выбранной в графе. Ьслн обозначить через Лу множество (слой) вершин, имеющих степень /с, то (]к = \ ЛК \ !N. 11рн неограниченном добавлении приращений к
графу число его вершин .V—> со и -> {ÖJ. где {£*} - финальное РСС вершин графа.
РСС дуг графа определяется как диу\(ерчое дигкретное распределение вероятностей {q;k}. которым описываются концевые степени (начальная 1 н терминальная i:) случайно выбранной дуги (сл.д.) графа. Начальная степень z^th - это степепь оершнны, из которой дуга исходит, терминальная степень - это степень верошш, в которую дуга заходит. Если обозначить через D(ik) множестзо дут (туннель), имеющих начальную степень I н
терминальную степень к. тс qt t = 1i?(i,¿) | / J?. где R - число дуг графа: R ~ rr:N при .V —> х. где
П\ = М(х) = срсднес тесло д>т в прнращсини графа С ростом графа [qttj > l&rj. где {Q¡ A фи-
нальное РСС цуг.
Используя изложенные основные положения теории сл.г. с НППС можно строить пдсквагнкс модели разнообразных сложных растущих сетей н решать сложиые задачи, соответствующие целям исследования. Сформулируем п решим в терминах теории сл.г. с НППС упомянутую ео введении задачу анализа характеристик сетей с учетом ограниченной степени связности нх узлов н случайного изменения (е данном случае — потери) связен между ними.
тт погт ahor4 а задачи Рас смотрим два режима потерн одной н той же доли а связей в большей сети:
- непрерывные потерн связен в ходе развития сети;
- разовая потеря связей в Ьсдыпой 'оесконечной) сети
1. Задача с растущем графе с непрерывкой которой дуг
Непрерывные потери связей в ходе развития сети промоделируем следующим образом Будем считать, что па каждом шаге выэащнваши графа G(cQ выполняются две операшш:
- к храфу дибдолжмел ио щ)<шнлу (1) .фмра-деыие. <_идерлиащее и ;_редн:гм //: ду1,
- их |р.и]м удалят-* случайниг число г. к д . к гр-днгм Cim — Y ду| (П < у < гп)
Задача состоит в расчете переходных процессов {</»(0) • т е в анализе динамики изменения РСС вершин
1рафа G(a) и ходе «и яыраи,и±и-_ыил. а .акже в определении флнл иьною (сгациокарною) РСС {0*}- Д-ш зтою требуется пелучнп. соответствующие уравнения динамики и найти метод нх решения, пригодный для расчета любых графов с НППС с потерями дуг в ходе выращивания.
2. Задача о бесконечном графе с разовой потерей дуг
Разовую потерю доли а дут в большой сети промоделируем следующим образом. Будем выращивать обыч ный бесконечный граф G с НППС и в финале (i.e. при У= <*>) просеем его дуги с вероятностью а. Иначе говоря.
КЯ'ЖДуЫ. дуг бгГКОНГЧНОГП грлфл novf-nnf .- РГрПЯТЧОГТЪТГ' <7, ЛЛТГМ ЧГГ ТТ'ПМГЧГННЫГ .тути удл.ттг (нлчокгм ЭТО
просеиванием дут). 13 результате получим просеянный граф 0(a). Задача состоит в расчете РСС вершин графа
Gia}.
Л.теория
S. Динамика графа с непрерывной потерей оуг
Урав:1епия динамики для РСС {^(i)} вьшрдятел с помощью асимптотически точных пр:юлнже:пш для i ipnpaiцгний K^iourHiicir-H молучигммх на ni/il с* / Ли начало im-чпа Kjirvt-ни бг-ргин момгш — ^ гдг — число верппш в затравке графа. Тогда о результате вылолпешш любого шага t > /0 выиолияется равенство / - N. Общее число д*т, добавляемых в граф за одш! шаг. в среднем состазляет М(дг)—у - m — у - и при
ОО. Ihlll ИХ N ЧИС.К» ду| Р ~ riW
При использовании правила (1) каждая из m (в среднем) дут пркрашения. поступившего на шаге t. выбирает для связьпкшия верпЕшу слоя А* с верояшостыо Рь = qifi /(/), в результате чего распределение верили: по
СЛОИМ ИГЧТГНИГТГ»-
-V (г+1) -Nt<0 + rt + mPt_,(г)-mPt(г), k>0, (2)
1Дe ( f) — If feqt — средний вес uqjiiwu ¿рифа. .V* - среди«: чниш аеришн и слое A¿.
Кроме того, на шаге С из графа удаляется в среднем '( с.в х D результате среднее число вершин (2) в каждом слое претерпевает дополнительно следующие изменения. С вероятностью {qt t) любая с.в л может заходить в вершину- слся А*. В таком случае потеря этой с.в.ц. уменьшает на единицу степень соответствующей вершины слоя At. н вершина уходит нз данного слоя в слой Число верппш в слсс Ае уменьшается на единицу. С учетом вероятности I¡(a¡j) рассматргааемого случая и среднего числа у теряемых па шаге ; дуг в среднем за счет возхюжноста захода теряемых дуг в слой Ак число вершин з кем уменьшается на Рассматривая анало-
гичным образом возможность захода удаляемой с.в.д. в слой находим, что за счет этой возможности в среднем па шаге t число верппш в слсе Af возрастает па )'!; favtri). Кроме того, чнеле верппш о этом слое vbbma ет [возрастает] в среднем на [в среднем на (í'i^!/)] за счет возможности исхода с.в.д. нз слоя At [нз
слоя Л* ц]. Таким образом, общая поправка к среднему- числу луг в слое Ак. вносимая потерей е.вд, составляет величину
= г{[М1;даИ) I Ш:\В(к\Ш-[\П..\1КЩ 1 М1,В(к.Г)\]}/(гт.
где М - символ математического ожндгнкя. Отсюда
= укН,/(_Ш)=у(.к+ уЫт. (3)
Добавляя поправку [3). вносимую похерен с.в.д.. к выражению '2). получаем:
Щ/+ 1) - 4(0 + л, + ~+ 7(* +
Выражая теперь = а /. /(/) через исходные данные и текущее РСС верпшп {<?*} - приходим к со
лгншмгник!
ЛГ,(Г 113 = ^(0 г, I ,(г)/, х ыШ) I I 1)^(0 *&</)],
^'где у'(^) _ ^^ ~ средний эес вершин па шехе /), пли
/(О
[где ( = N число всех в ершик на шаге 0- или. окончательно.
=-^- -^-- *>0. (5)
v
Соотношение (5) представляет собой асимптогочески точную систему уравнений динамики РСС {одг)} вершин графа с НППС с потерями дут. В частном случае, когда / = 0. уравнения описывают динамику РСС вершин в графе с НППС без потерь, а если ешеДф = к. го они описывают динамику раззнтня графа БА. Расчет РСС по формуле (5) легко выполняется, например, в Ехсе1. и на порядки превосходит по скороста и точности возможности кмнтацненного моделирования графа.
.0. Финн 1снч<: РСС ниргиин при непрерывной потпри ¿1ух
Вершины растулпего графа с 11ППС имеют ограниченную степень связности, если в £1) М< оо. т.е. если ограничена последовательность ненулевых весов {/£}. Тем самым в теории слх. с НППС автоматически снимаются адресованные графам ЬА критические замечания 11 У]. указывающие на ограниченность степеней связности в случае, когда моделируются социальные сети
Уравнения для финального РСС (<2*3 вершин графа с потерями дут легко вызсдятся из (4). Записывая левую ЧИПЪ РИКГНГГЮ1 (4) Н КИ.ЧГ ' ) О И I К ГКТКОНГЧНОПИ и()ЖН(1 гок]М1М1К члены + 1) к
левой часта и /<ь(/) в правой, предполагая, что оба охи сходятся к одной и той же ве.нгнше Оставшиеся вероятности слоев и средний вес вершин можно заменить их финальными (стгнионарными) значениями В результате получаем систему уравнении:
Выражая Ог из (6) в виде
тдк ./. . к-1
</> , к>0. (7)
, к/
молучлгм к\1г;-|гс уриннкнигм
</:>=!,/*</, (8) систему (/). (8) из М I 3 уравнений с М I 3 неизвестными, которая с учетом ограничения ¡ф = 0. когда I < и или />Л/+ 1» достаточно легко решается относительно (/") и всех методом простых итераций В качестве начального приближения рекомендуем орать равномерное РСС Оо = (?\ = - = бкм — 1 >(М 1 2) или финальное РСС оершнп. получаемое при а ~ Э методами, нзложештими в [5,9].
Расчет финального 1ЧХ путем решения системы уравнении ( /), (Ь) методом простых итераций легко реализуется в txccl и на порядки превосходит по скорости и точности возможности имитационного моделирования графов.
10. РСС вершин графа. просеянного в финале
Замечание. Здесь выводятся точные формулы для расчета РСС вершин графа 0(а). получаемого просеиванием любого бесконечного графа G с известным РСС £<&}. к = 0.....М I 1 (А/< со).
Представим число дуг. ннцидеишых эерппшам слоя Ак, в виде к \ Ак — kN.. В результате разметки дуг у любой вершины слоя АК могут оказаться помеченными i инцидентных ей дуг с вероятностью Р t — C¿Cí'(l — С*)* í - 0, .... k. Следовательно, в результате удаления помеченных дуг все Л» верппш слоя At перераспределятся по слоям А^ ..., Ац с вероятностями pt.t, ■■■.ро.п соответственно. В слое осгаиется в среднемpo.iXí вершин. Кроме того, в этот слой придут вершины из слоев Аы, ..А&г* ь н общее число Nk вершин в слое Ах в результате просеивания графа составит в среднем
.'/.i
и .i
w i
С)
= ^ft^i = XCV-41-»)'^ =(1-«У.г' Vrfn/лг,.
.-* t mi i-Ъ
Общее число N верппш о графе останется прежним. Разделив nepDoe и последнее выражения в (9) на Л", по лучим при 2V—* оо:
V
Ók = (I а)'а"УС"а О,-
i—i
где Q, - urpo.iHocib степени А в просеянном 1рафе G(cí)
Л--0_____Ai+ 1,
IV. Результаты экспериментов
IIa рис. 2 хтл тестового графа с НППС с потерями дуг показан график финального РСС. рассчитанного путем точного решения системы (7). (£) численными методами, и графики переходных РСС. сходящихся к финальному. Затравка графа состояла из 7 зерпшн. соединенных е колыго. Весовая функция при 0 < лг< 20 определена в видеЛ = Ск~ 1 ЮУ(А" I 1) и равна нулю при прочих к. Число х дуг прирашения (1 <х < 4) имеет распределение вероятностей (r<>, r>. r*j, Г4) = (0.00L, 0.1, 0.4, 0 2. 0.299), параметр у равен 0.7 (отсюда w = 2.696 и а = г/т «0 739fi) На диаграмму сходимости РСС кру-.тыт.ш маркерами (xfßv&f) добавлено РСС Qt графа <ХПХ
хширый получен просеиванием бесконечною хуафл G. выралленною без ц-лгрь дуг (при тех. же прочил условиях). Результаты расчеш РСС ¿ерифкиирсванэ! и лод.веиждены путям кмтшшоннош моделировании.
02
015
0.1
005
Як
mt=:w Ut= 1000 □ t = infnut;
0 1 2
4 5 € 7 3 9 10 11 12 13 14 15 16 17 18 19 20 21
Рис. 2. Диаграмма сходимости переходных РСС к финальному РСС {C>t}
На рис. 3 представлены результаты расчета фнпальпого РСС верппш графа, выращиваемого при М~ 1000 по JUliiC в трех режимах и имеющего среднюю степень связности вершин (к) = 2.
1£*00 ix d2
11-М IJS-Э* 1js0s 1x-10 1X-12
12-14 1X-16 1X-1S
I К.Л1 I К-Л I ЬМ ix 26 ix 28
Q
Phc. 3. Финальные PCC вершин для трех режимов развития графа
Финальное РСС ;<Ьез потерь £vr:> получено путем выранщвапия графе с JL111JC с w - 1 [приращения имеют фиксированное число дуг х = т = 1). При 100 млн. вершин в графе появляется в среднем 2D0 вершин со степень«)*.— .W+ 1 — 1001 fjNVVHXl CinirHh HTJIIHHH ГДКПШ 1|»1||к« t»T4 IKIlrjlh l lK I-.IKIIXr (к) — 7.ГП — 0.
v ойопгдрнир pf.tvjibtator
Граф с PCC «Без потерь»» на рис. 3. можно интерпретировать как структуру некой «разогретой» экономики, если его верпшны поставить в соответствие субъектам экономической деятельности, а дуги - проектам (регулярным взаимодействиям) пар субъектов. Правило ЛППС. используемое при выращивании графя. вполне соответствует тому, как выбираются партнеры новыми субъектами при их вхождении в систему регулярных экономических взаимодействий. Отсутствие потерь дуг соответствует благоприятному для развития экономики климату. когда все проекты сохраняются в течение длительного времени. Две с опт верили: со степенью связности 1001. появляющиеся в графе с N= 100 млн., соответствуют числу :<локомотнвов экономики» - активных субъектов. вносящих в ее развитие паиэслее значимый вклад.
Финальное 14JC «С потерями дуг», полученное на 1*нс. 3 для режима выращнзання графа с фиксированным числом х = 'л = 2 дуг у приращений н с непрерывной потерей доли а = 0.5 дут. соответствует «холодному экономическому климату», определяемому. в частности, большими налогами. Притюриионги-ьно уье.тнчсннаи активность новых субьсши {jr. -2) обеспечивает такую же. как и в иервим ату чае. среднюю активность узлов (к) = 1т = 2(1- а)т = 2. Но структура выращиваемого графа получается существенно иной. Теперь в графе со IX1 млн. вершин не найдется ни одной, степень связности которой достигала 5ы 100. «Локомотивы экономики» совершенно отсутствуют.
Наконец. финальное PC С «stored» (режим одноразового просеивания дут) получено на Рис. 3 путем разового просеивания доли а = 0.5 дуг у графа с ЛППС. выращенного при х = т = 2 в «теплом экономическом климате». В итоге просеивания получен ]раф с той же средней степенью связное ш вершин (А) - 2. но в трафе со 100 млн. вершин мы получаем около 750 вершин - «локомотивов экономики», степень связности которых находится в щк-делл* си 45(1 до 550 Rh 11<мнгннк|й финальным щннгикинисм it кхлг нгкешцхщ? «iriuioid мгрицди» < (м»р дуг получился тем же ч~о и в режиме непрерывной потери дуг но «структура экономики» после просеивяния
<1К>С«1ЛИ('.К шр-1-ru* жи<нг<1мхт>Гжгй
Аняло-ичные речуль-аткт получаются при грявнении графов степень которых ограничена параметром М- 200, более характерным для сониальных сетей, нежели экономических Пятикратное изменение диапазона степеней вершин не сказывается на качественном соотношении результатов трех разных режимов воздействия на сеть. Это свидетельствует о робастностн (устойчивом характере) закономерностей, выявляемых при моделировании растущих сетей.
Очевидно, подобный анализ различных сценариев воздействия иа сета позволяет получать валаг/ю нпоор мацню для выработки обоснованной политики в отношении разнообразных сетей, играющих важную роль в ллшш осшества (социальных, экономических, пиф ормацпошшх, транспорт:лтх и т.д.).
vi. вшэдь: и заключение
Эксперименты, результаты которых показаны на рис. 2 и 3, подтверждают адекватность и вычислительную эффективность разработанных в статье математических моделей динамики развития растулшх сстсй с НППС и предложенных методов расчета переходных процессов и стационарных характеристик таких сегек. Выявлена быстрая сходимость переходных РСС {<3*0)} к финальным распределснням (О*}. Такая сходимость позволяет
ДМ ¿w. ыхI S3UC 10U0 1ДО
даже прн относительно небольших размерах развивающихся реальных сетей с хорошей точностью решать следующие задачи:
- идентифицировать структурные н динамические характеристики сетей, отражаемые распределениями степеней связности нх узлов:
- строить и калибровать адекватные математические модели сетей:
- разрабатывать аффективные стратегии влияния на растущие сетн с целью содействия нх развитию в желаемом направлении (или. наоборот, с целью противодействия нежелательному ходу нх развития).
Тем самым экспериментально подтверждается практическая значимость полученных результатов, а также важное теоретическое значение развития теории сл.г. с НППС для применения ее в разнообразных прикладных сетевых исследованиях.
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 16-31-60023 моладк.
список литературы
1 Krapivsky P. L.. Redner S_ Organization of growing random networks Ц Phys. Rev. E. 2001. 63. 066123.
2, Barabasi A. L, Albert R. Emergence of scaling ш random networks // Science. 1999. 286, P. 509—SI 2.
3. Barabasi A. L., Albert R. Statistical mechanic? of complex networks I I Rev. Mod. Phys. 2002. 74. P. 47-97.
4 Amaral L. A. N , Scala A.. Bartlielemy M , Stanley H E. Classes of small-world networks // Proc. Natl. Acad Sci. U.S. A. 2000. 97. P. 11149.
5. Задорожный В. H. Случайные графы с нелинейным правилом предпочтительного связывания 7 Проблемы управления. 2011. № 6. С. 2—11
6. Zadorozhiivi V. N.. Ytidin Е. В. Structural properties of the scale-free Вarabasi-Albert graph П Automation and Remote Control. 2012. Vol. 73, no 4. P. 252-261. DOI: 10.1134/S0005117908020070.
7. Zadorozhiivi V., Yiudin E. Growing Network: Nonlinear Extension of the Barabasi-Albert Model H Communications in Computer and Information Science. 2014. V. 487. P. 432—439.
8. Zadorozlmyi V.. Yudm E. Structural Identification of Large Statistically Distributed Vertex Degree U Dynamics of Systems. Mechanisms and Machines (Dynamics), 2014. December, 2014. P. 1-4. DOI: 10.1109 / Dynamics -2014.7005703.
9. Zadorozlmyi V N , Yndm E. B. Growing network: models following nonlinear preferential attachment rule // Physic a A: Statistical Mechanics and its Applications. 2015. V. 428. P 111-132, 2015 DOI: 10.1016/j.physa.2015.01.052.
10. Jin Emily ML, Michelle Girvan Newman M. E. J. Tlie structure of growing social networks // Phys. Rev. E. 2001. 64. 046132.