Библиографический список
1. Народнохозяйственные последствия при-
соединения России к ВТО: доклад национального инвестиционного совета и Российской академии наук. - 2002. - [Электр. ресурс]. - Режим доступа: http://www.tpprf.ru/img/uploaded/
2002081511411592.zip
2. ГОСТРИСО10006-2005. Системы менеджмента качества. Руководство по менеджменту качества при проектировании. - М., 2005.
3. Костров А.В. Основы информационного менеджмента: учеб. для вузов.- 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2008. - 512 с.
4. Яблочников Е.И. Реинжиниринг бизнес-процессов проектирования и производства: учеб. пособие / Е.И. Яблочников, В.И. Молочник, Ю.Н. Фомина.. - СПб. : СПбГУИТМО, 2008. - 152 с.
5. ГОСТ2.103-68. ЕСКД. Стадии разработки. -М., 1971.
6. Стародубов В. Управление конфигурацией: задачи, стандарты и реализация // CAD/CAM/CAE Observer. - 2006. - J№4 (28).- С. 30-33.
7. Теория и методы управления конфигурацией [Электрон. ресурс]. - Режим доступа: http:// www.cals.ru/material/mater/UK.pdf
8. MIL-HDBK-61. Military handbook. Configuration management guidance. - 1997. - 205 p.
УДК 004.735: 007.3
Монахов Юрий Михайлович
кандидат технических наук
Абрамов Константин Германович
Владимирский государственный университет
МОДЕЛИРОВАНИЕ РАСПРОСТРАНЕНИЯ НЕЖЕЛАТЕЛЬНОЙ ИНФОРМАЦИИ В СОЦИАЛЬНЫХ МЕДИА
В данной работе представлены результаты экспериментального исследования распространения нежелательной информации в социальных медиа. Рассматриваются классификации топологий социальных сетей, выявлены параметры для соотнесения топологии реальной сети с одним из классов. Предлагается алгоритм нахождения перколяционного кластера.
Ключевые слова: социальные сети, моделирование, перколяционный кластер, алгоритм.
В настоящее время существуют множество факторов, способствующих появлению массового распространения нежелательной информации в социальных медиа. Задача противодействия этим явлениям крайне актуальна, очень сложна и имеет множество аспектов, одним из которых является моделирование и методы предсказания. Самым простым подходом является использование классических эпидемиологических моделей, разработанных еще в XIX веке для изучения эпидемий инфекционных заболеваний и основанных на системах дифференциальных уравнений. Однако эти модели достаточно примитивны и не учитывают некоторых особенностей процесса. Существующие модели распространения обладают многими недостатками, разработка новых моделей актуальна и необходима для предсказания характера эпидемий и противодействия им.
Из анализа текущего состояния исследований в этой области [1; 3] можно сделать вывод о необходимости уточнения математических моделей распространения нежелательной информации.
Для достижения поставленной цели нужно решить следующие задачи:
- составление набора моделей топологий сетей, предположительно применимых в рамках текущей проблемы;
- получение топологии участка реальной социальной сети;
- выявление классификационных признаков, достаточных для определения типа топологии социальной сети;
- определение модели топологии участка реальной социальной сети;
- получение результатов моделирования на реальной топологии;
- получение аналитического решения для SIR модели с учетом топологии сети;
- определение и проведение анализа перколяционного кластера.
В своих работах исследователи приводят различные классификации сетевых топологий и характерные для них свойства. По одной из классификаций [4], существует три класса сетей «тесного мира»: широкомасштабные сети, одномасш-
© Монахов Ю.М., Абрамов К.Г, 2011
Вестник КГУ им. Н.А. Некрасова ♦ № 3, 2011
15
табные сети и безмасштабные сети. Первый тип характеризуется функцией распределения степеней связности, которая представляет собой смесь степенного закона и экспоненциального распределения. Для графов второго типа характерно резкое распределение, которое означает, что узлы с очень высокой степенью связности отсутствуют. Одним из таких примеров является модель Уоттса-Строгатца. Наконец, безмасштабные сети (SF) строго описываются степенным законом распределения; подразумевается, что вероятность наличия узлов с большой степенью связности достаточно высока. Наиболее популярный пример SF сети - модель Барабаши и Альберт (ВА).
В рамках исследования авторами были получены топологические данные об участке социальной сети Facebook размером 6927 узлов.
Определим признаки, по которым будем классифицировать полученную топологию социальной сети [3]:
- число связей в сети из N узлов - число всех возможных связей между N узлами;
- средняя длина пути I - средняя длина пути между всевозможными парами вершин;
- распределение степеней вершин - зависимость для узла к. вероятности того, что узел будет иметь степень к, от числа вершин, с которыми соединен 1-й узел;
- коэффициент кластеризации определяется как вероятность того, что два узла, связанных с данным узлом, также связаны между собой.
С, = т
Е>
k, (k, -1)’
(і)
где к. - число вершин, с которыми соединен данный узел, Е. - общее число связей, между к. узла-
ми. Общий коэффициент кластеризации для сети из N узлов будет равен С = -1 Z С,.
Наиболее универсальными моделями влияния представляются классические эпидемиологические модели. Необходимо определиться с эпидемиологической моделью, которую мы будем использовать. Наиболее известные математические модели для исследования распространения вредоносного программного обеспечения следующие: модель SI, модель SIR, модель SIS, модель PSIDR, модель AAWP, модель SIM. Каждая из моделей имеет свою специфику, и ни одна из моделей не может претендовать на звание универсальной. В данной работе в качестве исходной модели мы будем использовать SIR модель.
Авторы провели сопоставление функций распределения степеней связности узлов участка рассматриваемой сети и сетей вида «тесный мир» (small world), безмасштабных сетей (scale-free), а также графов Эрдёша-Реньи. Для сетей вида «тесный мир» и графов Эрдёша-Реньи распределение степеней вершин можно аппроксимиро-
вать пуассоновским: p(k)« e
-pN
(PN )
k!
а для
безмасштабных сетей - степенным распределением: р(к)« к '. В рассматриваемой сети 6927 узлов. Из них часть узлов связана с несколькими другими, часть - с единственным узлом. Таким образом, максимальное число связей для одного узла составляет 507, минимальное - 1. Полученный график представлен на рисунке 1 (а, б).
Известно, что для безмасштабных сетей характерно наличие ярко выраженных наиболее свя-
0,2
ОД
^щВОІЧ^ЩИі
тоїn q- щ т
't ■sr =3- ■З- -vT I
Рис. la. Вероятность указанного числа смежных узлов
Рис. 1б. Вероятность указанного числа смежных узлов на отрезке [6, с. 195]
2
16
Вестник КГУ им. Н.А. Некрасова ♦ № 3, 2011
занных узлов и узлов, соединенных лишь с несколькими вершинами. Можно предположить, что рассматриваемая сеть именно безмасштаб-ная. Чтобы проверить это, были рассчитаны вероятности наличия того или иного числа связей для каждого узла.
Результаты анализа показывают, что полученный набор данных возможно с достаточной точностью (Д=0,01) аппроксимировать экспоненциальной функцией. Таким образом, характер распределения степеней связности узлов для участка социальной сети позволяет отнести данную сеть к безмасштабным.
В SF-сетях возможно образование перколяци-онного кластера (большой связной компоненты). В понимании авторов, перколяционный кластер представляет собой совокупность связных между собой узлов с высоким кластерным коэффициентом. Алгоритм поиска кластера состоит из следующих шагов:
1) для всех узлов в сети высчитывается кластерный коэффициент по формуле (1);
2) задается пороговый коэффициент, значение которого должно находиться между максимальным и минимальным значениями коэффициентов в заданной сети;
3) берется узел с наибольшим значением кластерного коэффициента, и от этого узла через его соседей начинаем рекурсивно формировать кластер. В кластер включаются только те узлы, значение кластерного коэффициента которых выше порогового.
Авторами была выдвинута следующая гипотеза. В ходе процесса распространения нежелательной информации в социальной сети скорость распространения будет коррелировать с количеством узлов в перколяционном кластере.
Для подтверждения или опровержения данной гипотезы было проведено имитационное моде-
лирование. Для того чтобы проследить динамику изменения узлов в перколяционном кластере, использовался следующий алгоритм:
1) если в ходе процесса в перколяционном кластере иммунизируется узел, то этот узел «выбрасывается» из сети;
2) пересчитываются кластерные коэффициенты для оставшихся узлов в перколяционном кластере;
3) если у узла из перколяционного кластера коэффициент падает ниже порогового, то данный узел «выбрасывается» из сети.
В настоящее время проводятся эксперименты по выявлению зависимости между количеством узлов в кластере и инфицированных узлов. В результате работы планируется создать аналитическую модель распространения нежелательной информации в социальных медиа. Эта модель позволит повысить устойчивость социальных медиа к распространению нежелательной информации путем недопущения ее дальнейшей передачи ключевыми участниками сетей.
Библиографический список
1. Груздева Л.М., Монахов М.Ю. Алгоритм оптимизации функционирования распределенной системы защиты // Вестник Костромского государственного университета им. Н.А. Некрасова. - 2008. - №>2. - С. 80-82.
2. ЖариновИ.В., КрыловВ.В. Конструирование графов с минимальной средней длиной пути // Вестник Ижевского государственного технического университета. - 2008. - .№4. - С. 164-169.
3. Монахов М.Ю., Груздева Л.М. Алгоритм раннего обнаружения атак на информационные ресурсы АСУП // Автоматизация в промышленности. - 2008. - №3. - С. 12-14.
4. Leveille J. Epidemic Spreading in Technological Networks // M. Sc. Thesis, HP Labs. -Bristol, 2002. - 100 pp.
Вестник КГУ им. Н.А. Некрасова ♦ № 3, 2011
17