Научная статья на тему 'Моделирование распространения нежелательной информации в социальных медиа'

Моделирование распространения нежелательной информации в социальных медиа Текст научной статьи по специальности «Математика»

CC BY
448
114
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СОЦИАЛЬНЫЕ СЕТИ / МОДЕЛИРОВАНИЕ / ПЕРКОЛЯЦИОННЫЙ КЛАСТЕР / АЛГОРИТМ

Аннотация научной статьи по математике, автор научной работы — Монахов Юрий Михайлович, Абрамов Константин Германович

В данной работе представлены результаты экспериментального исследования распространения нежелательной информации в социальных медиа. Рассматриваются классификации топологий социальных сетей, выявлены параметры для соотнесения топологии реальной сети с одним из классов. Предлагается алгоритм нахождения перколяционного кластера.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Modeling the spread of malicious information through social media

This article represents the results of experimental research of spreading of malicious information through social media. Social networks topology classifications are considered, parameters suitable for the identification of topological type of the real network fragment are determined. The algorithm for searching for the percolation cluster is offered.

Текст научной работы на тему «Моделирование распространения нежелательной информации в социальных медиа»

Библиографический список

1. Народнохозяйственные последствия при-

соединения России к ВТО: доклад национального инвестиционного совета и Российской академии наук. - 2002. - [Электр. ресурс]. - Режим доступа: http://www.tpprf.ru/img/uploaded/

2002081511411592.zip

2. ГОСТРИСО10006-2005. Системы менеджмента качества. Руководство по менеджменту качества при проектировании. - М., 2005.

3. Костров А.В. Основы информационного менеджмента: учеб. для вузов.- 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2008. - 512 с.

4. Яблочников Е.И. Реинжиниринг бизнес-процессов проектирования и производства: учеб. пособие / Е.И. Яблочников, В.И. Молочник, Ю.Н. Фомина.. - СПб. : СПбГУИТМО, 2008. - 152 с.

5. ГОСТ2.103-68. ЕСКД. Стадии разработки. -М., 1971.

6. Стародубов В. Управление конфигурацией: задачи, стандарты и реализация // CAD/CAM/CAE Observer. - 2006. - J№4 (28).- С. 30-33.

7. Теория и методы управления конфигурацией [Электрон. ресурс]. - Режим доступа: http:// www.cals.ru/material/mater/UK.pdf

8. MIL-HDBK-61. Military handbook. Configuration management guidance. - 1997. - 205 p.

УДК 004.735: 007.3

Монахов Юрий Михайлович

кандидат технических наук

Абрамов Константин Германович

Владимирский государственный университет

МОДЕЛИРОВАНИЕ РАСПРОСТРАНЕНИЯ НЕЖЕЛАТЕЛЬНОЙ ИНФОРМАЦИИ В СОЦИАЛЬНЫХ МЕДИА

В данной работе представлены результаты экспериментального исследования распространения нежелательной информации в социальных медиа. Рассматриваются классификации топологий социальных сетей, выявлены параметры для соотнесения топологии реальной сети с одним из классов. Предлагается алгоритм нахождения перколяционного кластера.

Ключевые слова: социальные сети, моделирование, перколяционный кластер, алгоритм.

В настоящее время существуют множество факторов, способствующих появлению массового распространения нежелательной информации в социальных медиа. Задача противодействия этим явлениям крайне актуальна, очень сложна и имеет множество аспектов, одним из которых является моделирование и методы предсказания. Самым простым подходом является использование классических эпидемиологических моделей, разработанных еще в XIX веке для изучения эпидемий инфекционных заболеваний и основанных на системах дифференциальных уравнений. Однако эти модели достаточно примитивны и не учитывают некоторых особенностей процесса. Существующие модели распространения обладают многими недостатками, разработка новых моделей актуальна и необходима для предсказания характера эпидемий и противодействия им.

Из анализа текущего состояния исследований в этой области [1; 3] можно сделать вывод о необходимости уточнения математических моделей распространения нежелательной информации.

Для достижения поставленной цели нужно решить следующие задачи:

- составление набора моделей топологий сетей, предположительно применимых в рамках текущей проблемы;

- получение топологии участка реальной социальной сети;

- выявление классификационных признаков, достаточных для определения типа топологии социальной сети;

- определение модели топологии участка реальной социальной сети;

- получение результатов моделирования на реальной топологии;

- получение аналитического решения для SIR модели с учетом топологии сети;

- определение и проведение анализа перколяционного кластера.

В своих работах исследователи приводят различные классификации сетевых топологий и характерные для них свойства. По одной из классификаций [4], существует три класса сетей «тесного мира»: широкомасштабные сети, одномасш-

© Монахов Ю.М., Абрамов К.Г, 2011

Вестник КГУ им. Н.А. Некрасова ♦ № 3, 2011

15

табные сети и безмасштабные сети. Первый тип характеризуется функцией распределения степеней связности, которая представляет собой смесь степенного закона и экспоненциального распределения. Для графов второго типа характерно резкое распределение, которое означает, что узлы с очень высокой степенью связности отсутствуют. Одним из таких примеров является модель Уоттса-Строгатца. Наконец, безмасштабные сети (SF) строго описываются степенным законом распределения; подразумевается, что вероятность наличия узлов с большой степенью связности достаточно высока. Наиболее популярный пример SF сети - модель Барабаши и Альберт (ВА).

В рамках исследования авторами были получены топологические данные об участке социальной сети Facebook размером 6927 узлов.

Определим признаки, по которым будем классифицировать полученную топологию социальной сети [3]:

- число связей в сети из N узлов - число всех возможных связей между N узлами;

- средняя длина пути I - средняя длина пути между всевозможными парами вершин;

- распределение степеней вершин - зависимость для узла к. вероятности того, что узел будет иметь степень к, от числа вершин, с которыми соединен 1-й узел;

- коэффициент кластеризации определяется как вероятность того, что два узла, связанных с данным узлом, также связаны между собой.

С, = т

Е>

k, (k, -1)’

(і)

где к. - число вершин, с которыми соединен данный узел, Е. - общее число связей, между к. узла-

ми. Общий коэффициент кластеризации для сети из N узлов будет равен С = -1 Z С,.

Наиболее универсальными моделями влияния представляются классические эпидемиологические модели. Необходимо определиться с эпидемиологической моделью, которую мы будем использовать. Наиболее известные математические модели для исследования распространения вредоносного программного обеспечения следующие: модель SI, модель SIR, модель SIS, модель PSIDR, модель AAWP, модель SIM. Каждая из моделей имеет свою специфику, и ни одна из моделей не может претендовать на звание универсальной. В данной работе в качестве исходной модели мы будем использовать SIR модель.

Авторы провели сопоставление функций распределения степеней связности узлов участка рассматриваемой сети и сетей вида «тесный мир» (small world), безмасштабных сетей (scale-free), а также графов Эрдёша-Реньи. Для сетей вида «тесный мир» и графов Эрдёша-Реньи распределение степеней вершин можно аппроксимиро-

вать пуассоновским: p(k)« e

-pN

(PN )

k!

а для

безмасштабных сетей - степенным распределением: р(к)« к '. В рассматриваемой сети 6927 узлов. Из них часть узлов связана с несколькими другими, часть - с единственным узлом. Таким образом, максимальное число связей для одного узла составляет 507, минимальное - 1. Полученный график представлен на рисунке 1 (а, б).

Известно, что для безмасштабных сетей характерно наличие ярко выраженных наиболее свя-

0,2

ОД

^щВОІЧ^ЩИі

тоїn q- щ т

't ■sr =3- ■З- -vT I

Рис. la. Вероятность указанного числа смежных узлов

Рис. 1б. Вероятность указанного числа смежных узлов на отрезке [6, с. 195]

2

16

Вестник КГУ им. Н.А. Некрасова ♦ № 3, 2011

занных узлов и узлов, соединенных лишь с несколькими вершинами. Можно предположить, что рассматриваемая сеть именно безмасштаб-ная. Чтобы проверить это, были рассчитаны вероятности наличия того или иного числа связей для каждого узла.

Результаты анализа показывают, что полученный набор данных возможно с достаточной точностью (Д=0,01) аппроксимировать экспоненциальной функцией. Таким образом, характер распределения степеней связности узлов для участка социальной сети позволяет отнести данную сеть к безмасштабным.

В SF-сетях возможно образование перколяци-онного кластера (большой связной компоненты). В понимании авторов, перколяционный кластер представляет собой совокупность связных между собой узлов с высоким кластерным коэффициентом. Алгоритм поиска кластера состоит из следующих шагов:

1) для всех узлов в сети высчитывается кластерный коэффициент по формуле (1);

2) задается пороговый коэффициент, значение которого должно находиться между максимальным и минимальным значениями коэффициентов в заданной сети;

3) берется узел с наибольшим значением кластерного коэффициента, и от этого узла через его соседей начинаем рекурсивно формировать кластер. В кластер включаются только те узлы, значение кластерного коэффициента которых выше порогового.

Авторами была выдвинута следующая гипотеза. В ходе процесса распространения нежелательной информации в социальной сети скорость распространения будет коррелировать с количеством узлов в перколяционном кластере.

Для подтверждения или опровержения данной гипотезы было проведено имитационное моде-

лирование. Для того чтобы проследить динамику изменения узлов в перколяционном кластере, использовался следующий алгоритм:

1) если в ходе процесса в перколяционном кластере иммунизируется узел, то этот узел «выбрасывается» из сети;

2) пересчитываются кластерные коэффициенты для оставшихся узлов в перколяционном кластере;

3) если у узла из перколяционного кластера коэффициент падает ниже порогового, то данный узел «выбрасывается» из сети.

В настоящее время проводятся эксперименты по выявлению зависимости между количеством узлов в кластере и инфицированных узлов. В результате работы планируется создать аналитическую модель распространения нежелательной информации в социальных медиа. Эта модель позволит повысить устойчивость социальных медиа к распространению нежелательной информации путем недопущения ее дальнейшей передачи ключевыми участниками сетей.

Библиографический список

1. Груздева Л.М., Монахов М.Ю. Алгоритм оптимизации функционирования распределенной системы защиты // Вестник Костромского государственного университета им. Н.А. Некрасова. - 2008. - №>2. - С. 80-82.

2. ЖариновИ.В., КрыловВ.В. Конструирование графов с минимальной средней длиной пути // Вестник Ижевского государственного технического университета. - 2008. - .№4. - С. 164-169.

3. Монахов М.Ю., Груздева Л.М. Алгоритм раннего обнаружения атак на информационные ресурсы АСУП // Автоматизация в промышленности. - 2008. - №3. - С. 12-14.

4. Leveille J. Epidemic Spreading in Technological Networks // M. Sc. Thesis, HP Labs. -Bristol, 2002. - 100 pp.

Вестник КГУ им. Н.А. Некрасова ♦ № 3, 2011

17

i Надоели баннеры? Вы всегда можете отключить рекламу.