Проектирование системы определения группы риска аккаунтов, подверженных влиянию квестовой игры суицидального
характера
А.С. Алымов, О С. Крылова (Смирнова)
Аннотация - В статье рассматриваются основные вопросы проектирования системы определения группы риска аккаунтов социальной сети «Вконтакте», попадающих под влияние квестовой игры суицидального характера, направленной на детей и подростков. Для описания архитектуры проектируемой системы выбран язык UML (Unified Modeling Language) -унифицированный язык моделирования, который предназначен для визуализации и документирования объектно-ориентированных систем и бизнес-процессов с ориентацией на их последующую реализацию в виде программного обеспечения. В процессе проектирования разработан ряд UML диаграмм, описывающих систему в целом, ее статические и динамические аспекты, а также особенности функционирования.
Ключевые слова - анализ социальных сетей; пользователи, подверженные влиянию; квестовая игра суицидального характера; группа смерти; синий кит; группа риска; анализ аккаунтов социальной сети; данные пользователя; анализ открытых данных; проектирование системы; UML; унифицированный язык моделирования.
I ВВЕДЕНИЕ
С начала 2017 года в социальной сети «Вконтакте» стали набирать популярность так называемые «группы смерти», целью которых является привлечение детей и подростков к игре-квесту суицидального характера. Пользователь, желающий принять участие в подобной «игре», размещает на своей странице в социальной сети призыв для кураторов так называемых «групп смерти» -людей, инициирующих и организующих процесс доведения до суицида. В качестве призыва может выступать статус «Я жду инструкций», «Я в игре», «Забери меня» или хэштеги #синийкит, #тихийдом и др.
Статья получена 27.11.2017 г.
Исследование выполнено федеральным
государственным бюджетным образовательным учреждением высшего образования «Московский технологический университет» (МИРЭА) за счет гранта Российского фонда фундаментальных исследований (проект №16-37-00492).
А.С. Алымов, МИРЭА (e-mail:
alexey.alymov@gmail. com).
О.С. Крылова (Смирнова), МИРЭА (e-mail: mail.olga.smirnova@yandex.ru).
Пользователям, вступающим в подобные «группы смерти», сперва предлагают заполнить анкету, в которой они указывают: возраст, место рождения, данные о своей семье (количество членов семьи, где работают родители и т.д.), описывают собственные страхи, проблемы и т.п. Таким образом, куратор получает личную информацию, которая в дальнейшем использует в целях манипулирования игроком. Далее участникам выдают задания так называемого «квеста по нарастающей», например, нарисовать кита, потом поцарапать, порезать себя и выложить фотографию увечий в социальную сеть, потом - убить какое-то животное и опять же сфотографировать. Последнее задание - самоубийство [1]. Перестать «играть» дети и подростки часто не решаются из-за угроз куратора вычислить настоящий адрес проживания жертвы через IP-адрес и навредить близким пользователя. По данным СМИ [2 - 4] есть ряд случаев доведения детей и подростков до суицида посредством данной квестовой «игры». В целях противодействия распространению подобных случаев необходимо определение групп риска пользовательских аккаунтов социальной сети «Вконтакте», попадающих под влияние квестовой игры суицидального характера за счет использования специального программного обеспечения.
Автоматизированное выявление в пользовательских профилях совокупности признаков, по которым аккаунт можно классифицировать, как подверженный влиянию игры «Синий кит», может способствовать ограждению детей и подростков от контента данного характера.
Система будет представлять собой клиент-серверное веб-приложение, которое со стороны клиента получает запросы на обработку пользовательских профилей и собирает все необходимые для этого данные аккаунтов посредством API социальной сети «Вконтакте» (интерфейса прикладного программирования -предопределенного создателем набора методов использования ресурса с целью получения результатов его работы для последующего применения во внешних программных продуктах [5]). Далее система анализирует полученные данные с использованием алгоритмов интеллектуального анализа, на предмет наличия ключевых факторов причастности конкретного пользователя к квестовой игре суицидального характера. Изначально алгоритм обучается «с учителем», другими словами, при помощи выборки с указанными
правильными ответами, а затем, на основе сконфигурированной модели, система анализирует ранее незнакомые ей данные. Информация об анализируемых профилях, а также все необходимые для анализа данные, будут храниться на удаленном вебсервере.
Для описания архитектуры проектируемой системы выбран язык UML (Unified Modeling Language) -унифицированный язык моделирования, который предназначен для визуализации и документирования объектно-ориентированных систем и бизнес-процессов с ориентацией на их последующую реализацию в виде программного обеспечения [6]. В процессе проектирования разработан ряд UML диаграмм, описывающих систему в целом, ее статические и динамические аспекты, а также особенности функционирования.
II ДИАГРАММА ВАРИАНТОВ ИСПОЛЬЗОВАНИЯ
Одной из разработанных диаграмм является диаграмма вариантов использования. Диаграмма вариантов использования (Use Case Diagram) представляет собой графическое изображение набора событий по взаимодействию «актера» (оператора и администратора) с проектируемой системой (рисунок 1). При этом реализация самого взаимодействия не определяется. Каждый вариант использования охватывает некоторое предназначение системы, список всех вариантов использования фактически определяет функциональные возможности системы:
- создание / обновление набора данных о пользователе социальной сети;
- проведение анализа;
а) анализ пользовательской активности;
б) анализ пользовательского профиля на причастность к бот-сети;
в) анализ медиаданных;
- автоматизированное добавление (исключение) пользователей в группу риска;
- самостоятельное добавление (исключение) пользователей в группу риска;
- реализация поисковых запросов по имеющимся результатам анализа пользовательских профилей;
- отображение результатов анализа;
- отображение критериев анализа;
- возможность конфигурирования системы.
В центре диаграммы представлен декомпозируемый вариант использования, а вокруг - входящие в него обязательные (include) или расширяющие (extend) составные части. Работа с системой предусматривает разные категории пользователей (актеров), каждая из них задействует только часть функциональных возможностей.
Таким образом, диаграмма вариантов использования раскрывает один из аспектов представления архитектуры системы определения группы риска аккаунтов, подверженных влиянию квестовой игры
суицидального характера в процессе ее проектирования и разработки.
Использование предлагаемой диаграммы вариантов использования при формировании архитектуры системы определения группы риска аккаунтов, подверженных влиянию указанной квестовой игры, позволит учесть ряд особенностей, связанных с вопросами формирования системы и ее состава.
III ДИАГРАММА КООПЕРАЦИИ
Диаграмма кооперации моделирует взаимодействия между объектами или частями в терминах упорядоченных сообщений. Диаграмма кооперации полезна в том случае, когда в системе много взаимодействующих между собой объектов, которые обмениваются информацией, как в рассматриваемом случае (рисунок 2).
Объект «Оператор» инициирует проведение анализа данных интересующего пользовательского профиля для определения, входит ли пользователь в группу риска аккаунтов, попадающих под влияние квестовой игры суицидального характера или нет. Для этого система использует:
- сервер, на котором происходят все логические операции в системе, в том числе анализ пользовательской активности и причастности профиля к бот-сети, а также итоговая классификация аккаунта;
- социальную сеть, из которой запрашиваются все необходимые для анализа данные;
- удаленные модули, позволяющие провести детальный анализ текста, изображений и аудио, видео объектов, а также определить причастность профиля к бот-сети;
- база данных (далее - БД), в которой хранятся все результаты проведенных анализов, а также все используемые пользовательские данные.
Объект «Оператор» посылает запрос на анализ пользовательского профиля, после которого система проверяет наличие результатов анализа данного профиля в БД. Далее сервер, для обновления имеющихся данных или формирования нового набора данных запрашивает всю необходимую для анализа информацию в социальной сети «Вконтакте». После получения всех необходимых данных начинается основной процесс - процесс анализа. Анализ включает в себя анализ пользовательской активности, анализ пользовательского профиля на причастность к бот-сети, а также анализ пользовательских медиаданных (медиаданные - совокупность различных видов данных (помимо текстовых сообщений), содержащих дополнительную звуковую и визуальную информацию — графику, видео, анимацию [7]). С целью проведения анализа текстовых сообщений, изображений, аудио и видео контента формируется запрос к удаленным модулям на детальный анализ данных данного типа, располагающихся на странице пользовательского профиля. На следующем этапе с учетом всех полученных результатов анализа производится
финальная классификация пользовательского профиля, как подверженного или не подверженного влиянию квестовой игры суицидального характера. Далее оператору предоставляется результат анализа в виде сформированных гипотез по финальной классификации пользовательского профиля, где он должен подтвердить или опровергнуть выдвинутые гипотезы, после чего происходит выгрузка данных в БД системы.
Диаграмма кооперации показывает порядок обмена сообщениями между объектами, и в рассматриваемом случае можно заметить, что для увеличения производительности системы необходимо использовать возможность асинхронной работы с запросами на получение данных о пользователе со стороны сервера и удаленных модулей.
IV ДИАГРАММА ДЕЯТЕЛЬНОСТИ
Диаграмма деятельности детализирует особенности алгоритмической и логической реализации операций, выполняемых системой. Данная диаграмма отражает динамику системы и представляет собой схемы потоков управления в системе от действия к действию, а также параллельные действия и альтернативные потоки (рисунок 3).
На данной диаграмме представлены следующие объекты:
- оператор;
- сервер;
- БД;
- удаленные модули.
Деятельность системы начинается с запуска клиента, а именно с действия отправки запроса на анализ пользовательского профиля. После того как в систему введен уникальный идентификатор или ссылка на пользовательский профиль в социальной сети «Вконтакте», система формирует запрос на сервер, для проверки его доступности. Если система получила положительный ответ на свой запрос, то производится проверка БД на наличие набора данных о запрашиваемом пользовательском профиле. Далее, если система нашла ранее использованные для анализа данные профиля, то происходит обновление набора данных о пользователе, если же предыдущего набора данных не было найдено, то формируется новый набор.
Далее происходит непосредственно анализ этих данных, который включает в себя: проверку пользовательского профиля на причастность к бот-сети (т.е. проверку самого профиля на наличие признаков бот-профиля, а также на наличие активности бот-профилей к данному аккаунту, проявляющемуся в списке друзей и подписчиков), анализ поведенческих признаков (периодичность и длительность обращений к социальной сети). Помимо этого, для определения подверженности пользователя квестовой игре суицидального характера, необходимо использовать результаты анализа его текстовых сообщений,
изображений и аудио, видео объектов. Для этого система запрашивает у удаленных модулей результаты детального анализа данных данного типа, располагающихся в открытом доступе на странице пользовательского профиля. Последним этапом анализа является финальная классификация пользовательского профиля, по заранее определенным критериям. После чего оператор оценивает правильность выдвинутых гипотез по финальной классификации
пользовательского профиля и происходит выгрузка всех данных в БД системы.
Данная диаграмма показывает порядок действий объектов системы в процессе выполнения своих задач. Из рисунка 3 видно, что последовательность действий достаточно большая, что может существенно замедлить выполнение анализа. Так как цепочку действий на сервере невозможно сократить, то необходимо минимизировать количество действий пользователя системы, для получения результата анализа. Часто распределенные веб-приложения реализуют частичное построение веб-страниц на стороне сервера с последующей отправкой на клиентскую часть. В данном случае, это приведет к лишним действиям на сервере, поэтому была выбрана технология AJAX, позволяющая осуществлять асинхронные запросы и изменять интерфейс в дальнейшем без перезагрузки страниц.
Рисунок 1 - Диаграмма вариантов использования
Рисунок 2 - Диаграмма кооперации
Рисунок 3 - Диаграмма деятельности
V ДИАГРАММА СОСТОЯНИЙ Диаграмма состояний показывает, как объект, в нашем случае система, переходит из одного состояния в
При начале работы с системой, оператор, на основе имеющегося у него уникального идентификатора пользователя в социальной сети, формирует запрос на проведение анализа пользовательского профиля.
На следующем этапе система переходит в состояние «Получение/обновление данных о пользователе», на котором собираются/обновляются все необходимые для
анализа данные о пользователе через API «Вконтакте» и выполняется проверка данных в БД.
Далее система одновременно пребывает в двух состояниях:
- «Анализа активности пользователя и его характеристик», на котором происходят следующие внутренние действия: анализ профиля на наличие признаков бот-профиля, соотношение реальных пользователей к бот-профилям в списке друзей, подписчиков и авторов сообщений на стене исследуемого аккаунта, а также происходит анализ активности пользователя (определение поведенческих признаков);
- «Анализ медиаданных», на котором система, использует удаленные модули для анализа изображений, текстового и аудио\видео контента.
После данных состояний система переходит в состояние «Финальная классификация пользователя», в котором происходит определение пользовательского профиля, как подверженного или неподверженного влиянию квестовой игры суицидального характера.
Завершающим состоянием является «Составление выводов из полученных результатов», где происходит отображение результатов анализа и оценка пользователем верности получившейся гипотезы с соответствующим выводом в рамках самообучения системы.
Система может подолгу находится в одном из состояний и, благодаря действиям оператора, произвольно переходить в другие состояния. Данный принцип работы системы позволит обеспечить объектно-ориентированная парадигма программирования, которую поддерживает JavaScript и выбранная платформа Node.js.
VI СТРУКТУРНАЯ СХЕМА
Для реализации всех описанных возможностей целесообразно использовать результаты ранее проведенных исследований в следующих направлениях:
- определение тональности текстовых сообщений [8];
- анализ изображений [9, 10], в том числе с определением тематической символики [11];
- анализ аудио, видео объектов [9];
- анализ связей между объектами [9, 12];
- определение бот-программ, имитирующих поведение людей в социальной сети [13];
- определение психоэмоциональных особенностей информационного образа пользователя социальных сетей [14];
- анализ контента социальной сети, соответствующего тематике квестовой игры суицидального характера [15].
Предполагаемая архитектура проектируемой системы определения группы риска аккаунтов, подверженных влиянию квестовой игры суицидального характера, должна (рисунок 5) включать:
- пользовательский интерфейс;
- модуль взаимодействия и сбора данных;
- модуль определения пользовательской активности;
- модуль определения причастности к бот-сети;
- удаленные модули:
другое (рисунок 4).
Рисунок 4 - Диаграмма состояний
а) модуль анализа текстовых сообщений; - база данных.
б) модуль анализа изображений;
в) модуль анализа аудио и видео данных;
Рис. 5 - Структурная схема системы
VII ЗАКЛЮЧЕНИЕ В рамках проектирования системы определения группы риска аккаунтов, подверженных влиянию квестовой игры суицидального характера, разработан ряд UML диаграмм, описывающих систему в целом, ее статические и динамические аспекты, а также особенности функционирования. На основе построения диаграмм вариантов использования, кооперации, деятельности и состояний было описано функциональное назначение системы, определены общие границы и контекст моделируемой предметной области, сформулированы общие требования к проектируемой системе, предложены средства реализации, а также разработана структурная схема системы.
Использование описанной системы обеспечит автоматизированное выявление в пользовательских профилях признаков, характеризующих аккаунты, как подверженные влиянию квестовой игры суицидального характера, что в свою очередь позволит выявлять группу риска пользователей социальной сети «Вконтакте». Несмотря на то, что социальная сеть «Вконтакте» проводит борьбу с «группами смерти» по данным анализа [15] проблема еще остается актуальной. Именно поэтому использование данной системы в дополнение к действиям администрации социальной сети позволит оградить детей и подростков от контента данного характера.
БИБЛИОГРАФИЯ
[1] Как защитить ребенка от «групп смерти». Байкал Инфо. URL: http://baikal-info.ru/kak-zashchitit-rebenka-ot-grupp-smerti (дата обращения: 22.09.2017).
[2] Комсомольская правда. Милкус А. Новые «Группы смерти» в интернете: «Синие киты» провоцируют детей на самоубийства. URL: https://www.irk.kp.ru/daily/26642.7/3660934/ (дата обращения: 22.09.2017).
[3] Новая Газета. Группы смерти (18+). URL:http://novayagazeta.ru/articles/2016/05/16/68604-gruppy-smerti-18 (дата обращения: 22.09.2017).
[4] Первый канал. Осторожно: «Синий кит»! Часть 1. Мужское / Женское. Выпуск от 02.03.2017. URL: https://www.1tv.ru/shows/muzhskoezhenskoe/vypuski/ostoro zhno-siniy-kit-chast-1-muzhskoe-zhenskoe-vypusk-ot-02-03-2017 (дата обращения: 22.09.2017).
[5] API. URL: http://drogin.ru/tag/api/ (дата обращения: 17.10.2017).
[6] Буч Г., Рамбо Д., Якобсон А. Язык UML. Руководство пользователя. 2-е издание. ДМК, 2006, 496 с.
[7] Интернет-ресурс «Словари и энциклопедии на Академике». URL: https://dic. academic. ru/dic. nsf/ruwiki/1030664 (дата обращения: 17.10.2017).
[8] Cмирнова О.С., Шишков В.В. Выбор топологии нейронных сетей и их применение для классификации коротких текстов. International Journal of Open Information Technologies. Том 4, №8, 2016, с. 50 - 54.
[9] Olga Smirnova, Alexey Petrov, Georgy Babiychuk. Common techniques for social network analysis study. Selected Papers of the XI International Scientific-Practical Conference Modern Information Technologies and IT-Education (SITITO 2016), Moscow, Russia, November 2526, 2016, p. 262 - 269. URL: http://ceur-ws.org/Vol-1761/paper34.pdf (дата обращения: 27.10.2017).
[10] Ишин И.А., Смирнова О.С. Технологии анализа изображений в рамках исследования социальных сетей // Российская научная конференция «Интеллектуальные системы в информационном противоборстве». М.: МИРЭА, 22 - 24 ноября 2016 г.
[11] Колесников И.Е., Смирнова О.С. Основные вопросы разработки модуля определения специальной символики на изображениях социальной сети. Проблемы современной науки и образования. 2017. № 24 (106). С. 8 - 12. http://ipi1.ru>images/PDF/2017/106/osnovnye-voprosy.pdf (дата обращения: 27.10.17).
[12] Cмирнова О.С., Шишков В.В. Графовый подход при составлении характеристики социального объекта. International Journal of Open Information Technologies. Том 5, №6, 2017, с. 12 - 15.
[13] Смирнова О.С., Алымов А.С., Баранюк В.В. Детектирование бот-программ, имитирующих поведение людей в социальной сети «Вконтакте». International Journal of Open Information Technologies. Том 4, №8, 2016, с. 55 - 60.
[14] Смирнова О.С., Баранюк В.В., Десяткова А.Д. Подходы к определению психоэмоциональных особенностей информационного образа пользователя социальных сетей. International Journal of Open Information Technologies. Том 4, №8, 2016, с. 61 - 65.
[15] Петров А.И., Cмирнова О.С., Чумак Б.Б. Анализ контента социальной сети на примере квестовой игры суицидального характера, направленной на детей и подростков. International Journal of Open Information Technologies. Том 5, №6, 2017, с. 16 - 19.
Designing a system for determining the risk group of accounts that are affected by a suicidal
quest game
A.S. Alymov, O.S. Krylova (Smirnova)
Annotation - The article considers the main issues of designing a system for determining the risk group of accounts of the social network Vkontakte, that fall under the influence of a suicidal quest aimed at children and adolescents. To describe the architecture of projecting system used UML (Unified Modeling Language). It is a unified modeling language that is designed for visualization and documentation of object-oriented systems and business processes with an orientation to their subsequent implementation in the form of software. During the design process, a series of UML diagrams describing the system as a whole, its static and dynamic aspects, as well as the features of the functioning have been developed.
Keywords - analysis of social networks; users who are affected; quest game of a suicidal nature; group of death; blue whale; risk group; analysis of social network accounts; user data; analysis of open data; system design; UML; unified modeling language.