Научная статья на тему 'Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи'

Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
174
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЧЕТКАЯ ТЕМПОРАЛЬНАЯ ИНФОРМАЦИЯ / ТЕМПОРАЛЬНЫЕ БАЗЫ ДАННЫХ / ВОЗМОЖНОСТНО-ТЕМПОРАЛЬНЫЕ ОТНОШЕНИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Фомин В. В., Мальцев С. В.

В статье предлагается решение проблем обработки нечетко-темпоральных данных телекоммуникационных сетей, необходимых для выявления и прогнозирования тенденций дальнейшего поведения абонентов. На основе разработанной библиотеки алгоритмов модели обработки нечетко-темпоральных отношений между временными точками и/или интервалами был реализован инструментарий, позволяющий обрабатывать и визуализировать нечетко-темпоральные данные в аналитических системах операторов связи. Представлены результаты внедрения модуля возможностно-темпоральной модели при реализации коммерческого проекта аналитической системы для телекоммуникационной компании.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Solution for processing, storing and visualization of fuzzy temporal data of telecommunication networks for Telecom analytical systems

The article proposes solution for solving problems related to fuzzy temporal data processing of telecommunication networks required to identify and predict trends in future subscriber’s behavior. On the basis of developed library of algorithms for fuzzy temporal relations processing model between time points and/or intervals the specialized toolkit was implemented allowing to process and visualize fuzzy temporal data in analytical systems of operators. Integration results of possibility-temporal module are described during implementation of the commercial project of the analytical system for the telecommunications company.

Текст научной работы на тему «Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи»

Cloud of Science. 2018. T. 5. № 3 http:/ / cloudofscience.ru

Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи

В. В. Фомин, С. В. Мальцев

Российский государственный педагогический университет им. А. И. Герцена 191186, Санкт-Петербург, ул. Набережная реки Мойки, 48

e-mail: [email protected]; [email protected]

Аннотация. В статье предлагается решение проблем обработки нечетко-темпоральных данных телекоммуникационных сетей, необходимых для выявления и прогнозирования тенденций дальнейшего поведения абонентов. На основе разработанной библиотеки алгоритмов модели обработки нечетко-темпоральных отношений между временными точками и/или интервалами был реализован инструментарий, позволяющий обрабатывать и визуализировать нечетко-темпоральные данные в аналитических системах операторов связи. Представлены результаты внедрения модуля возможностно-темпоральной модели при реализации коммерческого проекта аналитической системы для телекоммуникационной компании.

Ключевые слова: нечеткая темпоральная информация, темпоральные базы данных, возможностно-темпоральные отношения.

1. Введение

Стратегия взаимодействия с абонентами, удовлетворение их ожиданий и потребностей, а также предоставление дополнительных услуг являются ключевыми факторами поддержания конкурентоспособности оператора в телекоммуникационной индустрии [1]. Бизнес растет по мере увеличения абонентской базы, уменьшения оттока абонентов, улучшения взаимоотношений с потребителями. В связи с этим важнейшей задачей становится анализ поведения абонентов, определение перспектив возможного развития отношений с абонентами.

OSS/BSS системы операторов связи [2] взаимодействуют с множеством разнородных данных. Это непосредственно абонентская информация, локация и перемещение, данные биллинговых систем, данные о звонках, сообщениях, платежах абонентов. Прогнозирование динамики внесения платежей, определение периодов задолженностей, расчет временных интервалов для персонализированных предложений позволяют выстроить клиенто-ориентированные отношения, направленные на увеличение лояльности и повышение прибыли компании. Однако такие времен-

ные показатели включают элементы нечеткости, хранение и обработка которых требуют специализированного инструментария, позволяющего работать с таким классом задач. Научные и прикладные работы [3, 4], посвященные обработке нечетко-темпоральной информации, показывают ее значимость и актуальность в современных областях исследований. Развитие теоретической базы [5, 6] и реализация прикладных систем хранения и обработки нечетко-темпоральных данных позволит операторам связи и предприятиям других сфер расширить спектр аналитического инструментария и повысить эффективность результатов анализа.

2. Постановка задачи

Инфраструктура оператора связи может включать различное количество систем, используемых для автоматизации управления бизнес-процессами или процессами эксплуатационной поддержки сетей и сетевого оборудования. Статистические показатели результатов работы таких систем обрабатываются ответственными сотрудниками с помощью аналитических инструментов, позволяющих визуализировать отчеты и диаграммы по разнородным данным. Такими данными могут быть классификация брендов, сетей (3G, 4G) и операционных систем, тенденции рынка, типы устройств, профилей и др. Приведенные показатели по своей природе являются историческими данными, которые агрегируются и фиксируются в базах данных оператора в рамках точных временных измерений (например, часа или дня) с использованием темпорального подхода [7]. Однако также существуют показатели, временные характеристики которых имеют элементы неопределенности и неточности. К ним относятся прогнозируемые даты платежей абонентов, платежи прошлых периодов в неточных временных измерениях (например, середина месяца) и др. Практика обработки расчетных операций с абонентами выстроила требования к инструментарию, позволяющему выявлять платежи абонентов прошлых периодов в неточные интервалы времени (начало, середина, конец месяца / до, перед, в), а также анализировать предполагаемые платежи абонентов на следующие расчетные периоды (начало, середина, конец месяца / до, перед, в). Наличие механизмов, обрабатывающих такого рода данные, позволит операторам связи проводить комплексные аналитические мероприятия, направленные как на выявление тенденций в событиях прошлых периодов, так и на прогнозирование дальнейшего возможного поведения абонентов. Для решения данной проблемы была поставлена задача по реализации инструментария, позволяющего хранить, обрабатывать и визуализировать нечетко-темпоральные данные. В рамках поставленной задачи требовалось реализовать механизмы фиксации предполагаемых дат платежей абонентов на основании показателей прошлых периодов, а также визуализации результатов в виде отчетов по запрашиваемым периодам.

Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи

3. Библиотека алгоритмов возможностно-темпоральной модели

Для работы с временной информацией в базах данных применяется темпоральный подход [7], который подразумевает возможность наличия нескольких линий времени, необходимых для учета различных аспектов взаимосвязи времени и данных. Каждая линия времени характеризуется способностью моделировать различные формы темпоральных свойств данных. Линия действительности [8-10] необходима для определения времени истинности фактов в моделируемой реальности. Это могут быть факты событий, к примеру время снятия денежных средств с карты, или факты состояний, к примеру период блокировки карты в течение прошлого месяца. Помимо определения времени действительности фактов, отражающих истинность реального мира, в темпоральных моделях данных также существует другая важная линия времени, называемая линией транзакции [11, 12]. Осведомленность о фактах может быть не получена в масштабе реального времени, например, из-за задержки в обработке информации. Таким образом, может быть разрыв между временем действия факта в реальном мире и временем получения информации о факте. Иногда также необходимо отслеживать период осведомленности о фактах, иными словами, в течение какого периода времени информация о фактах должна храниться. Для этого и предназначены линии транзакции. Существует ряд коммерческих систем управления базами данных, поддерживающих темпоральную модель, например Oracle 12с [13], SQL Server 2016 [14], Teradata [15] и др. Темпоральный язык описания и манипулирования данными указанных СУБД оперирует только четкими темпоральными понятиями. Для работы с нечеткими данными необходим соответствующий язык запросов. Язык FSQL [16] для нечетко-реляционных баз данных ограничен решением задач обработки нечетко-статистических показателей.

Для работы с нечеткой темпоральностью были разработаны алгоритмы обработки нечетких точек и интервалов, введенных в модели хранения и обработки возможностно-темпоральных данных, реализованной посредством библиотеки алгоритмов в реляционной БД [5]. Разработанная библиотека алгоритмов дополняет и расширяет возможности языка SQL для обработки информации на базе реляционных моделей данных в развитии теории темпоральных моделей данных. Библиотека представляет собой пакет, состоящий из набора типов, функций для каждого отношения и функций для специализированных вычислений. Пакет предназначен для определения, фиксации, хранения нечетко-темпоральной информации в базах данных, осуществления операций сравнения и извлечения нечетко-темпоральных данных, определения степени принадлежности (возможности) темпоральной информации в нечетком множестве [6].

Для фиксации результирующих нечетких временных показателей использовались типы возможностных точек и интервалов. Каждый тип имеет строго заданную структуру в соответствии с введенными типами возможностных временных точек и интервалов, изображенных в табл. 1. Тип данных возможностных временных точек (Р0881БББВЛТБ) состоит из набора подтипов, одним из которых, к примеру, является подтип «Значение определено с возможностным отклонением», именуемый

БЛТБ_Ри2.

Таблица 1. Типы возможностных точек и интервалов

Тип данных Тип нечеткости Подтипы

DATE FUZ [pt - a, pt, pt + в, PExtent] —

RANGE FUZ DEF [{ptx, pty}, PExtent] —

DATE NOT DEF [undefined, PExtent] —

POSSIBLEDATE — TYPEID DATE DATE FUZ

RANGE FUZ DEF

DATE NOT DEF

POSSIBLEPERIOD — POSSIBLEDATE

— POSSIBLEDATE

Функции представляют собой нечеткие отношения временных точек и интервалов, сформированные на основе классической темпоральной алгебры Алле-на [17], ее декомпозиции до отношений между двумя точками и/или интервалами, а также новых отношений, введенных при построении модели. Примерами отношений являются PosBefore (перед) и PosAfter (после). Рассмотрим отношения между точной точкой и тремя типами возможностной точки (табл. 2 и 3).

Таблица 2. Возможностное отношение PosBefore

Отношение PosBefore

1. Значение определено неточно Точная дата а и возможностная точка Ь с периодами возможного отклонения наступления а и в

РозБе/оге = • 0, а>Ь_р (1 -(а - Ь _а Ь - Ь _а)/2)х Ь _PExtent _Ш, Ь _а< а < Ь (1 -(а - Ь/Ь _р-Ь)/2)х Ь _PExtent_ N, Ь < а < Ь _р 1, а < Ь _ а

2. Значение в диапазоне не определено Точная дата а и возможностная точка Ь с возможностным диапазоном времени наступления а и в и возможностной степенью = РЕх-tent ТЫ

PosBefore = ■ 0, b_р<a (1 -(a - b _ a/b _ p- b _ a))x b _PExtent _ IN, b _ a< a < b _ p b PExtent IN, a < b a

3. Значение не определено Точная дата а и возможностная точка Ь с неизвестным временем наступления события.

Отношение будет возвращать исходное значение PExtent, которое принимает значение 0

Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи

Таблица 3. Возможностное отношение PosAfter

Отношение РозААег

1. Значение определено неточно Точная дата а и возможностная точка Ь с периодами возможного отклонения наступления а и в

РозЛАег = 0, а < Ь _ а 1 -((Ь_Р-а)/(Ь_р-Ь))/2, Ь <а <Ь_р [1 - (Ь _ р- а)/(Ь _ р- Ь)]/2^1 —^у4 Ь _ а < а < Ь 1, а > Ь _ р

2. Значение в диапазоне не определено Точная дата а и возможностная точка Ь с возможностным диапазоном времени наступления а и в и возможностной степенью = PExtent Ш

РояЛАег = ■ 0 х Ь РБх(еп( 1М, а < Ь а ((а - Ь _ а)/(Ь _ р-Ь _ а))х Ь _ РБх(еп( _ 1М, Ь _ а< а < Ь _ р 1х Ь _ РБх(еп( _ 1М, а > Ь _ р

3. Значение не определено точная дата а и возможностная точка Ь с неизвестным временем наступления события.

Отношение будет возвращать исходное значение PExtent, которое принимает значение 0

Ь_ а а ь_ р

РоБВе/оге (а, Ь) = (Ч - * Ь_РЕхЬепЬ_Ш

1

Ц

0

Рисунок 1. Пример выполнения функции PosBefore

Ь_а а Ь Ь_в

РозЛ^ег (а, Ь) = : ;--:-— . :

V Ь — Ь а)

1

Ц

0

Рисунок 2. Пример выполнения функции PosAfter

4. Модуль аналитики возможностно-темпоральной модели

В рамках поставленной задачи был реализован модуль расчета и фиксации предполагаемых дат оплаты счетов абонентами на сновании показателей прошлых периодов. Аналитика реализована с использованием решения iReport [18], позволяющего разрабатывать специализированные отчеты, а также с использованием веб-приложения JasperServer [19], позволяющего разворачивать разработанные отчеты на веб-сервере Apache Tomcat [20] для их дальнейшей визуализации и использования. Архитектура решения изображена на рис. 3.

¡Report

Источники данных

jfifiEJpTsH "V "г" ¿в7ÍSkdüoh. -• ы>»

IfíÉ

fe

Отчеты

С_^ i

SQL JDBC, JNDI Веб-Приложение Jasper

XQuery, XPath *

PDF, HTML, XML, Ft FT, DOC, XLX, TXT, CSV, etc.

ШШ

lii.Jilli.a

Рисунок 3. Пакет библиотеки алгоритмов

Модель данных источника (SQL источник данных на рис. 3), описывающая связь абонентов и выставленных им счетов и платежей, была дополнена таблицей с воз-можностно-темпоральной структурой данных. Пример зафиксированных возмож-ностных дат платежей абонентов изображен на рис. 4. На рисунке видно, что атрибут PAYMENT_DATE имеет тип POSSIBLEDATE (в соответствии с введенными типами данных в табл. 3). В данном поле фиксируются даты предполагаемых платежей с возможностным типом.

1 ¡) CUSTOMER. ID |ф NAME SURNAME REGION |PAVMEMT_DATE PAVMEMT_VALUE

10001751 Наталья ЕЕДокимоЕа EÜEE [HSV. POSSIBLEDATE] 2940.39

100017E7 Ии:-г.слай Ман:-г.езич EÜEE [HSV. POSSIBLEDATE] 575.51

10001333 Александр Еаш:-г.сз EÜEE [HSV. POSSIBLEDATE] £57.52

ÍOOOISSE Еацетца Кочне в а 5052 [HSV. POSSIBLEDATE] 930.£5

10001337 Дмитрий Еары5ин EÜEE [HSV. POSSIBLEDATE] 712.9

10001S39 Ал-цр Еаланцин EÜEE [HSV. POSSIBLEDATE] E9E.77

Рисунок 4. Пример зафиксированных возможностных дат платежей

Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи

Визуализация представляет собой отчет, предназначенный для выборки платежей абонентов по неточным заданным периодам. К примеру, «платежи после середины мая» или «платежи до начала января». Пользователю предоставляется возможность выбора следующих условий:

- Отношение — выбор из списка (до / после / равен);

- Период — выбор из списка (начало / середина / конец);

- Год — выбор из списка;

- Месяц — выбор из списка;

- Минимальная степень возможности — ввод значения;

- Сумма платежа (не менее) — ввод значения.

Платежи абонентов зафиксированы в БД с точными датами их совершения, а сравниваемая дата является возможностной, которая является настраиваемой и задается в условии запроса. Для данного типа отчета был выбран тип сравниваемой даты как БАТБ_Ри2 (значение определено с возможным отклонением). Тип и значение могут быть изменены в зависимости от поставленной задачи. Используемые отношения сравнения являются функциями пакета библиотеки алгоритмов воз-можностно-темпоральной модели.

Реализованная система аналитики позволяет формировать отчеты по заданным условиям. Визуализация отчетов изображена на рис. 5 и 6.

абонентов за период Data refresh«! 2018-03-30 at 12i02i31

. |£>, О search report Q. т 4f ^

Платежи абонентов la период

Перпод: До . Начало 2016/12 Мин. степень: 0,1

ID платежа □ абонента ПГ.ЙТ^Ж Дата платежа Степень

106 юомгн 590 11.2016-12-07 21 №25] 0.11

261 10000&S4 554.6 |1.2(И6-1М7 22:11:05] 0.11

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

tOOOOSSS S2S52 11.2016-12 07 22:10-24 0.11

247 1000113Q 710 |1.2016-12-07 21:26:24! 0 11

139 10000373 490.32 11.2016-12-07 21 20 10] 0 11

Рисунок 5. Отчет «Платежи абонентов за период»

Operator Logo

Предполагаемые платежи абонентов на следующий расчетный период

Период: До, Середина 2017/12 Мин. степень: 0.1

IDnnatliu DaCOtwxIa Пгчт«я Дата плата СтаГМнь Платеж

6«С 155136 150442 Р20174В-01 18«: 12 2017-01081в*»12,.в] 08 150442

Рисунок 6. Отчет «Предполагаемые платежи абонентов»

На отчетах отображается информация по платежам абонентов с указанием возможностной даты платежа и степенью возможности наступления события. Возможность наступления измеряется степенью, известной как «степень принадлежности» этого элемента к множеству, которое принимает значение в интервале [0, 1]. Степень рассчитывается в соответствии с заданным отношением. К примеру, на

рис. 6 применялось отношение «Перед», сравнивающее возможностную дату платежа абонента a с возможностной датой следующего расчетного периода Ь. Диапазон времени возможного наступления платежа a имеет границы а _ а и а _ р, в то время как период возможного отклонения времени наступления платежа Ь включает Ь _ а и Ь _ р. Для каждого а _ х е А, где А = {а _ а, а _ р}, выполняется следующий расчет степени pos_extent: 0, а _ х > Ь _ р,

pos _ extent = <

^ a x — b a / ^

1 — -=-/2 I x min(a _ PExtent _ IN, b _ PExtent _ IN), b _ a < a _ x < b,

> — b a

a _ x — b

/2 Ixmin(a_PExtent_IN, b_PExtent_IN), b < a_x <b_p,

Ь_ Р-Ь/

а _ PExtend _ Ш, а _ х < Ь _ а. Результирующая степень возможности, с которой точка a находится перед Ь, рассчитывается с помощью среднего значения полученных pos_extent: PosBefore =AVG (pos_extent (a_a),pos_extent ^Р)).

Визуально сравнение двух возможностных временных точек в рамках отношения «Перед» выглядит следующим образом (рис. 7). Функция Ро8Бе1оге (рис. 7) возвращает степень принадлежности, с которой точка a (с типом «значение в диапазоне не определено»), соответствующая значению [3, 2017-03-01 18:49:12, 201703-08 18:49:12, 0.8] находится перед точкой Ь (с типом «значение определено неточно»), соответствующая значению [2, 48:00:00, 2017-12-15 00:00:00, 48:00:00, 1].

" "оТв" //777/7///' / / / / / / / / \ \ \ \ \ \ \ \

а_а = 2017-03-01 а_в = 18:49:12 18 017-03-08 b_a = b = 2017-12-15 bj = 49:12 48:00:00 00:00:00 48:00:00

PosBefore (a, b) = avg(1*0.8,1*0.8) = 0.8 PosBefore (a, b, 0.1) = {0.8, true}

Рисунок 7. Функция «Перед». Типы возможностных временных точек — DATEFUZ и

RANGE FUZ DEF

5. Веб-сервис возможностно-темпоральной модели

Модель хранения и обработки нечетко-темпоральных данных как алгебра отношений возможностных временных точек и/или интервалов была реализована в виде веб-сервиса библиотеки алгоритмов для реляционных баз данных и аналитического модуля отчетности. Веб-сервис построен на базе языка Java и представляет собой интерфейс, вызываемый внешними системами для выполнения отношений воз-

Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи

можностно-темпоральной алгебры. Клиентская сторона подключается к SOAP веб-сервису (endpoint) с использованием определенной XML структуры (wsdl), например http://server:port/msv-ws/services/PosTemporalImpl?wsdl, и вызывает необходимые методы. Веб-сервис представляет собой набор классов, часть которых определяет типы данных возможностно-темпоральной модели, а часть описывает методы, реализующие алгебру отношений. Фрагмент кода реализации отношения «Перед» в виде веб-сервиса с использованием средств языка Java представлен на рис. 8. На фрагменте показан блок выполнения отношения для типа RANGE_FUZ_DEF (см. табл. 1).

if (PosDate_A.getEve^cdaceloDace(}.before^

PosDace_3. getFuzdate () . gecLcirr.eloDace {))) {

> else if (PosDase_&.getlvestdaueToDate(},affcer{ PojDate_3 . getFjzdate () . gecStirr.eToDaue {))

PosDaue_3. geuF'jzdaue (J . gecRcirr.eloDate ())) {

} else if ((PosDate_A.getEventdateToDate().after(

PasDate_3 . getFjzdate () . gecIxirceToDase О ) II PosDac.e_A

PosDace_3. gecFuzdace().gecLuireeloDate(И) a (PasDai;e_A. getEveiitdaueToDese () .fcefoie [FosDai;e_3

Рисунок 8. Фрагмент кода веб-сервиса

Платеж абонента прошлого периода и сравниваемая возможностная дата следующего расчетного периода изображены в табл. 4. Тип точек определен в соответствии с введенными типами возможностных временных точек и интервалов, изображенных в табл. 1.

Таблица 4. Сравниваемые даты платежей

Точка А — дата платежа абонента Точка Б — возможностная дата следующего расчетного периода

[1, 2017-12-12 10:00:12] [2, 00:00:20, 2017-12-12 10:00:10, 00:00:30, 1.0]

Пример выполнения метода «Перед» для двух возможностно-темпоральных точек представлен ниже. Сформирован SOAP запрос, включающий две сравниваемые временные точки с типами 1 и 2. Запрос направляется на сервер, который, в свою очередь, выполняет операцию сравнения в соответствии с реализованной логикой:

<soapenv:Envelope xmlns:soapenv="http://schemas.xmlsoap.org/soap /envelope/" xmlns:ser="http://services.msv.ru"> <soapenv:Header/> <soapenv:Body>

<ser:posBefore> <ser:PosDate_A>

<ser:typeid>1</ser:typeid>

<ser:eventdate>2 017-12-12 10:0 0:12</ser:eventdate>

</ser:PosDate_A> <ser:PosDate_B>

<ser:typeid>2</ser:typeid> <ser:fuzdate>

<ser:eventdate>2 017-12-12 10:0 0:10</ser:eventdate> <ser:ltime>0 0:00:20</ser:ltime> <ser:pextent>1.0</ser:pextent> <ser:rtime>00:00:30</ser:rtime> </ser:fuzdate> </ser:PosDate_B> </ser:posBefore> </soapenv:Body> </soapenv:Envelope>

Степень возможности как результат сравнения возвращается в SOAP ответе в соответствии со структурой xml:

<soapenv:Envelope xmlns:soapenv="http://schemas.xmlsoap.org

/soap/envelope/" xmlns:xsd="http://www.w3.org/2 0 01/XMLSchema" xmlns:xsi="http: //www.w3.org/2001/XMLSchema-instance"> <soapenv:Body>

<posBeforeResponse xmlns="http://services.msv.ru">

<posBeforeReturn>0.47</posBeforeReturn> </posBeforeResponse> </soapenv:Body> </soapenv:Envelope>

Пример вызова SQL-функции PosBefore библиотеки алгоритмов для двух обозначенных точек представлен на рис. 9. В ответе возвращается аналогичный результат степени возможности.

а : = E;SSIELE"-ATE t111, todate ('2017-12-12 10:00 :12', 'уууу-шпиМ hb24:nl:ïï') , Ь:= POSSIBLEDATE{1Z',null,DATE_FITZ{'00 00:20'Fto_date ('2017-12-12 10:00:10',

DBMS_omTUT , EUI_1INE ('FcsEefcre extetit =41 i_nujr.r£ault) ;

Рисунок 9 .Результат выполнения функции PosBefore библиотеки алгоритмов

6. Показатели производительности

Оценка показателей производительности выполнения операций библиотеки алгоритмов проводилась в СУБД Oracle с разными объемами данных. Показателем производительности являлось время выполнения классических SQL операторов сравнения Oracle и отношений возможностно-темпоральной модели. Анализ проводился для всех возможностно-темпоральных отношений. Использованное аппа-

Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи

ратное и программное обеспечение: Intel Core i7-3520M CPU 2.9 GHz, 8 GB RAM, SSD 250GB, OS Linux version 2.6.18-404.el5 CentOS release 5.11, Oracle Database 12.1.0.2.0. Была использована таблица c платежами абонентов за один расчетный период. Пример содержимого таблицы (табл. 5).

Таблица 5. Таблица платежей абонентов за один расчетный период

ID абонента Тип услуги ID услуги ID периода Дата платежа Сумма платежа

13758920 Mobile 030739898 40617053 24-01-2018 19:07:15 1275.12

13918711 Mobile 0013123648 40617073 29-01-2018 19:03:00 17.93

12089807 Mobile 02079783315 40617113 01-01-2018 16:13:21 869.92

11687154 Mobile 1005440023 40617133 09-01-2018 14:50:26 0.09

Таблица наполнялась данными инкрементально после каждого шага тестирования. Время отработки запросов рассчитывалось как среднее значение нескольких выполняемых запросов подряд. Тестирование разделялось на два этапа:

— сравнение показателей выполнения отношений между точными точками с использованием классического оператора сравнения sql и с использованием возможностно-темпорального отношения;

— сравнение показателей выполнения возможностно-темпоральных отношений двух типов: «значение определено с возможным отклонением» и «значение в диапазоне не определено».

Результаты тестирования показали, что производительность отношений двух точных точек с использованием возможностно-темпорального отношения отличаются от результатов классического оператора sql приблизительно на 5-6%. Это то значение времени, которое отношение использует для расчета результирующей степени возможности, а также для его сравнения со значением, поступившим для удовлетворения условия (т. е. время на дополнительные требуемые расчеты). При этом важно учитывать, что с ростом объема данных рост значения процента не наблюдается. Сравнение отношений между возможностными точками проводилось для двух типов возможностно-темпоральной модели. Результаты показали примерно одинаковые значения производительности, независимо от объема тестируемых данных. Пример результатов тестирования точного SQL оператора сравнения и отношения возможностно-темпоральной модели изображен на рис. 10.

~ -__ Кол-во строк Отношение —-___ 10000 20000 JOOOO 40000 S0000 60000 70000 80000 90000 100000

з < Ь 98мс 205мс ЗОбмс 402м с 525МС S3 Оме 781м с 871м с 981МС 1154м с

PosBefore (а,Ь) 105мс 220мс 33 Оме 428м с 570МС бббме 845мс 920мс 1020МС 1199мс

Рисунок 10. Результат тестирования производительности

Важно отметить, что результаты показателей отношений между возможност-ными точками не сравнивались с показателями точных точек ввиду различных областей применения данных подходов, поскольку классические операторы для работы с точными данными не позволяют рассчитывать результирующие возможност-ные степени, которые являются обязательными для нечеткой модели.

7. Заключение

Хранение и представление возможностной темпоральной информации является эффективным инструментарием в системах, где определенный процент неточности в результатах может быть приемлемым для выполнения требуемых технических и бизнес-задач. В настоящей работе предложено решение, позволяющее операторам связи хранить и обрабатывать информацию с использованием нечетко-временных измерений. Разработанный модуль возможностно-темпоральной модели применяется в аналитической деятельности отдела маркетинга оператора связи для выявления тенденций поведения абонентов и прогнозирования дальнейших перспектив построения отношения с ними, в частности оператор анализирует платежи абонентов прошлых периодов в неточные интервалы времени, а также предполагаемые платежи абонентов на следующие расчетные периоды. В целом, разработанная модель хранения и обработки возможностно-темпоральных данных может быть эффективно применена в прикладных областях и технологиях обработки данных.

Литература

[1] Лукашова О. А., Лосев В. С. Стратегия конкурентных преимуществ и обеспечение конкурентоспособности оператора сотовой связи // Креативная экономика. 2012. № 5. С. 110-114.

[2] Гладышев Е. И., Мурыгин А. В. Обзор архитектура современного OSS/BSS решения //

Актуальные проблемы авиации и космонавтики. 2011. № 1. С. 386-3S7

[3] Pons E., Billiet C., Pons Capote O. A possibilistic valid-time model // Advances on Computational Intelligence, 2012. Vol. 297. P. 420-429.

[4] Mahmood N., Burney A., Ahsan K. Generic Temporal and Fuzzy Ontological Framework (GTFOF) for Developing Temporal-Fuzzy Database Model for Managing Patient's Data // Journal of Universal Computer Science. 2012. Vol. 18. No. 2. P. 177-193.

[5] Фомин В. В., Мальцев С. В. Вычислительные процедуры обработки неточной временной информации // Программные продукты и системы. 2016. № 3 (115). С. 29-35.

[6] Flegontov A. V., Fomin V. V., Maltsev S. V. The algorithms for processing of imprecise temporal data // 19th Conference of Open Innovations Association (FRUCT). 2016. P. 37-46.

[7] Kulkarni К., Michels J. Temporal features in SQL:2011 // ACM SIGMOD Record. 2012. Vol. 41. Iss. 3. P. 34-43.

Решение проблемы обработки, фиксации и визуализации нечетко-темпоральных данных телекоммуникационных сетей для аналитических систем операторов связи

[8] Sarda N. L. Extensions to sql for historical databases // IEEE Transactions on. Knowledge and Data Engineering. 1990. Vol. 2. P. 220-230.

[9] Gadia S. K., Yeung C. S. A generalized model for a relational temporal database // SIGMOD Records. 1988. Vol. 17. P. 251-259.

[10] Lorentzos N. A., Kollias V. J. The handling of depth and time intervals in soil-information systems // Computers & Geosciences. 1989. Vol. 15. P. 395-401.

[11] Rowe L. A., Stonebraker M. The Postgres Papers. — University of California at Berkeley. 1987.

[12] Jensen C. S., Mark L., Roussopoulos N. Incremental implementation model for relational databases with transaction time // IEEE Transactions on. Knowledge and Data Engineering. 1991. Vol. 3. P. 461-473.

[13] Gohil J. A., Dolia P. M. Testing Temporal Data Validity in Oracle 12c using Valid Time Temporal Dimension and Queries // Journal of Engineering Computers & Applied Sciences (JECAS). 2015. Vol. 4. No. 4.

[14] Темпоральные таблицы. [Электронный ресурс]. URL: https://docs.microsoft.com/ru-ru/sql/relational-databases/tables/temporal-tables

[15] Al-Kateb, M., Ghazal A., Crolotte A., Bhashyam R., Chimanchode J., Pakala S. P. Temporal query processing in Teradata // Proceedings of the 16th International Conference on Extending Database Technology, 2013. P. 573-578.

[16] Galindo J., Urrutia A., Piattini M. Fuzzy Databases: Modeling, Design and Implementation // Idea Group Publishing. 2006.

[17] Allen J. F. Maintaining Knowledge about Temporal Intervals // Communications of the ACM 1983. Vol. 26. No. 11. P. 832-843.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[18] iReport Designer. The Report Development Tool for JasperReports Server. JasperSoft. [Электронный ресурс]. URL: https://community.jaspersoit.com/project/ireport-designer/resources

[19] JasperReports Server. Self-service Reporting and Analysis Server. JasperSoft. [Электронный ресурс]. URL: https://community.jaspersoft.com/project/jasperreports-server

[20] Apache Tomcat. [Электронный ресурс]. URL: http://tomcat.apache.org/

Авторы:

Владимир Владимирович Фомин — доктор технических наук, профессор кафедры компьютерной инженерии и программотехники, Российский государственный педагогический университет им. А. И. Герцена.

Сергей Викторович Мальцев — аспирант, Российский государственный педагогический университет им. А. И. Герцена.

Cloud of Science. 2018. T. 5. № 3 http:/ / cloudofscience.ru

Solution for processing, storing and visualization of fuzzy temporal data of telecommunication networks for Telecom analytical systems

V. V. Fomin, S. V. Maltsev

Herzen State Pedagogical University of Russia, 191186, St. Petersburg, nab. Reki Moyki 48 e-mail: [email protected], [email protected]

Abstract. The article proposes solution for solving problems related to fuzzy temporal data processing of telecommunication networks required to identify and predict trends in future subscriber's behavior. On the basis of developed library of algorithms for fuzzy temporal relations processing model between time points and/or intervals the specialized toolkit was implemented allowing to process and visualize fuzzy temporal data in analytical systems of operators. Integration results of possibility-temporal module are described during implementation of the commercial project of the analytical system for the telecommunications company. Key words: fuzzy temporal information, temporal databases, temporal relationships.

References

[1] Lukashova O. A., Losev V. S. (2012) Kreativnaya ekonomika, 5:110-114. [In Rus]

[2] Gladyshev E. I., Murygin A. V. (2011) Aktual'nyye problemy aviatsiiikosmonavtiki,7:386-387. [InRus]

[3] Pons E., Billiet C., Pons Capote O. (2012) Advances on Computational Intelligence, 297:420-429.

[4] Mahmood N., Burney A., Ahsan K. (2012) Journal of Universal Computer Science, 18:177-193.

[5] Fomin V. V., Mal'tsev S. V. (2016) Programmnyyeprodukty i sistemy, 3:29-35. [In Rus]

[6] Flegontov A. V., Fomin V. V., Maltsev S. V. (2016) The algorithms for processing of imprecise temporal data. In 19th Conference of Open Innovations Association (FRUCT) (pp. 37-46).

[7] Kulkarni K., Michels J. (2012) ACMSIGMODRecord, 41(3):34-43.

[8] Sarda N. L. (1990) IEEE Trans. on. Knowledge and Data Engineering, 2:220-230.

[9] Gadia S. K., Yeung C. S. (1988) SIGMOD Records, 17: 251-259.

[10] Lorentzos N. A., Kollias V. J. (1989) Computers & Geosciences, 15:395-401.

[11] Rowe L. A., StonebrakerM. (1989) The Postgres Papers. University of California at Berkeley.

[12] Jensen C. S., Mark L., Roussopoulos N. (1991) IEEE Trans. on. Knowledge and Data Engineering, 3:461-473.

[13] Gohil J. A., Dolia P. M. (2015) Journal of Engineering Computers & Applied Sciences, 4(4).

[14] https://docs.microsoft.com/ru-ru/sql/relational-databases/tables/temporal-tables

[15] Al-Kateb, M., Ghazal A., Crolotte A., Bhashyam R., Chimanchode J., Pakala S. P. (2013) Temporal query processing in Teradata. In Proceedings of the 16th International Conference on Extending Database Technology (pp. 573-578).

[16] Galindo J., Urrutia A., Piattini M. (2006) Fuzzy Databases: Modeling, Design and Implementation. Idea Group Publishing.

[17] Allen J. F. (1983) Communications of the ACM, 28(11):832-843

[18] https://community.jaspersoft.com/project/ireport-designer/resources

[19] https://community.jaspersoft.com/project/jasperreports-server

[20] http://tomcat.apache.org/

i Надоели баннеры? Вы всегда можете отключить рекламу.