Научная статья на тему 'Алгоритмы фрактального анализа временных рядов в системах мониторинга сенсорных сетей'

Алгоритмы фрактального анализа временных рядов в системах мониторинга сенсорных сетей Текст научной статьи по специальности «Математика»

CC BY
2180
402
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЕННЫЕ РЯДЫ ДАННЫХ / ФРАКТАЛЬНЫЙ АНАЛИЗ / МЕТОД DFA / КОРРЕЛЯЦИЯ / ФАКТОР ФАНО / ПОКАЗАТЕЛЬ ХЕРСТА / СЕНСОРНАЯ СЕТЬ / ТРАФИК / САМОПОДОБИЕ / ПРОГНОЗИРОВАНИЕ / FANO'S FACTOR / HURST'S INDEX / TIME SERIES OF THE DATA / FRACTAL ANALYSIS / DFA METHOD / CORRELATION / A TOUCH NETWORK / TRAFFIC / SELF-SIMILARITY / FORECASTING

Аннотация научной статьи по математике, автор научной работы — Аксёнов Владислав Юрьевич, Дмитриев Вадим Николаевич

Экспериментально установлено, что временные ряды данных, полученные от датчиков сенсорной сети, обладают фрактальными свойствами (самоподобие, самоаффинность, фрактальная размерность), что даёт возможность прогнозировать их динамику, выявлять скрытые корреляции, циклы и т. п. Алгоритмы фрактально анализа, такие как метод DFA, корреляционный анализ, фактор Фано, показатель Херста, выявили высокий уровень статистической корреляции трафика, проходящего через маршрутизатор сенсорной сети, который принимал данные с датчиков с разной периодичностью опроса на продолжительных временных интервалах. Рассмотренный пример показал высокую персистентность процесса, что, в частности, свидетельствует об общей тенденции к увеличению трафика. Анализ самоподобия трафика каждого сенсора может рассматриваться как технология для осуществления прогнозирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Аксёнов Владислав Юрьевич, Дмитриев Вадим Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHMS OF FRACTAL TIME-SERIES ANALYSIS OF A SENSOR NETWORK

It is experimentally proved that the time series of the data received from sensors of the sensor network possess fractal properties (self-similarity, self-affinity, fractal dimensionality), that gives the chance to predict their dynamics, to reveal the latent correlations, cycles, etc. Algorithms of the fractal analysis, such as DFA method, correlation analysis, Fano's factor, Hurst's index have shown a high level of statistical correlation of the traffic transiting through a router of a sensor network which accepted data from sensors with different periodicity of inquiry on long time slots. The considered example has shown a high persistent process that, in particular, testifies to the general tendency of magnification of the traffic. The analysis of self-similarity of the traffic of each sensor can be used as a technology for forecasting realization.

Текст научной работы на тему «Алгоритмы фрактального анализа временных рядов в системах мониторинга сенсорных сетей»

КОМПЬЮТЕРНОЕ ОБЕСПЕЧЕНИЕ И ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА

УДК 519.246.8:519.254

В. Ю. Аксёнов, В. Н. Дмитриев

АЛГОРИТМЫ ФРАКТАЛЬНОГО АНАЛИЗА ВРЕМЕННЫХ РЯДОВ В СИСТЕМАХ МОНИТОРИНГА СЕНСОРНЫХ СЕТЕЙ

V. Yu. Aksenov, V. N. Dmitriev

ALGORITHMS OF FRACTAL TIME-SERIES ANALYSIS OF A SENSOR NETWORK

Экспериментально установлено, что временные ряды данных, полученные от датчиков сенсорной сети, обладают фрактальными свойствами (самоподобие, самоаффинность, фрактальная размерность), что даёт возможность прогнозировать их динамику, выявлять скрытые корреляции, циклы и т. п. Алгоритмы фрактально анализа, такие как метод DFA, корреляционный анализ, фактор Фано, показатель Херста, выявили высокий уровень статистической корреляции трафика, проходящего через маршрутизатор сенсорной сети, который принимал данные с датчиков с разной периодичностью опроса на продолжительных временных интервалах. Рассмотренный пример показал высокую персистентность процесса, что, в частности, свидетельствует об общей тенденции к увеличению трафика. Анализ самоподобия трафика каждого сенсора может рассматриваться как технология для осуществления прогнозирования.

Ключевые слова: временные ряды данных, фрактальный анализ, метод DFA, корреляция, фактор Фано, показатель Херста, сенсорная сеть, трафик, самоподобие, прогнозирование.

It is experimentally proved that the time series of the data received from sensors of the sensor network possess fractal properties (self-similarity, self-affinity, fractal dimensionality), that gives the chance to predict their dynamics, to reveal the latent correlations, cycles, etc. Algorithms of the fractal analysis, such as DFA method, correlation analysis, Fano’s factor, Hurst's index have shown a high level of statistical correlation of the traffic transiting through a router of a sensor network which accepted data from sensors with different periodicity of inquiry on long time slots. The considered example has shown a high persistent process that, in particular, testifies to the general tendency of magnification of the traffic. The analysis of self-similarity of the traffic of each sensor can be used as a technology for forecasting realization.

Key words: time series of the data, fractal analysis, DFA method, correlation, Fano’s factor,

Hurst's index, a touch network, traffic, self-similarity, forecasting.

Введение

Вид временного ряда - дискретной последовательности отсчетов - имеют сигналы на выходе практически всех современных измерительных устройств, использующих цифровую обработку, в том числе датчики сенсорных сетей и многих других измерительных систем. Экспериментально установлено, что временные ряды данных, полученные при изучении таких систем, обладают фрактальными свойствами (самоподобие, самоаффинность, фрактальная размерность), что даёт возможность прогнозировать их динамику, выявлять скрытые корреляции, циклы и т. п.

В статье описаны основные алгоритмы, применяемые при исследовании фрактальных свойств рядов измерений для систем мониторинга сенсорных сетей передачи данных.

Методы анализа временных рядов

В качестве иллюстраций рассмотрим результаты реальных численных экспериментов в качестве основы для исследования фрактальных свойств рядов, отражающих интенсивность проходящего трафика через маршрутизатор сенсорной сети, который принимал данные с датчиков с разной периодичностью опроса [1]. Анализируется временной ряд из объема трафика за указанный период с определенной дискретностью по времени в сутки (рис. 1).

200

150

100

50

0

«-iLn^mi4'‘Huicriror''Hu"><7ifnr^HLr»<T>i*oN'-t

(N^IN^lN'i ^O^H’^'lOCOHrOtOCOOl^lL/'lOO HHHHlNfNrjlNrOrOrOfO’iiJ'iiJ

Рис. 1. Количество ответов сенсоров (ось ординат) в разрезе дат (ось абсцисс)

Остановимся подробнее на некоторых методах анализа подобного типа временных рядов, порождаемых, в частности, в сенсорных сетях.

Один из универсальных подходов к выявлению самоподобия основывается на методе DFA (Detrended Fluctuation Analysis) - универсальном методе обработки рядов измерений [2].

Метод DFA представляет собой вариант дисперсионного анализа, который позволяет исследовать эффекты продолжительных корреляций в нестационарных рядах. При этом анализируется среднеквадратичная ошибка линейной аппроксимации в зависимости от размера отрезка аппроксимации. В рамках этого метода сначала осуществляется приведение данных к нулевому среднему (вычитание среднего значения (F) из временного ряда F (к), к = 1,2, ... N) и строится случайное блуждание у(к):

Затем ряд значений у (к), к = 1,2,..., N разбивается на перекрывающиеся отрезки длиной п, в пределах каждого из которых методом наименьших квадратов определяется уравнение прямой, аппроксимирующей последовательность у(к). Найденная аппроксимация уп (уп (к) = ак + Ь) рассматривается как локальный тренд. Далее вычисляется среднеквадратичная ошибка линейной аппроксимации О(п) при широком диапазоне значений п:

В случае, когда зависимость О(п) имеет степенной характер О(п) ~ па (наличие линейного участка при двойном логарифмическом масштабе 1пВ ~ а1пп ), можно говорить о существовании скейлинга.

Корреляционный анализ

Если обозначить через Xг- член ряда количества сенсоров, которые передали данные за единицу времени ^ (^ = 1, 2,...,N), то функция автокорреляции для этого ряда Хопределяется формулой

где т - среднее значение ряда Х, которое в дальнейшем, не ограничивая общности, будем считать равным 0 (это достигается переприсвоением значению Х1 значения Х{ — т). Предполагается, что ряд X может содержать скрытую периодическую составляющую.

Известно, что функция автокорреляции обладает тем свойством, что если скрытая периодическая составляющая существует, то ее значение асимптотически приближается к квадрату среднего значения исходного ряда [2].

Если рассматриваемый ряд периодический, т. е. может быть представлен как

Метод DFA

(1)

Xt = -0 + Х 1=1 -m ■ cOs(nw t + Qm ),

то его функция автокорреляции будет равна:

П 2 1

р(к) = -2- + 2X 1=1п™ • С08(и®к)•

Этот результат показывает, что функция автокорреляции периодического ряда также является периодической, содержит основную частоту и гармоники, но без фазовых углов 0т.

Рассмотрим числовой ряд X, являющийся суммой некоторой содержательной составляющей N и синусоидальной сигнала S:

X = Nt + ^ •

Найдем функцию автокорреляции для этого ряда (значения приведены к среднему т = 0):

1 N-1 1 N-к

р(к) = ^ X Хк+Х = ^ X (Nk+t + $к+t)(N. + 8) =

1

Хм1 X

N - к

к+iXt +

1

N - к

к+iSt +

1

N - к

к+iSt +

1

N - к

к+1Xt ■

(2)

Очевидно, первое слагаемое выражения (2) есть функция непериодическая, асимптотически стремящаяся к нулю. Так как взаимная корреляция между N и S отсутствует, то третье

и четвертое слагаемые этого выражения также стремятся к нулю. Таким образом, самый значи-

тельный ненулевой вклад составляет второе слагаемое, представляющее собой автокорреляцию сигнала S, т. е. функция автокорреляции ряда X остается периодической.

Для экспериментального подтверждения рассмотренной гипотезы была сгенерирована последовательность, по своей природе напоминающая реальный поток данных. Предполагалось, что ежедневное количество передаваемого трафика сети растет по экспоненциальному закону (с небольшим значением показателя степени экспоненциальной функции), и на это количество накладываются колебания, связанные с недельной цикличностью в работе сенсоров. Принимается во внимание также некоторый элемент случайности, выраженный соответствующими отклонениями. Для получения соответствующего временного ряда были рассмотрены значения функции

0.001x , • . \

y = ae + sin (— + a),

которая реализует простейшую модель информационного потока - экспонента отвечает за рост количества ответов сенсоров во времени (общая тенденция), синус - за недельную периодичность, параметр - за случайные отклонения. Количество ответов не может быть отрицательным числом. На рис. 2 представлен график модели (ось абсцисс - переменная - день, ось ординат -переменная - объем трафика Мб).

Рис. 2. Модель потока с экспоненциальным ростом

Исходный ряд был обработан: приведен к нулевому среднему и нормирован (каждый член разделен на среднее). После этого были рассчитаны коэффициенты корреляции, которые для рядов измерений X длиной N рассчитываются по формуле

R(k ) =

F (k )

(3)

s

где F(k) - функция автокорреляции; s - дисперсия.

Коэффициент корреляции для ряда наблюдений, соответствующего динамике реального передаваемого трафика, свидетельствует о неизменности корреляционных свойств по дням недели. Вместе с тем коэффициенты корреляции ряда наблюдений, усредненного по неделям, аппроксимируются гиперболической функцией, которая характеризует долгосрочную зависимость членов исходного ряда.

Фактор Фано

Для изучения поведения процессов принято использовать еще один показатель - индекс разброса дисперсии (IDC), так называемый фактор Фано (U. Fano) [3]. Величина фактора Фано F(k) определяется как отношение дисперсии количества событий (в нашем случае - объем передаваемого трафика) на заданном окне наблюдений k к соответствующему математическому ожиданию:

F (k ) =

s2(k )

m(k )

Для самоподобных процессов выполняется соотношение

F (k) = 1 + Ck 2я -1,

(4)

где С и Н - константы.

На рис. 3 приведен пример зависимости значений F(k) от ширины окна наблюдений для С » 22,8 и Н » 0,72 (4).

Рис. 3. Зависимость фактора Фано от ширины окна наблюдений

С увеличением ширины окна наблюдения k IDC практически возрастает в прямой пропорциональной зависимости, что означает самоподобие трафика сенсорной сети.

Показатель Херста

Г. Э. Херст (H. E. Hurst) экспериментально обнаружил, что для многих временных рядов справедливо выражение [4] :

- = (-)Н , (5)

S 2

где Н - показатель Херста; Я - вычисляемый определенным образом «размах» соответствующего временного ряда; S - стандартное отклонение.

Таким образом, показатель Херста определяет коэффициент нормированного размаха Я/5 временного ряда.

Показатель Херста связан с традиционной «клеточной» фрактальной размерностью В простым соотношением [5]:

В = 2 - Н. (6)

Условие, при котором показатель Херста связан с фрактальной «клеточной» размерностью в соответствии с приведенным соотношением (6), сформулировано Е. Федером следующим образом: «... Рассматривают клетки, размеры которых малы по сравнению как с длительностью процесса, так и с диапазоном изменения функции; поэтому соотношение справедливо, когда структура кривой, описывающей фрактальную функцию, исследуется с высоким разрешением, т. е. в локальном пределе» [5]. Еще одним важным условием является самоаффинность функции. Для передаваемого трафика это свойство интерпретируется как самоподобие, возникающее в результате процессов их формирования. При этом временные ряды, построенные на основании мощных тематических информационных потоков, вполне удовлетворяют этому условию. Поэтому, при расчете показателя Херста, фактически определяется и такой показатель тематического передаваемого трафика, как фрактальная размерность.

Известно, что показатель Херста представляет собой меру персистентности - склонности процесса к трендам (в отличие от обычного броуновского движения). Согласно значению Н > 'Л, что направленная в определенную сторону динамика процесса в прошлом, вероятнее всего, повлечет продолжение движения в том же направлении. Если Н < Л, то прогнозируется, что процесс изменит направленность. Н = Л означает неопределенность - броуновское движение. Для изучения фрактальных характеристик тематического передаваемого трафика за определенный период для временных рядов F(п), п = 1, 2,...,N, составленных из количества ответов сенсоров, изучалось значение показателя Херста, которое определялось из соотношения

Я ^ ХН ЛТ 1

— = (—г , N >> 1.

5 2

Здесь 5 - стандартное отклонение:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 =

1 N

- X ^(п) - (F)N )2

NH-1

1 "

(F)N = - X F(п),

1У Н -1

а Я - так называемый размах:

Я( N) = тах^^ X (п, N) - шш^^ (п, Ю,

где

п

X (п, N) = X ^ (г) - ^ )И).

г-1

Исследования фрактальных свойств рядов измерений, получаемых в результате мониторинга трафика сенсорной сети, свидетельствуют о том, что при увеличении п показатель Н принимает значения 0,65; 0,75. Ввиду того, что значение Н намного превышает Л, в этом ряду обнаруживается персистентность (существование долговременных корреляций, которые могут быть связаны с проявлением детерминированного хаоса). Если предположить, что ряд F(n) является локально самоаффинным, то он имеет фрактальную размерность В, равную

В = 2 -Н >> 1,35; 1,25.

Таким образом, исследования передаваемого сенсорами трафика подтверждают предположение о самоподобии и итеративности процессов сенсорной сети.

Заключение

В результате экспериментов было подтверждено наличие высокого уровня статистической корреляции проходящего трафика через маршрутизатор сенсорной сети, который принимал данные с датчиков с разной периодичностью опроса на продолжительных временных интервалах. На основе рассмотренного примера показана высокая персистентность процесса, что, в частности, свидетельствует об общей тенденции к увеличению трафика.

Анализ самоподобия трафика каждого сенсора может рассматриваться как технология для осуществления его прогнозирования.

СПИСОК ЛИТЕРАТУРЫ

1. Аксенов В. Ю., Сорокин А. А., Дмитриев В. Н. Сенсорные сети для линейно расположенных объектов // Инновационные технологии и управлении, образовании, промышленности «АСТИНТЕХ-2010»: материалы Междунар. науч. конф. 11-14 мая 2010 г.: в 3 т. / Астрахань: Изд-во АГУ, 2010. - Т. 1. - С. 87-89.

2. Quantification of scaling exponents and crossover phenomena in nonstationary heartbeat time series /

C.-K. Peng, S. Havlin, H. E. Stanley, A. L. Goldberger // Chaos. - 1995. - Vol. 5. - P. 82.

3. Fano U. Ionization yield of radiations. II. The fluctuations of the number of ions // Phys. Rev. - 1947. - 72. - P. 26-29.

4. Hurst H. E. Long-term storage capacity of reservoirs // Trans. Amer. Soc. Civil Engineers. - 1951. -116. - P. 770-799.

5. Федер Е. Фракталы. - М.: Мир, 1991. - 254 с.

Статья поступила в редакцию 15.12.2011

СВЕДЕНИЯ ОБ АВТОРАХ

Аксёнов Владислав Юрьевич - Астраханский государственный технический университет; аспирант кафедры «Связь»; [email protected].

Aksenov Vladislav Yurievich - Astrakhan State Technical University; Postgraduate Student of the Department "Communication"; [email protected].

Дмитриев Вадим Николаевич - Астраханский государственный технический университет; д-р техн. наук, профессор; зав. кафедрой «Связь»; [email protected].

Dmitriev Vadim Nickolaevich - Astrakhan State Technical University; Doctor of Technical Science, Professor; Head of the Department "Communication"; [email protected].

i Надоели баннеры? Вы всегда можете отключить рекламу.