Научная статья на тему 'Оценка самоподобности телекоммуникационного трафика с помощью вейвлетов'

Оценка самоподобности телекоммуникационного трафика с помощью вейвлетов Текст научной статьи по специальности «Математика»

CC BY
208
75
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Шелухин О. И., Осин А. В., Ахметшин Р. Р.

Рассмотрен методы взвешенной оценки самоподобно стиреального телекоммуникационного трафика с использованием математического аппарата вейвле-функций; приведены результаты вейвлет-анализа экспериментальных измерений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Telecommunication traffic self-similarity estimation by wavelets

Weighted self-similarity estimation technique for real telecommunication traffic by wavelets are considered; wavelet analysis results of the experimental measurements are presented.

Текст научной работы на тему «Оценка самоподобности телекоммуникационного трафика с помощью вейвлетов»

ИНФОРМАЦИОННЫЕ КОМПЛЕКСЫ И СИСТЕМЫ

УДК 621.396

ОЦЕНКА САМОПОДОБНОСТИ ТЕЛЕКОММУНИКАЦИОННОГО ТРАФИКА С ПОМОЩЬЮ ВЕЙВЛЕТОВ

О.И. Шелухин, А.В.Осин, Р.Р. Ахметшин

Рассмотрен методы взвешенной оценки самоподобности реального телекоммуникационного трафика с использованием математического аппарата вейвлет-функций; приведены результаты вейвлет-анализа экспериментальных измерений.

Weighted self-similarity estimation technique for real telecommunication traffic by wavelets are considered; wavelet analysis results of the experimental measurements are presented.

Существует много методов оценки самоподобности телекоммуникационного трафика, такие как И^-анализ, графики изменения дисперсии, периодограммный анализ, оценка Виттла [1]. Оценка самоподобности сводится к определению параметра Херста Н. Для самоподобных процессов 0,5<Н< 1. По определению, самоподобный процесс является сильно коррелированным и проявляет долговременную зависимость (ДВЗ). Свойство долговременной зависимости приводит к смещению оценки и к серьезным трудностям при оценке сходимости. С помощью вейлет-анализа можно избежать этой проблемы, путем правильного выбора скейлинг-функции (и соответствующей вейвлет-функции) [3].

Достоинства вейвлет-анализа обусловлены тем, что сами функции вейвлетного базиса проявляют масштабное свойство и, следовательно, составляют оптимальную «систему координат», на которой можно отследить масштабные явления. Аппарат вейвлет-анализа может быть использован тремя способами, чтобы обеспечить: устойчивое выявление масштабного поведения, идентификацию его типа , а также точное измерение параметров, описывающих это масштабное поведение.

В настоящей работе акцент делается на иллюстрацию возможностей аппарата вейвлетов для анализа ДВЗ и оценки параметра Херста Н для стационарных и стационарно-инкрементных дан-

ных. Такие оценки могут быть использованы в режиме реального времени с малыми вычислительными затратами и требованиями к памяти, а также для накопленных данных в случае анализа не в режиме реального времени. При этом радикально уменьшается объем данных, которые необходимых для анализа.

Задача решается путем разработки алгоритма оценки степени самоподобия потока трафика на основе методов многомасштабного анализа (Multiresolution Analysis - MRA) или вейвлет-анализа.

Вейвлет-анализ выполняется путем разложения последовательной выборки V(t): {v(t0), v(ti),...v(tv_i)} объема n0 = 2Jmax , (n0<N) на функции детализации различного масштаба. Здесь Jmax = [log2N]- максимальное число масштабов разложения; [log2N] - целая часть числа [log2N].

Значение индекса масштаба j=0 соответствует случаю максимального разрешения - самой точной аппроксимации, которая равна исходному ряду V(t), состоящему из n0 отсчетов. С увеличением j (0 < j < Jmax) происходит переход к более грубому разрешению.

Определение [4]. При заданных скейлинг-функции ф и материнском-вейвлете у коэффициенты аппроксимаций и коэффициенты деталей djk дискретного вейвлет-преобразования для процесса X(t) определяются следующим образом:

а1,к: = ] х (і)Ф- к (іуа, —да (1)

ё1 ,к : да = | X(і)^-,к (0<*, (2)

где ф- к := 1 1 сч сч 1 1 (3)

V ,к := 2—1 /2^(2—-і — к). (4)

Функции — и — формируют ортонормиро-ванный базис для У- и Щ соответственно. В результате процессХ(і) имеет следующее представление:

да

Х(і) ^2 ада,кф да,к (і) + к(і). (5)

к -=-да к

В соответствии с положениями вейвлет-анализа известно, что временной ряд У(і) может быть представлен в виде

У (і) = УJ (і) + 2 О- (і):

(6)

1=і

ио/2-7-1

где VJ (Г) = I SJ кФ.1 к ({) -функция начальной

к=0

аппроксимации, соответствующая масштабу J

(^^*Лпах);

8:1к = (у((),д>1/к} - масштабный коэффициент, равный скалярному произведению исходного ряда У(0 и масштабной функции «самого грубого» масштаба J, смещенной на к единиц масштаба вправо от начала координат;

п012-1

(?) = I к (?) - функция детали-

к=0

зации у-го масштаба, ёу ,к = (у(?), у ,к ^ - вейвлет-

коэффициент масштаба у, равный скалярному произведению исходного ряда У(0 и вейвлета масштаба у, смещенного на к единиц масштаба вправо от начала координат.

Согласно конструкции вейвлета [5], материнский вейвлет цг(?) представляет собой полосовой фильтр между частотами а>1 и ®2, которые являются соответственно нижней и верхней отсечками частоты для щ(0. Поэтому коэффициенты деталей у можно рассматривать как процесс на выходе полосового фильтра. Квадрат процесса деталей ё2 к грубо измеряет энергию около момента времени ^ = 2укД и частоты 2"; со0, где А -

принятый единичный интервал времени; а>0 = (®1 + ®2)/2.

Дисперсии процессов деталей ёу на всех масштабах {У7} (когда такие процессы являются стационарными) это характеристики 2-го порядка процесса У, которые определяют вид «вейвлет-спектра».

Справедливо утверждение [6]: если стационарный процесс с конечной дисперсией X, имеет ДВЗ с параметром а, то соответствующие коэффициенты деталей ёу,к обладают следующим свойством:

М

К И

^2 1 о <Ю<2 1 а х| ^ {/2у(Т-і )}ёа =

і

5(а)21 у/(2-а) ёа =

^2 ^ а<|а<2 1 О

:[ і і. і Сі°га)21 к21а)

•>2 1 о <0<2 1 02 I

= 21аСг [

•а

ёа =

10 а 1И0)| ёа =

1 ^а,<Н<®2

= 2 аСгС (а,¥), (7)

где ^{.} - преобразование Фурье; 5(а) ~ С[а\а при а^0 - спектральная плотность мощности случайного самоподобного процесса

Х-;

С

Г

Сг =----- ,

1 2Г(1- а)8Іп(яа/2)

Г() - гамма-функция;

СуС(а,щ) не зависит от переменнойу.

Степенной характер (7) предполагает, что параметр а является крутизной графика

1о§2М|^ё2к] , названного логарифмической диаграммой. Одно из преимуществ вейвлет-анализа состоит в том, что даже когда исходный процесс Ху имеет ДВЗ, его вейвлет-преобразование ёу,к

имеет КВЗ, если число исчезающих моментов N материнских импульсов цг(?) выбрано достаточно большим ^ > а /2).

Определение. Пусть число исчезающих моментов N материнского вейвлета у^) определяется как

|? у Ц) = 0,при к = 0,1,2,3...,N -1. (8)

Тогда, если число исчезающих моментов N^/2, то ёук являются стационарными и больше не проявляют долговременную зависимость, а

■у>

обладают лишь кратковременной зависимостью, т. е. К- к квазидекоррелированы между собой:

а—1—2 N

М

,кК ,1 ,Л

1 ,к

2 -к — 21к1

(9)

Определение показывает, что чем выше N тем меньше корреляция вейвлет-коэффициентов.

Хорошие результаты для анализа дискретных временных рядов дает использование нормированных материнской функции ф(і) и масштабного вейвлета цг(і) Хаара.

Определение. Если \ 1 при :1 < і < 0,

[0 в других случаях

ф(і) =

у/(і) =

при 1 < і < -2,

—1

при

2

< і < 1,

0, в других случаях,

то щ называется ортонормированным вейвлетом Хаара в пространстве Ь2(К), а {¥]:к у,к^2} называется ортонормированной системой в пространстве Ь2(К) (рис. 1).

Рис. 1. Нормированные масштабные функции ф(0 и материнские вейвлеты щ(0 Хаара

Поскольку для вейвлетов Хаара фу,к(0 и Щу,к(0 ортонормированны, то коэффициенты аук и йу,к связаны следующим образом:

а1 к :=

а-—1,2к + а-—1,2 к +1

Л

(10)

,к :=

а-—1,2к а-—1,2к+1

Л

(11)

Разложение может быть выполнено на всем интервале от у = - да до у = да. Однако на практике ограничиваются конечным значением индекса от у = 0 до J, поэтому рассматриваются только подпространства УJ с УJ-1 с... с У0 .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для дискретного во времени процесса Хь / = 0, 1, 2, ... дискретное вейвлет- преобразование может быть осуществлено при помощи быстрого пирамидального алгоритма [8,9]. Для понимания особенностей трафика X, как правило, более интересен процесс деталей йу,к дискретного вейвлет-преобразования.

Рассмотрим следующую непараметрическую несмещенную оценку дисперсии для процесса деталей в октаве у:

М- = :=

пі

=12І1

ю I ■>

(12)

1 к=1

где Пу - число вейвлетных коэффициентов на каждой шкале у; ^ - мера энергии, которая лежит внутри данной ширины полосы 2-у около частоты 2"; Я0; Я0 - произвольная эталонная частота, обусловленная выбором щ0.

Анализ результатов исследований [1], показал, что связь между вейвлет-коэффициентами, полученными при разложении временного ряда по базису вейвлет-функций, и параметром Херста Н определяется из соотношения

( п у Л

ІОБ2 М- ~ 1о§2

—(-, к )|2 м * *

1 к=1

□ (2Н — 1)- + С№ =

= 1о§2

К1 —1

К- 2 К,

1 к=0

= (2Н — 1)- + Сщ , (13)

где Ку = п0/2у - число вейвлет-коэффициентов для масштаба у; С^ =СуС(а,щ) - параметр, не зависящий от масштаба у.

Число вейвлет-коэффициентов уменьшается по мере увеличения масштаба (Ку = 2Ку+1).

Один из способов оценки показателя Херста ДВЗ процессов возможен с помощью (13). Это означает, что если у является ДВЗ с показателем Херста Н, то график зависимости от у, называемый логарифмической диаграммой (ЬБ), должен иметь линейный наклон 2Н - 1. Это говорит о том, что масштабный показатель (2Н - 1) может быть получен из оценки наклона графика функции

и

1

ку -1

у к=0

от у. Поэтому оценку парамет-

ра Херста Н можно получить путем подбора уравнения аппроксимирующей прямой по методу взвешенных наименьших квадратов (ВНК) (рис. 2).

Рис. 2. Графическая интерпретация метода оценки параметра Херста

Логарифм этой переменной будет оценкой для 1о§2 /иу, однако она будет смещена, так как нелинейность логарифма означает, что

М 1о§2(К2) Ф 1og2(Mdj) = ]а + 1о^2 Сш .

Поэтому непосредственно применить линейную регрессию не представляется возможным. Чтобы избавиться от этого, введем член g(j), корректирующий смещение, и определим у у как

Уу = 1оВ2 (у )- g (у) , где gj := у(Пу / 2)/ 1п 2 - ^2 (пу / 2).

В результате задача регрессионного анализа сводится к рассмотрению уравнения Му=у'а+1о82Сж.

Оценка наклона а может быть получена с помощью взвешенной линейной регрессии, в которой Ху = у и а2 = Уаг(уу).

Определение [11]. Пусть задана последовательность независимых переменных (хг,уг), /=1,2, ..., связанных между собой линейной регрессией в виде уравнения Муу=Ьх/+а. Тогда несмещенная взвешенная оценка коэффициентов регрессии (Ь, а) из (Ь,а) задается оценками вида

I У г (Я - 5Х )/а2

Ь = -

Жху -

а =

I Уг (5ХХ $хх1 )/а/

жХ^Х

(14)

где 5=11/а/2; 5х = Iх/а/2; ^хх = Iх2 /а/2 .(15)

а значения 1/а2 называют произвольными весами.

Таким образом, вместо того, чтобы минимизировать сумму квадратов ошибок оценок, предлагается взвешивать каждый член этой суммы, умножая его на величину, обратную дисперсии соответствующей случайной величины. Это придает больший вес тем наблюдениям, ошибки которых оказываются меньше, что кажется вполне разумным. Данная процедура называется взвешенным методом наименьших квадратов.

Минимальная вариация несмещенной оценки достигается, если принять а2 =Уаг(уу).

Таким образом, определяя сначала квантили

5 = I На у2, 5! = I у/а у2, ^ = I у 2/а у2,

j=А у=л у=у1

можно дать взвешенную оценку а для а:

а = -

I

У, № - *1)/а,2

у=л -1 1

у

2

_°1

которая является не смещенной на интервале у у2].

Соответственно для коэффициента справедливо выражение

IУу (52 - -V)/а2

1о§2 СШ =

552 - 52

В предположении слабых корреляций между вейвлет-коэффициентами в случае, когда ёу,к являются гауссовскими, g(j) и а2 могут быть оценены выражениями

g (у ) = г( п,! 2 )/(г(у2)2)-

- 1о§2 ("у/2)' 1

Пу 1п2

а? =

ф, п,12 )п22--------------2

Пу 1п 2

где Г - гамма-функция; Г - производная гамма-

функции; С(2^) = I 0^( + п)2 - обобщенная

зета-функция Римана.

Асимптотически большое пу в формулах, приведенных выше, выполняет хорошую аппроксимацию даже для негауссовских данных:

а

у2

(г Ы

1

(1- 2-)

у=Л

2 2 а7w7--------

] ] п ^

а = у .

Здесь ^ ^ (у1, J ) = 1п2 2 • 21-у х х(1 -(J2 /2 + 2) 2-+ 2-2 ■/ ),

где J=у'г - у"1+1 - ширина диапазона масштабирования.

На основе вышеизложенного предлагается следующий алгоритм оценки параметра Херста для потока трафика (рис. 3).

Шаг 1. Определение начальных значений масштабных коэффициентов '0,к, соответствующих масштабу у = 0, которые равны значениям исходного временного ряда У(0:

1) установить у = 0;

2) So,o=v(to), 50,1 =у(Ь), So,2=v(t2),...,'0,п0-1 =у(Упв-\).

Шаг 2. Переход к масштабу у+1:

1) установить у = у+1;

2) определить значения масштабных и вейвлет-коэффициентов 'у,к, Ку,к на масштабе у с помощью рекуррентных формул

5у,к = 72 ^5'у-1,2к + 5у-1,2к+1 ] ,

,к = 72 ^'у-1,2к - 'у-1,2к +1] ,

где к = 0,1,., к,-1; К = Щ/2.

Шаг 3. Расчет начального момента 2-го по-

рядка m2] ^ вейвлет-коэффициентов масштаба J по

(17)

Рис. З. Алгоритм оценки степени самоподобия на основе вейвлет-анализа

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

формуле

/] =m = m2]) =

'/ K,

k =0

Шаг 4. Проверка условия j<J, где J = log2(n0). Если условие выполняется, то возврат к шагу 2. Если условие не выполняется, то переход к шагу 5.

Шаг 5. Определение уравнения аппроксимирующей прямой по методу ВНК вида

log2(m2j)) = aj + Cw , где j = 1,2,..., J.

Каждой точке по оси ординат, соответствующей значению log2(m2j)), присваивается вес W=Kj.

Шаг 6. Определение точечной оценки параметра Херста H из уравнения 2H-1= а. Окончание расчета.

Рассмотрим численные результаты анализа трассы видеотрафика для фильма «Star wars» (рис. 4). В качестве алгоритма кодирования использовался MPEG-1. Длина трассы составила 40

000 кадров, частота кадров 25 кадров/с. В результате длина исследуемой последовательности приблизительно оценивается как 26 мин 40 с.

Эти данные хорошо известны и являются эталонным тестовым набором, полезным для проверки фрактальности и ДВЗ для видеотрафика. Результаты вейвлет-анализа степени самопо-добности, полученные на примере трассы «Star wars», приведены на рис. 5.

Для каждой оценки Н можно указать диапазон октав, в котором подбиралась линейная регрессия. Эти диапазоны выбраны при помощи визуального анализа логарифмических диаграмм и идентификации линейной области в них. Можно

|й 1уЦу|й

Рис. 4. Трасса видеотрафика для фильма «Star wars»

0

4

4

4

0 1-10 2-10 З-10 4-10

Рис. 5. Вейвлет оценки трассы «Star wars»: а - Н = 0,86;

б - Н = 0,998

наблюдать приблизительно линейный интервал логарифмического графика для октав 5< j <14. Большие значения j не рассматривались из-за ограниченного объема данных, а также потому, что набор вейвлет-коэффициентов при больших уровнях масштабирования содержит лишь несколько значений, которые не обеспечивают устойчивой аппроксимации. (Эти ограничения также учитываются при масштабном анализе других потоков.) Подбор линейной зависимости на этом интервале дает оценку показателя ДВЗ Н = 0,86 ....0,996. Наклон для больших масштабов времени постоянен и показывает, что реальный трафик самоподобен (монофрактален) на больших временных масштабах. Однако на малых масштабах времени наклон значительно изменяется, значит трафик является мультифрак-

тальным процессом. Линейность логарифмических диаграмм для самых грубых октав показывает, что спектральные плотности для трасс проявляют степенной характер вблизи нуля, с показателем а>1, что противоречит предположению о ДВЗ, так как для ДВЗ-процессов а<1. Ниже приведены результаты оценки показателя Херста другими методами:

метод изменения дисперсии - Н = 0,819;

И/8- статистика - Н=0,789; периодограмма - Н=0,993; абсолютные моменты - Н=0,992; вейвлет оценка - Н=0,929; оценка Виттла - Н=0,599.

Видно, что близкие к вейвлет-методу результаты дает периодогораммный метод и метод изменения дисперсии. Наиболее отличающиеся результаты дает оценка Виттла.

Поскольку график выглядит «ломаным», то трасса, скорее всего, не проявляет строгое масштабирование 2-го порядка. Так как видеопоследовательности состоят из различных сцен, то видеокадры, представляющие отдельную сцену, схожи из-за идентичного или подобного фона и объектов, присутствующих в сцене. Это подразумевает, что размеры соседних кадров почти одинаковы, и это свидетельствует о сильной положительной корреляции для малых задержек. Таким образом, монофрактальная вейвлет-оценка часто дает ненадежные результаты, когда используется для процессов с сильной КВЗ- и сильной ДВЗ-составляющей.

Расширением монофрактальной вейвлет-оценки является мультифрактальная оценка. В дополнение ко 2-м моментам (дисперсиям) для вейвлет-коэффциентов эта оценка может учитывать также моменты более высокого порядка

П]

1

^ (Л = - Ё (] )д . (18)

п] к=1

Мультифрактальная оценка оценивает наклон ач, выполняя линейную регрессию для «^(л) при заданном диапазоне ]. Показатель Херста Н вычисляется по выражению

Н = 0,5 + ад /q,

которое аналогично выражению, использующемуся в монофрактальном случае:

Н = 0,5(1 + а), учитывающему порядок момента q.

Априори не известно, какое и на каких масштабах свойство масштабной инвариантности

может существовать, если вообще существует. На практике решение может быть принято при более низких отсечках октав для каждого предполагаемого режима масштабирования. Это решение принимается на основании результатов исследования логарифмической диаграммы при помощи доверительных интервалов. Полезная эвристика состоит в том, что линия регрессии должна ограничить каждый из доверительных интервалов в выбранном диапазоне [ДЛЬ Такой подход может быть нормализован при использовании критерия согласия «хи-квадрат». Масштабные режимы всего лишь в три октавы шириной следует рассматривать только как предположительные, за исключением тех случаев, когда доверительные интервалы очень малы, так как вероятно, что они могут «выстраиваться в линию», даже если и нет масштабирования. Особенно следует обратить внимание на то, что линия регрессии, которая, кажется, хорошо аппроксимирует точки на более низких масштабах, может в действительности быть очень плохой аппроксимацией, как только начинают учитывать известные веса.

Логарифмическая диаграмма, основанная на дискретном вейвлет-преобразовании, может быть реализована при помощи быстрого пирамидального алгоритма банка фильтров с очень низкой вычислительной сложностью порядка О(п), где п - длина временного ряда. Этот алгоритм также имеет преимущества с точки зрения использования памяти при разделении данных на блоки, анализируемые и восстанавливаемые с минимумом вычислительных затрат.

Логарифмическая диаграмма демонстрирует не только ДВЗ, но и статистические характеристики 2-го порядка на каждом масштабе времени. Это свойство вейвлет-анализа может быть использовано для разработки эффективного алгоритма предсказания характера построения очередей.

Изложена методика вейвлет-анализа са-моподобности телекоммуникационного трафика с использованием вейвлета Хаара, позволяющая оценивать показатель Херста. Предложенная оценка использует логарифмическую диаграмму и базируется на методе взвешенных наименьших квадратов. Показан метод и приведено соотношение для оценки мультифрактальных свойств телекоммуникационного трафика. Теоретические положения проиллюстрированы на примере вейвлет-оценки видео трассы «Star wars». Проведен

сравнительный анализ результатов оценки самоподобности с помощью вейвлет-оценки и других, широко распространенных методов оценки. Показано, что вейвлет-анализ хорошо согласуется с большинством из них.

ЛИТЕРАТУРА

1. Шелухин О. И., Тенякшев А. М., Осин. А. В. Фрактальные процессы в телекоммуникациях/Под ред. О. И. Шелухина. - М.: Радиотехника. 2003 .

2. W.E. Leland, M.S. Taqqu, W. Willinger andD.V. Wilson, “On the selfsimilar nature of ethernet traffic,” IEEE/ACM Transactions on Networking, vol. 2, no. 1, pp. 1-15, Feb. 1994.

3. VeitchandD., Abry P., “A wavelet based joint estimator for the parameters of long-range dependence,” IEEE Transactions on Information Theory, vol. 45, no. 3, pp. 878-897, 1999.

4. Riedi R., Crouse M.S., Ribeiro V.J., and Baraniuk R.G., “A multifractal wavelet model withapplication to network traffic,” IEEE Transactions on Information Theory, vol. 45, no. 3, pp. 992-1018, Apr. 1999

5. Abry P. and Veitch D., “Wavelet analysis of long-range-dependent traffic,” IEEE Transactions on Information Theory, vol. 44, no. 1, pp. 2-15, 1998.

6. Abry P., Veitch D., and Flandrin P., “Long range dependence: Revisiting aggregation withw avelets,” Journal of Time Series Analysis, vol. 19, no. 3, pp. 253-266, 1998.

7. Veitchand D., Abry P., “A statistical test for the time constancy of scaling exponents,” IEEE Transactions on Signal Processing, vol. 49, no. 10, pp. 2325-2334, Oct. 2001.

8. Mallat S.G., “A theory for multiresolution signal decomposition: the wavelet representation,” IEEE/ACM Transactions on Pattern Analysis and Machine Intelligence, vol. 11, no. 7, pp. 674-693, July 1989.

9. Vaidyanathan P.P., Multirate Systems and Filter Banks, Prentice-Hall, 1993.

10. Flandrin P., “Wavelet analysis and synthesis of fractional Brownian motion,” IEEE Transactions on Information Theory, vol. 38, no. 2, pp. 910-917, Mar. 1992.

11. Kay S.M., Fundamentals of Statistical Signal Processing, Prentice-Hall, 1993.

Поступила 02. 01. 2006.

i Надоели баннеры? Вы всегда можете отключить рекламу.