УДК 693.548
Моделирование телекоммуникационного трафика с использованием мультифрактальной вейвлет-модели
Р.Р. Ахметшин, А.В. Арсеньев, А.Е. Перегняк
Рассмотрены методы анализа и имитационного моделирования трафика с использованием мультифрактальной вейвлет-модели; показано преимущество модели F-ARIMA совместно с моделью MWM перед другими моделями синтеза трафика при описании и моделировании мультифрактальных свойств телекоммуникационного трафика.
Analysis and simulation modelling methods about traffics with usage multifractal wavelet models are considered; advantage of a choice of model F-ARIMA together with model MWM in comparison with other models of synthesis of the traffic is shown at the description and modelling multifractal properties of the telecommunication traffic.
Постановка задачи
Для описания мультифрактальных свойств сетевого трафика в работах [1,2] были предложены математические модели на основе вейвлетов — WIG (гауссовская) и MWM (мультифрактальная). Эти модели предназначены для моделирования как долговременной (ДВЗ) так и кратковременной зависимости (КВЗ) в трафике данных.
Целесообразно проверить опытные трассы сетевого трафика на мультифрактальность и исследовать их поведение с помощью мультивейв-летной модели (MWM). Если смоделированный мультифрактальный трафик ведет себя аналогично реальному, то используемые параметры реального трафика достаточны для моделирования. Если по-разному, то необходимо уточнить параметры модели MWM.
Целью работы является анализ результатов моделирования мультифрактальных свойств телекоммуникационного трафика на основе использования MWM.
Моделирование ДВЗ-трафика с помощью вейвлетов
В основе моделирования ДВЗ-трафика с помощью вейвлетов лежит алгоритм синтеза самоподобных потоков трафика методом обратного дискретного вейвлет-преобразования (ОДВП). Он состоит в формировании с помощью масштабных и вейвлет-коэффициентов дискретного временного ряда X(t): {x(t0), x(ti),...,x(tN_i)} объема n0=2/max, (n0<N), при использовании функции детализации различного масштаба на основе сдвинутых и расширенных вариантов прототипа полосовой вейв-лет-функции и сдвинутых вариантов низкочастотной скейлинг-функции. Здесь /max=[log2N]- максимальное число масштабов разложения; [log2N] -
целая часть числа Значение индекса мас-
штаба 1 = 0 соответствует случаю максимального разрешения - самой точной аппроксимации, которая равна исходному ряду Х(0, состоящему из п0 отсчетов. С увеличением j (0 < j < ^тах) происходит переход к более грубому разрешению.
Для выбора конкретного разложения скей-линг <р}-к = 2-1 /2<((2~Ч — к) и вейвлет-функции
у/]- к = 2—1 /2^(2—Ч — к); 1,к е 2, образуют орто-
нормированный базис и представление временного ряда Х(0 получается в виде
X(t) = (t) + D, (t).
(1)
Здесь Xj (t)= 2 wJ Л ,k (t ) функция на-
k=0
чальнои аппроксимации, соответствующая масштабу J (J < Jmax),
где
да
Wj,k = ( X (t\Vj,k) = \ X (t VM (t t)dt
веивлет-
коэффициент масштаба 1, равный скалярному произведению исходного ряда Х(0 и материнского вейвлета масштаба 1, смещенного на к единиц масштаба вправо от начала координат;
о, (< )=2
п„/21 -1
:(t) - функция дета-
лизации
к=0 и1,к^1,к 1-го масштаба UJ л = {х (t ^ =
да
= | X([)ф1 к (1 ^ - скейлинг-коэффициент, равный
— да
скалярному произведению исходного ряда Х(0 и скейлинг-функции «самого грубого» масштаба J, смещенной на к единиц масштаба вправо от начала координат.
Ил /2J -1
Для моделирования сигналов с негауссовским распределением (к которым относится телекоммуникационный трафик с использованием вейвлет-преобразования, необходимо наложить ограничения на значения скейлинг- и вейвлет-коэф-фициентов, чтобы Х(У) в (1) была неотрицательной. Так как скейлинг-коэффициенты м/,к отражают локальное среднее значение сигнала при различных масштабах и сдвигах, они являются неотрицательными, если и только если сам сигнал является отрицательным; т.е., поскольку Х(У) > 0, то и щк > 0, У/, к . Это условие непосредственно приводит к ограничениям на вейвлет-коэф-фициенты. Например, для вейвлетов Хаара для скейлинг- и вейвлет-коэффициентов справедливы равенства[2]
= 2~1/2К-и + ^-1,k )
lj,2k
j-1,k 1 " j-1k'
= 2-1/2(u;-i,k -w,u)
1 j,2k+1
(2)
что соответствует смещению на один уровень масштаба за один шаг.
Совмещая (2) с условием м/,к > 0, получаем условие Х(0 > 0,откуда следует, что
Wm < j
у/, k.
(3)
wj,k = aj,kuj,k
(4)
где а/к — случайная переменная на интервале [-1;1]-'
Для реализации (4) на масштабе / генерируем коэффициент (а,к) в интервале [-1,1] с симметричным бета-распределением
Р
- 0,5,-1
-0,5
2^2
2^2
, а затем формируем вейвлет-
коэффициент как произведение Wjk = ajkx xujk; на масштабе j+1 формируем скейлинг-коэффициенты
ajk G Р
1 - 0,5, 1
-0,5
2о 2
2<г 2
Тогда с помощью a
j,k
скейлинг-коэффициенты могут быть определены из системы уравнений следующим образом:
u
= 2-1/2(1 + a,u )u
j,2k
j-1,k j-1,k
u
= 2 -1/2(1 - al -,k )Uj -1
j,2k
(5)
j-1,k j-1,k
Мультифрактальная вейвлет-модель
Из вышеизложенного вытекает основной вейвлет-подход для моделирования негауссовского ДВЗ сетевого трафика. Как и в случае WIG, для того чтобы охватить и кратковременные и долговременные корреляции, будем описывать затухание дисперсии вейвлета Хаара как функцию масштаба. В отличие от WIG, для того чтобы гарантировать неотрицательность выходных значений модели, необходимо накладывать условие (3).
В частности, ограничения положительности (3) на коэффициенты вейвлета Хаара предполагают очень простую многомасштабную, мультипликативную модель процесса для положительно-значных процессов. Для мультифрактальной вейв-лет-модели вейвлет-коэффициенты рекурсивно вычисляются как
Наложим некоторые дополнительные ограничения на а/к:
1) множители а/к независимые, одинаково распределенные случайные числа а(/) е [-1,1];
2) значения а/к симметричны относительно 0;
3) величина а/к является независимой и для самого грубого масштабного коэффициента м0,0, и для коэффициента а/к на более детальных масштабах (это предположение является упрощающим; кроме того, на начальном этапе построения модели используется среднее значение реального сигнала для вычисления всех коэффициентов и самих точек данных); когда Х(У) сгенерируется искусственно, нужно гарантировать, чтобы выходные значения являлись неотрицательными.
Из (5) видно, что положительные м/к могут быть сгенерированы, если коэффициенты а/к выбираются из распределения в интервале [-1;1]. Для выбора коэффициента а/к использовано симметричное бета-распределение с плотностью распределения вероятностей вида
Щ x
(x ) =
xa-1 (1 - x Г
0 < x < 1.
В(а, Ъ) '
где В(а, Ъ) = Г(а )г(ъ)/г(а + Ъ)- бета-функция.
В итоге алгоритм МWМ формулируется следующим образом.
Пусть V (t) — опытная трасса, из которой генерируется искусственная трасса 1(У). Шаг 1. При выполнении вейвлет-преобразова-
ния для V(у) определяются м]к и Шаг 2 . Из оцененных м/к и оценивают дисперсию о/ для А/,к на каждом разрешении /
Шаг 3 . Принимаем/ = 0 и = М[|V(у)].
Шаг 4. На разрешении 1 генерируем случайные множители (а1>к) е [-1;1] из симметричного бета-распределения с параметром Р1 — 0,5 .
Шаг 5 . На разрешении 1 используются и1к и а1,к в (5) для вычисления и1+\,2к и и1+1,2к+1.
Шаг 6 . Шаги 4 и 5 повторяются с заменой 1 на 1 + 1 до тех пор, пока не будет достигнуто самое детальное разрешение 1 = J.
Рассмотрим результаты имитационного моделирования, полученные с помощью разработанного в [2] пакета прикладных программ MsynTraff с использованием алгоритма MWM.
Описание программы MsynTraff
MsynTraff — визуальная интерактивная программная среда, предназначенная для синтеза и анализа сетевого трафика, которая обеспечивает синтез моделей MWM из опытного трафика. На рис. 1 показан главный интерфейс MsynTraff, содержащий три блока ввода данных, реализующих три главные функции программы. Главный верхний блок обеспечивает синтез и анализ мультиф-рактальной вейвлет-модели опытной трассы трафика. Блоки ввода данных позволяют осуществить ввод имени файла опытного трафика для последующего анализа файла и имени выходного файла для размещения результатов анализа. При создании модели MWM пользователь может выбрать результат в виде анализа характеристики вейвлета или в виде сравнительных характеристик двух моделей. Программа производит построение шести характерных диаграмм: среднего значения коэффициентов масштабирования, дисперсии коэффициентов масштабирования, среднего значения вейвлет-коэффициентов, дисперсии вейвлет-коэффициентов, среднего значения нормализованных коэффициентов а^ и дисперсии нормализованных коэффициентов а,^.
Для построения диаграммы анализа каждой модели пользователь должен ввести имя файла в блок ввода «Проанализировать» и нажать на кнопку «Нарисовать». Для построения сравнительных диаграмм характеристик пользователь должен ввести два имени файла в соответствующие блоки
Рис. 1. Главный интерфейс МзуЩгаТ
ввода «Проанализировать» и «Имя проанализированного файла».
Центральный блок комплекса позволяет генерировать мультифрактальные трассы трафика, основанные на файлах, которые получены в результате анализа экспериментальных данных. Независимо от выбранной методики, пользователь должен указать название файла анализа MWM, произведенного комплексом, и имя файла для трафика, получаемого в результате обработки. В зависимости от выбранной методики пользователь может изменить дополнительные необязательные параметры. В частности, кнопка FARIMA позволяет пользователю изменять значения параметров Херста и дисперсионности. После определения параметров пользователь нажимает на кнопку «Синтез», чтобы получить синтезированный трафик. Нижний блок ввода данных позволяет задать параметры анализа и построения графиков стати-
стических свойств синтезируемых или опытных трасс трафика (по умолчанию должны быть заданы всех параметры: профиль трассы, автокорреляция, R/S статистика, дисперсия, маргинальное распределение).
Типичные результаты анализа, выполненного программой MsynTraff над опытной трассой Bellcore [3], показаны в таблице. Анализ включает в себя вычисление коэффициентов масштабирования Ujk, вейвлет-коэффициентов Wjk и отношение ajk вейвлет-коэффициентов к коэффициентам масштабирования (нормализованные коэффициенты вейвлета), а также среднего значения и дисперсии вышеупомянутых трех наборов коэффициентов. (Напомним, что индекс j относится к уровню масштабирования, а k — к смещению вейвлета.)
Как видно из самого правого столбца таблицы, с улучшением разрешающей способности (большие значения j) разброс коэффициентов ajk возрастает, а это означает, что опытная трасса при рассмотрении обладает большей импульсивностью на малых масштабах времени по сравнению с более крупными масштабами.
На рис. 2 представлены графики зависимостей всех шести столбцов таблицы.
Из рис. 2,е можно констатировать, что изменение нормализованных коэффициентов вейвлета, вычисленных в нескольких масштабах времени, отражает относительные пульсации трафика на Таблица. Численные значения вейвлет-коэффициентов экспер
соответствующих масштабах времени и что MWM может фиксировать мультифрактальные характеристики опытного потока трафика.
Сравнительный анализ поведения вейвлетов синтезируемых потоков трафика в сравнении с опытным трафиком представлен на рис. 3. Из этого рисунка видно, что на малых масштабах времени поведение вейвлета всех синтезированных трасс, сгенерированных с использованием различных методик с крупным шагом, относительно точно повторяет поведение опытной трассы.
Однако только FARIMA+MWM и трассы Gaussian+MWM сохраняют эту тенденцию на более грубых масштабах времени. Поведение синтезированной реализации FARIMA+MWM ближе всех к опытной трассе на малых масштабах времени, а Gaussian + MWM ближе к опытной на более грубых масштабах времени.
Сравнение профиля этих синтезированных трасс с опытной трассой показало, что только FARIMA+MWM подобен опытному трафику на всех рассмотренных масштабах времени. Сравнение распределений всех синтезированных трасс показывает их хорошее совпадение с распределением опытной трассы. Рис. 4 иллюстрирует профиль FARIMA+MWM и опытной трассы, в то время как рис. 5 иллюстрирует распределение этих трасс.
[ентального трафика, полученные с помощью MsynTraff
j Среднее значение u,-,k Дисперсия Ujk Среднее значение wj,k Дисперсия Wj,k Среднее значение ajk Дисперсия ajk
0 22795,012 0,0 286,931 0,0 0,012587 0,0
1 16118,507 82336,0 —186,189 1063062,6 —0,010984 0,004067
2 11397,506 404906,7 —735,759 432868,1 —0,066925 0,003752
3 8059,253 668388,6 —72,024 124744,9 —0,007568 0,001995
4 5698,753 372896,0 —206,258 200457,0 —0,041114 0,007613
5 4029,627 299384,8 4,495 112314,0 —0,001937 0,008712
6 2849,376 202593,5 26,986 85230,5 0,010109 0,014463
7 1730,001 143145,6 14,224 64806,9 0,003862 0,017134
8 1424,689 103668,7 —6,010 46399,3 —0,000701 0,022449
9 1007,406 74906,8 —0,681 30244,9 0,000682 0,032512
10 712,344 52524,4 3,675 18917,9 0,004652 0,043445
11 503,703 35710,5 —0,276 10441,1 —0,003329 0,046945
12 356,173 23069,3 1,415 7023,8 0,002735 0,074052
13 251,852 15046,2 —1,479 5098,3 —0,004716 0,141899
14 178,089 10071,7 0,216 4250,1 0,005902 0,212013
15 125,927 7160,9 —4,984 5795,8 —0,038821 0,343183
16 89,046 6490,1 —0,858 4333,0 —0,010551 0,395641
17 62,969 5411,1 - - - -
Рис. 2. Характеристики трафика трассы Bellcore: а - среднее значение коэффициентов масштабирования ujk; б — дисперсия коэффициента масштабирования ujk ; в — среднее значение коэффициента вейвлета wjk; г — дисперсия коэффициента вейвлета Wjk; д — среднее значение нормализованного коэффициента ajk; е — дисперсия нормализованного коэффициента ajk
а)
б)
_в)_
Рис. 3. Сравнение поведения коэффициентов вейвлета а/к опытной и искусственных трасс: а — Gaussian+MWM; б — FARIMA+MWM; с — Sprinkle+MWM к Cascades+MWM
3,5 -10
3,0 -104 2,5-104 2-104 1,5 -10 1-10 0,5 -10
п4
N, байт 20-103 18-103
16-103 14-103
12-103
10-10
8-10:
6 -10:
4-103
2-103
0 2-103 4-103 6-103 8-103 10-103 12-103 14-103
2-103 4-103 6-103 8-103 10-103 12-103 14-10
N, байт 30-103
25-103
20-103
15-103
10-10
5-103
N, байт 12-103
10-10; 8-103 6-103 4-103 2-103
0 2-103 4-103 6-103 8-103 10-103 12-103 14-103
0 2-103 4-103 6-103 8-103 10-103 12 103 14-103
N, байт
N, байт 6-10"
2-103 4-103 6-103 8-103 10-103 12-103 14-103
а)
б)
t
t
t
5-10
4-10
3-10
2-10
1-10
t
t
Рис. 4. Профили трасс: а - реализация синтезированного мультифрактальной моделью трафика FARIMA-MWM; б - опытный глобальный трафик TCP (графики построены на основе анализа принятых байтов, прибывающих в интервалы времени 24 мс, 12 мс и 6 мс соответственно)
1 -103 2-103 3-103 4 -103 5-103 6-103 7-103 8-103
1-103 2-103 3-103 4-103 5-103 6-103 7-103 8-103
а)
б)
Рис. 5. Гистограммы трасс: а — реализация синтезированного мультифрактальной моделью трафика ^АЯГМА-МЖМ), б — опытная трасса (графики построены на основе анализа принятых байтов, прибывающих в интервалы времени 24 мс, 12 мс и 6 мс соответственно)
m
1-10
Таким образом, приведенные результаты доказывают преимущество выбора модели FARIMA совместно с моделью MWM по сравнению с другими моделями синтеза трафика при описании и моделировании мультифрактальных свойств телекоммуникационного трафика.
ЛИТЕРАТУРА
1. Шелухин О.И., Осин А.В., Смольский С.М. Самоподобие и фракталы. — Телекоммуникационные при-
ложения/ Под ред. О.И. Шелухина — М.: ФИЗМАТ-ЛИТ, 2008.
2. Шелухин О.И., Разумов Я.М. Имитационные средства моделирования самоподобного трафика. — Электротехнические комплексы и информационные системы, 2008, т.4, №3, с. 20-23.
3. Leland W., Taqqu M., Willinger W., and Wilson D. On the Self-Similar Nature of Ethernet Traffic (Extended Version). — IEEE/ACM Transactions on Networking, Vol. 2, No. 1, pp. 1—15, February 1994.
Поступила 21.09.2008 г.