УДК 621.396.67
МАТЕМАТИЧЕСКИЕ МОДЕЛИ И ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ АГРЕГИРОВАННОГО ТРАФИКА VoIP
О.И. Шелухин, А.В. Пружинин, А.В. Осин, Г.А. Урьев
Предложены математические модели агрегированного трафика VoIP на уровне вызовов и на уровне пакетов, удобные для имитационного моделирования. Показано, что при небольшом числе мультиплексируемых каналов трафик речи на уровне вызовов может быть описан и смоделирован полумарковским процессом. Для описания сильно пульсирующего трафика на пакетном уровне предложена нестационарная ФГШ-модель. Предложенные модели трафика более реалистично описывают поведение нестационарных серий сетевого трафика на малых масштабах времени.
In this paper we propose mathematical models of the VoIP traffic aggregation on the call level and the packet level. This models are usable for imitation modeling. In this paper we show that the voice traffic can be describe and model by semi-Markov process under few multiplexing voice channels. Nonstationary FGN-model for describing the bursty traffic on the packet level is proposed. It describe the nonstationary behavior of a network traffic on the small scales more realistic.
Постановка задачи. Анализ и моделирование сетевого трафика имеют большое значение при описании производительности сети. Модели, которые точно описывают явно выраженные характеристики трафика, полезны для анализа и моделирования, позволяют глубже понять сетевую динамику, что помогает при проектировании и управлении.
Большинство исследований по анализу и моделированию сетевого трафика на сегодняшний день ставят целью описать поведение агрегированного трафика, в котором все одновременно активные соединения складываются в единый поток. Типичные агрегированные ряды состоят из числа пакетов в единицу времени на некотором интервале. Многие исследования показали, что агрегированный трафик проявляет фрактальное или самоподобное масштабирование, т.е. трафик выглядит статистически подобным на всех масштабах времени. Самоподобность наделяет трафик долговременной зависимостью (ДВЗ). Многие исследования также показали, что трафик может иметь сильно пульсирующую структуру. Эти открытия резко контрастируют с классическими моделями трафика, такими как марковская или пуассонов-ская. ДВЗ и негауссовская структура трафика могут приводить к гораздо более высоким потерям пакетов, чем предсказывается в классическом анализе построения очередей [1].
Открытие самоподобного поведения трафика привело к новым фрактальным моделям агрегированного трафика [2]. Фрактальный гауссовский шум (ФГШ) (наиболее широко применяемая фрактальная модель) - гауссовский процесс со строго
масштабирующейся структурой. Вследствие своей гауссовости он применяется в скрупулезных аналитических исследованиях построения очередей. К тому же, приблизительный ФГШ можно быстро синтезировать при помощи различных методов.
Зачастую агрегированный трафик может рассматриваться как наложение большого числа отдельных независимых ON/OFF-источников, которые передают информацию с одинаковой интенсивностью, но с длительностями, распределенными в соответствии с распределениями с «тяжелыми хвостами» [3]. В пределе для бесконечного числа источников ON/OFF-модель сходится к ФГШ.
При проведении экспериментальных исследований трафика в телекоммуникационных сетях (ТС) была получена информация о характеристиках трафика на уровне соединений, содержащаяся в широко доступных трассах трафика. Эта информация, как правило, игнорировалась при классическом агрегированном анализе (ДВЗ, фрактальный, мультифрактальный).
Учет этой информации при создании моделей трафика обеспечивает новый подход к анализу и моделированию пульсирующего сетевого трафика.
Разработка математической модели речевого трафика на уровне вызовов. Рассмотрим стохастическую непрерывную цепь Маркова (ЦМ) E,(t) с непрерывным временем T е R+[0, да) и конечным множеством состояний X = {0, ..., N}.
Последовательность {(^„, Tn), n = 0, 1, ...} случайных векторов, где ^n принимает значения из множества X(^n е X), а Tn е R+ будем называть по-
лумарковской последовательностью, если выполняется условие
Р{Еп = Л Тп < t 1^0 = ¥; Т0 < ^ Е1 =
= i1,..., ^п-Ъ Тп-1 < {п-1}= Р{п = {, Тп < { |^п-1> =
=а1} (о (1)
для произвольных натуральных п, произвольных t0,^,...,tn-1 е Я+ и произвольных /,у,г0,...гп-1 е X .
Компоненту Еп последовательности {(Еп,Тп)} будем называть ведущей компонентой, а компоненту Тп - сопровождающей (вложенной) компонентой этой последовательности.
Функцию Qij ^) будем называть переходной
функцией последовательности {п, Тп)}.
Процесс моделирования случайного процесса {<^^(t), tn е Л+} по полумарковской последовательности { п , Тп )} осуществляется следующим образом:
предположим, что То = 0 с вероятностью Р{То = 0} = 1;
будем считать, что ^) = Е0 , если 0 < t < Т1;
Е(0 = ^1, если Т < t <Т1 + Т2;
^(t) = Е2, если Т1 + Т2 < t < Т1 + Т2 + Т3 и т.д.; предположим также, что на произвольном отрезке времени [0, t] с вероятностью Р = 1 происходит конечное число скачков процесса Е(0 .
Построенный таким образом процесс {^)^ > 0} называется полумарковским процессом, построенным по полумарковской последовательности.
Траектория построенного процесса формируется с помощью следующего алгоритма.
Пусть задано начальное распределение {Рг (0) = Р{^0 = 0,' е X}.
Шаг 1. Разыгрываются величины (реализации) (Еь Т1), соответствующие распределению Qi0 у (t). Предположим, что результатом такого розыгрыша является пара (г1, tl). В этом случае полагаем, что реализация процесса Е(0 на интервале времени [0, ^) принимает значение г0.
Шаг 2. Разыгрываем значение вектора (Е2, Т2) в соответствии с распределением Qi1 у (t). Предположим, что они оказались равными ('2, t2) . В ре-
зультате реализация процесса Е(0 на интервале времени [^, ^ +12) принимается равной г1 и т.д.
Типичная траектория процесса Е(0 изображена на рис. 1. Видно, что траектория полумар-ковского процесса представляет собой непрерывные справа ступенчатые функции. Важнейшей характеристикой полумарковских процессов является матрица Qij = 1, N. Рассмотрим способы ее описания и определения.
Пусть р{Еп = ] \ Еп-1 = г} = Ргу * 0 .
Тогда имеем
Qij(t) = р{Еп = У,Тп <t\Еп-1 = г} =
= Р {Тп < t 1 Еп = У, Еп-1 = г}х
хР {Еп = Жп-1 = г} = Руру (t), (2)
где
р (t)=Р{Тп < г | Еп = у,Еп-1 = г} (3)
- функция распределения (ФР) времени пребывания процесса Е(0 в состоянии г, если известно, что следующим его состоянием будет состояние у.
Таким образом, процесс {Еп} является ЦМ с дискретным временем и матрицей вероятностей переходов (Ру).
Если ЦМ не содержит поглощающих состояний, то для произвольных г е X имеем
Рг] = Р{Еп = ]\Еп-1 = г} = Хг; г ф у; Рг] = 0 . Здесь Ру - вероятность того, что ЦМ, находящаяся в состоянии г, в очередной момент изменения состояния перейдет в состояние у.
Из (3) видно, что переходная функция Qij(t) произвольной полумарковской последовательности может быть представлена в виде
(0 = Ргргу V), (4)
где в качестве ^) выступает ФР произвольной (не обязательно марковской) случайной величины.
Таким образом, трафик речи и видеоконференции на уровне вызовов может быть описан и смоделирован полумарковским процессом, который полностью характеризуется своими элементами: матрицей вероятностей переходов (Ру);
матрицей ФР (0; начальным распределением
{Рг (0), t е X}.
Замечание. Полумарковский процесс является стохастически непрерывной однородной ЦМ с непрерывным временем, только если переходная функция Qij ^) для У г', у е X представима в виде
Qij(t) = Ру 1 -е М), т.е. полумарковский процесс
представляет собой ЦМ с непрерывным временем, если и только если время пребывания в каждом из его состояний не зависит от того, каким будет следующее состояние, и будет распределено по экспоненциальному закону.
В марковском случае р (t) = Р{Т, <t | Еп =у,ЕИн1 =г} = = 1 -е-^, т.е. для анализируемого процесса Е(0 время пребывания в произвольном состоянии г е X не зависит от того, какое состояние процесса будет следующим. Более того, время пребывания процесса в состоянии г подчиняется экспоненциальному распределению, параметр которого Хг зависит исключительно от состояния г е X .
Таким образом, в случае марковских процессов Е(0 ФР не зависит от у и имеет вид
ру ()= 1 - exp(-Ягt), в то время как в более общем
(немарковском) случае ФР может быть произвольной.
Можно оценить некоторые статистические характеристики иолумарковских иро-цессов, имеющие важное значение для описания и моделирования трафика на уровне вызовов.
Таким образом, трафик речи на уровне вызовов может быть описан и смоделирован полумарковским процессом с переходной функцией вида
Qг] (t) = РуРу (t),
г , у = 1,2,..., N,
где ру (t) = р{ < (: \ Еп = у,Еп-1 =г }
- функция распределения времени пребывания процесса Е(0 в состоянии г', если известно, что следующим его состоянием будет состояние у;
Ру = Р{Еп = у |Еп-1 = г} = 4 1 Хг, г * у, Ру = 0
- вероятность того, что ЦМ, находящаяся в состоянии г, в очередной момент изменения состояния перейдет в состояние у; {Рг (0), г' е X} - начальное распределение; N - число состояний ЦМ.
При небольшом числе мультиплексируемых каналов ^ < 20) трафик речи и видеоконференции на уровне вызовов может быть описан и смоделирован полумарковским процессом, который полностью характеризуется своими элементами: матрицей вероятностей переходов (Ру); матрицей
ФР Ру ^); начальным распределением {Рг (0), г' е X} .
Оценка параметров полумарковской модели и результаты моделирования речевого трафика на уровне вызовов. Анализ экспериментально полученных графиков реализаций трафика вызовов показывает, что в исследуемом процессе речевого трафика на уровне вызовов можно выделить конечное число состояний N (в рассматриваемых реализациях N = 21), каждое из которых соответствует активному числу вызовов в данный момент времени.
Выполнив аппроксимацию трафика вызовов при помощи марковской матрицы размером N х N (в эксперименте 21х21), можно оценить параметры матрицы вероятности переходов на основе анализа экспериментальных данных, воспользовавшись методикой, изложенной в [2]. После получения матрицы вероятностей переходов осуществим с ее помощью моделирование процесса и сравним полученные данные с экспериментальными.
На рис. 2. представлена реализация, полученная с использованием матрицы вероятностей переходов, оцененной по экспериментальным данным.
Гистограмма распределения амплитуд (числа уровней) для этого случая представлена на рис. 3.
Рис. 2. Смоделированный трафик вызовов в рабочий день
£ 9000
I 8000
о 7000
5
" 6000 5000 4000 3000 2000 1000
О 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1в 17 18 19
Интенсивность вьгдовов (выгонов с)
Рис. 3. Гистограмма вызовов в рабочий день, полученных на основе марковской модели
Для проверки адекватности распределений экспериментального и смоделированного процесса построим график квантиль-квантиль (или кратко -график К-К), который обычно используется для нахождения наиболее подходящего распределения из выбранного семейства распределений. Для оценки соответствия распределений наблюдаемые значения упорядочиваются так, что Х1 <... < хп , и по ранжированным значениям (х;) строится обратная эмпирическая функция распределения. После чего к ней подбирается линия регрессии. Процесс проверки автоматизирован с помощью пакета прикладных программ «^^йзйса». Применяя квантильный анализ, можно показать хорошее соответствие моделируемого процесса экспериментальному, что и иллюстрируется на рис. 4.
Quantile-Quanrtile Scatterplot (Spreadsheet3 1 0v*70000c) Var2 = 0,0423+0,9629*x
Var1
Рис. 4. График К-К
Вместе с тем, исследования показывают, что корреляционные свойства процесса, полученного в результате моделирования марковского процесса и реального процессов, различны, что иллюстрируется на рис.5.
Для рассматриваемой реализации процесса вызовов таких процессов было 21, по числу состояний ЦМ. На основе найденных оценок распределения длительностей пребывания в каждом из состояний, используя полученную ранее матрицу вероятностей переходов, была сгенерирована
Заиисимость коэффициента корреляции от ивдоржки
задержка
а)
Зависимость коэффициента корреляции от задержки
0 500 1 ООО 1500 2 000 2 500 3 000 3 500 4000 4500 5 000
задержка
______________________________________6)_________________________________________
Рис. 5. Графики корреляционной функции: а - реальный процесс; б - марковский процесс
искусственная реализация процесса вызовов. На рис. 6 показаны образцы полученных выборок, а их корреляционные функции - на рис. 7
О 1ОООО 20000 30000 40000 50000 60000 70000 80000 90000
Индекс последовательности
Рис. б. Реализация, полученная в результате моделирования процесса вызовов на основе полумарковской модели
О 2 000 4 000 6 000 8 000 10 000 12 000 14 000 16 000 18 000 20 00І
задержка
Рис. 7. Зависимость коэффициента корреляции процесса, полученного на основе полумарковской модели, от задержки
Для уточнения модели получим статистику процессов длительностей нахождения в каждом из состояний, которая необходима для учета реальных корреляционных свойств моделируемого процесса. Указанная статистика позволяет оценить статистические характеристики функции распределения длительности состояний Fj (t).
Сравнительный анализ статистических характеристик экспериментальных и полученных в ре-
зультате моделирования показывает их хорошее соответствие.
Разработка математической модели речевого трафика на уровне пакетов. Анализ показывает, что использование известных моделей суммарного трафика VoIP, базирующихся на экспоненциальных распределениях длительностей ON/OFF-периодов речевых источников, не дает удовлетворительных результатов. Хорошо известно, что объединение большого количества ON/OFF-источников с тяжелым хвостом для распределения ON- и/или OFF-периодов является самоподобным [2]. Следовательно, самоподобные модели являются наиболее приемлемой аппроксимацией для объединенного (агрегированного) трафика VoIP.
Модель агрегированного трафика VoIP на уровне пакетов. Проведенные исследования показывают, что с увеличением числа серий агрегированный процесс при малом масштабе времени стремится к ФГШ. В такой формулировке при помощи байтовых серий ДВЗ агрегированного процесса получается из-за того, что ON- или OFF- периоды обладают распределением с тяжелыми хвостами.
Зная самоподобные свойства трафика VoIP, можно использовать несколько видов самоподобных процессов для моделирования подобного трафика [2]. Наибольшее распространение получила модель сетевого трафика в виде ФГШ. Подобная модель использовалась во многих работах для аппроксимации байтовых серий с ON/OFF-периодами, имеющими распределения с тяжелыми хвостами [2,3]. Реальный трафик имеет большое число активных байтовых серий, в каждой из которых активные ON-периоды сменяются неактивными OFF-периодами. ON- и OFF- периоды в рамках серии независимы. В свою очередь, серии независимы между собой и имеют одинаковые статистические свойства.
Для примера рассмотрим самый простой способ моделирования самоподобного трафика, используя ФГШ. Эта модель определяется как
X(t) = m + cGH (t), (5)
где Gh (t) обозначает центрированный ФГШ с показателем Херста Н, средним значением m, среднеквадратичным отклонением (СКО) с и корреляционной функцией
R(k) = С2- (( + 1)2H - 2k2H + (k - l)2H )
Таким образом, для полного описания модель (5) имеет три параметра: Н, m и с.
В реальных сетях вместо фиксированного числа байтовых серий на всем промежутке времени серии поступают и удаляются из системы в случайные моменты времени. Времена поступления серий берутся из нестационарного пуассонов-ского процесса, и времена их жизни распределены экспоненциально с большим средним значением.
В результате на малых масштабах времени трафик проявляет свойства самоподобности и ДВЗ из-за отдельных ОК/ОРР-процессов. Однако данная модель является нестационарной, если интенсивность поступления серий меняется во времени (см. рис. 2). Кроме того, поскольку парциальные серии имеют ограниченную длительность (в силу суточных колебаний), кореляции на больших масштабах времени отбрасываются моделью.
Для упрощения оценки нестационарной модели будем рассматривать ФГШ-последовательность как результат наложения большого числа независимых и одинаково распределенных ФГШ-процессов, каждый из которых отражает активную трафиковую серию. В обоих случаях агрегированный трафик соответствует традиционной ФГШ-модели, поэтому при моделировании агрегированных вариантов различие не так важно. Использование ФГШ трафиковых серий упрощает теоретическое описание нестационарных модели.
В результате модель является суперпозицией большого числа активных сегментов ФГШ трафи-ковых серий, длительности которых распределены экспоненциально. Свойства самоподобности и корреляции на малых масштабах времени такие же, как и для ФГШ, но на больших масштабах времени они исчезают.
Для разработки нестационарной модели рассмотрим агрегированный трафик xSt на временном интервале ^, S^ +1)) в виде отсчетов большого числа (N(0 = ^)(Щ^ = N1 независимых и одинаково распределенных трафиковых серий. Каждая серия сама по себе является ФГШ-процессом с общими параметрами гауссовского распределения а, с2 и параметром Херста Н. В результате агрегированная нестационарная ФГШ-модель для отсчетов сетевого трафика с масштабом времени S для различных времен t = 0, ± 1, ± 2,... записывается как
N
X^) = mNs + сS^ GH г ^), t с Т . (6)
г=1
Здесь N - оценка числа суммируемых ФГШ, которая оценивается из полумарковской модели вызовов; Т - длительность интервала, соответствующего г'-му состоянию ЦМ, которая определяется ФР р (х) = Р {Тп < t\Е п = у, Е п-1 = г}; Сн (t) -ФГШ с показателем Херста Н, средним значением т, среднеквадратичного отклонения с и корреляционной функцией
я(к) = -у ((к +1)2н - 2к2н +(к -1)2н ).
Рассмотрим результаты моделирования входного трафика, формируемого в виде объединенного потока, отдельные элементы которого могут быть представлены в виде последовательности пакетов. Принцип получения объединенного трафика схематически показан на рис. 8, где рассмотрены три источника пакетов.
Рис. 8. Схематическое представление процесса получения входного трафика
Поскольку необходимо, чтобы параметры входного потока обладали фрактальными свойствами, воспользуемся ФГШ, параметризованным на основе реальных измерений. По сформированной модели на основе марковской матрицы было получено нужное число реализаций. Для них оценивались среднее значение и дисперсия общего процесса. Эти параметры были использованы в алгоритме моделирования ФГШ.
Для более глубокого понимания влияния фрактальности (самоподобности) во входном потоке на характеристики производительности мультиплексора смоделируем несколько процессов с различными показателями Херста (0,5; 0,6; 0,7;
0,8; 0,9). Так как входной поток мультиплексора рассматривается как число пакетов в некоторый момент времени, то значения ФГШ округлялись до целого. В случае, если ФГШ-процесс содержал отрицательные значения, то они приравнивались нулю. Для моделирования ФГШ был использован БПФ-алгоритм [1,2].
В рассматриваемом случае нестационарность вводилась путем изменения интенсивности поступления пакетных серий во времени и путем изменения числа суммируемых парциальных потоков.
Модельное исследование было проведено с использованием измеренной статистики для вызовов и реальных ОМОРР-трасс. Результаты показали, что в случае высокой загруженности пуассоновская модель не согласуется с результатами моделирования, а объединенный процесс является сильно коррелированным и проявляет свойства ДВЗ. Кроме того, число поступивших пакетов обладало схожими характеристиками при различных уровнях агрегирования. Такие результаты говорят о присутствия самоподобия.
ЛИТЕРАТУРА
1. Шелухин О.И., Тенякшев А.М., Осин А.В. Моделирование информационных систем /Под ред. О. И. Шелу-хина. - М.: САЙНС-ПРЕСС, 2005.
2. Шелухин О.И., Тенякшев А.М., Осин А.В. Фрактальные процессы в телекоммуникациях /Под ред. О.И. Шелухина. - М.: Радиотехника, 2003.
3. Шелухин О.И. Фрактальные (самоподобные) процессы и их применение в телекоммуникациях. - Нелинейный мир, 2004, т.2, №1.
Дата поступления: 01.11.2005
1-й источник
2-й источник
3-й источник
Число
пакетов
3-
2-
1-