Научная статья на тему 'Исследование структуры потока http-запросов в телекоммуникационных сетях'

Исследование структуры потока http-запросов в телекоммуникационных сетях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
192
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
http трафик / самоподобие / параметр Херста / АКФ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Игнатенко Е. Г., Турупалов В. В., Бессараб В. И.

Проведено исследование характеристик http трафика в телекоммуникационной сети. Проанализирована структура трафика и выявлены его составляющие с целью управления телекоммуникационными сетями. Разработана методика анализа временного ряда входящего потока http-запросов, обладающего свойством самоподобия.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Проведено дослідження характеристик http трафіку в телекомунікаційній мережі. Проаналізовано структуру трафіку та виявлено його складові з метою управління телекомунікаційними мережами. Розроблено методику аналізу самоподібного часового ряду вхідного потоку http-запитів.

Текст научной работы на тему «Исследование структуры потока http-запросов в телекоммуникационных сетях»

яш дозволяють враховувати витрати часу в модел^ наближаючи до поведшки реально! системи або процесу.

Networks Petri allow to model various systems and processes by mathematical representation, with an opportunity of reception of the information on behaviour of structure of model. The analysis of networks Petri should be spent for correct and adequate work.

The analysis of correct work of models can be carried out by means of a tree of approachibilities and the matrix equations which allow to reveal errors of modelling. The analysis of adequate work of models can be lead by means of time networks of events which allows to consider expenses of time in model, approaching to behaviour of real system or process.

УДК 621.395.7

ИГНАТЕНКО Е.Г., аспирант (ДонНТУ), ТУРУПАЛОВ ВВ., к.т.н, доцент (ДонНТУ), БЕССАРАБ В.И. к.т.н, доцент (ДонНТУ).

Исследование структуры потока Ьйр-запросов в телекоммуникационных сетях

Актуальность

В классической теории телетрафика принято считать, что информационные потоки в телекоммуникационных сетях, адекватно описываются Пуассоновским распределением. Такое допущение является верным для сетей небольшого размера и позволяет использовать известные методы теории массового обслуживания для расчета сетевых параметров. Но с ростом размера сетей, увеличением разнообразия сетевых приложений, появлением новых протоколов передачи данных в поведении трафика проявляются фрактальные свойства [1]. Для такого трафика методы расчета, которые традиционно базируются на пуассоновских моделях и формулах Эрланга, приводят к неадекватной оценке реальной нагрузки. Также известно, что фрактальным процессам присуще свойство самоподобия или масштабной инвариантности, которое для сетевых процессов заключается в том, что с уве-

личением интервала агрегирования временного ряда сохраняется структура нижележащих уровней, и интервал корреляции теоретически стремится к бесконечности [1-3].

К настоящему времени показано, то самоподобной структурой обладает трафик в телекоммуникационных сетях при работе протоколов Ethernet [4], Уо1Р [5], TCP [6] и OKC7 [7]. При этом проводился анализ сведений об информации, полученной пользователями сети._

Постановка цели и задач исследования

Целью работы является разработка методики анализа временного ряда входящего потока http-запросов, обладающего свойством самоподобия. Для достижения поставленной цели необходимо решить следующие задачи:

- проанализировать существующие подходы к исследованию временных рядов трафика;

- проанализировать временной ряд

входящего потока Ьйр-запросов с целью выявления своиств самоподобия для последующего построения на его основе прогнозных моделей.

Основная часть

Экспериментальный случайный процесс рассматривается как дискретная последовательность случайных величин, т. е. аргументом считается порядковый номер такой единицы времени:

X ={Xt: t = 0,1,2...}

(1)

Будем считать, что рассматриваемый случайный процесс имеет ограниченную ковариацию В(xi, х^т) <<х>, У т и следовательно, дисперсию сС = В(xi, х{+т) .

Случайный процесс будет обладать свойством самоподобия, если агрегированный процесс пг-го порядка:

X

(m)

[ x2m),..., 4m) ]={ -1 Z Xk _i)m+1, k = 1,2,... j (2)

[ mt=1 J

будет иметь корреляционную функцию г (к), совпадающую с корреляционной функцией исходного случайного процесса Г (к) для любых т.

Важнейшим параметром, характеризующим степень самоподобия, является параметр Херста (Н). С учетом показателя Херста выделяют три типа случайных процессов:

1. 0 < Н < 0.5 - случайный процесс, который не обладает самоподобием;

2. Н = 0.5 - полностью случайный ряд, аналогичный случайным смещениям при классическом броуновском движении частицы;

3. Н > 0.5 - самоподдерживающийся процесс, который обладает длительной памятью и является самоподобным.

Коэффициент Херста можно определять различными способами - с по-

мощью R/S -анализа, анализа изменения дисперсий, периодограммного анализа и анализа АКФ. Все они отличаются друг от друга по сложности вычислений и точности получаемого результата.

Считается, что временной ряд, обладающий свойством самоподобия, подчиняется распределению с тяжелым хвостом. Распределение имеет тяжелый хвост, если

P( x > X) = x -а,0 <а< 2. (3)

Простейшим распределением с тяжелым хвостом является распределение Парето, для которого функция распределения имеет вид:

F (x) = |1 -

k

(4)

Распределение с тяжелым хвостом имеет ряд свойств, которые существенно отличают его от наиболее известных распределений, таких как экспоненциальное, нормальное или Пуассоновское. Существует несколько методов для оценки тяжести хвоста а по экспериментальным данным. Для оценки -а строят линию регрессии для дополнительного распределения ^(х) = 1 - ^(х) в логарифмическом масштабе и вычисляют тангенс угла наклона к горизонтальной оси. Параметр Херста связан с параметром тяжести хвоста следующим соотношением:

H =

3 -а 2 .

(5)

Самоподобные процессы, в отличие от пуассоновских, характеризуются наличием последействия, т.е. вероятность поступления следующего события зависит не только от времени, но и от предыдущих значений событий. Это означает, что число текущих событий может зависеть от предыдущих событий в отдаленные про-

а

X

межутки времени. Именно поэтому одним из основных свойств самоподобного процесса является медленно убывающая зависимость (МУЗ). Считается, что процесс обладает МУЗ, если он характеризуется АКФ, которая убывает гиперболически (по степенному закону) при увеличении лага [8]. Понятие медленно убывающей зависимости имеет ключевое значение в теории самоподобных процессов. Процесс Х обладает медленно убывающей зависимостью (МУЗ), если выполняется условие [9-11]:

r(к)~ к-РЦ(к), к

(6)

где 0 < Р < 1, Ь1 - медленно меняющаяся на бесконечности функция, т.е.

lim

Li(tx) = 1

^ L1(t)

= 1 для всех x>0.

Для того чтобы проверить гипотезу о присутствии МУЗ в некотором временном ряде, необходимо решить задачу регрессии, т.е. вычислить по экспериментальной АКФ методом наименьших квадратов параметры A0 и Р модели:

r(k) = A0 • к-Р,0 < Р< 1, к A0 - const .(7)

Для оценки степени точности необходимо найти дисперсию Оmuz разности экспериментальной АКФ и полученной ее аппроксимации (7). Одновременно проверяется гипотеза о присутствии быстро убывающей зависимости (БУЗ) в этом же ряде. Для этого аналогичным образом вычисляются параметры B0 и р модели (8):

г(к) = B0 • рк, к < р < 1, B0 - const .(8)

Для оценки степени точности необходимо найти дисперсию о2 buz разности экспериментальной АКФ и полученной ее аппроксимации (8). Вывод о присутствии

МУЗ в ряде делают, если Omuz достаточ-

но мало и значение коэффициента LR<1.

_2 '-'И1117

LR =

°buz

(9)

В рассматриваемой статье разрабатывается обоснованная методика, подтверждающая самоподобие Ьйр-трафика, основанная на измерениях характеристик реального сетевого ресурса. В качестве объекта исследования рассматривается процесс поступления Ьйр-запросов на реальный web-сервер за период длиной 1 неделя с 10 апреля 2010 года по 17 апреля 2010 года. Фиксируемые характеристики - моменты поступления Ьйр-запросов. Все действия сервера записываются в так называемый лог-файл. Необходимыми данными для исследований является количество запросов к серверу, которые получаются из анализа лог-файла.

Анализируемые данные, которые представляют собой количество запросов пользователей к серверу в течение суток, взяты непосредственно из лог-файла. Так же можно рассматривать размеры передаваемых файлов, интервалы передачи и другие реальные характеристики сетевого трафика.

Осуществим с имеющимся временным рядом следующий процесс агрегирования - определим количество Ьйр-запросов за 1 минуту

X = (X, I = 1,2,...,1440). Агрегированный по 1 минуте поток запросов приведен на рисунке 1.

Выполним уменьшение размера шкалы наблюдений в 5 раз. Для этого вычислим новый ряд согласно формуле (2). Агрегированный по 5 минут поток запросов приведен на рисунке 2. Далее проведем такую же процедуру с исходным рядом (рисунок 1) при т=10. Таким образом, одно деление будет содержать 10 единиц исходной реализации. Агрегированный по 10 минут поток запросов приведен на рисунке 3.

Рисунок 1. - Агрегированная за 1 минуту реализация входящего потока запросов

250 -г

1 41 81 121 161 201 241 281

time

Рисунок 2. - Агрегирование входящего потока X(т), т = 5

Рисунок 3. - Агрегирование входящего потока X(т), т = 10

Основываясь на рекомендациях [1214] и проанализировав полученные результаты, можно сделать предположение о том, что рассматриваемый входящий поток имеет самоподобную структуру. Этот вывод можно сделать исходя из определения самоподобия, которое говорит о том, что структура ряда, полученного усреднением групп элементов, остается такой же, как и структура исходного. Этот

Коэффициент -а - является оценкой тяжести хвоста. Построив линию регрессии для дополнительной функции распределения и вычислив тангенс угла наклона к горизонтальной оси, определяем значение параметра а-1,36. Значение попадает в промежуток от 0 до 2, откуда следует, что анализируемое распределение имеет свойство тяжелого хвоста. Тя-

эффект наблюдается на рисунке 1 -рисунке 3, иллюстрирующих изменение шкалы. Этот факт является предпосылкой для предположения о самоподобной структуре рассматриваемого потока и основанием для проведения детального анализа.

Проведем оценку тяжести хвоста а по экспериментальным данным:

желые хвосты также являются причиной хорошей предсказуемости потока [15].

Используя найденное значение параметра а, по формуле (5) определяем значение параметра Херста Н=0,82. Для сравнения в таблице приведены значения параметра Херста, рассчитанные различными способами.

Таблица 1. - Оценка показателя Херста различными методами

Я/ £ - анализ Периодограммный метод Изменения дисперсии АКФ

0,73062 0,6891 0,9097 0,8725

1оц(х)

Рисунок 4. - График дополнительного распределения

Построим АКФ для исходной реализации с Н=0,82 и для сравнения АКФ с параметрами Херста Н=0,9; 0,7 и 0,5

Рисунок 5. - АКФ исследуемого процесса Н=0,82; АКФ при Н=0,9; 0,7 и 0,5

1,2 1

0,8

4 0,6

0,4

0,2

51

101 151

лаг, k

201

H=0,82 H=0,9 H=0,7 H=0,5

0

Анализируя АКФ, можно заметить достаточно слабое ее убывание: при сдвиге 150 значений АКФ остается выше 0,3. В общем случае АКФ характеризует внутреннюю зависимость между временным рядом и тем же рядом, но сдвинутым на некоторый промежуток (сдвиг) времени, который называется лагом.

Для исходной реализации процесса построены регрессионные модели МУЗ и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

БУЗ, рассчитаны о2 muz и О buz, оценен коэффициент LR=0,3868. Таким образом, результаты анализа АКФ реализации http трафика подтверждают присутствие медленно убывающей зависимости.

С понятием МУЗ связано важнейшее прогнозирующее свойство - продолжительная память, характеризующаяся зависимостью текущих параметров процесса от предыдущих.

Выводы

Проведен эксперимент по сбору и исследованию характеристик http трафика в телекоммуникационной сети. Проведенное исследование подтверждает наличие самоподобных свойств в http трафике современных телекоммуникационных сетей. Показано, что входящий поток подчиняется распределению с тяжелым хвостом.

Результаты анализа АКФ реализации http трафика подтверждают присутствие медленно убывающей зависимости. С целью получения достоверных результатов, показатель Херста рассчитывался несколькими методами: анализа дисперсии, нормированного размаха (R/S), периодограмм. Для всех методов показатель Херста H>0.5, значит, трафик относится к классу персистентных процессов.

В процессе анализа выявлено присутствие регулярной детерминированной, циклической и случайной составляющих в агрегированном сетевом трафике, что может быть использовано при решении задачи прогнозирования трафика с целью управления телекоммуникационными сетями.

Список литературы

1.Городецкий А. Я., Заборовский В. С. Информатика. Фрактальные процессы в компьютерных сетях. Учебное пособие. -СПб.: Изд-во СПбГТУ, 2000 - 102 с.

2. Морозов А. Д. Введение в теорию фракталов. М.: Институт компьютерных исследований, 2002. - 159 с.

3. Кроновер Р. М. Фракталы и хаос в динамических системах. М.: Постмаркет, 2000. - 352 с.

4. W.E.Leland, M.S.Taqqu, W.Willinger, and D.V.Wilson. On the self-similar nature of Ethernet traffic (extended version).IEEE/ACM Transactions of Networking, 2(1):1-15,1994.

5. T. D. Dang, B. Sonkoly, S. Molnr, Fractal Analysis and Modelling of VoIP Traffic, NETWORKS2004, Vienna, Austria, 2004.

6. Feng W., Tinnakornsrisuphap P. The Failure of TCP in High-Performance Computational Grids //SC2000: HighPerformance Network and Computing Conference, Dallas, TX , November 2000.

7. Криштофович А.Ю. Самоподобие трафика сети ОКС №7. МКИССиТ, Санкт- Петербург, 2002 г.

8. Крылов В.В., Самохвалова С.С. Теория телетрафика и ее приложения.-СПб.: БХВ-Петербург, 2005.

9. Tsybakov B.S., Georganas N.D. Self-similar processes in communications networks // IEEE Trans. Inform. Theory, vol. 44. Sep.1998. P. 1713-1725.

10. Leland W.E., Taqqu M.S., Willinger W., and Wilson D.V. On the self-similar nature of ethernet traffic // IEEE/ACM Transactions of Networking, 2(1), 1994. P. 1-15.

11. Цыбаков Б. С. Модель телетрафика на основе самоподобного случайного процесса // Радиотехника. 1999. № 5. C. 24-31.

12. Mark E. Crovella and Azer Bestavros, "Self-Similarity in World Wide Web Traffic: Evidence and Possible Causes" in IEEE/ACM Transactions on Networking, 5(6):835--846, December 1997.

13. Mark E. Crovella, Murad Taqqu and Azer Bestavros, "Heavy Tailed-Probability distributions in the World Wide Web" 5(6):835--846, December 1997.

14. Mark E. Crovella, Azer Bestavros, Paul Baarfor, Adam Bradley "Change in Web Client Access Patterns. Characteristics and Caching Implications", Computer Science Department Boston University, 1999.

15. Tsybakov B.S., Georganas N.D. Self-similar processes in communications networks // IEEE Trans. Inform. Theory, vol. 44. Sep.1998. P. 1713-1725.

Аннотации:

Ключевые слова: http трафик, самоподобие, параметр Херста, АКФ.

Проведено исследование характеристик http трафика в телекоммуникационной сети. Проанализирована структура трафика и выявлены его составляющие с целью управления телекоммуникационными сетями. Разработана методика анализа временного ряда входящего потока http-запросов, обладающего свойством самоподобия.

Проведено дослвдження характеристик http траф1ку в телекомушкацшнш мереж1. Проанал1зо-вано структуру траф1ку та виявлено його складов! з метою управлшня телекомушкацшними мережами. Розроблено методику анал!зу самопод!бного часового ряду входного потоку http-запитiв.

There was an examination of HTTP traffic characteristics accomplished. The structure of traffic was considered and components identified in order to control internetworking. Method of incoming http requests stream time series analysys was developed. This applies for self-similar time series.

УДК 681.3

i Надоели баннеры? Вы всегда можете отключить рекламу.