14 декабря 2011 г. 18:25
ТЕХНОЛОГИИ
Исследование модели трафика сервера данных по результатам измерений трафика мультимедийного ресурса
Ктз'швш слова Wab сервер, математическая медаль анализ сетевого трофика, вероятность переполнение буфера.
Проведан анализ свойств трафиса, генерируемого чувЬ-сврввроч который предоставлв-вт погьюватегжм доступ к файлам различного типа. На ооювании этих данных проанализирована модель трафика сервера ив [1 ] И проведено исследование вероятности переполнения буфера коммутационного устройства, обслуживающего »тот трофик. Получены оценки эффективности некоторых методов управляли« скоростью передаче* дл> трафика *«Ь-сореера.
Иван Титов,
аспирант МТУ СИ,
1. Введение
При проектировании сети, а тоске при разработке методов управления, необходим использовать модель источника нагрузки, которая будет отражать свойство реапьнсго сетевого трафмеа. \Afeb трофис остаётся од-им из основных типов трафиса в современных сетях, поэтому, понимание его структуры и особенностей, очень важно гри разработке модет трафика
В настоящей работе проесдотся анализ реального трофнка от мультимедійного портала Д анный Web ресурс предоставляет пользователям доступ к файлам разгъ^ыого типа. Больше сто запросов поступоет иа передачу файлов небольшого розмера (ИТМ1 страницы с изображениями] при поисхе и просмотре дополнительной информауи Требований пользователей на передачу конкретного файла эню'мтепь-но меньше, однако обработка таких запросов требует намного больше времени Причёмвза-висимости от типа файлов (музыкалмые или видео файлы, архивные файлы с данными) дги-тельность обслуживания и интен*си»юсть по-стут&мя запросов будут отличаться значитегь-но Таким образом можно сказать, что но вход сервера поступает неосолько типов потоков требевоий пользователей отгичающихся *+*-те<ивностъю и объемом зопрошенных д анных
Необходимо отметить, что размеры файлов одного типа могут существую различаться. Например, трЗ-файгы имеют различные длительность и качество (Ьі»аіе), размер видеофайлов существвио отличается по длительности, а размер архивных файлов, содержащих музыкальные альбомы, отмоется значите^но в зависимости от количества музыкальных ком-ПОВЯДИ* в них Эго не позволяет, основываясь на размере передаваемого объекта, провести четкую границу между файлами различного ти-
Обычно для эсгрузки каждого файла открывается отдельная TCP сессия, однако, протокол НТТР/1.1 позволяет передавать несколько объектов в рамках одной сессии (persistent connector) и, напротив, передавать за одну сессию только фрагмент файла (partial content). Эго также привої*« к тому, что гранида между объемом передаваемых данных для файлов различного типа становится менее явной.
В предыдущей работе [2] было представлено исследование свойств трофика, поступающего от другого ресурса (музыкальный портал). Трафнк фиксировался на границе сети оператора, предоставляющего доступ в Интернет, т е. анализировалась часть трофика Web сервера к определённой группе пользователей Внасто-яцей роботе представлены результаты измерений трофика, который фиксировался на гропи-це сети дата-центра, в котором располагаются серверы мутьтимеди^ого портала. Таким образом был получен весь трофик. порождаемый этим Web ресурсом. Эго позволяет не учитывать особенности сети оператора (например, технологию доступа и тд), которые могут оказывать впняьме на полученные результаты
При проведении измерений проводился анализ заголовков сетевого и трекпортного уровня Критерием отбора был пул IP суресов, принадлежащих рассматриваемому ресурсу (primary и non-primary серверы), а также TCP порт источника 80 (HTTP). Трофик анализировался с 10:00 до 13:30 23 октября 2010 (суббота) За 3,5 часов было зафиксировано 383000 TCP сессий, было передано более <11 Гбайта данных.
Во 2-м разделе представлен ана/из структуры постигающего потока. В разделе 3 проведено исследование функции распределения размера передаваемых файлов. В 4-м разделе проанализированы свойства дисперсии трафика Web сервера. В разделе 5 представлены результаты иантоцюниого моделирования, а также прсеедсн о«апиз эффективности некоторых методов управления скоростью передав сервера.
2. Анализ поступающего потока требований пользователей
Для того чтобы охарактеризовать трафик сервера дон#ых россмотрн*и структуру поступающего потока запросов пользователей. Для этого будем фика^ювать моменты времени, в которые открывается новая ТСР сессия. На рис! представлена гистограмма промежутков времени между двумя последовательные событием поступления запроса пользователя на передачу файла
Изданной зависимости видно, что распределен»« убывает экспоненциально (т е. в логарифмическом масштабе имеет вед бгмэкий к лныейному). Причем среднее значение промежутка времени между последовате/ъным открытием ТСР сессий — 39,4 мс и дисперсия — 40,6 мс практически совпадают. Такое равенство характерно при показательном законе распределения случайной величины (3).
Поскольку, при высокой интенсиэюсти по-ступпення запросов, промежуток времени между двумя последовательным событиями оказывается неботиич полученная характеристика не позволяет в потной мере исследовать долго временные зависимости. Для этого рассмотрим другую характерному поступающего потока — вероятность поступления т требовоий за временной промежуток длительностью Г.
46
FVtc. 1. Іигтофсмма промежутков времени между поступлением трвбовомй на обслуживание
T-Comm #6-2011
fac. 6. Зависимость 1 -FJ,*) от * в bg-Jog масштабе (, от/нча-
•сиимся от 8 до 19 pos Следователно, каждому из потоков будет соответствовать свой масштаб времен, от/ичаюшийся существенно для ра этичных потоков
4. Исследование свойств дисперсии трафика сервера данных
Известно, что для самоподобных процессов дисперсия выборочного среднего затухает медленней, чем велич»*« обратной размеру выборки (4). Для исследования свойств дисперсии трофика рассматриваемого мультууиедий-ного ресурса необходимо получить денные о загрузке выходило канала сервера При проведении исследований фиксировалось время начала TCP сессии, время её окончания, а также обьем переданных данных в рампах этой сесст Предположим, что в рамках отдельной TCP сессии схсростъ переда*** д анных посто»и на и равно, соответственно, отношению объёма переданных донных к дгнтелыюсти сесои. Тогдо, просу**ліроеав на каждом последовательном временном интервале длительностью 1 с средние скорости передачи данных от отдельных сессий, ПОЛ/'НМ оценку общей осоро-сти передачі от Web сервера
Рассмотрим временной промежуток соот-
Іс 11:30 до 1 3:30), посхальку средняя нагрузка на этом промежутке практически не менялось. Кроме того дли донного промежутка времени неучтёнными окажутся лишь те TCP сессии, которые начатись до 10 ОО и ещё не эакснчигись к 11:30, число которых крайне мало[эа 3,5 чоса наблкэденнй не было зафиксировано ни одной TCP сессии длитегьностъю более 1 часа]. На рис7 представлена временная зависимость схорости передачи данных в бит/с
Изданной зависимости видно, что для трафика сервера характерны всплесхи нагрузки, причем некоторые из них имеют достато'но бопыиуо дгительность Коэффициент путьсо-1ИЙ для этого трафжо (отношение пжовой скорости за 1 с к средней скорости) превышает 2 Лря полученных значении создаваемой нагрузки ВЫИС7ИМ зависимость изменения ДИС-
48
Рис. 7. Временная зависимость скорости передачи дениых от \Afeb сервера
персии вы борового среднего от времени агрегирования. Для этого от существующей последовательности, состоящей из значений скорости передачи донных вычисленных за 1 с, перейдём к новой последовательности, для которой средняя скорость будет выясняться за больший промежуток времени — Г Для этой новой лоследсвателжости, также как и для исходной, вычиаим/ислерсио. На рис 8 представлена зависимость дисперои скорость передю->и донных от времени агрегировения Т.
Для троодионых случайных процессов дисперсия выборочного среднего уменьшается обратно пропорционапно объему выборки Одоко из рис 8 *1ХНо, дисперсия трафика россмотреиого Web-cepeepo убывает со эна-«ительно меньшей скоростью Если полученную зависимость аппроксимировать прямой гинией то коэффициент пропоріионсуьности Р будет равен 0,23. Тогда параметр Херста H * 1 - Р/2 = 0,88 Это говорит о высокой степени самоподобности трафика сервера.
5. Анализ численных исследований
В реалыых сетях ресурсы часто бьвоот ограничены, что грнводит к перегрузкам Для того чтобы определить вероятность потерь при обслуживании трафика рассматриваемого VVfeb сервера, а тгжже для сиданки эффостивности разгич-ных методов управления сксростыо передові, перейдём к имигаде»ному модегировсм^о.
В роботе [ 1 ] была рассмотрена математиче-схся модель трафика сервера данных предо-ставллещего пользователям доступ к файлам раэгичкхо тша В «хестве вхедых параметров этой модеги используем данные, получен+-ные при анализе трафмеа мутьтимед>«ного ресурса. В соответствии с результатами, полученными в разделе 2, предполо*ич чгона вкод сервера данных поступает пуассоновсюн поток требований пользователей на передачу файлов различного типа. Функция распределен* размера запраииваемых файлов соответствует эм гирннеской функции распределения объёма передаваемых объектов, полученней в разделе 3. Предположив что скорость передои д»*ых Оп одинакова для всех пользователей и равна
ftc. 8. Зовисимэстъ дслерсии скорость передачи денных от времени агрегирования Т
1 Мбит/с Тогда дгителыюсть обслуживания требований пользователей будет определяться только размером передаваемого файла Интенсивность поступления запросов выберем таким образом, чтобы сред няя скорость передели данных от сервера была ровна 100 Мбит/с
Пусть в россматривоемэй системе ограниченным ресурсом является ёмкость выход-юго к »юла коммутаїионного устройства обслуживающего трафик сервера. Поэтому коммутационное устройство имеет буфер, куда попадают пакеты, если весь ресурс выходного канала занят. Если объём задействованного ресурса буфера достигает максимального значения, по поступающие пакеты отбрасываются В качестве характеристики QoS будем рассматривать вероятность переполнения буфера коммутационного устройство, поскольку файлы обладают высокой чувегеительностыо к потере даже небольших фрагментов данных
На рис 9 представлена зависимость вероятности потерь от размера буфера гри емкости канапа 120 Мбит/с в log-log моашабе Д ля того чтобы гроанагмзнровать, какой из потоков оказывает ноибаъшее вгняние но рост потерь, рассмотрим значене усло»юго обьема буфера, задействованного нм потоком, определяемое на основании нагрузки, создаваемой донным потоком Іакже введем вегичжу успокой вероятности лерепогнения буфера для і-го потока — Р, соответствующую доле от обиих потерь, пропоріионс«иой значению условного обьема буфера, эодействовснного каждым из потоков [5]. Для 1-гои 2-го потоков представлена обшря вероятность потерь, посхолку доля потерь, Вносимая только 1-м потоком очен», мала.
Из рис 9 видно, что ксж 3-й так и 4-й поток вносят примерно такой же вкладе потери, что и суммарно 1-й и 2-й потоки При этом 3-й поток создает всего 27%, а 4-й 16% от суммарной нагрузки При малом размере буфера основной вкладе потери ®«хят 1-й и 2-й потоки. С увеличением размера буфера доля, вносимая 3-м и, соответственно, 4-м потоками увеличивается При достато'но большом ра змере буфера кратковременные всплески нагрузки, создаваемые 1 -м и 2-м потоками, не приводят к поте-
T-Comm #6-2011
« !
;:.
ftc. 9. Зависимость вероятности потерь от размера буфера для 1-й системы о6слу*>«с»ни*
рам Объём задействованного ресурса выходного канала часто достигает мсжсимальиого хіч^ния, но система находится в таком состоянии недолго, и буфер не успевоет переполниться Если *е в системе набліодоется период с высокой средней нагрузкой, к которому приводит обслуживание требований 3-го и 4ч-о потокам (лоасолысу этим потокам соответствует больиий масштаб времени), то размера буфера оказывается недостаточно и воэнисоот потери Таким образом, доля потерь, вносимая каждом потоком, будет зависеть от соотношения масштаба времени, соответствующего денному потоку, и масштаба времени, соответствующего системе обслуживания, который определяется временем зол синения буфера
Для оценки эффективности методов управления скоростью передачи дойных, кроме описанной выше системы, рассмотрим несхогъко систем с управлене* 2 я система, в которой скорость передачи уменьшается до Cm/d для всех требоесний, 3 я система, в котсрой одинаковое управление применяется к запросам из 3 го и 4-го потсксв, 4 я система, в которой управлене применяется только к запросам но передачу файлов наибольшего размера, те. к требованиям 4 го потока. Дг* 3 й и 4 й систем ко-эффшиенты, елределяюшие во сколько роз уменьшается скорость передачи для требований из потоков, к которым применяется управлене, выбирались таким образом чтобы среднее ерем« обслуживания было одинаковым для всех трёх систем с управлением
На рис 10 представлена зависимость вероятности потерь от размера буфера для 4-х систем обслуживания при d- 1,5.
Из рис 10 видно, что с ростом размера буфера растёт эффективность прн*лен<*ния управления только к требованиям 4-го потока (4-я система), относительно применения одинакового управления ко всем требованиям (2-я система). Наименьшая вероятность потерь при средних значениях размера буфера достигается при применении управления, как к требованием 3-го, так и 4-го потоков (3-я система).
В работе [5] была рассмотрена модегъ
^ ■
•\
Рис. 10. Заесииюстъ вероятности потерь от размера буфера для 4-х систем обслуживания
сервера данных с дискретной фуисіией распределения объёма переданных дани»«. При проведении численных исследований предполагалось, что на вход сервера поступает несколько потоков требований пользователей, отличающихся интенсивностью и объёмом запрошенных денных, но внутри одного потока длитегьность обслуживания всех требоесянй было постоянной Для того чтобы исследовать наскагъко объективной является такая модель, проведём имитационное моделирование трафика сервера данных с дискретной функіией распределения объёма переданных денных То есть, предположим, что на вход >Л/еЬ сервера поступает 4 ггуос ооновских потока требований ню передачу файлов фиксированного размера, соответствующего среднему размеру передаваемого объекта для каждого из потоков (см. табтду). Зависимость вероятности потерь от размена буфера для 4-х систем обслуживания представлена на рисі 1.
Из рис. 11 видно, что характер изменения вероятности переполннения буфера соответствует аналогичной эавио^мости, лолуче*нойдпя систем с непрерывней функцией распределения объёма переданных донных Соответствую-иие значения вероятности потерь, ннапример, для 1-й системы обслужнвония отликэотся в среднем на 25% Таким образом предположение о дискретной функции раелределеня объёма переданных данных, позволяет сделать "оценку снизу1' для вероятности потерь. При этом выводы, полученные о структуре трафика и эффективности методов управления им могут
также распространяться и на реальные системы с непрерывной функцией распределения.
Выводы
Ана/из полученных результатов позволяет сделать следующие выводе
1 Анализ распределения промежутков времен между поступлением требований на обслуживание, о также распределения количества требований в единицу времени, показывает, что поступающий поток может считаться пу-
f\c. 11. Зависимость вероятности потерь от размвро буфера при декретной фумщин раелределеиня
2 Осмовываяа» но схорости убывания 4ум<-иии распределения, трафик, генери^>уе*ый серверов может быть разделён на 4 потока Интенсивность поступлеия запросов пользователей, а тежже среднее количество переданной информации в рамках отдельной TCP сессии, для различных потоков отгичается существенно.
3 Результаты имитационного моделирования показьеают, что вклад, вносимый определённым потоком, в вероятность переполнения буфера определяется соотношением между масштабом времен, соответствующим этому потоку, и масштабом времени соответствующим системе обслуживания, и определяемым временем заполнения буфера.
4 Результаты, полученные для модели сервера даиых с декретной функцией распределения дгителыности обслуживания требований, те когда каждому потоку соответствует фиксированный размер передаваемого объела, могут быть обобщены на реальные серверы с непрерывной функцией распределении« длительности обслуживания требований при учёте ин^дивиду-альных особенностей создаваемых потоков
Литература
1 Цкгович ИМ, Типов ИМ О временном масштабе в математической модели историка погрузки с бесконечной дисперсией времени обслуживания // Информационные процессы, Том 11, N*3, 2011. Москва — С369-377
2 Титов ИМ Исспедовене характеристик потоков донных, генерируемых NAfebcepeepOM // T-Comm: телекоммуникации нн транспорт, 2010, — N*5. Москва. — С.30-34.
3 АнвшнцБ.С, Пшеничное АП, Хджвеич АД Теория телетрафика — М_ Связь, 1979. — С-21 -23.
4 Шелухин ОИ, Тенкшее AM , Осин А.В Фрактальные процессы в теяекоммуникацио- Под ред Шелулнно ОМ. — М.; йэдиэтехника, 2003, — С19-24
5 Миг=ви« ИИ, Титов ИМ Об эффективности методов управления трафиком сервера донных // Тезисы докладов Всероссийской конференции с междумарод«ым участием "14«формсиионно-твле-коммуникацноииые технологии и математическое моделирование высокотехнологичных систем*. Москва, 2011.-С.55-5&
T-Comm #6-2011
49