УДК 621.39
Горбунова А.В.1, Самуйлов К.Е.1, Сопин Э.С.12
1 Российский университет дружбы народов, г. Москва, Россия
2 Институт проблем информатики ФИЦ ИУ РАН, г. Москва, Россия
ПРЕОБРАЗОВАНИЕ ЛАПЛАСА-СТИЛТЬЕСА ДЛЯ ВРЕМЕНИ ОТКЛИКА СИСТЕМЫ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ С ГИСТЕРЕЗИСНЫМ УПРАВЛЕНИЕМ И ОГРАНИЧЕНИЕМ НА ОДНОВРЕМЕННОЕ ЧИСЛО АКТИВАЦИЙ
АННОТАЦИЯ
Для анализа показателей производительности модели системы облачных вычислений с динамическим масштабированием в статье рассмотрена многолинейная система массового обслуживания с гистерезисным управлением количеством включенных приборов на основе порогов длины очереди и немгновенным подключением дополнительных приборов, а также ограничением на одновременное количество активаций приборов с целью уменьшения вычислительной сложности без потери соответствующих свойств моделируемой системы. Разработан рекуррентный метод вычисления преобразования Лапласа-Стилтьеса распределения времени пребывания заявки в системе и времени ожидания начала обслуживания. С помощью полученного преобразования проведен анализ характеристик системы облачных вычислений.
КЛЮЧЕВЫЕ СЛОВА
Облачные вычисления; время отклика; гистерезисное управление; динамическое масштабирование; пороговая система; преобразование Лапласа-Стилтьеса.
Gorbunova A.V.1, Samouylov K.E.1, Sopin E.S.1-2
1 RUDN University, Moscow, Russia
2 Institute of Informatics Problems, FRC CSC RAS, Moscow, Russia
RESPONSE TIME ANALYSIS IN TERMS OF LAPLACE-STIELTJES TRANSFORM FOR CLOUD COMPUTING SYSTEM WITH HYSTERETIC CONTROL AND LIMITED
SIMULTANEOUS ACTIVATIONS
ABSTRACT
In the paper, cloud computing system with dynamic scaling is analyzed in terms of multiserver queuing system with hysteretic control of active server numbers based on queue length thresholds, and noninstantaneous server activation. To decrease computing complexity of the algorithms for evaluation of response time characteristics, we provide the analysis under simplifying assumption that only three servers may run activation procedures simultaneously. Recurrent algorithm for Laplace-Stieltjes transform of the response time and the sojourn time is developed. The algorithm is used to analyze response time characteristics of a cloud computing system.
KEYWORDS
Cloud computing; response time; hysteretic control; dynamic scaling; Laplace-Stieltjes transform. Введение
Под облачными вычислениями (англ. cloud computing) обычно понимается предоставление пользователю компьютерных ресурсов и мощностеи в виде интернет-сервиса. Системы облачных вычислении применяются для хранения и обработки данных, для распределенных вычислении при решении научных и коммерческих задач. Современные облачные системы проектируются, как правило, масштабируемыми, что позволяет системе справляться с высокои нагрузкои и иметь возможность снизить энергопотребление в периоды снижения нагрузки.
Проблема недостаточного использования ресурсов возникает вследствие того, что их
распределение обычно происходит в соответствии с пиковой нагрузкой, которая может длиться только в течение короткого периода времени. Затем происходит переход в состояние простоя, но при этом потребляемая мощность может по-прежнему составлять около 50% от пиковои, что вызывает значительные потери энергии.
Вообще говоря, методы повышения энергетическои эффективности и энергосбережения можно условно разделить на три категории: изменение рабочеи нагрузки, влияние на поведение пользователе^ перенастроика ресурсов. Идея первого заключается в использовании дополнительного устроиства между сервисом и пользователем, которое изменяет интенсивность входящего трафика посредством буферизации: увеличивает продолжительность «спящего» режима и удлиняет периоды высокои загрузки [9]. Если же говорить о втором подходе, то положительным опыт внедрения мер стимулирования потребителеи к энергосбережению имеется, в частности, у энергетических компании. Применение системы тарификации, предполагающеи значительное снижение стоимости электроэнергии в периоды низкои активности, например, ночью, побуждает потребителеи к использованию электричества хотя бы отчасти в ночное время, что в свою очередь, приводит к выравниванию рабочеи нагрузки. Однако у этих методов имеется существенный недостаток, которыи заключается в снижении качества оказываемых услуг, что является нарушением SLA.
Одним из способов реализации третьего подхода является динамическая активация виртуальных машин [5,10]. Иными словами, регулируется количество ресурсов (серверов, машин) в зависимости от текущеи нагрузки [6-8]. При анализе таких систем применяются модели с пороговым управлением обслуживанием, в том числе, с гистерезисным управлением количеством включенных приборов [2,4]. При этом основнои проблемои при моделировании облачных систем с помощью методов теории телетрафика является высокая вычислительная сложность получаемых в результате алгоритмов [1]. В [4] исследована система с гистерезисным управлением обслуживанием для анализа предоставления услуги видео по требованию, стационарные характеристики системы получены с помощью матричных методов, которые не применимы для анализа современных облачных платформ из-за высокои вычислительнои сложности. В [10] система с гистерезисным управлением обслуживанием применена для анализа облачных систем с конечным числом приборов, а для случая трех приборов получен эффективныи вычислительныи алгоритм расчета стационарных характеристик функционирования облачнои системы, имеющии линеиную сложность. Однако слабои сторонои предложеннои модели является чрезвычаино большая мощность пространства состоянии, которая имеет квадратичную зависимость от количества серверов. Поэтому в даннои статье мы рассмотрим упрощенную модель с уменьшенным пространством состоянии благодаря наложению ограничения на максимальное количество одновременно возможных активации, и проведем анализ ее характеристик с помощью известных своиств преобразования Лапласа-Стилтьеса, алгоритм получения которого и будет предложен в даннои работе. Статья является развитием работы [10], а также продолжением работы [3], в которои был разработан эффективныи алгоритм вычисления стационарных вероятностеи и показателеи качества функционирования системы.
Математическая модель
Рассматривается система облачных вычислении с гистерезисным подключением и отключением дополнительных виртуальных машин в виде многолинеинои системы массового обслуживания с K приборами, часть которых может быть не активна, и конечнои емкостью системы R. В систему поступает пуассоновскии поток заявок с параметром X . Считаем, что приборы являются однородными, время обслуживания распределено по экспоненциальному закону с параметром р.
В пустои системе активным, т.е. готовым при поступлении заявки мгновенно начать ее обслуживание, является один прибор. При поступлении заявок в систему активация приборов происходит не мгновенно, при этом количество активных приборов определяется числом заявок в очереди, в которои установлены парные пороги, заданные значениями векторов Н = (H^H2,...,Hк_i) Hi < H2 <... < Hк_i, и L = (Li,L2,...,Lk_i) , Li < L2 <... < LK_X, где LM <Ht, i = 1, K _ 2 и Lt < Ht, i = 1, K _ 1. Заявки обслуживаются в порядке поступления, т.е. очередь имеет дисциплину FCFS (First Come First Served). При поступлении на прибор заявка сохраняет место в очереди. Кроме того, накладывается ограничение на число одновременных активации, которых не должно быть больше трех. Таким образом, когда в системе уже запущено два процесса активации, то при возникновении необходимости в запуске третьего дополнительного прибора его активация происходит мгновенно.
Правила работы системы следующие:
1. Если в системе уже есть H¡ заявок, то при поступлении новой заявки активируется (подключается) один (¡' +1) -и дополнительным прибор, но не мгновенно, а через случаиное время, имеющее экспоненциальное распределение с параметром а ;
2. Если в системе находится Li заявок и при этом одна заявка обслужилась, то (¡' +1) -и прибор мгновенно отключается, либо, если он не был активен, останавливается процедура его активации.
Функционирование системы описывается Марковским процессом X(?) с множеством состоянии
0 < п < Нх, k = 1, i = 1
S =
(k, i, n)
Lk_1 < n < Hk, к = 2, i = к _1, к
Lk_1 < n < Hk, к = 3, K _ 1, i = к _ 2, к
Lk_1 < n < R, к = K, i = к - 2, к
где к - необходимое количество приборов; i - количество активированных приборов; n -количество заявок в очереди. Для выбранного расположения пороговых значении относительно друг друга диаграмма интенсивностеи переходов для системы с K = 5 приборами представлена на рисунке 1.
(I)
' "А- ¡г "A -4 -i
level 1,1
(TV)f(5.5,ii ... 5-5.Hi ... 5,5,L5_l! ... 55Н. + 1 ...(5ДЯ) -'5$ sS..........'5$ ........5$
Рис.1. Диаграмма интенсивностей переходов для системы с K=5 приборами
Метод вычисления преобразования Лапласа-Стилтьеса для времени отклика системы
Для того чтобы составить объективное мнение о поведении времени отклика системы, недостаточно знать только среднее значение этой случайной величины. Для всей полноты картины, а также для решения актуальных практических задач наряду с математическим ожиданием желательно иметь представление о значениях дисперсии и моментов высших порядков. В этои связи определение функции распределения времени отклика - в нашем случае в терминах преобразования Лапласа-Стилтьеса (ПЛС) - приобретает особую важность.
Обозначим Ут,п(5) - ПЛС времени ожидания т -и в очереди заявки, если система находится в состоянии (к, ¡, п). В случае, когда т < ¡, время ожидания равно нулю, а значит
Укт,п (5) = 1, т < ¡. (1)
В остальных случаях будут справедливы рекуррентные соотношения, полученные, исходя из следующих соображении: время ожидания т -и в очереди заявки, если система находится в состоянии (к, ¡, п), складывается из суммы двух времен, а именно времени, проведенного в ожидании перехода в одно из следующих возможных состоянии и времени пребывания заявки в очереди в ожидании обслуживания, оставшегося уже после совершения этого шага, проделав которьш, естественно, что заявка может сменить свое местоположение в очереди. Теперь, воспользовавшись формулои полнои вероятности, запишем следующие соотношения для различных состоянии системы:
Кк,п (5 ) =~.-^-1 (5 ) + 1-Г-Кк,п+1 О X
Л + кр + 5 Л + кр+ 5 (2)
1 < к < К, Lk_ 1 < п < Нк;
Vть 1 (5) = у^-УДк-^ 1_1 (5) + —Л-Vть 1+1 (5), 2 < к < К; (3)
1 л+ кр + 5 1 л+ кр + 5 1
Уктк,Нк (5) = —^кг-¥т7к-1(5) + -КГ+1,к,Нк +1(5), 1 < к < К -1; (4)
Л + кг + 5 Л + кг + 5
VIК * (5) = ¥К— УктКкя-1(5); (5)
Кг + 5
1/т ( \ __(к 2)г тут-1 / \ . Л тг т / \ .
Кк к-2,п (5) " л+ (к-2)г + 2а + 5 Ук к-2,п-1 (') + Л + (к-2)г + 2а + 5 Ук к-2п+1 (5) + 1 2а -У™ ,я (5), 2 < к < К, Ьк-1 < п < Нк;
(6)
Г + (к -2)г + 2а + 5
тут / \ __(к 1)г тут-1 / \ . Л тут / \ .
Ук,к-1,п (5) _ 7] 77 Ук,к-1,п-1 (5) +~л 7~1 ^ ч к,к-1,п+1(5) +
л+ (к -1)г+ а + 5 л+ (к - 1)г+)а + 5
а
' -Укткп (5), 2 < к < К, Ьк-1 < п < Нк;
Г+ (к -1)г+ а + 5
тгт / \ __(к 2)г ту т-1 / \ . Л тг т / \ .
Ук к-1(5) " л + (к-2)г+ 2а + 5 ^ и--1 (5) + л+ (к-2)г+ 2а + 5 Ук к-1+1 (5) +
+-—-Уктк 1Ь (5), 2 < к < К;
Г+ (к -2)г+ 2а + 5 к,к- 1,Ьк-1
тут / \ __(к 1)г тут-1 / \ . Л тут / \ .
Ук ,к-1,Ьк-1) " л+ (к-1)^+ а + 5 Ук- 1'к"1,Ьк--1 (5) + л+ (к-1)г+ а + 5 ,к- 1-Ь-1+1 (5) +
а ¥™к,Ьк-1 (5), 2 < к < К;
(7)
(8)
(9)
Л + (к -1)г+ а + 5
тгт / \ __(к 2)г тгт-1 / \ . Л 1/т { \ л.
Ук,к-2,Нк(5) _ ТТТ1 тч То ^ Ук,к-2,Нк-1(5) + о , ^ "т; : Ук+1,к-1,Нк+1(5) + к Л + (к -2)г+ 2а + 5 к л + (к -2)г+ 2а + 5 к
+-2а-Укк 1Н (5), 2 < к < К-1;
Л + (к-2)г+ 2а + 5 к,к- 1,Нк
тт-т / \ __(k T/'m-1 / \ | ^ ту m / \ .
Vk,k-i,Hk(s) ~ TTTi n ! ! Vk,k-i,Hk-i(s)+ TTT n ! ! Vk+i,k-i,Ht+1(s)+
k Л + (k - i)u+ а + s k Ä+ (k - 1 ш + а + s k , „
(11)
+-а-VmkH (s ), 2 < k < K -1;
Ä + (k -1)^+ а + s k,k,Hk
VKm,M (s) = ,--Vmjh (s) + . {f~°)а-VKmMfi (s), 1 < i < K. (12)
iß + (K - i)a + s iß + (K - i)a + s
Далее на основе рекуррентных соотношении (1)-(12) составляется алгоритм уже для вычисления ПЛС V'jn (s), с помощью которого можно наити ПЛС V(s) времени ожидания и ПЛС W (s) времени пребывания заявки в системе:
V (*) = ^ (5); (13)
(к .¡»еХ
W (5) =—^ V (5), (14)
где жк1п - стационарные вероятности для соответствующих состоянии (к, ¡, п), алгоритм вычисления которых приведен в [3]. Последовательность применения рекуррентных формул для вычисления Ук,п (5) в силу громоздкости ее описания приводить не будем, но заметим, что в
качестве первых шагов итерации следует рассматривать ПЛС для времени ожидания обслуживания заявки, стоящеи первои в очереди, постепенно отдаляя ее от обслуживающих приборов.
Задача обращения ПЛС для времени ожидания начала обслуживания и времени отклика системы в случае большого объема накопителя и, соответственно, значении парных порогов активации и отключения дополнительных приборов, представляет собои значительную вычислительную трудность. Однако благодаря своиствам ПЛС, в частности, тому, что п -и момент случаинои величины £ равен:
Е£п = (-1) пж(п)(0),
где ж(п)(0) - это значение п -и производнои ПЛС случаинои величины £ в нуле, возможно вычислить моменты высших порядков и составить полноценное представление о поведении исследуемых случаиных величин.
Численный пример
Рассмотрим применение разработанного метода расчета временных характеристик модели системы облачных вычислении в терминах преобразования Лапласа-Стилтьеса для следующего набора данных: число приборов К = 4, максимальная длина очереди R = 75 , векторы нижних и верхних порогов L = (10,20,30), Н = (25,35,45), интенсивность обслуживания заявок ¡ = 1.
Интенсшностк (ходящего потока
Рис.2. Математическое ожидание времени отклика
На рисунке 2 изображены графики зависимости среднего времени отклика от интенсивности входящего потока Л для различных значении параметра а экспоненциального времени активации дополнительных приборов, на которых в целом наблюдается рост математического ожидания, что вполне естественно для увеличения значении интенсивности входящего потока. При а = 0.1 колебания среднего времени отклика незначительны, и с ростом Л кривая сглаживается, поскольку большую часть времени заявки проводят в ожидании начала обслуживания. Для двух других значении а на графиках более четко выражены локальные минимумы, что объясняется выигрышем во времени при небольших значениях загрузки системы за счет быстрого и своевременного подключения дополнительных приборов.
2.5 3 3.5
Интенсивность входящего потока
Рис.3. Дисперсия времени отклика
Как видно из рисунка 3, на графике дисперсии тоже присутствуют локальные минимумы, что также вызвано вышеописаннои причинои. При малом значении а = 0.1 система ведет себя более определенно, так как серверы в преобладающем большинстве случаев не успевают вовремя подключиться и заявкам приходится длительную часть времени пребывать в очереди. При больших значениях а наблюдаются скачки, в частности, локальныи максимум при Л = 4 .
Заключение
Разработанный метод расчета временных характеристик модели системы облачных вычислении в терминах преобразования Лапласа-Стилтьеса в сочетании с полученными ранее результатами позволяет с высокои точностью получить оценки важнеиших показателеи качества обслуживания, на которые следует ориентироваться при расчете и проектировании облачных систем. Однако, для реальных систем облачных вычислении, где вычислительные облака включают тысячи серверов и обеспечивают ресурсами десятки тысяч приложении, которые одновременно используют миллионы пользователеи, размерность пространства состоянии модели создает вычислительные трудности, даже несмотря на линеиную вычислительную сложность предложенного в статье алгоритма. Поэтому задачеи дальнеиших исследовании является разработка приближенного метода оценки показателеи производительности модели системы облачных вычислении.
Исследование выполнено при частичной финансовой поддержке РФФИ в рамках научных проектов № 14-07-00090,15-07-03051,15-07-03608.
Литература
1. Basharin G.P., Gaidamaka Yu.V., Samuilov K.E. Mathematical teletraffic theory and its application to the analysis of the next generations multiservice networks / / Automatic control and computer sciences, Latvia, Riga: Institute of electronics and computer science of the Latvian university. - 2013. - №. 2. - P. 11-21.
2. Гайдамака Ю.В., Печинкин А.В., Разумчик Р.В., Самуйлов А.К., Самуйлов К.Е., Соколов И.А., Сопин Э.С., Шоргин С.Я. Распределение времени выхода из множества состояний перегрузки в системе M | M | 1 | <L,H> | <H,R> с гистерезисным управлением нагрузкой // Информатика и ее применения. - 2013. - Т. 7, Вып. 4. - С. 20-33.
3. Gaidamaka Yu., Sopin E., Talanova M. A simplified model for performance analysis of cloud computing systems with dynamic scaling // Proc. of the 18th International Scientific Conference "Distributed Computer and Communication Networks: Control, Computation, Communications" DCCN-2015, М.: ИПУ РАН, 2015. - P. 75-86
4. Golubchik L., Lui J.C.S. Bounding of Performance Measures for Threshold-Based Queuing Systems: Theory and Application to Dynamic Resource Management in Video-on-Demand Servers // IEEE Trans. Computers. - 2002. - Vol. 51, №. 4. - P. 353372.
5. Goswami V., Patra S.S., Mund G..B. Performance Analysis of Cloud with Queue-Dependent Virtual Machines // Proc. of 1st Int'l Conf. on Recent Advances in Information Technology, Dhanbad, India. - 2012. - P. 357-362.
6. Kaxiras S., Martonosi M. Computer Architecture Techniques for Power-Efficiency // Synthesis Lectures on Computer Architecture. - 2008. - Vol. 3, №. 1. - Pp. 1-207.
7. Lin M., Wierman A., Andrew L.L.H., Thereska E. Dynamic right-sizing for power-proportional data centers / / INFOCOM, Proceedings IEEE. - 2011. - P. 1098-1106.
8. Meisner D., Gold B.T., Wenisch T.F. Powernap: eliminating server idle power // CM SIGPLAN Notices. - 2009. - Vol. 44. - P. 205-216.
9. Nedevschi S., Popa L., Iannaccone G., Ratnasamy S., Wetherall D. Reducing network energy consumption via sleeping and rate-adaptation / / Proceedings of the 5th USENIX Symposium on Networked Systems Design and Implementation, NSDI'08, Berkeley, CA, USA. USENIX Association. - 2008. - P. 323-336.
10. Shorgin S.Y., Pechinkin A.V., Samouylov K.E., Gaidamaka Y.V., Gudkova I.A., Sopin E.S. Threshold-based Queuing System for Performance Analysis of Cloud Computing System with Dynamic Scaling // Proc. of the 12 th International Conference of Numerical Analysis and Applied Mathematics ICNAAM-2014, Rhodes, Greece, 2014, USA, AIP Publishing - 2015. - Vol. 1648.
- P. 1-3.
References
1. Basharin G.P., Gaidamaka Yu.V., Samuilov K.E. Mathematical teletraffic theory and its application to the analysis of the next generations multiservice networks / / Automatic control and computer sciences, Latvia, Riga: Institute of electronics and computer science of the Latvian university. - 2013. - №. 2. - P. 11-21.
2. Gaydamaka Yu.V., Pechinkin A.V., Razumchik R.V., Samuylov A.K., Samuylov K.E., Sokolov I.A., Sopin E.S., Shorgin S.Ya. Raspredelenie vremeni vykhoda iz mnozhestva sostoyaniy peregruzki v sisteme M | M | 1 | <L,H> | <H,R> s gisterezisnym upravleniem nagruzkoy / / Informatika i ee primeneniya. - 2013. - T. 7, Vyp. 4. - S. 20-33.
3. Gaidamaka Yu., Sopin E., Talanova M. A simplified model for performance analysis of cloud computing systems with dynamic scaling // Proc. of the 18th International Scientific Conference "Distributed Computer and Communication Networks: Control, Computation, Communications" DCCN-2015, М.: ИПУ РАН, 2015. - P. 75-86
4. Golubchik L., Lui J.C.S. Bounding of Performance Measures for Threshold-Based Queuing Systems: Theory and Application to Dynamic Resource Management in Video-on-Demand Servers // IEEE Trans. Computers. - 2002. - Vol. 51, №. 4. - P. 353372.
5. Goswami V., Patra S.S., Mund G..B. Performance Analysis of Cloud with Queue-Dependent Virtual Machines // Proc. of 1st Int'l Conf. on Recent Advances in Information Technology, Dhanbad, India. - 2012. - P. 357-362.
6. Kaxiras S., Martonosi M. Computer Architecture Techniques for Power-Efficiency // Synthesis Lectures on Computer Architecture. - 2008. - Vol. 3, №. 1. - Pp. 1-207.
7. Lin M., Wierman A., Andrew L.L.H., Thereska E. Dynamic right-sizing for power-proportional data centers // INFOCOM, Proceedings IEEE. - 2011. - P. 1098-1106.
8. Meisner D., Gold B.T., Wenisch T.F. Powernap: eliminating server idle power // CM SIGPLAN Notices. - 2009. - Vol. 44. - P. 205-216.
9. Nedevschi S., Popa L., Iannaccone G., Ratnasamy S., Wetherall D. Reducing network energy consumption via sleeping and rate-adaptation / / Proceedings of the 5th USENIX Symposium on Networked Systems Design and Implementation, NSDI'08, Berkeley, CA, USA. USENIX Association. - 2008. - P. 323-336.
10. Shorgin S.Y., Pechinkin A.V., Samouylov K.E., Gaidamaka Y.V., Gudkova I.A., Sopin E.S. Threshold-based Queuing System for Performance Analysis of Cloud Computing System with Dynamic Scaling // Proc. of the 12 th International Conference of Numerical Analysis and Applied Mathematics ICNAAM-2014, Rhodes, Greece, 2014, USA, AIP Publishing - 2015. - Vol. 1648.
- P. 1-3.
Поступила 21.10.2016
Об авторах:
Горбунова Анастасия Владимировна, ассистент кафедры прикладной информатики и теории вероятностей Российского университета дружбы народов, [email protected];
Самуйлов Константин Евгеньевич, заведующий кафедрой прикладной информатики и теории вероятностей Российского университета дружбы народов, доктор технических наук, профессор;
Сопин Эдуард Сергеевич, доцент кафедры прикладной информатики и теории вероятностей Российского университета дружбы народов, старший научный сотрудник Института проблем информатики Федерального исследовательского центра «Информатика и управления» РАН, кандидат физико-математических наук.