АНАЛИЗ ПОКАЗАТЕЛЕЙ КАЧЕСТВА ФУНКЦИОНИРОВАНИЯ СИСТЕМ ОБЛАЧНЫХ ВЫЧИСЛЕНИЙ С ГИСТЕРЕЗИСНЫМ
УПРАВЛЕНИЕМ
Сопин Эдуард Сергеевич,
Доцент кафедры прикладной информатики и теории вероятностей, Российский университет дружбы народов РУДН, Москва, Россия, [email protected]
Таланова Маргарита Олеговна,
Ассистент кафедры прикладной информатики и теории вероятностей, Российский университет дружбы народов РУДН, Москва, Россия, [email protected]
Гайдамака Юлия Васильевна,
Доцент кафедры прикладной информатики и теории вероятностей, Российский университет дружбы народов РУДН, Москва, Россия, [email protected]
Исследование выполнено при финансовой поддержке РФФИ в рамках научных проектов № 14-07-00090, 15-07-03051, 15-07-03608.
Ключевые слова: облачные вычисления, гистерезисное управление, пороговая система, динамическое масштабирование, метод исключения состояний, время отклика.
С развитием технологий сетей связи последующих поколений системы облачных вычислений превратились в высокопроизводительную вычислительную среду. Они обладают хорошей масштабируемостью и простотой в обслуживании, что приводит к быстрому росту числа облачных приложений и поставщиков облачных услуг. Важным для поставщиков облачных услуг показателем производительности системы является энергоэффективность. При невысокой интенсивности потока задач, поступающих в систему, лишние виртуальные машины отключаются для экономии электроэнергии, и включаются по мере увеличения загруженности системы. С одной стороны, подключение дополнительной виртуальной машины помогает решить большее количество задач и, тем самым, повысить производительность системы. С другой стороны, это приводит к увеличению затрат на обслуживание, а время, необходимое на активацию дополнительных виртуальных машин - к снижению эффективности функционирования. Поэтому для уменьшения числа срабатываний системы управления масштабированием применяется гистерезисный подход. Количество серверов в современных облачных платформах исчисляется тысячами и десятками тысяч, а в наиболее крупных, таких как Windows Azure и Amazon EC2, - сотнями тысяч. Поэтому при разработке методов расчета показателей качества функционирования систем облачных вычислений следует учитывать масштаб задачи и уделить особое внимание эффективности вычислительных алгоритмов. Для анализа показателей производительности модели системы облачных вычислений с динамическим масштабированием, таких как среднее время отклика, среднее число требуемых виртуальных машин, среднее число активированных виртуальных машин, исследована многолинейная система массового обслуживания с гистерезисным управлением количеством включенных приборов на основе порогов длины очереди и немгновенным подключением дополнительных приборов. Для разработки эффективного алгоритма вычисления стационарных вероятностей и показателей качества функционирования системы использован метод исключения состояний. Выбор данного метод обусловлен тем, что он позволяет получить вычислительный алгоритм линейной сложности. Приведен пример численных расчетов основных вероятностно-временных характеристик системы.
Для цитирования:
Сопин Э.С., Таланова М.О., Гайдамака Ю.В. Анализ показателей качества функционирования систем облачных вычислений с гистерезисным управлением // T-Comm: Телекоммуникации и транспорт. - 2015. - Том 9. - №9. - С. 54-60.
For citation:
Sopin E.S., Talanova M.O., Gaidamaka Yu.V. Performance measures analysis of cloud computing systems with hysteretic control. T-Comm. 2015. Vol 9. No.9, рр. 54-60. (in Russian).
Введение
Под облачными вычислениями (англ. cloud computing) обычно понимается предоставление пользователю компьютерных ресурсов и мощностей в виде интернет-сервиса [1]. Системы облачных вычислений применяются для хранения и обработки данных, для распределенных вычислений при решении научных и коммерческих задач. Современные облачные системы проектируются, как правило, масштабируемыми, что позволяет системе справляться с высокой нагрузкой и иметь возможность снизить энергопотребление в периоды снижения нагрузки. Одним из способов реализации этого подхода является динамическая активация виртуальных машин [2-4]. При анализе таких систем применяются модели с пороговым управлением обслуживанием, в том числе, с гистерезисным управлением количеством включенных приборов [5, 6]. При этом основной проблемой при моделировании облачных систем с помощью методов теории телетрафика является высокая вычислительная сложность получаемых в результате алгоритмов [7-9]. В [5] исследована система с гистерезисным управлением обслуживанием для анализа предоставления услуги видео по требованию, стационарные характеристики системы получены с помощью матричных методов, которые не применимы для анализа современных облачных платформ из-за высокой вычислительной сложности. В [3, 4] система с гистерезисным управлением обслуживанием применена для анализа облачных систем с конечным числом приборов, а для случая трех приборов получен эффективный вычислительный алгоритм расчета стационарных характеристик функционирования облачной системы, имеющий линейную сложность. Данная статья является развитием работ [3, 4], а метод вычисления стационарных характеристик системы, позволяющий разработать эффективный вычислительный алгоритм уже для произвольного числа приборов, известный как «метод исключения состояний» [10], был предложен авторам профессором A.B. Печинкиным.
Математическая модель системы
облачных вычислений
Для оценки показателей функционирования опишем систему облачных вычислений с гистерезисным подключением и отключением дополнительных виртуальных машин в виде многолинейной системы массового обслуживания с К приборами, часть которых может быть не активна, и конечной очередью емкости R. На систему поступает пуассоновский поток заявок с параметром Л■ Считаем, что приборы однородные, время обслуживания распределено по экспоненциальному закону с параметром ц .
О"*
QiU
R
н
н.
и
и
к-\
U
L
В пустой системе активным, т.е. готовым при поступлении заявки мгновенно начать ее обслуживание, является один прибор. При поступлении заявок в систему активация приборов происходит не мгновенно, при этом количество активных приборов определяется числом заявок в очереди, в которой установлены парные пороги, заданные значениями векторов Н = (#„#2.....НК_]),И]<Н2<...<НКА,
и .....Ц<Ь2<.«<1кА, где Ц«<Н><Ц+2,
; = Очередь имеет дисциплину FCFS (First Come
First Served). При поступлении на прибор заявка сохраняет место в очереди. Правила работы системы следующие.
1) Если в системе уже есть н. заявок, то при поступлении новой заявки активируется (подключается) один (/+5)-й дополнительный прибор, но не мгновенно, а через случайное время, имеющее экспоненциальное распределение с параметром а .
2) Если в системе находится ц заявок и при этом одна заявка обслужилась, то (/+1)-Й прибор мгновенно отключается, либо, если он не был активен, останавливается процедура его активации.
Обратим внимание, что предположение об экспоненциальное™ распределения времени подключения дополнительного прибора является упрощающим и позволяет разработать эффективный алгоритм расчета стационарных характеристик при сохранении высокой точности оценок основных параметров производительности системы.
Функционирование системы описывается Марковским процессом X{t) с множеством состояний
S =
(■k,i,n)
0<л<//]Д = w = l
Lk _ j < и < Hk,k = 2, К - 1, i=l, К-I Lk {<n<R,k = K,i = lK
Рис, I. Многолинейная система массового обслуживания с порогами Н и L
где к — необходимое количество приборов; / — количество активированных приборов; п — количество заявок в очереди. Для выбранного нами расположения пороговых значений относительно друг друга диаграмма интенсивностей переходов для системы с К -4 приборами показана на рис. 2.
На диаграмме выделены состояния системы, для которых справедливы формулы (1)-{У) для стационарных вероятностей, представленные ниже. Для иного расположения порогов в формулах поменяются только границы, для которых они применимы.
Алгоритм вычисления стационарного
распределения
Для вычисления стационарных вероятностей использован метод исключения состояний, подробно описанный в [10]. Введем дополнительные вероятности и интенсивности, аналогично [4]:
Щ
in+%
Lk-\ S « < - Ь
, + 1 < я < Hk
- а7гк,:-\л + ak.i.n+\Ak.i.n+] - <n< 11 k;
Стационарные вероятности для состояний (k,i,n) при к~2,К-\, i = l,k-\ вычисляются по формулам (II) и (III).
Akj,„+^Un.^UkJnHk.UM . - . -. СО
я ---, , Lk_, < л < Lk -2. Lk<„< Hk
Aju^ + ^b./H+MVi-w/, , , ,. (Ill)
+ -a,,-j
где начальная вероятность nkiL х := 0 •
Вспомогательные вероятности и интенсивности, используемые в формулах (II) и (111), вычисляются по рекуррентным соотношениям (8)-(22).
_ _ ifJ
(2) Стационарные вероятности для состояний (£,/',«) при
к = К, ¡ = 1,А—1 вычисляются по формуле (IV).
+ , , . , „ (IV)
як.к»=-—:—т.—^--гт:-"ч—- у '
где начальная вероятность К ,•=[}•
Вспомогательные вероятности и интенсивности, используемые в формуле (IV), вычисляются по рекуррентным соотношениям (23)-(30).
(3)
(4)
(5)
(6)
i/i+{k~-i) ог+Л(1- аш+!)' Lk_¡ + \<n<Lk~2, Lk<n<Hk-
(8) (9)
m
i¡i + (k~i)a + Á(l~akjy
«и =
ЛС,
к.i
X + {k-i)a'
0. Lk^ <n< Hk; Akj.n = (*■-( +1)axkJ_Ul + akJjl+ ,AiJjI+l, Lk<n<Hk; (14)
v=n
(IS)
с« =
'U
h, ,+i
Lt„-2 H,+1
ft W <[6>
A i
'A
, r-i ,, (17)
,, , ,/, \*+V 11 11 "Í+Ij.H'
«i-l+l
4./.» = П °*.<>> Lk -1 S/IÉ/^.,; 4u = + (I - ) -7777 ;
Akj,n = 4./ П Аы -2.
(18)
(19)
(20) (21) (22)
iju
k,i,n
, Lk_x +1 < л < Л 1
Akj.H+1
Ли.п:=0- Aw*"**!
ль> + ДА,„+|, ¿í-, < и < й -
//,_,+2<«</f; у—и+1
(23)
(24)
(25)
(26)
(27)
(28)
(29)
(30)
Стационарные вероятности для состояний при
А =АГ, / = А вычисляются по формуле (V).
(V)
Akjj> + ^^.i.»-] , . и . п =-—-> £(_,<«</?-
(10)
(И)
(12) (13)
'М
где начальная вероятность К. ,, , — о.
í.I.Í.,,,-1
Вспомогательные интенсивности, используемые в формуле (V), вычисляются по рекуррентному соотношению (31).
= иI>*j4.B. Lk-(3|)
Для получения стационарных вероятностей положим ft =1. Далее по формулам (l)-(V) вычислим ненормированные вероятности ñk¡„, (kj,n)sSw нормирующую константу q у1 i . Тогда значения стационарных ве~
¿i k,i,л
роятностей равны ^ (k,i,n)mS-
Стационарные характеристики системы
Зная стационарные вероятности состояний системы, можно оценить некоторые вероятностно-временные характеристики исследуемой системы, формулы для расчета которых приведены ниже.
Среднее число заявок в системе: N = £ щ
Среднее число требуемых приборов: ■
К К R
Среднее число занятых приборов:
1=1 и=I
Вероятность блокировки заявки: ж = К
Заключение
Разработанный метод расчета характеристик модели системы облачных вычислений позволяет с высокой точностью получить оценки среднего числа заявок в системе и среднего времени отклика, на которые следует ориентироваться при расчете и проектировании облачных систем. Однако, для реальных систем облачных вычислений, где вычислительные облака включают тысячи серверов и обеспечивают ресурсами десятки тысяч приложений, которые одновременно используют миллионы пользователей, размерность пространства состояний модели создает вычислительные трудности даже несмотря на линейную вычислительную сложность предложенного в статье алгоритма. Поэтому задачей дальнейших исследований является разработка приближенного метода оценки показателей производительности модели системы облачных вычислений. Одним из возможных решений является построение модели СМО с ограничениями на максимальное число дополнительных приборов, которые возможно подключить в то время как очередь растет между соседними значениями порогов.
Авторы благодарят магистра кафедры прикладной информатики и теории вероятностей РУДН Васильева И.Ю. за участие в получении численных результатов.
Литература
1. ETSI Cloud Standards Coordination. Final Report 2013, ver. 1.0, [Электронный ресурс] / Режим доступа: свободный (дата обращения 12,03.2015) http://www.etsi.org/images/files/Events/ 2013/2013_CSC_Dd¡very_WS/CSC-Final_report-013-CSC_Final_ report_v I _0_PDF_format-.PDF,
2. Goswemi, V, Patra, S.S., Mund, G.ß. 2012, 'Performance Analysis of Cloud with Queue-Dependent Virtual Machines', Proc. of I" Int'l Conf. on Recent Advances in Information Technology, Dhanbad, India, pp. 357-362.
3. Печинкин А.В., Гайдамака Ю.В., Co nun Э.С., Таланова M.O. 2014, 'Анализ показателей эффективности функционирования системы облачных вычислений с динамическим масштабированием' Сборник избранных трудов IX Международной ежегодной научно-практической конференции «Современные информационные технологии и ИТ-образование». - М.: ИНТУИТ.РУ. - С. 395-406.
4. Shorgín, ST., Pechinkin, A.V., Samouylov, K.E., Gaidamaka, Y.V., Gudkova, I.A., and Sopin, E.S. 2014-2015, 'Threshold-based Queuing System for Performance Analysis of Cloud Computing System with Dynamic Scaling', Proc. of the 12th International Conference of Numerical Analysis and Applied Mathematics ICNAAM-2014, Rhodes, Greece, 2014, USA, AIP Publishing, 2015, Vol. 1648, pp. 1-3.
5. Golubchik, L, Lui, JCS 2002, Bounding of Performance Measures for Threshold-Based Queuing Systems: Theory and Application to Dynamic Resource Management in Video-on-Demand Servers', IEEE Trans. Computers, vol. 51, no. 4, pp. 353-372.
6. Гайдамака Ю.В., Печинкин Л.В., Разумчик Р.В., Самуилов А.К., Самуйлов К.Е., Соколов И.А., Сопин Э.С., Шоргин С.Я. 2013, 'Распределение времени выхода из множества состояний перегрузки в системе М | М j I | <L,H> | <H,R> с гистерезисным управлением нагрузкой'. Информатика и ее применения. Т. 7, Вып. 4, С.20-33.
7. Башорин ГЛ., Гайдамака Ю.В., Самуйлов К.Е. 2013, 'Математическая теория телетрафика и ее приложения к анализу мультисервисных сетей связи следующих поколений'. Автоматика и вычислительная техника, Латвия, Рига: Институт электроники и вычислительной техники Латвийского университета, Na2. С. 11-21.
8. Мокрое Е.В., Самуйлов К.Е, 2013, 'Модель системы облачных вычислений в виде системы массового обслуживания с несколькими очередями и с групповым поступлением заявок', T-comm: Телекоммуникации и транспорт. М.: ИД «Медиа Паблишер», №1 I. С. I39-Í4I.
9. Мокрое Е.В„ Чукарин А.В, 20 И, 'Анализ показателей эффективности системы облачных вычислений с миграцией серверов', T-Comm: Телекоммуникации и Транспорт, Т.8, № 8. С. 64-67.
10. Bocho го V P.P., D'Apice С., Pechinkin A.V., Salerno S, 2004, 'Queueing Theory', Ultrecht, Boston: VSP Publishing.
MATHEMATICS
PERFORMANCE MEASURES ANALYSIS OF CLOUD COMPUTING SYSTEMS
WITH HYSTERETIC CONTROL
Sopin Eduard, Peoples' Friendship University of Russia, Department of applied probability and informatics, associate professor,
Talanova Margarita, Peoples' Friendship University of Russia, Department of applied probability and informatics, PhD student,
Gaidamaka Yulia, Peoples' Friendship University of Russia, Department of applied probability and informatics, associate professor, [email protected]
This work was partially supported by the RFBR, research projects No. 14-07-00090, 15-07-03051, 15-07-03608. Abstract
Goud computing systems provide a high-performance computational environment available through the Internet. Good scalability and maintenance simplicity lead to rapid growth of cloud applications number and cloud service providers number. Besides performance, one of the most important measure for cloud service providers is energy efficiency of system. For better energy efficiency, in case of light load on the system additional virtual machines are switched off, and switched on again if load increases. On the one hand, adding virtual machines helps to serve bigger number of requests and increases performance of the system. On the other hand, it leads to increase in service costs and activation time of additional virtual machines - to decrease in efficiency. Therefore hysteresis approach is applied to decrease the number of system scaling operations. Developing methods for performance measures calculation of cloud computing system, special attention should be paid to efficiency of algorithm, considering number of virtual machines in modern cloud platforms. In this work we describe behavior of cloud computing system with dynamic scaling in terms of queuing system with threshold-based hysteretic control of active servers number and noninstantanuous server activation. We use state elimination technique to develop efficient algorithm for stationary probabilities calculations and estimation of its performance measures, such as response time of the system, number of the active servers and blocking probability.
Keywords: cloud computing, hysteresis control, threshold-based system, dynamic scaling, state elimination method, response time. References
1. ETSI Cloud Standards Coordination. Final Report 2013, ver. 1.0. Available at: http://www.etsi.org/images/files/Events/2013/2013_CSC_ Delivery_WS/CSC-Final_report-013-CSC_Final_report_v1_0_PDF_format-.PDF. (viewed March 12, 2015).
2.Goswami, V, Patra, S.S., Mund, G.B. 2012, 'Performance Analysis of Cloud with Queue-Dependent Virtual Machines', Proc. of 1st Int'l Conf. on Recent Advances in Information Technology, Dhanbad, India, pp. 357-362.
3. Pechinkin A, Gaidamaka, Yu, Sopin E, Talanova M 2014, 'Performance analysis of cloud computing systems with dynamic scaling', Collection of the chosen works IX of the International annual scientific and practical conference "Modern Information Technologies and IT Education", pp. 395-406. (in Russian)
4. Shorgin, S.Y., Pechinkin, A.V., Samouylov, K.E., Gaidamaka, Y.V., Gudkova, I.A., and Sopin, E.S. 2014-2015, 'Threshold-based Queuing System for Performance Analysis of Cloud Computing System with Dynamic Scaling', Proc. of the 12th International Conference of Numerical Analysis and Applied Mathematics ICNAAM-2014, Rhodes, Greece, 2014, USA, AIP Publishing, 2015, Vol. 1648, p. 1-3.
5. Golubchik, L, Lui, JCS 2002, 'Bounding of Performance Measures for Threshold-Based Queuing Systems: Theory and Application to Dynamic Resource Management in Video-on-Demand Servers', IEEE Trans. Computers, vol. 51, no. 4, pp. 353-372.
6. Gaidamaka, Yu.V., Pechinkin, A.V., Razumchik, R.V., Samuilov, A.K., Samuilov, K.E., Sokolov, I.A., Sopin, E.S., Shorgin, S.Ya. 2013, 'The Distribution of the return time from the set of overload states to the set of normal load states in a system M | M | 1 | <L,H> | <H,R> with hysteretic load control', Informatics and its applications, vol. 7, no. 4, pp.20-33. (in Russian)
7. Basharin, G.P., Gaidamaka, Yu.V., Samuilov, K.E 2013, 'Mathematical teletraffic theory and its application to the analysis of the next generations multiservice networks', Automatic control and computer sciences, Latvia, Riga: Institute of electronics and computer science of the Latvian university, no. 2, pp. 11-21. (in Russian)
8. Mokrov, E.V., Samouylov, K.E. 2013, 'Modeling of cloud computing as a queuing system with batch arrivals', T-Comm, no. 11, pp. 139-141.
(in Russian)
9. Mokrov, E.V., Chukarin, A.V. 2014, 'Performance analysis of cloud computing system with live migration', T-Comm, vol. 8, no. 8, pp. 64-67. (in Russian)
10. Bocharov, P.P., D'Apice, C., Pechinkin, A.V., Salerno, S. 2004, 'Queueing Theory', Ultrecht, Boston: VSP Publishing. (in Russian)