#
Вестник РУДН. Серия МИФ
ИиБК Лоигпа1 of М1РЬ
http://journals.rudn.ru/miph
2018 У01. 26 N0. 1 13-27
УДК 519.21
БС! 10.22363/2312-9735-2018-26-1-13-27
Обзор систем параллельной обработки заявок. Часть II А. В. Горбунова*, И. С. Зарядов*1", К. Е. Самуйлов*
* Кафедра прикладной информатики и теории вероятностей Российский университет дружбы народов ул. Миклухо-Маклая, д. 6, Москва, Россия, 117198 ^ Институт проблем информатики Федеральный исследовательский центр «Информатика и управление» РАН ул. Вавилова, д. 44, кор. 2, Москва, Россия, 119333
Данная работа является продолжением обзора методов исследования системы массового обслуживания вида «£эгк-]эт» (в западной классификации) или системы с расщеплением запросов. Интерес к рассматриваемой системе объясняется широким спектром задач, которые могут быть решены с её помощью, поскольку фактически речь идёт о параллельной обработке данных и их приложениях. К примеру, это может касаться анализа работы дисковых массивов, облачных вычислений, высокопроизводительных сервисов и даже процесса комплектации заказов на складе. Если в первой части обзора были описаны особенности построения данной модели и родственных ей систем, а также приведено подробное описание подхода к получению точного выражения среднего времени отклика в случае двух приборов и представлено несколько методов приближенного анализа данной характеристики в случае, когда число приборов больше двух, то во второй части обзора представлено описание других существующих методов аппроксимации среднего времени отклика. В частности, к рассматриваемым подходам приближенного анализа времени отклика относятся: матрично-геометрический метод, анализ с помощью порядковых статистик для различных типов распределения времени пребывания подзапросов.
Ключевые слова: система массового обслуживания, расщепление заявок, параллельное обслуживание, параллельная обработка, время отклика, время синхронизации, матрично-геометрический метод, порядковые статистики
Наряду с такими методами аппроксимации среднего времени отклика системы с расщеплением запросов, как эмпирический подход и интерполяция с помощью предельных значений загрузки системы [1], отдельного внимания заслуживают матрично-геометрический метод и анализ с помощью порядковых статистик, которому посвящена большая часть статьи, поскольку известные результаты теории порядковых статистик позволяют расширить ряд изучаемых распределений для входящего потока и времени обслуживания, а также оценить не менее важные характеристики для рассматриваемой системы: математическое ожидание и дисперсию времени синхронизации. Под временем синхронизации здесь фактически подразумевается её задержка, т.е. время между окончанием обслуживания первого и последнего подзапросов одного запроса [2].
Статья организована следующим образом: в разделе 2 описываются особенности и результаты применения матрично-геометрического метода к анализу системы с расщеплением запросов, в разделе 3 представлен подход к анализу среднего времени отклика, основанный на теории порядковых статистик, в заключении кратко подведены итоги работы.
Статья поступила в редакцию 5 ноября 2017 г.
Публикация подготовлена при поддержке Программы РУДН «5-100» и при финансовой поддержке РФФИ в рамках научных проектов № 18-07-00576, 16-07-00766.
1. Введение
2. Анализ с помощью матрично-геометрического метода
Идея использования матрично-геометрического подхода при анализе fork-join систем в большинстве работ сводится к рассмотрению моделей, аппроксимирующих исходную, непосредственный анализ которых позволяет сделать вывод, что изучаемый процесс, описывающий поведение системы, является квазипроцессом «размножения и гибели» со всеми вытекающими из этого следствиями [3-5]. То же касается и fork-join системы с конечными очередями к серверам в условиях пуассонов-ского входящего потока и экспоненциальных времён обслуживания. Так, в [6,7] был предложен алгоритм, позволяющий свести матрицу вероятностей переходов для марковского процесса, описывающего поведение системы, к блочно-диагональному виду, что даёт возможность компактно записать систему уравнений равновесия (СУР) и решить её одним из известных численных методов и, как следствие, вычислить среднее время отклика.
Матрично-геометрический подход для оценки времени отклика fork-join системы используется в серии статей [8-10]. В первой работе [8] были предложены две модели, аппроксимирующие исходную fork-join систему с К ветвями М\М|1 и различными интенсивностями обслуживания на разных серверах (приборах):
1) поступающий запрос принимается в систему тогда и только тогда, когда число подзапросов к-го типа, находящихся в системе, меньше некоторого фиксированного положительного целого числа Uk: Пк < Uk, к = 2, К, в противном случае он теряется;
2) отказ в обслуживании на j-м сервере происходит тогда и только тогда, когда нарушается условие: n^ — n,j = Ui,j для некоторого i и для фиксированных положительных целых чисел Ui j, = j, причём сервер j блокируется до тех пор, пока подзапрос не закончит обслуживаться на сервере г.
Здесь вектор п = (п\,...,пк,...,пк) отражает состояние системы, Пк — число подзапросов к-го типа в системе, к = 1,К.
В результате анализа обеих систем с помощью матрично-геометрического метода удаётся определить стационарное распределение числа подзапросов в системах ж(п). Далее полученное распределение используется при алгоритмическом решении задачи нахождения функции распределения времени оклика:
FWK,max (X) = V\ K^FwH (Х), Х> 0.
' f * K,max
П
Таким образом, задача сводится к поиску условного распределения времени отклика Fwh (х) при условии, что система находится в состоянии п. Для первой
K, max
модифицированной модели искомое условное распределение может быть выражено с помощью распределения Эрланга, а во втором случае условное распределение получается при анализе процесса поглощения для подзапросов. Кроме того, авторы доказали, что решения, полученные при анализе этих двух систем, являются верхней и нижней границами для функции распределения времени отклика соответственно.
В следующей статье авторов [9] изучается fork-join система с пуассоновским входящим потоком, но при этом время обслуживания на однородных серверах имеет распределение Кокса. Отметим, что для стационарных вероятностей состояний в СМО М\Ck\1 известно точное решение [11]. Как и в предыдущей работе рассматриваются две аналогичные, аппроксимирующие исходную систему модели:
1) модель, в которой все очереди кроме очереди к первому серверу имеют конечную ёмкость;
2) модель, в которой вводится ограничение на то, что разница между каждой парой длин очередей к серверам не должна превышать заданный порог.
Матрично-геометрический анализ указанных систем, предложенный в [12], благодаря тому, что матрицы вероятностей перехода сводятся к блочно-треугольному
виду, позволяет получить стационарные вероятности, которые используются для вывода распределения времени отклика, а, соответственно, и моментов этого распределения. Полученные выражения являются верхними и нижними границами для моментов времени отклика. Следующая работа [10] продолжает начатые исследования. Авторы предлагают алгоритмический метод для вычисления верхних и нижних оценок производительности системы, который, по их мнению, может быть расширен для анализа систем с отличными от пуассоновского входящим потоком и отличным от экспоненциального временем обслуживания на разнородных серверах.
Отметим, что матрично-геометрический метод (МГМ) использовался и при анализе систем, родственных fork-join. Так, МГМ был применён для анализа модели независимых серверов (ISM), в [13] с помощью МГМ анализируется split-merge система [I] с двумя ветвями с наложением ограничения на ёмкость накопителя одной из очередей. Были получены выражения для математического ожидания, дисперсии и функции распределения времени отклика. Также был разработан метод аппроксимации для систем с более чем с двумя ветвями. В работах [14,15] также исследуется fork-join система, но уже с распределением фазового типа для входящего потока и с потерями. В статье [16] рассматривается ещё одна вариация классической fork-join системы, для анализа которой используется МГМ: обслуживание каждого подзапроса происходит в несколько этапов, включая фазу ожидания и фазу объединения родственных подзапросов; существует динамическая политика планирования нагрузки системы для поддержания эффективного использования сервера.
3. Анализ с помощью порядковых статистик
Поскольку время отклика fork-join системы классически определяется как максимум, а в некоторых случаях и как минимум из К случайных величин времён пребывания подзапросов в системе [17], то естественно, что одним из альтернативных способов оценки среднего времени отклика является использование теории порядковых статистик [18-20]. По определению [18-20], если ... — конечная выборка, определённая на некотором вероятностном пространстве (Q,F,P), и для ш £ Q : х% = = 1,..., К, и далее, если перенумеровать последовательность {xi}f=1 в
порядке неубывания таким образом, что Ж(1) ^ Х(2) ^ • • • ^ Х(к-1) ^ ж(к), то такая последовательность будет называться вариационным рядом, а его члены — порядковыми статистиками. Случайная величина же £(&) : £(&)(ш) = X(k) называется к-й порядковой статистикой исходной выборки. Из определения ясно, что
£(i) = min(£i,... ), £(к) = max(£i,...,£x). (1)
Таким образом, время отклика Wk,max = £(к) или Wk,min = £(i) в терминах теории порядковых статистик, где , k = 1, К — положительные случайные величины времён пребывания подзапросов в системе до попадания в буфер синхронизации. Следовательно, математическое ожидание времени отклика можно вычислить, зная распределения экстремальных значений £(i) и £(к), причём функция распределения второй случайной величины фактически является совместной функцией распределения случайных величин £i,... ,£к:
Р£(к) (х) = р (max(£b-. .^К) < х) = Р (£i <Х,...,£К <х) , (®) = р (min(£i,...,£x) < х) = 1 - Р (£i >х,...,£к > х).
Обозначим через Fk (х) — функцию распределения, а через Д (ж) — плотность распределения случайной величины , к = 1, К. Если сделать допущение о том, что £i,... — независимые, что в нашем случае, как уже говорилось выше, является упрощающим предположением, то:
К
(х) = р <х,...,£к <х) = Д Р^х),
1=\ к
(х) = 1 - Р >Х,...,£к >х) = 1 -Д [1 - рг(х)\ ,
¿=1
а п-й момент случайной величины времени отклика можно определить, вычислив интеграл:
сю сю
Е №1тах] « Е =1 хпЪк) (фх, Е « Е =1 хп^1) (х)&х,
где
к . ( ) к к к р ( )
Л(к)(*) = Е Ш ПВД' Л(1)(*) = Е и(х) П1 (х)
Р](Х) 1 -Р](ху
1 1 1 1
Далее, если предположить, что серверы являются однородными, т.е. случайные величины £1,..., £к не только независимы, но и одинаково распределены, а, следовательно, их функции и плотности распределения равны между собой: Рк(х) = Р(х), I к (х) = ¡(х), к = 1, К, то
Р а 1 < х,..., и <х) = РК (х), 1 -Р а 1 > х,..., и > х) = 1 - (1 (х)) и, соответственно,
к
Е
= К I хп/(х)Рк-1(х)6х, Е 31) = К I хп/(х)(1 -Р(х))К-1 ¿х. (2)
Также заметим, что математическое ожидание максимума К н.о.р.с.в. можно представить в виде [21]:
Е Ы м = ! I1 {х)] Ъ
(3)
Для того чтобы проанализировать время отклика, необходимо вычислить указанные интегралы. В зависимости от типа распределения для оценки интегралов могут быть применены численные методы, однако для таких распределений, как экспоненциальное, гиперэкспоненциальное и распределение Эрланга 2-го порядка, распределение Кокса, результат может быть получен в символьном виде [21-23]. Вычислительные затраты увеличиваются с ростом ветвей (К) и увеличением порядка для распределений Эрланга или Кокса. Для уменьшения вычислительных затрат при вычислении максимума может быть использован характеристический максимум [24].
3.1. Экспоненциальное распределение
Допустим, что времена пребывания подзапросов в подсистемах являются независимыми экспоненциально распределёнными случайными величинами с плотностями распределения /к(х) = Хке-ХкХ, х > 0, к = 1,К.
Для того, чтобы определить моменты высшего порядка максимума К независимых экспоненциальных случайных величин, эффективнее с вычислительной точки зрения может быть дифференцирование соответствующее число раз преобразования Лапласа-Стилтьеса (ПЛС) совместной функции распределения максимума К£(К) (з) по 8 ив последующем приравнивание 8 к нулю. В частности, для случая К = 2 функция распределения, плотность распределения и ПЛС [25, 26] равны:
(ж) = ^(ж)^(ж) = 1 - е-ХгХ - е-Х2Х + е-(Х1+Х2)х,
ёЩх) ёж
е
/«(2) (*) = = /1 (*)ВД + /2 да (ж)
= Ме-ХгХ + \2в-Х2Х - (А1 + Л2) е-(Х1+Х2)х,
4(2)(8) = У ¡2(х)е 8Жёж = +
А1 А2 А 1 + А2
8 + А1 8 + А2 8 + А1 + А2 Тогда математическое ожидаемое максимума равно [21,23,25,26]:
= - -¿г
1 1 1
= -г- + 1--
8=0 ^2 А1 + А2
Общее выражение для ПЛС максимума К экспоненциально распределённых случайных величин может быть записано в следующем виде [27]:
г
К (1 )
щК) оо = £ (-1Г1£ Е -,
^=1 ^'=1 т=1 8 +£ \т+1-1)к
1=1
где (т + I - 1)к обозначает сложение по модулю К. Кроме того, ПЛС максимума К независимых экспоненциально распределённых случайных величин с параметрами А = (А1,..., \к) и плотностью распределения /^(К) (А, ж) с ПЛС (А, в) можно представить с помощью рекуррентной формулы [28]:
к \ к 8 + Е ) ^(Ю(Х,в) = Е (Х/з,s), 1 ^ к ^ K,
3 = 1 ) 3 = 1
где «/]» означает исключение \j, т.е. = (А1,..., \j-1 ..., Ато) и ^0(0, в) = 1.
Тогда момент п-го порядка максимума К независимых экспоненциально распределённых случайных величин равен:
Мк (А, п) = ^пМк (А, п - 1) + Е Мк-1 (Х/э ,п)) ^ Хз ) , (4)
К > 1, М0(0, п) = 0 для всех п > 1 и Мк(А, 0) = 1 для всех К > 0.
Рассмотрим ещё одну важную характеристику производительности системы облачных вычислений — время синхронизации. Время синхронизации определяется как
время между поступлением первого и последнего подзапросов одного запроса в буфер синхронизации, иными словами, это разность между максимумом и минимумом из времён пребывания подзапросов в системе:
Е ] = Е [^к,тах] - Е №к,гшп] .
В теории порядковых статистик данная величина называется размахом [18-20]. Одни из первых результатов анализа этого показателя были приведены в работе [2], а именно численное решение оптимизационной задачи по минимизации среднего времени синхронизации. В статье [25] были представлены оценки математического ожидания в случае неоднородных приборов, а в случае однородных приборов (Хк = Х,к = 1,К) получена оценка и для дисперсии времени синхронизации:
1 К-1 1
] - ^ £ ¡2• ¿=1
Вычислить дисперсию исследуемой величины, для определения которой недостаточно знать значения дисперсий случайных величин ^к,тах и Wк,min, можно и в неэкспоненциальном случае, действуя аналогичным образом, а именно пользуясь известными в теории порядковых статистик формулой для функции распределения размаха положительных н.о.р.с.в.:
либо непосредственно формулой для вычисления дисперсии размаха выборки объёма К н.о.р.с.в. с функцией распределения Е(х) [18]:
В ^к ] «В [£(к) - £(1)] =
СЮ
= 2 I (1 -Ек(у) - [1 -Е(х)]к + [Е(у) -Е(х)]к) АхАу - (Е ^к])2 . (6)
-С
3.2. Распределение Эрланга
Формула для аппроксимации среднего времени отклика fork-join системы с распределением Эрланга Ik-го порядка (е¡к), которое представляет собой сумму Ik независимых случайных величин, распределённых по одному и тому же экспоненциальному закону с параметром Xk для времени пребывания в к-й ветви системы, к = 1, К с функцией и плотностью распределения:
1к-1
(XkX)г
F(х) = 1 - е-Хкж V , f(x) ="Tk"L. е-ЛкХ
Xk (Xkx))к \-Хк
^ Ц
г=0
(Ik - 1)!
где Xk ^ 0; Ik = 1, 2,...; х ^ 0, а математическое ожидание равно Ik/Xk, представлена в [29]:
7 г к (
Е [^K,max] ^ 1 - П I
k=1
к 1
1- е-ХкХ V
(Xkx)
dx.
Для случая К = 2:
¿1-1 ¿2-1
Ш\П
2 I 1 12-1/ш + п\
, £=пП=Л т )(\1 + \2)т+п+1
3.3. Распределение экстремальных значений
Ещё один метод вычисления максимума н.о.р.с.в. — это его аппроксимация распределением экстремальных значений [30]. Распределение экстремальных значений представляет собой предельное распределение наибольшего £(к) (наименьшего £(1)) из значений н.о.р. непрерывных с.в. при бесконечном увеличении их числа К ^ то, т.е., говоря иными словами, это предельное распределение наибольшего (наименьшего) выборочного значения при бесконечном увеличении объёма выборки из непрерывного распределения [30], хотя, конечно, нельзя сказать, что распределение экстремального значения — это распределение £(к) при К ^ то, поскольку фактически оно будет вырожденным, поэтому, чтобы получить невырожденное предельное распределение, рассматривают линейное преобразование £(к) с коэффициентами, зависящими от объёма выборки, что в действительности аналогично нормировке, но по большому счету не исчерпывается только последовательностями линейных преобразований [30].
Существует три типа семейств экстремальных распределений [30]:
1) тип I — распределение типа Гумбеля, которое ещё иногда называют дважды экспоненциальным:
/ _ х — а \
2) тип II — распределение типа Фреше:
'0,
Р£(К) (ж) =
ехр
/ж — а\
ж < а,
ж > а,
3) тип III — распределение типа Вейбулла:
Р£(Ю(х)
ехр 0,
/ж — а\ 1
ж < а, ж > а,
где а, 0 > 0 ип> 0 — параметры. Распределения типа II и III приводятся к распределению типа I с помощью преобразований (1п(£(к) — а)) и (— 1п(£(к) — а)), соответственно, поэтому в основном акцент делается на распределении типа Гумбеля, плотность распределения которого имеет вид:
к(ю (ж) = 0 1е « ехр — е «
/ х — а \
а математическое ожидание и дисперсия равны:
Е &к)] = а + ^в, В [£(к)] =
ж
2
6
где 7 « 0, 577721 — это постоянная Эйлера-Маскерони. При а = 0 ив = 1 получается стандартная форма распределения типа I — распределение Гумбеля:
Е^к) (х) = (-е-х) , /кк) (х) = ехр (-х - е-х) . (8)
В [30] упоминается об установленной связи между свойствами генерального распределения Е(х) и типом предельного распределения. Полученные условия, которым, вообще говоря, удовлетворяют далеко не все распределения (например, распределения с «тяжёлыми хвостами»), являются необходимыми и достаточными для сходимости к одному из трёх типов семейств экстремальных значений и касаются поведения Е(х) при больших (малых) значениях х, если речь идёт о наибольших (наименьших) значениях случайных величин. Причём при одном и том же исходном распределении наибольшее и наименьшее значения могут иметь предельные распределения, относящиеся к разным типам. К распределениям, которые удовлетворяют условию сходимости к типу I можно отнести нормальное, экспоненциальное и логистическое, к типу II — распределение Коши, а к типу III — распределения, сосредоточенные на ограниченной сверху части числовой оси [30]. Так, в [20] было показано, что распределение максимального значения £(к) в выборке из случайных величин с экспоненциальным распределением с параметром Л = 1 приближается к распределению Гумбеля в его стандартной форме с ростом объёма выборки, т.е.
£( к) « 1пК + С, Е [£(к)] « 1пК + 7, В [£(к)] «Б[С] «к2/6,
где £ — это случайная величина с распределением Гумбеля с функцией распределения из (8), математическим ожиданием Е[£] =7 и дисперсией = ■к2/6.
Отметим, что для случая, когда каждая порядковая статистика имеет стандартное распределение экстремальных значений типа I из (8), математическое ожидание максимума вычисляется по формуле [30]: Е [£(к)] = а + 76 + вЫК.
3.4. Произвольное распределение
Рассмотрим обобщение вывода в [28] для аппроксимации моментов максимума случайных величин с произвольным распределением [4]. Рассмотрим случайную величину £ = тах (£1, £2), где £к — неотрицательные и независимые с функциями распределения Ек(х), а Кк(в) — это ПЛС этих функций распределения, к = 1,2. Тогда математическое ожидание £ можно выразить следующим образом:
Е[£] = Е [£1] + Р (£2 > £1) Е [£2 - £11£2 > £1] =
С
= Е [£1] + 1 Е1(х)АЕ2 (х) Е [£2 - £1|£2 > £1] .
о
Пусть и о-! — первые два момента случайной величины £1, а ^2 и 02 — случайной величины 2. Тогда, если 1 — экспоненциальная, то
Е [£2 - £1| £2 > £1] = 0-2 .
Далее окончательно получаем следующую аппроксимацию:
Е [Т]=,1 + ,
которая фактически является точным результатом для случая, когда обе случайные величины £1 и £2 имеют экспоненциальное распределение. Таким образом, в общем случае, когда речь идёт о К случайных величинах, необходимо аппроксимировать ПЛС функции распределения максимума (К — 1) случайных величин. Поэтому допустим, что уравнение (4) применимо не только к экспоненциальным случайным величинам. Обозначим М(К, X, а) среднее значение максимума К случайных величин с математическими ожиданиями ^ = (М1,..., мк), А = (м-1,..., и вторыми моментами а = (01,..., ок). Тогда М(К, X, а) можно выразить рекуррентно:
1 к 1
М (к, X, а) = М(к — 1, Х/г, а/г) + з^ж^—^ {Х/г ,Хг) , (9)
г=1
где к = 2,..,К и М(1,Х1,01) = 1 /Х1. Если же все случайные величины имеют одинаковые распределения со средним XI = X и а; = а для 1 ^ г ^ К, то
М(к, X, а) = Х + аХ (Нк — 1).
Результаты моделирования для оценки точности приближения приведены в [28], а также в [31] с использованием уравнения из (2). Рассматриваются следующие распределения: распределение Эрланга 2-го, 3-го и 4-го порядков (е2, £3, е 4) и распределение Парето с функцией распределения вида Рр(ж) = 1 — а(ж + 7)-^, 3 > 2, для 3 = 4 и 3 = 5. Условие 3 > 2 необходимо для того, чтобы первые два момента были конечными, а = 7^ и 7 = 3 — 1, так что т = 1 иМ = 2 + 2/(3 — 2).
Погрешность аппроксимации выражений (9) и (2) мала и для £2, но быстро увеличивается начиная с К = 16, для £3 и £4. Интересно, что оба уравнения дают точные результаты для распределения Парето, а последнее уравнение даёт более точные результаты в обоих случаях.
3.5. Аппроксимация на основе границ моментов порядковых статистик
Если математическое ожидание и дисперсию генерального распределения обозначить м и а2 соответственно, то справедливо [18,19]:
К 1 К 1
ЕКт]«м + а ^25-Т • Е К — а ТЙ—Т •
Поэтому в [18,19] для максимума К н.о.р.с.в. £(к) была предложена аппроксимация следующего вида:
Е &к)] «М + аС(К), (10)
где
К 1
С(К) < . . (11)
Т2К — 1 У 7
Заметим, для экспоненциального распределения справедливо, что С(К) = Нк — 1, а для равномерного распределения выполняется: С(К) = \/3(К — 1)/(К + 1) [27]. Если же математическое ожидание равно нулю, а стандартное квадратическое отклонение равно единице, то, очевидно, Е[£(к)] « С(К). Знак равенства в выражении (11) имеет место для н.о.р.с.в. (£к,к = 1,К) с функцией и плотностью распределения
следующего вида:
(^Г-4 • К (щ11"-1"
где _
^^ <х < V2K-1, Ь = К - 1
К - 1 ' V2К - 1'
Для симметричного распределения F(х) = 1 — F(—х) справедливо:
К
Е [^X,max] <
2(1 — 1/{ 2K-i))
_к-
2К - 1
1/2
Для аппроксимации ожидаемого значения максимума н.о.р.с.в. с нормальным распределением в работе [32] используется С(К) = л/2\п(К) в формуле (10), т.е.:
Е [£(*)] « » + а^2Ы(К). Более точная аппроксимация дана в [30]:
Е [£(К)] ~ » + а
¿шт —1п(ы(К >>— ^—2"<
V ; 2^/2\n(K)
(12)
Стоит отметить, что в уравнении (12) существует некоторый сдвиг (смещение), который корректируется путём вычитания 0,1727К-0,2750 из выражения в скобках в (12) [33]. Таким образом, имеем:
, 1,64492а2
D И 2\n(K) ■
На основе формулы (10) в [34] для случайной величины времени отклика было представлено приближение:
Е [WK,max] ~ Е [Wi ,max] + FkOW^ (Р)<*К (р), (13)
где Е [Wi. max] и awx max обозначают математическое ожидание и среднее квадратиче-ское отклонение времени отклика СМО М|G|1 с коэффициентом загрузки системы р. Напомним, что если времена обслуживания подзапросов распределены по произвольному закону В(х) [4], то
ХЬ (2)
Е [Wi ,max] =Ь +
2(1 — р)
где Ь = f xdB(х), Ь(2) = f x2dB(x), р = ХЬ. Fk определяется из (13) при р = 0 и 00 ак(р) = 1 следующим выражением:
ЬК,max — Ь
Fk =
V Ь (2) — Ь 2'
где ^ = / [1 - В- (х)] dx - математическое ожидание максимума К н.о.р.с.в.
о
с функцией распределения В(х). Легко показать, что для экспоненциального распределения FK = Нк — 1, а для распределения экстремальных значений F— = \/6ln(K)/к [30]. Сравнительный анализ полученного приближения и результатов имитационного моделирования при заданном распределении времени отклика может быть использован для получения выражения ак (р) [34]:
, , Е[^K,max] — E[Wl,max]
ак (р) =-=,-.
FK^Wl,max
Так, например, для fork-join системы с двумя ветвями М\М|1 из выражения (6) следует, что а2 (р) = 1 — р/4.
4. Заключение
В статье рассмотрены подходы к приближенному анализу времени отклика: матрично-геометрический метод, анализ с помощью порядковых статистик для различных типов распределения времени пребывания подзапросов в системе. Также приводятся результаты для математического ожидания и дисперсии времени синхронизации. Стоит отметить, что существуют исследования, посвящённые анализу работы сетей массового обслуживания, в качестве узла или узлов которой выступает система с расщеплением, но обзор подобных работ выходит за рамки поставленной перед авторами задачи.
Литература
1. Обзор систем параллельной обработки заявок / А. В. Горбунова, И. С. Зарядов, К. Е. Самуйлов, Э. С. Сопин // Вестник РУДН. Серия: Математика, информатика, физика. - 2017. - Т. 25, № 4. - С. 350--362.
2. Tsimashenka I., Knottenbelt W. J. Reduction of Subtask Dispersion in Fork-Join Systems // Computer Performance Engineering. — Springer Berlin Heidelberg, 2013. — Pp. 325-336.
3. Башарин Г. П. Лекции по математической теории телетрафика. — Москва: РУДН, 2009. - 342 с.
4. Бочаров П. П., Печинкин А. В. Теория массового обслуживания. — Москва: Изд-во РУДН, 1995. - 529 с.
5. Queueing Theory / P. P. Bocharov, C. D'Apice, A. V. Pechinkin, S. Salerno. — Brill Academic Publishers, 2004. — 457 p.
6. Мокров Е. В., Самуйлов К. Е. Модель системы облачных вычислений в виде системы массового обслуживания с несколькими очередями и с групповым поступлением заявок // T-Comm — Телекоммуникации и Транспорт. — 2013. — Т. 11, № 7. - С. 139-141.
7. Мокров Е. В., Чукарин А. В. Анализ показателей эффективности системы облачных вычислений с миграцией серверов // T-Comm — Телекоммуникации и Транспорт. - 2014. - Т. 8, № 8. - С. 64-67.
8. Balsamo S., Mura I. Approximate Response Time Distribution in Fork and Join Systems // SIGMETRICS Performance Evaluation Review. — 1995. — Vol. 23, No 1. — Pp. 305-306.
9. Balsamo S., Mura I. On Queue Length Moments in Fork and Join Queuing Networks with General Service Times // Computer Performance Evaluation Modelling Techniques and Tools. LNCS. — 1997. — Vol. 1245. — Pp. 218-231.
10. Balsamo S., Donatiello L., Van Dijk N. M. Bound Performance Models of Heterogeneous Parallel Processing Systems // IEEE Transactions on Parallel and Distributed Systems. — 1998. — Vol. 9, No 10. — Pp. 1041—1056.
11. Perros H. G. On the М/Ск/1 Queue // Performance Evaluation. — 1983. — Vol. 3, No 2. — Pp. 83-93.
12. Neuts M. F. Matrix-Geometric Solutions in Stochastic Models: An Algorithmic Approach. — Courier Corporation, 1981. — 332 p.
13. Rao B. M., Posner M. J. M. Algorithmic and Approximation Analyses of the Split and Match Queue // Stochastic Models. — 1985. — Vol. 1, No 3. — Pp. 433-456.
14. Takahashi M., Osawa H., Fujisawa T. On a Synchronization Queue with Two Finite Buffers // Queueing Systems. — 2000. — Vol. 36. — Pp. 107-123.
15. Takahashi M., Takahashi Y. Synchronization Queue with Two MAP Inputs and Finite Buffers // Proc. of the Third International Conference on Matrix Analytical Methods in Stochastic Models. — 2000. — Pp. 375-390.
16. Generalized Parallel-Server Fork-Join Queues with Dynamic Task Scheduling / M. S. Squillante, Y. Zhang, A. Sivasubramaniam, N. Gautam // Annals of Operations Research. — 2008. — Vol. 160, No 1. — Pp. 227-255.
17. Joshi G., Soljanin E., Wornell G. Efficient Redundancy Techniques for Latency Reduction in Cloud Systems // arXiv preprint arXiv:1508.03599. — 2015.
18. David H. A. Order Statistics. — Wiley, New York, 1981.
19. David H. A., Nagaraja H. N. Order Statistics. — John Wiley & Sons, 2003. — 458 p.
20. Gumbel E. J. Statistics of Extremes. — New York: Columbia University Press, 1958. — 375 p.
21. Allen A. O. Probability, Statistics, and Queueing Theory: With Computer Science Applications. — Gulf Professional Publishing, 1990. — 740 p.
22. Kleinrock L. Queueing Systems, Volume I: Theory. — Wiley Interscience, 1975. — 448 p.
23. Trivedi K. S. Probability and Statistics with Reliability, Queueing, and Computer Science Applications (2nd ed.). — John Wiley & Sons, 2002. — 830 p.
24. Gravey A. A Simple Construction of an Upper Bound for the Mean of the Maximum of N Identically Distributed Random Variables // Journal of Applied Probability. — 1985. — Vol. 22. — Pp. 844—851.
25. The Estimation of Probability Characteristics of Cloud Computing Systems with Splitting of Requests / A. V. Gorbunova, I. S. Zaryadov, S. I. Matushenko, E. S. Sopin // Distributed Computer and Communication Networks. DCCN 2016. Communications in Computer and Information Science. — 2016. — Vol. 678. — Pp. 418-429.
26. Самуйлов К. Е., Зарядов И. С., Горбунова А. В. Анализ времени отклика системы облачных вычислений // T-Comm: Телекоммуникации и транспорт. — 2015. — Т. 9, № 11. — С. 57-61.
27. Thomasian A. Analysis of Fork/Join and Related Queueing Systems // ACM Computing Surveys (CSUR). — 2014. — Vol. 47, No 2. — Pp. 17:1-17:71.
28. Harrison P., S. Z. Queueing Models with Maxima of Service Times // Computer Performance Evaluation. Modelling Techniques and Tools. — Springer Berlin Heidelberg, 2003. — Pp. 152-168.
29. Thomasian A., Menon J. RAID5 Performance with Distributed Sparing // IEEE Transactions on Parallel and Distributed Systems. — 1997. — Vol. 8, No 6. — Pp. 640657.
30. Johnson N. L., Kotz S., Balakrishnan N. Continuous Univariate Distributions. — Wiley Series in Probability and Statistics, 1995. — Vol. 1, 752 p.
31. Lebrecht A. S., Knottenbelt W. J. Response Time Approximations in Fork-Join Queues // In Proceedings of the 23rd Annual UK Performance Engineering Workshop (UKPEW'07). — 2007.
32. Arnold B. C. Distribution-Free Bounds on the Mean of the Maximum of a Dependent Sample // SIAM Journal on Applied Mathematics. — 1985. — Vol. 38, No 1. — Pp. 163-167.
33. Petzold M. A Note on the First Moment of Extreme Order Statistics from the Normal Distribution // rapport nr.: Seminar Papers. — 2000.
34. Thomasian A., Tantawi A. N. Approximate Solutions for M/G/l Fork/Join Synchronization // Proceedings of the 26th conference on Winter simulation (WSC'94) / Society for Computer Simulation International. — 1994. — Pp. 361-368.
UDC 519.21
DOI: 10.22363/2312-9735-2018-26-1-13-27
A Survey on Queuing Systems with Parallel Serving of Customers. Part II
A. V. Gorbunova*, I. S. Zaryadov*1", K. E. Samouylov*
* Department of Applied Probability and Informatics Peoples' Friendship University of Russia (RUDN University) 6 Miklukho-Maklaya St., Moscow, 117198, Russian Federation ^ Institute of Informatics Problems Federal Research Center "Computer Science and Control" Russian Academy of Sciences 44-2 Vavilova St., Moscow, 119333, Russian Federation
This paper is a continuation of the survey of the "fork-join" queuing systems (in the western classification) or the systems with splitting of queries. Interest in such systems is explained by a wide range of problems that can be solved with their help, since in fact it is a matter of parallel processing of data and their applications. For example, this may concern the analysis of disk arrays, cloud computing, high-performance services and even the process of picking orders in a warehouse. In the first part of the survey, the main features of the described model (and related systems) and its construction were introduced. Also the detailed description of the approach to obtaining an accurate expression of the average response time in the case of two devices was presented as well as several methods of approximate analysis of this characteristic (the case when the number of devices is more than two). This part of the survey is devoted to the description of other existing methods for approximating the average response time. In particular, the approaches of the approximate analysis of the response time are as follows: the matrix-geometric method, the analysis with the help of order statistics for various types of distribution of the service time of subqueries.
Key words and phrases: queuing system, splitting of requests, parallel service of requests, parallel processing, response time, synchronization delay, matrix geometric method, order statistics
References
1. A. V. Gorbunova, I. S. Zaryadov, K. E. Samouylov, E. S. Sopin, A Survey on Queuing Systems with Parallel Serving of Customers, RUDN Journal of Mathematics, Information Sciences and Physics 25 (4) (2017) 350-362, in Russian.
2. I. Tsimashenka, W. J. Knottenbelt, Reduction of Subtask Dispersion in Fork-Join Systems, in: Computer Performance Engineering, Springer Berlin Heidelberg, 2013, pp. 325-336.
3. G. P. Basharin, Lectures on the Mathematical Theory of Teletraffic, PFUR, Moscow, 2009, in Russian.
4. P. P. Bocharov, A. V. Pechinkin, Queueing Theory, PFUR, Moscow, 1995, in Russian.
5. P. Bocharov, C. D'Apice, A. Pechinkin, S. Salerno, Queueing theory, Brill Academic Publishers, 2004.
6. E. V. Mokrov, K. E. Samouylov, Modeling of Cloud Computing as a Queuing System with Batch Arrivals, T-Comm — Telecommunications and transport 11 (7) (2013) 139-141, in Russian.
7. E. V. Mokrov, A. V. Chukarin, Performance Analysis of Cloud Computing System with Live Migration, T-Comm — Telecommunications and transport 8 (8) (2014) 64-67, in Russian.
8. S. Balsamo, I. Mura, Approximate Response Time Distribution in Fork and Join Systems, SIGMETRICS Performance Evaluation Review 23 (1) (1995) 305-306.
9. S. Balsamo, I. Mura, On Queue Length Moments in Fork and Join Queuing Networks with General Service Times, Computer Performance Evaluation Modelling Techniques and Tools. LNCS 1245 (1997) 218-231.
10. S. Balsamo, L. Donatiello, N. M. Van Dijk, Bound Performance Models of Heterogeneous Parallel Processing Systems, IEEE Transactions on Parallel and Distributed Systems 9 (10) (1998) 1041—-1056.
11. H. G. Perros, On the M/Ck/1 Queue, Performance Evaluation 3 (2) (1983) 83-93.
12. M. F. Neuts, Matrix-Geometric Solutions in Stochastic Models: An Algorithmic Approach, Courier Corporation, 1981.
13. B. M. Rao, M. J. M. Posner, Algorithmic and Approximation Analyses of the Split and Match Queue,_Stochastic Models 1 (3) (1985) 433-456.
14. M. Takahashi, H. Osawa, T. Fujisawa, On a Synchronization Queue with Two Finite Buffers, Queueing Systems 36 (2000) 107-123.
15. M. Takahashi, Y. Takahashi, Synchronization Queue with Two MAP Inputs and Finite Buffers, in: Proc. of the Third International Conference on Matrix Analytical Methods in Stochastic Models, 2000, pp. 375-390.
16. M. S. Squillante, Y. Zhang, A. Sivasubramaniam, N. Gautam, Generalized ParallelServer Fork-Join Queues with Dynamic Task Scheduling, Annals of Operations Research 160 (1) (2008) 227-255.
17. G. Joshi, E. Soljanin, G. Wornell, Efficient Redundancy Techniques for Latency Reduction in Cloud Systems, arXiv preprint arXiv:1508.03599.
18. H. A. David, Order Statistics, Wiley, New York, 1981.
19. H. A. David, H. N. Nagaraja, Order Statistics, John Wiley & Sons, 2003.
20. E. J. Gumbel, Statistics of Extremes, Columbia University Press, New York, 1958.
21. A. O. Allen, Probability, Statistics, and Queueing Theory: With Computer Science Applications, Gulf Professional Publishing, 1990.
22. L. Kleinrock, Queueing Systems, Volume I: Theory, Wiley Interscience, 1975.
23. K. S. Trivedi, Probability and Statistics with Reliability, Queueing, and Computer Science Applications (2nd ed.), John Wiley & Sons, 2002.
24. A. Gravey, A Simple Construction of an Upper Bound for the Mean of the Maximum of N Identically Distributed Random Variables, Journal of Applied Probability 22 (1985) 844—851.
25. A. V. Gorbunova, I. S. Zaryadov, S. I. Matushenko, E. S. Sopin, The Estimation of Probability Characteristics of Cloud Computing Systems with Splitting of Requests, Distributed Computer and Communication Networks. DCCN 2016. Communications in Computer and Information Science 678 (2016) 418-429.
26. K. E. Samouylov, I. S. Zaryadov, A. V. Gorbunova, The Response Time Analysis of Cloud Computing System, T-Comm — Telecommunications and transport 9 (11) (2015) 57-61, in Russian.
27. A. Thomasian, Analysis of Fork/Join and Related Queueing Systems, ACM Computing Surveys (CSUR) 47 (2) (2014) 17:1-17:71.
28. P. Harrison, Z. S., Queueing Models with Maxima of Service Times, in: Computer Performance Evaluation. Modelling Techniques and Tools, Springer Berlin Heidelberg, 2003, pp.152-168.
29. A. Thomasian, J. Menon, RAID5 Performance with Distributed Sparing, IEEE Transactions on Parallel and Distributed Systems 8 (6) (1997) 640-657.
30. N. L. Johnson, S. Kotz, N. Balakrishnan, Continuous Univariate Distributions, Vol. 1, Wiley Series in Probability and Statistics, 1995.
31. A. S. Lebrecht, W. J. Knottenbelt, Response Time Approximations in Fork-Join Queues, in: In Proceedings of the 23rd Annual UK Performance Engineering Workshop (UKPEW'07), 2007.
32. B. C. Arnold, Distribution-Free Bounds on the Mean of the Maximum of a Dependent Sample, SIAM Journal on Applied Mathematics 38 (1) (1985) 163-167.
33. M. Petzold, A Note on the First Moment of Extreme Order Statistics from the Normal Distribution, in: rapport nr.: Seminar Papers, 2000.
34. A. Thomasian, A. N. Tantawi, Approximate Solutions for M/G/1 Fork/Join Synchronization, in: Proceedings of the 26th conference on Winter simulation (WSC'94), Society for Computer Simulation International, 1994, pp. 361-368.
© Горбунова А. В., Зарядов И. С., Самуйлов К.Е., 2018
Для цитирования:
Горбунова А. В., .Зарядов И. С., Самуйлов К. Е. Обзор систем параллельной обработки заявок. Часть II // Вестник Российского университета дружбы народов. Серия: Математика. Информатика. Физика. — 2018. — Т. 26, № 1. — С. 13-27. — DOI: 10.22363/2312-9735-2018-26-1-13-27.
For citation:
Gorbunova A. V., Zaryadov I.S., Samouylov K.E. A Survey on Queuing Systems with Parallel Serving of Customers. Part II, RUDN Journal of Mathematics, Information Sciences and Physics 26 (1) (2018) 13-27. DOI: 10.22363/2312-9735-2018-26-1-13-27. In Russian.
Сведения об авторах:
Горбунова Анастасия Владимировна — кандидат физико-математических наук, ассистент кафедры прикладной информатики и теории вероятностей РУДН (e-mail: [email protected], тел.: +7(495)9550927)
Зарядов Иван Сергеевич — кандидат физико-математических наук, доцент кафедры прикладной информатики и теории вероятностей РУДН, старший научный сотрудник ИПИ ФИЦ ИУ РАН (e-mail: [email protected], тел.: +7(495)9550927)
Самуйлов Константин Евгеньевич — профессор, доктор технических наук, заведующий кафедрой прикладной информатики и теории вероятностей РУДН (e-mail: [email protected], тел.: +7(495)9550956)
Information about the authors:
Gorbunova A. V. — Candidate of Physical and Mathematical Sciences, assistant of Department of Applied Probability and Informatics of Peoples' Friendship University of Russia (RUDN University) (e-mail: [email protected], phone: +7(495)9550927)
Zaryadov I. S. — Candidate of Physical and Mathematical Sciences, assistant professor of Department of Applied Probability and Informatics of Peoples' Friendship University of Russia (RUDN University); Senior Researcher of Institute of Informatics Problems of Federal Research Center "Computer Science and Control" Russian Academy of Sciences (e-mail: [email protected], phone: +7(495)9550927) Samouylov K. E. — professor, Doctor of Engineering Science, head of Department of Applied Probability and Informatics of Peoples' Friendship University of Russia (RUDN University) (e-mail: [email protected], phone: +7(495)9550956)