УДК 004.272.43
В.Н. ЕВГРАФОВ
ПОВЫШЕНИЕ ПРОИЗВОДИТЕЛЬНОСТИ БЕЗБУФЕРНЫХ МНОГОСТУПЕНЧАТЫХ СЕТЕЙ МЕТОДОМ ДУБЛИРОВАНИЯ СТУПЕНЕЙ
Швидкодія багатоступеневої мережі є однією з ключових складових загальної швидкодії багатопроцесорної системи. В данній роботі запропонований метод дубліювання ступенів, що приводить до зростання швидкодії мережі за рахунок зменьшення ймовірності блокування. Також побудована математична модель, яка дозволяе оцінити пропускну здатність мережі з дублійованими ступенями.
Performance of the multistage interconnection network is a crucial component of the integral performance of the multiprocessor system. This paper presents a method of stages replication that leads to performance increasing. The analytical model was built that allows estimate throughput of replicated MIN.
Постановка проблемы. Одним из параметров производительности многоступенчатой сети является нормированная пропускная способность памяти (НПСП). НПСП определяется как отношение математического ожидания количества переданных от процессоров к модулям памяти пакетов к среднему числу сгенерированных пакетов за один такт.
N ___
НПСП = £Р?(Р))/NP , (1)
k=1
где q(p) - вероятность того, что в заданном такте было передано р пакетов, а
Np - среднее число сгенерированных за один такт пакетов. НПСП удобно
рассчитывать как сумму уровней потоков данных на входных каналах модулей памяти, деленное на сумму уровней потоков данных на выходных каналах процессорных элементов
N-1 N-1
НПСП = £ рС/М£ r(i)), (2)
j=0 i=0
где p(j) - уровень потока данных на j -м входном канале модуля памяти, а r(i) - уровень потока данных на i -м выходном канале процессорного элемента. В работе [1] были приведены выражения для расчета НПСП многоступенчатой сети. Увеличение отклонения НПСП от единицы при изменении характера трафика, означает увеличение потерь пакетов внутри сети. Необходимо модифицировать сеть, чтобы значение пропускной способности удовлетворяло требованиям производительности в новых условиях. Кроме того, необходимо предоставить средство оценки пропускной способности модифицированной сети.
Анализ литературы. Дитмар Туч и Гюнтер Хомель [2] предложили многослойные многоступенчатые сети, которые являются устойчивыми к сбоям переключающих элементов. В основе работы многослойной сети лежит широковещательный трафик. Каждая ступень сети дублируется в нескольких слоях. Количество слоев на каждой ступени увеличивается в несколько раз. Множитель, на который увеличивается количество слоев, называется фактором роста сети (Ор). На Рис. 1 показана многоступенчатая сеть размера 8x8 с Ор = 2 .
Ъ2
Рис. 1
Для данной сети число слоев удваивается на каждой последующей ступени. Данная архитектура подразумевает, что даже в случае двух широковещательных пакетов на входных каналах, все пакеты могут быть отправлены на выходные каналы. Также исключена излишняя репликация первой ступени. Выбирая Ор надлежащим образом можно гарантировать, что не возникнет внутренней блокировки пакетов. Однако блокировка по-прежнему может иметь место на выходных узлах многоступенчатой сети. В данной статье предлагается новая архитектура сети, которая практически исключает вероятность блокировки пакетов, тем самым, увеличивая пропускную способность. Также представлен метод оценки пропускной способности сети, который может быть использован при любой степени реплицирования для неравномерного трафика. Метод разработан на основе идей, изложенных в статьях [3] и [4]. В работе [5] описана производительность буферной нереплицированной сети в условиях неравномерного трафика.
Цель статьи: разработать метод повышения нормированной пропускной способности памяти путем дублирования ступеней сети; разработать математическую модель позволяющую выполнять оценку пропускной способности памяти и выбирать необходимую степень дублирования для достижения оптимального соотношения цена/производительность.
Дублирование ступеней сети. Основная причина падения пропускной способности сети заключается в наличии внутренних блокировок пакетов. Блокировка происходит в случае, когда на передающий канал поступает более одного пакета. Переключающий элемент случайно выбирает и блокирует один пакет. Процессорный элемент должен переслать заблокированный пакет повторно. Уменьшение вероятности блокировки повлечет увеличение пропускной способности сети и производительности системы в целом. Введем три дополнительных типа переключающих элементов: ПЭ-2х4, ПЭ-4х4, ПЭ-4х2.
Ступени, состоящие из переключающих элементов ПЭ-2х4, ПЭ-4х4 и ПЭ-4х2 обозначим S-2x4, S-4x4 и S-4x2 соответственно. Ступень, состоящую из переключающих элементов ПЭ-2х2, назовем обыкновенной ступенью.
Выполним замену переключающих элементов обыкновенной ступени на дополнительные типы переключающих элементов, как показано на Рис. 2, так чтобы выполнялись следующие условия:
1. Нулевая ступень должна быть либо обыкновенной, либо типа S-2x4.
2. Последняя ступень должна быть либо обыкновенной, либо типа S-4x2.
3. Если ступень £г- есть обыкновенная, то ступень £г+1 либо обыкновенная, либо типа S-2x4.
4. Если ступень Si есть типа S-2x4, то ступень £г-+1 либо типа S-4x4, либо типа S-4x2.
5. Если ступень £г- есть типа S-4x4, то ступень £г+1 либо типа S-4x4, либо типа S-4x2.
6. Если ступень £г- есть типа S-4x2, то ступень £г+1 либо обыкновенная, либо типа S-2x4.
На Рис. 3 изображена многоступенчатая сеть размерности 8x8 с дублированными ступенями. Жирными линиями обозначены каналы, и переключающие элементы, по которым проходят пакеты, предназначеные для горячих модулей памяти.
Рис. 2 148
S-2x4
S-4x4
S-4x2
СЕЕЕ^"
СЕЕ5-
©-
©-
СЕЕ^)-
сЕЕ^
СЕЕ^-
ЭЕ-
ЭЕ2
ЭЕо2 ЭЕ-2
ЭЕ22
ЭЕоэ ЭЕ-э ЭЕ2Э
-^ММ2^
-(Мм^
-(ММ^
-(Мм^)
Рис. 3
Оценка пропускной способности сети базируется на изложеных в статьях [6, 7] свойствах. Расчет пропускной способности т-й ступени S-2x4 выполняется по формуле (2):
рт,5 = Рт,5 = Рт—1,5—1 - (Рт—1,5—1) 2 I 1 I , для 1 < т < п -1,2 < 5 < т + 1;
Рат^ = Рт,5 = 2(Рт-1,с)(^)- 2(Рт-1,о)2(^)2
(3)
для
0 < т < п —1,0 < 5 < 1,
где
Я =
( к —1 ¿1 +£2 —1 ^
(Ж / 2т+1 )д' + (£ д' — *19')(1 — 5) + ( 2] Ч' — £2Ч>
=£
¿1 +¿2 —1
(Ж/2т — к1 — к2)д' + 2] Ч'
--
'=0
Расчет пропускной способности т-й ступени £-4x4 выполняется по формуле (3):
й и ^ и й . 1 / й ч2 и ,1/ й ч2 1 / и \
рк,5 = рк,5 = —2рк—1,5—1рк—1,5—1 +~ (рк—1,5—1) рк—1,5—1 +~ (рк—1,5—1) —~ (рк—1,5—1),
при 1 < т < п —1,2 < 5 < т +1,
рй,5 = рЬ — 8(р—1,0 р—1,0 Я)2 + 4(рй1,0)2 р—1,0 Я3 + (р—1,0 Я)2 — 2(р—\0Я)2, для 0 < к < п —1,0 < 5 < 1.
Увеличение пропускной способности дублированной сети.
Последовательное дублирование ступеней сети размерности 512х512 привело к значительному увеличению НПСП. Изменение пропускной способности памяти для начального уровня потока 0,3; 0,6; 0,9 показан на Рис. 4.
Применение. Метод последовательного реплицирования ступеней может быть использован проектировщиком системы совместно с методом оценки пропускной способности реплицированной сети для выяснения необходимой степени реплицирования и достижения оптимального соотношения цена/производительно сть.
1
0,8 0,6 0,4 0,2 0
123456789
р=0,9
р=0,6
р=0,3
Рис. 4
Выводы. В многоступенчатой сети, выполненной по предложенной архитектуре, возникает гораздо меньшее число внутренних блокировок по
сравнению с нереплицированной сетью. Получены выражения для определения НПСП в условиях горячего трафика с произвольным числом горячих приемников для реплицированной сети. Метод последовательного дублирования ступеней позволяет повысить пропускную способность сети на 80-90%. Повышение пропускной способности наиболее существенно при более интенсивных начальных нагрузках на сеть.
Список литературы: 1. Дикарев В.А., Евграфов В.Н. Производительность безбуферных многоступенчатых сетей при наличии горячего трафика // Вестник НТУ "ХПИ". - Х.: НТУ "ХПИ", 2005. - № 49. - С. 52 - 59. 2. Tutsch D., Hommel G. Comparing Switch and Buffer Sizes of Multistage Interconnection Networks in Case of Multicast Traffic Technische Universitaet Berlin, Real-Time Systems and Robotics, 2000. 3. Atiquzzaman M, Akhtar MS. Effect of hot spots on the performance of multistage interconnection networks. FRONTIERS 92: The Forth Symposium on the Frontiers of Massively Parallel Computations, Virginia, 1992. - P. 504-505 4. Yang Q, Bhuyan LN. Analysis of packet-switched multiple-bus multiprocessors // IEEE Transaction on Computers. - 1991. - 40 (3). - P. 352-357. 5. Kim HS, Leon-GarciaA. Performance of buffered Banyan networks under non-uniform traffic patterns // IEEE Transactions on Computers. - 1990. - 38 (5). - P. 648-658. 6. Евграфов В.Н. Производительность непрямой многоступенчатой сети при наличии горячего трафика для конечных каналов. // Радиоэлектроника и Информатика. - 2005. - .№ 1. - С. 119-122. 7. Евграфов В.Н. Свойства бузбуферных многоступенчатых сетей для произвольного числа горячих модулей памяти. Вестник НТУ ХПИ. - Х.: НТУ "ХПИ", 2004. - № 46. - С. 153-159.
Поступила в редакцию 03.11.2005