УДК 021.8 + 025.1 ББК 78.34
О ТОПОЛОГИЧЕСКОЙ МАСШТАБИРУЕМОСТИ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ1
Мелентьев В. А.2
(ФГБУН Институт физики полупроводников им. А.В. Ржанова СО РАН, Новосибирск)
Большая часть опубликованных в научной литературе результатов, посвященных исследованию масштабирования параллельных задач и систем, локализованы под конкретные их реализации. Эксклюзивность, обусловленная различиями в классах решаемых задач, в техническом, технологическом и топологическом воплощении систем, во-первых, не позволяет напрямую использовать эти результаты в анализе и синтезе иных параллельных систем и задач, и во-вторых, не дает цельной картины взаимной обусловленности заданных параметров системы с востребованными показателями ее функционирования. На основе предложенной в настоящей работе модели предпринята попытка восполнить имеющийся в этом отношении пробел, и прежде всего, оценить влияние топологии на масштабируемость параллельных систем и решаемых на них задач.
Ключевые слова: топологии, сетевые технологии систем, масштабируемость параллельных вычислительных систем и задач.
1. Введение
Понятие масштабируемости может быть отнесено к любой системе как свойство, характеризующее зависимость критиче-
1 Работа выполнена при поддержке Российского фонда фундаментальных исследований, проект №14-07-00169.
2 Виктор Александрович Мелентьев, кандидат технических наук (те[уа@1&р. тс. ги)
ски важных (существенных) показателей качества функционирования от числа составляющих ее конструктивно и/или функционально самостоятельных элементов. При этом потребности потенциальных пользователей системы определяют множество оцениваемых показателей, а составные элементы, способы их соединения и взаимодействия - вариативное множество «измерений», в которых следует оптимизировать эти показатели. Как правило, одним из основных показателей качества вычислительной системы (ВС) считается эффективность использования всей совокупности ее процессоров. Однако такая эффективность представляет интерес прежде всего для собственников системы. Соответствие системы потребностям конкретных пользователей оценивают эффективностью использования не всех, а только тех процессоров ВС, которые задействованы в образуемых для реализации соответствующих приложений подсистемах.
Достижение наивысших значений эффективности использования компонентов системы далеко не всегда является целью оптимизации ее архитектуры или прикладных алгоритмов. Например, общесистемным задачам непременно сопутствует требование оперативности их решения, а актуализация приложений является причиной создания специализированных систем; в коммерческих системах реального времени определяющим фактором также часто является оперативность пользовательских приложений, даже в ущерб эффективности использования ресурсов. Однако в этих случаях тоже можно говорить об эффективности, но уже не в части использования ресурсов, а в отношении повышения актуальности получаемых результатов.
Целью данной работы является формализация обусловленной топологией вычислительной системы зависимости ее потенциальных в отношении параллелизма возможностей при горизонтальном масштабировании1. Естественно, что исследование такой топологической обусловленности предполагает абстрагирование от ограничений, связанных с присутствием в
1 Под горизонтальным масштабированием ВС понимается наращивание ее возможностей увеличением числа вычислительных модулей.
параллельном алгоритме скалярных (нераспараллеливаемых) фрагментов, учитываемых классическим вариантом закона Амдала, названного в [5] «бичом параллельных вычислений». При исключении из рассмотрения фактора «скалярности» основным обстоятельством, определяющим реальную производительность вычислительной системы, становится ее зависимость от межпроцессных обменов, связанных как с топологией системной сети, так и с ее технологическими характеристиками -темпом выдачи сообщений, задержкой, пропускной способностью, и эта зависимость тем существеннее, чем больше размер системы [1].
В работе предложена модель параллельных вычислений, на базе которой проведено размежевание топологических и технологических факторов по их влиянию на реальную производительность системы и на предельный (при директивных критериях эффективности) порядок подсистем; даны формальные определения функций топологической масштабируемости параллельных задач и системы, основанные на использовании показателей плотности графа ВС с достижимостью, лимитированной используемой в системе сетевой технологией, параметрами задачи и заданными критериями эффективности их решения.
2. Описание модели масштабируемой ВС
Понятно, что оценка влияния сетевой топологии на потенциальную масштабируемость задач в масштабируемой ВС будет правомерной, если количественный критерий оценки такого влияния не меняет относительную упорядоченность сопоставляемых топологий при допускаемых предназначением ВС изменениях класса решаемых задач и обрабатываемых данных. В принципе, сетевая топология ВС может быть спроектирована под определенную задачу в смысле биективности ее информационно-логической структуры физической структуре системы -это позволяет добиться достаточно высоких показателей качества таких систем, но только при решении ими соответствующих специализации задач. Отметим также, что специализация систем и эффективность их использования в задачах, выходя-
щих за рамки специализации, антагонистичны по своей сути. Поэтому случай узкой специализации в данной работе мы не затрагиваем и далее будем вести речь о системах универсального назначения, пригодных для решения достаточно широкого класса задач и увеличивающих, таким образом, круг потенциальных потребителей и коммерческую эффективность их использования.
Известная в научной литературе концепция неограниченного параллелизма, с вербальным описанием которой можно ознакомиться, например, в [3] и [4], вводит ряд допущений в свойства параллельной системы в целом, не разделяя при этом свойства распараллеливаемого приложения и свойства реализующей его вычислительной системы. Для выявления влияния на параллелизм общесистемных архитектурных особенностей ВС (в нашем случае - топологии) мы далее абстрагируемся от приложений, считая их неограниченно распараллеливаемыми при том, что все ограничения параллелизма обусловлены только архитектурой вычислительной системы.
Из обобщенного формального описания такой постановки выделим часть, отнесенную только к задаче. Здесь W и w -измеряемые временем объемы вычислений при решении произвольной задачи на одном и на р процессорах вычислительной системы. Соответствующие числу задействованных процессоров p объемы подлежащих обмену данных обозначим через Q и q, измеряя их при этом информационными единицами (байтами):
1. Задача допускает разбиение на произвольное число р информационно-связанных параллельных ветвей, 1 <p < да. Информационный граф Wp распараллеленной на p ветвей задачи может быть нерегулярным, но обязательно связен.
2. Масштабирование данных в задаче с коэффициентом m увеличивает объем вычислений W и объем Q подлежащих обмену данных в m раз.
3. Общий объем вычислений W и объем Q подлежащих обмену данных при разбиении задачи на р параллельных ветвей не зависят от числа процессоров р и распределяются по ним равномерно: w = W/p и q = Q /p.
4. Параллельный алгоритм не содержит скалярных фрагментов - это свойство вытекает из сформулированных выше п.п. 1 и 3.
Понятно, что если бы в системе могла быть реализована полносвязная топология с реактивностью сетевой технологии1, сравнимой с быстродействием процессора, то это соответствовало бы концепции неограниченного параллелизма системы в целом, и проблемы наращивания быстродействия ВС не возникало бы. Однако, во-первых, полная связность процессоров при неограниченном наращивании числа процессоров реализована быть не может как из экономических соображений, так и из-за отсутствия технической возможности неограниченного наращивания числа портов в процессорах. Во-вторых, из чисто физических ограничений (скорости света и несравнимости расстояний внутри процессора и между многими процессорами системы) даже предельное быстродействие ЫТ не будет адекватным быстродействию процессора и его оперативной памяти, - к примеру, возможности высокоскоростной передачи данных по медным проводникам ограничены 40 Гбит/с, что соответствует единицам сантиметров на плате и примерно одному метру при передаче по кабелю [11]. Поэтому сдерживающим фактором линейного наращивания вычислительной мощности является наличие задержек в реализации межпроцессорных обменов. В связи с этим данный выше перечень свойств задачи с неограниченным параллелизмом дополним свойствами реализующей ее вычислительной системы, влияющими на величину таких задержек:
5. Все процессоры системы идентичны, их общее число п достаточно для реализации на них р параллельных ветвей, и первоначальное предварительное распределение входных данных по задействованным в параллельном приложении процессорам не требуется.
6. Топология ВС является регулярной2 и неполносвязной.
1 Далее в тексте статьи словосочетание «сетевая технология» заменено аббревиатурой NT (Network Technology).
2 Степени всех вершин графа ВС одинаковы.
7. Общие объемы W и Q не зависят от топологии сети связи и от используемой NT, и ограничения на минимальные объемы w и q отсутствуют.
8. Вычислительные и коммуникационные элементы ВС допускают совмещенную во времени работу.
9. Временные затраты на обмены пропорциональны расстояниям между информационно-связанными задачей вершинами графа ВС.
10.Совокупность используемых в вычислительной системе топологии и NT гарантирует отсутствие сетевых коллизий и связанных с ними задержек.
Перечисленные здесь свойства неограниченно распараллеливаемой задачи (п.п. 1-4) и свойства (п.п. 5-10) предназначенной для решения таких задач вычислительной системы в совокупности определяют используемую далее модель параллельных вычислений.
3. Технологический и топологический аспекты масштабируемости параллельных вычислений
Предпоследнее из свойств используемой нами модели параллельных вычислений является тривиальным в практике построения и использования коммуникационных сетей: как правило, время передачи сообщений между наиболее удаленными элементами оценивают диаметром соответствующих графов [10], характеризующим коммуникационную задержку в худшем случае [9]. Учитывая это, представим функцию Tnd(p) сетевых задержек (ND - Network Delay) произведением определяемой топологией функции расстояния L(p) между наиболее удаленными в графе ВС и задействованными в решении задачи процессорами на определяемую NT и зависящую1 от q = Q / р функцию задержки tm(q): Tnd(p) = L(p) х tm(q). Отметим при этом, что непременным свойством функции tNr(q) является ее обратная от р и прямая от Q зависимость: Р1 < Р2 ^ tNT(Q / р1) > tNT(Q / р2) и q1 > q2 ^ tm(q\) > tmiqi). Применение в ВС технологий с иной зависимостью функции tNT(q)
1 В соответствии с п. 3 используемой здесь концепции.
противоречило бы основной цели распараллеливания - достижению требуемой оперативности в реализации пользовательских приложений и требуемой их достоверности, связанной с повышением сложности алгоритмов и/или объемов обрабатываемых данных. Однако, к сожалению, увеличение числа процессоров p, приводящее к пропорциональному уменьшению удельного объема q обмениваемых данных, приводит к уменьшению элементарного (на единичном расстоянии) времени tm(q) информационного взаимодействия физически смежных процессоров не в тех же, а в зависимых от применяемой в системе NT пропорциях, т.е. с некоторым коэффициентом непропорциональности к. К примеру, при коммутации сообщений функция элементарных задержек от числа процессоров p является гиперболической: t^r(q) = а + q / ß, здесь а - латентность сети, ß - ее пропускная способность [6], а q = Q / p - объем обмениваемых данных между двумя информационно смежными процессорами. Из п. 3, в соответствии с которым lim q = 0, и из определения латентности [12] как времени, затрачиваемого на передачу информационного сообщения с нулевым объемом данных, ясно, что ее значение является горизонтальной асимптотой в графике гиперболической функции tm(p) при заданном объеме Q. Подобная этой зависимость tm(p), хоть и в разной степени, но справедлива не только для рассмотренного здесь в качестве примера метода коммутации сообщений, но и для других используемых в современных сетях связи ВС сетевых технологий.
Рассмотрим общий случай масштабирования задачи, включающий в себя масштабирование числа p используемых ею процессоров с коэффициентом kp > 1 и масштабирование этой задачи «по данным», увеличивающее общий объем обмениваемых данных Q в m > 1 раз. При этом элементарное время задержки
( \ m ■ q
tNT
k„ ■ P
р
в соответствии с оговоренным выше свойством непропорционального его изменения и в зависимости от диапазона изменения обобщающего эти виды масштабирования коэффициента кшр = ш / кр, определим неравенствами:
kmp > 1 ^ t^iq) < tM(kmp q) < kmp•tm(q),
(1) kmp = 1 ^ tNT (q) = tNT(kmpq),
kmp < 1 ^ kmptNT(q) < tNT(kmp q) <
Неравенства учитывают непропорциональность изменения времени задержки tNT(q), заданного общим объемом обмениваемых данных Q и числом задействованных в решении задачи процессоров р, от масштабирования как этого объема Q, так и числа процессоров р. Эта непропорциональность обусловлена сетевой технологией, например, для рассмотренной выше NT с коммутацией сообщений - обратной пропорциональностью от числа процессоров р элементарного объема q и присутствием во времени постоянной составляющей - латентности а. Введем в неравенства (1) коэффициент
kNT = kmp tNT(qq)/tNT(kmp учитывающий присущую используемой в системе NT непропорциональность, назовем этот коэффициент технологическим и определим диапазоны его изменения при изменении ктр:
kmp > 1 ^ kNT > 1
(2) kmp = 1 ^ kNT =1,
kmp < 1 ^ kNT < 1
Из данного выше формального определения технологического коэффициента kNT видно, что его величина определена исходным (до масштабирования) элементарным объемом q = Q / Р, и так как ктр > tm(q) / tm(kmp • q) - на эту непропорциональность мы обращали внимание выше, — то kNT находится в прямой (но не в прямо пропорциональной) зависимости от масштабного коэффициента ктр. К примеру, технологический коэффициент уже рассмотренной выше NT с коммутацией сообщений -
kNT =
_ kmp tNT(q) _ kmp'(a + q / в) _ kmp (aP + q)
tNT(kmp q) а + kmp q / P ав + kmp q '
Однако далее мы абстрагируемся от исходных значений р и q и ограничимся использованием определенных выражением (2) качественных оценок кмг и ктр, тем не менее достаточных для
установления взаимозависимости топологической и технологической составляющей архитектуры ВС.
Учитывая вытекающее из п. 8 используемой нами модели неравенство TмD(p) > w и считая обмены максимально совмещенными с вычислениями, определим время фактических задержек разностью Тш(р) - w. Модифицируя при этом известный закон Амдала, получим:
(3) £ =_1_= 1
Р ™ + ^(р^мг^) - *>) Ls(p)•tm(q)^
Тогда максимально допустимое при решении задачи с параметрами Ж и q расстояние Ьб(р) > 1, обусловленное директивным (предписанным) при заданном числе процессоров р ускорением Бр, определится из
(4) ^ (р)=^
Отметим, что максимальное для системы с некоторой ЛТ ускорение Бр = Ж/ 1лт(4) в решении задачи с объемом Q обмениваемых данных может быть получено при предельно допустимом расстоянии Ьб(р) между информационно смежными процессорами, равном единице. Такое могло бы быть реализовано только при использовании в ВС полносвязной топологии - в этом случае информационная топология задачи не имеет значения - или при использовании в ВС топологии, повторяющей информационную топологию задачи с точностью до изоморфизма. Из выражений (3) и (4), учитывая известную для используемой ЛТ зависимость времени задержки Л от числа процессоров р, несложно определить и нижнее граничное значение этого числаРб(Ь) для заданного ускорения Бр при изменении Ь.
Если для пользователя ВС приоритетным является не ускорение Бр, а эффективность Ер = Бр / р использования задействованных в решении задачи р процессоров, то
(5) Е=_™_
( ) р гЬЕру^ч)'
и предельное расстояние Ье(р) для данной такой эффективности Ер составит
(6) 1Е(р)=^м^).
Учитывая, что сохранение прежней эффективности Ер + др = Ер с помощью уменьшения расстояния ЬЕ(р + Др) < Ье(р), компенсирующего увеличение р + Др, невозможно из-за относительной несоизмеримости изменения этих величин -(р + Др) /р > Ье(р) / Ье(р + Др), становится понятным, что связанное с потребностью повышения оперативности в решении задач увеличение числа р параллельных ветвей неизбежно ведет к снижению эффективности Ер использования процессоров -это, как отмечено выше, обусловлено непропорциональным к увеличению р уменьшением tNт(Q / р): Др > 0 ^ ^ (р + Дp)•tNт(Q / (р + Др) >р tNт(Q /р) с соответствующим изменением знаменателей в (5) и (6).
Факт снижения эффективности при масштабировании задач подтвержден многочисленными экспериментальными исследованиями (например, в [13]), теоретическое же его обоснование нетрудно увидеть из рассмотрения полносвязной топологии, где Ур > 1 Ь(р) = 1. Таким образом, определенное из (5), (6) при требуемой эффективности Е и при заданном предельном расстоянии Ь число ветвей ре(Ь) параллельной (W, Q)-задачи в системе, использующей сетевую технологию с характерной для нее функцией задержки tNт(Q / р), является верхним пределом распараллеливания.
Учитывая это и то, что нижний предел ръ распараллеливания обусловлен заданным ускорением Ъ, делаем вывод о том, что распараллеливание задачи с требуемыми значениями Ъ и Е возможно только если при обусловленном сетевой технологией ВС расстоянии Ь между информационно смежными в ней процессорами выполняется неравенство ръ(Ь) <рЕЬ), а топологически обеспечиваемое при этом Ь число процессоров р находится между значениями ръ и рЕ - ръ(Ь) < р(Ь) < ре(Ь).
В дополнение к вышесказанному еще раз обратим внимание на различную природу обусловленности расстояния Ь и числа процессоров р в Q)-задаче: если предельное расстояние Ь(р) при заданном р обусловлено функцией tNт(Q /р), т. е. используемой в ВС сетевой технологией, то предельное число р(Ь) процессоров, которое может быть задействовано при допускаемом задачей расстоянии Ь, обусловлено только топологически и
зависит от информационной топологии задачи и физической топологии системы.
Отмеченную здесь инвариантность обусловленных директивными значениями Ер и Бр предельных расстояний Ье(р) и Ьб(р) к топологии не следует понимать как гарантированную произвольной топологией ВС обеспеченность этих расстояний при заданном р и при прочих равных условиях - равенстве объемов Ж вычислений и Q обмениваемых в задачах данных, равенстве критериев эффективности реализации этих задач и идентичности используемой в системах ЛТ. Инвариантность к топологии расстояний Ье(р) или Ьб(р) состоит в том, что, во-первых, они определены вне зависимости от топологии ВС, и, во-вторых, они определяют общее для любой топологии требование, заключающееся в следующем: успешное (в смысле обеспечения критериев эффективности, предписанных задаче с параметрами Ж и Q) распараллеливание на р процессоров любой задачи возможно лишь тогда, когда топология системы гарантирует хотя бы одно вложение (Ж, Q)-задачи, при котором расстояния между информационно смежными процессорами в соответствующем этой задаче подграфе ВС не превышают этих расстояний. Отметим здесь интуитивно понятную прямую зависимость успешности (в данном выше смысле) вложения от величины расстояния Ь(р): большему допускаемому расстоянию соответствует и большая вероятность наличия в нем подграфов, допускающих удовлетворяющие заданным требованиям вложения. Это объяснимо хотя бы тем, что с увеличением предельно допускаемого расстояния возрастает число удовлетворяющих этому пределу вершин графа, естественно при этом, что кратность возрастания числа таких вершин должна быть выше кратности масштабирования кр, но этот момент уже определяется топологиями задачи и системы.
Рассмотрим, каким образом технологическая составляющая ВС влияет на масштабирование задачи с коэффициентом кшр = ш / кр, где коэффициент ш > 1 соответствует увеличению объема Q в ш раз, а кр > 1 - увеличению числа задействованных в решении этой задачи процессоров в пределах п (р кр < п), где п - общее число процессоров в системе (порядок графа ВС). Дополнительно к уже использованным ранее обозначениям
ускорения Ър, эффективности Ер и соответствующих этим критериям предельно допустимых при заданном числе процессоров р расстояний Ье(р) и Ьъ(р) введем обозначения ускорения Ътр, эффективности Етр и соответствующих расстояний Ls (р) и LEmp (р) при масштабированных с коэффициентом т данных и масштабированном с коэффициентом кр исходном числе процессоров р. В соответствии с п. 2 изложенной в разделе 2 модели объем вычислений Ж при этом также увеличивается в т раз. Тогда из (6), оставив прежнюю (до масштабирования) эффективность Етр = Ер и используя введенный выше технологический коэффициент кыт = ктр • tNт(q) / tNт(kmp • 4), получим
/п\ Т ( _т №__ Ш-км _ , Т Г Л
(7) ^тр (р)~ кр-р-Етр^ктр-я) ~РЕ^) ~ ^МУ
Если масштабирование числа задействованных в решении задачи процессоров превалирует над масштабированием данных и кр > т, то в соответствии с (2) кмт < 1, и из (7) - LE (р) < LE(p). Таким образом, сохранение эффективности при масштабировании задачи с кратностью увеличения объема данных т, меньшей кратности увеличения числа процессоров кр, потребует обеспечения в кыт- раз меньшего Ье(р) предельно допустимого расстояния на в кр раз большем множестве информационно смежных процессоров. Понятно, что явная противоречивость этого предъявляет более жесткие требования к топологии системы, каковой в условиях неограниченного (при кр ^ да) масштабирования может быть только полносвязная топология.
Если же кратность т масштабирования данных в задаче более или равна кратности масштабирования кр числа задействованных при ее решении процессоров - ктр > 1, то в соответствии с (2) кыт > 1, при этом из (7) следует LE(р) > LE(p), и превышение LE (р) над LE(p) будет тем большим, чем больше т превышает кр. Как видим, здесь, в отличие от предыдущего случая, сохранению прежней эффективности при увеличении числа задействованных в решении задачи процессоров способствует возможность увеличения предельно допустимого расстояния между ними. Естественно, потенциал такого увеличения для единственной задачи определялся бы близостью (в лучшем случае - изоморфностью) топологии системы к топологии раз-
мещаемой в ней задачи. Для множества же решаемых в системе задач потребуется оптимизация топологии ВС под все задачи этого множества с учетом присущих им объемов вычислительных Ж и обменных Q операций, а также с учетом ожидаемых пределов масштабирования этих задач.
Из изложенного ясно, что сетевая технология играет существенную роль в организации эффективного функционирования ВС. Для каждой из решаемых в системе параллельных (Ж, Q)-задач, характеризующихся вычислительной сложностью Ж и общим объемом Q обменных взаимодействий, вне зависимости от их информационных топологий и от физической топологии ВС сетевая технология определяет потребную для достижения директивной эффективности решения задачи функциональную зависимость между числом задействованных процессоров р и предельно допустимым расстоянием Ь(р) между ними. Отвечающая такой зависимости топология, позволяющая в рамках заданного набора из Л решаемых в ВС задач с заданными рангами р, (7 = 1, ..., Л) их распараллеливания конфигурировать подсистемы с меньшими Ь(р,) расстояниями между информационно смежными процессорами, дает возможность снизить требования к технологической составляющей системы - для осознания этого факта достаточно рассмотреть предельный случай использования полносвязного графа ВС. Поэтому, учитывая, что отнесенное к 7-й задаче ранга р, расстояние Ь(р,) является предельно допускаемым в рассматриваемой параллельной системе, топологическую ее составляющую имеет смысл характеризовать адекватностью топологии ВС требованиям, предъявляемым одной или набором из Л решаемых в ней задач в обеспечении соответствующих этим задачам предельных расстояний Ь(р7).
Таким образом, обусловленное директивной для отдельной задачи эффективностью предельное расстояние может быть обеспечено выбором соответствующей этой задаче топологии. Если же задач, определяющих предназначение системы, некоторое множество, то неизбежно встает вопрос о выборе топологии, оптимизированной под это множество. Однако даже при самой
лучшей оптимизации никакая, кроме полносвязной1, топология при ее статической организации не способна обеспечить изоморфную вложимость всех топологически разнотипных2 задач из набора, заданного ориентацией системы. Поэтому даже без учета предполагаемого в перспективе масштабирования задач необходимость организации опосредованных (транзитных) взаимодействий информационно смежных в задачах процессоров становится неизбежной, и расстояния между ними зависят от степени адекватности топологии задачи топологии системы. Масштабирование системы - увеличение общего числа процессоров п системы - приводит к такому же (в смысле увеличения расстояний) результату в связи со стремлением максимального их использования в решении той или иной задачи из набора (масштабирование задач). Кроме того, связанное с масштабированием задачи наращивание числа вершин ее информационного графа может сопровождаться ростом его степени и снижением вероятности изоморфного его вложения в граф ВС вплоть до нулевой при превышении степенью первого степени второго. Добавим к этому, что увеличение числа р задействованных в решении задачи процессоров неполиномиально увеличивают сложность и время реализации алгоритмов ее изоморфного размещения в системе, и при числе процессоров, большем десяти, это побуждает к замене точных методов приближенными, со свойственным им полярным отношением достоверности и актуальности.
Итак, потенциальные возможности масштабирования задачи, свободные от ограничений, вносимых используемыми в системе сетевой технологией и топологией, определяются общим числом п процессоров и возможностью наращивания их числа. Существенная, в сравнении с вычислительными операциями, продолжительность информационных взаимодействий ограничивает этот потенциал: число р задействованных в решении задачи процессоров не может быть вне диапазона значений,
1 В полносвязной ВС расстояние между любыми двумя вершинами не зависит от числа процессоров и является единичным.
2 Здесь имеется в виду, что, информационно-логическая структура таких задач представлена существенно отличающимися графами.
определенных из (4), (6) и соответствующих директивным значениям ускорения и эффективности. Для узкоспециализированных ВС проблема адекватного вложения единственной задачи может быть решена выбором соответствующей этой задаче топологии. Расширение набора топологически разнотипных задач, определяющих проблемную ориентацию ВС, и потребности обеспечения возможностей эффективного их масштабирования в наращиваемой системе не укладываются в рамки какой-либо одной, кроме полносвязной, топологии. Экономическая нецелесообразность и техническая неосуществимость реализации такой топологии ограничивают возможности эффективного масштабирования как отдельных решаемых в системе задач, так и системы в целом.
В связи с теоретической и физической невозможностью реализации в ВС полносвязной топологии, в работе [7] впервые представлено решение проблемы вложения задач в постановке, основанной на замене отношений смежности вершин графа ВС отношениями лимитированной их достижимости - при этом расстояния между вершинами графа подсистем, образуемых для решения распараллеленных на р ветвей задач, ограничены определяемыми из (4), (6) предельно допускаемыми расстояниями.
4. Вложение параллельных задач с учетом лимитированной достижимости
Как показано в предшествующем разделе, соотношение между объемами вычислений Ж и информационных взаимодействий Q в параллельной задаче, заданные критерии эффективности ее решения и быстродействие используемой в системе ЛТ определяют взаимозависимость числа р задействованных процессоров и предельно допускаемого при этом р расстояния Ь(р) между информационно смежными вершинами соответствующего задаче подграфа в графе ВС. Учитывая, что расстояния между вершинами невзвешенного графа 0(У, Е) определяются числом транзитных участков и могут быть выражены только целыми числами, а также тем, что расстояние между информационно смежными вершинами подграфа не должно превышать
определяемого из (4) и/или (6) предельного при предписанных критериях Ър или Ер и при заданном р значения Ь(р), предельное расстояние между информационно смежными в задаче процессорами определим целой частью Ь(р)1 и назовем предельной достижимостью д(р): (8) д(р) = _Ь(р)], 1 < д(р).
В соответствии с (4) директивное ускорение Ъ для уменьшенного в сравнении с Ь^р) значения предельной достижимости д(р) < Ь(р) может быть достигнуто при большей задержке tмт и, соответственно, при уменьшенном в сравнении с р числе процессоров рд. Покажем это на уже использованном примере N1 с коммутацией сообщений, обозначив допускаемые при равенстве ускорений Ър = ^ задержки на соответствующих Ьъ(р)
и д(р) расстояниях, через tNт(q) и tNт(q'). Из
^ Q N (Я) = а + ~р и
N(я) = а + р^
и из (4) получим минимальные при этих задержках значения числа процессоров:
Q■Ls(p)■Sp р =--— и
рд р-(Ш-а-дШрУ Отсюда нетрудно убедиться в том, что рд < р.
Вершины и и V графа вычислительной системы 0(У, Е) считаем связанными отношением д-достижимости2 Яд (д-достижимыми), если расстояние й(и - V) между ними не превышает д: (и - V) € Яд ^ ё(и - V) < д. Порожденный множеством вершин Уэ = V и матрицей д-достижимости Яд граф Од(У9, Ед), Ед € Яд назван графом д-достижимости. Очевидно, что превышение степени этого графа над степенью графа G(V, Е) тем значительнее, чем больше полученное из (4) или из (6) и из д(р) = \_Ь(р)\ значение д(р). Максимальное по включению подмножество V с VII связанных отношением
1 Здесь индекс критерия Ър или Ep опущен.
2 Здесь и далее зависимость значения достижимости д от числа процессоров р не указана и предполагается по умолчанию д = д(р).
д-достижимости Яд вершин порождает подграф Gg(Vg*, Яд), являющийся кликой графа Од(Уд, Ед), иначе - д-кликой Кд(0) графа G(V, Е). Подобно плотности ф(О) графа G, определяемой порядком его наибольшей клики [2], порядок наибольшей из максимальных д-клик графа G(V, Е) назовем плотностью ф^д) графа д-достижимости, или д-плотностью фд^) графа G(V, Е) -
ф(Од) = фд^).
В работе [7] введено понятие д-ограниченной компоненты достижимости (д-компоненты) графа. Говоря далее о д-компоненте графа G(V, Е), будем иметь в виду данное там определение глобальной компоненты д-достижимости, как подграфа G*g+(F*g+, Е*д+), порожденного максимальным по включению множеством V* + = У*д и V* + вершин, объединяющим подмножество У*д = {и | Уу е У*д(и - V) е Яд] попарно д-достижимых вершин с подмножеством
V* + = ^ £ Уд | Зи, V е Уд : w е Vд(u - V)] вершин, не являющихся членами подмножества У*д, но входящих в состав д-ограниченных путей между его вершинами; здесь ^(и - V) -подмножество вершин, составляющих путь из и в V. Вершины из У*д в плане их попарной д-достижимости называем основными; они составляют множество вершин д-клики Кд(О) графа G(V, Е), и их число (порядок д-клики, порядок глобальной д-компоненты) есть д-плотность фд^) графа G(V, Е) -фд^) = Вершины из V* + - вспомогательные; они обеспечивают д-достижимость основных вершин из У*д и, не входя в У*д, входят в состав д-путей между ними.
Проблема выявления в графе ВС G(V, Е) компоненты д-достижимости (д-клики графа G) решена в [7] с помощью проективного описания графа [8]. Суть соответствующего алгоритма состоит в следующем:
1. Строим систему п = | V д-уровневых проекций Рд(у,) графа G(V, Е), определяющих граф д-достижимости Gд(Vg, Яд).
2. В проекциях Рд(у,) графа Gд(Vg, Яд) выявляем подмножества Vд(v^) вершин, д-недостижимых из соответствующих ракурсных вершин VVд(vi) = V\ Vд(vi).
3. Используя полученные в п. 2 подмножества Vд(vj), строим матрицу Ыд смежности графа д-недостижимости Gд(V, Яд) и
выявляем в нем наибольшее множество независимых вершин (МНВ). Входящие состав полученного МНВ вершины образуют искомое подмножество вершин, порождающих клику Кд(О) графа д-достижимости Gд(Vд, Яд).
-ш—ж- *
4. Проекции Рд+ искомой компоненты д-достижимости
И« /■ И« * \
Gд+ (У&+, Eд+) получаем последовательным (от у = д до у = 1)
исключением из каждого у-го уровня проекций [Рд(уд | VI £ V*}
*
вершин, не принадлежащих V* и не имеющих продолжения на (у + 1)-м уровне проекции, полученной на предыдущем шаге. Оставшиеся при этом в результирующих проекциях Рд+ вершины не принадлежат V* и являются дополнительными.
5. О топологической масштабируемости
параллельных задач и вычислительных систем
Уточним используемые в этом разделе обозначения: р - ранг рассматриваемой задачи (число параллельных ветвей задачи, число задействованных в решении задачи процессоров);
Жр - информационно-логический граф задачи, соответствующий ее распараллеливанию на р параллельных ветвей;
д =д(р) = \_Ь(р)\ - обусловленное числом процессоров р и требуемым критерием эффективности Ър или Ер предельно допускаемое в графе ВС значение достижимости;
ф(Жр) - плотность распараллеленного на р ветвей информационного графа задачи, порядок наибольшей клики в графе Жр;
Фа(^) - д-плотность графа G(V, Е), она же - порядок д-клики Кв(0) графа G, или порядок клики К(Од) графа д-достижимости Gg(Vд, Rд).
5.1. ТОПОЛОГИЧЕСКАЯ МАСШТАБИРУЕМОСТЬ ЗАДАЧИ
Понятно, что, если числу р ветвей (Ж, 0-задачи, решаемой в рассматриваемой ВС1, соответствует предельная достижи-
1 Здесь и далее, говоря о ВС, по умолчанию предполагаем использование ею сетевой технологии, которая для (Ж, Q)-задачи ранга р с
мость д(р), а порядок p информационного графа Wp вкладываемой подсистемы не выше ö-плотности фв(О) графа G -9d(G) > р, то вложение графа Wp в эту д-клику может быть произвольным, даже если граф Wp является полным (при этом ç(Wp) = p). Попытка наращивания при этом числа процессоров сверх определенного для графа G значения д-плотности (p + Ap > ^a(G)) неизбежно потребует размещения Ap вершин вне клики K(Gd), что увеличит расстояния между информационно смежными в задаче вершинами как минимум на единицу: d(p + Ap) - d(p) > 1. Так как по определению d(p) = \_L(p)\ и d(p + Ap) = _L(p + Ap)_|, то при таком увеличении p предельно-допустимое расстояние L(p) будет превышено -L(p + Ap) - L(p) > 1, что воспрепятствует сохранению директивного критерия эффективности.
В отличие от рассмотренного выше случая информационно -полносвязных задач, вложение в граф д-достижимости Gd графа G задач с p(Wp) <p (неполносвязных задач) допускает увеличение числа p процессоров сверх д-плотности ^d(G) -(p(Wp) < фд(0) <p, если в графе Gd найдется подграф, изоморфный графу Wp задачи. К примеру, если исходная ВС является узкоспециализированной и ориентирована на решение некоторой задачи (или нескольких топологически однотипных задач) с неполносвязным (p > f(Wp)) информационным графом Wp, то, в принципе, для этой ВС может быть выбрана топология, повторяющая информационную топологию задачи с точностью до изоморфизма. Если при этом допустимы опосредованные (с д(p) > 1) взаимодействия информационно смежных процессоров, то топология ВС может быть сведена к одной из известных регулярных топологий, граф д-достижимости Gd которой изоморфен графу Wp. Этого можно достичь, например, определив граф G системы суграфом1 информационного графа Wp задачи, получаемым путем последовательного удаления из Wp ребер до сохраняющего изоморфизм Gg — Wp их минимума. Такой подход позволит минимизировать топологию проектируемой ВС, и
требуемыми значениями показателей эффективности ее решения обусловливает предельно допустимую достижимость д.
1 Суграф - часть графа, имеющая то же множество вершин, что и сам граф.
он может быть применен и для некоторого набора из N решаемых в системе задач. Соответствующую постановку, состоящую в объединении графов Шр задач из этого набора (/ = 1, ..., несложно представить, поэтому останавливаться на ней не имеет смысла.
Итак, связанные с масштабированием параллельной задачи изменения информационной ее топологии существенно влияют на возможности вложения в ВС этой задачи, релевантного требуемым ускорению и эффективности. Понятно, что возможности вложения информационного графа Жр в граф д-достижимости Gд при превышении рангом р задачи д-плотности фд(0) графа ВС коррелированы не только информационной топологией задачи, но и физической топологией системы, и шансы изоморфного вложения задачи ранга р в граф д-достижимости Gд возрастают как с уменьшением плотности ф(Жр) вкладываемых задач, так и с увеличением д-плотности фд^) графа ВС (естественно при этом, что порядок р информационного графа Жр задачи не должен превышать порядка п графа G системы: р < п^)). Очевидно, что тезис об увеличении шансов успешного вложения для задач с меньшей плотностью информационного графа актуален для любой системы, топологически адекватной заданному неравенством ф(Жр) < условию. Это позволяет абстрагироваться от используемой в ВС топологии (разумеется, в рамках ее адекватности этому условию) и, таким образом, сосредоточиться только на топологическом аспекте масштабируемости ¡ф(Жр) параллельной задачи, оценивая связанное с наращивание числа параллельных ветвей относительное изменение возможностей ее вложения лишь качественно:
Из (9) ясно, что в случаях, например, с неизменной при масштабировании задачи плотностью ф(Жр) = 2 и с плотностью ф(Жр) = р (эти случаи характерны для конвейерных (Жр = Ср) и полносвязных (Жр = Кр) вычислений) для предельных значений р = 2 и р = получим, соответственно, ¡¿^(Ст) = '/г, ц^Кт) = 0 и и ¡ф(Кш) = 0. Физический смысл введенной здесь функции ¡ф(Жр) состоит в том, что в первом случае наращивание параллелизма (числа р ее параллельных ветвей) уменьшает
относительную (в отношении к p) плотность информационного графа задачи, соответственно, его вложение в граф д-достижимости Gd, 1 < д < d(G), облегчается, и масштабируемость fi9(Cp) стремится к равному единице максимальному значению. Во втором же случае f(Kp) = p, т.е. вне зависимости от ранга p относительная плотность параллельной задачи1 максимальна и равна единице. Это, как и нулевое значение juv(Kp), говорит о максимальной сложности масштабирования информационно полносвязной параллельной задачи и о том, что вложение в граф д-достижимости2 Gd задачи Kp возможно, только если плотность ç(Gd) этого графа не меньше числа ветвей p.
Однако относительная плотность - не единственное, что определяет сложность вложения масштабируемой задачи. К примеру, задачи одного ранга с кольцевой и звездной информационными топологиями обладают одинаковой плотностью, но степень s «кольца» Cp при этом независимо от ранга p задачи постоянна и s(Cp) = 2, тогда как наращивание числа p ветвей в задаче со «звездной» (Wp = Zp) топологией увеличивает степень ее информационного графа: s(Zp) = p - 1, и при p > s(Gè) + 1 одно из необходимых условий наличия изоморфных вложений s(Zp) < s(Gd) будет нарушено. Коррелированную степенью информационного графа масштабируемость задачи с аналогичным вышеописанному физическим смыслом можно описать тем же выражением, что и в (9), заменив плотность ç(Wp) степенью
Тогда для задач с «кольцевой» и «звездной» топологиями при р > 2 получим: ^(Ср) =1 - 2р_1 и ^(^р) = р"1, что соответствует увеличению ^(Ср) (улучшению возможностей вложения при наращивании «кольца») и уменьшению (ухудшению таких
возможностей для «звезды»).
Совместное использование введенных выше частных функций масштабируемости параллельной задачи, связанных с изме-
1 Словосочетание «информационного графа» для краткости опущено.
2 Предельная достижимость д соответствует заданному числу ветвей р.
s(Wp):
нением плотности и степени ее информационного графа, позволяет качественно (больше/меньше - лучше/хуже) сопоставлять возможности вложения задач в регулярные топологии вычислительных систем, предельные значения достижимости д в которых адекватны изменениям р, а плотность ф^д) и степень s(Gд) соответствующих графов д-достижимости удовлетворяют условиям: ф^д) > ф(Жр) и s(Gд) > s(Жp). Функцию ¡¡(Жр) зависимости топологической масштабируемости задачи от числа р параллельных ее ветвей определим произведением функций (9) и (10): (11) ¡(Жр) = ¡ф(Жр)-МЖр).
Из введенных выше частных функций (9), (10) и из обобщающей их функции (11) видим, что топологическая масштабируемость задачи ухудшается с приближением к единице относительных значений плотности или степени ее информационного графа, т.е. с приближением ее информационной топологии к полносвязной. Понятно также, что при сопоставлении алгоритмов распараллеливания задачи для обеспечения хорошей ее масштабируемости следует отдать предпочтение тем из них, в которых увеличение параллелизма приводит по крайней мере к меньшему росту относительных значений плотности и степени информационного графа.
5.2. ТОПОЛОГИЧЕСКАЯ МАСШТАБИРУЕМОСТЬ СИСТЕМЫ
Понятно, что степень и плотность графа д-достижимости Gд(V, Ед), д > 1, положительно коррелированы степенью исходного регулярного1 графа G(V, Е) и величиной полученного из (8) значения достижимости д(р) = \_Ь(р): для графов G и Н одного порядка (п^) = п(Н)
я(О) < s(H * я^д) < я(Нд), фд(в) < фд(И) ,
д1 < д2 * Я^) < Я^^), ф^) < ф^д2). Понятно также, что д-плотность фд(G) графа ВС как порядок п(Кд) его максимальной д-клики, все вершины которой по определению взаимно д-достижимы, ограничивает сверху параллелизм (число ветвей) только для информационно полносвязных
1 Напомним, что в соответствии с п. 6 рассматриваемой здесь модели топология ВС представлена регулярным неполносвязным графом.
задач. Для задач же с плотностью информационного графа ç(Wp), меньшей числа ветвей p в них, верхние границы могут быть большими ô-плотности графа G ВС, если в графе д-достижимости Gd найдется подграф порядка p > ^e(G), изоморфный графу Wp. К примеру, число задействованных в гиперкубической ВС процессоров для задачи с кольцевой топологией ограничено сверху порядком гиперкуба вне зависимости от допускаемой при ее решении достижимости д.
Итак, пределы распараллеливания решаемых в системе задач в зависимости от допускаемой для каждой из них достижимости д находятся в диапазонах от çô(G) до n(G), поэтому задачи можно классифицировать соответственно принадлежности
этим диапазонам, идентифицируемым значениями д > 1. Понятно при этом, что при использовании в системе достаточно быстродействующей NT допускаемая некоторыми задачами предельная достижимость д не ограничивается диаметром d(G)
графа ВС, и д > d(G) ^ ^s(G) = n(Gd).
Рассмотрим, к примеру, решение двух из множества принадлежащих д-классу задач на системах, топологии которых не привязаны к информационным топологиям этих задач. Пусть топологии систем заданы графами G1 и G2 одного порядка n(G\) = n(G2), значения их д-плотности соответствуют оговариваемому д-классу, но различны: ^ö(g2) > ^ö(g\). Наделим рассматриваемые здесь задачи W1 и W2 значениями топологической масштабируемости и ^2, близкими к граничным и равными, соответственно, единичному и нулевому значениям. Следует ожидать при этом, что предел распараллеливания первой, наименее топологически сложной для вложения задачи для обеих систем будет близок к одному и тому же значению -порядку n их графов. Для второй задачи, как наиболее топологически сложной для вложения, можно ожидать, что предельное число задействованных в каждой системе процессоров будет близким к порядку наибольшей д-клики графа - значениям д-плотности tyd(G\) и tyd(G2). Из этого ясно, что системы с меньшей д-плотностью графов обладают меньшими возможностями распараллеливания прежде всего топологически более сложных
задач, обладающих меньшей топологической масштабируемостью ¡(Wp).
Понятно тогда, что при решении набора задач усредненное изменение пределов их распараллеливания будет более выигрышным в системах с большими значениями д-плотности их графов. Поэтому вполне оправданным будет использование д-плотности в качественной (больше/меньше - лучше/хуже) характеристике графов ВС и в сопоставительном их анализе не только для информационно полносвязных задач, но и для задач, не требующих информационной полносвязности. Естественным при этом будет нормирование значений д-плотностей сопоставляемых графов ВС порядком этих графов — отношением tyd(G)/n. Нормированное таким образом значение не только характеризует в абсолютном выражении потенциал системы в распараллеливании информационно полносвязных задач с ¡(Wp) = 0, но и позволяет осуществлять качественную оценку потенциала для классифицированных по достижимости д > 1 задач с ¡(Wp) > 0. Эту функцию изменения д-плотности графа ВС от его порядка n ¡d(Gn) = фд(ОП)/п назовем функцией топологической масштабируемости системы.
При этом, как мы уже говорили выше, если рассматриваемая система допускает для некоторых из решаемых на ней задач
д > d(G), то предел распараллеливания этих задач определяется
числом процессоров в ней - ^d(G) = n(Gd), понятно, что масштабируемость таких задач в этой системе максимальна и равна единице - ¡d(Gn) = 1. Отсюда, кстати, вытекает желательность выбора сетевой технологии масштабируемой системы с учетом того, чтобы быстродействие NT было достаточным для эффективного использования увеличенного в результате предполагаемого в процессе эксплуатации масштабирования системы числа ее процессоров: например, для ключевых задач, определяющих функциональное назначение системы, обусловленная сетевой технологией достижимость д должна быть близкой к текущему диаметру d(G) графа ВС или превышать его.
Итак, учитывая, что предельные значения достижимостей д в системе обусловлены предписанными ей задачами и используемой сетевой технологией, топологическую масштабируемость
системы, как характеристику изменения потенциала в распараллеливании предписанных ей задач при изменении порядка n графа Gn системы можно характеризовать семейством функций fid(Gn) относительного к масштабу системы изменения д-плотности графа Gn, описывающего топологию исследуемой ВС, при заданных значениях достижимости д > 1.
6. Заключение
Все параллельные системы по мере их появления и наращивания подвергаются исследованиям их быстродействия и эффективности на различных классах и наборах задач и данных. Понятно, что различия в технической, технологической, топологической, прикладной и прочих архитектурных составляющих системы придают полученным при этом результатам некую эксклюзивность и могут быть распространены на другие системы и задачи лишь с некоторыми ограничениями. Обобщение полученного таким образом и опубликованного к настоящему времени огромного фактологического материала убеждает в качественной идентичности локального влияния этих компонент на показатели масштабируемых систем, но не дает цельной картины взаимной их обусловленности, достаточной для получения требуемых показателей вновь проектируемых и уже эксплуатируемых систем. В настоящей работе предпринята попытка восполнить имеющийся в этом отношении пробел, прежде всего, в оценке влияния топологии на масштабируемость параллельных систем и решаемых на них задач.
С этой целью во втором разделе статьи предложена разделенная на две составляющие модель параллельных вычислений: первая отнесена к параллельным приложениям и приписывает им свойства неограниченной распараллеливаемости, вторая отнесена к вычислительной системе, ограничения параллелизма которой обусловлены недостаточным быстродействием ее коммуникационной среды. В связи с тем, что задержки информационных взаимодействий ветвей зависят от присущих каждой задаче объемов вычислительных и обменных операций, естественной является характеризация задач соответствующими этим объемам параметрами.
Использование предложенной модели позволило сконцентрировать внимание на технологической и топологической составляющих коммуникационной среды и исследовать формальную их взаимозависимость в совокупном влиянии на пределы распараллеливания в заданной ВС задач, соответствующие предписанным критериям эффективности их решения. В третьем разделе статьи получены выражения, связывающие с используемой в системе сетевой технологией предельно допускаемые между информационно смежными процессорами расстояния L(p), минимально необходимое и максимально допускаемое число параллельных ветвей, релевантные заданным ускорению и эффективности. Это позволяет оценить любой из перечисленных выше параметров при заданных остальных.
В связи с тем, что расстояния между вершинами невзве-шенного графа определяются числом транзитных участков и могут быть выражены только целыми числами и не должны превышать при этом упомянутых выше предельно допускаемых расстояний между информационно смежными в задаче вершинами графа ВС, введено понятие предельной достижимости d(p), определенной целой частью L(p). В четвертом разделе рассматривается проблема вложения в граф ВС параллельных задач с учетом лимитированной достижимости. Даны понятия графа д-достижимости, д-компоненты графа, представляющей собой клику графа д-достижимости и соответствующей порядку последней, д-плотности графа ВС, приведен алгоритм выявления в графе ВС такой клики.
В пятом разделе введены взаимно абстрагированные формализованные показатели и функции топологической масштабируемости параллельных задач и топологической масштабируемости систем. Свойство взаимной абстрагированности, с одной стороны, позволяет, не привязываясь к конкретной среде реализации задачи, выбирать наименее топологически сложный для ее вложения алгоритм, а с другой - выбирать для унифицированных систем топологии, при прочих равных условиях обладающие наибольшими возможностями успешного вложения произвольных задач. Это не исключает, однако, использование данных функций для специализированных систем.
Введенные показатели топологической масштабируемости задач и систем основаны на использовании плотности информационного графа задачи и д-плотности графа ВС; допускаемая предложенной в работе моделью нерегулярность топологии задачи учтена дополнением соответствующего показателя степенью изменяющегося при ее масштабировании информационного графа. Отметим, что использование в составе показателей масштабируемости задач и вычислительных систем инвариантов соответствующих графов (степени, плотности и д-плотности) определяет инвариантность этих показателей к способам вложения задач в системы, характеризуя, таким образом, потенциал масштабируемости, который в той или иной степени достижим при использовании этих способов.
Результаты работы будут полезными не только при анализе уже действующих систем и реализуемых на них параллельных алгоритмов, но и при создании новых систем или алгоритмов с учетом предполагаемого масштабирования тех и других.
Литература
1. АБРАМОВ С М., ЛИЛИТКО Е.П. Состояние и перспективы развития вычислительных систем сверхвысокой производительности // Информационные технологии и вычислительные системы. - 2013. - №2. - С. 6-22.
2. БАДЕХА И.А., РОЛДУГИН П.В. О плотности графов, в которых каждое ребро входит хотя бы в две максимальные клики // Дискрет. матем. - 2013. - Т. 25, №3. - С. 7-21.
3. БУРОВА И.Г., ДЕМЬЯНОВИЧ Ю.К. Алгоритмы параллельных вычислений и программирование: Курс лекций. - СПб: Изд-во С.-Пб. ун-та, 2007. - 206 с.
4. ВОЕВОДИН В В., ВОЕВОДИН В В. Параллельные вычисления. - Санкт-Петербург. 2002. - 599 с.
5. ВОЕВОДИН В. Суперкомпьютеры и парадоксы неэффективности // Открытые системы. СУБД. - 2009. - №10. -С.17-20.
6. ГЕРГЕЛЬ В.П. Высокопроизводительные вычисления для многопроцессорных многоядерных систем: [учебник для ву-
зов]. - Нижний Новгород: Издательство Нижегородского госуниверситета, 2010. - 539 с.
7. МЕЛЕНТЬЕВ В.А. Вложение подсистем, лимитирующих длину и число путей между вершинами графа вычислительной системы // Управление большими системами. - 2014. -№47. - С. 212-246.
8. МЕЛЕНТЬЕВ В.А. Формальные основы скобочных образов в теории графов // Труды II Международной конференции «Параллельные вычисления и задачи управления». PACO'2004 Москва. 2004. - С. 694-706.
9. ПОЖИЛОВ И.А. Оценка задержки и пропускной способности сети с топологией «многомерный тор» при наличии отказавших каналов связи // Научный сервис в сети интернет: многообразие суперкомпьютерных миров. Труды Международной суперкомпьютерной конференции. -С.211-217.
10. РАППОПОРТ А.М. Метрические характеристики графов сетей коммуникаций // Труды ИСА РАН. - 2005. - Т. 14. -С. 141 -147.
11. СЛЕПУХИН А.Ф. Перспективы развития аппаратных технологий и их применение в суперкомпьютерах экзафлоп-ного уровня // Тезисы докладов Четвертого Московского суперкомпьютерного форума (Москва, 23 октября 2013 г.) / [Под. ред. Волкова Д.В. Москва. Россия. Октябрь 2013. -С. 7.
12. ШПАКОВСКИЙ Г.И., СТЕЦЮРЕНКО В.И., ВЕРХОТУ-РОВ А.Е. И ДР. Применение технологии MPI в Грид. -Минск: Белорусский государственный университет, 2008. -137 с.
13. GRAMA A.Y., GUPTA A., KUMAR V. Isoefficiency: Measuring the Scalability of Parallel Algorithms and Architectures // Parallel & Distributed Technology: Systems & Applications, IEEE. - August 1993. - Vol. 1. No.3. - P. 12-21.
ON TOPOLOGICAL SCALABILITY OF COMPUTING SYSTEMS
Victor Melentiev, Rzhanov Institute of Semiconductor Physics Siberian Branch of RAS, Novosibirsk, Cand. Sc., senior research associate ([email protected]).
Abstract: Most results on parallel task and system scaling met in the literature are guided by the specific technological and topological implementation. Unique properties of a problem originated from the class of the task solved, from technical, technological and topological implementation of the system, firstly, prevent using these results directly in the analysis and synthesis of the other parallel systems and tasks, and, secondly, hide the general pattern of mutual condi-tionality of the given parameters of system with demanded performance metrics. On the basis of the model suggested in this paper we try to fill the existing gap with the main goal to assess the impact of the topology of a parallel system on scalability of a system or a task.
Keywords: topology, system network technology, scalability of parallel computing systems and tasks.
Статья представлена к публикации членом редакционной коллегии М.В. Губко
Поступила в редакцию 06.09.2015.
Опубликована 30.11.2015.