Научная статья на тему 'Комплексный подход к повышению эффективности многомашинныхвычислительных систем'

Комплексный подход к повышению эффективности многомашинныхвычислительных систем Текст научной статьи по специальности «Математика»

CC BY
101
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИКОМПЬЮТЕР / ЭФФЕКТИВНОСТЬ / УСКОРИТЕЛЬ / ОБРАБОТКА / АЛГОРИТМ / СОСТАВЛЕНИЕ РАСПИСАНИЯ / ОПТИМАЛЬНЫЙ ПЛАН / ЗАДАЧА / MULTICOMPUTER / EFFICIENCY / ACCELERATOR / PROCESSING / ALGORITHM / SCHEDULING / OPTIMUM PLAN / TASK

Аннотация научной статьи по математике, автор научной работы — Цветкова Ю. А.

Для повышения эффективности предлагаются совместно два пути. Первый оснастить компьютер ускорителем. Второй выбрать оптимальный план обработки задачи. Рассматриваются алгоритмы для составления расписания.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Complex approach for increasing the multicomputer systems efficiency

For increasing the efficiency the two paths are jointly offered. The first is to introduce the computer accelerator. The second is to select the optimum processing task plan. The scheduling algorithms are considered.

Текст научной работы на тему «Комплексный подход к повышению эффективности многомашинныхвычислительных систем»

Для уменьшения разрядности чисел рекомендуется включать интеграторы после нерекурсивной части, так как входящий в эту часть дифференциатор обеспечит отсутствие постоянных составляющих на входе любого интегратора и предотвратит их накопление.

, -

ры общего вида с квазиконечной ИХ. В случае квазисимметричной или квазиантисимметричной ИХ фазовая характеристика будет квазилинейной. Эксперименты , -

ностями квантования чисел в процессоре (дая процессора Intel Pentium - 10-6 и 1015 соответственно для 32- и 64-р^рядных чисел с плавающей точкой). Для ИХ в виде аппроксимации окна Хэмминга двумя отрезками полинома 3-й степени, а = 0.99999, M = 5000, фазовая погрешность на частоте среза составила 0,05°, а

среднеквадратическое значение этой погрешности в полосе пропускания - 0,02°.

, -

рования при жестких ограничениях, накладываемых на время перестройки пара, -

конечной импульсной характеристикой.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Воротков В.Л., Лукин Р.П. Повышение эффектавности информационно-телеметрического обеспечения в условиях риска потерь информации // Приборы и системы. Управление, контроль, диагностика. - 2006, №3.

2. Сарыче в В.В., Ткаченко М.Г. Использование цифровых фильтров в канальных процессорах информационно-измерительных систем. - М.: Естественные и технические науки. 2008, №1.

УДК 681.324

Ю.А. Цветкова

КОМПЛЕКСНЫЙ ПОДХОД К ПОВЫШЕНИЮ ЭФФЕКТИВНОСТИ МНОГОМАШИННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ

Введение. Современное развитие средств м оделирования требует от компьютеров (ЭВМ) все большей производительности, повышение которой идет по пути создания разнообразных аппаратных ускорителей (акселераторов (АК)) вычислительного процесса и вычислительных систем (ВС) [1-5].

Среди ВС наиболее эффективны по набору показателей (производительность /стоимость; широкий класс приложений; надежность; маштабируемость и др.) многомашинные (кластерные) ВС на базе сетевых Switch-тexнoлoгий, которые в настоящее время широко применяются при построении разнообразных вп^систем [2, 6].

Статья посвящена комплексному подходу к повышению эффективности многомашинной ВС путем эволюции ее структуры (объединение кластера ЭВМ и кластера акселераторов на базе сетевой Switch-тexнoлoгии) и оптимизация обработки соответствующего этой структуре класса задач. Данная структура ВС позволяет эффективно обрабатывать широкий класс практически важных задач.

1. Условия эффективности обработки задач в ВС. Задача с объемом счета (у) в простых операциях (ОП) может быть выполнена одним процессором (узлом)

с производительностью Р1 [ОП/с] или кластером из N узлов с пиковой производительностью Ркл = Р1 * N , но если узлы зависимы, то Рк (Ы) < Р1 *N. Требуемое от ВС число узлов на определенном временном отрезке и логические зависимости по обмену данными задается графом задачи. Если ВС выделяет ресурс точно в требуемый момент (и не раньше и не позже) и в необходимом объеме (не меньше и не больше), то эффективность обработки г|=1, а Р(^), 1)=Р1 * N(1). Это режим идеальной адаптивной обработки (идеадьный динамический режим). Назовем ее графовым параллельным компьютером (ГПК). Для ГПК выполняются условия: N(1)=^), где п(1) - текущий параллелизм задачи, и время обмена Тобм=0. В статическом режиме (СР) Ркл(Ы)=сош!1 и всегда г|<1. В статье рассматривается лишь .

обработки, которые определяются только параметрами задачи и числом N (1<№лшях), где пмах - наибольший параллелизм задачи. При N > тах величина г| .

ц=Б(Ы)/Ы=1/(1 + ТизГ) (Ы)); (1<Ы<птах);

_ (1) Б(Ы) =Т1/Тсч(Ы), Тизб(Ы)=Тизб(Ы)/Т1,

где - ускорение обработки; Тизб(Щ - избыточный ресурс кластера;

ТИЗ(7 (Ы) - нормированное значение величины ТизбОТ; Т1, Тсч(Ы) - время счета

программы соответственно одним и N узлами.

Значение Тизб(^>0 обусловлено только изменением параллелизма задачи п(1) в ходе счета (0<1< Тсч(^).

По процессу счета можно выбрать оптимальный вариант по выбранным приемлемым значениям ускорения и эффективности (№пт; 8(№пт); г| (№пт)).

, (1) , -мизация осуществляется методом целенаправленного подбора N по специальному .

При обработки задачи в реальной ВС к Тсч^) добавляется время внешнего

обмена Тобм^) и тогда время обработки задачи ТобрОТ < Тсч^) + Тобм^). (<) ,

требует независимых каналов обмена и достигается установкой коммутаторов. Величина г| снижается дополнительно также из-за несоответствия структур графа задачи и структуры ВС. Необходимость максимального соответствия структур для достижения г|шах доказана практикой [1].

В [2] отмечается, что разброс величины РклОТ от пиковой составляет от 90% до 2% и для ВС с N>10 вопрос согласования структур выходит на передний план. Граф является информационным ядром задачи, т.е. содержит информацию о спе-, , . для согласования структур необходимо представлять граф в различных эквива-.

2.Эквивалентные формы представления графа задачи и их использование для повышения эффективности обработки задач в ВС.Математическая модель задачи представляется операторами различного уровня и каждому уровню соответствует свой граф. Каждый последующий уровень получается из предыдущего декомпозицией его операторов (р^ложением). При этом последний включа-

(+, - , * , / ).

Понятие оператора более общее, чем понятие функции и охватывает как про, . ,

при этом сложный оператор может представляться множеством простых [3]. Оператор связывает переменные причинно-следственной связью и может описывать ( , , , ). Практическая реализация операторов может быть программной, аппаратной или -.

Для целей статьи представляют интерес следующие формы эквивалентного представления графа задачи:

1) ( );

2) ( );

3) гомоморфная свертка (ГС) [2].

( ), -

раторов графа задачи qi С О ^=1,2,.. I) на три подмножества так, чтобы:

123 123 11

О и О" и О =О и О П О" = О , при этом qi С О будут обрабатываться только

2 2 3 3

универсальными ЭВМ, qi С О - только АК, а qi С О - ЭВМ совместно с АК.

Повышение производительности ЭВМ с помощью АК осуществлялось всегда по мере развития больших интегральных схем (БИС) [3, 4]. АК разгружает центральный процессор ЭВМ от узкоспециализированных операторов, обусловленных спецификой задачи - вычисление элементарных и специальных функций, прямое и обратное преобразование Фурье, операции над матрицами и другие. Ускорение в выполнении операторов аппаратным путем по сравнению с программным может достигать для некоторых операторов до 100 [4]. Для повышения эффективности обработки задачи на кластере из универсальных совместимых ЭВМ объединим его с кластером из АК. Пример двухслойной структуры гетерогенного кластера из четырех ЭВМ с АК и двух коммутаторов К1, К2 представлен на рис. 1. Данная структура обладает новыми качествами. Повышается производительность кластера за счет ускорения счета в обоих слоях и ускорение обмена в слоях и между слоями. Коммутатор образует И/2 независимых каналов обмена, где Я - число портов. По.

Управление обработкой задачи возлагается на одну из ЭВМ. Связь между ЭВМ и ее АК (оформлены в виде отдельной платы) осуществляется по внутренней шине. АК получает задания от ЭВМ, выполняет их самостоятельно (или коллективно в своем слое) и отправляет результаты ЭВМ.

Для выбора оптимального варианта обработки воспользуемся второй и

( , ).

граф задачи в виде групп (подграфов) независимых операторов от начала графа, а гомоморфная свертка - в виде подграфов операторов по их связности в порядке их обработки от начала графа.

Рис. 1. Двухслойная структура гетерогенного кластера

Форма КПФ позволяет определить внутренний параллелизм задачи в

группах (nk), где k=1,2,3 . . . Kmax - (число групп) и максимальный параллелизм

задачи nkmax. Общее число узлов в ЭВМ должно быть N > nkmax. КПФ позволяет также с помощью отображения операторов групп на конкретное число узлов ЭВМ ВС составлять расписание их работы по специальным алгоритмам без учета и с учетом обмена, моделировать процесс обмена отдельно. КПФ составляется по матрице смежности графа задачи с помощью ЭВМ, начиная со входных операторов. При этом множество Q разбивается на упорядоченные подмножества (группы) Qk (k=1,2,3... Kmax) так, что Q1 U Q2 U Q3 . . . U Qkmax=Q и Q^ Q2f! Q3 . . . П

Qkmax=0. Число "К" есть порядковый номер оператора qi от начала графа по логическим связям qiK С QK (k=1,2,3 . . . kmax). Если некоторому qi соответствует

k, " операторов'' для выбора одного значения. Изложение этого способа не входит в .

( ) -

рицей смежности B(IxI), а числом (kmax-1) матриц смежности Вкк+1 (k=1,2,3 . . . (kmax-1)) значительно меньшего размера. Матрицы Вкк+1 связывают смежные

группы операторов Qk и QK+1 , а число 'k' указывает на последовательность их обработки. Операторы одной группы независимы между собой и могут обрабатываться параллельно или последовательно.

Выбирается оптимальный вариант обработки по счету путем ряда итера, N=nk max . осуществляется распределение операторов по ЭВМ. Для этого с помощью третьей

формы (ГС) по матрицам Вкк+1 (k=1,2,3 . . . (kmax-1)) множество Q разделяется

,

,

своем слое с универсальными.

Число вариантов разбиения, как правило, выражается очень большим числом. Из них можно выбрать оптимальный вариант по загрузке ЭВМ и времени внешнего обмена. Распределение подмножеств Ql(l = 1,2,3...L) по ЭВМ осуществляется с учетом их производительности. Если Q1 соответствует общее число операций V1 [оп], m-

P L

Vm = 'MP * Y/1 , (2)

MPm И

m=1

где Pm - производительность отдельной ЭВМ (m=1,2,3 . . . М); М - число ЭВМ;

L I

Y/1 = V[on] - общее число операций в задаче; V = ^ Vi, где Vi - объем от-l=1 i дельного оператора qi.

При таком распределении обработка задачи будет закончена всеми ЭВМ .

выполняться для обработки подграфов в ЭВМ, в качестве которых могут выступать SMP-серверы с различным числом процессоров.

После оптимального распределения объема V по ЭВМ моделируется процесс внешнего обмена между ЭВМ и выбирается оптимальный вариант, при котором Тобм = Тобм min. При моделировании берутся реальные характеристики коммуникационной системы кластера и сетевой Switch-технологии. Моделирование осуществляется по тому же алгоритму, что и для процесса счета. Затем можно выполнять полное моделирование - одновременно для всех процессов счета и обмена, которое проводится по более сложному алгоритму.

3. Применение разработанной структуры ВС. Данная структура может успешно применяться для моделирования процессов в сложных системах, операторы которых разнообразны по своей физической природе и описываются различными системами уравнений большой размерности и специальными уравнениями. Системы уравнений большой размерности для решения разбиваются по всем узлам кластера, включая АК. Структура ВС позволяет осуществлять внешние обмены типа:

ЭВМ-ЭВМ, ЭВМ-AK, АК-АК. При решении частных задач они разбиваются по

,

ЭВМ. Кластер комплектуется из готовых элементов - ЭВМ, коммутаторов, линий связи, интерфейса и программного обеспечения. Для АК также существуют программы для широкого класса задач, а при необходимости могут быть выполнены . : проектирования, в технологических и диагностических комплексах; для замены части натурных испытаний сложных объектов испытанием на математических моделях в различных режимах и обработки полученных численных результатов; в качестве тренажерного комплекса для подготовки операторов; для моделирования групповых действий объектов (роботов, боевых машин) - с ЭВМ тогда связываются отдельные объекты, которые взаимодействуют в своем слое.

На основании изложенного можно сделать вывод: объединение кластера ЭВМ и кластера акселераторов, и согласование структур графа задачи и кластера выбором оптимального варианта обработки задачи повышает эффективность предлагаемой структуры кластера на широком классе задач. .

. -, -

мального варианта обработки. Изложено содержание процесса оптимизации на основе различных форм эквивалентного представления графа задачи (канониче-

). -стера на основе двухслойной коммутации эффективна на широком классе задач, так как обладает повышенной производительностью по процессам счета и обмена, а так же повышенной надежностью.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Пятибрат ов АЛ., Гудыно Л.П., Кириченко А А. Вычислител ьные системы, сети и телекоммуникации / Учебник 2-е издание. - М.: Финансы и статистика, 2004. - 512 с.

2. Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. - СПб.: БХВ-Петербург, 2004. - 608 с.

3. Балашов ЕЛ. и др. Микро и мини-ЭВМ / Учебное пособие для вузов - Л.: Энергоиздат, 1984. - 376 с.

4. Хвощ С.Т. и др. Микро процессоры и микро ЭВМ в системах автоматического управления / Справочник. - Л.: Машиностроение, 1987. - 640 с.

5. Солонина А.И., Улахович ДА., Яковлев Л.А. Алгоритмы и процессоры цифровой обработки сигналов. - СПб.: БХВ-Петербург, 2002. - 464 с.

6. Олифер ВТ., Олифер НА. Компьютерные сети. Принципы, технологии, протоколы / Учебник для вузов 2-е издание. - СПб.: Питер, 2005. - 864 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.