Для уменьшения разрядности чисел рекомендуется включать интеграторы после нерекурсивной части, так как входящий в эту часть дифференциатор обеспечит отсутствие постоянных составляющих на входе любого интегратора и предотвратит их накопление.
, -
ры общего вида с квазиконечной ИХ. В случае квазисимметричной или квазиантисимметричной ИХ фазовая характеристика будет квазилинейной. Эксперименты , -
ностями квантования чисел в процессоре (дая процессора Intel Pentium - 10-6 и 1015 соответственно для 32- и 64-р^рядных чисел с плавающей точкой). Для ИХ в виде аппроксимации окна Хэмминга двумя отрезками полинома 3-й степени, а = 0.99999, M = 5000, фазовая погрешность на частоте среза составила 0,05°, а
среднеквадратическое значение этой погрешности в полосе пропускания - 0,02°.
, -
рования при жестких ограничениях, накладываемых на время перестройки пара, -
конечной импульсной характеристикой.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Воротков В.Л., Лукин Р.П. Повышение эффектавности информационно-телеметрического обеспечения в условиях риска потерь информации // Приборы и системы. Управление, контроль, диагностика. - 2006, №3.
2. Сарыче в В.В., Ткаченко М.Г. Использование цифровых фильтров в канальных процессорах информационно-измерительных систем. - М.: Естественные и технические науки. 2008, №1.
УДК 681.324
Ю.А. Цветкова
КОМПЛЕКСНЫЙ ПОДХОД К ПОВЫШЕНИЮ ЭФФЕКТИВНОСТИ МНОГОМАШИННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
Введение. Современное развитие средств м оделирования требует от компьютеров (ЭВМ) все большей производительности, повышение которой идет по пути создания разнообразных аппаратных ускорителей (акселераторов (АК)) вычислительного процесса и вычислительных систем (ВС) [1-5].
Среди ВС наиболее эффективны по набору показателей (производительность /стоимость; широкий класс приложений; надежность; маштабируемость и др.) многомашинные (кластерные) ВС на базе сетевых Switch-тexнoлoгий, которые в настоящее время широко применяются при построении разнообразных вп^систем [2, 6].
Статья посвящена комплексному подходу к повышению эффективности многомашинной ВС путем эволюции ее структуры (объединение кластера ЭВМ и кластера акселераторов на базе сетевой Switch-тexнoлoгии) и оптимизация обработки соответствующего этой структуре класса задач. Данная структура ВС позволяет эффективно обрабатывать широкий класс практически важных задач.
1. Условия эффективности обработки задач в ВС. Задача с объемом счета (у) в простых операциях (ОП) может быть выполнена одним процессором (узлом)
с производительностью Р1 [ОП/с] или кластером из N узлов с пиковой производительностью Ркл = Р1 * N , но если узлы зависимы, то Рк (Ы) < Р1 *N. Требуемое от ВС число узлов на определенном временном отрезке и логические зависимости по обмену данными задается графом задачи. Если ВС выделяет ресурс точно в требуемый момент (и не раньше и не позже) и в необходимом объеме (не меньше и не больше), то эффективность обработки г|=1, а Р(^), 1)=Р1 * N(1). Это режим идеальной адаптивной обработки (идеадьный динамический режим). Назовем ее графовым параллельным компьютером (ГПК). Для ГПК выполняются условия: N(1)=^), где п(1) - текущий параллелизм задачи, и время обмена Тобм=0. В статическом режиме (СР) Ркл(Ы)=сош!1 и всегда г|<1. В статье рассматривается лишь .
обработки, которые определяются только параметрами задачи и числом N (1<№лшях), где пмах - наибольший параллелизм задачи. При N > тах величина г| .
ц=Б(Ы)/Ы=1/(1 + ТизГ) (Ы)); (1<Ы<птах);
_ (1) Б(Ы) =Т1/Тсч(Ы), Тизб(Ы)=Тизб(Ы)/Т1,
где - ускорение обработки; Тизб(Щ - избыточный ресурс кластера;
ТИЗ(7 (Ы) - нормированное значение величины ТизбОТ; Т1, Тсч(Ы) - время счета
программы соответственно одним и N узлами.
Значение Тизб(^>0 обусловлено только изменением параллелизма задачи п(1) в ходе счета (0<1< Тсч(^).
По процессу счета можно выбрать оптимальный вариант по выбранным приемлемым значениям ускорения и эффективности (№пт; 8(№пт); г| (№пт)).
, (1) , -мизация осуществляется методом целенаправленного подбора N по специальному .
При обработки задачи в реальной ВС к Тсч^) добавляется время внешнего
обмена Тобм^) и тогда время обработки задачи ТобрОТ < Тсч^) + Тобм^). (<) ,
требует независимых каналов обмена и достигается установкой коммутаторов. Величина г| снижается дополнительно также из-за несоответствия структур графа задачи и структуры ВС. Необходимость максимального соответствия структур для достижения г|шах доказана практикой [1].
В [2] отмечается, что разброс величины РклОТ от пиковой составляет от 90% до 2% и для ВС с N>10 вопрос согласования структур выходит на передний план. Граф является информационным ядром задачи, т.е. содержит информацию о спе-, , . для согласования структур необходимо представлять граф в различных эквива-.
2.Эквивалентные формы представления графа задачи и их использование для повышения эффективности обработки задач в ВС.Математическая модель задачи представляется операторами различного уровня и каждому уровню соответствует свой граф. Каждый последующий уровень получается из предыдущего декомпозицией его операторов (р^ложением). При этом последний включа-
(+, - , * , / ).
Понятие оператора более общее, чем понятие функции и охватывает как про, . ,
при этом сложный оператор может представляться множеством простых [3]. Оператор связывает переменные причинно-следственной связью и может описывать ( , , , ). Практическая реализация операторов может быть программной, аппаратной или -.
Для целей статьи представляют интерес следующие формы эквивалентного представления графа задачи:
1) ( );
2) ( );
3) гомоморфная свертка (ГС) [2].
( ), -
раторов графа задачи qi С О ^=1,2,.. I) на три подмножества так, чтобы:
123 123 11
О и О" и О =О и О П О" = О , при этом qi С О будут обрабатываться только
2 2 3 3
универсальными ЭВМ, qi С О - только АК, а qi С О - ЭВМ совместно с АК.
Повышение производительности ЭВМ с помощью АК осуществлялось всегда по мере развития больших интегральных схем (БИС) [3, 4]. АК разгружает центральный процессор ЭВМ от узкоспециализированных операторов, обусловленных спецификой задачи - вычисление элементарных и специальных функций, прямое и обратное преобразование Фурье, операции над матрицами и другие. Ускорение в выполнении операторов аппаратным путем по сравнению с программным может достигать для некоторых операторов до 100 [4]. Для повышения эффективности обработки задачи на кластере из универсальных совместимых ЭВМ объединим его с кластером из АК. Пример двухслойной структуры гетерогенного кластера из четырех ЭВМ с АК и двух коммутаторов К1, К2 представлен на рис. 1. Данная структура обладает новыми качествами. Повышается производительность кластера за счет ускорения счета в обоих слоях и ускорение обмена в слоях и между слоями. Коммутатор образует И/2 независимых каналов обмена, где Я - число портов. По.
Управление обработкой задачи возлагается на одну из ЭВМ. Связь между ЭВМ и ее АК (оформлены в виде отдельной платы) осуществляется по внутренней шине. АК получает задания от ЭВМ, выполняет их самостоятельно (или коллективно в своем слое) и отправляет результаты ЭВМ.
Для выбора оптимального варианта обработки воспользуемся второй и
( , ).
граф задачи в виде групп (подграфов) независимых операторов от начала графа, а гомоморфная свертка - в виде подграфов операторов по их связности в порядке их обработки от начала графа.
Рис. 1. Двухслойная структура гетерогенного кластера
Форма КПФ позволяет определить внутренний параллелизм задачи в
группах (nk), где k=1,2,3 . . . Kmax - (число групп) и максимальный параллелизм
задачи nkmax. Общее число узлов в ЭВМ должно быть N > nkmax. КПФ позволяет также с помощью отображения операторов групп на конкретное число узлов ЭВМ ВС составлять расписание их работы по специальным алгоритмам без учета и с учетом обмена, моделировать процесс обмена отдельно. КПФ составляется по матрице смежности графа задачи с помощью ЭВМ, начиная со входных операторов. При этом множество Q разбивается на упорядоченные подмножества (группы) Qk (k=1,2,3... Kmax) так, что Q1 U Q2 U Q3 . . . U Qkmax=Q и Q^ Q2f! Q3 . . . П
Qkmax=0. Число "К" есть порядковый номер оператора qi от начала графа по логическим связям qiK С QK (k=1,2,3 . . . kmax). Если некоторому qi соответствует
k, " операторов'' для выбора одного значения. Изложение этого способа не входит в .
( ) -
рицей смежности B(IxI), а числом (kmax-1) матриц смежности Вкк+1 (k=1,2,3 . . . (kmax-1)) значительно меньшего размера. Матрицы Вкк+1 связывают смежные
группы операторов Qk и QK+1 , а число 'k' указывает на последовательность их обработки. Операторы одной группы независимы между собой и могут обрабатываться параллельно или последовательно.
Выбирается оптимальный вариант обработки по счету путем ряда итера, N=nk max . осуществляется распределение операторов по ЭВМ. Для этого с помощью третьей
формы (ГС) по матрицам Вкк+1 (k=1,2,3 . . . (kmax-1)) множество Q разделяется
,
,
своем слое с универсальными.
Число вариантов разбиения, как правило, выражается очень большим числом. Из них можно выбрать оптимальный вариант по загрузке ЭВМ и времени внешнего обмена. Распределение подмножеств Ql(l = 1,2,3...L) по ЭВМ осуществляется с учетом их производительности. Если Q1 соответствует общее число операций V1 [оп], m-
P L
Vm = 'MP * Y/1 , (2)
MPm И
m=1
где Pm - производительность отдельной ЭВМ (m=1,2,3 . . . М); М - число ЭВМ;
L I
Y/1 = V[on] - общее число операций в задаче; V = ^ Vi, где Vi - объем от-l=1 i дельного оператора qi.
При таком распределении обработка задачи будет закончена всеми ЭВМ .
выполняться для обработки подграфов в ЭВМ, в качестве которых могут выступать SMP-серверы с различным числом процессоров.
После оптимального распределения объема V по ЭВМ моделируется процесс внешнего обмена между ЭВМ и выбирается оптимальный вариант, при котором Тобм = Тобм min. При моделировании берутся реальные характеристики коммуникационной системы кластера и сетевой Switch-технологии. Моделирование осуществляется по тому же алгоритму, что и для процесса счета. Затем можно выполнять полное моделирование - одновременно для всех процессов счета и обмена, которое проводится по более сложному алгоритму.
3. Применение разработанной структуры ВС. Данная структура может успешно применяться для моделирования процессов в сложных системах, операторы которых разнообразны по своей физической природе и описываются различными системами уравнений большой размерности и специальными уравнениями. Системы уравнений большой размерности для решения разбиваются по всем узлам кластера, включая АК. Структура ВС позволяет осуществлять внешние обмены типа:
ЭВМ-ЭВМ, ЭВМ-AK, АК-АК. При решении частных задач они разбиваются по
,
ЭВМ. Кластер комплектуется из готовых элементов - ЭВМ, коммутаторов, линий связи, интерфейса и программного обеспечения. Для АК также существуют программы для широкого класса задач, а при необходимости могут быть выполнены . : проектирования, в технологических и диагностических комплексах; для замены части натурных испытаний сложных объектов испытанием на математических моделях в различных режимах и обработки полученных численных результатов; в качестве тренажерного комплекса для подготовки операторов; для моделирования групповых действий объектов (роботов, боевых машин) - с ЭВМ тогда связываются отдельные объекты, которые взаимодействуют в своем слое.
На основании изложенного можно сделать вывод: объединение кластера ЭВМ и кластера акселераторов, и согласование структур графа задачи и кластера выбором оптимального варианта обработки задачи повышает эффективность предлагаемой структуры кластера на широком классе задач. .
. -, -
мального варианта обработки. Изложено содержание процесса оптимизации на основе различных форм эквивалентного представления графа задачи (канониче-
). -стера на основе двухслойной коммутации эффективна на широком классе задач, так как обладает повышенной производительностью по процессам счета и обмена, а так же повышенной надежностью.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Пятибрат ов АЛ., Гудыно Л.П., Кириченко А А. Вычислител ьные системы, сети и телекоммуникации / Учебник 2-е издание. - М.: Финансы и статистика, 2004. - 512 с.
2. Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. - СПб.: БХВ-Петербург, 2004. - 608 с.
3. Балашов ЕЛ. и др. Микро и мини-ЭВМ / Учебное пособие для вузов - Л.: Энергоиздат, 1984. - 376 с.
4. Хвощ С.Т. и др. Микро процессоры и микро ЭВМ в системах автоматического управления / Справочник. - Л.: Машиностроение, 1987. - 640 с.
5. Солонина А.И., Улахович ДА., Яковлев Л.А. Алгоритмы и процессоры цифровой обработки сигналов. - СПб.: БХВ-Петербург, 2002. - 464 с.
6. Олифер ВТ., Олифер НА. Компьютерные сети. Принципы, технологии, протоколы / Учебник для вузов 2-е издание. - СПб.: Питер, 2005. - 864 с.