Научная статья на тему 'Оптимизация вычислительной структуры задач с переменной интенсивностью потоков данных на реконфигурируемых вычислительных системах'

Оптимизация вычислительной структуры задач с переменной интенсивностью потоков данных на реконфигурируемых вычислительных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
262
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АППАРАТНАЯ РЕАЛИЗАЦИЯ / ДОКИНГ / РЕКОНФИГУРИРУЕМЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ / КРИПТОГРАФИЯ / HARDWARE REALIZATION / DOCKING / RECONFIGURABLE COMPUTER SYSTEMS / CRYPTOGRAPHY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дордопуло Алексей Игоревич, Левин Илья Израилевич, Сорокин Дмитрий Анатольевич

Статья посвящена применению методов оптимизации и адаптации архитектуры реконфигурируемой вычислительной системы под структуру задач с переменной интенсивностью потоков данных, к числу которых относятся задачи криптографии, молекулярного конструирования лекарств, транскодирования видеоизображений. Отличительной особенностью описываемого решения по сравнению с известными реализациями является функционально завершенное решение полной задачи, обеспечивающее согласованность функционирования всех фрагментов в едином вычислительном контуре.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дордопуло Алексей Игоревич, Левин Илья Израилевич, Сорокин Дмитрий Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPTIMIZATION OF COMPUTING STRUCTURE OF TASKS WITH VARIABLE DATA FLOW DENSITY ON RECONFIGURABLE COMPUTER SYSTEMS

The paper is devoted to use of methods of optimization and adaptation of architecture of a reconfigurable computer system to the structure of the solving task with variable data flow density like tasks of cryptography, molecular drug design, image transcoding. In comparison with existing realizations, the distinctive feature of the viewed solution is all-in-one solution of complete problem of docking on reconfigurable computer sys

Текст научной работы на тему «Оптимизация вычислительной структуры задач с переменной интенсивностью потоков данных на реконфигурируемых вычислительных системах»

Раздел VII. Технические средства защиты информации

УДК 004.382.2

А.И. Дордопуло, И.И. Левин, ДА. Сорокин

ОПТИМИЗАЦИЯ ВЫЧИСЛИТЕЛЬНОЙ СТРУКТУРЫ ЗАДАЧ

С ПЕРЕМЕННОЙ ИНТЕНСИВНОСТЬЮ ПОТОКОВ ДАННЫХ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ*

Статья посвящена применению методов оптимизации и адаптации архитектуры реконфигурируемой вычислительной системы под структуру задач с переменной интенсивностью потоков данных, к числу которых относятся задачи криптографии, молекулярного конструирования лекарств, транскодирования видеоизображений. Отличительной особенностью описываемого решения по сравнению с известными реализациями является функционально завершенное решение полной задачи, обеспечивающее согласованность функционирования всех фрагментов в едином вычислительном контуре.

Аппаратная реализация; докинг; реконфигурируемые вычислительные системы; .

A.I. Dordopulo, I.I. Levin, D.A. Sorokin

OPTIMIZATION OF COMPUTING STRUCTURE OF TASKS WITH VARIABLE DATA FLOW DENSITY ON RECONFIGURABLE COMPUTER

SYSTEMS

The paper is devoted to use of methods of optimization and adaptation of architecture of a reconfigurable computer system to the structure of the solving task with variable data flow density like tasks of cryptography, molecular drug design, image transcoding. In comparison with existing realizations, the distinctive feature of the viewed solution is all-in-one solution of complete problem of docking on reconfigurable computer system, providing coordinated functioning of all fragments of the task in a single computer system.

Hardware realization; docking; reconfigurable computer systems; cryptography.

Введение. Необходимость качественного решения вычислительно-^удоемких задач в различных областях науки и техники, таких как информационная безопасность, криптоанализ, молекулярное моделирование, требует применения новых подходов к повышению производительности реконфигурируемых вычислительных систем. Основная проблема при решении таких задач на РВС состоит в том, что размер потока данных в их вычислительной структуре заранее не определен и зависит от самих обрабатываемых данных. Так, для задач криптоанализа размер потока данных в разных местах вычислительной структуры отличается до десяти раз, а для задач молекулярного моделирования - на 2-4 десятичных порядка.

Рассмотренные в статье [1] методы оптимизации фрагментов задач с переменной интенсивностью потоков данных и средства адаптации архитектуры реконфигурируемой вычислительной системы (РВС) под структуру решаемой задачи обеспечивают согласованную аппаратную реализацию всех фрагментов задачи в едином вычислительном контуре.

* Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации.

Применение этих методов (редукция вычислительной структуры графа фрагмента задачи, использование предвычисленных массивов для хранения результатов повторяющихся операций, согласованное распараллеливание подграфов графа задачи, использование специальной структуры хранения данных) позволяет получить качественно новое решение задач с существенно переменной интенсивностью потоков данных, обеспечивающее многократный выигрыш (не менее 10 раз) по скорости решения задачи на РВС по сравнению с вычислительными системами традиционной архитектуры при пересчете на один процессор. Рассмотрим оптимизацию фрагмента задачи с переменной интенсивностью потоков данных на примере задачи молекулярного моделирования - докинга [2, 3].

Оптимизация вычислительно-трудоемких фрагментов расчета внутренней энергии лиганда задачи докинга. Внутренняя энергия лиганда Еп^ учитывает энергию Ван-дер-Ваальса Е_Уц, электростатическую энергию Ещ _Е5 и энергию торсионного взаимодействия лиганда Е^ _1огз [2]. Расчет внутренней

энергии лиганда состоит из разнородных по плотности потока обрабатываемых .

Так, расчет Ецё-Шз выполняется однократно, время обработки одного лиганда зависит от числа торсионных связей ИОг!., времени на обработку одной связи 1Ог!! и вычисляется по формуле

^Ештз _ ^Штз * Чот.

Согласно приведенной в работе [2] математической модели, максимальное число ^От8 не превысит 500, время обработки одной связи ^=1 такту работы ПВМ. Тогда можно определить время обработки для расчета торсионной энергии при структурной реализации Ецг_(Оге, которое составит гШоге=500 тактов. Полученное значение не превышает значение времени обработки для фрагментов Я и ЯТ, поэтому структурная реализация процедуры расчета Ецв.{Огз не требует распараллеливания для согласованной работы в едином вычислительном контуре. Вместе с тем, необходимый для её реализации аппаратный ресурс также был со-

1 2,

устройств с 68 до 51.

При вычислении значений энергии Ван-дер-Ваальса Бц^ц, и электростатического взаимодействия Еи^Е5 используется принцип суперпозиции полей [2, 3], когда для текущего атома необходимо учитывать влияние всех остальных атомов лиганда, в результате чего многократно (до двух десятичных порядков) возрастает поток промежуточных данных. Время расчета значений этих энергетических составляющих выполняется за время, определяемое по формуле:

tEvdw _ ез _ 2 (tvdw ^ ^ез), (3)

где - время расчета одного прохода Ец^ц,, ге, - время расчета одного прохода

ЕИ%-Е$.

Значения Еи^упщ и Ецё_Е5 зависят от одной общей вычисляемой переменной, поэтому целесообразно объединить структурные реализации одной ступени расчета Ецё_тц, и Ец^ж в единый фрагмент, чтобы сократить вдвое время обработки. Формула (3) в этом случае примет вид

+ _ ^Шош _ + _ ^Шош ' (^Шош _1) _ + (4)

^Evdw _ ез 2 vdw _ ез а, (4)

где га - время обработки одной пары атомов, которое составляет 1 такт работы ПВМ.

Для лиганда максимального размера с числом атомов Natom=200 время расчета электростатической EligES и Ван-дер-Ваадьсовой Elig_VDW составляющих общей энергии составит 19 900 тактов, что существенно превышает максимальное из достигнутых при реализации фрагментов R, RT, Elig-prot значение в 950 тактов и требует распараллеливания для согласования скорости обработки информации разных фрагментов задачи в едином вычислительном контуре. Степень распараллеливания n в данном случае можно определить как

tEvdw es

П =------------, (5)

tI

гдеГд - наибольшее время выполнения других фрагментов задачи, равное 950 тактам. При tEvdw_es=19 900 и tElig_prot=950 необходимая степень распараллеливания n 21.

При определении необходимой степени распараллеливания должны учитываться и ограничения по занимаемому ресурсу, которые определяются как

lim V(n) < 1, (6)

tEvdw _ es ^ tI V0

V0 - , V(n) - ,

необходимого ДЛЯ построения вычислительной структуры Eug_VDW_ES с учетом рас.

,

Eng-VDW_Es, равно 33, поэтому при n=21 получим Vmin(n)=693 устройства.

Свободный аппаратный ресурс ПВМ 16V5-75 для реализации вычислительной структуры Elig_VDW_ES после размещения вычислительных структур R, RT и Eng-prot для реализации вычислительной структуры Elig-VDW_ES можно оценить по формуле

V0 = С X Vp - Vg - VR - VRT - VEtors - VElig -prot ,

где Vp - объем ресурса, эквивалентный всему доступному ресурсу платформы;

- , -гласования потоков данных между вычислительными структурами и внутри них, для рассматриваемого случая составляет 0,71;

Vg - объем ресурса на реализацию фрагментов GEN и MPS; Vg=95;

VR - объем ресурса на реализацию фрагмента R; VR =440;

VRT - объем ресурса на реализацию фрагмента RT; VRT= 17;

VEtors - объем ресурса на реализацию фрагмента Elig_tors; VEtors=51;

VEiig-prot - объем ресурса на реализацию фрагмента EUg_prot; VEiig-prot=51.

С помощью несложных вычислений получим V0 =438 устройств.

(6) , 2 3

затрачиваемого на реализацию вычислительной структуры Elig_VDW_ES аппаратного 1,5 - 33 21 . ,

редукция вычислительного графа невозможна, степень распараллеливания необ-

n=20, (6).

N=200

' tEvdw es

t Evdw es =-------= 995 тактов.

n

, -

ботки данных можно разделить на две группы:

♦ фрагменты R, RT и Elig_tors (не более 600 тактов);

♦ фрагменты Elig_VDW_ES, Elig_prot (не более 1000 тактов).

2З4

Для согласования скорости обработки между этими группами наиболее простым решением, которое и было реализовано, явилось замедление скорости входного потока данных в соответствии со скоростями обработки на самом медленном участке задачи

Фрагменты задачи докинга в едином вычислительном контуре. В результате была синтезирована структура вычислительного конвейера, обеспечивающего полное решение задачи на РВС, представленная на рис. 3.

гат9 гашЮ гашії

Рис. 3. Структура вычислительного конвейера

Разработанная вычислительная структура с учетом архитектурных особенностей ПВМ 16V5-75 была отображена на структуру вычислительного поля 16V5-75, результат отображения представлен на рис. 4.

Общий объем задействованного оборудования на построение вычислительных блоков составил 1 078 устройств, реализующих 32-разрядные математические операции в стандарте 1ЕЕЕ754. В результате применения методов оптимизации 4-

сохранении заданной скорости решения задачи.

Результаты вычислительных экспериментов. Для проверки, оценки и обобщения результатов реализации задачи докинга на РВС был проведен ряд вычислительных экспериментов для четырех тестовых выборок, две из которых содержат молекулы с одинаковым числом атомов (48 и 52) и разным количеством торсионных степеней свободы, третья выборка состоит из молекул с одинаковым количеством торсионных степеней свободы, равным 7, но разным числом атомов, а четвертая выборка состоит из молекул с большим количеством атомов (до 198) и большим числом торсионных степеней свободы (до 18) [5, 6].

Рис. 4. Отображение основных фрагментов задачи докинга на структуру

ПВМ16V5-75

Оценка проводилась сравнением времени выполнения задачи молекулярного докинга на нескольких вычислительных системах:

♦ на персональн ых компьютерах, оснащенных процессорами Intel Core2Duo

3 , 2 ;

«Чебышев» (2 четырехъядерных процессора Intel Xeon E5472 3.0 ГГц,

8 ), (

. . );

♦ ( 32 )

СКИФ МГУ «Чебышев» (НИВЦ МГУ имени М.В. Ломоносова);

♦ ПВМ 16V5-75.

Для экспериментов по сравнению времени работы программы на РВС и кластерной системе стандартной архитектуры использовалась параллельная версия программы докинга SOL.

При докинге молекул тестовых выборок на РВС (ПВМ 16V5-75) была достигнута реальная производительность 125,7 Гфлопс, что составляет 89,8 % от пи.

16V5-75 -

30 000 Intel Core2Duo 3 -

35 90 ;

со стандартным вычислительным узлом суперкомпьютера СКИФ МГУ «Чебы-» - 6 15 ; 32-

« » - 3 5 .

.

программы докинга SOL приводят к интенсивному обмену MPI-сообщениями, в результате чего на скорость решения задачи, в основном, начинает влиять латент-

23б

MPI- , . ,

30, , , -

, ,

32,

, 32- , - 5 . -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

личества процессоров не повлияет на ускорение одного независимого запуска, а с

MPI-

процессами будет наблюдаться даже замедление работы программы.

Значение ускорения выполнения программы на РВС существенно зависит от размера рассчитываемой молекулы: чем больше количество атомов и торсионных

,

по сравнению с вычислительными системами традиционной архитектуры. Это , , -ганизации вычислений и меньшими накладными расходами на организацию вычислительного процесса на специализированных вычислительных системах, чем

. 16V5-75

, 70 -

,

лиганде и числа торсионных связей до их максимальных значений.

Полученные экспериментальные результаты позволяют сделать вывод о том, что использование РВС для решения задач с переменной интенсивностью потоков данных обеспечивает существенное ускорение: не менее чем на один десятичный порядок при пересчете на один процессор по сравнению с вычислительными системами традиционной архитектуры. Таким образом, применение РВС для таких , , -кости криптографических систем, требующих обработки больших потоков данных с переменной интенсивностью, позволяет существенно сократить как время реше-, .

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Левин ИМ., Дордопуло А.И., Сорокин ДА. Реализация докинга для молекулярного моделирования на реконфигурируемых вычислительных системах // Известия ЮФУ. Технические науки. - 2011. - № 7 (120). - С. 217-224.

2. Молекулярная стыковка: http://ru.wikipedia.org/wiki/floKHnr.

3. . ., . ., . . . -

: SOL // .

- 2008. - Т. 9. - С. 213-233.

4. http://ru.wikipedia.org/wiki/ _ .

5. AutoDock. http://autodock.scripps.edu/.

6. . ., . ., . ., . . -

. - 2- ., . . / . . И.А. Каляева. - Ростов-на-Дону: Изд-во ЮНЦ РАН, 2009. - 344 с.

Статью рекомендовал к опубликованию д.т.н., профессор Я.Е. Ромм.

Левин Илья Израилевич

Научно-исследовательский институт многопроцессорных вычислительных систем им. академика А.В. Каляева федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет».

E-mail: [email protected].

347922, . , . , . 224/1, . 65.

.: 88634623226.

Зам. директора по науке; д.т.н.

Сорокин Дмитрий Анатольевич

347922, г. Таганрог, пер. Украинский, д. 21, кв. 30.

E-mail: [email protected].

.: 88634393820.

.

Дордопуло Алексей Игоревич

« ».

E-mail:scorpio@mvs .tsure.ru.

347900, г. Таганрог, 10-й переулок, 114/1, кв. 6.

Тел.: 88634368651.

К.т.н.; с.н.с. отдела ИТ и ПУ.

Levin Ilya Israilevich

Kalyaev Scientific Research Institute of Multiprocessor Computer Systems at Southern Federal University.

E-mail: [email protected].

224/1, Lenin Street, Ap. 65, Taganrog, 347922, Russia.

Phone: +78634623226.

Deputy Director of Science; Dr. of Eng. Sc.

Sorokin Dmitry Anatolievich

E-mail: [email protected].

21, Ukrainskiy Lane, Ap. 30, Taganrog, 347922, Russia.

Phone: +78634393820.

Scientific Associate.

Dordopulo Alexey Igorevich

Southern Scientific Centre of the Russian Academy of Sciences.

E-mail: [email protected].

114/1, 10th Lane, Ap. 6, Taganrog, 347900, Russia.

Phone: +78634368651.

Senior Staff Scientist; Cand. of Eng. Sc.

УДК 004.08

А.М. Максимов, Е.Н. Тищенко

ОСОБЕННОСТИ ИСПОЛЬЗОВАНИЯ НОСИТЕЛЕЙ ИНФОРМАЦИИ В ЗАЩИЩЁННЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

В современных защищённых информационных системах общий уровень защищенности определяется уровнем защищенности самого слабого звена. Одним из таких звеньев являются накопители данных. Распространение, удешевление и увеличение объёмов накопителей вынуждает делать больше затрат для контроля за носителями данных, чтобы сохранить защищённое состояние информационной системы в целом. Дополнительные проблемы в этом направлении создаются с появлением, развитем и распространением , . применимы, или же в принципе не применимы подходы, использующиеся в настоящее время, что требует поиска новых решений по защите информационных систем.

Информационная система; накопители данных; магнитные накопители данных; твердотельные накопители данных; программно-техническая экспертиза.

i Надоели баннеры? Вы всегда можете отключить рекламу.