Научная статья на тему 'Интеграция инструментальных средств организациипроблемно-ориентированных распределенных вычислений'

Интеграция инструментальных средств организациипроблемно-ориентированных распределенных вычислений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
230
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛЕНИЯ / ПРОБЛЕМНО-ОРИЕНТИРОВАННОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ / ИНТЕГРАЦИЯ ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ / DISTRIBUTED COMPUTING / PROBLEM-ORIENTED SOFTWARE / TOOLS INTEGRATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бычков Игорь Вячеславович, Опарин Геннадий Анатольевич, Новопашин Алексей Петрович, Феоктистов Александр Геннадьевич, Корсуков Александр Сергеевич

Представлен подход к интеграции инструментальных средств организации распределенных вычислений в единую среду проектирования, создания и применения проблемно-ориентированных программных комплексов различного назначения. Отличительной особенностью представленного подхода является интегрированное применение методологии разработки параллельных и распределенных пакетов прикладных программ, мультиагентных технологий управления вычислительным процессом и комплексного моделирования (концептуального, имитационного и полунатурного) создаваемых проблемно-ориентированных распределенных программных комплексов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бычков Игорь Вячеславович, Опарин Геннадий Анатольевич, Новопашин Алексей Петрович, Феоктистов Александр Геннадьевич, Корсуков Александр Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE INTEGRATION OF TOOLS FOR ORGANISATION OF THE PROBLEM-ORIENTED DISTRIBUTED COMPUTING

In article the approach to the tools integration of organization of the distributed computing into the united environment of designing, creating and using of the problem oriented software of different purpose is presented. The distinctive feature of this approach is the integrated application of the methodology of parallel and distributed software packages, multiagent technology of computing process management and complex modeling (conceptual, simulation and seminatural) the problem-oriented distributed software systems.

Текст научной работы на тему «Интеграция инструментальных средств организациипроблемно-ориентированных распределенных вычислений»

УДК 681.3.06

И. В. Бычков, Г. А. Опарин, А. П. Новопашин, А. Г. Феоктистов А. С. Корсуков, В. Г. Богданова

Институт динамики систем и теории управления СО РАН ул. Лермонтова, 134, Иркутск, 664033, Россия

E-mail: [email protected]

ИНТЕГРАЦИЯ ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ ОРГАНИЗАЦИИ ПРОБЛЕМНО-ОРИЕНТИРОВАННЫХ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛЕНИЙ

Представлен подход к интеграции инструментальных средств организации распределенных вычислений в единую среду проектирования, создания и применения проблемно-ориентированных программных комплексов различного назначения. Отличительной особенностью представленного подхода является интегрированное применение методологии разработки параллельных и распределенных пакетов прикладных программ, мультиагент-ных технологий управления вычислительным процессом и комплексного моделирования (концептуального, имитационного и полунатурного) создаваемых проблемно-ориентированных распределенных программных комплексов.

Ключевые слова: распределенные вычисления, проблемно-ориентированное программное обеспечение, интеграция инструментальных средств.

Введение

Современное развитие информационно-вычислительных и сетевых технологий, программного обеспечения и аппаратных средств позволяет организовывать сложные географически распределенные вычислительные системы для поддержки проведения массовых ресурсоемких фундаментальных и прикладных исследований. В частности, в научном сообществе ведутся активные работы по созданию и использованию Грид-систем различного назначения, среди которых важное место отводится вычислительным Грид-системам.

В данной статье представлен опыт, накопленный в Институте динамики систем и теории управления СО РАН (ИДСТУ СО РАН) в области организации высокопроизводительных параллельных и распределенных вычислений.

Суперкомпьютерный центр ИДСТУ СО РАН предоставляет высокопроизводительные вычислительные ресурсы и системы хранения данных в коллективное пользование учреждениям иркутского научно-образовательного комплекса для наукоемких вычислений. Основу такой инфраструктуры составляют вычислительные установки, в которых реализованы наиболее востребованные на сегодняшний день архитектурные решения - кластеры выделенных серверных узлов и серверы на базе графических ускорителей.

Существующая материально-техническая база суперкомпьютерного центра включает: вычислительный кластер МВС-1000 (пиковая производительность 170 GFlops), вычислительный кластер Blackford (пиковая производительность 1,5 TFlops), гибридный вычислительный кластер «Академик В. М. Матросов» (пиковая производительность 33,7 TFlops), кластеры невыделенных вычислительных машин на базе ПЭВМ лабораторий ИДСТУ СО РАН и серверы с графическими ускорителями NVIDIA, связанные локальной сетью и образующие универсальный полигон для проведения экспериментов.

1818-7900. Вестник НГУ. Серия: Информационные технологии. 2012. Том 10, выпуск 4 © И. В. Бычков, Г. А. Опарин, А. П. Новопашин, А. Г. Феоктистов,

А. С. Корсуков, В. Г. Богданова, 2012

Интегрированная кластерная система

Одной из разновидностей Грид-систем является интегрированная кластерная система -распределенная вычислительная среда, предназначенная для решения фундаментальных и прикладных вычислительных задач и характеризующаяся следующими особенностями:

• в качестве узлов системы выступают вычислительные кластеры;

• кластеры организуются на базе как выделенных, так и невыделенных вычислительных машин и, следовательно, существенно различаются по степени надежности своих вычислительных ресурсов;

• на разных уровнях интеграции системы существуют различные категории пользователей, в их числе пользователи, нуждающиеся в высокоуровневых средствах организации вычислительного процесса решения задачи;

• вычислительные кластеры используются пользователями системы совместно с владельцами этих кластеров;

• задание пользователя представляет собой спецификацию процесса решения задач, содержащую информацию о требуемых вычислительных ресурсах, исполняемых прикладных программах, входных / выходных данных, а также другие необходимые сведения;

• множество заданий пользователей рассматривается с точки зрения теории очередей и представляется в виде совокупности потоков заданий с приоритетами;

• поток заданий характеризуется динамичностью, стохастичностью, неоднородностью, отсутствием обратной связи, неординарностью, стационарностью;

• свободных ресурсов системы недостаточно для одновременного обслуживания всех заданий, находящихся в очередях;

• в рамках системы функционируют распределенные проблемно-ориентированные программные комплексы, размещенные в ее узлах;

• в общем случае в системе имеется программно-аппаратная вычислительная избыточность (программа может быть размещена и выполнена в разных узлах системы, а одни и те же вычисления могут быть произведены с помощью различных программ);

• в системе нет единой политики администрирования вычислительных кластеров, на кластерах применяются различные принципы и механизмы обработки потоков заданий различных типов.

Программные инструменты

В настоящее время в ИДСТУ СО РАН в рамках САТУРН-технологии [1] разработаны следующие новые программные инструменты [2-4] для создания интегрированных кластерных систем: среда непроцедурного программирования СиКруС для синтеза параллельных программ на языке Fortran-DVM с учетом ресурсных ограничений используемой вычислительной системы и продолжительности исполнения прикладных модулей; инструментальный комплекс ORLANDO для автоматического конструирования асинхронных параллельных программ в вычислительных кластерах; инструментальный комплекс DISCOMP для организации распределенных пакетов прикладных программ в разнородных вычислительных средах; инструментальный комплекс РЕБУС для параллельного решения нелинейных систем булевых уравнений; инструментальный комплекс DISCENT для организации интегрированных кластерных сред; графическая инструментальная среда СИРИУС для моделирования и анализа эффективности функционирования интегрированных кластерных сред; мультиагент-ная среда децентрализованного планирования вычислений и распределения ресурсов, функционирующая на основе вероятностных моделей надежности интегрированной кластерной системы и экономических механизмов регулирования спроса и предложения ресурсов.

Сбор данных о функционировании интегрированной кластерной системы осуществляется с помощью программного комплекса метамониторинга вычислительных ресурсов, обладающего расширенной по сравнению с аналогичными системами функциональностью. Данный комплекс обеспечивает:

Технологическая схема решения задач

• взаимодействие разработанных средств с существующими системами мониторинга вычислительных кластерных систем (например, с системой Ganglia) в рамках единого программного комплекса;

• веб-ориентированный доступ пользователей к этому программному комплексу;

• сбор информации о текущих эксплуатационных характеристиках узлов с разнотипных вычислительных кластерных систем, ее унификацию, хранение в единой базе данных, а также представление этой информации администраторам различных уровней интегрированной кластерной системы;

• наличие в составе программного комплекса мониторинга интегрированной кластерной системы экспертного модуля, функционирующего на базе продукционной системы и позволяющего определять с помощью продукционных правил критические ситуации в процессе работы программно-аппаратных средств, а также формировать рекомендации администраторам вычислительных кластеров по разрешению этих ситуаций.

Перечисленные инструментальные средства обеспечивают поддержку всех научнотехнических процессов, связанных с решением в интегрированной кластерной системе фундаментальных и прикладных задач на основе парадигм параллельного и распределенного программирования.

Эти инструментальные средства были использованы для создания ряда параллельных и распределенных пакетов прикладных программ, а также экспериментальной кластерной Грид-системы ИДСТУ СО РАН.

Технология интеграции программных инструментов

Технология интеграции инструментальных средств организации проблемноориентированных распределенных вычислений представляет собой следующую совокупность компонентов:

• методов автоматизации процессов концептуализации предметных областей решаемых задач, построения вычислительных моделей, проведения имитационного и полунатурного моделирования вычислительных систем, выполнения параллельных и распределенных вычислений, мониторинга работы вычислительных систем;

• мультиагентных средств управления вычислительными процессами решения прикладных и фундаментальных исследовательских задач, планирования и распределения вычислительных ресурсов;

• инструментальных программных средств создания и применения проблемноориентированных программных комплексов различного назначения, в том числе параллельных и распределенных пакетов прикладных программ;

• программно-аппаратных средств (вычислительных кластеров и системного программного обеспечения для их интеграции и управления), в рамках которых осуществляется создание и применение проблемно-ориентированных программных комплексов.

Перечисленные компоненты объединяются в единую технологическую схему (см. рисунок) решения прикладных и фундаментальных исследовательских задач с заданными параметрами уровня их обслуживания (временем, стоимостью и надежностью процесса решения задачи). Объединение компонентов осуществляется на основе оригинальной объектной модели [5], которая обеспечивает взаимосвязанное представление проблемно-ориентированного, программно-аппаратного, имитационного и управляющего слоев знаний об интегрированной кластерной системе, а также всестороннее исследование необходимых свойств (эффективность, надежность и др.) проектируемых для этой системы прикладных программных комплексов различного назначения.

Использование в инструментальных средствах единой модели интегрированной кластерной системы позволяет обеспечить комплексирование по данным для всех проблемноориентированных программных комплексов, разрабатываемых с помощью этих средств. Тем самым обеспечивается возможность использования в процессе создания нового программного комплекса фрагментов описания предметных областей, функциональных модулей, исходных данных и результатов вычислений, имеющихся в других комплексах. Вследствие этого сокращаются сроки разработки прикладного программного обеспечения и проведения вычислительных экспериментов.

В качестве примеров практического использования представленных в статье инструментальных средств можно привести ряд практически важных задач, решенных в интегрированной кластерной системе ИДСТУ СО РАН. В их числе:

• решение задач обращения булевых функций;

• решение задачи оптимального управления и построения графиков множеств достижимости;

• параллельное решение систем булевых уравнений общего вида;

• декомпозиция алгоритма филогенетического классификатора CARMA;

• имитационное и полунатурное моделирование алгоритмов планирования и распределения ресурсов в распределенных вычислительных средах;

• моделирование процессов складской логистики;

• комплексирование по данным разработанных пакетов моделирования складской логистики.

Применение представленной выше технологической схемы решения задач позволяет существенно уменьшить такие показатели функционирования интегрированной кластерной системы, как число незавершенных (из-за сбоя вычислительных узлав) заданий, число рестартов программ, общее время выполнения набора взаимосвязанных заданий, а также повысить коэффициент полезной загрузки ресурсов системы [3; 6; 7].

Заключение

В целом в статье представлен подход к организации проблемно-ориентированных распределенных вычислений, обеспечивающий единую технологическую схему решения широкого спектра задач в интегрированной кластерной системе, а также комплексную инструментальную поддержку всех научно-технических процессов в ней.

Основное отличие этого подхода от подходов, традиционно применяемых к организации разнородных распределенных вычислительных сред, состоит в комплексном использовании: методов и средств инженерии знаний; методов автоматического построения параллельных распределенных планов решения непроцедурных постановок задач на вычислительной модели предметной области в виде системы булевых уравнений; децентрализованной схемы управления решением поставленной задачи с использованием группы интеллектуальных агентов; концептуального, имитационного и полунатурного моделирования создаваемых проблемно-ориентированных распределенных программных комплексов.

Список литературы

1. Опарин Г. А. Сатурн - метасистема для построения пакетов прикладных программ // Пакеты прикладных программ. Методы и разработки. Новосибирск: Наука, 1982. С. 130-160.

2. Бычков И. В., Опарин Г. А., Новопашин А. П., Феоктистов А. Г., Корсуков А. С., Сидоров И. А. Высокопроизводительные вычислительные ресурсы ИДСТУ СО РАН: текущее состояние, возможности и перспективы развития // Вычислительные технологии. 2010. Т. 15, № 3. С. 69-82.

3. Бычков И. В., Опарин Г. А., Феоктистов А. Г., Корсуков А. С. Децентрализованное

управление потоками заданий в интегрированной кластерной системе // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2011. Т. 9, вып. 2. С. 42-54.

4. Опарин Г. А., Богданова В. Г. Инструментальные средства автоматизации параллельного решения булевых уравнений на многоядерных процессорах // Программные продукты и системы. 2012. № 1. С. 10-14.

5. Опарин Г. А., Феоктистов А. Г. Модели и инструментальные средства организации распределенных вычислений // Параллельные вычисления и задачи управления: Тр. IV Меж-дунар. конф. М.: Изд-во ИПУ РАН, 2008. С. 1126-1135.

6. Бычков И. В., Корсуков А. С., Опарин Г. А., Феоктистов А. Г. Инструментальный комплекс для организации гетерогенных распределенных вычислительных сред // Информационные технологии и вычислительные системы. 2010. № 1. С. 45-54.

7. Корсуков А. С. Инструментальные средства полунатурного моделирования распределенных вычислительных систем // Современные технологии. Системный анализ. Моделирование. 2011. № 3 (31). С. 105-110.

Материал поступил в редколлегию 28.10.2012

I V. Bychkov, G. A. Oparin, A. P. Novopashin, A. G. Feoktistov A. S. Korsukov, V. G. Bogdanova

THE INTEGRATION OF TOOLS FOR ORGANISATION OF THE PROBLEM-ORIENTED DISTRIBUTED COMPUTING

In article the approach to the tools integration of organization of the distributed computing into the united environment of designing, creating and using of the problem oriented software of different purpose is presented. The distinctive feature of this approach is the integrated application of the methodology of parallel and distributed software packages, multiagent technology of computing process management and complex modeling (conceptual, simulation and seminatural) the problem-oriented distributed software systems.

Keywords: distributed computing, problem-oriented software, tools integration.

i Надоели баннеры? Вы всегда можете отключить рекламу.