УДК 004.414
Возможности и задачи применения grid-технологий в муниципальных и региональных информационных системах
Косяков С. В., д-р техн. наук
Приводятся результаты исследований возможностей применения Grid-технологий в сфере автоматизации муниципального и регионального управления, рассматриваются задачи построения муниципальных и региональных Grid-сред, а также подходы к их решению на базе концепции «семантического Web».
Ключевые слова: Grid-технологии, муниципальные информационные системы, региональные информационные системы.
Рossibilities and Application Objectives of Grid Technologies in Municipal and Regional Information Systems
S.V. Kosyakov, Doctor of Engineering
The article gives research results of application possibilities and objectives of the GRID technologies in the municipal and regional management automation. The author considers design problems of the municipal and regional GRID-environments and their solution approaches based on the “Semantic Web” concept.
Keywords: Grid technologies, municipal informational systems, regional informational systems.
Муниципальное и региональное управление является сферой деятельности, которая связана с необходимостью сбора и обработки большого количества информации разными организациями. В настоящее время данная информация часто используется несогласованно, дублируется, может быть неполной, противоречивой и недостоверной. Это во многом объясняется наличием межведомственных информационных барьеров между участниками процессов управления. Вместе с тем практика разработки муниципальных и региональных информационных систем показывает, что и на технологическом уровне существует множество проблем, препятствующих организации эффективного коллективного использования информационных ресурсов. В частности, эти проблемы обусловлены географической распределенностью и организационной автономностью организаций, решающих задачи управления территориями. Решение данных проблем связано с созданием распределенных информационных систем. Без использования таких систем невозможно повысить качество информационного обслуживания населения и предприятий органами государственной власти и местного самоуправления, создать эффективные системы электронного правительства, обеспечить качественное обоснование масштабных мероприятий по развитию территорий. Поэтому разработка и внедрение распределенных информационных систем в органах территориального управления является одной из актуальных задач информатизации в масштабе страны.
В г. Иванове на протяжении ряда последних лет активно велась работа по созданию распределенной муниципальной информационной
системы, интегрирующей информационные ресурсы различных организаций [1, 2], что позволило сделать ряд шагов к созданию интегрированной информационной среды города. Однако проблема создания эффективно действующей распределенной информационной системы в городе не решена. Эта проблема включает множество аспектов, в том числе связанных с теоретическим обоснованием применяемых решений. Ниже рассматриваются научные направления, которые могут использоваться как теоретическая база для дальнейшего развития работ в этой области.
В настоящее время существует несколько научных и технологических направлений в области распределенных вычислительных систем, которые находят практическое применение в различных сферах информационных технологий и могут быть использованы для решения задач создания распределенных информационных систем в рассматриваемой сфере: виртуализация; «облачные вычисления»; технологии web-сервисов; Grid-технологии. При этом Grid-технологии можно считать наиболее универсальным направлением, интегрирующим достижения в других областях.
Основы Grid-технологий были заложены в 1998-2002 годах, когда под руководством Йана Фостера была разработана и опубликована открытая архитектура Grid-сервисов (Open Grid Services Architecture, OGSA). Основной задачей этих технологий является создание «виртуальных организаций» для объединения вычислительных и информационных ресурсов географически разобщенных организаций и людей в глобальных сетях при
решении ими общих вычислительных задач. При этом основное внимание уделяется скоординированности действий участников, единым стандартам взаимодействия и безопасности взаимодействий. Основные положения Grid-технологий подробно рассмотрены в [3].
Применение Grid-технологий принесло значительные результаты при решении задач массовых вычислений и распределенного хранения данных в рамках проведения научных исследований международными научными сообществами. С обзором этих проектов можно познакомиться, например, на российском Grid-портале http://gridclub.ru. В рамках реализации множества однотипных проектов удалось выработать унифицированный набор спецификаций, что позволило создать соответствующие программные инструментарии для многократного использования. Однако потенциал Grid-технологий, по мнению многих исследователей, гораздо шире, поэтому с развитием этого направления связывают построение информационных систем будущего.
Развитие сети Интернет привело к тому, что многие идеи Grid-технологий нашли применение в технологиях web-сервисов. В настоящее время к работам в этом направлении подключились компании HP, IBM, Intel и Microsoft. В 2006 г. они объявили о своем намерении участвовать в разработке общего стандартного набора спецификаций web-служб и выработали «дорожную карту» общей схемы этих спецификаций. Мировое Grid-сообщество восприняло это как существенный шаг в развитии Grid-технологий [4] и очередной стимул к развитию исследований в данной области.
Одной из сфер, где применение Grid-технологий может обеспечить существенный прорыв в эффективности применения информационных технологий, является сфера управления. Но при создании распределенных информационных систем в этой сфере проблемы заключаются не столько в распределении вычислительных мощностей компьютеров и физических средств хранения данных, сколько в установлении семантических связей между различными информационными ресурсами. Данные задачи рассматриваются в разделе Grid-технологий, получившем название «семантический Grid», а также в разделе Web-технологий, получившем название «семантический Web». В них методы распределения информационных ресурсов рассматриваются совместно с методами представления знаний. Однако описание практически реализованных информационных систем, основанных на этих принципах, в научно-технической литературе отсутствует.
Идеи построения семантического Web предложены одним из основателей современного Web Тимом Бернерсом-Ли еще в 2000 г. По определению консорциума W3C, семантический Web представляет собой расширение
существующей сети Интернет, в котором информация представляется в определенном смысловом значении, дающем возможность людям и компьютерам работать с более высокой степенью взаимопонимания и согласованности. В процессе реализации концепции семантического Web получили широкое развитие синтаксические методы представления информации языковыми средствами. В настоящее время для этих целей активно применяется ряд языков, поддерживаемых международным консорциумом W3C
(www.w3c.org). Эти языки реализуют базовый уровень реализации подобных систем, но их возможности для представления семантики не достаточны. К таким языкам можно отнести:
• XML (обеспечивает синтаксис для структурированных документов, но не налагает никаких семантических ограничений на содержание этих документов);
• XML Schema (определяет структуру документов XML, а также дополняет XML конкретными типами данных);
• RDF (позволяет описать модель данных для ресурсов и отношения между ними);
• RDF Schema (предоставляет средства для описания свойств и классов RDF-ресурсов, а также семантику для иерархий-обобщений таких свойств и классов);
• WSDL (предоставляет средства описания web-сервисов);
• другие.
Принципиальным элементом семантического Web является использование методов из области искусственного интеллекта, и в частности, онтологического подхода. Этот подход включает в себя средства аннотирования документов, которыми могли бы воспользоваться web-сервисы и программы-агенты при обработке сложных пользовательских запросов. Данное направление опирается на использование языка описания онтологий OWL (Web Ontology Language). В рамках OWL онтология - это совокупность утверждений, задающих отношения между понятиями и определяющих логические правила для рассуждений о них. Компьютеры могут «понимать» смысл семантических данных на web-страницах, следуя по гиперссылкам, ведущим на онтологические ресурсы. Онтология может включать описания классов, свойств и их примеры (индивиды).
Однако предложенный универсальный подход семантического Web в полной мере не реализован до сих пор. Вероятно, это объясняется тем, что универсальные технологии представления семантики в распределенных вычислительных системах оказываются слишком абстрактными и неудобными для практического применения. По нашему мнению, более продуктивным путем реализации данного подхода является его использование в узких
предметных областях, где требования к представлению семантики существенно ограничены. Выбор узкой предметной области, в которой можно выделить и зафиксировать на уровне специализированного программного инструментария значительную часть семантики, может существенно облегчить задачу практического внедрения таких технологий и вывести научные разработки в этой области на уровень коммерциализации. При этом отпадает необходимость построения в универсальном виде части сложных в реализации и использовании «прослоек» в многоуровневой системе средств представления знаний. Вместе с тем, даже в этом случае, задача построения подобных систем остается сложной. Результаты ее решения имеют большое значение для развития Grid-технологий в целом.
Таким образом, цели и задачи построения распределенных информационных систем в органах регионального и муниципального управления можно рассматривать в парадигме создания Grid-сред соответствующего назначения на базе концепции семантического Grid. Практические задачи, которые необходимо решить в рамках исследований и опытных разработок по данному направлению, можно в общем виде определить как создание специализированной «надстройки» или дополнительного семантического уровня над существующими стандартами и технологическими решениями в области построения Grid-сред.
Предметная область регионального и муниципального управления с точки зрения технологий создания распределенных информационных систем имеет ряд характерных особенностей. Это наличие типовых задач управления, устойчивых закономерностей в использовании наборов данных, широкое применение географической привязки данных, которая осуществляется средствами ГИС, наличие общей и обширной нормативно-законодательной базы. Это позволяет утверждать, что выделение инвариантных составляющих в Grid-средах, создаваемых для этой сферы управления, возможно. Кроме того, в данной области крайне важна задача поддержки унаследованных систем, поскольку такие Grid-среды не могут создаваться «с нуля». Они должны эволюционно вырастать на базе существующих информационных систем без прекращения их работы. Это предъявляет дополнительные требования к методикам внедрения Grid-сред в данной сфере.
В рассматриваемой предметной области можно выделить несколько категорий информации и задач ее обработки, для управления которыми в составе Grid-среды могут быть созданы отдельные спецификации. Спецификации должны определить наборы необходимых web-сервисов и их интерфейсов. К таким категориям можно отнести:
• информацию о населении (паспортные данные, данные регистрации, учет различных категорий граждан, данные соцобес-печения);
• информацию о недвижимости (земельные участки, здания и сооружения, инженерная и транспортная инфраструктура, жилищный фонд и т.д.);
• градостроительную документацию (генеральные планы развития территорий, градостроительные регламенты и зонирование, инвестиционные площадки, данные о строительстве новых объектов недвижимости и т.д.);
• информацию о субъектах хозяйственной деятельности (сведения о юридических лицах, индивидуальных предпринимателях и их деятельности);
• информацию о финансовой деятельности органов территориального управления (управление расходами бюджетов);
• правовую информацию, включающую законодательные акты и нормативные документы федерального, регионального и местного уровней.
Разработка спецификаций web-сервисов для обработки данной информации в распределенных системах и соответствующего нормативного обеспечения создает условия для реализации специализированного инструментального программного обеспечения соответствующих Grid-сред. Поскольку эта часть работ связана со значительными затратами, для ее реализации необходимо максимально задействовать существующий потенциал готовых решений и базовых технологий разработки программных средств.
В мире на сегодняшний день накоплен значительный опыт реализации программного обеспечения распределенных информационных систем в сети Интернет, и в частности, Grid-сред в архитектуре OGSA. Наиболее известным инструментальным программным продуктом в этой архитектуре является программный комплекс с открытым кодом Globus Toolkit, который распространяется ассоциацией Globus Alliance (http://www.globus.org).
Globus Toolkit содержит элементы (в основном web-сервисы), которые обеспечивают реализацию необходимых функций при построении Grid-сред для распределения вычислительных ресурсов в сети Интернет. Он активно используется для создания международных Grid-сред, заменяющих суперкомпьютеры при решении задач ядерной физики, астрофизики, изучения климата, генетики и т.д. Однако он не обеспечивает эффективного решения задач в рассматриваемой сфере. Globus Toolkit не включает средства для решения задач представления семантики. Кроме того, он ориентирован на операционную систему Linux, что, безусловно, ценно для использования в международном научном со-
обществе и удобно при реализации некоммерческих проектов «с чистого листа». Однако в рассматриваемой прикладной области более распространены решения на платформе Windows и имеется большой арсенал готовых программных продуктов, использующих для интеграции технологии Microsoft.NET. Этот фактор невозможно игнорировать, поскольку данная сфера работает в условиях рыночных отношений и гарантий поставщиков на всех уровнях реализации информационных систем.
С учетом указанных факторов представляется целесообразной разработка специализированного инструментального программного комплекса для создания Grid-сред в сфере регионального и муниципального управления. На роль технологической платформы такой разработки лучше всего подходит Microsoft Visual Studio. Этот продукт ориентирован на профессиональную, управляемую работу команд разработчиков и обеспечивает получение запланированных результатов разработки в установленные сроки. Microsoft Visual Studio предлагает большой набор технологий коллективной разработки, тестирования, сопровождения крупных информационных систем, что является немаловажным фактором эффективности работы. Вместе с тем при реализации инструментальных программных средств Grid-сред в сфере регионального и муниципального управления целесообразно использовать решения архитектуры OGSA как компоненты или как прототипы разработки. К таким компонентам относятся средства управления доступом к ресурсам, управления пользователями, организации распределенного хранения данных.
Реализация предложенного подхода требует проведения комплекса научно-исследовательских работ, который включает:
• исследование последних достижений в области Grid-технологий с учетом возможности их применения в сфере регионального и муни -ципального управления;
• исследование и проектирование процессов распределения ресурсов в информационных системах регионального и муниципального управления, разработку моделей соответствующих Grid-сред;
• разработку высокоуровневых спецификаций и методов доступа к ресурсам Grid-сред регионального и муниципального управления;
• разработку методов и инструментальных программных средств разработки Grid-сред для органов регионального и муниципального управления;
• исследование и реализацию возможностей применения разработанных методов и средств при создании информационных систем органов регионального и муниципального управления.
Заключение
Достижение поставленных целей требует проведения большого объема дополнительных исследований на стыке теории Grid и разработки корпоративных информационных систем. Эти исследования планируется проводить в научно-образовательном центре распределенных информационных систем и технологий ИГЭУ.
Планируемые исследования имеют прикладное значение. Их результаты будут применяться при развитии муниципальной информационной системы г. Иванова и информационных систем регионального уровня. Вместе с тем выбранная привязка к предметной области не ограничивает значение исследований для более широкой сферы применения. Многие из решаемых методических задач имеют универсальный характер. В этом смысле можно считать, что на примере выбранной предметной области будут решаться задачи методики построения Grid-сред для широкого класса систем в сфере управления.
Список литературы
1. Косяков С.В., Гадалов А.Б., Огородников А.В.
Интеграция муниципальных информационных ресурсов с использованием Интернет-технологий // Вестник ИГЭУ. -2007. - № 3. - С. 69-75.
2. Косяков С.В. Разработка проекта муниципальной информационной системы города Иванова // Вестник ИГЭУ. - 2008. - № 4.
3. Демичев А.П., Ильин В.А., Крюков А.П. Введение в грид-технологии // НИИЯФ МГУ. - Препринт. - М., 2007.
4. Фостер Ян. Наконец-то дождались: отраслевые
стандарты управления системами.
http://h102.keldysh.ru/library/publication.2006-03-28.7071858474/publ_file/
Косяков Сергей Витальевич,
ГОУВПО «Ивановский государственный энергетический университет имени В.И. Ленина»,
доктор технических наук, профессор, зав. кафедрой программного обеспечения компьютерных систем,
телефон (49З2) 26-98-40,
адрес: г. Иваново, ул. Красных Зорь, д. 29/2, кв. 60, e-mail: [email protected]