Научная статья на тему 'Разработка механизмов виртуальной интеграции разнородных информационных ресурсов в системах информационноаналитической поддержки управления территориями'

Разработка механизмов виртуальной интеграции разнородных информационных ресурсов в системах информационноаналитической поддержки управления территориями Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
482
160
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
виртуальная интеграция / данные и сервисы / распределенные информационные системы / поддержка принятия решений / развитие Арктики / virtual integration / data and services / distributed information systems / decision support / Arctic development

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Вицентий Александр Владимирович

В работе рассматривается задача интеграции данных, знаний и сервисов, как одна из наиболее важных задач, решение которых должно обеспечиваться современными интеллектуальными системами информационно-аналитической поддержки управления сложными процессами и системами. На основе анализа современных решений в этой области делается выбор в пользу виртуальной интеграции.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE VIRTUAL INTEGRATION OF HETEROGENEOUS AND DISTRIBUTION DATA, KNOWLEDGES AND SERVICES MECHANISMS DEVELOPMENT FOR DEVELOPMENT OF INTELLIGENT PROBLEM-ORIENTED SYSTEMS FOR SPATIALLY ORGANIZED SYSTEMS AND PROCESSES INFORMATION AND ANALYTICAL CONTROL SUPPORT

This paper considers the problem of data integration, knowledge and services as important part of modern intelligent systems for complex processes and systems information and analytical control support. Based on the analysis of modern solutions in this area, we made a choice in favor of virtual integration.

Текст научной работы на тему «Разработка механизмов виртуальной интеграции разнородных информационных ресурсов в системах информационноаналитической поддержки управления территориями»

УДК 004.9

А.В. Вицентий

Институт информатики и математического моделирования технологических процессов Кольского НЦ РАН

Кольский филиал Петрозаводского государственного университета

РАЗРАБОТКА МЕХАНИЗМОВ ВИРТУАЛЬНОЙ ИНТЕГРАЦИИ РАЗНОРОДНЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ В СИСТЕМАХ ИНФОРМАЦИОННОАНАЛИТИЧЕСКОЙ ПОДДЕРЖКИ УПРАВЛЕНИЯ ТЕРРИТОРИЯМИ*

Аннотация

В работе рассматривается задача интеграции данных, знаний и сервисов, как одна из наиболее важных задач, решение которых должно обеспечиваться современными интеллектуальными системами информационно-аналитической поддержки управления сложными процессами и системами. На основе анализа современных решений в этой области делается выбор в пользу виртуальной интеграции.

Ключевые слова:

виртуальная интеграция, данные и сервисы, распределенные информационные системы, поддержка принятия решений, развитие Арктики.

A.V. Vicentiy

THE VIRTUAL INTEGRATION OF HETEROGENEOUS AND DISTRIBUTION DATA, KNOWLEDGES AND SERVICES MECHANISMS DEVELOPMENT FOR DEVELOPMENT OF INTELLIGENT PROBLEM-ORIENTED SYSTEMS FOR SPATIALLY ORGANIZED SYSTEMS AND PROCESSES INFORMATION AND ANALYTICAL CONTROL SUPPORT

Abstract

This paper considers the problem of data integration, knowledge and services as important part of modern intelligent systems for complex processes and systems information and analytical control support. Based on the analysis of modern solutions in this area, we made a choice in favor of virtual integration.

Keywords:

virtual integration, data and services, distributed information systems, decision support, Arctic development.

Введение

В последние годы происходит накопление огромных объемов неоднородных, распределенных информационных ресурсов (ИР), что обуславливает потребность совместного использования (интеграции) информационных компонентов и сервисов в различных применениях, а также их повторного использования и композиции для реализации интероперабельных информационных систем (ИС). Необходимость интеграции разнородных ИС, особенно в таких областях, как построение информационных систем поддержки регионального управления, обусловливает создание специальных методов и

Работы выполнены в рамках Программы ОНИТ РАН «Интеллектуальные информационные технологии, системный анализ и автоматизация».

121

технологий интеграции, использующих различные модели данных и осуществляемых с помощью различных процедур.

При решении задач построения проблемно-ориентированных интеллектуальных систем информационно-аналитической поддержки развития больших пространственно-распределенных объектов и территорий неизбежно встают вопросы, связанные с использованием различных механизмов интеграции разнородных данных и знаний. При этом, интеграция данных является одной из наиболее важных задач, решение которых должно обеспечиваться современными крупными информационно-аналитическими системами. На основе анализа существующих на сегодняшний день технологий интеграции данных и сервисов в работе предлагается использовать виртуальную интеграцию данных и сервисов, как наиболее перспективное решение.

Интероперабельность интегрируемых информационных систем

При решении задачи интеграции нескольких информационных систем часто приходится сталкиваться с проблемой значительной или полной ориентации некоторых из них на аппаратные средства и программное обеспечение определенного производителя или специфическую архитектуру. Такая ситуация порождает серьезную проблему, называемую в литературе проблемой "унаследованных систем" (legacy systems) [1], которая осложняется еще и тем, что часто производственные процессы не позволяют прекратить или приостановить использование морально устаревших систем, чтобы перевести их на новые технологии. При этом, например, осуществлять проектирование региональных информационных систем для информационно-аналитической поддержки задач развития Арктических регионов РФ без опоры на уже имеющиеся ИС практически невозможно. Унаследованные ИС и лежащие в их основе базы данных (БД) являются слишком ответственными и дорогими продуктами, чтобы можно было позволить себе их переделку при смене аппаратной платформы или даже системного программного обеспечения. Для этого программный продукт должен обладать свойствами легкой переносимости с одной аппаратно-программной платформы на другую. Другим свойством, которым должны обладать современные информационные системы является способность наращивания возможностей за счет использования дополнительно разработанных или уже существующих и подключаемых к ним программных компонентов.

Выполнение этих требований невозможно без обеспечения интероперабельности ИС. Под этим понимается способность ИС взаимодействовать друг с другом посредством соблюдения определенных правил или привлечения дополнительных программных средств, обеспечивающих возможность взаимодействия независимо разработанных программных модулей, подсистем или функционально завершенных программных систем [2]. Взаимодействие может проявляться как в виде обычного обмена информацией, так и в выполнении распределенных задач. Необходимость обеспечения интероперабельности возникает, например, при объединении процессов различных организаций в рамках региона, согласовании работы существующей отраслевой ИС с принятыми стандартными решениями и т.д.

122

Свойство интероперабельности проявляется также при интеграции нескольких ИС, включении в создаваемую систему БД ранее использованных хранилищ данных, разработке комплексных автоматизированных систем управления, построении сетей информационных хранилищ, а также во многих других случаях. Проблема обеспечения интероперабельности ИС имеет фундаментальный характер. Она актуальна как для унаследованных систем, которые требуется связать с вновь создаваемыми либо получить возможность использования их БД, так и для проектируемых хранилищ данных, в которых необходимо предусмотреть возможности реализации взаимодействия с другими ИС в перспективе, при изменении требований к ним.

Интероперабельность нужно рассматривать в структурном и семантическом аспектах. Структурный аспект интероперабельности систем означает способность к структурному согласованию сущностей систем. Семантический аспект означает возможность установления соответствия между смыслами единиц информационных систем. Существующие сегодня методы обеспечения интероперабельности касаются, главным образом, ее синтаксических (структурных) аспектов, т.е. направлены на согласование и преобразование структур данных за счет стандартизации их форматов и использования расширяемых метаязыков. Универсальные подходы к обеспечению интероперабельности ИС на семантическом уровне в настоящее время отсутствуют, и их разработка представляет собой актуальную научную задачу. Интеграционные технологии широко применимы в государственном и муниципальном управлении. В этом случае речь идет о взаимодействии государственных органов друг с другом в ходе предоставления электронных услуг гражданам и бизнесу. Компонентный состав обеспечения интероперабельности ИС в этом случае может быть представлен следующим образом: регламенты и стандарты, интеграционная платформа, модель данных, ИТ-инфраструктура, архитектура ИС.

Механизмы интеграции гетерогенных информационных ресурсов

Системы информационно-аналитической поддержки регионального управления и развития Арктических территорий РФ предназначены для обеспечения хозяйственной деятельности комплексной информацией об обстановке в регионе, предоставляемой информационными системами федеральных органов исполнительной власти и другими поставщиками ИР в рамках единого информационного пространства (ЕИП). Основными функциями проблемно-ориентированных систем являются информационное и технологическое взаимодействие ведомственных информационных систем, формирование и интеграция ИР, организация доступа к ним для изучения, освоения и использования арктических территорий, а также обмен данными с ведомственными и международными информационными системами. Предоставление информации осуществляется путем описания метаданных.

В настоящее время выделяются несколько видов интеграции (I) информационно-ориентированная (Ii), процессно-ориентированная (Ip) и сервисно-ориентированная (Is) виды интеграции. В зависимости от задачи, возможно использование только одного или комбинации нескольких из них (I=<Ii, Ip, Is>), причем универсального решения в данном случае нет. Модель

123

интеграции каждого вида можно описать с помощью вовлеченных в нее компонентов информационных систем. Основными классами таких компонентов являются: множество интегрируемых ИС (Num), множество наборов данных (Dat), множество сервисов (Sevr), множество функций (Func), и множество процессов (Proc).

Для информационно-ориентированной интеграции (Ii = <Num, Dat>) характерной областью применения является организация обмена информацией между несколькими ИС. Данный вид интеграции является наиболее простым и недорогим по сравнению с другими, т.к. данные просто передаются из одной системы в другую с помощью преобразования в необходимый формат. В процессе работы информационно-ориентированная интеграция использует обычно брокеры сообщений, связывающее программное обеспечение (middleware), серверы репликации БД и другие технологии, целью которых является распространение информации между несколькими системами. Чаще всего данный вид интеграции используется при интеграции корпоративных приложений (Enterprise Application Integration, EAI), например, в рамках одного ведомства или поставщика информации в ЕИП. Такой способ практически не используется для объединения существенно разных по структуре ИС.

Процессно-ориентированная интеграция (Ip = <Num, Dat, Func, Proc>) подразумевает использование внутренних бизнес-процессов различных ИС, при этом необходимо создание дополнительной системы, связующей все остальные системы в единое целое. Такая интеграция применяется в сложных случаях, когда необходимо связать большое число разнородных ИС, используя при этом их функции. Сущность данного вида интеграции заключается в предоставлении возможности передачи произвольных данных из одной ИС в другую за счёт работы специализированного метапроцесса или системы, создаваемой поверх уже существующих систем. В практической деятельности механизмы процессно-ориентированной интеграции применяют только в случае доказанной необходимости и невозможности использования менее затратного подхода, т.к. требуют существенного преобразования внутренних функций интегрируемых ИС, что является дорогостоящим мероприятием. Такой вид интеграции плохо подходит для целей построения региональных информационных систем информационно-аналитической поддержки развития территорий.

Сервисно-ориентированная интеграция (Is = <Num, Dat,< Func, Serv>) применяется в случаях, когда имеет место необходимость в использовании, как данных, так и функций ИС. Здесь системы могут совместно использовать функции друг друга. Принцип такой интеграции заключается в использовании функций унаследованных систем, а не в создании новых сервисов, что соответствует целям построения проблемно-ориентированных интеллектуальных систем информационно-аналитической поддержки развития Арктических территорий и хорошо укладывается в современное понимание ЕИП. При таком подходе нет необходимости в создании специальных служб для различных ИС - сервисно-ориентированная интеграция использует связующую среду, которую можно использовать повторно.

Современной тенденцией в этой области является использование вебсервисов и универсальных стандартов представления данных (например, XML). В целом технология данного вида интеграции опирается на сервисориентированную архитектуру ИС (Service Oriented Architecture, SOA).

124

Основу SOA составляют принципы многократного использования функциональных элементов, ликвидации дублирования функциональности, унификации типовых операционных процессов, обеспечения перевода операционной модели на централизованные процессы и функциональную организацию на основе выбранной платформы интеграции.

SOA использует такие технологии, которые интегрируют системы посредством использования сервисов, а не написания дополнительного программного кода. Компоненты или сервисы, имея согласованные общие интерфейсы, используют единые правила для определения того, как вызывать сервисы и как они будут взаимодействовать друг с другом.

Данная архитектура предполагает наличие трех основных компонентов: поставщика сервиса, потребителя сервиса и некоторого реестра сервисов или средств поиска и подбора необходимых информационных ресурсов. В такой схеме взаимодействия поставщик сервиса регистрирует свои сервисы в реестре или предоставляет метаописание имеющихся ресурсов, а потребитель обращается к реестру с запросом определенной структуры.

Компоненты программной системы могут быть распределены по разным узлам сети, и предлагаются как независимые, слабо связанные и, взаимозаменяемые сервисы-приложения. Программные комплексы, разработанные в соответствии с SOA, часто реализуются как набор веб-сервисов, интегрированных при помощи известных стандартных протоколов (SOAP, WSDL, и т.п.). Веб-сервисы работают на основе независимого от платформы и языка программирования стандартного интерфейса, что позволяет говорить о том, что технологии сервисно-ориентированной интеграции независимы от конкретных разработчиков ИС.

Технология виртуальной интеграции гетерогенных ИР и сервисов

Чаще всего проблема интеграции гетерогенных данных и сервисов их обработки формулируется следующим образом: имеется несколько

гетерогенных источников данных, которые каким-то образом связаны на смысловом уровне; необходимо предоставить возможность унифицированного доступа и обработки этих данных, как если бы они имели единое логическое и физическое представление. Для решения этой проблемы требуется более гибкая альтернатива прямой физической интеграции данных. Такой альтернативой может стать технология виртуальной интеграции распределенных информационных ресурсов и сервисов в рамках функционирования комплексной информационно-аналитической среды (Единого Информационного Пространства (ЕИП)) [3].

Виртуальная интеграция распределенных гетерогенных информационных ресурсов характеризуется тем, что данные не материализуются в локальной базе данных, вместо этого промежуточное программное обеспечение транслирует пользовательские запросы в подзапросы к источникам данных и сервисам их обработки, и на основе ответов отдельных информационных ресурсов формирует окончательный результат.

Под распределенными системами обычно понимают программные комплексы, составные части которых функционируют на разных компьютерах в сети. Эти части взаимодействуют друг с другом, используя ту или иную

125

технологию различного уровня. Выбор приемлемой технологии создания распределённой информационной системы зависит от выбора ее архитектуры.

Рассматривая информационную систему как совокупность взаимодействующих компонентов, можно распределить их по следующим уровням:

1) аппаратный уровень (компьютеры, периферийные устройства, сетевое и телекоммуникационное оборудование и т.д.);

2) системный и системно-зависимый уровни (операционные системы, сетевые протоколы и т.д.);

3) уровень прикладной среды (средства middleware, DBMS, Intranet, OLAP, коммуникационные интерфейсы и др.);

4) уровень приложения предметной области (общая инфраструктура, как совокупность компонентов ИС, пригодных для использования в различных предметных областях, а также компоненты, реализующие модель предметной области. Более формальное определение и пример описания отдельных информационных систем как совокупности взаимодействующих в ЕИП компонентов можно найти в [3].

Под проектированием архитектуры взаимодействия компонентов интеллектуальной предметно-ориентированной ИС понимается, прежде всего, выделение базовых компонентов, разработка их интерфейсов, а также определение правил и принципов взаимодействия этих компонентов. Каждый из таких компонентов представляет собой программный модуль, исполняемый в рамках отдельного процесса. При проектировании архитектуры взаимодействия распределенных компонентов ИС различают вертикальный, горизонтальный и смешанный типы взаимодействия. При этом, понятие клиента, взаимодействующего с сервером приложений, трактуется широко. Он может поддерживать интерфейс с конечным пользователем, а может выполнять прикладные функции и сам являться сервером приложения. В общем случае клиент (сервер) может, как предоставлять, так и запрашивать некоторые сервисы. Это позволяет осуществить декомпозицию функций по компонентам проблемно-ориентированной ИС, которая была бы оптимальной в контексте решаемой задачи.

Одним из активно развивающихся сегодня направлений интеграции является семантическая интеграция. К этой группе технологий можно отнести такие технологии, как Z39.50, XML, RDF, SOAP и другие. В основе Z39.50 лежит идея построения абстрактной модели работы с абстрактной базой данных. Каждый элемент этой абстрактной модели подробно описывается до однозначного толкования и стандартизуется с присвоением уникального идентификатора. Язык XML предоставляет удобный и универсальный подход к хранению и передаче информации. Обмен информацией в формате XML - это механизм, позволяющий свести к минимуму проблемы внутрифирменных форматов данных. SOAP - это протокол, предназначенный для обмена структурированной информацией в децентрализованной, распределённой среде. Он использует XML-технологии для создания масштабируемых структур обмена сообщениями, предоставляя конструирование сообщений, которыми можно обмениваться при помощи множества различных протоколов. Важно отметить и то, что структура SOAP разработана независимой от любой конкретной программной модели или конкретной реализации специфической семантики.

126

Идея RDF заключается в том, что при большом разнообразии семантики описываемых ресурсов невозможно создать единое семантическое пространство, которое удовлетворяло бы все потребности в описании семантики ресурсов. В то же время каждый ресурс или группа связанных ресурсов, как правило, имеет ограниченную семантику. Описывать семантику ресурса и затем выполнять поиск тем проще, чем уже и специфичнее его предметная область. При невозможности объединить в рамках одной семантики все значимые понятия, встречающиеся в информационных ресурсах, остается искать пути работы с неоднородными и независимыми семантическими описаниями ресурсов. Для описания предметной области ресурсов и сервисов может быть использован стандарт RDF.

Заключение

Таким образом, виртуальная интеграция распределенных информационных ресурсов и сервисов, основанная на технологии семантической интеграции и сервис-ориентированной архитектуре, даёт большие возможности для комбинации семантических технологий с технологиями взаимодействия распределённых компонентов информационных систем.

Литература

1. Кузнецов, С. Переносимость и интероперабельность информационных систем и международные стандарты [Электронный ресурс]. - Режим доступа: http://citforum.ru/database/articles/art_1.shtml

2. Михайлов, И.С. Исследование и разработка методов и программных средств обеспечения структурной и семантической интероперабельности информационных систем на основе метамоделей /И.С. Михайлов // Труды 11-й национальной конференции по искусственному интеллекту - 2008.

- Т.2. - С.207-209.

3. Вицентий, А.В. Разработка модели единого информационного пространства для оценки надежности его функционирования / А.В. Вицентий // Труды Кольского научного центра РАН. Информационные технологии.

- Вып.2. -4/2011(7).- Апатиты: Изд-во КНЦ РАН, 2011. - С 65-70.

Сведения об авторе

Вицентий Александр Владимирович - к.т.н., научный сотрудник, доцент, е-mail: alx [email protected]

Alexander V. Vicentiy - Ph.D. (Tech. Sci.), researcher, docent

127

i Надоели баннеры? Вы всегда можете отключить рекламу.