Научная статья на тему 'Два уровня коммуникаций: значение и представление'

Два уровня коммуникаций: значение и представление Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
114
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННЫЙ ОБМЕН / БИЗНЕС-ПРАВИЛА / РАСПРЕДЕЛЕННАЯ СРЕДА / МОДЕЛЬ ПРЕДМЕТНОЙ ОБЛАСТИ / ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Липунцов Юрий Павлович

Открытое правительство как новая система государственного управления требуют качественно нового уровня информационного обеспечения для взаимодействия ведомств между собой, а также ведомств с гражданами, экспертами и бизнесом. В статье рассмотрены три категории контрагентов ведомства, взаимодействие с которыми строиться на разных принципах: сообщество по интересам, где обмен может быть реализован на базе модели предметной области; информационный обмен между предметными областями; и взаимодействие в слабосвязанной среде. С ростом количества пользователей и снижением степени их контроля в методах информационного обмена и интеграции данных большее значение приобретает одинаковое восприятие данных всеми участниками обмена.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Два уровня коммуникаций: значение и представление»

Липунцов Ю. П.

Московский государственный университет им. М.В. Ломоносова, экономический факультет, к.э.н., [email protected]

Два уровня коммуникаций: значение и представление

КЛЮЧЕВЫЕ СЛОВА

Информационный обмен, бизнес-правила, распределенная среда, модель предметной области, информационное моделирование.

АННОТАЦИЯ

Открытое правительство как новая система государственного управления требуют качественно нового уровня информационного обеспечения для взаимодействия ведомств между собой, а также ведомств с гражданами, экспертами и бизнесом. В статье рассмотрены три категории контрагентов ведомства, взаимодействие с которыми строиться на разных принципах: сообщество по интересам, где обмен может быть реализован на базе модели предметной области; информационный обмен между предметными областями; и взаимодействие в слабосвязанной среде. С ростом количества пользователей и снижением степени их контроля в методах информационного обмена и интеграции данных большее значение приобретает одинаковое восприятие данных всеми участниками обмена.

Введение

Сложность современного мира требует совершенствования механизмов государственного управления. Система «Открытое правительство» рассматривается как один из возможных ответов. Эта управленческая модель предполагает включение в процесс управления участников, которые не только следят за результатами деятельности правительства, но и способны внести свой вклад в развитие административных процедур, поделиться опытом и проявить себя в совершенствовании бюрократических процессов.

Реализация новых методов управления требуется адекватного уровня технологий, современное состояние не полностью удовлетворяет текущим потребностям. Требуется более тесное взаимодействие между специалистами предметной области и специалистами информационных технологий. При реализации семантической интеграции, существенно меняется роль специалистов предметной области, поскольку с их участием формируются базовые инструменты интеграции.

Преобразование данных в информацию

Современная организация является активным поставщиком и

потребителем информации. Возможности отдельного ведомства по предоставлению машиночитаемого доступа к накопленным информационным ресурсам, получению информации из внешней среды, лежат в основе совершенствования государственной деятельности. Для реализации активного информационного обмена необходимо реализовывать технологию интеграции данных и многоуровневое информационное моделирование.

Организация взаимодействия между несколькими системами может быть реализована на различных уровнях, отличающихся по уровню интеллектуальности обмена данными и интерпретации этих данных:

• создание технологической инфраструктуры, используемой для сбора, хранения и передачи данных;

• разработка единых форматов данных для структур данных;

• семантика посредством которой данные могут быть преобразованы в наделенную смыслом информацию. Интерпретация данных предопределяет ход исполнения процессов, реализацию бизнес логики.

Наиболее развитым из трех приведенных позиций является создание технической инфраструктуры, реализуемой чаще всего по модели создания интеграционной шины, т.е. используются методы, в которых слой данных скрыт от участника [1]. Семантика данных остается незначительно задействованной, вместе с тем уровень развития информационных технологий, накопленный опыт по работе с данными достиг уровня, когда реализация семантических методов становится реальным.

Любое взаимодействие, независимо от его характера, предполагает передачу смысла между участниками, реализацию семантики. Семантическая модель в каждом случае является абстракцией, которая описывает соотношение реального мира с его символьным отражением в виде сущностей и экземпляров. Реализацию семантики призваны обеспечить два механизма: механизм присвоения имен объектам, определение данных, и механизм однозначной идентификации объектов, идентификацию данных. При этом схема идентификации является более важным и более сложным механизмом.

Для присвоения имени объекта необходимо определить соотношения между самим объектом, его смысловым значением и терминами, построить семантический треугольник [4]. Каждый объект необходимо определить с помощью концепции, которые представляют собой значение, а для представления или коммуникации каждый концепт определяется с помощью терминов и обозначений, представляющие собой имя объекта.

Вторая задача для реализации семантических методов состоит в обеспечении механизма легкой идентификации объектов, который позволяет однозначно распознать объект в распределенной среде.

Механизмы обеспечения семантики различаются по категориям

контрагентов. Всю совокупность контрагентов отдельной государственной организации, можно разделить на три категории - по критерии принадлежности к типу организованного сообщества. В первую категорию попадут контрагенты, которые взаимодействуют в рамках одного сообщества. С ними можно выстроить автоматизированный информационный обмен на основе модели предметной области. Вторая категория предполагает информационное взаимодействие с совокупностью организованных сообществ. Здесь автоматизированный обмен происходит с помощью моделей организации сбора и хранения данных, либо модели федерации. В третью категорию попадают контрагенты слабосвязанной среды. Работа с этой категорией описывается моделями открытых и связанных данных, технологиями семантической интеграции, реализующих идею интеграции слабосвязанных информационных активов.

Для каждой из трех категорий сообщества по разным принципам организуется модель данных, отличаются метаданные. Поскольку системы отличаются степенью контроля, то в них будут представлены разные механизмы присвоения имени объекту, и однозначной идентификации. Помимо этого, у разных категорий будет разная модель коммуникаций.

В коммуникации выделяется два уровня взаимодействия: уровень представления и уровень значения [5]. Уровень представления отражает сообщение, его форму, формат. Значение касается более общих вопросов взаимодействия, отражающих позицию участника информационного обмена в контексте текущего взаимодействия.

Представление реализуется с помощью средств отражения: терминов, имен, определений, утверждений и прочих языковых средств и невербальных элементов, которые позволяют донести до контрагента информацию.

Смысл, значение предполагает содержание скрытых элементов, которые имеют отношение к текущему сеансу коммуникаций, но не отражаются явно в ходе коммуникаций. Потенциалом технологической поддержки коммуникаций состоит в формализованном представлении скрытой части взаимодействия и отражении ее в символьной форме. Возможность получить доступ к невыражаемой части коммуникаций, бизнес-правилам, которыми руководствуются участники в ходе коммуникаций, позволит повысить взаимопонимание.

Слой значений является более подходящим для формализованного представления, поскольку его можно представить в форме бизнес-правил, излагать формализованным языком, который близок не только к машиночитаемому, но и машино-исполняемому. Примером такого языка может выступать структурированный английский, который используется для обмена структурированными выражениями. При формализации слоя представлений возникает необходимость структурно описать естественный язык, что на сегодня пока проблематично.

С учетом возрастающего количества каналов взаимодействия, высокой динамики содержания, формализация слоя значения становится актуальным вектором развития информатизации государственного сектора.

Степень вовлеченности специалистов предметной области, поскольку они задействованы в создание контролируемых словарей, регистров базовых объектов, создание бизнес правил для формализованного представления слоя распределенных значений, всех элементов, которые служат основой для интеграции данных с использованием смысловой принадлежности информационных ресурсов. Рассмотрим отдельные особенности взаимодействия по категориям контрагентов государственного сектора.

Информационный обмен в рамках сообщества предметной области

Если контрагенты государственного ведомства соприкасаются с неким сектором деятельности, то можно сказать, что они являются членами одного «сообщества предметной области». Для обмена данными используется согласованная модель предметной области (МПО), в которой определено пространство имен для описания объектов предметной области и операций с ними.

Вторым условием передачи осмысленной информации является однозначная идентификация объекта. В распределенной среде, объединяющей несколько систем, создается механизм синхронизации базовых объектов в виде компонента, выполняющего функцию управления мастер данными (Master Data Management). Семантика обеспечивается в части наименования объектов с помощью схемы данных, а однозначная идентификация посредством мастер данных.

Модель коммуникации представляет собой репрезентацию, поскольку все участники осведомлены составом функций других участников, количество бизнес-процессов и бизнес-правил ограничено.

Организация информационного обмена между предметными сообществами

При организации информационного обмена между участниками разных организованных сообществ применяется иная идеология. Модель предметной области в случае существенного расширения становится громоздкой, поэтому обычно используют другие подходы, такие как расширение модели предметной области путем установления межпредметных связей (Национальная модель обмена информацией США, NIEM) или унификация представления информации, в объектном подходе (Core Architecture Data Model, CADM DODAF).

Промежуточным вариантом моделирования является построение модели верхнего уровня, которая предполагает организацию взаимодействия на уровне абстрактного поставщика и потребителя данных. Примерами такого подхода являются модели Asset Description

Metadata Schema (ADMS) и Statistical Data and Metadata eXchange (SDMX). Рассмотрим модель SDMX, используемую в проектах по индустриализации поставки статистических данных.

Статистическое агентство государства выступает своеобразным узлом обмена данными - агрегатором и поставщиком данных. Органы государственной статистики являются основным источником данных для государственных органов, в задачи которых входит разработка политических решений, их реализация, мониторинг и оценка. Поставщиками данных являются субъекты официального статистического учета.

Спецификация SDMX возникла в результате совместной инициативы ряда международных организаций в 2002 году по выработке правил обмена данными в области статистической информации. Силами участников проекта создана спецификация SDMX, содержащая общие технические и статистические стандарты сбора, хранения и представления данных, описаны требования ИТ-архитектуры

Одним из основных элементов спецификации SDMX является набор формальных объектов, которые описывают участников, процессы и ресурсы статистического обмена.

Набор данных, попадающий в среду обмена должен содержать информацию о Поставщике данных и его Соглашении о поставке. Описание содержания Набора Данных, его тематическая привязка производится с помощью Концепций, вспомогательную роль для описания набора данных играют Категории и Списки Кодов. Гармонизация контента, единая семантика в SDMX обеспечивается с помощью трех основных элементов: межпредметные концепции, общий словарь метаданных и классификатор статистических предметных областей.

Информационная модель позволяет поддерживать единый формат данных, поступающих от разных производителей, что обеспечивает автоматическое взаимодействие систем. Это достигается путем предварительной подготовки данных, описания их метаданными.

Для поставки статистических данных в России разработано две системы: Единая Межведомственная Информационно-Статистическая Система (ЕМИСС, www.fedstat.ru) и ГАС «Управление» (http://gasu2.ru/). В ЕМИСС используется стандарт SDMX, в текущей версии ГАС «Управление» построено по принципу разработки технологических карт межсистемного взаимодействия. Технологические карты содержит инвентаризацию данных двух систем для интеграции точка-точка. С увеличением поставщиков и потребителей информации количество соединений стремительно растет. В итоге - одна система реализует публикацию данных в стандартных форматах в машиночитаемом виде, в другой под каждую поставку данных разрабатывается индивидуальный механизм реализации.

Построение и реализация интеграционной модели требует постановки задач следующего уровня абстракции. В модели второго уровня

появляются новые сущности, характерные для уровня организации автоматического взаимодействия и не представленные на уровне локальных систем, такие как набор данных, набор метаданных, потоки данных и метаданных.

Семантика взаимодействия помимо стандартизации наборов данных и метаданных, в части согласованного наименования объектов реализуется путем разработки модели публикации данных для каждой категории участников. Единая идентификация решается путем создания системы регистров: физические лица, юридические лица, адресная система, объекты недвижимости и т.д.

Количество предметных областей в этой категории взаимодействия существенно возрастает, поэтому модель коммуникации отражает не только презентационный слой, но и слой значений, в котором отражаются базовые бизнес-правила участников взаимодействия.

Взаимодействие в слабосвязанной среде

Свой набор проблем возникает, когда нужно организовать информационное взаимодействие с самостоятельными субъектами. Эта категория участников является наименее организованной, их можно и нужно подтолкнуть к самоорганизации.

Один из основных принципов отрытого правительства это вовлечение граждан в процесс государственного управления. Сформировалась новая парадигма инноваций корпоративного сектора -инновации от клиентов [10]. Компании рассматривают активных клиентов как источник бесплатных инноваций. В таком подходе есть много элементов, которые целесообразно использовать в государственном секторе: такие как готовность значительного количества граждан вносить свои предложения по модификации сервисов.

Направлений деятельности государственного сектора гораздо больше корпоративного. Дерево целей государства включает международную политику, внутреннюю безопасность, блок социальных целей и ряд других функций. Гражданину или эксперту для результативной коммуникации необходимо иметь хорошую базу, быть в курсе текущего законодательства. Для этого целесообразно задействование технологической поддержки, формализованное представление скрытой части коммуникаций. Отдельное взаимодействие между участниками часто представляет собой специфичный бизнес-процесс. Вместе с тем существует конечное число бизнес-правил, которые являются образующими элементами гибкого процесса. Наличие таких правил в символьном виде, их понимание участвующими сторонами способно существенно повысить качество коммуникаций.

Перспективным направлением сопровождения коммуникаций является формализация правовых норм. Часто участвующие стороны воспринимают правовую область как сложную и непонятную сферу, в которой способны разобраться только эксперты. Перевод опубликованных

правовых норм в формат концепций существительных, фактов деятельности и формирование на этой основе бизнес-правил, позволит получить структурированную интерпретацию намерений регулятора. На основе формализованных бизнес правил формируется исполнение правил в ходе оперативной деятельности [11].

Не только правовая сфера, а более широкий информационный срез представлен в открытых данных. Государственные ведомства имеют информационные системы со значительный объем информации. Публикуя данные в машиночитаемом формате, ведомства создают условия для создания приложений. Открытые данные в руках активистов являются важным рычагом для решения накопившихся проблем.

Приложения на открытых данных и прочая активность граждан в информационном пространстве, в том числе в социальных медиа, являются инструментом для отражения неформальных правил. Модель предметной области подходит для отражения формальных правил. Но как в жизни корпораций, так и в жизни государства значительную роль играют неформальные отношения. Слабосвязанная среда являются инструментом для отражения разных событий, в том числе и для событий, реализуемых по неформальным правилам. Поэтому слабосвязанная среда выступает инструментом мониторинга социально-экономической ситуации, социодинамики, а также средством перевода неформальных правил в формальные. Действия по переводу неформальных правил в формальные предопределяются текущей политической и экономической ситуацией: в какие-то моменты времени есть необходимость преследовать фискальные цели и перевести неформальную экономику в формальную, иногда необходимо обеспечить социальную стабильность, упорядочить неформальные отношения путем установления правовых норм и обеспечения правопорядка.

Для выстраивания целостной картины в области государственного управления необходимо реализовывать принципы семантического взаимодействия. Государственное управление устроено таким образом, что разные ведомства оперируют с одними и теми же объектами, совершая с ними разные действия. Поэтому особую значимость имеют связанные данные.

Использование инструмента связывания, способно серьезно повысить эффективность информационного обмена. Например, присвоив уникальный идентификатор определенной компании можно получить последовательность отдельных этапов ее жизненного цикла: регистрация, собрания акционеров, получение лицензий и т.д. Каркасом создания связанных данных является совокупность регистров базовых объектов.

Для интеграции данных в слабосвязанной среде, вебе, инструментом реализации единого пространства имен выступает (RDF/RDFS/OWL), посредством которых создается граф, с описанием объектов и типов связей между ними. При этом сам формат не предполагает использование единой

модели всеми участниками. Поэтому более жестким семантическим условием является использования наряду с RDF/OWL контролируемого словаря, что позволяет обеспечить использование единых концепций с однозначным толкованием. Примерами создания контролируемых словарей для отдельных предметных областей являются Agrovoc, Biotech, Land and Water (FAO), EUROVOC (EU), European Environment Protection Agency (GEMET) и т.д.

Для единой идентификации объектов в вебе используется URI. В RDF приложениях инструментом связывания объектов реализуется путем создания распределенных баз данных в рамках контролируемой среды, как например dbPedia. В вебе с одной стороны предоставлена свобода участникам создавать собственные URI объектам, а с другой стороны ведется работа по использованию единых идентификаторов для базовых объектов, поскольку именно это обеспечивает интеграцию данных. Примеры ресурсов по присваиванию уникальных идентификаторов для корпораций - opencorporates.com, Legal Entity Identifier - openleis.com, European Legislation Identifier - http://eli.legilux.public.lu/eli и др.

OMG также движется в сторону семантических методов, развивая SBVR, а в конце 2011 года опубликовала запрос на предложения для спецификации Семантическое информационное моделирование для федерации (SIMF RFP), как метода интеграции для независимых источников данных. Тезис OMG при развитии этих технологий состоит в том, что большинство информационных ресурсов, которые необходимо интегрировать, опубликованы в форматах, отличных от RDF. Поэтому при рассмотрении методов семантической интеграции не стоит ограничиваться методами семантического веба, а учитывать технологии, которые использованы при создании большинства работающих систем.

В SIMF в дополнение к трем традиционным моделям (концептуальная, логическая и физическая) для связывания трех уровней предполагается использовать дополнительную модель: Model Bridging Relation. Эта модель описывает связь между различными наборами элементов, находящимися в одной или в разных моделях, при этом связь может быть определена между моделями разных слоев моделирования или между моделями одного слоя.

С содержательной точки зрения эта модель показывает связь между представлением предметной области на уровне ее описательного изложения в концептуальной модели через определенный контекст логического уровня с процессами, использующими или реализуемыми приложениями. Связывая семантику информации в ее различных представлениях, эта модель являются основой для создания федеративной интеграции основанной на семантических принципах.

В статье рассмотрены три категории участников взаимодействия с государственными органами. Первые две категории условно можно отнести к контролируемой среде, они являются базисом для развития методов

интеграции в слабосвязанной среде. Подобно тому, как управление мастер данными является необходимым условием для эффективной обработки больших данных, так и развитие методов интеграции в рамках контролируемой среды является необходимым условием для полноценного развития методов интеграции слабосвязанных систем. Заключение

Активное использование информационных технологий является тенденцией, которая предопределяет такие важные для развития общества элементы как методы государственного управления. Эффективность реализации технологических проектов во многом предопределяется квалификацией заказчика и возможностями исполнителя. С учетом того, что методы интеграции данных смещаются в семантические методы зависимость от специалистов предметной области, их квалификации будет нарастать. Поэтому необходимо организовывать междисциплинарные площадки, для стандартизации данных предметных областей, выработка контролируемых словарей, формализация базовых бизнес правил.

Литература

1. A. Giordano Data Integration: Blueprint and Modeling Techniques for a Scalable and Sustainable Architecture, IBM Press, 2011

2. ISO 8000 (series). Data quality

3. Hodgson R. An industry perspective on deployed semantic interoperability solutions, SEMIC,TopQuadrant, Athens, 09-04-14

4. Galinski С. Content Interoperability Standardization and harmonization, OASIS, Brussels, 200810-10

5. Chapin D. Implementing SBVR with Practitioner's Perspective, Semantic Web Rules, RuleML 2010, Washington, Springer

6. Documents SBVR, http://www.omg.org/spec/SBVR/1.2

7. Ю. Липунцов. "Стандартизация данных предметной области Data standardization in Higher School Domain" IT and IT-Education, MSU 2013 Moscow

8. M. Pellegrino, Maintaining the quality of EU statistics while enabling re-use. SEMIC 2013. Dublin: Eurostat.

9. E. Hippel, S. Ogawa, de Jong J., "The age of consumer -innovator" MIT Sloan management Review 2011 53(1) http://sloanreview.mit.edu/article/the-age-of-the-consumer-innovator

10. F. Hayek Law, Legislation and Liberty: A New Statement of the Liberal Principles of Justice and Political Economy. Vol. 1: Rules and Order. London, 1973.

11. OMG, Semantic Information Modeling for Federation (SIMF RFP), http://tinyurl.com/SIMFrfp

12. S. Kumaran, R.Liu, F.Y. Wu, On the Duality of Information-Centric and Activity-Centric Models of Business Processes, Advanced Information Systems Engineering, 2008/1/1 IBM, Springer

i Надоели баннеры? Вы всегда можете отключить рекламу.