Горюнова. В.В., Истомина. Т.В., Молодцова Ю.В., Аленин С.А., Шамин Е.А. МЕТОДОЛОГИЯ ПРОЕКТИРОВАНИЯ РАСПРЕДЕЛЕННЫХ МЕДИЦИНСКИХ СИСТЕМ НА ОСНОВЕ КОНЦЕПТУАЛЬНЫХ СПЕЦИФИКАЦИЙ
Представлен краткий обзор решений в области обработки распределенных медико-биологических данных . Рассматриваются аспекты декларативного моделирования, составляющего основу модульной онтологической системной технологии (МОСТ-технологии), определяющей механизм проектирования, функционирования и разработки интегрированных медицинских информационных систем из так называемых онтологических модулей (ДОМ).
Ключевые слова: онтологии, декларативное моделирование, базы знаний, интегрированные среды
Введение. С помощью инструментальных средств моделирования решаются задачи прогнозирования развития интегрированных медицинских информационных систем (ИМИС), в том числе: формирования
стратегии развития в условиях изменения внешней среды; выбора целей ИМИС с учетом ограничений на потребляемые ресурсы; определения возможных сценариев достижения целей при выбранной стратегии, определения оптимального сценария и т.д.
Обзор решений по интеграции распределенных биомедицинских данных и знаний в ИМИС [1,2] может быть представлен информационными структурами, приведёнными ниже.
Хранилища данных. Во многих учреждениях медицинскиого профиля одним из первых инструментариев ИМИС были хранилища данных, которые работают по принципу центрального склада. Хранилища данных отличаются от традиционных баз данных (БД) тем, что они проектируются для поддержки процессов принятия решений, а не просто для эффективного сбора и обработки данных. Как правило, хранилище содержит многолетние версии обычной БД, физически размещаемые в той же самой базе. Данные в хранилище не обновляются на основании отдельных запросов пользователей. Вместо этого вся база данных периодически обновляется целиком.
Хранилища знаний. Если хранилища данных содержат в основном количественные данные, то хранилища знаний ориентированы в большей степени на качественные данные. ИИС генерируют знания из широкого диапазона баз данных (включая Lotus Notes), хранилищ данных, рабочих процессов, статей новостей , внешних баз, Web-страниц (как внешних, так и внутренних), и конечно, люди, представляют свою информацию. Таким образом, хранилища знаний подобны виртуальным складам, где знания распределены по большому количеству серверов.
В некоторых случаях в роли интерфейса к реляционной базе данных может выступать Web браузер.
Базы данных и базы знаний. Знания можно извлекать из рабочих процессов, обзоров новостей и широкого диапазона других источников. Знания, приходящие из рабочих процессов, базируются на рабочих материалах, предложениях и т. п. Кроме того, базы знаний могут быть спроектированы в расчете на ведение хронологии деятельности предприятия, касающейся, например, работы с клиентами.
Базы данных для обучения. Обучающие БД могут использоваться для поддержки операций или генерации информации о бизнесе в целом.
Базы знаний оптимальных решений. Обычно подобные знания накапливаются в процессе использования различных тестов при поиске эффективных путей решения задач. После того как организация получила знания о наилучшем решении, доступ к ним может быть открыт для сотрудников корпорации.
На сегодняшний день основными по объему источниками структурированных данных выступают реляционные базы данных, хотя это могут быть и файловые системы, и XML базы данных, расширяющие масштабы своего применения, и другие типы источников информации. Вне зависимости от выбранного метода хранения данных, первая проблема интеграции гетерогенных данных, с которой приходится сталкиваться при формировании хранилища (репозитория) информационных ресурсов, это разнообразие моделей и схем данных, низкий уровень их абстракции, малая адекватность отражения семантики предметной области. Например, хорошим решением может быть переход к некоторой объектно-ориентированной модели данных, на основе онтологий, которые по многим параметрам близки к семантическим моделям, где ключевой единицей является сложно структурированный информационный объект (концепт) , поддерживающий различные атрибуты, участвующий в различных ассоциациях с другими объектами [2].
Для описания объектно-ориентированных моделей данных применяется ряд языков описания объектных схем данных, например:
ODL— стандарта ODMG объектно-ориентированных БД;
RDFS (Resource Definition Framework Schema)— W3C стандарт позволяет описывать схемы классов и их свойств, с учетом их наследования, ограничений;
OWL (Web Ontology Language)— специализация RDFS, ориентированная на описание предметных онтологий.
Переход от реляционной модели данных к объектно-ориентированной является необходимым этапом в построении открытого информационного хранилища. Объектно-ориентированная модель позволяет:
повысить уровень абстракции модели предметной области;
удобно выделить канонические схемы данных, представляющие собой пересечение экспортных схем данных, соответствующих различным предметным областям, строить унифицированные объектные запросы на доступ к распределенным данным с последующим агрегированием результатов запросов в соответствие с каноническими схемами;
в случае RDFS и OWL — еще иметь унифицированный формат представления данных, обеспечивающий неплохую синтаксическую и семантическую интероперабельность.
В вопросе интеграции (точнее, технической интероперабельности) распределенных данных все большую силу набирает технология Web-сервисов, как средства предоставления унифицированного, платфор-мо-независимого интерфейса для удаленного доступа к информационным ресурсам. В данном контексте, Web-сервис выступает в роли автономного приложения, которое предоставляет средства доступа к информации внешним клиентам через набор предоставляемых им услуг. Технология Web-сервисов базируется на таких открытых XML-стандартах, как:
SOAP (Simple Object Access Protocol)— XML-протокол для удаленного вызова методов Web-сервисов;
UDDI(Universal Description, Discovery and Integration) — описывает модель данных, предназначенную для каталогизации и обнаружения услуг, предоставляемых Web-сервисами;
WSDL (Web Services Description Language) — язык описания интерфейсов Web-сервисов.
Формирующиеся дополнения к ним, например, WSCoordination/WS-Transaction (транзакции), WSSecurity (безопасность), WS-Routing (маршрутизации сообщений) и т.д., призваны расширить возможности этой платформы в удовлетворении требований задач интеграции приложений. В рамках инициативы WS-I разрабатываются примеры прикладных решений, предложения и дополнительные требования, призванные гарантировать совместимость решений разных поставщиков. Это сулит широкие возможности по интеграции различных информационных систем в рамках единого согласованного набора спецификаций.
Для описания композиций Web-сервисов на данный момент различными ассоциациями предлагается ряд стандартов. Среди них можно отметить следующие языки описания автоматизированных потоков работ, участниками которых являются Web-сервисы:
WSFL (Web Services Flow Language)— позволяет определять композиции Web-сервисов в виде графовой модели рабочего процесса;
BPML (Business Process Modeling Language)— определяет блочную модель композиции Web-сервисов;
BPEL4WS (Business Process Execution Language For Web-Services) — представляет собой гибрид блочной и графовой моделей описания взаимодействий Web-сервисов.
Эти языки позволяют описывать композиции Web-сервисов, что позволяет определять сложные, распределенные процессы по извлечению, обработке и интеграции информации.
Итак, можно выделить метод осуществления процесса сбора и интеграции распределенных данных, который базируется на трех технологиях:
объектные ИМИС, соответствующие некоторым предметным областям;
механизм Web-сервисов, как средство построения внешних интерфейсов к таким ИМИС;
аппарат рабочих процессов, как средство управления обработкой и интеграции информационных потоков.
Предлагается расширить эти технологические рамки, применив модульную онтологическую системную технологию (МОСТ-технологию).
Использование возможностей МОСТ-технологии [3]:
обеспечить системе большую открытость для подключения новых информационных ресурсов;
возможности распределённого и автономного поиска;
построение систем поддержки принятия решений.
На рисунке представлена схема использования МОСТ-технологии в ИПС.
Рисунок. МОСТ-технология описания изделий в ИПС.
Практика моделирования концептуальных спецификаций интегрированных медицинских интеллектуальных систем. Для моделирования сложных систем управления процессами производства (в том числе, медицинской техники) разработан ряд методологий, например методологии семейства IDEF (Integrated DEFintion). IDEF содержит 14 государственных стандартов. Они предназначены для анализа процессов взаимодействия в производственных системах. Для поддержки онтологического анализа предназначена методология IDEF5.
Процесс построения онтологии, согласно IDEF5, состоит из пяти основных действий:
изучение и систематизирование начальных условий — это действие устанавливает основные цели и контексты проекта разработки онтологии, а также распределяет роли между членами проекта;
сбор и накапливание данных — на этом этапе происходит сбор и накапливание необходимых начальных данных для построения онтологии;
анализ данных — эта стадия заключается в анализе и группировке собранных данных и предназначена для облегчения построения терминологии;
начальное развитие онтологии — на этом этапе формируется предварительная онтология на основе отобранных данных;
уточнение и утверждение онтологии — заключительная стадия процесса.
В любой системе существуют две основные категории предметов восприятия: объекты, составляющие
систему, и взаимосвязи между этими объектами, характеризующие состояние системы.
На начальном этапе построения онтологии должны быть выполнены следующие задачи: создание и документирование словаря терминов;
описание правил и ограничений, согласно которым на базе введенной терминологии формируются достоверные утверждения, описывающие состояние системы;
построение модели, которая на основе существующих утверждений позволяет формировать необходимые дополнительные утверждения.
В частности, для поддержания процесса построения онтологии в IDEF5 разработаны специальные онтологические языки: схематический язык (Schematic Language-SL) и язык доработок и уточнений
(Elaboration Language-EL).
Язык SL позволяет строить разнообразные типы диаграмм и схем в IDEF5. Основная цель всех этих диаграмм — наглядно и визуально представлять основную онтологическую информацию [2].
Существуют четыре основных вида схем, которые используются для накопления информации об онтологии в прозрачной графической форме.
диаграмма классификации (Classification Schematics) — обеспечивает механизм для логической систематизации знаний, накопленных при изучении системы;
композиционная схема (Composition Schematics) — механизм графического представления состава классов онтологии, позволяющий описывать, что из каких частей состоит, т. е. наглядно отображать состав объектов, относящихся к тому или иному классу;
схема взаимосвязей (Relation Schematics) — инструмент визуализации и изучения взаимосвязей между различными классами объектов в системе;
диаграмма состояния объекта (Object State Schematics) — средство документации процессов с точки зрения изменения состояния объекта.
Таким образом, диаграммы состояния в IDEF5 наглядно представляют изменения состояния или класса объекта в течение всего хода процесса. При построении концептуальной модели используются предметные знания в виде набора понятий и связывающих их отношений. Каждое понятие имеет имя и может иметь атрибуты, каждый атрибут может иметь значение с учетом специфики предметной области.
Для определения технологий разработки концептуальных спецификаций введём термин «декларативное моделирование», которое включает формальный аппарат описания процессов построения онтологии и предполагает разработку визуально-графических средств реализации следующих функциональных задач: обозначение целей и области применения создаваемой онтологии;
построение онтологии, которое включает: 1) фиксирование знаний о проблемной области (ПрО), т.
е. определение основных понятий и их взаимоотношений в выбранной предметной области; создание точных непротиворечивых определений для каждого основного понятия и отношения; определение терминов, которые связаны с этими терминами и отношениями; 2) кодирование, т. е. разделение совокупности основных терминов, используемых в онтологии, на отдельные классы понятий; 3) выбор или разработку формальных средств (специальных языков для представления онтологии); 4) непосредственно задание фиксированной концептуализации на выбранном языке представления знаний;
совместное применение пользователями (исполнителями) общего понимания структуры системы; обеспечение возможности использования знаний предметной области (ПрО); создание явных допущений в ПрО, лежащих в основе реализации; отделение знаний ПрО от оперативных знаний.
В основе декларативного моделирования лежит описание системы (организации или предприятия) в терминах сущностей, отношений между ними и преобразование сущностей, которое выполняется в процессе решения определенной задачи.
Основной характерной чертой этого подхода является, в частности, разделение реальных процессов на составляющие и классы объектов и определение их онтологий, или же совокупности фундаментальных свойств, которые определяют их изменения и поведение [4].
Декларативное моделирование подразумевает глубокий структурный анализ предметной области. Простейший алгоритм декларативного моделирования может быть представлен следующими составляющими: выделение концептов — базовых понятий данной предметной области; определение «высоты дерева онтологий» — количество уровней абстракции; распределение концептов по уровням;
построение связей между концептами — определение отношений и взаимодействий базовых понятий; консультации с различными специалистами для исключения противоречий и неточностей.
Декларативное моделирование начинается с составления словаря терминов, который используется при обсуждении и исследовании характеристик объектов и процессов, составляющих рассматриваемую систему, а также создания системы точных определений этих терминов. Кроме того, документируются основные логические взаимосвязи между соответствующими введенным терминам понятиями. Результатом моделирования является словарь терминов, точных их определений и взаимосвязей между ними.
Декларативное моделирование предполагает декомпозицию системы распределенного управления на этапы. Вместе с тем, есть целый ряд особенностей, которые определяют характер выполнения отдельных этапов. К таким особенностям относятся:
Коллективное использование знаний предполагает объединение и распределение источников знаний по различным субъектам, а, следовательно, решение организационных вопросов администрирования и оптимизации деловых процессов, связывающих пользователей систем.
Состав источников знаний определяется в принципе, конкретные источники знаний, особенно внешние источники знаний, могут добавляться по мере развития проекта.
Поскольку системы распределенного управления промышленными процессами имеет многоцелевое назначение, возникает потребность в интеграции разнообразных источников знаний на основе единого семантического описания пространства знаний.
Таким образом, концептуальная проработка реализации системы распределенного управления в основном сводится к созданию онтологии, которая выполняется классически в результате взаимодействия исполнителей и экспертов. Разработка и поддержка онтологии в масштабе целого предприятия требует постоянных усилий для ее развития. Для сокращения затрат на разработку онтологии целесообразно использовать онтологии, разработанные специализированными проектными организациями, которые могут использоваться на принципах тиражирования (разделения доступа) и повторного использования [5].
МОСТ-технология определяет механизм проектирования, функционирования и разработки сети распределенного управления (в стандартном варианте, иерархического типа) из так называемых декларативных онтологических модулей (ДОМ) или декларантов. При этом статическая структура распределенной сети ДОМ-модулей блоков определяет «стратегию» процессов управления, а динамический механизм процессов «отработки» ОБ-блоков описывает «альтернативу» процессов управления в сети распределенного управления
МОСТ-технология дает возможность формального описания процессов поведения сети онтологических модулей , служит основой верификации, трансформации и оценки производительности систем распределенного управления.
МОСТ-технология должна обеспечивать не только доступ к онтологиям, но и функции контроля версий, репликации, экспорта/импорта. В распределённой сети системы должна обеспечиваться возможность иметь «прозрачный» доступ к актуальным версиям любых онтологий, которые могут понадобиться при анализе данных.
Использование подобной технологии обеспечивает:
универсальное программирование данных независимо от типа их источника;
обеспечивается поддержка обобщённых приложений;
упрощает поиск, просмотр, изменение и анализ данных для приложений, утилит и средств разработки;
возможность использования одного интерфейса для доступа к разным уровням абстракции данных (когда метаданные доступны через единый программный интерфейс).
Для реализации интерфейса МОСТ-технологии и доступа к онтологиям можно использовать возможности Service Data Object, формирующего SDO -объекты, соответствующие активным и пассивным образам ИМИС.
Эти же технологические средства лежат в основе реализации компонент сервисов доступа к данным (Data Access Service, DAS). Для каждого возможного источника данных (Реляционные базы данных, XML документы, Web-сервисы и т.д.) реализуется отдельная компонента, обеспечивающая возможности поиска SDO объектов, и фиксирования их изменений, на основе метаданных, хранимых в метаонтологии. За любой онтологией может быть закреплён определённый экземпляр соответствующей компоненты DAS, который с одной стороны, использует её для обеспечения доступа, а с другой, определяет конкретное место хранения описанных в ней данных.
Идентификатор онтологии должен однозначно определять её «базовое» месторасположение относительно других серверов системы, обеспечивая быстрое нахождение источника данных в распределённой сети.
Предлагается вариант построения такой сети посредством сервиса сообщений. Сообщение представляет собой набор параметров, определяющих целевой сервис, который должен быть вызван на каждом сервере, на который это сообщение будет послано и механизм возврата результатов работы этих сервисов в точку вызова. При этом на каждом сервере хранится набор таблиц маршрутизации, имеющих уникальные идентификаторы. Каждая таблица определяет набор параметров подключения к другим серверам приложений. Конечный пользователь использует сетевой сервис сообщений, создавая новое сообщение и определяя уникальный идентификатор таблицы маршрутизации. Сервис передаёт это сообщение на каждый из серверов, описанных в указанной таблице маршрутизации, используя такой же сетевой сервис на каждом из них. Таким образом, сообщение каскадно передаётся по всей заранее сконфигурированной сети, а пользователь получает набор результатов работы всех найденных целевых сервисов.
Заключение. Описанные принципы МОСТ-технологии является ключевыми элементами обеспечения логики внутри сетевого взаимодействия узлов распределенной системы. Кроме описанной функциональности МОСТ-технология обладает некоторыми дополнительными возможностями управления стратегиями передачи сообщений и организации иерархических сетей.
Для каждой ИМИС в отдельности производится анализ её данных и формирование отдельной онтологии с метаданными (онтологической модели) описывающей их структуру и характер. Этот процесс автоматизируется средствами реинжиниринга медицинских данных и осуществляется соответствующими специалистами.
В целом, предложенный авторами подход позволит формализовать практически все процессы жизненного цикла изделий медицинского назначения, а, кроме того, он может быть распространен на другие области науки и техники.
ЛИТЕРАТУРА
1. Gruber N.R. A Translation approach to portable ontologies//Knowledge Acquisi-tion.1993.№5(2), pаges 199-220.
2. Farquhar A., Fikes R., Rice J. The Ontolingua server: A tool for collaborative ontology
construction // International Journal of Human-Computer Studies, 46(6), pages 707-728, 1997.
3. Горюнова В.В. Модульная онтологическая системная технология в управлении промышленными процессами. // Приборы и системы. Управление, контроль, диагностика. - 2008, -№2, с.59-64
4. Горюнова В.В. Декларативное моделирование распределенных систем управления промышленными
процессами. // Приборы и системы. Управление, контроль, диагностика. - 2009, -№9,с.62-70
5. Горюнова В.В. Онтологический подход к проектированию систем технического обслуживания //
Автоматизация и современные технологии. . - 2009,№12, с. 25-29