ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ
Ворожцова Т.Н.
УДК 004.42
ОНТОЛОГИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОГРАММНОГО КОМПЛЕКСА С ИСПОЛЬЗОВАНИЕМ МИКРОФОРМАТОВ
Введение. Исследованию возможностей использования онтологий в различных направлениях в настоящее время уделяется достаточно много внимания. На их основе решаются такие задачи, как представление знаний для релевантного поиска и вывода информации; формализация знаний предметных областей и их классификация; организация общей и предметной терминологии; выделение концептуальных знаний и др. Основная цель разработки онтологий — организация и структурирование знаний, а также их приобретение и повторное использование. Использование международных открытых стандартов, а также современных инструментов и технологий Web-программирования на базе использования языка XML и метаданных способствует дальнейшему расширению перспектив применения онтологического подхода.
В Институте систем энергетики им. Л.А. Мелентьева (ИСЭМ) СО РАН ведется работа по созданию IT-инфраструктуры научных исследований с использованием онтологий для описания интеллектуальных ресурсов [1], а также предложено использовать онтологическое описание для моделирования и разработки программных комплексов (ПК) [2, 3]. Использование микроформатов является дальнейшим шагом в развитии онтологического подхода к формализованному описанию ресурсов. В данной статье рассматривается возможность их использования для формирования и структурирования HTML-страниц, предназначенных для вывода информации в HTA-прило-жениях, используемых при разработке программных комплексов для исследований теплоэнергетических объектов.
Микроформаты и их назначение. Микроформаты становятся современным новым средством представления данных. Фактически они представляют собой специальные элементы языка разметки, позволяющие закодировать то или иное понятие, наиболее часто встречающееся на Web-страницах. Тем самым
появляется дополнительная возможность выявления семантики страниц на HTML или XHTML программными средствами. Уже формируются стандарты на такие семантические фрагменты, например, hCard (для представления контактной информации о людях, компаниях, организациях), hCalendar (календарные даты и события), hReview (обзоры продуктов, услуг, бизнеса) и др. [6, 7]. Вид понятия представляется как определенный класс объектов, понятный для браузера. Основное назначение микроформатов — дополнительная формализация для обеспечения работы поисковых программ и других программ обработки информации, в том числе и для автономных приложений.
Моделирование и разработка ПК с использованием онтологий. Специфика проведения исследований в энергетике связана с моделированием энергетических объектов и требует постоянной разработки нового программного обеспечения (ПО), все более усложняющихся программных комплексов. Основной особенностью ПО, используемого в исследованиях теплоэнергетических объектов, является тесная взаимосвязь его структуры с описанием исследуемой предметной области. Как правило, ПК предназначаются для моделирования и расчетов тепловых электрических станций (ТЭС) или теплоэнергетических установок (ТЭУ). Такие объекты имеют сложную структуру, как правило, иерархическую, состоят из большого количества элементов. Алгоритмы математического моделирования базируются на разработках системы декларативного программирования, работы по которой ведутся достаточно давно [4]. Для автоматизации создания моделирующих программ используется комплекс СМПП-ПК [5], с помощью которого можно автоматически генерировать программу расчета сложной ТЭУ по информации об элементах и связях технологической схемы. С использованием этого комплекса выполняются многочисленные оптими-
зационные исследования теплосиловых систем различных типов. Происходит постоянное развитие методик расчетов и усложнение исследуемых объектов, что требует современных подходов к моделированию ПО, в частности, базирующихся на концепции MDA (Model Driven Architecture — архитектура, управляемая моделью), предполагающей зависимость структуры разрабатываемого ПО от предметной области.
В ИСЭМ СО РАН для разработки ПК, предназначенных для моделирования ТЭУ и ТЭС используется концептуальная схема ПК, основанная на распространенном паттерне проектирования MVC (Model-View-Controller — Модель-Вид-Контроллер), позволяющем разделить все объекты проектируемого ПК на отдельные группы, каждая из которых отвечает за свой набор функций. Объединение всех вычислительных модулей реализуется на основе HTA-приложения, которое позволяет организовать гибкий расширяемый интерфейс любого вида с помощью возможностей языка сценариев JavaScript или VBscript. HTA объединяют в себе все возможности Internet Explorer — объектную модель, поддержку протоколов, отображают меню, иконки, панели инструментов, заголовки и другую информацию и могут выполняться как любой исполняемый файл (рис. 1).
Моделирование состава конкретного ПК осуществляется на основе описания реальной структуры моделируемой предметной облас-
Рис. 1.Структурная схема ПК
ти, например, описания технических объектов ТЭЦ. Иерархическая структура формируется путем создания дерева каталогов, каждый элемент которого содержит данные о том или ином фрагменте общей модели ТЭЦ и его компонентах. В соответствии с этой структурой программными средствами автоматически создается онтологическое описание моделируемой предметной области, которое представляет собой текстовый файл в формате XML.
Сформированная онтология является базой для формирования всей структуры приложения, в соответствии с ней формируется интерфейс на основе HTA, навигационная структура меню с набором основных команд приложения. Каждый элемент навигационной структуры содержит привязку к соответствующему HTML-файлу, который создается в соответствии с потребностями пользователя и особенностями данного компонента, содержит необходимые данные и отображается в рабочем окне (рис. 2). HTML-формат обеспечивает гибкие возможности как для отображения любой необходимой информации, так и для формирования гипертекстовых переходов и связей с другими компонентами приложения.
Использование микроформатов для представления данных на HTML-страницах.
Содержимым рабочего окна могут быть разные компоненты — графические схемы (общая схема ТЭЦ, схема группы турбин, схема турбогенератора и др.), числовые данные в виде таблиц значений параметров расчета, текст, рисунки, гиперссылки, элементы управления (поля редактирования, кнопки и др.). Информация в рабочем окне может формироваться динамически в соответствии с текущей выполняемой командой.
При проектировании
HTML-страниц, содержащих данные приложения предлагается использовать микроформаты для формализации наиболее часто используемых видов отображаемой информации. В разрабатываемых ПК для теплоэнергетических исследований такой типичной информацией, требующей отображения, являются гиперссылки, простые текстовые фрагменты, графическая информация и таблицы данных.
ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ
Рис. 2. Фрагмент навигационной структуры и рабочего окна
В Интернет уже получили распространение микроформаты, используемые в ссылках с помощью атрибута ге! такие как rel-directory, указывающий, что ссылка указывает на директорию или rel-tag, показывающий, что ссылка указывает на метку, находящуюся на той же странице. Данные микроформаты показывают связь текущей страницы с той, на которую ссылается. Атрибут гс1 предоставляет широкие возможности для семантического сопровождения страниц, так как для него не существует определенного списка значений и можно использовать произвольные в соответствии
<a href="scheme.html"
rev="help">возврат на текущую страницу</a>.
Расширяет возможности и использование атрибута class, который может иметь разное назначение : во-первых, для использования стандартным механизмом каскадного стилевого оформления CSS; во-вторых, может быть обработан и трансформирован стандартными средствами XSLT (или специальным про-граммым обработчиком поддержки данного микроформата) для запуска команды операционной системы (типа AT для MS Windows); в-третьих, обладает явной семантической "читабель-множественного применения для
свойством ности" и подготовленного пользователя.
Далее приведен пример микроформата для запуска программного модуля ПК в заданное время [10]:
<р class="start">3aпycк программного модуля,
^рап class="20080804">4 августа 2 00 8<^рап>осуществить,
^рап class="193000">19:30</span>. </р>.
Спецификой разработанного ПК для мо
с потребностями. Примеры использования на делирования ТЭУ являются иерархические
страницах приложения: связи между моделируемыми объектами, ко-
1.<link rel= alternate type= img торые необходимо отслеживать. При этом title= ТЭЦ" href="img_tec.xml />. страницы, содержащие графическую инфор-
Данная ссылка описывается с использова- мацию, связываются ссылками, обеспечиваю-
нием атрибута гс1, который указывает, что щими переходы по уровням иерархии, Тот же
документ с названием «ТЭЦ» является альтер- относится и к страницам, отображающим чис-
нативным по отношению к текущему, т.е. ловые параметры. По аналогии с универсаль-
представляет, например, графическое отобра- ными микроформатами можно использовать
жение ТЭЦ. собственные, дополнительно описывающие,
2.<a href= scheme_tec/T_100.html например, взаимосвязи между числовыми и rel= tag>группатурбин T-100</a> . графическими данными одного и того же мо-
Данное значение атрибута указывает на делируемого объекта. Возможны и другие ва-то,чтоссылкаявляетсяметкойнатомжедоку- рианты использования аналогичных микроменте. форматов, описывающих типовые компонен-
Существует возможность указывать и об- ты представляемых данных, например, для
ратную связь между страницами с помощью формирования типовых таблиц, содержащих
атрибута rev. Например, страницы помощи, списки редактируемых и не редактируемых
содержащие подсказки пользователю, целесо- параметров и др.
образно снабжать ссылками, использующими микроформат, указывающий, что текущая страница является вспомогательной по отношению к той, на которую указывает ссылка для возврата:
При необходимости работы в WWW распределенные по страницам метаданные в микроформатах могут быть обработаны и представлены в стандартных онтологических форматах OWL (OWL Lite, OWL DL, OWL Full). Ожидается, что ряд стандартных микрофор-
матов и их развитие (например, RDFA, hCard, hCaledar, AtomOWL и др.) будут поддерживаться в стандарте W3C языка HTML версии 5.0.
Заключение. Использование универсальных микроформатов, которые находят все большее применение в Интернет а также разработка собственных мини-структур данных, аналогичных микроформатам, может способствовать лучшему структурированию информации на страницах и обеспечивать дополнительные возможности программной обработки типовых данных для аналогичных страниц и их фрагментов. Разработанная модель ПК является достаточно универсальной, т.к. позволяет создавать программные комплексы для разных предметных областей на основе формализованного описания в виде онтологической модели реальной структуры данных и решаемых задач, включая в свой состав прикладные алгоритмы обработки данных и расчетов, реализованные на разных языках программирования, в виде исполняемых программных модулей. Представление данных в виде HTML-страниц или фреймов с использованием как универсальных, так и специальных микроформатов для формализации типовых компонентов данных, также обеспечивает большую гибкость и возможность динамического формирования данных в зависимости от потребностей пользователя, особенно в случаях совместного использования одних и тех же данных разными приложениями.
БИБЛИОГРАФИЯ
1. Ворожцова Т.Н., Скрипкин С.К. Онтологический подход к моделированию программного комплекса // Вестник ИрГТУ. — 2006. - № 2 (26). - С. 72-78.
2. Ворожцова Т.Н., Скрипкин С.К. Моделирование программно-вычислительного
комплекса на основе онтологий // Информационные и математические технологии в науке, технике и образовании / Труды X Байкальской Всероссийской конференции «Информационные и математические технологии в науке, технике и образовании». Часть 1. - Иркутск: ИСЭМ СО РАН, 2005. - С. 87-94.
3. Копайгородский А.Н., Массель Л.В. разработка и интеграция основных компонентов информационной инфраструктуры научных исследований // Вест.ИрГТУ. 2006. №2 (26). С. 20-24.
4. Карпов В.Г., Попырин Л.С., Самусев В.И., Эпельштейн В.В. Автоматизация построения программ для расчета схем теплоэнергетических установок // Изв. АН СССР. Энергетика и транспорт. - 1973. -№ 1.-С.129-137.
5. Математическое моделирование и оптимизация в задачах оперативного управления тепловыми электростанциями / Клер, Н.П. Деканова, С. К. Скрипкин и др. - Новосибирск: Наука. 1997. - 120 с.
6. Latest microformats news. http://microformats.org
7. Microformat From Wikipedia, the free encyclopedia.
http://en.wikipedia.org/wiki/Microformats
8. Алексей Копылов. Семантическая сеть, основанная на микроформатах. http://www.gui.ru.copylove/microformats/
9. Юч Огбуджи. Микроформаты в контексте их применения
http://www.xml.com/pub/a/2006/04/26/mi croformats-grddl-rdfa-nvdl.html.
10. Datetime Design Pattern http://microformats.org/wiki/datetime-desi gn-pattern