УДК 004.682
П.А. Ломов, Е.Ю. Данилов
Институт информатики и математического моделирования технологических процессов Кольского НЦ РАН
ПОСТРОЕНИЕ КОГНИТИТИВНЫХ ФРЕЙМОВ НА ОСНОВЕ ОНТОЛОГИЧЕСКИХ ПАТТЕРНОВ ДЛЯ ВИЗУАЛИЗАЦИИ ОНТОЛОГИЙ*
Аннотация
В работе предлагается решение проблемы передачи эксперту знаний, представленных в онтологиях посредством их визуализации на основе специальных структур - когнитивных фреймов. Рассматривается формирование когнитивных фреймов на основе распространенных онтологических паттернов, используемых при разработке онтологий. Представлен прототип программного средства визуализации.
Ключевые слова:
онтология, визуализация, шаблоны онтологического проектирования.
P.A. Lomov, E.Yu. Danilov
CONSTRUCTION OF COGNITIVE FRAMES BASED ON ONTOLOGICAL PATTERNS FOR ONTOLOGIES VISUALIZATION
Abstract
The paper proposes a solution to transfer expert knowledge represented in ontologies through their visualization based on special structures - cognitive frames. The formation of cognitive frames on the basis of common ontological patterns and prototype of visualization tool are considered.
Keywords:
ontology, visualization, ontological design patterns.
Введение
В настоящее время онтологические модели становятся распространенным средством представления знаний в сети Интернет. Однако применение для их описания языка веб-онтологий (Ontology web language, OWL), основанного на дескрипционной логике ALC (Attributive Language with Complement), хоть и позволяет обеспечить высокие выразительные возможности с сохранением разрешимости, но по мере роста онтологии (увеличении в ней числа логических утверждений - аксиом) создает проблемы ее понимания человеком. Целью предлагаемого подхода к визуализации онтологий является решение данной проблемы, то есть обеспечение эффективной (в смысле затрат труда и времени) передачи онтологических знаний пользователю. Для этого авторами предлагается использовать когнитивный фрейм (КФ) [1]. Под КФ, в общем случае, понимается визуализированный фрагмент онтологии, позволяющий передать человеку (эксперту) знания о некотором целевом понятии. Формирование КФ производиться с учетом психологических особенностей восприятия и структурирования человеком информации, а также
*
Работа выполнена при финансовой поддержке РФФИ (проект №15-07-03321).
43
принципов определения понятий в онтологии. По своей функции когнитивный фрейм близок к понятию «точка зрения» [2], однако в отличие от последнего он включает помимо набора фактов о понятии еще и соответствующий ему визуальный образ.
Формально определение когнитивного фрейма можно записать следующим образом:
KF(t) =< CT,VS >, (1)
где t - целевое понятие когнитивного фрейма, СТ - содержание фрейма -множество дуг вида «понятие-отношение-понятие», отражающих смысловое значение целевого понятия, VS - визуальный образ, формируемый на основе содержания.
В прошлых работах мы рассматривали процедуру формировании КФ на основе инвариантных к предметным областям понятийных отношений [3, 4], таких как «таксономия», «партономия» и «зависимость». Это позволяло получить приемлемую визуализацию для простых онтологий, понятия которых заданы с использованием только данных отношений. В данной работе мы рассмотрим формирование КФ на основе паттернов онтологического проектирования, применяемых при разработке онтологий, а также с учетом гештальт принципов организации человеческого восприятия [5]. В завершении работы представлены результаты экспериментальной оценки когнитивных свойств, полученных КФ для прикладной онтологии.
Онтологические паттерны содержания как точки зрения на понятия онтологии
В работе [2] точка зрения (viewpoint) определяется как согласованный набор фактов, описывающий понятие с определенного ракурса. Визуализация понятия с учетом точки зрения, заданной разработчиком онтологии, облегчает и обеспечивает правильность интерпретации смысла понятия пользователем. Основной проблемой при оперировании точками зрения является извлечение из базы знаний фактов, соответствующих им (viewpoint extraction). Для произвольной базы знаний это может быть затруднительно в виду довольно абстрактных определений точек зрения, что позволяет реализовывать их произвольным образом.
В последние годы развивающимся подходом к построению онтологий является использование онтологических паттернов проектирования (Ontology design patterns, ODP) [6, 7]. ODP представляют собой рекомендуемые решения распространенных проблем онтологического инжиниринга. Их применение упрощает создание онтологии, а также делает ее структуру более понятной для других разработчиков, знакомых с ODP. ODP подразделяются на несколько типов в зависимости от решаемых задач: структурные паттерны (Structural ODPs), паттерны соответствия (Correspondence ODPs), паттерны содержания (Content ODPs), паттерны логического вывода (Reasoning ODPs), паттерны представления (Presentation ODPs), лексико-синтаксические паттерны (Lexico-Syntactic ODPs). В данной работе будет рассмотрено использование онтологических паттернов содержания (CDP), ввиду их сходства с понятием точки зрения. Они представляют собой небольшие фрагменты онтологий, на основе которых можно описать типовые положения вещей в предметной области
44
(участие в событиях, части целого, последовательность сущностей и др.). Отличием CDP является большая детализация структуры такого фрагмента и ориентация на онтологии, описанные OWL. Таким образом, CDP можно рассматривать как формализованное описание некоторой точки зрения, которое потенциально может быть использовано для определения понятий прикладных онтологий. Учет смысла CDP, использованных при определении понятий, позволит задать общий подход к формированию соответствующих им когнитивных фреймов.
Для определения CDP, которые могли бы быть использованы в качестве основы когнитивных фреймов, был произведен анализ паттернов, представленных в каталоге ODP [8]. В результате были отобраны инвариантные по отношению к области применения паттерны, такие как: «Агент-роль» (Agent-Role), «Роль участника» (Participant role), «Выполнение задачи» (Task execution), «Описание-ситуация» (Description-Situation), «Временной интервал» (Time interval), «Список» (List), «Набор» (Bag), «Последовательность» (Sequence).
Формирование когнитивных фреймов на основе онтологических паттернов содержания
Основными компонентами когнитивного фрейма для некоторого понятия онтологии являются содержание и визуальный образ. Рассмотрим формирование данных компонентов на основе ODP с учетом требований к когнитивному фрейму.
1. Формирования содержания когнитивных фреймов
Формирование содержания КФ на основе CDP предполагает в первую очередь их обнаружение (design pattern detection) [9, 10]. Данная задача заключается в выявлении факта использования того или иного паттерна в онтологии. После чего необходимо извлечь реализацию этого паттерна -фрагмент онтологии, соответствующий его структуре. Решение задачи извлечения вообще требует синтаксического и семантического анализа аксиом онтологии, что заслуживает отдельного исследования. На данном этапе обнаружение и извлечение реализаций паттернов осуществляется по упрощенной схеме путем обнаружения множеств понятий и отношений с идентификаторами IRI (Internationalized Resource Identifier), сходными с IRI элементов того или иного паттерна:
(2)
где Pk - реализация CDP в онтологии, <c, Cj> - отношение между понятиями
С и С,\
Таким образом, содержание КФ для некоторого понятия t определяется множеством реализаций паттернов, использованных для его определения:
(3)
где Pk - реализация CDP для целевого КФ понятия t.
2. Построение визуального образа когнитивных фреймов
Формируемый визуальный образ должен обеспечить быструю и правильную с точки зрения разработчика онтологии интерпретацию его смысла
45
пользователем. Именно это является главным показателем когнитивных свойств полученного образа.
Предполагается, что созданию «хорошей» визуализации способствует учет принципов организации восприятия, сформулированных сторонниками Гештальт-психологии [5]. Базовая предпосылка этих принципов состоит в том, что при восприятии человеком объектов окружающего мира самопроизвольно происходит упорядочивание полученных чувственных ощущений с образованием в итоге целостной структуры - гештальта. Тем самым сознание навязывает ощущениям определенные организационные принципы. Таким образом, их учет при формировании визуальных образов КФ позволит предопределить неосознанное формирование пользователем гештальта, соответствующего смыслу паттерна. Поэтому пользователь будет затрачивать меньше ментальных усилий при последующем осознанном анализе визуализации, так как сформированный бессознательно гештальт будет наводить его на правильную интерпретацию ее смысла.
В пользу предлагаемого подхода к формированию говорят результаты, полученные в работах [11], посвященных оценке когнитивной органомичности онтологий. В них в частности отмечалось, что следование принципам гештальтпсихологии при разработке онтологий позволит облегчить их понимание людьми.
При формировании визуальных образов КФ учитывались следующие принципы восприятия:
1. Принцип близости (Principle of proximity). Элементы расположенные близко во времени или пространстве воспринимаются совместно.
2. Принцип непрерывности (Principle of common fate). Связывание наблюдаемых элементов в непрерывную последовательность или придание им определенной ориентации.
3. Принцип сходства (Principle of similarity). Восприятие похожих объектов в виде групп.
4. Принцип замыкания (Principle of closure). Стремление завершить или дополнить представленный «неполный» образ.
5. Принцип симметрии (Principle of symmetry). Симметричное расположение элементов в процессе формирования образа.
6. Принцип включения В. Келлера. Тенденция воспринимать только большую фигуру, а не ту меньшую, которую она включает.
Данные принципы лежат в основе формирования в сознании «хорошего гештальта» (Good gestalt) - наиболее простого, неизменного, симметричного образа наблюдаемых объектов. Если наблюдаемый объект будет обладать деталями, не вписывающимися в «хороший гештальт», то они могут быть восприняты человеком только при последующем детальном рассмотрении объекта. Таким образом, при визуализации КФ, построенных на основе паттернов, необходимо, чтобы компоненты паттернов «попали» в «хороший гештальт».
С точки зрения сложности построения визуализации можно разделить рассматриваемые нами CDP на следующие группы:
- Простые CDP. Данные паттерны состоят из пары понятий, связанных некоторым инвариантным по отношению к предметным областям отношением. Например, к таковым паттернам можно отнести: «Агент-роль» (Agent-Role),
46
«Выполнение задачи» (Task execution), «Последовательность» (Sequence) и другие.
- Составные CDP. К данной группе были отнесены разновидности паттерна «Ситуация» (Situation) и «Описание-ситуация» (Description and situation), а также более специфические паттерны, имеющие сложную структуру, такие как «Передача сообщения» (CommunicationEvent), «Обработка сообщения» (EventProcessing).
Основной целью визуализации простых паттернов является обеспечение восприятия их элементов в виде отдельной группы, в также представление смысла отношения между ними. При этом важно исключить использование текстового наименования отношения. Это обусловлено тем, что данные CDP часто выступают в комбинациях с другими паттернами, поэтому необходимо делать их визуализации компактными. Исходя из этого, основными гештальтпринципами при формировании образа для них являются принципы близости и включения.
Далее при рассмотрении примеров визуализации паттернов будем использовать следующие обозначения:
VC(c) - визуальный образ понятия c;
VR(<c,n>) - визуальный образ отношения между понятиями с и n;
LC(VC(c), VC(n)) - визуальный образ, полученный в результате применения принципа сближения к образам для понятий с и п;
LS(VC(c), VC(n)) - визуальный образ, полученный в результате применения принципа симметрии к образам для понятий с и n;
LF(VC(c), VC(n)) - визуальный образ, полученный в результате применения принципа непрерывности к образам для понятий с и n;
LI(VC(c), VC(n)) - визуальный образ, полученный в результате применения принципа включения образа понятия c в образ понятия n;
LE(VC(c), C(n)) - визуальный образ, полученный в результате применения принципа сходства к образам для понятий с и n;
VP(P) - визуальный образ реализации паттерна P.
В качестве примера визуализации для простого CDP, рассмотрим визуальный образ для реализации паттерна «Agent-Role»:
Pag = «а, г», (4)
VP{PAG) = Ш ( VC(al VC (г) )}, (5)
где PAG - реализация паттерна «Агент-Роль», a - понятие-агент, r - понятие-роль, <a,r> - отношение «играет-роль».
Пример рассмотренного образа представлен на рис. 1.
DHCP-server
role
-k
• Executed program № process agent
Рис.1. Пример визуального образа для реализации паттерна
«Агент-Роль»
47
В данном случае был использован принцип включения - визуальный образ понятия-роли «поглощает» образ понятия-агента. Это позволяет подчеркнуть смысл данного паттерна, который предлагает рассматривать некоторого агента, как действующего в контексте некоторой роли.
Заметим, что в образе отсутствует представление отношения. В данном случае оно неявно следует из наличия в названиях понятий наименований суперклассов - «Role» и «Agent». Это, в свою очередь, является реализацией одного из шаблонов представления онтологий (Presentation ODP), предписывающего использовать в наименованиях подклассов название супер-класса. Еще более предпочтительным приемом является использование пиктограммы, вместо названия суперкласса. В данном случае она будет служить когнитивной графической метафорой [12], позволяющей пользователю быстро понять вид понятия, а также преодолеть возможный языковой барьер. Однако при ее подборе следует позаботиться о том, чтобы пользователь верно интерпретировал ее.
Ситуационные паттерны представляют некоторые положения вещей в предметной области или представляют n-арные отношения между объектами. Таким образом, основное их отличие он простых паттернов состоит в том, что они включают более 2 понятий различных видов.
В рамках ситуационных паттернов понятие-ситуация связывается с понятиями-компонентами ситуации, имеющими в ней некоторое значение. Это выражается определением между ними и понятием-ситуацией разновидностей отношения «присутствует» (has-setting). Например, в ситуационном паттерне «BasicPlanExecution» между понятием-ситуацией «PlanExecution» и понятием-исполнителем действия, предусмотренного планом, определено отношение «включает-агента» «includesAgent».
При визуализации ситуационных паттернов важным является передать смысл каждого понятия-компонента для данной ситуации. При этом следует разделить образы понятий, представляющих различный смысл по разным группам. Для этого можно использовать принципы сходства, непрерывности, близости. В качестве иллюстрации рассмотрим пример визуализации реализации паттерна «N-арное участие» (N-ary participation). Данный паттерн позволяет отразить участие нескольких объектов в событии, происходящем в определенное время.
Формальная запись реализации данного паттерна и его визуализации выглядит следующим образом:
Рдгр = {{п, t), {п, е), {п, о), {(?!, е),... {о„, е)}, (6)
№ЯР) = {1П VC(e), VC(t)), LC( КС(е), VC(f)). (7)
LC( PC(01),...PC(O), LF( VR«0l,e», ...Рй({оп,е}))},
где PNP - реализация паттерна «N-арное участие», n - понятие-ситуация, t - понятие-временной интервал, e - понятие-событие, o1,...,on - понятия-
участники события, <n,t>,<n,e>,<n,o> - отношение между понятием-ситуацией и ее компонентами, <o1,e>,...,<on,e> - отношения «участвует в» (participant-in) между понятием-участником и понятием-событием.
48
Возможная визуализация представлена на рис. (рис. 2).
Рис. 2. Пример визуального образа для реализации паттерна «N-арное участие»
В данной визуализации отсутствует образ для самого понятия-ситуации, которое необходимо лишь при представлении понятия в онтологии. Значение понятий для данной ситуации неявно следуют из расположения и видов их образов. Так, например, понятие «Событие» (Event) и соответствующее ему понятие «Временной интервал» имеют схожую форму и направление. В тоже время образы понятий-участников события имеют другую форму и «направлены» перпендикулярно образу понятия-события, поэтому образуют свою группу образов.
Паттерн «Описание-ситуация» (Description-situation) используется для концептуализации некоторой ситуации с помощью иной понятийной системы. Например, некоторое действие, произведенное кем-либо, может описываться (концептуализироваться) в законе как преступление. Понятия-компоненты описания связываются с соответствующими им понятиями-компонентами ситуации посредством разновидностей отношения «классифицирует» (classifies). Конкретный тип отношения зависит от соединяемых им понятий. Например, между понятием-ролью и понятием-агентом определяется отношение «играется» (played-by), а между понятием-параметром и понятием-значением -отношение «оценивается» (valued-by). Если все понятия-компоненты ситуации были «классифицированы» понятиями-компонентами описания, то ситуация удовлетворяет описанию, что выражается определением отношения «удовлетворяет» (satisfies) между ними.
Основной целью визуализации реализации паттерна «Описание-ситуация» является передача смысла понятий-компонентов ситуации в контексте понятия-описания. Для этого целесообразно применять принцип подобия и включения для представления соответствия компонентов ситуации и описания. Рассмотрим формальное определение реализации паттерна «Описание-ситуация» и ее визуального образа:
PDS = ...(S, Оп}}, (8)
FPCPD5) = {L/(FC(0l), FC{q)).U(VC(oJ, FCfc)),
Щ1ВД..-ВД), (9)
VRiM).....VRfcoJ), ВДС!».....ВДл)) l
где PDS - реализация паттерна «Описание-ситуация», d - понятие-описание, s - понятие-ситуация, c1,..,cn- понятия-компоненты описания, o1,..,om - понятия-компоненты ситуации, <d,s> - отношение «удовлетворяет» (satisfies),
49
<d,c1>,..,<d,cn> - отношение между понятием-описанием и его понятиями-компонентами, <s,o1>,..,<s,om> - отношения между понятием-ситуацией и его компонентами, <cI,oI>,..,<cn,om> - отношения «классифицирует» (classifies) между понятиями-компонентами описания и соответствующими им понятиями-компонентами ситуации. Возможная реализация рассмотренного образа представлена на рис. 3.
Рис. 3. Пример визуального образа для реализации паттерна «Description-situation »
В данной визуализации образы понятий-компонентов описания «поглощают» образы понятий-компонентов ситуации. Это передает смысл паттерна, заключающегося в переопределении понятий-компонентов ситуации.
Визуализация специфических паттернов ввиду их меньшей распространенности на данном этапе исследования не рассматривалась.
В результате визуальный образ КФ будет состоять из комбинации визуальных образов, сформированных для реализаций паттернов, присутствующих в содержании:
VS = (ТР(Р;)}, (10)
где Pi - реализация CDP.
Пример визуального образа КФ для понятия «Network routing task» из разрабатываемой авторами прикладной онтологии сетевых устройств представлен на рис. 4.
Рис. 4. Визуальный образ КФ для понятия «Network routing task»
Данный образ включает комбинированную визуализацию 3-х паттернов «Выполнение задачи» (Task execution), «Последовательность» (Sequence), «Участие в событии» (Participation).
50
Программная реализация технологии визуализации
В рамках разработки программной реализации технологии визуализации было создано множество графических объектов, используемых для формирования визуального образа (рис. 5).
Рис. 5. Иерархия графических объектов для формирования визуализаций онтологических паттернов
Иерархия графических объектов (рис. 5) включает графические элементы (GE). Формальное определение графического элемента можно записать следующим образом:
GE=<{A}>, С11)
где (Л) - это множество атрибутов для элемента. Атрибуты используются при формировании в визуализации. Атрибуты могут быть такие как: цвет, размер текста и т.д. Примером графических элементов являются элементы («Стрела», «Ярлык», и др.). Для группировки этих графических объектов используются контейнеры. Контейнер определяет расположение объектов с помощью менеджера компоновки (L). Формально определение контейнера записывается следующим образом:
GO =< {GO},L >, (12)
где {GO} - это множество графических объектов, a L — менеджер компоновки.
Менеджер компоновки задает правила, по которым располагаются визуальные объекты в контейнере. Правила могут, например, располагать все визуальные объекты горизонтально по мере их добавления в контейнер или располагаться их поочередно сверху, снизу, справа, слева или в центре.
51
Контейнер может содержать в себе другие контейнеры с другими менеджерами компоновки. Это позволяет создавать визуальные комбинации различной сложности.
Программная реализация была выполнена на языке программирования Java c использованием в качестве графической библиотеки Piccolo2D. На рис. 6 представлен пример реализации визуализации когнитивного фрейма для понятия «Задача сетевой маршрутизации» (Network routing task), рассмотренного ранее.
Рис. 6. Пример визуализации паттернов онтологии
Заключение
В данной статье мы рассмотрели вопрос генерации CF на основе CDP и его визуального представления с учетом гештальт-принципов. Использование CDP для формирования содержимого CF гарантирует целостность и полноту полученной на его основе визуализации. Учет гештальт-принципов организации восприятия человека при формировании образа КФ предоставляет возможность быстрой и правильной интерпретации смысла пользователем.
Рассмотренный подход к визуализации онтологии обеспечивает более эффективное решение задачи передачи содержащихся в ней знаний пользователю по сравнению с простой визуализацией понятийной системы в виде графовой структуры. В свою очередь широкое использования ODP при разработке прикладных онтологий делает возможным его применения для визуализации во многих случаях.
Литература
1. Lomov, P.A. Technology of Ontology Visualization Based on Cognitive Frames for Graphical User Interface / P.A. Lomov, M.G. Shishaev // In Proceedings of KESW-2013, Communications in Computer and Information Science, vol. 394. - Springer, 2013. -Р.54-68. -ISBN 978-3-642-41359-9.
52
2. Acker, L., Porter, B. Extracting viewpoints from knowledge bases /L. Acker, B. Porter // In Proceedings of the 12th National Conference on Artificial Intelligence. -1994. -Р.547-552.
3. Ломов, П.А. Подход к визуализации онтологий на основе когнитивных фреймов / П.А. Ломов, М.Г. Шишаев // Информационные системы и тех -нологии. - №6 (86). -2014. - С.21-30. -ISSN 2072-8964.
4. Ломов, П.А. Визуализация с помощью когнитивных фреймов для передачи знаний / П.А. Ломов, Е.Ю. Данилов // Информационные системы и технологии. - 2015. - № 3 (89). - С. 10-18. -ISSN 2072-8964.
5. Kohler, W. Gestalt Psychology. An Introduction to New Concepts in the Modern Psychology /W. Kohler // Liveright Publishing Corporation. - Gestalt (Psychology). -1947. - 367p.
6. Gangemi, A. Ontology Design Patterns for Semantic Web Content /А. Gangemi // Proceedings of the Fourth International Semantic Web Conference, Galway, Ireland, Springer. - 2005. -P.262-276.
7. Gangemi, A. Ontology design for interaction in a reasonable enterprise / А. Gangemi, V. Presutti // Handbook of Ontologies for Business Interaction, IGI Global, Hershey, PA. - November, 2007. -452p.
8. Ontology design patterns portal. - Режим доступа: http: //www. ontologydesignpatterns. org
9. Khan, M. Ontology Design Pattern Detection - Initial Method and Usage
Scenarios / M. Khan, E. Blomqvist // In: Proceedings of the Fourth
International Conference on Advances in Semantic Processing (SEMAPRO 2010). XPS, ThinkMind Digital Library. - 2010. -Р.19-24.
10. Svab-Zamazal, O. Preliminary results of logical ontology pattern detection using SPARQL and lexical heuristics /О. Svab-Zamazal, F. Scharffe, V. Svatek //Proc. 1st ISWC 2009 workshop on Ontology pattern (WOP). - 2009. -Р.139-146.
11. Гаврилова, Т.А. Оценка когнитивной эргономичности онтологии на основе анализа графа / Т.А. Гаврилова, В.А. Горовой, Е.С. Болотникова // Искусственный интеллект и принятие решений. -2009. - №3. -С.33-41.
12. Валькман, Ж.Р. Когнитивные графические метафоры / Ж.Р. Валькман // Труды международной конференции «Знания-Диалог-Решение» (ЗДР-95). -Ялта. -1995. -С.261-272.
Сведения об авторах
Ломов Павел Андреевич - к.т.н, научный сотрудник,
е-mail: [email protected]
Pavel A. Lomov - Ph.D., research associate
Данилов Евгений Юрьевич - программист,
e-mail: daniloveugene @yandex. ru
Evgeniy Yu. Danilov - programmer
53