Научная статья на тему 'Концептуальная спецификация некоторых задач информатики'

Концептуальная спецификация некоторых задач информатики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
213
46
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Уралев Г. В.

В настоящей статье под задачей информатики понимается такая задача, решение которой достигается с помощью программ, использующих экспертное знание. Важным этапом в разработке таких программ является концептуальная спецификация структуры этого знания, в частности, знания предметной области и методов решения задачи. Концептуальная спецификация состоит в идентификации соответствующих понятий предметной области, связей между ними, схем, правил, процедур и т.п. Обычно формальная концептуальная спецификация выполняется с помощью подходящих концептуальных (понятийно-ориентированных) языков. Рассматривается система концептуальных языков БМЗ «Бинарная Модель Знаний». Показана возможность применения БМЗ к двум задачам: 1) проектирование потоков работ с учетом динамики требований и целей. Точнее, БМЗ может применяться в качестве инструмента для создания онтологий, которые могут быть использованы для моделирования поведения системы потока работ. Такие онтологии могут быть использованы при разработке семантических веб-сервисов для бизнеспроцессов; 2) создание медицинской онтологии, используемой для диагноза вирусных гепатитов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Уралев Г. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Conceptual specifying of some informatics problems

Under a problem of informatics we understand the task which can be solved by computer programs using expert knowledge. The important stage in development of such programs is conceptual specification of structure of the knowledge, in particular, knowledge of problem domain and methods of solving. Conceptual specification consists in identifying adequate problem domain concepts and relations among them, schemas, rules, procedures et al. Usually, formal conceptual specification is realized by means of suitable conceptual languages (concept-oriented languages). The system BKM Binary Knowledge Model is considered. It is shown of possibility of applying BKM to two problems: 1) design of workflows with dynamics of requirements and goals; 2) creating of medical ontology for diagnosis of viral hepatitis.

Текст научной работы на тему «Концептуальная спецификация некоторых задач информатики»

ранговой степени R(tk>c) для каждого из выбранных термов является предметом

отдельного исследования и будет освещен автором в отдельной работе.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Блюмин С.Л., Шуйкова КА., Сараев П.В., Черпаков КВ. Нечеткая логика: алгебраические основы и приложения: Монография. - Липецк: ЛЭГИ, 2002. - 113 с.

2. Ха Т.Ч., Юрчук СМ. Создание текстовой выборки на основе электронного архива данных лаборатории ELDIC для исследования задач автоматической обработки текстов на естественном языке // Труды Всероссийской научной школы-семинар молодых ученых, аспирантов и студентов Таганрог: "Интеллектуализация информационного поиска, скантехнологии и электронные библиотеки". - Таганрог: Изд-во ТТИ ЮФУ, 2008. - С. 82-86.

3. Igor Kuralenok, Vladimir Dobrynin, Igor Nekrestyanov, Mikhail Bessonov, and Ahmed Patel. Distributed search in topic-oriented document collections. In Proc. of World Multiconference on Systematics, Cybernetics and Informatics (SCI'99), volume 4, pp. 377-383, Orlando, Florida, USA, August 1999.

4. Dumais S.T., Platt J., Heckerman D., SahamiM. Inductive learning algorithms and representations for text categorization. In Proceedings of CIKM-98, 7th ACM International Conference on Information and Knowledge Management (Bethesda, MD, 1998), 148-155.

5. Haris Z. Mathematical Structures of Language. Interscience Publishers John Wiley & Sons, New York. - 1968, 80. - 230 p.

6. McCallum A., Nigam K. A Comparison of Event Models for Naive Bayes Text Classification. In AAAI/ICML-98 Workshop on Learning for Text Categorization, 1998. p. 41-48.

7. Sebastiani F. Machine Learning in Automated Text Categorization. ACM Computing Surveys, 34(1): 1-47, 2002.

УДК 517.714.3

Г.В. Уралев

КОНЦЕПТУАЛЬНАЯ СПЕЦИФИКАЦИЯ НЕКОТОРЫХ ЗАДАЧ ИНФОРМАТИКИ*

Введение. Здесь под задачей информатики мы понимаем задачу, решение которой достигается с помощью программ, использующих экспертное знание. Важным этапом в разработке таких программ является концептуальная спецификация структуры этого знания, в частности, знания предметной области и методов решения задачи. Концептуальная спецификация состоит в идентификации соответствующих понятий предметной области, связей между ними, схем, правил, процедур и т.п.

Часто концептуальная спецификация выполняется на неформальном уровне. Но тенденция такова, что все чаще используются формальные языки для концепту,

приложений, допускающие формальную интерпретацию и, следовательно, машин.

моделированием [1]. Формализмы концептуальной спецификации называются концептуальными языками или языками концептуального моделирования [2]).

Одним из важных требований, предъявляемых к концептуальным языкам, является их когнитивная адекватность, т.е. близость их конструкций к тем, какие ис, .

*

Работа выполнена при финансовой поддержке РФФИ (грант № 08-01-00465). 144

концептуализация выполняется с использованием понятий, то концептуальные языки должны быть понятийно-ориентированными. В частности, «нормальный» концептуальный язык для спецификации структуры понятий должен содержать основные конструкторы понятий (агрегацию, таксономию, конкретизацию, обоб-

. .)

Формальное описание предметной области, выполненное в концептуальном

, . -же онтологиями.

В работах ПС. Плесневича была предложена система концептуальных языков, названная «Бинарная Модель Знаний» (БМЗ) [4, 5]. С помощью предложений этих языков можно определять формальные понятия моделируемой предметной области, которые могут быть двух типов - классы и бипарные связи. В БМЗ имеются следующие языки:

♦ Язык структурной спецификации (ЯСС). С помощью предложений этого языка определяется атрибутная структура объектов - элементов универсума формального понятия, а также определяется таксономия понятий.

♦ Язык для определения таксономической структуры понятий (ЯТС). С помощью предложений этого языка определяется иерархическая сеть понятий и указываются дефолты для атрибутов.

♦ ( ), , -ленной из предложений языков ЯСС и ЯТС.

♦ ( ). -ка можно вводить в базу фактов новые факты, исключать факты и моди.

♦ ( ). -го языка определяются абстрактные типы данных, которые могут служить значениями атрибутов понятий.

♦ ( ).

языка определяются логические связи между понятиями.

♦ ( ).

языка определяется модальные связи между понятиями.

♦ ( ). -го языка специфицируются понятия, содержащие неявно атрибуты, значениями которых служат моменты или интервалы времени, и определяющие темпоральные отношения между такими атрибутами.

Приведем примеры предложений из языков системы БМЗ.

Примеры.

1) :

Преподаватель[ФИО: String, Должн: String, Зарплата: Integer, Работает_на: Кафедра]

% Преподаватель имеет фамилию имя и отчество (представляется строчкой символов), занимает некоторую должность (представляется строчкой символов), работает на некоторой кафедре. Вообще, предложение ЯСС, специфицирующее универсум класса имеет вид <имя понятия> [список атрибутных пар]%.

Студент[ФИО: String, Группа: String, Руководитель: Преподаватель], (Студент СдалЭкзамен Предмет)[ВремяСдачи: Date,04eHKa: Integer,

Принял: Препод].

% -

лучил некоторую оценку, причем экзамен принял некоторый преподаватель. Во, , ,

(< > < > < > [< >] %

[ : String, : ],

Предмет[Н^вание: String].

2) Предложения ЯЗ:

?Х.ФИО - X СдалЭкзамен(Оценка = 5; Принял.(ФИО = ‘И.И. Иванов’; Должность = профессор) Предмет(Н^вание = матлогика).

% ( , ) 13-02,

отлично профессору ИЛ. Иванову экзамен по математической логике %.

?(Х.ФИО, LLIST Y.®HO) - X.Руководитель = Y; Y. Работает_на. На звание = ПМ.

%

список руководимых им студентов %

3) Предложения ЯЛ С:

EACH Препод.(Должность = профессор OR доцент; Работает_на. Название = ПМ ) Руководит SOME Студент; (X Руководит Y) IFF Y. Руководитель = X.

% -дит хотя бы одним студентом %

IF X IN Преподаватель.Должность = профессор) THEN X.Зарплата > 10000.

% Зарплата профессора больше 10000 рублей %

В ЯТС имеются предложения, относящиеся к интервальной логике Аллена [6]. Декларация события С выполняется предложением EVENT C. Базовые отношения между событиями C и D выражаются следующими предложениями: С BEFORE D (раньше), C MEETS D (встречает), C OVERLAPS D (перекрывает), C FINISHES D (заканчивает), С STARTS D (начинает), С DURING D (в течение), C EQUAL D ( ). i .

, C i-BEFORE D D BEFORE C.

Дизъюнкция предложений с одинаковыми парами событий обозначается так, как обозначается конечное множество. Например, дизъюнкция трех предложений С BEFORE D, C i-MEETS D и C EQUAL D обозначается так: С {BEFORE, i-MEETS, EQUAL} D.

В настоящей работе мы показываем возможность применения БМЗ к двум задачам:

[7]. , -

, -

ведения системы потока работ. Такие онтологии могут быть использованы при разработке семантических веб-сервисов для бизнес-процессов;

♦ создание медицинской онтологии, используемой для диагноза вирусных .

Онтологии для потока работ. На самом верхнем уровне поток работ представляется ориентированным графом, вершинами которого являются задачи (или , ), . уровень специфицируется следующими двумя структурными предложениями: ПотокРабот[Задачи: Задача(*), НачальнаяЗадача: Задача,

КонечнаяЗадача:Задача], (1)

( _ (*)). (2)

(1)

данном потоке работ, которая должна исполняться первой. Класс Задача может иметь ряд атрибутов, определяемых условиями моделируемой предметной области. Например, может быть включен атрибут, определяющий длительность выполнения задачи, атрибут, указывающий ее директивные сроки, дедлайн и т.п. Дан-

ная задача может в дальнейшем уточняться в терминах ее подзадач, совокупность которых составляет свой поток данных. Это обстоятельство можно формально представить структурным предложением:

Задача[Уточнение: ПотокЗадач].

Бинарная связь Связь_с имеет атрибут ТипСвязи, значениями которого, например, могут быть управляющая, синхронизующая, ресурсная и т.п. Значения атрибута ТипСвязи определяют соответствующие понятия. Например, понятие УправляющаяСвязь специфицируется с помощью предложения:

= _ ( = ).

Это понятие имеет атрибут Паттерн, значениями которого служат следование, параллельное_расщепление, исключающий_выбор, простое_слияние и др.

Рассмотрим следующий типичный сценарий, возникающий при концептуальном моделировании веб-сервиса для организации, обслуживающей покупателей. Запросы покупателей принимаются веб-сервисом, который обрабатывает их с помощью подходящих софт-агентов. Софт-агенты имитируют работу экспертов в , - . Этот план включает тесты и другие действия по обработке запросов. Затем план , .

,

(обозначаемый именем класса План), содержащий 5 диагностических тестов: Тест1, Тест2, Тест3, Тест4 и Тест5. Имена Тест) мы рассматриваем как имена классов, каждый из которых может иметь свои атрибуты. Более того, естественно считать их именами событий. Поэтому в онтологию мы записываем предложения:

Event(TeCT), Tecij ISA Тест (j = 1,2,3,4,5). Кроме того, класс План включает атрибуты Входной_запрос и Компиляция_плана и компоненту Ситуация доступа. Структуру класса План специфицируем при помощи предложения

План[Входной_запрос: Запрос, Ситуация доступа,

_ : ].

Атрибут Компиляция_плана является вычислимым, т.е. представляется в языке ЯСТД для спецификации абстрактных типов данных. С другой стороны, этот атрибут мы рассматриваем как событие, т.е. как класс, с которым ассоциирован . , _ -ция доступа рассматриваются как события.

Между событиями в сценарии существуют бинарные связи, выражаемые отношениями алгебры Аллена. Предположим, что эти связи (в обозначениях Аллена) указаны в следующем графе отношений между событиями (рис. 1).

В языке БМЗ темпоральных отношений мы записываем отношения между этими событиями с помощью следующих предложений:

(Входной_запрос {BEFORE, MEET, OVERL} Ситуация_доступа), (Си^ация_доступа {BEFORE, MEET, OVERL} Тест1),

( _ {BEFORE, MEET, OVERL} 4),

(Тест 1 {BEFORE, MEET, OVERL, i-DURING, i-FINISH*} Тест2),

(Тест2 {BEFORE, MEET} Тест3), (Тест2 {BEFORE} Компиля-

_ ),

( 3 {BEFORE, MEET} _ ),

(Компиляция_плана {BEFORE, MEET} Тест5 ),(Тест4 {START, MEET} 5).

{Ь, 111} {Ь, 111}

Рис. 1. Граф отношений между событиями

Онтологии медицинского знания. Мы покажем, как БМЗ можно использовать для построения медицинских онтологий, взяв пример, связанный с задачей диагноза гепатита В, на основе выявления антигенов и антител [8].

Для диагноза гепатитов выполняются серологические исследования, при которых могут быть обнаружены антитела к вирусам гепатита. Первая фаза после заражения вирусом гепатита В - инкубационный период. К концу инкубационного периода обнаруживается определенные антитела, которые указывают на начало острой фазы заболевания. Затем наступает период выздоровления, при котором происходит сероконверсия антигенов вируса гепатита в антитела. Последний - ,

. .

, , -явлением и исчезновением определенных антигенов и антител. Имеется 4 основных курса, анализ которых показывает, что (1) количественная темпоральная информация (дайны временных интервалов событий) представляется средними значениями, тогда как, ндивидуальные значения могут варьировать от случая к случаю. Но качественная темпоральная информация (например, что данное антитело появляется в курсе раньше другого) является устойчивой; (2) все курсы выглядят одинаково с точки зрения серологических данных; они различаются порядком их появления. Это подсказывает, что в формальную модель (онтологию) для представления медицинского знания о течении болезней, следует включать темпоральные отношения.

Введем события Инкубация, Остры й_период, Выздоровление, Иммунизация, представляющие фазы течения болезни. Тогда эти события представляются следующими предложениями: еует(Инкубация), еуеп1(Острый_период),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

еуеШ:(Выздоровление), еуеП:(Иммунизация). Гепатит В возникает при инфицировании вирусом ИБУ. Следующие предложения представляют некоторое общее , :

Г епатит = Внутренняя_болезнь(Место_поршсение = Печень) Вирусный_гепатит = Гепатит(Этиолог ия.Фактор = Вирус), Вирус[Тип:81п^, Антигены: Антиген(*)],

(Антиген Сероконверсия Антитело),

Гепатит_В = Вирусный_гепатит(Вирус.Тип = 'ИБУ').

При рутинном серологическом исследовании на диагноз гепатита В проводится тесты на:

♦ поверхностный антиген HBsAg и антитело к нему апй-НВБ;

♦ оболочный антиген HBeAg и антитело к нему апй-НВе;

♦ антитела апй-ИБе и апй-ИБе к ядерному антигену НВс.

Обозначим через C<HBsAg> соб ытие, во время которого существует антиген при тесте на антиген HBsAg. Подобные обозначения сделаем для событий, определяемых другими антигенами и антителами. Декларируя все эти события в онтологии, записываем следующие предложения: event(C<HBsAg>), event(C<anti-HBs>),

event(C<HBeAg>), event(C<anti-HBe>), event(C<Ign_anti-HBc), event(C<anti-HBc>). Введем классы, означающие обнаружение антигена и антитела: ОбнаружАнтитигена = C<anti-HBs> | C<anti-HBe | C<anti-HBc) |

C<Ign_anti-Hвc,

ОбнаружАнтитела = C<HBsAg> | C<HBs> | C<HBeAg>

Г епатит В имеет четыре основных типа течения.

Инкубация Острый_период Выздоровление Иммунизация

Инкубация Острый_период Выздоровление Иммунизация

Инкубация Острый_период Выздоровление Иммунизация С<НВзАд> С<апИ-НВз>

С<НВеАд> С<агШ-НВе>

С<апИ-НВс>

С<1дт_апй-НВс>

Инкубация Острый_период Выздоровление Иммунизация С<НВэАд> С^ап^-НВэ*

С<НВеАд> С<апй-НВе>

С<апй-НВс>

С<1дт_апА-НВс>

Инкубация Острый_период Выздоровление Иммунизация

ОНВэАд* С<апІі-НВз>

С<НВеАд> Оапй-НВе*

С<апй-НВс>

С<Ідт_ап1і-НВс>

Инкубация Острый_период Выздоровление Иммунизация С<НВзАд> С<апІі-НВз>

С<НВеАд> С<апй-НВе>

С<апй-НВс>

С<Ідт_ап1і-НВс=

Информацию о типе 1 течения гепатита В можно представить в онтологии следующими предложениями:

(Инкубация meets Острый_период), (Инкубация overlaps C<HBsAg>), (Инкубация meets C<anti-HBc>), (Инкубация meets C<Igm_anti-HBc), (Остры й_период meets Выздоровление),

(Остры й_период starts C<anti-HBc>),

(Остры й_период starts C<Igm_anti-HBc>),

(Остры й_период i-overlaps C<HBeAg>), (Иммунизация overlaps C<anti-HBs>),

(Иммунизация during C<anti-HBe>),

(Иммунизация during C<anti-HBc>),

(Иммунизация i-overlaps C<Igm_anti-HBc>),

(Выздоровление meets Иммунизация),

(Выздоровление i-overlaps C<HBsAg>), (C<HBeAg> meets C<anti-HBe>), Замечание 1. Так как в диаграмму интервалов для типа 1 входят 10 событий, то имеется 102 = 100 предложений, выражающих базовые темпоральные отношения между этими событиями. Однако вышеуказанные 14 предложений составляют минимальное множество предложений, из которых остальные 86 предложений являются логическими следствиями этих 14 предложений.

Аналогичные минимальные системы предложений можно указать для типов 2, 3 и 4. Из минимальных систем предложений для указанных четырех типов течений гепатита В можно получить обобщенный тип течения болезни. Этот тип представляется следующими предложениями:

(Инкубация meets Острый_период), Инкубация overlaps C<HBsAg>), (Инкубация meets C<anti-HBc>), (Инкубация meets C<Igm_anti-HBc) (Остры й_период meets Выздоровление),

Острый_период starts C<anti-HBc>),

(Остры й_период starts C<Igm_anti-HBc>),

(Остры й_период i-overlaps, C<HBeAg>),

(Иммунизация {overlaps, starts, i-overlaps} C<anti-HBs>), (Иммунизация {during, i-overlaps} C<anti-HBe>),

Иммунизация {during, i-before} C<anti-HBc>),

(Иммунизация {i-overlaps, i-meets, i-before} C<Igm_anti-HBc>),

( meets ),

(Выздоровление {i-overlaps, i-before} C<HBsAg>).

Замечание 2. Интерпретатор БМЗ содержит компоненту, выполняющую обобщение темпоральных предложений.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Advances in Conceptual Modeling. Challenges and Opportunities (ER 2008 workshops, Barcelona, Spain, October 2008). - LNCS, vol. 5232, 2008. - 458 p.

2. Allen J.F. Maintaining knowledge about temporal intervals. Communications of the ACM. - v. 26, no. 11. 1983.

3. http://ksi.cpsc.ucalgary.ca/KAW/KAW98/menzies/.

4. G.S. Plesniewicz. Binary Data and Knowledge Model. Knowledge-based Software Engineering (Proc. of the 6th JCBSE). - IOS, 2004. - pp. 237-244.

5. . . // . 3- -

ции «Интегрированные модели и мягкие вычисления в искусственном интеллекте» (Коломна, май 2005 г.). - М.: Физматлит, 2005. - С. 88-93.

6. . . . // -

конференций «Интеллектуальные системы», «Интеллектуальные САПР» (AIS’08, CAD-2008). - М.: Физматлит, 2008. - С. 135-14.

7. P. Lawrence (ed.) Workflow Handbook: 1997, Workflow Management. -. John Wiley and Sons, N.Y., 1997. - 561 p.

8. K.-P. Adlassnig, Horak W. Development and retrospective evaluation of HEPAXPERT-1: a routinely-used expert system for interpretive analysis of hepatitis A and B serological findings. Artificial Intelligence in Medicine, 1995, v. 7, pp. 1-24.

i Надоели баннеры? Вы всегда можете отключить рекламу.