УДК 519.71
В.В. КРАСНОПРОШИН, д-р техн. наук, проф., зав. каф. МО
АСУ БГУ (г. Минск),
О.Л. КОНОВАЛОВ, с.н.с. каф. МО АСУ БГУ (г. Минск),
А.Н. ВАЛЬВАЧЕВ, с.н.с. каф. МО АСУ БГУ (г. Минск)
ТЕХНОЛОГИЯ ПОСТРОЕНИЯ БАЗ ЗНАНИЙ НА ОСНОВЕ
РАСПРЕДЕЛЕННЫХ КОГНИТИВНЫХ РЕСУРСОВ
Рассмотрена задача построения баз знаний на основе распределенных когнитивных ресурсов для систем поддержки принятия решений. Выделены подзадачи: создание виртуальной организации для доступа к ресурсам, построение модели знаний, обогащение модели за счет знаний ресурсов и формирование базы знаний. Предложено решение на основе синтеза элементов теории организации и многоагентного подхода. Ил.: 2. Библиогр.: 8 назв.
Ключевые слова: базы знаний, распределенные когнитивные ресурсы, системы поддержки принятия решений, виртуальная организация.
Постановка проблемы. Глобализация поставила перед человеческим сообществом ряд новых экономических, социальных, медицинских, экологических и других проблем [1]. Для их оперативного и качественного решения необходимы инновационные знания, которые, как правило, распределены по научным центрам, расположенным в разных странах мира [2]. Источниками знаний могут быть эксперты, инженеры, технологи и другие лица, которых определим как распределенные когнитивные ресурсы (РКР). Инновационные знания (далее - знания) будем рассматривать как структурированную и формализованную информацию, необходимую и достаточную для решения задачи и обладающую свойствами актуальности, точности и полноты. В постиндустриальном мире знания, особенно технологические, имеют ряд специфических свойств: распределенность, короткий жизненный цикл, комплексное (теоретическое + технологическое) применение [2, 3].
В компьютерных системах знания формализуются согласно некоторой модели (логической, продукционной, фреймовой, семантической и др.), хранятся в базах знаний (БЗ) и применяются в процессах принятия решений.
Построение БЗ включает три этапа: приобретение знаний, их
формализация и программирование БЗ. Традиционно их реализация считается долговременным и дорогостоящим процессом, что противоречит указанным выше свойствам знаний, является причиной применения устаревших знаний и слабого распространения систем, основанных на знаниях [4].
Новые глобальные угрозы, в частности, экологические (например, загрязнение Мексиканского залива), привели к необходимости разработки новых методов и структур знаний, позволяющих формировать и оперативно применять БЗ для решения возникающих проблем в кратчайший срок на основе инноваций РКР независимо от места их расположения [1]. Эта задача
достаточно трудна, многогранна и недостаточно исследована, т.к. понимание масштаба изменений среды и необходимости быстрого принятия адекватных решений пришло сравнительно недавно. В данной работе рассматривается один из подходов к ее решению на основе фреймовой модели для конкретной структуры знаний и соответствующего класса практических задач.
Анализ литературы. Методы получения и использования знаний исследуются в рамках следующих основных направлений: 1) построение моделей организаций, обеспечивающих доступ к знаниям [1, 3]; 2) разработка методов представления и приобретения знаний [2]; 3) создание коммуникаций для обмена информацией в разнородных средах [5]; 4) разработка компьютерных систем моделирования, получения и тиражирования знаний [4, 6]. По каждому из них получен широкий спектр результатов.
В литературе организация рассматривается как активная система [3], как интеллектуальная организация [2], как иерархия [6]. Однако предложенные модели в целом ориентированы на многошаговые игровые методы Гермейера-Моисеева, что затрудняет их применение для организации оперативного одношагового диалога, характерного для РКР.
Методы приобретения знаний [2] в основном используют прямой диалог "аналитик-эксперт", что практически исключено для удаленных источников, характерных для РКР.
Коммуникационные схемы обмена информацией (COM, WEB) предложены для инфраструктур с различными свойствами [5], их основным недостатком является слабая защита от несанкционированного доступа, что подтверждает большое количество результативных атак на сайты крупнейших правительственных организаций США и Европы.
Цель статьи - разработка организационной, информационной, коммуникационной и программной основы для построения комплексной технологии построения БЗ, инвариантной количеству РКР.
Постановка задачи. Пусть имеется центр Center, задача S, декомпозированная на подзадачи S1, S2,..., S и распределенные эксперты E = (E1, E2, ..., En} - обладающие знаниями D = (D1, D2, ..., Dn} для их решения. Требуется разработать технологию преобразования S в D, обеспечивающую инвариантность времени формирования БЗ количеству ресурсов [7, 8].
Комплексное решение общей задачи включает следующие подзадачи:
1) построение модели организации, включающей центр, РКР и глобальные коммуникации; 2) построение модели знаний mD; 3) разработку механизмов обогащения модели mD за счет знаний удаленных E; 4) формирование БЗ;
5) публикация БЗ в форме компьютерных систем различного направления.
Основные требования к решению: использование стандартных IBM-совместимых персональных компьютеров; OS Windows XP; прозрачность архитектуры; интуитивно понятный интерфейс.
Модель организации. В качестве основы для модели организации возьмем аппарат теории графов, так как он широко используется для моделирования иерархий, к которым относится структура любой организации.
Состав организации (Centr, E) несет идентификационную, функциональную и диалоговую нагрузку, что позволяет им совместно решать задачи и обмениваться информацией. Для отображения этих свойств в графе:
1) пометим вершины графа. В качестве метки возьмем номер (N), по которому будем выполнять локальную идентификацию вершин в графе;
2) каждому номеру вершины поставим в соответствие конечное множество объектов (атрибутов attr), обеспечивающих идентификацию вершины в глобальной среде и выполняющих некоторые другие функции;
3) каждое ребро пометим идентификатором посредника т, обеспечивающего информационное взаимодействие между вершинами.
В результате получим атрибутированное дерево.
Соответственно под моделью структуры ОС, будем понимать связное атрибутированное дерево G = (V, E), вершины которого отражают свойства акторов, а дуги - информационные потоки между ними в распределенной среде. В рамках данной модели знания представлены в атрибутах вершин.
Модель знаний. Модель БЗ будем строить с прагматической точки зрения, то есть как разнородную структурированную информацию, обеспечивающую комплексное решение задачи. За основу возьмем идею паттернов проектирования, предложенную Э. Гаммы, Д. Джонсона и др. [4]. Соответственно знания представим как комплекс структур, включающий: постановку задачи (S), теоретическое решение (dTheor), технологическое решение (dPrac) и инструкцию по применению (Manual) (рис. 1).
Рис. 1. Технологически-ориентированная модель БЗ
Параметры модели можно рассматривать как атрибуты узлов в модели организации, что создает основу для получения и интеграции знаний РКР в БЗ.
Обогащение модели БЗ. На основании модели БЗ можно однозначно выделить процессы ее обогащения:
1) формулирование в Center задачи Si;
2) выбор ресурса Ei;
3) отправка паттерна m к E, где M = (adrCEnter,adeE1, S1, dTheor1,dPrac1, Manual1), причем dTheor1,dPrac1, Manual1 = 0;
4) включение ресурсом E в паттерн знаний dTheor1, dPrac1, Manual1 ;
5) отправка обогащенного паттерна E1 в центр;
6) интеграция паттернов в единую БЗ.
Предложенный подход к построению БЗ носит универсальный характер и не накладывает ограничений на модели представления dTheor1, dPrac1, Manual1. Тем не менее, процессы 1 - 6 позволяют выделить элементы архитектуры компьютерной системы для автоматизации построения БЗ на основе РКР.
Архитектура системы. Основным свойством модели организации является ее распределенность. Для автоматизации решения распределенных задач предлагается использовать многоагентный подход, т.к. он позволяет совмещать преимущества WEB-подхода и средства защиты от несанкционированного доступа. На основании приведенных выше рассуждений можно выделить четыре агента: построения организации (ModOrg) и инициализации задачи (ModTask), построения и обогащения модели БЗ (Mrner), интеграции (Integrator) и публикации (PubHcator) БЗ. Архитектура системы, обеспечивающей их совместную деятельность, представлена на (рис. 2).
Такая архитектура в принципе позволяет подстраивать общую схему решения под различную семантику задач, различные модели знаний и агентов использования БЗ из других библиотек (через XML-шлюз). Практическая реализация архитектуры должна учитывать возможность быстрой модификации каждого их агентов за счет замены модулей извлечения знаний на более совершенные и использования разработанных ранее программных кодов, включая типовые диалоги для разных видов ресурсов.
\
□
Center
Агент
ModOrg
Агент
ModTask
Г s знт er1
Аге Min нт
Рис. 2. Архитектура системы построения и использования БЗ
Реализация архитектуры. Для автоматизации решения распределенных задач применяются две основные технологии: Java 2 Platform, Enterprise Edition (J2EE) от SUN и .Net от Microsoft. Предлагается использовать второй вариант, т.к. при прочих примерно равных возможностях .Net имеет возможность применения ранее созданных кодов на разных языках, включая C++, Visual Basic, Fortran и др., что важно при использовании различных методов приобретения знаний. На языке C# была разработана библиотека агентов, которые применяются для построения БЗ в различных компьютерных системах, включая системы оперативного управления.
В целом эффективность разработанной технологии обеспечивается существенным сокращением времени и средств на создание БЗ и формирование систем за счет автоматизации наиболее трудоемких процессов.
Выводы. В работе рассмотрена проблема построения технологии для оперативного построения БЗ на основе распределенных РКР.
Предложено комплексное решение, включающее:
- открытую модель распределенной организации, ориентированную на использование инновационных знаний РКР. В отличие от существующих моделей, она допускает параллельное получение знаний от удаленных ресурсов и быструю замену источников;
- структурную модель представления знаний, обеспечивающую, в отличие от традиционных моделей, технологически ориентированную парадигму моделирования и применения;
- многоагентную архитектуру системы, обеспечивающую параллельное получение знаний РКР для формирования БЗ и допускающую подключение внешних модулей для разностороннего использования БЗ;
- компьютерную систему, обеспечивающую комплексное решение задачи построения БЗ на основе РКР в рамках предложенных моделей.
Список литературы: 1. Глобализация и конкурентоспособность // Сборник статей. - СПб: Альпина Бизнес Бук, 2003. - 208 с. 2. Гаврилова Т. Базы знаний интеллектуальных систем / Т. Гаврилова, В. Хорошевский. - СПб: Питер, 2001. - 384 с. 3. Новиков Д.А. Теория управления активными системами / Д.А. Новиков. - М.: МПСИ, 2005. - 584 с. 4. Гамма Э. Приемы объектноориентированного проектирования. Паттерны проектирования / Э. Гамма, Р. Хемл, Д. Джонсон, Д. Влиссидес. - СПб.: Питер, 2001. - 368 с. 5. Василик М.А. Основы теории коммуникаций. - М.: Гордарики, 2003. - 616 с. 6. Wooldridge M. Multiagent Systems / M. Wooldridge. - 2002. - 340 p.
7. Краснопрошин В.В. Интеграция распределенных экспертных знаний: проблемы и решения / В.В.Краснопрошин, Г. Шаках, А.Н. Вальвачев // Информатика. - Минск, 2004. - № 1. - С. 45-53.
8. Кгasnoproshin V. Unstructured Knowledge Synthesis for Decision-Making Problems / V. Krasnoproshin, A. Valvachev, H. Vissia / Proc. of the 7-th International Conference, PRIP’2003. -Minsk, 2003. - Vol. 1. - P. 145-149.
УДК 519.71
Технологія побудови баз знань на основі розподілених когнітивних ресурсів / В.В. Краснопрошин, О.Л. Коновалов, А.Н. Вальвачов // Вісник НТУ "ХПІ". Тематичний випуск: Інформатика і моделювання. - Харків: НТУ "ХПІ". - 2010. - № 31. - С. 106 - 111.
Розглянуто завдання побудови баз знань на основі розподілених когнітивних ресурсів для систем підтримки прийняття рішень. Виділені підзадачі: створення віртуальної організації для
доступу до ресурсів, побудова моделі знань, збагачення моделі за рахунок знань ресурсів і формування бази знань. Запропоновано вирішення на основі синтезу елементів теорії організації і многоагентного підходу. Іл.: 2. Бібліогр.: 8 назв.
Ключові слова: бази знань, розподілені когнітивні ресурси, системи підтримки прийняття рішень, віртуальна організація.
UDC 519.71
Technology of building knowledge bases on distributed cognition resources / V.V. Krasnoproshin, O.L. Konovalov, A.N. Valvachev // Herald of the National Technical University "KhPI". Subject issue: Information Science and Modelling. - Kharkov: NTU "KhPI". - 2010. - №. 31. -P. 106 - 111.
The paper describes the use of distributed cognitive resources for constructing knowledge base. The proposed theoretical and technological basis is the use of the graph theory and multivalent approach. The agent’s library is successfully functioning at many management computer systems of the Republic of Belarus. Figs: 2. Refs: 8 titles.
Key words: knowledge base, distributed cognition resources, decision making, virtual organization.
Поступила в редакцию 20.05.2010