УДК 004.823.
МНОГОМЕРНАЯ МОДЕЛЬ ЗНАНИЙ
М. М. Макаров, научный сотрудник Тел. (495) 608 3168, e-mail: michaelmm@mail.ru ГОУ ВПО «Российский государственный университет инновационных технологий и предпринимательства» http://www.itbu.ru
This article is dedicated to the multidimensional frame structure conception for knowledge storing and «raw» data analysis. Some applications of m-dimensional data model within information analysis in compound subject branches are considered. Some samples for the application of the results of this scientific development are offered.
Статья посвящена рассмотрению концепции многомерной фреймовой структуры для хранения знаний и анализа «сырой» информации. Рассмотрены вопросы прикладного применения многомерной модели данных в контексте анализа информации в составных предметных областях. Предложены несколько примеров использования основных результатов данной работы.
Ключевые слова: Искусственный интеллект, модель знаний, фреймовая база знаний, слот, логика предикатов
Keywords: Artificial intelligence, knowledge model, frame knoledge base, frameslot, predicate logic
1. Введение
Одной из тенденций в последних достижениях науки и техники становится глубокая интеллектуализация управления и поведения систем. Часто условием перехода к следующему поколению разработок является широкое применение методик искусственного интеллекта, в связи с чем, в последние годы возобновились исследования в этой области «умных» вычислений. Наиболее актуальной проблемой является разработка хранилищ знаний со структурой, позволяющей не только вырабатывать решения, соответствующие той или иной ситуации, но и эффективно анализировать накопленные сведения о предметной области (ПО) [1].
2. Базы знаний на основе фреймовых структур
Фреймовая архитектура часто признается как одна из перспективных моделей баз знаний (БЗ) [2], позволяющая строить иерархические сети широкой предметной ориентации. Среди преимуществ такой модели можно выделить хорошую масштабируемость структуры и иерархичность организации знаний, что существенно упрощает поиск правил и позволяет неограниченно дополнять ПО новой информацией. Однако часто разработчики и исследователи сталкиваются с проблемой управления знаниями, когда размер фреймовой структуры начинает расти за счет активного накопления правил. В этом случае применение фрейма становится нецелесообразным из-за сложности поиска и реструктурирования представленных в нем знаний.
Для повышения эффективности управления фреймом БЗ значительного объема возможно введение условий применимости [1]. Их суть сводится к тому, что для каждого слота фрейма вводится некоторое формальное выражение, значение которого управляет доступом к содержимому данного поддерева фрейма. Для формализации этих выражений применяют различные исчисления, но наиболее часто применяются логические выражения, в частности предикаты порядка n [3]. Схема доступа к слотам некоторого фрейма S показана на рисунке 1.
Рис. 1. Пример схемы доступа к слотам фрейма S
Для каждого значения в слотах представленного на рисунке 1 фрейма £ введено условие применимости в виде предикатного выражения. Истинность/ложность этого условия определяется значениями исходных данных согласно постановке задачи. Решатель, получая доступ к слоту, может прочитать из него факт или правило, соответствующее заданному условию, и применить его для логического вывода, либо передать пользователю. Поскольку фрейм обладает иерархичностью, слоты верхних уровней (слот £1) содержат более общую информацию о предмете, на что указывает более короткое условие применимости - предикат х(^). Истинность х(^) означает, что применимы правила в слотах £1 и £14 и, при удовлетворении дополнительным условиям м>(^),г(^) и у(Л), правила в £12, £13 и £131.
Рассмотрим БЗ, состоящую из нескольких древовидных структур фрейма. В случае если описывается одна ПО, слоты соседних ветвей фрейма должны быть связаны между собой семантически. Однако введение дополнительных связей может усложнить логический вывод. Для устранения данной проблемы предлагается способ многомерного связывания слотов по предикатным критериям условий применимости. Суть его заключается в том, что цепочка слотов «¡¡Р,
s(3'> и (где т, к, I, к пробегают значения 1,п ) некоторого фрейма /1 е ^ находится в не-
которой области, принадлежащей одной сети подобия [4,7] тогда и только тогда, если каждое условие применимости сг, г = 1,п имеет в своем составе общие предикатные последовательности.
Исходя из определения, любую сеть подобия можно представить матрицей N, элементами которой являются индексы (номера) сетей:
N =
c1 C2 . .. Cn
fl Xll X12 . .. X1 n
f2 X 21 X21 . . X2n
fn Xn1 X n 2 . .. Xnn
(1)
Данный способ позволяет связать знания семантически без введения дополнительных изменений во фрейм. С его помощью можно существенно сократить время поиска знаний в БЗ большого объема, поскольку в качестве критерия используется лишь значение элемента матрицы (1). Кроме того, применение сетей подобия упрощает логический вывод за счет исключения из анализа слотов, не входящих в область сети подобия, а также позволяет сократить расход аппаратных ресурсов.
3. Многомерные сети подобия
Однако практика Data Mining [5] показывает, что анализ данных часто затрагивает несколько ПО, каждая из которых представлена отдельным фреймом знаний. Факты такой БЗ имеют отношение к разным сферам деятельности, однако существуют смежные факторы, влияющие на принятие решения в нескольких областях одновременно. Обозначим такое множество смежных факторов как C = C1 п C2 п... п Cz, где C1 - множество условий применимости фрейма j -ой ПО. Если множество C - пустое, то анализируемые ПО не являются смежными, т.е. нет ни одной предикатной последовательности в условиях применимости, которая присутствовала бы в нескольких фреймах. В другом случае, для непустого множества C’, определяется многомерная сеть подобия, представляющая собой объемную матрицу, с общим числом измерений n > 2. Каждое измерение матрицы является сетью подобия вида (1), представляющая собой набор условий применимости для каждой ПО. В общем виде такая многомерная матрица может использоваться для группировок, содержащих информацию относительно ограниченной выборки ПО, входящих в многомерную сеть подобия. Тогда для t группировок из общего набора ПО T для анализа бу-T!
дет доступно до -|(т—— группировок [6]. Такое количество позволяет выявлять закономерности
на всем поле анализа, причем все условия применимости из множества C' будут рассмотрены в контексте каждой ПО.
В качестве методики группирования в данной статье предлагается метод склеивания 2мерных матриц вида (1), содержащих «сырые» данные из полного состава объемной матрицы. Обозначим объемную матрицу произвольнойразмерности рх /х...х д следующим образом:
B =
'Nu,...,1 ... N1,1,...,f Ч,2,..,1 ... N1,2,...,f N1,q,...,1 ... N1,q,...,f '
Np,1,....,1 ... NP,U.f ... ,2, . p, Np ... ,2, p, Np Np,q,....,1 ... NP, q,.., f,
(2)
Тогда для некоторых субматриц из объемной матрицы B возможно проведение операции склеивания. Ее суть заключается в том, что для каждой пары сетей Nab c и Nd g e ( a, b, c, g, d, e - в
данном случае произвольные индексы) столбцам/строкам из Nabc ставятся в соответствие строки/столбцы из Ng d e на основе наличия общих условий применимости (подмножества условий применимости для Nabc и Ngde пересекаются). В результате склеивания получим некоторую композицию Ngb , которая представляет собой новую сеть подобия для группы двух ПО. Анализ полученной композиции позволяет получить новые условия применимости и факты (правила) во фреймах межотраслевых ПО. Операцию склеивания проводят до тех пор, пока пересечения всех подмножеств условий применимости фреймов не дадут пустое множество. В этом случае получим финальную объемную матрицу размерности меньшей, чем p х f х... х q . Такая матрица в общем случае не подлежит дальнейшему упрощению до тех пор, пока в составе фреймов не появятся общие условия применимости. В случае если общих условий применимости не найдено, дальнейший анализ информации производится с применением методов, описанных в [5].
4. Выводы
Автор считает, что в данной работе новыми считаются следующие положения и результаты:
- получена методика многомерного связывания знаний в сложных моделях на основе фреймовых БЗ;
- рассмотренная на примере схема склеивания позволяет упрощать анализ исходных данных, имеющих отношение к нескольким смежным ПО;
- примененная схема БЗ вполне может заменять продукционные БЗ, что позволяет существенно экономить вычислительные ресурсы на этапе логического вывода, в том числе и за счет применения сетей подобия фрейма.
Результаты данного исследования могут найти много практических применений. Среди них:
- многомерные модели данных используются для анализа информации при рассмотрении многоотраслевых ПО;
- выведенные закономерности в многоотраслевых ПО позволяют обнаружить новые тенденции и факторы влияния на принятие решения [7];
- упрощение задачи анализа за счет сокращения множества факторов (условий применимости) в результате склеиваний матриц, представляющих сети подобия фреймов.
Литература
1.Гаврилова Т. А. Хорошевский В. Ф. Базы знаний интеллектуальных систем: Учебник. - СПб.: Питер, 2000. - 384 с.
2.Кузин Л. Т. Основы кибернетики: В 2-х т. Т.2. Основы кибернетических моделей: Учеб. Пособие для вузов. - М.: Энергия, 1979. - 584 с.
3.Такеути Г. Теория доказательств / Пер. с англ. Соболева С. К. под ред. Адяна С.И.. -М.: Мир, 1978 - 412 с.
4.МинскиМ. Фреймы для представления знаний. -М.: Энергетика, 1979. - 151 с.
5.Барсегян А. и др. Методы и модели анализа данных: OLAP и DataMining. - СПб.: БХВ, 2004. - 336
с.
6.Виленкин Н. Я. Комбинаторика/Н.Я.Виленкин.- М.: Наука, 1969.-328с.
7.Макаров М. М. Методика интеллектуального анализа в системах поддержки принятия решений / М. М. Макаров // Известия высших учебных заведений. Поволжский регион. Технические науки. 2008. № 1. С. 53-61.