Научная статья на тему 'Использование математической логики с переменной значностью при моделировании систем знаний'

Использование математической логики с переменной значностью при моделировании систем знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
180
55
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лютикова Лариса Адольфовна

В статье рассматривается логический подход к решению интеллектуальных задач, анализирующих заданную предметную область, представляющую собой набор объектов и их характеристик.Предлагаемый метод моделирует систему знаний по исходным данным,минимизирует предметную область до необходимого набора правил,что существенно сокращает объемы используемой информации,осуществляет быстрый и качественный вывод. Использование в качестве кодируемого алфавита предикатов с переменной значностью повышает выразительность характеристик и оптимизирует представление данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование математической логики с переменной значностью при моделировании систем знаний»

20 Вестник СамГУ — Естественнонаучная серия. 2008. №6(65).

МАТЕМАТИКА

УДК 510.644

ИСПОЛЬЗОВАНИЕ МАТЕМАТИЧЕСКОЙ ЛОГИКИ С ПЕРЕМЕННОЙ ЗНАЧНОСТЬЮ ПРИ МОДЕЛИРОВАНИИ СИСТЕМ ЗНАНИЙ1

© 2008 Л.А. Лютикова2

В статье рассматривается логический подход к решению интеллектуальных задач, анализирующих заданную предметную область, представляющую собой набор объектов и их характеристик. Предлагаемый метод моделирует систему знаний по исходным данным, минимизирует предметную область до необходимого набора правил, что существенно сокращает объемы используемой информации, осуществляет быстрый и качественный вывод. Использование в качестве кодируемого алфавита предикатов с переменной значностью повышает выразительность характеристик и оптимизирует представление данных.

Ключевые слова: математическая логика, предикат, система знаний, минимизация, индивидная область.

Для автоматизированной реализации некоторых задач, таких как геологическое прогнозирование, медицинская диагностика, диагностика сложных технических систем, прогнозирование кризисов в экономике и т.д., как правило, имеет место следующая ситуация: число прецедентов невелико, информация об их статистической природе либо отсутствует, либо ее недостаточно для обоснованного применения вероятностных моделей, а описание прецедентов содержит разнородную информацию.

Логические алгоритмы хорошо зарекомендовали себя в решениях обозначенных задач, главным образом потому, что они делают возможным анализ исходной предметной области, что в свою очередь оптимизирует поиск.

1 Представлена доктором физико-математических наук, профессором О.А.Репиным.

2Лютикова Лариса Адольфовна ([email protected]), заведующий отделом интеллектуализации информационных и управляющих систем Научно-исследовательского института прикладной математики и автоматизации Кабардино-Балкарского научного центра РАН, 360000, Россия, г. Нальчик, ул. Шортанова, 89-А.

Для более выразительного представления знаний предполагается использование многозначной и переменнозначной логики.

Существующие на сегодняшний день алгоритмы обработки информации, в основном основанные на статистическом анализе, оперируют избыточной информацией, упуская интеллектуальную составляющую любого вывода. На базе разработанных методов предполагается создание компьютерной системы обучения в слабо формализованной области знаний. Имеется в виду автоматическое построение правил, их автоматическая минимизация (удаление избыточной информации) и поиск по оптимизированной системе знаний, что, в сравнении с другими методами, дает более продуктивную автоматизированную реализацию для решения интеллектуальных задач.

1. Постановка задачи моделирования баз знаний

Описание объекта представляет собой п-мерный вектор, где п — число признаков, используемых для характеристики объекта, причем ]-я координата этого вектора равна значению _/-го признака, ] = 1,...,и. В описании объекта допустимо отсутствие информации о значении того или иного признака. При составлении эффективной системы следует избегать двух крайностей: избыточности и недостаточности набора признаков. В первом случае важные результаты окажутся скрытыми в массе второстепенных или малозначимых. Во втором — критерий для однозначного опознания конкретных объектов останется невыявленным.

Совокупность объектов и характеризующих их признаков составляет базу данных. После создания базы данных строится база знаний, играющая главную роль в процессе распознавания объектов исследуемой предметной области.

Естественно представить знания в наиболее компактной форме, что позволит сократить время для процедуры вывода.

Задача состоит в разработке методов, позволяющих моделировать и минимизировать базу знаний по исходной базе данных.

2. Формальная постановка задачи

Соответствие множества объектов характеризующим их признаков может быть представлено следующей таблицей

_ Таблица

XI Х3 хп ж

Х2О1) Х3О1) . • *пО 1)

*1<>2) хг(^г) • Хп(ч?2) 1Ф>2

Х\ {Ч>т) *2<>т) *зОт) . ■ хп(ч>т)

Пусть Xу = Х2(м^ — вектор качественных признаков,

каждый элемент которого — фиксированный признак характеризуемого объ-

т

екта. Ж = и Wj — множество характеризуемых объектов.

У=1

Вид функции Ж = /(X) не задан. Требуется восстановить неизвестную зависимость по наблюдениям.

Каждый соответствующий признак хД^у) в общем случае кодируется предикатом кг-значности (переменнозначным), г е [1.....п].

Для нахождения значения функции Ж = /(X) системе важно обращаться к базе знаний, которая по запросу Ху = {Х1, Х2,..., хп} выдаст Wj в случае, если Wj принадлежит исследуемой предметной области, или объект (группу объектов), наиболее соответствующих данному запросу.

Предлагаемый принцип моделирования систем знаний по базе данных состоит в следующем:

- совокупность зависимостей между объектами и их признаками будем рассматривать как множество тавтологий, т.е. как некую логическую теорию;

- каждая логическая теория обладает своей аксиоматической системой и правилами вывода;

- в случае нахождения для заданной теории метода построения её системы аксиом можно считать искомую систему знаний построенной.

Обычно по аксиоматике строится логическая теория, в данном случае наоборот, предлагается по заданной теории найти одну из её аксиоматик.

Для выполнения поставленной задачи необходимы следующие понятия и определения.

Пусть S — множество исследуемых объектов, которое характеризуется некоторым набором свойств Е в терминах многозначных предикатов, с переменной значностью.

Многозначным предикатом с переменной значностью в дальнейшем изложении мы будем называть конечное отображение вида а : S ^ 1т а, где 1та - а е {0,1,...,кг - 1}, кг е[2,... N

Алгебра переменнозначной логики

Высказывания строятся над множеством {В, —, Л, V, 0,1,..., к(--1}, где В — непустое множество, над элементами которого определены три операции:

- — отрицание (унарная операция),

Л — & конъюнкция (бинарная),

V — дизъюнкция (бинарная), а также константы — логический ноль 0,1,..., к - 1.

Пусть Хг — независимая многозначная переменная величина, Хг е [0,..., кг - 1], являющейся одной из характеристик объекта. Введем еще несколько функций и свойств многозначной логики.

(Х) =

кг - 1 при X = у, 0 при X Ф у;

Iji(Xi) =

кг - 1 при Хг = ], 0 при Хг * ].

1) Свойство коммутативности: Х1 о Х2 = Х2 о Х1;

2) Свойство ассоциативности: (Х1 о Х2) о Х3 = Х1 о (Х2 о Х3);

3) Свойство дистрибутивности: (Х1 V Х2) о Х3 = Х1 о Х3 V Х2 о Х3;

4) Правила упрощения:

¡п (х) при ] = Г,

W * /.(X) А j(при {=r

J у 0 при j ф r.

Отметим ряд свойств, справедливых для многозначной логики:

(к - 1)&Х = Х;

0&Х = 0;

(к - 1) V Х = (к - 1);

0 V Х = Х.

Введем понятие обобщенной инверсии. Обобщенной инверсией является следующее выражение:

Х = 1& vki"01 ¡г(Хг),..., v(l - 1)& vkL-01 ¡г(Хг) V (г + 1)&

& vk="01 ¡г(Хг) V (к - 1)& vk="01 ¡г(Хг).

Заданная таким образом инверсия обеспечивает включение всех возможных интерпретаций отрицания в различных многозначных логических системах.

В дальнейшем будем считать, что дизъюнкцией двух элементов разной значности является следующая функция:

x у

I >п - 1 при - > -,

X V у = тах --г; --г * i, где i = { ь - 1 - 1

- 1 в противном случае.

ki - 1' kj - 1

Конъюнкцией двух элементов разной значности назовем

x у

, — 1 при - < -,

X & у = min --г; --г * i, где i = { h - 1 kj - 1

kj - 1 в противном случае.

x у

kj - 1

Импликацию для переменнозначной логики зададим следующим выражением: х у = х V у.

Х V У = 1& vki-1 ¡1 (Хг),..., V(г - 1)& vki-1 ¡1 (Хг) V (г + 1)&

& vki-1 /(Xi) V (k -1)& vki:1 /i (Xi) V y.

г=0 г г г=0

Любая функция рассматриваемой системы может быть представлена в следующем виде:

/(хх,..., хи) = V ¡01&Х1 &,..., ¡0п &Хи&/(01,...,0„).

01,...,ап

Элементарная конъюнкция представляет характеристическую функцию некоторого интервала I, пространства М, а интервал — это простое произведение непустых подмножеств а,-, взятых по одному из каждого Х- :

I = ах X а1х,...,хап, ах е Xа, Ф 0, - = 1,2,..., п.

Тогда элементарная переменнозначная конъюнкция представлена выражением:

К = (хх е а0&( Х2 е а2), ...,(Хп е ап), а- Ф 0, - = 1,2,...,п

и определяется как конъюнкция произвольных, но отличных от нуля одноместных предикатов х- е а- (х- принимает значения из а1, где а- — конечное множество констант, а- = [0,..., к^]).

Элементарная переменнозначная дизъюнкция есть дизъюнкция одноместных предикатов, отличных от нуля ^ = (х1 е а^ V (х2 е а2)У,..., У(хп е ап).

Многозначные дизъюнктивная и конъюнктивная нормальные формы (МДНФ, МКНФ) определяются стандартным образом: МДНФ — это дизъюнкция элементарных конъюнкций, МКНФ — это конъюнкция элементарных дизъюнкций.

Решение исходной задачи в системе кодирования информации с переменной значностью будет выглядеть следующим образом.

Каждую строку обучающей выборки опишем правилами продукции в соответствующем многозначном смысле:

&п=1 хг(^) ^ wj. (2.1)

Тогда дизъюнктивной формой МДНФ (многозначная дизъюнктивная нормальная форма) будет следующее представление данного правила:

^^ V Wj

при к- е [2,...,И], где

щ = 0& у^1 и(хд V 1& у^1 и(хд,... V (I - 1)&

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

& vk=-l 1-( хд V (-+1)& vk="ol ь(хд V (к -1)& vk=-l 1-( х-). .

Поскольку каждое знание в обучающей выборке мы можем записать в виде логической функции соответствующей значности, хотелось бы иметь возможность представления всей базы знаний функцией или системой функций многозначной логики с учетом специфики кодирования каждого признака. Однозначное соответствие можно получить, объединив все правила продукций в данной предметной области. Это будут рассуждения такого плана: знаем это правило и следующее, и так далее, знаем все вместе правила одновременно. Это будет функция вида:

/(X) = (Д х V при j е [1,..., т]. (2.3)

Далее можно применить алгоритм сокращения, адаптированный для многозначных логик.

1. Если некоторая переменная входит в ДНФ с одним знаком (Ijk-i(x), j = const во всех дизъюнктах), то удаляем все дизъюнкты, содержащие эту переменную (данная переменная неинформативна);

2. Если в ДНФ имеется какой-то дизъюнкт Ijk-i(x), то выполняем следующие действия:

- удаляем все дизъюнкты вида Ij( x)&... (правило поглощения);

k-i

- дизъюнкты вида V I;(xi)&xi&s&p, заменяем дизъюнктами вида

j=0

ki-i

V Ij( Xi) s&p, 4Ii (Xi), l e [0,...,k - 1].

j=0,j*l

Результатом примененного алгоритма является функция, соответствующая исходной таблице данных, однозначно ее характеризующая и дающая множество наиболее существенных правил, формирующих исходную область знаний.

Функция {f(X)} полна на заданном пространстве признаков.

Решающая функция и исходная БД имеют однозначное соответствие.

n _

Теорема 1. Функция: f(X) = V x(wj) V wj) при j e [1,...,m],

J=i i=i

Xi(wj) e [0,..., ki - 1], ki e [2,..., N], где Xi(wj) — соответствующий многозначный признак, wj — характеризуемый объект, есть дизъюнкция всех возможных классов заданной предметной области.

Построенная функция состоит из конечного числа дизъюнктов, часть из которых являются аксиомами, это те дизъюнкты, которые содержат минимальное число объектов в качестве сомножителей. Другая часть дизъюнктов является классами, это дизъюнкты, содержащие как можно больше объектов, и дизъюнкты, не содержащие объектов вообще и состоящие только из переменных. Иначе говоря, f(X) можно разделить на три функции:

f (X) = fi(X) V f2(X) V fs(X), (2.4)

где fi (X) — система аксиом или индивидуальные признаки определенных объектов, f2(X) — множество классов исходной БД и f3(X) — множество настроечных элементов, которые не имеют значения для вывода, но имеют значение в случае поступления новой информации.

Остановимся подробнее на каждой из функций. Для получения системы аксиом заданной БД необходимо построить f(X), сократить её по заданному ранее алгоритму, затем проанализировать те дизъюнкты, куда вместе с переменными входят объекты, выбрать среди них минимальные. Это и будут аксиомы заданной предметной области.

Функция f?(X) дает картину разбиения БД на классы. Дизъюнкты, входящие в данную функцию, должны содержать как можно больше компонент — объектов.

Функция f3(X) не имеет отношения ни к выводу, ни к совокупности классов, ни к идентификации объектов. Она состоит только из дизъюнктов, элементами которых являются переменные (признаки объектов). Можно назвать f3(X) настроечной функцией, так как она предоставляет информацию

о неиспользованных переменных или их определенных наборах, которые могут в дальнейшем стать основными идентифицирующими признаками для новых элементов множества {W}.

В результате подробного анализа f(X) становится очевидным рекурсивная составляющая при построении, в результате чего получаем следующее представление W(X), где W(X) — моделируемая функция, Zj — характеристика объектов на текущий момент, Qj — состояние системы на текущий момент.

Полученную функцию f(X) можно представить в следующем виде: W (X) = Zk (qkWkX);

П __П _

Zk(qkwkXk) = Zk-1&( V xk(wi) V wh) V qk-i&( V xk(wi) V wk)\

i=1 i=1 , 0 , n —, \ (2.5)

qk = qk-i&iV xk(wi); i=1

n _

qi = V xi(Wi)\j = 2,...,m;Zi = wb i=l

Выводы

1. В данной статье обосновано существование функции, осуществляющей формальное построение системы знаний по исходным данным.

2. Искомая функция, являющаяся конъюнкцией по пространству признаков и множеству объектов, однозначно характеризует исходные данные. Разбивая предметную область на классы, обладает свойствами модифицируемости, отвечает требованиям полноты, непротиворечивости в заданной области.

3. Решающая функция сохраняет свои свойства в пространстве двузначных и переменнозначных предикатов.

4. Представление данных пространством многозначных предикатов с переменной значностью дает возможность для выразительной интерпретации признаков, хранения знаний в более компактной форме, установления новых закономерностей между признаками и построения качественно новых систем знаний.

5. Результатам анализа данных является системы аксиом, порождающая заданную предметную область.

Литература

[1] Закревский, А.Д. Логика распознавания / А.Д. Закревский - М.: Наука, - 2003. - 144 с.

[2] Лютикова, Л.А. Развитие и применение многозначных логик и сетевых потоков в интеллектуальных системах / Л.А. Лютикова, А.В.Тимофеев, В.В. Сгурев [и др.] // Труды СПИИРАН, - 2004. -Вып. 2. - С. 117-121.

[3] Лютикова, Л.А. Использование трехзначной логики для анализа логических баз данных / Л.А. Лютикова // Управление и информационные технологии: труды Всероссийской конференции. - 2006. - С. 214-220.

[4] Тимофеев, А.В. Применение диофантовых нейронных сетей для генетического анализа и диагностики / А.В.Тимофеев, А.М.Шеожев, З.М. Шибзухов // Сб. трудов 6-го Санкт-Петербургского симпозиума по теории адаптивных систем SPAS'99. СПб: Изд-во "НПО Омега", -2003. - Т. 2. - С. 169-171.

[5] Тимофеев, А.В. Методы построения обучающих выборок для развернутой медицинской диагностики на основе нейросетевых технологий / А.В.Тимофеев, А.М.Шеожев // Доклады АМАН. - 2000. - №1. -Т. 5. - С. 69-71.

[6] Шибзухов, З.М. Конструктивные методы обучения ЕП-нейронных сетей / З.М. Шибзухов. - М.: Наука, 2006.

Поступила в редакцию 13/XII/2006; в окончательном варианте — 26/XII/2006.

APPLICATION OF LOGIC WITH A VARIABLE VALUE TO KNOWLEDGE BASES MODELLING3

© 2008 L.A. Lyutikova4

In the paper a method of analysis of databases containing a set of objects and their characteristics is considered. Every characteristic of the objects has its value in order to represent input data in a optional way.

Using the input data, we construct a function such that a database is uniquely defined. After the function is analyzed and minimized, we obtain both a complete set of classes possible on the initial database and a number of unique elements. In this case, it is possible to introduce a system of axioms and theorems on the input area, highly reducing the data representation.

Keywords and phrases: mathematical logic, predicate, knowledge system, minimization, individual domain.

Paper received 13/XII/2006. Paper accepted 26/XII/2006.

3Communicated by Dr. Sci. (Phys. & Math.) O.A.Repin.

4Larisa Adolfovna Lyutickova ([email protected]), Institute of Applied Mathematics and Automatization, Kabardino-Balkariya Science Center of Russian Academy of Science, Nalchik, 360000, Kabardino-Balkariya, Russia.

i Надоели баннеры? Вы всегда можете отключить рекламу.