УДК 004.89
ИСПОЛЬЗОВАНИЕ НЕЧЕТКОГО ЛОГИЧЕСКОГО ВЫВОДА ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
А.Р. Вахитов, В.А. Силич
Томский политехнический университет E-mail: [email protected]
Показан способ интеллектуального анализа данных, основанный на использовании нечеткого логического вывода. Обсуждаются принципы реализации способа, области применения, а также преимущества по сравнению сдругими способами обработки данных. Особое внимание уделяется практическому применению данного способа в предметной области, связанной с НИРС в вузе. Сделан вывод о целесообразности использования нечеткой логики в условиях неопределенности и неполноты знаний.
Ключевые слова:
Интеллектуальные информационные системы, нечеткая логика, НИРС, анализ данных. Key words:
Intellectual information system, fuzzy logic, students' research effort, data analysis.
Знания, которыми располагает человек, в какой-то степени всегда неполны, приближенны, ненадежны. Тем не менее, людям на основе таких знаний удается делать достаточно обоснованные выводы и принимать разумные решения. Следовательно, чтобы интеллектуальные информационные системы были действительно полезны, они должны учитывать неполную определенность знаний и успешно действовать в таких условиях [1, 2]. Таким образом, неполная определенность и нечеткость имеющихся знаний - скорее типичная картина при анализе и оценке положения вещей, при построении выводов и рекомендаций, чем исключение. В процессе исследований по искусственному интеллекту для решения этой проблемы выработано несколько подходов.
Одним из таких подходов является нечеткая логика Л. Заде. В его работе [3] понятие множества расширено допущением, что функция принадлежности элемента к множеству может принимать любые значения в интервале [0..1], а не только 0 или 1. Такие множества были названы нечёткими. Также Л. Заде были предложены логические операции над нечёткими множествами и предложено понятие лингвистической переменной, в качестве зна-
чений которой выступают нечёткие множества.
Модель нечеткой логики делает возможным реализацию в системе интеллектуальных функций, основанных на анализе неполной информации о предметной области, и построение удобного пользовательского интерфейса, в котором вывод данных имеет такие сходства с результатами человеческих рассуждений, как приближенность, неуверенность и субъективность. Кроме того, благодаря непрерывности функции принадлежности появляются преимущества в скорости обработки данных.
Функциональная схема процесса нечеткого вывода представлена на рис. 1 [4].
Выполнение первого этапа нечеткого вывода -фаззификации - осуществляет фаззификатор. За процедуру непосредственно нечеткого вывода ответственна машина нечеткого логического вывода, которая производит второй этап процесса вывода на основании задаваемой нечеткой базы знаний (набора правил), а также этап композиции. Дефаззификатор выполняет последний этап нечеткого вывода - дефаззификацию [5].
Исследуемая предметная область (НИРС в вузе) система была описана в терминах нечеткой логики. В соответствии с предложенным методом
Рис. 1. Функциональная схема процесса нечеткого вывода
был осуществлен нечеткий логический вывод. Предметная область описывается следующими входными параметрами А1 и выходными параметрами В,, таблица:
Таблица. Входные и выходные параметры системы
Обозначение Описание Универсум (список возможных значений)
Входные параметры
А Количество результатов НИРС Множество натуральных чисел п
А Сумма денег, полученных за НИРС Множество положительных вещественных чисел т
Аз Число страниц,опубликованных по итогам НИРС п
A4 Число наград за НИРС п
As Число поощрений по итогам НИРС п
А Сумма денег, затраченных на поощрения т
Выходные параметры
Премирование m
Назначение преподавателю руководства НИРС n
Вз Рекомендация для поступления в аспирантуру n
B4 Рекомендация на стажировку n
Bs Командировка на конференцию n
Все универсумы находятся в пределах измеримого диапазона с 5 степенями градации (термами): очень низкий [0..xj, средний [x^.x2], высокий [x2..x3]. Конкретные значения x¡ зависят от масштабов анализа данных (на уровне конкретного студента или преподавателя, кафедры, факультета либо вуза) и особенности измерения данного параметра. Исследуемая система описывается правилами вывода:
L{. (A5e[0..x1]AA6e[0..x1])A(A1e[x2..x3]v
vA2 e [x2..x3] vA3 e [x2..x3] vA4 e [x2..x3]) ^B1 e [x1..x2];
L2: (A5e[0..X1]AA6e[0..X1])A(A1e[x2..X3]A
л^е [х^ХзМзе [х2..ХзМ4е [х2.Хз])^В1е [X2..X3]; L3: (A5e [x1..X2]AA6e [x1..X2])A(A1e [x2..x3]v
v^e [x2..x3]v4e [x2..X3]vA4e [x2..X3])^B1e [0..X1]; L4: (A5e [x1..x2]AA6e [x1..x2])A(A1e [x2..x3]a
AA2 e [X2..X3] AA3 e [X2..X3] AA4 e [X2..X3]) e [X1..X2];
L5: (A5 e [x2..x3] aA6 e [x2..x3]) a(A1 e [x2..x3] a
AA2 e [X2..X3] AA3 e [X2..X3] AA4 e [X2..X3]) ^B1 e [0..X1];
L5: (A2e[x2..x3]AA4e[x2..x3]AA1e[0..x1]AA5e[0..x1])^
^B2e[x1..x2]; L6: (A2 e [x1..x2] aA4 e [x1..x2] aA1 e [0..x1 aA5 e [0..x1]) ^ ^B2e[0..xJ;
L7: (A3e [^..XjMAe [x2..x3]AA26 [X2..X3]aA46 [x2..x3]))^
L8: (A3 e [xj ..x2] v(Aj e [x1 ..x2] aA2 e [x1 ..x2] aA4 e [xj..x2])) ^ ^e^.xj;
L9: (Aje[x2..x3]v^2e[x2..x3]v^3e[x2..x3])^^4e[xj..x2];
Lj0: (Aje [x2..x3]AA2e [x2..x3]AA3e [x2..x3])^B4e [x2..x3];
Ln: (A^ [x^A^e [x^D^e [x^];
Lj2: (Aj e [x2..x3] vA3 e [x2..x3])^B5 e [x2..x3];
Lj3: (A^ [x^A^e fe.^D^e [x^];
Lj4: (Aje[x2..x3]AA6e[0..xj])^A5e[xj..x2];
Lj5: (A1e[0..x1]vA6e[0..x1])^A5e[0..x1].
Следует отметить, что наряду с возможностью вывода выходных параметров на основе входных в системе также возможен вывод неизвестных входных параметров из известных входных параметров (правила вывода Lj3-Lj5).
Рассмотрим алгоритм нечеткого вывода на конкретном примере. У одного из студентов необходимо доопределить значение A5, зная значения Aj и A6, используя затем полученные параметры для генерирования решения о том, заслуживает ли студент дополнительных поощрений.
Универсум значения числа поощрений A5,ora этого студента находится в отрезке [0..6]. Начальное множество термов - низкое, среднее, высокое. Функции принадлежности u(A5) показаны на рис. 2.
Универсум значения числа результатов Aj для этого студента находится в отрезке [0..20]. Начальное множество термов - {малое, среднее, большое}. Функции принадлежности u(A1) приведены на рис. 3.
Универсум значения суммы денег A6 для этого студента находится в отрезке [0..12000]. Начальное множество термов - {малая, средняя, большая}. Функции принадлежности ju(A6) имеют следующий вид, рис. 4.
Нечеткий логический вывод производится в несколько этапов:
1. Этап фаззификации.
На основе значений A1=15 и A6=7000 была осуществлена фаззификация, в результате которой получены следующие степени уверенности в значениях входных переменных:
• Число достижений A1 большое - 0,65; среднее -0,7; малое - 0,35.
• Сумма денег A6 большая - 1; средняя - 0,5; малая - 0.
2. Этап нечеткого вывода.
На данном этапе вычислены степени уверенности посылок правил L13-L15, представляющих из себя нечеткие импликации:
• L13: min(A1e[x2..x3]AA6e[x2..x3])=min(0,65;1)=0,65.
• L14: min(A1e[x2..x3]AA6e[0..x1])=min(0,65;0)=0.
• L15: max(A1e[0..x1]vA6e[0..x1])=max(0,35;0)=0,35.
3. Этап композиции.
Рис. 2. Функции принадлежности /л(Аь)
Рис. 3. Функции принадлежности ^.(А)
Рис. 4. Функции принадлежности ^(А)
Рис. 5. Аккумуляция правил
Степень уверенности заключения задается функцией принадлежности соответствующего терма. Поэтому с использованием определения нечеткой импликации как минимума левой и правой частей получены новые нечеткие переменные, соответствующую степени уверенности в значении выходных данных при применении к заданным входам соответствующего правила.
Затем была проведена аккумуляция - объединение результатов применения всех правил, рис. 5.
В результате была получена функция принадлежности для числа поощрений A5, которая говорит о степени уверенности в значении искомого параметра на основе входных параметров и правил нечеткого логического вывода. 4. Этап дефаззификации.
Для преобразования нечеткого набора значений к точным был использован метод первого мак-
симума, в результате чего было определено, что число поощрений находится в диапазоне «среднее» и равно примерно 3.
Затем полученные данные были использованы для определения выходных параметров В.. Зная, что А;=15, А5=3, Аб=7000, согласно правилу нечеткого логического вывода Ь3:
(А е [х1 ..х2] лАб6 [х1 ..х2])л(А1 е [х2..х3] vA2 е [х2..х3] V vA3 е [х2..х3] vA4 е [х2..х3]) ^В1 е [0..х1] было определено, что с данными показателями НИР этот студент заслуживает премирования в размере [0..2000].
Таким образом, использование нечеткого логического вывода делает возможным получение новых знаний на основе анализа существующих данных даже в условиях неполноты и приближенности сведений об исследуемой предметной области.
СПИСОК ЛИТЕРАТУРЫ
1. Brachman R., Sefridge P. Knowledge representation support for data archeology // Intelligent and Cooperative Information Systems. -1993. - №2. - P. 113-120.
2. Борисов А.Н., Алексеев А.В., Меркурьева Г.В. и др. Обработка нечеткой информации в системах принятия решений. - М.: Радио и связь, 1989. - 304 с.
3. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. - М.: Мир, 1976. - 165 с.
4. Корниенко А.В. Интеллектуальные информационные системы в экономике. - Томск: Изд-во ТПУ, 2008. - 177 с.
5. Кузнецов С.Д. Неопределенная информация и трехзначная логика // СУБД. - 1997. - № 5. - С. 65-67.
Поступила 08.09.2010г.
УДК 004.89
ВЫБОР КЛАССА МАТЕМАТИЧЕСКОЙ МОДЕЛИ СИСТЕМЫ НА ОСНОВЕ МЕТОДА СААТИ И ИНТЕГРАЛЬНЫХ КРИТЕРИЕВ
А.Р. Вахитов, В.А. Силич
Томский политехнический университет E-mail: [email protected]
Показано обоснование выбора класса математической модели информационной системы, содержащей сведения о НИРС в вузе. Произведено описание альтернативных классов моделей, основных критериев выбора и применения метода Саати и интегральных критериев для выбора наиболее подходящего варианта из имеющихся альтернатив. Сделан вывод о целесообразности использования нечеткой логики в качестве класса математической модели для исследуемой предметной области.
Ключевые слова:
Математическая модель, НИРС, метод Саати, интегральные критерии. Key words:
Mathematical model, students' research effort, Saati's method, integral criterias.
Создание математического обеспечения информационной системы предполагает обоснование выбора класса математической модели из множества Х альтернативных вариантов х., а также непосредственное описание предметной области в терминах выбранного класса. К числу основных логических моделей, для которых разработаны формальные методы логического вывода, относятся [1, 2]:
х1 - исчисление высказываний; х2 - исчисление предикатов; х3 - семантические сети; х4 - дескриптивная логика; х5 - нечеткая логика.
Исследуемой предметной областью является НИРС в вузе. Обоснование выбора класса математической модели является важным этапом при разработке системы, так как здесь должны учитывать-