Сеченов Михаил Дмитриевич
Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.
E-mail: [email protected].
347928, г. Таганрог, пер. Некрасовский, 44.
Тел.: 88634371625.
Щеглов Сергей Николаевич
E-mail: [email protected].
Setchenov Mixail Dmitrievich
Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education “Southern Federal University”.
E-mail: [email protected].
44, Nekrasovskiy, Taganrog, 347928, Russia.
Phone: 88634371625.
Shcheglov Sergej Nikolaevich
E-mail: [email protected].
УДК 004.827
С.В. Скороход
К ВОПРОСУ О ПРИМЕНЕНИИ ЛИНГВИСТИЧЕСКИХ ПЕРЕМЕННЫХ ДЛЯ ПОСТРОЕНИЯ ЭКСПЕРТНЫХ ОЦЕНОК*
Рассматривается задача построения значения нечёткой переменной методом экспертного опроса. Анализируется подход, основанный на использовании лингвистической переменной. Продемонстрированы недостатки существующих методов, использующих нечёткие множества второго уровня. Предлагается подход, позволяющий осуществить переход от нечёткого множества второго уровня к значению нечёткой переменной, лишенный указанных недостатков.
Нечёткая переменная лингвистическая переменная экспертная оценка.
S.V. Skorokhod
APPLICATION OF LINGUISTIC VARIABLES FOR EXPERT ESTIMATIONS
CONSTRUCTION
The problem of a fuzzy variable value construction is considered by a method of expert inquiry The approach based on use by a linguistic variable is analyzed. Lacks of the existing methods using fuzzy sets of the second level are shown. The approach, permitting to realize passage from an fuzzy set of the second level to a value of the indistinct variable, deprived the indicated shortages is offered.
Fuzzy variable linguistic variable expert estimation.
Постановка задачи. В системах принятия решений, основанных на обработке нечёткой информации, часто решается следующая задача. Имеется некоторая нечёткая переменная [1] K , заданная на числовой базовой шкале B. Требуется при помощи опроса нескольких экспертов построить её значение. Данная задача сводится к построению функции принадлежности Hk(x) нечёткого множества (НМ):
* Работа выполнена при финансовой поддержке Международного научного фонда экономических исследований академика Н.П. Федоренко. Проект № 2009-103
K = \^к (x)l x
хеВ
(1)
с учётом мнения каждого из экспертов.
Существует множество прямых и косвенных методов её решения, обзор которых приведён в [1]. Общим их недостатком является большая трудоёмкость процедуры экспертного опроса, что делает их крайне неудобными для применения в автоматизированных системах. В данной работе предлагается подход, основанный на использовании лингвистической переменной [2], включающей в себя набор терм-множеств. Функции принадлежности терм-множеств строятся однократно любым из известных методов на подготовительном этапе, после чего они используются для построения Цк (x) , что существенно уменьшает трудоёмкость работы экспертов.
Нечёткая и лингвистическая переменные. Нечёткая переменная K определяется тройкой элементов K =< N~,B,K > , где N ~ - её название, Б - базовая
шкала, К - НМ (1), задающее её значение. Нечёткие переменные используются для описания каких-либо субъективных понятий, оцениваемых некоторым лицом, задействованным в процессе принятия решения. Значением переменной является
НМ (1), отражающее субъективные предпочтения этого лица. В общем случае, К имеет столько значений, сколько людей привлечено к оценке.
Для примера рассмотрим понятие «высокая сложность», оценка которого производится двумя экспертами. Нечёткая переменная будет иметь вид:
К =<" высокая'",[0;1], К > . Учитывая справедливость известного утверждения «сколько людей, столько и мнений», с большой степенью уверенности можно предположить, что мнения экспертов, совпадая, в целом, между собой, разойдутся в деталях. В результате получим два значения К1 и К2, функции принадлежности которых изображены на рис. 1.
Рис. 1. Значения нечёткой переменной
Лингвистическая переменная Ь определяется тройкой Ь=^Ь,Б,Т>, где ^- её название, Б - базовая шкала, Т=[/1.Лт} - терм-множество, задающее набор её значений. При этом каждый элемент терм-множества , / = 1, т является нечёткой переменной на шкале Б. Лингвистическая переменная является аппаратом для представления в системах принятия решений качественных категорий и их вербальных значений, а её терм-множество должно быть функционально полным и покрывать всё базовое множество Б.
В качестве примера возьмём категорию «сложность задачи». Предположим, что в результате опроса сформировано функционально полное множество терминов, которыми эксперты характеризуют её уровень: «минимальная» (/Д «низкая» (/2), «лёгкая» (/3), «средняя» (/4), «повышенная» (/5), «высокая» (/6), «максималь-
ная» (г7). Тогда соответствующая лингвистическая переменная
Ь=<«Сложность»,[0;1],Т>, где Т={ г1.. г7}, а функции принадлежности термов изображены на рис. 2. Их анализ позволяет сделать вывод о том, что данное терм-множество удовлетворяет всем требованиям.
Необходимо отметить, что построение терм-множества и его функций принадлежности является важной задачей, существенно влияющей на качество процесса принятия решений. Для этого используется тщательный опрос экспертов [2], который выполняется однократно на этапе создания или настройки системы, использующей лингвистические переменные. В дальнейшем функции принадлежности термов могут редактироваться, но при подстройке системы, а не при выборе конкретного решения.
Построение экспертной оценки. Рассмотрим теперь этап принятия решения. Пусть имеется конкретная задача, сложность которой должна быть оценена одним или несколькими экспертами. Другими словами, требуется, с учётом их мнений, построить функцию принадлежности (1), имея предварительно созданную лингвистическую переменную с набором термов, изображённых на рис. 2. Для этого экспертам предлагается выбрать подходящий терм, соответствующий сложности рассматриваемой задачи.
Сложность
1 ‘ П Ь г3 и г5 г6 г7
Рис. 2. Функции принадлежности термов
Если эксперт один, и он сделал однозначный выбор в пользу терма /, то в качестве (1) берётся функция принадлежности этого терма:
* г
К = г = \ц*( х)/ х . (2)
хе[0;1]
В случае, если он сомневается, какому терму отдать предпочтение, ему следует оценить степени Цв (^) е [0;1],/ = 1,т соответствия термов сложности зада-
чи. Результатом является НМ второго уровня [2] на множестве термов:
Б = {<Мв(и)/^ еТ >}. (3)
Заметим, что (2) является частным случаем (3), когда * *
(Мб(г) = 1)&(^еТ)(гфг ^мб(г) = 0).
Если экспертов несколько (р человек), то в результате опроса получим р НМ второго уровня (3):
= {< Мб, (и)/*1 е Т >}, = 1Р.
Вычислив среднее арифметическое функций принадлежности соответствующих термов по формуле:
^Мв; (ti ) ____
Мв ({1) = —----------,1 = 1,т ,
Р
получим единственное НМ второго уровня вида (3).
Итак, в результате опроса, как одного, так и нескольких экспертов, всегда получается НМ второго уровня (3). Рассмотрим вопрос о построении на его основе искомой функции принадлежности (1).
Традиционный метод, описанный в [2,3], основан на использовании а-уровней термов из Т, где в качестве а-уровня для терма II используется величина МБ(^') . Тогда (1) вычисляется по формуле:
Мк (*) = тахшш(мб (^), М' (х)). (4)
1геТ 1
Проиллюстрируем этот способ на примере. Пусть для набора термов (см. рис. 2) сформировано НМ _0={<0.6/?4>,<0.4//5>}. Тогда (4) будет иметь вид, изображённый на рис. 3 штриховкой.
Сложность
| и Ь
О х 1
Рис. 3. Традиционный метод
Достоинством этого метода является его применимость для функций принадлежности термов любого вида. Но у него есть и существенный недостаток. В нашем примере наблюдается разброс мнений экспертов, которые почти равномерно распределились между 14 и /5. Логично предположить, что искомая функция принадлежности должна иметь пик между пиками этих термов, немного ближе к /4, т.е. в точке x. Однако в этой точке она имеет локальный минимум, что противоречит здравому смыслу.
Рассмотрим другой метод, лишённый такого недостатка. Для этого наложим ограничения на форму функций принадлежности термов и предположим, что все они имеют треугольный вид, что соответствует изображениям (см. рис. 1-3). Поскольку эти функции определены на числовой базовой шкале (отрезок [0;1]), мы
имеем дело с треугольными нечёткими числами (НЧ) [4].
Треугольное НЧ C =< ^, c , ^ > задаётся тройкой чисел, которые обозначают минимальное, наиболее правдоподобное (максимум функции принадлежности) и максимальное значения его области определения. Над треугольными НЧ определены операции сложения, вычитания, умножения и деления, результаты которых также являются треугольными НЧ, которые вычисляются по формулам:
г~ч г~ч l l ’ ’ Г Г
C1 + ^2 =< С1 + сг, ^ ^ ^ + сг >
С1 - С2 =< С1 - с2 = С1 - c2, С1 - с2 >5 C1'С2 =< С1 'c25С1 'c2,С1 ' с2 >
Cl/С2 =< с/ /c2,Cl /C2,с[ /с2 > .
I ' г -—
Полагая, что терм =< ti, ti, >, ' = 1, m , используем операцию умноже-
ния треугольных НЧ для вычисления (1) как средневзвешенного термов из Т, в котором весовыми коэффициентами термов выступают значения ^D (^') из (3). Тогда К в (1) имеет вид треугольного НЧ:
ТМБ ({і ) • ^ ТМБ ({і) • (І ТМБ ({і) • (І
К =<
І=1
І =1
І =1
>
Тмб ({і ) Тмб ({і ) Тмб (и)
І=1 І=1 І=1
Проиллюстрируем этот метод на предыдущем примере. Полученное НЧ К изображено на рис. 4 и, на мой взгляд, гораздо более точно отражает колебания экспертов между термами 14 и 15 нежели функция принадлежности (см. рис. 3).
Рис. 4. Метод средневзвешенного термов
Выводы. В работе рассмотрена проблема построения нечёткой экспертнбой оценки, возникающая в задачах принятия решений. Для минимизации экспертного опроса предложено использовать лингвистическую переменную и её терм-множество. Проведён анализ двух способов построения экспертной оценки: традиционного, с использованием функций принадлежности произвольного вида, и основанного на использовании треугольных НЧ. Показано, что второй способ даёт более правдоподобные, с точки зрения здравого смысла, результаты.
БИБЛИОГРАФИЧЕСКИИ СПИСОК
1. Нечёткие множества в моделях управления и искусственного интеллекта / Под ред. Д.А. Поспелова. - М.: Наука. Гл. ред. Физ.-мат. лит.- 1986.- 312 с.
2. Мелихов А.Н., Берштейн Л.С., Коровин С.Я. Ситуационные советующие системы с нечёткой логикой. - М.: Наука. Гл. ред. Физ.-мат. лит. - 1990. - 272 с.
3. Скороход С.В. Моделирование целей управления в условиях неопределённости // Материалы международной научной конференции «Татищевские чтения: актуальные проблемы науки и практики».- Тольятти: Изд-во ВУИТ.- 2004. - С. 253-258.
4. Скороход С.В. Применение нечётких чисел для оценки квалификации персонала // Известия ТРТУ. - 2005. - № 3 (47). - С. 214-216.
Скороход Сергей Васильевич
Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.
E-mail: [email protected].
З4792З, г. Таганрог, ул. Инструментальная, 19/2, кв. 48.
Тел.: 88б34б48891.
Skorokhod Sergey Vasilievitch
Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education “Southern Federal University”.
E-mail: sssб[email protected].
19/2, ap. 48. Instrumentalynaya street, Taganrog, 347923, Russia.
Phone: +78бЗ4б48891.
УДК 519.712.2
Л.А. Гладков, Н.В. Гладкова
НОВЫЕ ПОДХОДЫ К ПОСТРОЕНИЮ СИСТЕМ АНАЛИЗА И ИЗВЛЕЧЕНИЯ ЗНАНИЙ НА ОСНОВЕ ГИБРИДНЫХ МЕТОДОВ*
Приводятся основные отличия методов Data Mining от традиционных методов анализа, обсуждаются их преимущества и недостатки и приводятся предложения по их решению на основе использования гибридных интеллектуальных технологий и методов вычислительного интеллекта. Рассмотрены основные аспекты применения нечетких генетических алгоритмов для решения задач извлечения знаний. Описаны основные компоненты организации и процесса взаимодействия генетического алгоритма и нечеткого логического контроллера. Приводятся основные определения и принципы использования методов эволюционного проектирования и моделирования, многоагентных систем и нечетких математических моделей при создании гибридных компонентов интеллектуальных систем. Обсуждаются преимущества и недостатки традиционных методов и приводятся предложения по их решению на основе использования гибридных интеллектуальных технологий и методов вычислительного интеллекта. Приводится обоснование актуальности разработки новых гибридных методов анализа и извлечения данных.
Анализ и извлечение знаний; нечеткий генетический алгоритм; нечеткий логический контроллер; фаззификация; дефаззификация; мультиагентная система; эволюционное проектирование; модели эволюции.
L.A. Gladkov, N.V. Gladkova
NEW APPROACHES TO CONSTRUCTION OF DATA MINING SYSTEMS ON THE BASIS OF HYBRID METHODS
In work the basic differences of methods Data Mining from traditional methods of the analysis are resulted. Also advantages and lacks of methods Data Mining are discussed and offers under their decision on the basis of use of hybrid intellectual technologies and methods of computing intelligence are resulted.Also the basic aspects of application of fuzzy genetic algorithms for the decision of problems of extraction of knowledge are considered. The basic components of the organization and process of interaction of genetic algorithm and the fuzzy logic controller are described. The basic definitions and principles of use of methods of evolutionary designing and modeling, multiagent systems and fuzzy mathematical models at creation of hybrid components of intellectual systems are resulted. Also advantages and lacks of traditional methods are discussed
*
Работа выполнена при поддержке: РФФИ (гранты № 08-01-00473), г/б № 2.1.2.1652.