№ 4 (40) 2012
Т. М. Леденёва, докт. техн. наук, профессор, заведующая кафедрой Воронежского государственного университета
С. А. Моисеев, аспирант Воронежского государственного университета
Формализация свойств интерпретируемых лингвистических шкал и термов нечетких моделей
Теория нечетких множеств привлекает внимание многих исследователей. Вместе с тем значимым аспектом остается повышение эффективности ее практического применения, для чего необходимо решить ряд задач.
Введение
Одна из важнейших задач, решаемых на этапе проектирования нечеткой системы, — задача формирования базы знаний, в рамках которой формируются лингвистические шкалы для входных и выходных переменных. Данная статья посвящена вопросу выбора критериев интерпретируемости нечеткой модели, которые возникают при автоматизированном формировании лингвистических шкал на основе обучающего набора данных.
Основными «интеллектуальными» компонентами нечеткой системы является база нечетких продукционных правил, отражающая взаимосвязи между входными и выходными переменными, и база данных, содержащая сведения о параметрах системы — лингвистических переменных, диапазонах изменения значений переменных, критериях оценки работы системы. Традиционно построение баз правил и баз данных нечетких систем предполагает использование двух подходов: основанного на привлечении знаний экспертов и автоматического (автоматизированного) подхода. В связи со сложностями, с которыми сталкиваются эксперты при выполнении подобных работ, в настоящее время активно развивается вторая группа методов, при этом широкое распространение получили эволюционные и генетические алгоритмы, что обусловлено их способностью нахо-
дить глобальные и локальные оптимумы заданной целевой функции, которая, в случае формирования и настройки базы данных нечеткой системы, представляет собой определенный критерий качества, позволяющий оценить эффективность разбиения входного пространства на составляющие терм-множества, и задание соответствующих отношений на этом множестве для построения лингвистической шкалы. Вопросами построения оптимальных лингвистических шкал занимались такие исследователи, как А. Пигат [1], Й. Калерт [2], Д. Дрянков [3]. Также было предложено большое количество различных нечетких индексов, позволяющих по-разному оценивать нечеткое разбиение исходного набора данных. Сравнение индексов нечеткого разбиения для разных методов кластеризации изложено в [4].
Проблема соотношения интерпретируемости и точности нечеткой системы
При проектировании нечеткой системы следует оптимальным образом определить как базу правил, так и базу данных. Критерий оптимальности может быть различным в зависимости от того, какого типа нечеткую систему необходимо получить. Нечеткое моделирование характеризуется набором свойств, которые дают представление о качестве полученных нечетких моделей:
№ 4 (40) 2012
1. Интерпретируемость — относится к способности нечеткой модели отражать работу системы в понятной для человека манере, т. е. представляет собой показатель того, как легко человек может понять поведение нечеткой модели. Данное свойство при проектировании нечетких систем рассматривается на нескольких уровнях. На уровне нечетких терм-множеств лингвистических переменных интерпретируемость может означать возможность назначить каждому терму ясное, понятное человеку в терминах рассматриваемой предметной области значение. Расплывчатость определения интерпретируемости терм-множеств, а также зависимость от конкретной предметной области предполагает неоднозначность и субъективизм при выборе критериев ее оценки. В общем случае под интерпретируемостью понимается прозрачность работы нечеткой модели для пользователя. Анализируя большинство работ, посвященных анализу интерпретируемости нечетких систем, определяется следующий набор критериев интерпретируемости на уровне нечетких множеств: нормальность, выпуклость, унимодальность, непрерывность. На уровне шкал лингвистических переменных выделяются критерии: наличие отношения порядка на рассматриваемом терм-множестве, разумное количество элементов — термов, различимость элементов, полнота шкалы, равномерность распределения элементов шкалы, наличие граничных нечетких множеств, естественное положение нуля.
2. Точность — относится к способности нечеткой модели адекватно представлять моделируемую систему. Чем ближе модель к системе, тем выше ее точность. Точность нечеткой модели может определяться разными способами, например:
1) общее количество правильно распознанных образов — состояний системы, при этом для повышения точности модели его необходимо максимизировать;
2) общая среднеквадратическая ошибка для всего набора правил, которая может вычисляться следующим образом:
о ^
1 т 2 <Ц
Е = 11 (У(X) - У), |
2 i=1 §
_
где т — размер обучающей выборки; у — ^э выход нечеткой модели для входного вектора; X, у — значение выхода системы для <Б входного вектора X. Для достижения более ¿а высокой точности нечеткой модели следует минимизировать значение данного критерия. к
Указанные свойства являются противоречивыми, так как повышение точности модели обычно достигается увеличением размерности лингвистических шкал и баз правил, усложнением вида функции принадлежности отдельных термов, в то время как для улучшения интерпретируемости нечеткой модели необходимо ее максимальное упрощение, т. е. уменьшение количества продукционных правил, а также количества термов лингвистических шкал, поэтому при решении практических задач большое значение имеет согласованность этих требований. В зависимости от того, какая из указанных характеристик должна проявляться в результирующей нечеткой системе в большей степени, различают:
1) лингвистическое нечеткое моделирование, основной целью которого является построение нечетких моделей с хорошей интерпретируемостью;
2) точное нечеткое моделирование — для получения нечетких моделей с хорошей точностью.
Рассмотрим содержательное и формальное определение составляющих понятия интерпретируемости нечетких множеств и лингвистических шкал.
Критерии интерпретируемости нечеткой системы
Нормальность нечеткого множества означает, что существует как минимум один элемент из области определения, степень принадлежности которого нечеткому множеству равна 1: 3 х е и: (х) = 1. С понятийной точки зрения нормальность означа-
ет, что присутствует как минимум один такой элемент, который полностью соответствует семантике, представляемой нечетким множеством. Если максимальная степень принадлежности элементов из области определения нечеткому множеству меньше единицы, такое множество является субнормальным. Приведение субнормального нечеткого множества к нормальному возможно следующим образом:
V х е U : цл'(x) =
Ц л(х)
1
t §
I
£ со
i
i I
is is
I
§
I
i S
£
0
is §
1
t e
supЦл (x)
Выпуклость нечеткого множества означает, что значения функции принадлежности, принадлежащие любому интервалу, не меньше, чем значения функции принадлежности в граничных точках этого интервала:
Va,b,x eU: a < х < b ^ц л (х) > min{|j, л (а),ц л (b)}.
Выпуклость — важное требование для обеспечения интерпретируемости, она может рассматриваться как обобщение свойства нормальности, когда происходит постепенное уменьшение принадлежности при устремлении элементов множества к его границам.
Унимодальность нечеткого множества заключается в том, что существует только один элемент данного нечеткого множества с максимальным значением функции принадлежности:
3a eU :(ц л (a)=max ц л (x),Vb ф а: ц л (b) <ц л (a)).
Указанный элемент называется модальным значением нечеткого множества. Свойство унимодальности — это следствие свойства строгой выпуклости нечеткого множества. При невыполнении требования унимодальности различные модальные значения становятся неразличимы и могут привести к построению неэффективных моделей. С учетом приведенного определения треугольные нечеткие числа и гауссовы нечеткие числа являются унимодальными.
Непрерывность нечеткого множества заключается в непрерывности функции принадлежности на области определения не-
четкого множества. Данное свойство выполняется для треугольных, трапециевидных и гауссовых нечетких чисел.
Отношение порядка — это нечеткое бинарное отношение, обладающее некоторыми свойствами. Так, отношение нестрогого порядка обладает свойствами транзитивности, антисимметричности и рефлексивности. Отношение строгого порядка обладает свойствами транзитивности, антисимметричности и антирефлексивности. При построении лингвистической шкалы необходимо получить конечное линейно упорядоченное множество термов. Линейная упорядоченность множества А, частично упорядоченного отношением порядка Я, имеет место в том случае, если в нем любые два элемента сравнимы по отношению Я. Это означает, что в линейно упорядоченном множестве для любых двух элементов а и Ь имеет место одно и только одно из соотношений: либо а < Ь, либо а > Ь. Исходя из представленного определения, для задания отношения порядка на наборе нечетких множеств необходимо определить операцию сравнения нечетких множеств, заданных на одном универсуме, друг с другом. Один из подходов — использование индекса ранжирования, который является четкой функцией от нечетких аргументов. Значения индекса для конкретной пары нечетких чисел дают основание решить вопрос о том, какое из двух чисел и с какой степенью больше другого. На данный момент предложено большое количество индексов ранжирования применительно к нечетким числам общего вида. Например, Д. Дюбуа и А. Прад представили в [5] четыре индекса ранжирования. При предположении, что носители нечетких чисел разделены на непересекающиеся подмножества следующим образом:
где Эл
■ = S и Sv
Ss —
Sb = SB и SB ,
области левее максимума
функции принадлежности, а SA ,SB — соответственно, правее максимума функции принадлежности, имеем четыре индекса Дюбуа-Прада:
№ 4 (40) 2012
/1( A, B) = sup iTiin(p. a (х), Ив (У)).
X>Y ,XeSA YeSB
Указанный индекс показывает возможность присвоить х значение, по крайней мере, не меньшее, чем у.
/2(A,B) = XТЭХ(Иа(Х),1-Ив(У)).
Эта величина интерпретируется как возможность того, что наибольшие значения переменной х будут больше наибольших значений переменной у.
ЦA,B) = X>Jnf Y S Tax(1 И а(х),Ив(У)).
X >Y X GSa , Y eSg
Эта величина интерпретируется как необходимость того, что наименьшие значения, принимаемые переменной х, будут, по крайней мере, равны наименьшим значениям переменной у.
Ц A,B) = 1- sup тт(и a (х), Ив (у)).
X<Y,XeSA YeSB
Эта величина интерпретируется как необходимость того, что переменной х могут присваиваться только большие значения по сравнению с переменной у.
Возможны другие способы сравнения нечетких чисел. В работе [6] в качестве индекса ранжирования используется интеграл функции, вычисляющей середину носителя а-уровня нечеткого числа:
/(A) = j
a (а) + a+ (а) 2~
d а, a+ (а) =
= sup(х),а (а) = ^(х),х е Аа.
Также используется подход, в котором выполняется построение нечеткого числа
С =
A
с последующим вычислением ин-
А + В
декса ранжирования:
0,5 1
/(А, В) = } (1-|с (х))бх + }|с (х)бх .
0 0,5
При этом, если /(А,В) > 0,5, то принимается, что А > В.
Другим способом проведения ранжирования является вычисление математического ожидания случайной величины, в качест-
ве функции плотности распределения вероятностей которой принимается функция принадлежности нечеткого числа:
/(A) = ■
J х и а (х)dх _
J И а (х)dх
где NA — носитель нечеткого числа А.
Также возможен подход, при котором значением индекса ранжирования выступает модальное значение нечеткого числа: / = агд^ир^ (э))).
Еще одним подходом является использование в качестве индекса ранжирования «центра тяжести» нечеткого числа:
х * 1
/ = х*: } |а (х)^х =1} |а (х)^х .
Сравнение указанных индексов для случая треугольных чисел приведено в [7]. Также в указанной статье предлагается построение интегрального критерия для повышения устойчивости сравнения нечетких чисел.
Разумное количество элементов предполагает, что количество элементов семейства нечетких множеств не превышает 9. Это ограничение было получено в результате исследований в психологии и рассматривается в ряде публикаций. Эксперименты Дж. Миллера [8] показали, что человек способен запоминать, воспринимать и обрабатывать в короткий промежуток времени сущности, количество которых равно 7 ± 2, в зависимости от сложности рассматриваемого предмета. Эти результаты дали научное обоснование необходимости уменьшения сложности моделей на всех уровнях при построении интерпретируемых систем. Однако данному психологическому ограничению можно придать меньшее значение, когда нужно повышение точности модели для улучшения описания поведения реальной системы.
Различимость предполагает, что любое нечеткое множество в рассматриваемом наборе множеств должно быть хорошо отличимо от остальных. Это одно из наиболее об-
8 о
<u it
129
а
1
!
I £ £ со
!
1
I £ £
I
€ I
I
Й §
£
0
3 §
1
I в
щих ограничений интерпретируемости, которое признано большинством исследователей как существенное. Грубо говоря, различимые нечеткие множества хорошо обособлены и представляют отдельные концепты, а также могут быть назначены семантически различным лингвистическим значениям. Хорошо различимые нечеткие множества обладают следующими преимуществами:
1) уменьшение субъективности при установлении ассоциаций с лингвистическими значениями [9];
2) устранение потенциально возможной противоречивости нечетких моделей [10];
3) исключение избыточности модели и вычислительной сложности [11];
4) упрощение лингвистической интерпретации нечеткой модели ввиду того, что нечеткие множества представляют хорошо разделимые концепты [11].
Полностью обособленные нечеткие множества максимально различимы. Однако для интерпретируемых нечетких моделей обычно присутствуют требования пересечения нечетких множеств. Таким образом, различимость должна быть учтена вместе с другими ограничениями при проектировании нечетких систем.
Требование различимости может быть формализовано различными способами. Наиболее общеупотребительна формализация на основе мер сходства. Сходство рассматривается как нечеткое отношение, определенное на нечетком множестве и показывающее, насколько рассматриваемые нечеткие множества являются идентичными друг другу.
Меры сходства хорошо характеризуют понятие различимости, но их вычисление обычно трудоемко, вследствие чего большинство стратегий, которые принимают сходство за основную характеристику интерпретируемости, основаны на применении таких техник, как генетические и эволюционные алгоритмы, коэволюция, многокритериальная генетическая оптимизация.
Различимость как вероятностная характеристика не является мерой сходства, однако может быть интерпретирована как степень
удовлетворения нечеткого требования «Х это А». Также вероятностная мера различимости между нечеткими множествами часто может быть определена аналитически, что делает процесс вычислений менее трудоемким.
Полнота лингвистической шкалы означает, что каждый элемент из множества определения принадлежит, по крайней мере, одному нечеткому множеству из данной шкалы: Ух е и 3 А е L : цА (х) > 0. Также существует обобщение указанного определения полноты для ситуации, когда каждый элемент из области определения принадлежит как минимум к одному нечеткому множеству со степенью принадлежности не меньшей, чем а: Ух е и 3 А е L : цА (х) > а. Это требование называется а-полнотой. Полнота является свойством дедуктивных систем для обозначения того, что схема логического вывода, основанная на знаниях, может представить любой элемент рассматриваемой области. Применительно к нечетким моделям это означает, что нечеткая модель должна быть способна произвести правильный логический вывод для каждого входного значения. Однако при автоматическом построении нечетких моделей из данных требование полноты может быть нарушено, например, из-за переобучения модели [12]. Для описания а-полноты была предложена следующая мера [13]:
CDа =
I
{х еи:тах цА (х )>а
бх
Ых
Также В. де Оливейра в [14] предложил более общий критерий для обеспечения а-полноты:
Ух е и : Р/X (х) > а,
\Х еF
однако без приведения доказательства его эффективности.
Комплементарность — для каждого элемента области определения сумма значений функции принадлежности для набора термов должна быть равна единице:
Ух е и : £цх(х) = 1.
С семантической точки зрения данное свойство отражает тот факт, что, когда
№ 4 (40) 2012
данный концепт не полностью представляет элемент, существует другой концепт, который, по крайней мере частично, представляет указанный элемент. Сюда относится требование того, что для любого элемента области определения не может быть более двух нечетких множеств с ненулевыми значениями функции принадлежности:
Ух е и :|{X : |х (х) > 0} < 2.
Соблюдение требования комплементар-ности позволяет интерпретировать значение функции принадлежности |А (х) как вероятностную меру наступления события «х это А», что позволяет использовать для анализа нечетких моделей мощный аппарат теории вероятности и математической статистики.
Равномерная грануляция — требование выражается в том, что мощности всех нечетких множеств рассматриваемой шкалы должны быть примерно одинаковы:
УА,В : |А| = |В|.
Данный критерий может быть формализован путем фиксации класса функций принадлежности, которые характеризуются некоторыми параметрами. Равномерная грануляция при этом обеспечивается путем установления границ изменения указанных параметров или путем назначения штрафа в зависимости от текущего значения параметра:
Gr(p) =-1--
1 + ехр(-(р - рт|П)/ о р)
1
1 + exP((P - Pmax ) / 0p )
где p — рассматриваемый параметр, pmin, Pmax— соответственно, минимальное
I t in I'' max
и максимальное значения параметра, о p — среднеквадратическое отклонение. Данное свойство является желательным для повышения интерпретируемости нечеткой модели.
Требование существования крайних левого и правого термов лингвистической шкалы заключается в том, что в шкале должны присутствовать два экстремальных нечетких
множества, которые полностью представляют граничные значения области определения: 3 A,B : иа(minU) = 1;ив(maxU) = 1. Впервые указанное свойство было явно предложено М. Чоу в [15]. Если на наборе нечетких термов введено отношение порядка, то естественно, что крайний левый терм будет первым термом шкалы, в то время как правый — последним. С семантической точки зрения, требование существования правого и левого нечетких множеств имеет большое значение, поскольку в случае нарушения интерпретируемость нечеткой модели может ухудшиться. Важно учитывать данное ограничение при формировании качественных лингвистических шкал, в которых термы представлены такими значениями, как «высокий», «холодный», «зеленый», поскольку их восприятие в большей степени зависит от интуиции человека. Для шкал, выражающих количественные характеристики («примерно 5» ), подобные граничные нечеткие множества могут отсутствовать, поскольку в подобных случаях экстремальные значения шкалы не имеют большого значения для улучшения интерпретируемости.
Требование естественного расположения нуля заключается в том, что если область определения содержит нуль, то в шкале должно быть нечеткое множество, отражающее данный факт: 0 e U ^3 A : иа(0) = 1. Согласно утверждениям авторов, предлагающих применять это требование, естественное положение нуля является специфическим ограничением предметной области, особенно полезным при решении задач управления [14].
Безошибочное восстановление заключается в том, что каждый элемент области определения х должен быть точно восстановлен путем применения соответствующего отображения D :[0,1]n ^ R на множестве значений его функций принадлежности: Ух e U : D^^ (х),иа(х),...,иа (х)) = х. Указанное ограничение гарантирует, что «внутреннее представление» элемента х области определения, состоящее из значений функций принадлежности Ид (х),Иа2(х),...,ИА„(х), явля-
131
8 о
<u
I
№ 4 (40) 2012
ется точным и однозначным представлением элемента x. С точки зрения интерпретируемости это означает, что преобразование, выполняемое в результате фаззифика-ции с применением данной лингвистической шкалы, является логичным и ясным. Также при анализе интерпретируемости применяется менее строгая форма требования безошибочного восстановления:
3 D : [0,1]" ^ ^ R,Vx е U : А(x),цa2 (x),..., цАп (x)) = x.
Заключение
В статье даются формальные и семантические определения основных свойств, являющихся значимыми для интерпретируемости лингвистических шкал и составляющих их отдельных нечетких множеств. При проектировании нечетких моделей реальных Ц систем следует обеспечивать надлежащее * соотношение точности и интерпретируемо-| сти, с учетом того, что эти глобальные ха-| рактеристики противоречивы. « Авторами рассмотрены свойства, относящиеся к представлению нечеткой системы ® на уровне базы данных. Однако для даль-5! нейшего повышения качества системы не-li обходимо включать в рассмотрение и свой-| ства, обеспечивающие интерпретируемость базы правил, а также механизмы, позволяю-§ щие гарантировать заданный уровень ин-Ц терпретируемости и точности. Для решения ¡s задачи, которая включает как параметриче-§ скую, так и структурную оптимизацию, могут | использоваться разные техники оптимизации, например, эволюционные и генетические алгоритмы. Целью дальнейших исследований авторов работы является примене-i ние многокритериального эволюционного & алгоритма для решения подобных задач.
" Список литературы
£
Ц 1. Piegat A. Fuzzy Modelling and Control. Springer.
§ Р. 728, 2001. a
2. Kahlert J., Frank H. Fuzzy-Logic and Fuzzy-Control.
© Braunschweig, BRD: Vieweg Verlag. Р. 353. 1994.
3. Driankov D, Saffiotti A. Fuzzy Logic Techniques for Autonomous Vehicle Navigation, Springer. Р. 343366. 2001.
4. Halkidi M, Batistakis Y, Vazirgiannis M. Clustering Validity Checking Methods: Part II. SIGMOD Record, Vol. 31, Issue 3. Р. 19-27. 2002.
5. Дюбуа Д., Прад А. Теория возможностей. Применение к представлению знаний в информатике. М.: Радио и связь, 1990. С. 288.
6. Борисов А. Н., Алексеев А. В., Меркурьева Г. В. и др. Обработка нечеткой информации в системах принятия решений. М.: Радио и связь, 1989. С. 304.
7. Скороход С. В. Анализ индексов ранжирования нечетких чисел треугольного вида // Известия ЮФУ. Технические науки. 2010. № 5. С. 91-95.
8. Miller G. A. The magical number seven, plus or minus two: Some limits on our capacity for processing information. The Psychological Review, 63. Р. 8197. 1956.
9. Valente de Oliveira J. On the optimization of fuzzy systems using bio-inspired strategies // Proc. IEEE International Conference on Fuzzy Systems. Vol. 2. Р. 1229-1234. 1998.
10. Valente de Oliveira J. Towards neuro-linguistic modeling: Constraints for optimization of membership functions. Fuzzy Sets and Systems, Vol. 106, Issue 3, Р. 357-380. 1999.
11. Setnes M, Babuska R., Kaymak U., Van Nauta Lemke H. R. Simularity measures in fuzzy rule base simplification. IEEE Transactions on Systems, Man and Cybernetics, Vol. 28 (3). Р. 376-386. 1998.
12. Jin Y., Von Seelen, W. Sendhoff, B. On generating FC3 fuzzy rule systems from data using evolution strategies. IEEE Transactions on Systems, Man and Cybernetics, p. B, 29 (6). Р. 829-845. 1999.
13. Meesad P., Yen G. G. Quantitative measures of the accuracy, comprehensibility, and completeness of a fuzzy expert system // Proc. IEEE International Conference on Fuzzy Systems. Р. 284-289. 2002.
14. Valente de Oliveira J. Semantic constraints for membership function optimization. IEEE Transactions on Systems, Man and Cybernetics, part A. Р. 128-138. 1999.
15. Chow M.-Y., Altug S., Trussel H. J. Heuristic constraints enforcement for training of and knowledge extraction from a Fuzzy / Neural architecture — part I: Foundation. IEEE Transactions on Fuzzy Systems, 7 (2). Р. 143-150. 1999.