УДК 615.47
МЕТОД СИНТЕЗА НЕЧЕТКИХ РЕШАЮЩИХ ПРАВИЛ ДЛЯ ОЦЕНКИ СОСТОЯНИЯ СЛОЖНЫХ СИСТЕМ ПО ИНФОРМАЦИИ О ГЕОМЕТРИЧЕСКОЙ СТРУКТУРЕ
МНОГОМЕРНЫХ ДАННЫХ
Н.А. Кореневский, Е.Б. Рябкова
В работе рассматриваются вопросы построения функций принадлежностей к исследуемым классам состояний сложных систем с базовой переменной, определяемой как мера близости до многомерных разделяющих поверхностей и эталонных структур
Ключевые слова: разделяющая поверхность, эталон, функция принадлежностей, коэффициент уверенности
Одним из распространенных подходов к решению задач классификации по многим признакам является теория распознавания образов в её геометрической интерпретации, когда для определения различных классов состояний в многомерном пространстве признаков (чаще всего в Евклидовом) используются многомерные разделяющие поверхности.
Исследуемые классы состояний представляют собой некоторые многомерные гиперобъемы достаточно сложной конфигурации, которые редко имеют аналитическое описание и, более того эти гиперобъемы могут сильно пересекаться, причем зону пересечения определить гораздо сложнее, чем «основной» четко определяемый класс состояний.
В этих условиях для построения аналитических моделей классификации часто используют так называемые обучающие выборки описываемые таблицами экспериментальных данных с заранее известной классификацией.
Обычно каждой строке такой таблицы соответствует многомерный объект (вектор) пространства признаков, а совокупность этих объектов с заранее известной классификацией представляет собой некоторое множество, принадлежащее исследуемым классам состояний. В процессе синтеза решающих правил с использованием объектов обучающей выборки производится поиск таких типов и параметров разделяющих поверхностей, которые позволяют отделить друг от друга многомерные области различных классов состояний. Процесс такого синтеза принято называть процессом обучения.
В зависимости от используемых математических моделей в ходе обучения получают линейные, кусочно-линейные, кусочно-нелинейные и нелинейные разделяющие поверхности.
Задача классификации неизвестных объектов заключается в определении местоположения объ-
Кореневский Николай Алексеевич - ЮЗГУ, д-р техн.
наук, профессор, тел. (4712) 58-70-98
Рябкова Елена Борисовна - ЮЗГУ, аспирант, тел. (4712)
58-70-98
ектов относительно разделяющей гиперповерхности.
Если объект лежит по ту же сторону от разделяющей поверхности, что и исследуемая классификационная гиперобласть, то он относится к соответствующему классу состояний.
В некоторых моделях области различных классов заполняются различными эталонными объемами имеющими известные и достаточно простые аналитические описания (гиперкубы, ги-перпараллепипеды, гиперромбы, гиперсферы, гиперцилиндры, гиперэлипсоиды и т.д.). На этапе обучения количество, объем и формы элементарных гиперобъемов подбираются так, чтобы полностью «заполнить» исследуемый класс состояний.
Классификация осуществляется по «попаданию» неизвестных объектов в элементарные объемы того или иного класса.
В ряде методов разделяющие поверхности явно не присутствуют. В этом классе методов выбираются некоторые эталонные точки различных классов состояний (например, центры классов). Для объекта с неизвестной классификацией решение в пользу того или иного класса принимается по величине расстояния между этим объектом и эталонными точками.
Во всех этих методах классификации принимается четкое решение. Объект либо принадлежит к тому или иному классу состояний, либо не принадлежит [1.2].
В тоже время при таком механизме классификации возникает ряд нерешенных вопросов. Например, как классифицировать объект если он располагается на границе раздела альтернативных классов, как производить классификацию если классы в исходном пространстве пересекаются, что делать если границы классов изменяются во времени и т.д.
Ответы на эти вопросы можно получить, если от четкой классификации перейти к нечетким понятиям аналогично тому, как это сделано в классической теории нечеткой логики принятия решений [3,4].
Практически во всех методах использующих геометрическое представление классов состояний определены меры близости (расстояния) между точками, разделяющими поверхностями и други-
ми эталонными структурами, используемыми для классификации. Это позволяет говорить о том, что чем дальше мы удаляемся от области заполняемой объектами исследуемого класса состояний, даже не переходя в альтернативные классы, тем с меньшей уверенностью можно делать вывод о том, что объект относится к этому классу состояний. Можно на экспертном уровне решить вопрос и о том с какой уверенностью о классификации можно говорить об объекте находящемся на границе класса.
В другом варианте можно говорить об уверенности в классификации по расстоянию от исследуемого объекта до эталонных точек и до других многомерных объектов принадлежащих альтернативным классам и т.д.
Таким образом, расстояния между эталонными структурами исследуемых классов и различными точками многомерного пространства признаков можно рассматривать как базовые переменные для вынесения суждения о том насколько исследуемый объект может принадлежать к тому или иному классу состояний. Это означает, что может быть поставлен вопрос о построении функций принадлежностей к исследуемому классу (области) состояний со шкалой, определяемой как мера близости в многомерном пространстве признаков, причем сама функция принадлежностей остается как и в классической теории нечеткой логики принятия решений одномерной.
Для определенности, по аналогии с нечеткой логикой принятия решений, базовыми переменными назовем вводимые шкалы расстояний.
Если в многомерном пространстве признаков существует разделяющая гиперповерхность между парами альтернативных классов вида У = Г (А, X), то функция принадлежности к
классу <а( может быть определена на базовой переменной Б определяемой как мера близости от объекта с координатами X = (х1, х2,..., хп) до этой поверхности, где х1,...хп - координаты объекта в многомерном пространстве размерностью п . Вектор А = (а1,...,ап) определяет положение разделяющей поверхности в многомерном пространстве определяемом координатами х1 ,...хп . Этот вектор можно рассматривать как вектор настраиваемых параметров, определяемый в процессе обучения по критерию минимума ошибки классификации на объектах обучающей выборки. При выборе формы и параметров функций принадлежностей /и (Б)
следует руководствоваться достаточно простым правилом. Для объектов «удаляющихся» от разделяющей границы в сторону объектов альтернативных классов величина функций принадлежностей убывает. Для объектов удаляющихся от границы в сторону «скоплений» объектов «своего» класса функция принадлежностей возрастает, вплоть до числа определяющего максимальное доверие экспертов к тому набору признаков, которое участву-
ет в решении искомой задачи. В такой интерпретации функцию принадлежности вычисленную в
* / * * * \ конкретной точке X = (Xj, х2,...,хп) можно рассматривать как коэффициент уверенности КУш1 в гипотезе ю( по Е. Шортлифу, то есть:
*
КУ" =Иы[D (X ,Fot (А,X))] (1)
Другим подходом к классификации в многомерном пространстве признаков является подход связанный с определением мер близости до некоторых эталонных объектов (например правило К
- ближайших соседей). В нечеткой интерпретации
мера близости D' от точки X = (,...,х‘п) до
эталона класса <п, с номером r может интерпретироваться как базовая переменная соответствующей функции принадлежностей /иг (D\) .
Если каждый класс ю( представляется одним эталоном, например своим математическим ожиданием, то принятие решения о классификации может осуществляться с помощью операции max: КУ^ = max{ МШ( (Dt)\.
Если каждый из классов представляется несколькими эталонами, то агрегация функций принадлежностей для одного класса может производиться по различным формулам, в зависимости от той роли которой эксперты наделяют каждый из эталонов. Например, если все эталоны класса равноправны и близость к одному из них рассматривается как близость к объектам всего класса, то агрегация по эталонам одного класса может осуществляться с использованием операции max. Тогда решение о классификации будет определяться выражением
КУ = max
04 l
{ max [< (Di)])
В другой интерпретации близость к классу ю( может определяться по «средневзвешенной» близости ко многим эталонам исследуемого класса состояний и т.д.
Проведенные нами исследования показали, что при решении задач определения структуры исследуемых классов с одновременной оценкой вида и параметров функций принадлежностей удобно использовать различные типы гистограмм, которые для удобства рассуждений выделены нами в две группы.
Первая группа гистограмм распределения исследуемых классов является традиционной для статистического анализа и строится на шкалах совпадающих с выбранными классификационными признаками XI. Вторую группу гистограмм не менее (а
иногда и более) значимую в задачах оценки структуры исследуемых классов и выбора типов и параметров функций принадлежностей составляют гистограммы которые отражают распределение исследуемых классов на шкалах определяемых как меры близости до эталонных многомерных структур (то-
чек, гиперплоскостей, гиперкубов, гипперпаралле-пипедов, гиперсфер и т.д.) названных нами дистальными гистограммами. При построении таких гистограмм шаг разделения соответствующих шкал ё по крайней мере на начальном этапе, удобно выбирать исходя из известной формулы Стреджесса
Г...
А = -
где Г
тах
(1 + 3.321т;
- расстояние между наиболее удаленными объектами обучающей выборки по шкале й ; п
- количество объектов обучающей выборки.
Величина q -го столбца дистальной гистограммы определяется отношением числа объектов попадающих в интервал dq + Лй к величине п . ч
В качестве конкретного примера рассмотрим рекомендации по определению формы и параметров функций принадлежностей к двум альтернативным классам ®£ и ог относительно линейной
разделяющей поверхности (ЛРП) вида:
п
2а(х( = а , (2)
1=1 0
где а0, а! ,..., ап - вектор, настраиваемых в процессе обучения параметров; х! ,., хп - координаты пространства и информативных признаков.
Предположим, что настраиваемые параметры разделяющей поверхности определены на объектах обучающей выборки одним из известных в теории распознавания образов способов по критерию минимума ошибки классификации[1,2].
Для построения соответствующей дистальной гистограммы выбираем шкалу типа:
У =пах (3)
1=1
Нетрудно показать, что величина У пропорциональна расстоянию от гиперплоскости типа (2) до точки многомерного пространства с координатами х! ,., хп
Пусть в двумерном пространстве признаков
(х1, х2} классы о 1 и ог имеют зону пересечения
порождающую зону пересечения гистограмм ко>^ и
И0г распределения классов о£ и ог по шкале У
(рисунок). Факт такого пересечения может быть установлен методами разведочного анализа [3].
Вариант расположения дистальных гистограмм с соответствующими функциями принадлежностей по шкале У
Рассмотрим теперь механизм построения классам <п( и ог представляющий собой набор
функций принадлежностей доя в^1ражения (2.1) к рекомендаций экспертам по выбору формы и пара-
метров этих функций в зависимости от структуры и свойств исследуемых классов с учетом формы и параметров соответствующих гистограмм распределения классов по шкале У .
На первом этапе выбора формы и параметров функций принадлежностей /- и иШг (У) к классам о£ и ог с базовой переменной У рекомендуется определить опорные области и точки этих функций, относительно которых определяются их остальные элементы. При этом следует иметь в виду, что гистограммы распределения классов отражают только частость появления события и обладает тем свойством, что площадь под их кривой ровна единице. При этом максимальные значения гистограмм значительно меньше единицы, несмотря на то, что физически могут существовать участки на их шкалах, где можно говорить с большой уверенностью о принадлежности объектов к исследуемым классам состояний. Кроме того меньшие, а иногда и нулевые значения амплитуд гистограмм на некоторых участках шкал могут быть связаны только с тем, что в силу некоторых причин (ограниченности объемов выборок, редкость появления событий, физическая нереализуемость событий и т.д.) в выборке отсутствуют объекты соответствующие значениям шкал на которых строится гистограмма. В то же время появление этих значений на числовых шкалах с учетом существа и особенностей задачи может сопоставляться с большой (и даже единичной) уверенностью в принимаемых решениях.
Таким образом, амплитудная характеристика гистограмм должна очень осторожно учитываться при выборе амплитудной характеристики соответствующих функций принадлежностей.
Вторая особенность, которую следует обязательно учитывать при выборе вида и параметров соответствующих функций принадлежностей, заключается в свойствах, используемых разделяющих поверхностей, в частности ЛРП. Эта особенность заключается в том, что при выбранном
У = а разделяющая поверхность типа 2 делит все
00
пространство признаков на два подпространства, в котором располагаются исследуемые классы.
Однако значительное число реальных объектов располагающихся в этих подпространствах могут не принадлежать этим классам (например точки А, В и С рисунка 1), тогда как решающим правилом типа 2 они будут ошибочно классифицироваться как объекты принадлежащие к классам о £ и о г.
С учетом этих двух замечаний выбор формы и параметров функций принадлежностей с базовой переменной определяемой относительно ЛРП предлагается выполнять по следующей схеме.
1. На начальном этапе построения функций принадлежностей определим следующие опорные точки и области функций принадлежностей классов о£ и ог:
- интервал шкалы У соответствующий не нулевым значениям ио£ (У) и ио (У) называемый по
аналогии с классической нечеткой логикой Л. Заде носителем соответствующих функций принадлежностей:
- левая граница класса о £ располагаются слева по шкале У определяемая как точка в которой функция принадлежностей переходит от нулевых к положительным значениям (левая граница носителя класса о £)- У£ ;
- правая граница носителя класса о£ - Уп£;
- левая граница носителя класса сог - Ужг;
- правая граница носителя класса со г - Уп ;
- область (точка) максимальных значений функций принадлежностей классов о£ и ог.
- области нарастания и спада значений функций принадлежностей относительно возрастающих значений базовой переменной У .
- максимальные значения функций принадлеж-
, ,т
ностей классов о£ и аг -и, иог.
Аналогичные параметры определим для гистограмм распределения классов со, и ог -к щ и к о .
Для того чтобы различать координаты левых и правых границ функций принадлежностей и соответствующих гистограмм, для последних введем понятие нижних и верхних границ - Ун£, Ув£, Уш , Увг .
Основная задача экспертов при построении графиков функций принадлежностей на базовой переменной У заключается в том, чтобы зная геометрические свойства ЛРП, особенности структуры диагностических классов и анализируя форму и взаиморасположение гистограмм определить координаты Уп£, У£ , Упг , Уш , форму и параметры восходящих (нарастающих) ( /'+, /+ ) и нисходящих (спадающих) (/ -, /) ветвей функций принадлежностей и участки их максимальных значений (ит с левой Ут и правой У^ границами, и с левой У” и правой У™ границами). Таким образом, в общем виде функции принадлежностей определяются функциональными зависимостями типа:
и (У) = р^у^у*./+,/-,и];
и(У) = РЛУ^УгЛ,/--,,^]. (4)
2. При выборе максимальных значений функций принадлежностей ит и ит эксперты формально могут считать, что левее координаты Унг (рис. 1) правило типа (2) не совершает ошибочных классификаций по классу и что правее координаты УВ£ не совершается ошибочных классификаций по классу ог. То есть зона ошибочной классификации для объектов обучающей выборки ограничивается интервалом [ Унг, УВ£ ]. Если эксперты
полностью доверяют обучающей выборке и считают ее исчерпывающе полной и если их устраивает гипотеза о том, что вне гиперобъемов классов и
ог объекты «чужих классов» не появляются, их следует классифицировать по положению в пространстве признаков только по отношению к ЛРП с «порогом» У0, то и" = 1,0 для всех У лежащих левее Ут и иГ = 1,0 для всех У лежащих правее У.
Однако на практике из-за ограниченного объема обучающей выборки, ограниченных информативных возможностей используемого пространства признаков, из-за возможного наличия объектов не принадлежащих исследуемым классам (точки А, В, С рис. 2.5) и ряда других факторов возможны ошибки классификации как внутри, так и вне интервала [Уяг,УВ£ ].поэтому реальные значения /иЛ и и" выбираются несколько ниже значения 1,0. Для уточнения значений л” и применительно к ЛРП могут использоваться два параметра. Мера доверия к используемому пространству информативных признаков МД(Х) и мера недоверия к используемому решающему правилу (МНД (Я)), поскольку ЛРП не выделяет области занимаемых объектами исследуемых классов, а делит пространство признаков на две части, куда могут попадать объекты не только классов о£ и ог, но и других неизвестных (не исследуемых) классов. Дополнительную меру недоверия может составить отношение экспертов к возможности получения максимально достоверной информации по на используемым информативным признакам, например, с учетом имеющихся в конкретном лечебном учреждении возможностей МНД(Р).
Таким образом, величины л” и определяются зависимостями:
ит = Гт,[МД, (X),МНД£ (К),МНД, (Р)] ; (5)
ит = Ртг[МДг(Х ),МНДг (К),МНД г (Р )] .
Если эксперты соответствующие меры доверия и недоверия определяют в том смысле как это принято в теории уверенности Шортлифа, то выражения принимают конкретные формы типа:
ит = МД£ (X) - МНД, (К) - МНД, (Р) + МНД, (К) ■ МНД, (Р), (6)
ит = МДг (X) - МНДг (К) - МНДг (Р) + МНДг (К) ■ МНДГ (Р)
Естественно, что последнее выражение имеет смысл, если мера доверия к используемыми признакам превышает все возможные меры недоверия.
3. При определении координат границ участников максимальных значений л” и л” функций принадлежностей иы(У) и /и„(У) целесообразно учитывать такой фактор как доверие экспертов к элементам обучающей выборки БЕ.
Если эксперты считают, что обучающая выборка достаточно полно описывает состояние системы для классов о£ и ог (полное доверие экспер-
тов к обучающей выборке), то координаты У т , У т ,
П£
У 2, У ПТ, границ максимальных участков л” , следует определять по координатам Ун£, УВ£, Ут и УВг, определяющим положение гиперплоскостей между которыми расположены области исследуемых классов состояний.
В реальных ситуациях координаты признаков описывающих состояние системы находящейся в одном из классов о£ или ог могут выходить за границы гиперплоскостей зафиксированных в пространстве признаков параметрами Ун£, УВ£, Унг и УВг, что будет вызывать «расширение» границ соответствующих гистограмм ко и ко . Это «расширение» целесообразно учитывать при определении границ участков л” и Л .
Рассмотрим более подробно механизм определения координат У™, УП,, У ” , УПГ с учетом фактора БЕ .
3.1. Если эксперты считают, что обучающие выборки и соответствующие им гистограммы к и
ко отражают объективную картину расположения
классов в исходном пространстве признаков и полученные границы гистограмм распределения классов о£ и ог по шкале У будут достаточно устойчиво сохраняться на контрольных выборках и в ходе реальной работы с исследуемыми системами, то рекомендуются координаты Ут, и У” совместить с границами гистограмм альтернативных классов, что будет соответствовать отсутствию ошибок в классификации для максимальных участков соответствующих функций принадлежностей по крайней мере для объектов обучающей выборки. То есть: Ут = Унг; Ут = У,.
3.2. Если у экспертов нет достаточного доверия к обучающей выборке, то решается вопрос о том, насколько далеко могут «раздвинуться» границы гистограмм распределения классов о£ и ог по шкале У .
При этом, если эксперты «связывают» величину «расширения» границ кщ и ко со «скоростью»
уменьшения количества объектов по мере их приближения к границам гистограмм полученным на обучающей выборке, то новые координаты границ гистограмм У* , У*£, У* и У* предлагается производить графическим способом. Для этого строятся линии соединяющие верхние «ступени» гистограмм кщ и ко (пунктирная линия на рис. 1) с их
продолжением до пересечения с осью абсцисс. Эти точки пересечения и являются искомыми координатами «расширенных» границ соответствующих гистограмм. Вновь полученные координаты гистограмм определяют координаты границ участков максимальных значений функций принадлежностей следующим образом: УП£ = У*; Ут = У* .
3.3. Если в условиях п. 3.2. существует возможность произвести оценку «расширения» границ классов о£ и ог на основании дополнительных исследований и (или) экспертных заключений, то в зависимости от имеющихся возможностей решаются следующие задачи:
- формируются дополнительные обучающие выборки, описывающие состояние системы на границах и «за» границами исследуемых классов состояний представленных обучающей выборкой;
- эксперты на признаковом уровне описывают такие состояния системы, когда при известной классификации существует «похожесть» на альтернативный класс;
- эксперты выделяют казуистичные, редко встречающиеся ситуации с известной классификацией.
Для вновь выделенных состояний систем, описываемых в пространстве признаков, используя выражение 3 отмечаются те точки Уч по шкале У ,
которые выходят за первоначальные границы гистограмм полученных на исходной обучающей выборке (рис. 1 точка У^ для класса о£ и точка У2
для класса ог). По координатам этих точек уточняются координаты границ объектов исследуемых классов на оси У . Например, с учетом новых границ класс на оси У представляется интервалом
[ У»0, Ун, ], а класс ог - интервалом [ Ун0, У£г ].
По уточненным границам определяющим отображение исследуемых классов состояний по шкале У рекомендуется выбрать следующие координаты границ максимальных участков функций принадлежностей: Ут = У„°г; У™г = У^ .
3.4. Если рассматривались варианты 3.2 и 3.3 совместно, то эксперты исходя из особенностей решаемой задачи могут: отдавать предпочтение одному из методов; отдать предпочтение «максимальному сдвигу границ» в сторону «своего» класса, т.е. у” = тт(У1,У1) ; Ут = тах^У*,) ; выбрать среднее значение между Ун0, У* и У°, У*£; определить границы Уп£ по правой границе максимального значения гистограммы ко , а границу У2 по левой границе максимального значения гистограммы кщ
3.5. При выборе координат У” и У™г эксперты
могут руководствоваться теми же правилами, что и при выборе УП” и У” с учетом «привязи» к «своим» границам гистограмм кщ и ко . Тогда: в условиях п.3.1 Ут = Ун£, УП”г = УВг; в условиях п.3.2 УП£ = у*, у” = У* ; в условии п.3.3 Ут = У*£, УПг = Увг ; в условиях п.3.4 отдается предпочтение одному из методов: Ут = тт(У° ,У*);
У”г = тах(У0, У*г) ; Ут = (Ун<£ + У*)/ 2,
УП = (Увг + У*г)/ 2 ; уПт, - по левой границе максимального значения гистограммы кщ; Ут - по правой границе максимального значения гистограммы
к .
о
3.6. Дополнительно, при выборе координат Ут и у” экспертами может быть выдвинуто предположение о том, что если по мере удаления от разделяющей границы в сторону противоположную классу ог уверенность в классификации о, сохраняет свое максимальное значение, то левая граница
достигает физически существующих минимальных значений .
Аналогично определяется правая граница класса ог, но в сторону увеличения У при «удалении»
от класса .
В примере приведенном на рис. 2.5 координата УПт, выбрана из условий п.3.3, т.е. Ут = Ун0, а координат Ут из условия п.3.2 (Ут = У*£). Координата Ут выбрана из условия п.3.3 (У” = УВ0£), а Ут из условия п.3.6 (эксперты уверены в том, что по мере удаления объектов класса ог от разделяющей гиперплоскости с параметром У0 уверенность в этом классе не уменьшается).
4. По аналогии с нечеткой логикой Л.Заде носители функций принадлежностей л о (У) и Лт (У) определим как интервалы на У для которых ио (У) > 0 и иог(У) > 0. Левую и правую границу носителя класса о£ обозначим через У£ и УП£ соответственно, а класса ог - Ужг и УП£.
Основным ориентиром при выборе границ носителей соответствующих функций принадлежностей может служить фактор доверия ДЕ определяемый аналогично 3. При этом дополнительным требованием является выполнение следующих неравенств: У, < Ут ; У, > Ут ; Ут < УтПг; Ут > Ут ■
Учитывая, что координаты Ут, и Ут «привязаны» к координатам границ гистограмм альтернативных классов целесообразно границы Уп, и У г выбирать из условия УП£ = У” ; Ужг = УШ,.
Координаты У, и УПг экспертам рекомендуется выбирать с учетом особенности решаемой задачи по одному из предлагаемых способов:
- в условиях подпункта 3.6 пункта 3 эти границы не назначаются;
- симметрично Уш и Уш (Ул = Ут + У т, - У т ;
уп,=ут+у: - ут);
- по профилю линий соединяющих «внешние углы» соответствующих гистограмм (для определения координаты У£ соединяются внешние углы левой ветви гистограммы кщ (пунктир рис. 1), верхняя граница этой ветви /+ переносятся в точку
левой границы л” (при необходимости полученная линия продолжается до пересечения с осью У ), пересечение У с /+ дает координату У, ; аналогично, для ко получают У Пг).
- по координатам точек У°, У*, Ун£ (если они лежат левее Ут) и точек УВг, У* , УВг (если они лежат правее УШГ), (если Ут = У° или УШГ = УВг, то эксперты задают дополнительные точки границ относительно Ут и Ун0, как «запас» на возможные изменения границ соответствующих классов).
При выборе координат границ носителей эксперты должны учитывать тот факт, что эти границы уменьшают «объем» пространства в котором принимаются классификационные решения поскольку фактически появляются две дополнительные ограничивающие гиперплоскости:
V а.х. - У = 0 ;
її ні >
і =1
V аіХі - УВГ = 0 .
(7)
(8)
Эти плоскости «отсекают» объекты пространства признаков не принадлежащие ю £ и лежащее «под гиперплоскостью» (7) и объекты не принадлежащие юг и лежащие «над гиперплоскостью» (8).
С учетом этого мера доверия к используемому решаемому правилу в выражениях 7 и 8 может быть повышена, что повлечет за собой и увеличение лГ и (или) лГ, повышая качество классификации.
Исходя из этого соображения на рис. 1 область классификации слева ограничена координатой
У0
1 ні '
5. При формировании участков сопряжения (восходящих /+, /Щ+ и нисходящих , /ю- участков) функций принадлежностей лю(У) и ло, (У)
предлагается учитывать два фактора.
Удаление координат, описывающих состояние системы (объекта исследования) от разделяющей поверхности (фактор ЬО) и тип ошибок классификации, который выбирается приоритетным при синтезе решающих правил (фактор ТЯ).
При этом фактор ЬО целесообразно учитывать при определении формы и параметров участков /+, /- , а фактор ТЯ при определении участков
/-, / +.
и со1 > и щ
Фактор ТЯ определяет суждение экспертов о том, какой вид ошибок совершаемых решающим правилом наносит меньший «ущерб» исследуемой системе при неправильной классификации ее состояния. В теории принятия решений используют два основных подхода к определению вида ошибок. В первом подходе выделяют ошибки первого и второго рода. Во втором подходе оперируют поня-
тиями диагностической чувствительности, специфичности, эффективности, а так же прогностичной значимости положительных и отрицательных результатов.
В предлагаемой работе фактор ТЯ будем определять по показателям диагностической чувственности (ДЧ) специфичности (ДС) и эффективности (ДЭ).
Известно, что диагностическая чувствительность ДЧ определяется отношением количества объектов исследуемого класса правильно классифицируемых решающих правилом к общему числу объектов класса в обучающей выборке.
Диагностическая специфичность ДС определяется отношением количества объектов альтернативного класса ог правильно классифицируемых решающим правилом к общему числу объектов класса ог в обучающей выборке.
Диагностическая эффективность определяется отношением всех ошибок совершаемых решающим правилом к общему числу объектов в обеих обучающих выборках.
В соответствии с этим определением, если стоит задача уменьшения числа ошибок по классу , при безразличном отношении к числу ошибок по классу ог достаточно «сместить» параметр У0 выражения 3 в строку УВ£. Если на объектах обучающей выборки выполнить неравенство У0 > УВ£, то ДЧ достигает значения единицы (ошибки в классификации о, отсутствуют). Аналогично ДЧ будет увеличиваться при стремлении У0 к УВ*£, к УВ£ (в зависимости от представления экспертов о границах класса определяемых по шкале У ).
С другой стороны, если стоит задача уменьшения ошибок по классу ог при безразличном отношении к числу ошибок при классификации о, необходимо обеспечивать стремление к единице показателя ДС, что соответствует смещению границы У, влево, в сторону Унг, У*, Ун° и т.д. На прак-
тике стремятся к разумному компромиссу между значениями ДЧ и ДС .
С точки зрения выбора формы и параметров участков /щ , /I при необходимости обеспечить превосходство ДЧ над ДС (ДЧ - ДС )>0, необходимо на соответствующем участке шкалы У обеспечить выполнение условия лщ (У) > ЛШ(У) и наоборот при (ДЧ - ДС )<0 необходимо обеспечить
л о(У) < л (У).
Рассмотрим более подробно рекомендации по выбору формы и параметров участков /-, /+ в зависимости от предпочтений по показателям ДЧ,
ДС и ДЭ.
. =1
С учетом ограничений на величины л” и л” удобно максимальные значения ДЧ и ДС выбрать из соотношений: ДЧт = лЛ ; ДСт = лЛ . В качестве одной из основных опорных точек при определении параметров функций принадлежностей на участках /щ, /+ выберем координату Ус для которой Лщ(Ус ) = Лщ(Ус ) .
Если параметр У0 выбирается из условия минимизации общего количества ошибок (ДЭ ^ тт), то при условии ДИ и ДС следует считать, что Ус = У0, а
Л о, (У0) = Л о,, (У0) = ( ЛЛ +Л”)/4 . На промежуточных участках от УП, до УП£ и от Улг до У, целесообразно обеспечить «похожие» формы участков / ~, /+ формам соответствующих участков гистограмм. Такая «похожесть» может быть выполнена прорисовкой «на глаз» с последующей аппроксимацией полученных кривых соответствующими аналитическими выражениями или аппроксимацией по точкам внешних углов гистограмм, например, с использованием метода наименьших квадратов. Такой механизм получения участков /~, /+ использован при построении функций принадлежностей ло,(У) и Ло, (У) приведенных на рисунке
При стремлении увеличить показатель ДЧ следует сдвигать границу У0 вправо, вплоть до У = У0, однако при этом будет уменьшаться показатель ДС (будет увеличиваться ошибка классификации по классу о,). Для объектов обучающей выборки показатель ДЧ определяется через количество объектов п класса удовлетворяющих п п.
пг(Ус) < Ыг( 1 - ДСД ) .
(9)
неравенству V аіхі > Ус . При этом ДЧ = 1 -
N.
где N£ - число объектов в обучающей выборке класса . С другой стороны диагностическая специфичность определяется через количество объектов п, класса , удовлетворяющих неравенству
Я п
2 а1х1 < Ус . При этом ДС = 1--------—. Задав допус-
I=1 N,
тимые величины ошибок для классов и , ,
ДЧД и ДСД соответственно и учитывая, что п ,
и п, определяются выбором координаты Ус получаем условия для выбора этой координаты:
1 -. ПЧЯ .
N.
■> ДЧ Д
1 - Пг(У ) > ДСД .
Nr “ Г
откуда:
пе(Ус) < N(1 - ДЧД);
При стремлении обеспечить максимальное значение ДЧ решается задача с ограничением типа
[1 - Пд(Ус) ^ тах N 7 пг(Ус) < N (1 - ДСД ) .
(10)
В ходе решения (9) или (10) определяется координата Ус для которой
Лю (У) = Лю,(У) =
лЛ +Л
4
(11)
Формулы 9, 10 и 11 написаны с учетом только объектов обучающей выборки. С учетом фактора доверия экспертов к обучающей выборке ДЕ границы гистограмм ко и ко могут расширяться аналогично вариантам описанным в 3. Тогда если у экспертов есть возможность оценить дополнительно возникающие ошибки они должны быть учтены в 9, 10 и 11.
Если такой возможности нет, следует оставить координату Ус без коррекции ДЕ, поскольку расширение границ классов вероятнее всего будет приводить к расширению границ обеих классов. Тогда стремление к улучшению одного показателя качества путем сдвига Ус будет приводить к уменьшению другого показателя качества с риском нарушения условий 9.
После определения координаты средней точки через нее и соответствующие точки границ максимальных участков и границ носителей функций принадлежностей строятся участки /~, /+ , аналогично варианту с условием ДЧ и ДС.
Формирование участков /+, /~ осуществляется аналогично /~, /* но только с учетом фактора ТК . Для каждого из классов эксперты выбирают один из вариантов, связанный с тем, что по мере удаления от разделяющей гиперповерхности: уверенность в принимаемом решении не уменьшается; уверенность уменьшается, повторяя форму соответствующей гистограммы; уверенность уменьшается симметрично /~, /+ ; с учетом ограничений на объемы анализируемых подпространств в которые «заключены» классы о ( и о,.
6. По полученным фрагментам функций принадлежностей формируется полное их аналитическое описание. Неизвестные состояния системы (классификация объектов) определяются по следующему простому алгоритму. При
Лщ (У) > Ло,(У) решение принимается в пользу
класса , в противном случае в пользу .
Работа была выполнена в рамках реализации федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы. Государственный контакт №П424.
і =1
1. Горелик, А. Л. Методы распознавания [Текст] / А.Л. Горелик, Скрипкин. М.: Высшая школа, 1984.258с.
2. Дуда, Р. Распознавание образов и анализ сцен. [Текст] / Р.Дуда, П. Харт // М.: Мир, 1976.-511с.
3. Кореневский Н.А. Проектирование систем принятия решений на нечетких сетевых моделях в
задачах медицинской диагностики и прогнозирования [Текст]: Н.А. Кореневский // Вестник новых медицинских технологий, 2006. Т. XIII, №2. С.6-10.
4. Zadeh, L.A. Advances in Fuzzy Mathematics and Engineering : Fuzzy Sets and Fuzzy Information-Granulation Theory. Beijing. Beijing Normal University Press. 2005. ISBN 7-303-05324-7.
Юго-Западный государственный университет (г. Курск)
A METHOD OF SYNTHESIS OF FUZZY DECISION RULES FOR THE ASSESSMENT OF THE STATE OF COMPLEX SYSTEMS OF INFORMATION ON THE GEOMETRIC STRUCTURE OF THE MULTIDIMENSIONAL DATA
N.A. Korenevskiу, E.B. Ryabkova
In the article the questions of functions accessories to the explored classes consisting of complex systems with a host variable, defined as a measure of the closeness to the multidimensional sharing over-capacities and reference structures
Key words: separating surface, etalon, the accessories, the ratio of confidence