УДК 004.891.2, 616.8-009
СИНТЕЗ НЕЧЕТКИХ РЕШАЮЩИХ ПРАВИЛ ДЛЯ МЕДИКО-ЭКОЛОГИЧЕСКИХ ПРИЛОЖЕНИЙ НА ОСНОВЕ АНАЛИЗА СТРУКТУРЫ ДАННЫХ
Н. А. КОРЕНЕВСКИЙ С. А. ФИЛИСТ Г. В. ЧУРСИН
В работе предлагается метод синтеза нечетких решающих правил на основе объединения способов агрегации функций принадлежности, формы и параметры которых определяются при использовании данных о структуре признаков и классов, получаемых методами разведочного анализа. Показывается, что такой подход позволяет решать задачи прогнозирования, ранней и дифференциальной диагностики для различных типов медико-экологических задач с приемлемым для практики качеством.
1)Курский
государственный
технический
университет
2)Курская
государственная
сельскохозяйственная
академия
e-mail:SFШ[email protected]
Ключевые слова: нечеткая логика, прогнозирование, ранняя диагностика, дифференциальная диагностика, функция принадлежности, коэффициент уверенности, разведочный анализ.
Многочисленные исследования показывают, что при практическом применении методов теории распознавания образов наилучших результатов удается достичь, если при синтезе соответствующих решающих правил учитывается информация о структуре данных и других особенностях решаемых задач. Для медицинских и экологических приложений к таким особенностям следует относить следующие обстоятельства. Исследуемые структуры классов могут сильно пересекаться в пространстве информативных признаков, особенно если речь идет о прогнозировании и ранней (донозологической) диагностике; классы состояний могут менять свое положение в пространстве признаков; доступные для измерения признаки измеряются в различных шкалах (порядка, наименований, интервалов), имеют различную природу и фиксируются на различных этапах ведения пациентов (данные опросов, осмотров, инструментальных и лабораторных исследований); в реальных условиях не весь требуемый набор информативных признаков может быть зарегистрирован у конкретного обследуемого; как исходные признаки, так и принимаемые решения могут иметь нечеткий характер и т.д.
Анализ литературных данных и результаты собственных исследований позволяют сделать вывод о том, что в этих условиях предпочтение следует отдавать двум подходам, принятым в теории принятий решений: на основе теории нечеткой логики принятия решений [1, 3, 5, 8, 9] и на основе аппарата, обеспечивающего изучение структуры классов с выдвижением гипотез о наилучших классификаторах в ходе вычислительного эксперимента (диалоговые системы распознавания образов) [2, 4, 7]. Каждый из этих подходов обладает определенными достоинствами, но при решении практических задач они используются раздельно, что снижает потенциально достижимые возможности проектируемых классификаторов.
С целью повышения эффективности решения задач прогнозирования и медицинской диагностики заболеваний, в том числе и заболеваний порождаемых вредными экологическими факторами, нами предлагается объединить два этих подхода, реализуя задачи синтеза нечетких решающих правил в три этапа.
На первом этапе производится разведочный анализ, позволяющий изучить геометрическую структуру классов в пространстве информативных признаков. Под структурой имеется в виду взаимоположение объектов различных классов на обучающей выборке.
На втором этапе под известную структуру классов и типы признаков выбираются носители и параметры функций принадлежностей. Эти функции решают задачи клас-
сификации по подпространствам и областям исходного пространства признаков. При этом выбор осуществляется с таким расчетом, чтобы при заданной сложности классификатора каждая функция принадлежности на каждом технологическом шаге принятия решений обеспечивала максимально возможную уверенность классификации или прогнозирования.
На третьем этапе функции принадлежностей объединяются в частные (по группам однотипных признаков и подпространствам) и финальные решающие правила, обеспечивающие требуемую уверенность в принимаемых решениях.
Здесь функции принадлежностей определяются так, как в основополагающей работе [5]. Агрегация функций принадлежностей в нечеткие решающие правила может осуществляться с использованием операций, определенных в классической теории нечетких множеств: объединения, пересечения, отрицания, импликации и т.д.
В ряде приложений удобно частные и финальные решающие правила определять через коэффициенты уверенности так, как это предлагается в работе [5] с использованием нечетких правил вида:
где КУ а — коэффициент уверенности в гипотезе ое; МД^ и МНД^ - меры доверия и недоверия к гипотезе ое соответственно, j и к — номера итераций в расчетах МД и МНДо соответственно; МД* (х) и МНД* (уч) — меры доверия и недоверия
к ое от одного свидетельства (признака, фактора) х/ и уд соответственно; / и д — номера свидетельств.
Если выбираемые свидетельства «работают» только на повышение уверенности в ое, а используемые функции принадлежностей выбираются как меры доверия к ое, то агрегацию решающих правил можно проводить, объединяя два направления нечеткой логики принятия решений, развиваемых в работах Заде [8, 9] и Шортлифа [5]. Тогда коэффициент уверенности может быть определен итерационной формулой вида:
где Ма> (^р) — функция принадлежности к ое с носителем по шкале Бр, которая может определяться как по отдельно взятому свидетельству, так и по группе свидетельств, объединяемых по какому-либо закону в обобщающий интегральный показатель, свидетельствующий в пользу гипотезы ое.
В общем случае, функции принадлежности могут характеризовать как МД* (X) так и МНД* (уч), тогда коэффициенты уверенности будут определяться
модифицированными формулами (1-3) с заменой МД* (х) на цо (х) и МНД* (уч) на Мо (У) .
Для проведения разведочного анализа с целью изучения структуры исследуемых классов нами разработан специальный пакет прикладных программ, решающий следующие задачи: выделение характерных точек обучающей выборки (многомерных центров классов и выделяемых объектов, групп наиболее близких и наиболее далеких объектов между парами различных классов, казуистических и артефактных объектов); рас-
КУ ое = МДоое - МНД ^;
МДоое и +1) = МДоо1 (]) + МД**е (х) • [1 -МДо1 (])];
МНД ое ^ +1) = МНД ое ^) + МНД* 1 (у) • [1 - МНД ое ^)],
(2)
(3)
(1)
(4)
чет расстояний между характерными точками и между всеми заданными точками, как внутри своего класса, так и до точек чужого класса; различные методы отображения многомерных данных в двумерные пространства с сохранением выбираемых структурных свойств исследуемых объектов (сохранение близких расстояний, сохранение далеких расстояний, сохранение структур задаваемых ядер и т.д.); построение гистограмм распределений объектов исследуемых классов на координатах признаков (признаковые гистограммы); построение гистограмм распределения объектов исследуемых классов на шкалах, определяемых как меры близости до эталонных многомерных структур (точек, гиперплоскостей, гиперкубов, гиперсфер и т.д.) (дистальные гистограммы); определение исходных координат объектов по выбираемым участкам гистограмм и областям отображающих пространств; определение группировок объектов в многомерном пространстве признаков; определение областей пересечений различных классов в исходном пространстве с описанием структурных особенностей этих областей.
Знание различных характеристик структурных особенностей классов позволяет обоснованно, под структуру классов: выделить подпространства, где с точки зрения пользователя и достигаемых результатов удобно и целесообразно построить частные нечеткие решающие правила; выбрать тип носителя и характеристики частных функций принадлежностей; из частных решающих правил построить агрегирующее решающее правило, обеспечивающее требуемое качество классификации [1,6].
Под различные типы структур классов разрабатываются рекомендации по выбору типов носителей и параметров функций принадлежностей, обеспечивающих высокое качество классификации при хорошей интерпретируемости получаемых результатов и небольшой вычислительной сложности.
Рисунок 1 иллюстрирует вариант выбора носителя функций принадлежностей для случая линейно-разделимых классов а>1 и а> 2 в двумерном пространстве признаков
{х15 х2} . Из этого рисунка хорошо видно, что признаковые гистограммы классов И ^ (х1) а (х1), И ^ (х2), И а (х2), сильно перекрываются. Также сильно перекрываются и частные функции принадлежностей.
Х2
Рис. 1. Построение признаковых и дистальных гистограмм для линейно-разделимых классов
Анализ признаковых функций принадлежностей показывает, что по ним нельзя построить надежные решающие правила для классификации о1 и о 2. С другой стороны, имея по данным разведочного анализа информацию о линейной разделимости классов о1 и о 2, легко получить разделяющую линию уо = а°Х1+а20Х2 и семейство взаимно-параллельных линий вида У= ах+а2Х2, использование которых позволяет, с одной стороны, подтвердить линейную разделимость (дистальные гистограммы И ^ (У), И (У)), а с другой стороны, построить непересекающиеся функции принадлежности /ло (У), /ло (У), обеспечивающие построение надежного классификационного правила типа
0 = тах {р (У), р2 (у)}, ° = {°1,о 2} . (5)
В соответствии с этим правилом объект с номером j относится к тому из классов Ю1 или <й2, для которого функция принадлежности имеет большее значение.
Рисунок 2 иллюстрирует вариант построения решающего правила для случая пересекающихся классов о1 и о 2 через функции принадлежностей ц (У), /л (У), с
носителем на шкале У = ах1+а2Х2.
0 , 0 Уо = а1 Х1 + а2 Х2
Рис. 2. Вариант выбора функций принадлежностей для пересекающихся классов
В многомерном случае если для двух классов о1 и о 2 в ходе разведочного анализа по исследуемым подпространствам или всему пространству информативных признаков определена целесообразность использования линейной или кусочнолинейной разделяющей поверхности, то в качестве носителя для соответствующих функций принадлежностей удобно использовать выражение вида:
У = 10А, (6)
I =1
где Х|к — признак с номером I в подпространстве с номером к (1 = 1,...,п; к=1,..., К); а\к — настраиваемые параметры, ориентирующие гиперплоскость (6) по критерию, минимизирующему ошибку классификации; У— переменная величина, пропорциональная величине расстояния от начала координат до гиперплоскости (6).
Если зафиксировать положение гиперплоскости (6) в подпространстве (пространстве признаков), определив для минимального количества ошибок классификации У=уо, то по величине У относительно уо можно судить о расстоянии от объекта классификации до линейной разделяющей гиперповерхности, заданной выражением
1 = 1
В этом случае в качестве ориентира для выбора вида и параметров функций принадлежностей удобно использовать дистальные гистограммы Ио (У) и Ио (У)
распределения объектов классов о1 и о 2 по шкале У. По графикам гистограмм эксперты, решающие задачу определения функций принадлежностей, могут выбрать: точки перехода на оси У, в которых л 0 (У) = 0 и где л 0 (У) > 0 (переход между интервалом отказа от гипотезы и интервалом, где гипотеза принимается); участки (точки) где л(У) принимает максимальные значения; точки, где Л о (У) принимают половинные значения от своего максимума; форму наклонных участков и т.д.
При установлении факта пересечения объектов классов Ю1 и Ю2 в исходном пространстве строятся пересекающиеся участки функций принадлежностей ц о (У) , цо (У) с учетом плотностей объектов в исходном пространстве, порождающих зону пересечения гистограмм И о (У) , И о (У) , и с учетом “запасов” на возможные прогнозируемые ошибки классификации в реальных условиях.
При выборе формы и параметров функций принадлежностей следует иметь в виду, что если гистограммы отражают частость появления объектов в исследуемых классах, то функции принадлежности отражают экспертную уверенность в диагностике.
Если методы разведочного анализа показывают, что интервал пересечения гистограмм И (У) , И (У) образован объектами, не имеющим пересечения классов
в исходном пространстве, то может быть рассмотрена возможность использования для классификации кусочно-линейных разделяющих поверхностей. В этом варианте в начале функции ц о (У) , цо (У) строятся только для объектов, не создающих интервал пересечения гистограмм И о (У) , И о (У) . Далее эти объекты из обучающей
выборки исключаются, и по новым обучающим выборкам строится линейная разделяющая поверхность (6) с получением группы частных функций принадлежностей ^0 (Утк ) , где т - номер частной функции принадлежности в подпространстве к.
Составляющие (6) кусочно-линейной гиперповерхности строятся до получения заданного или возможно достижимого качества классификации, а уверенность в классификации относительно полученной кусочно-линейной разделяющей поверхности определяется через агрегацию ц 0 (Утк ) в соответствии с выражением
Учитывая, что в ряде нейросетевых структур первый слой реализует кусочнолинейную разделяющую поверхность, описанный механизм может быть использован для обучения этого слоя.
Если количество классов больше двух, то обучающая выборка разбивается на две: класс, относительно которого строится нечеткое решающее правило (базовый
П
К <* = тах 1Л {Чтк )
т |_ <■
(7)
класс 01), и все остальные классы, от которых отделяется класс 01 (противоположный класс 02). Для вновь созданных обучающих выборок определяются функции принадлежностей к классу 01. Далее класс 01 заменяется следующим и т.д. до тех пор, пока не будут построены функции принадлежностей для всех £ классов (£ =1,...,Ь).
В ходе разведочного анализа может быть установлен факт «вложения» одного класса в другой, например, так, как это показано для двумерного пространства на рисунке за.
В таком варианте дистальную гистограмму предлагается строить относительно центра, «охватываемого» класса в соответствии с выражением вида:
у = (а - х )2, (8)
где аь...,ап — координаты центра «охватываемого» класса.
Визуальный анализ такой гистограммы позволяет увидеть возможность разделимости линейно-неразделимых классов (рис. зб) и подобрать соответствующие функции принадлежностей.
б)
Рис. 3. Построение функций принадлежностей для «вложенных» структур классов
В более общем случае если в ходе разведочного анализа выясняется целесообразность использования разделяющих гиперплоскостей с уравнением вида:
У = ¥в£( А, X) , (9)
то целесообразно в качестве носителя для соответствующей функции принад* * *
лежности использовать расстояние между произвольной точкой X = хп}
и поверхностью (9).
Таким образом, частное или финальное решение о классификации будет приниматься на основании значения функции принадлежности ла (П), где
В = К
X , К (А, X)
А = а
вектор настраиваемых параметров, определяю-
щий ориентацию разделяющей гиперповерхности в пространстве признаков X = {х1,..., хп} ; ¥ — функциональная зависимость, определяющая вид функции (9);
¥П — функциональная зависимость, определяющая способ расчета носителя й.
Если в ходе определения функций принадлежностей достигается заданное качество классификации, то их можно считать мерой доверия к классу , то есть отождест-
влять с мерой доверия к классу с 1 в выражении (2), или, при отсутствии свидетельств, отвергающих гипотезу се, с соответствующим коэффициентом уверенности:
КУ = Мс).
В ряде случаев в задачах диагностики и прогнозирования состояния сложных систем геометрическая интерпретация нецелесообразна или неприемлема. Тогда принятие решения может быть осуществлено с использованием формул расчета коэффициентов уверенности в отнесении объекта к классу (С£ - КУ . В работе [5] для расчета
предлагается использовать выражение типа (1). В более общем случае КУ может
быть вычислен с помощью других формул, форма и параметры которых выбираются в соответствии с типом решаемой задачи и ролью диагностических и (или) прогностических признаков х, входящих в общие правила принятия решений. В простейшем случае при отсутствии факторов недоверия к с 1 (МНД=о) и при условии, что /Л (У) соответствует понятию меры доверия (МД), то коэффициент уверенности может совпадать с соответствующей функцией принадлежности, т.е. КУ = /Л (У), где функция принадлежности может характеризовать уверенность отнесения объекта к классу С 1 при
наличии свидетельства, представляемого носителем Y, или может быть получена как частное решение о классификации, например, в подпространствах или пространствах признаков в геометрической интерпретации задачи распознавания. В частном случае
¥ = х.
При наличии нескольких свидетельств в пользу решения или нескольких частных решений с частными коэффициентами уверенности решается задача синтеза более общего правила принятия решений или окончательного решения [1, 2].
В ряде медицинских приложений, особенно в задачах прогнозирования риска появления и развития заболеваний , принимаемое решение зависит от времени
воздействия на организм некоторого вредного фактора У,.
Интенсивность действия фактора У, совместно со временем воздействия в
частном решающем правиле по фактору с номером j могут быть учтены при использовании правила вида:
0, если м (У, )'М )=0
се с 1У]
где м (У ) - функция принадлежности к классу с 1 по шкале интенсивности дейст-
с 3
вия У ; м (1) - функция принадлежности к классу С1 от действия фактора У с
3 С£’Уз 3
носителем по шкале времени воздействия.
Если выбрать форму и параметры функций принадлежности таким образом, что функции принадлежности растут с ростом величин их носителей, то при выполнении условия М (У3)' М (1) > 0, КУс , растет по мере роста интенсивности и
£ ^ ]
времени воздействия по закону, определяемому формой и параметрами соответствующих функций принадлежностей.
Характерной особенностью ряда информативных признаков (артериальное давление, энергетические характеристики биологически активных точек и т.д.) является то, что они могут изменяться под воздействием однократных относительно коротких возмущающих внутренних и внешних воздействий, после чего, если организм обладает достаточным адаптационным потенциалом, возвращаться в рамки допустимых значений или находиться за рамками значений, считающихся нормой, достаточно длительное время (неделя, месяц, год и т.д.)
В первом случае не всегда речь идет о патологическом отклонении в организме человека, а второй случай, как правило, свидетельствует о высоком риске появления и развития заболеваний или об имеющейся патологии. Причем, чем большее время наблюдается отклонение контролируемого параметра за рамки своих номинальных значений, тем увереннее можно говорить о наличии гипотезы .
Учесть патологическое отклонение измеряемых показателей от номинальных значений в формулах расчета коэффициентов уверенностей в гипотезах можно,
введя понятие различных уровней доверия. Например, к первому уровню доверия со своими частными решающими правилами следует отнести выводы, делаемые по результатам однократных измерений, ко второму уровню доверия — результаты, получаемые при устойчивой тенденции выхода измеряемых параметров за рамки номинальных значений в течение недели и т.д. С учетом сказанного целесообразно соответствующие функции принадлежности строить для каждого уровня доверия щ функции принадлежности /Л^ (X).
Расчет частных коэффициентов уверенности для каждого из уровней доверия, в зависимости от существа решаемой задачи и предпочтений экспертов, можно производить различными способами.
В первом варианте для каждого из выбранных интервалов времени записывается продукционное правило вида:
где ^ — интервал времени, в течение которого наблюдается выход x{ за рамки номинальных значений.
Во втором варианте коэффициент уверенности для различных уровней доверия может быть пересчитан из коэффициента уверенности, рассчитанного для первого уровня доверия КУ'Ю через весовой коэффициент, отражающий время удержания Х| в определенных рамках у1 (х г., ^, то есть:
варианте дополнительно к ? ^ {) вводится функция принадлежностей к классу ю^
по времени отклонения Х| от номинального значения, а соответствующий частный коэффициент уверенности рассчитывается аналогично (9). В этом варианте уровень доверия к гипотезе ад в явном виде не присутствует. Здесь наблюдается рост уверенности в ад по мере роста отклонения Х| от своего номинального значения со стремлением КУЮ ^ к своему верхнему значению, не превышающему единицы. КУЮ J изменяется по закону, определяемому параметрами соответствующих функций принадлежностей.
Используя описанный механизм синтеза нечетких решающих правил, решались задачи прогнозирования, ранней и дифференциальной диагностики заболеваний: желудочно-кишечного тракта, нервной и костно-мышечной систем, возникающих и развивающихся в условиях действия постоянного магнитного поля Курской магнитной
(11)
(12)
При выборе значений у ЮДх {^ следует учитывать, что КУ < 1. В третьем
аномалии повышенной напряженности и выбросов Михайловского горнообогатительного комбината; заболеваний системы пищеварения, бронхолегочной и мочеполовой систем, порождаемых вредными воздействиями агроэкологических факторов. При этом в задачах прогнозирования достигается уверенность не хуже 0,85, а в задачах диагностики не хуже 0,9. Такие результаты позволяют рекомендовать предложенный подход к синтезу нечетких решающих правил к использованию в медицинских и экологических системах поддержки и принятия решений.
1. Кореневский Н.А. Проектирование нечетких решающих сетей, настраиваемых по структуре данных для задач медицинской диагностики // Системный анализ и управление в биомедицинских системах. Т. 4 № 1. 2005. С. 12 -20.
2. Кореневский Н.А., Титов В.С., Чернецкая И.Е. Проектирование систем поддержки принятия решений для медико-экологических приложений (монография). Курск, Курск. гос. техн. ун-т. 2004. - 180 с.
3. Осовский, С. Нейронные сети для обработки информации /Пер. с польского И.Д. Ру-динского. М.: Финансы и статистика, 2002. 344 с.
4. Прикладная статистика: Классификация и снижение размерности /Под ред С.А. Айвазяна. М.: Финансы и статистика, 1989. 328 с.
5. Bruce G. Buchanan, Edward H. Shortliffe. Rule-Based Expert Systems: The MYCIN Experiments of the Stanford Heuristic Programming Project. Addison-Wesley Publishing Company. Reading, Massachusetts, 1984.
6. Korenevskii N.A., Krupchatnikov R.A., Gorbatenko S.A. "Generation of fuzzy network models taught on basis of data structure for medical expert systems" Biomedical Engineering. Springer New York. Volume 42, Number 2 / March 2008. pp. 67-72. ISBN 0006-3398 (Print) 15738256 (Online).
7. Sammon, J.W., JR.; "Interactive Pattern Analysis and Classification". IEEE Transactions on Computers, Volume C-19, Issue 7, July 1970 Page(s):594 - 616.
8. Zadeh, L.A. Advances in Fuzzy Mathematics and Engineering Fuzzy Sets and Fuzzy In-formation-Granulation Theory. Beijing. Beijing Normal University Press. 2005. ISBN 7-303-05324-7
9. Zadeh, L.A., King-Sun Fu, Kokichi Tanaka, Masamichi Shimura. Fuzzy sets and their applications to cognitive and decision processes. Academic Press, Inc. New York San Francisco London, 1975. ISBN 0-12-775260-9
SYNTHESIS OF INDISTINCT SOLVING RULES FOR MEDIKO-ECOLOGICAL PRILO-ZHENY ON THE BASIS OF THE ANALYSIS OF STRUCTURE OF THE DATA
Литература
N. A. KORENEVSKY 1) S. A. FILIST 1)
G. V. CHURSIN 2)
1)Kursk state
technical
university
In work the method of synthesis indistinct solving is offered pra-twisted on the basis of association of ways of aggregation of functions pri-nadlezh-nosti, forms and which parametres are defined at use of the data about structure of signs and the classes received by methods unless-dochnogo of the analysis. It is shown that such approach allows to solve problems of forecasting, early and differential diagnostics for various types of mediko-ecological problems with quality comprehensible to practice.
e-mail:
Key words: The indistinct logic, forecasting, early diagnostics, differential diagnostics, accessory function, confidence factor, the prospecting analysis.
2) Kursk state agricultural academy