Научная статья на тему 'Теоретико-возможностная модель компьютерной диагностики заболеваний'

Теоретико-возможностная модель компьютерной диагностики заболеваний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
52
15
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Газарян В. А., Иваницкая Н. В., Пытьев Ю. П., Шаховская А. К.

Теоретико-возможностный метод используется для решения задач медицинской диагностики. Создан возможностный аналог алгоритма «Кора». Возможностный метод диагностики сравнивается с используемыми ранее алгоритмами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Теоретико-возможностная модель компьютерной диагностики заболеваний»

УДК 519.2:534

ТЕОРЕТИКО-ВОЗМОЖНОСТНАЯ МОДЕЛЬ КОМПЬЮТЕРНОЙ ДИАГНОСТИКИ ЗАБОЛЕВАНИЙ

В. А. Газарян, Н. В. Иваницкая, Ю. П. Пытьев, А. К. Шаховская*'

(.кафедра компьютерных методов физики) E-mail: [email protected]

Теоретико-возможностный метод используется для решения задач медицинской диагностики. Создан возможностный аналог алгоритма «Кора». Возможностный метод диагностики сравнивается с используемыми ранее алгоритмами.

1. Оптимальное решение задачи диагностики в результате минимизации возможности потерь

Функциональные нарушения в системе пищеварения активно изучаются на протяжении ряда последних лет [ 1 ]. Проводимые совместно с врачами клиники НИИ питания РАМН исследования позволили значительно продвинуться по пути создания нового комплексного метода компьютерной оценки состояния больных с функциональными нарушениями. На основании опросников пациентов клиники были найдены количественные и качественные характеристики симптомов расстройств ЖКТ, выявлены их связи с изменением психоэмоциональной сферы. По обучающей выборке больных — пациентов НИИ питания с верифицированным диагнозом были определены наиболее часто встречающиеся сочетания признаков (симптомов) синдрома раздраженной толстой кишки (СРТК) с помощью алгоритма типа «Кора» [2], что позволило создать комплексный тест оценки самочувствия больного и описать симптоматику СРТК в общем виде. Однако, как было показано в [3], детерминистские и статистические методы недостаточно эффективны при неформализованном характере данных и ограниченном размере обучающей выборки, содержащей больных с верифицированным диагнозом. Для уточнения диагностических критериев был привлечен теоретико-возможноетный метод, что привело к созданию алгоритма, ранжирующего группы симптомов по их возможностям при определенных заболеваниях [3]. Вследствие этого можно определить условную возможность заболевания при наличии тех или иных наборов симптомов. Выявленная теоретико-возможностная симптоматика позволила вплотную подойти к конечной цели — диагностике заболеваний при нечетких данных на основании решающего правила, оптимального с тео-ретико-возможностной точки зрения, т. е. минимизирующего возможность ошибки классификации.

Сопоставим каждому субъекту (пациенту) п-

мерный нечеткий вектор признаков х=(х'>х2>---... , х")> принимающий значение х = (х',х2,... ... ,хп), где х> — значение /-го признака (симптома). Пусть ж — нечеткий элемент, значением которого является номер класса к, к=\,...,М. Пусть «^'^(х, &) — распределение возможностей нечеткого вектора (х, х), /(&,<1) — возможность потерь при отнесении субъекта класса ^ к классу д, д=\,...,М. Будем считать, что 1(к,д) = О при к = д и 1(к,д) = 1 при к=£ д. Далее не будем делать различий между субъектом и присущим ему вектором значений признаков х = (х1, х2,..., хп).

Оптимальное решение задачи классификации достигается при минимизации возможности (необходимости) потерь [4]. Согласно теореме о Р -оптимизации, субъект х следует отнести к классу д*:

Р(д*,х) = т'т Р(д,х),

ч

Р(д,х) = эиртт{фх,3*{х, к), 1{к, д)),

к

где Р(д,х) — возможность ошибки при отнесении субъекта х = х к классу ж = д.

Аналогично строится N-оптимальная оценка д* класса ж, минимизирующая необходимость ошибки классификации нечеткого вектора х-

Поскольку фх^(х,к) = т'т(фх^(х\к), фК(к)) = = фх^И(х\к) в предположении равенства априорных возможностей ф>е(к) =1, & = 1,...,М, где фх^И(х\к) — условное распределение возможностей пациенту класса ^ обладать признаками (симптомами) х, то решающее правило можно представить в следующем виде:

Р(д*,х) = ттР(д,х), (1)

я

Р(д,х) = &иртт(фх^(х\к),1(к,д)). (2)

к

Условное распределение фх\'я{х\к) получим в результате стохастического моделирования условных

ГУ НИИ питания РАМН.

возможностей определенных наборов признаков при условии принадлежности субъекта выделенным классам.

2. Обучение на основании ранжированных по возможностям групп признаков. Возможностный аналог алгоритма классификации «Кора»

В работе [3] рассмотрен алгоритм поиска всех разбиений Т\,Т2,... € {Г}, множества значений

признаков на группы признаков , I = I,... , /€{1,2,...} (Ц — число найденных групп признаков, соответствующих разбиению 7}), ранжированных по значениям их условных возможностей

р[' = при условии принадлежности субъ-

екта, обладающего набором признаков хю^, к классу к, к = 1,..., М:

р^>рТ2'>...>р1 7}€{Г}.

Наборы признаков ш[, ,..., Т € {Г} удовлетворяют по определению условию максимальной разделенное™ Было показано, что так же упорядочены апостериорные возможности р(к\т[) заболевания & при наличии симптомов [4]. Наиболее существенными признаками заболевания & являются наборы ,ш>[2,... разбиений Т\,Т2,..., имеющие

Т- Т-

максимальную возможность /?,' = р(ш1'\к) = 1.

По обучающей выборке находятся множества к = 1 ,...,М, всех наборов признаков,

имеющих ненулевую возможность. Предъявляется субъект х = (х1 ,х2,... ,хп), где х; — значение /-го признака (симптома), который следует отнести к одному из М классов. Выявляются все наборы (ти)8)ь, к = 1 ,...,М, из множества {ау}^, присущие субъекту. Пусть найдено таких наборов в клае-се ^: 5 = 1,..., . В каждом классе ^ определяется набор тВк, имеющий максимальную апостериорную возможность:

р{к\тч) = тахр{Щт5), 5= 1,...

Далее в (2) значение р(х\к) используется в качестве ф^(х\к), причем вместо вектора значений признаков х = (х1, х2,..., х"), где х1 — значение ¿-го признака субъекта х, берется наиболее существенный в классе ^ набор т8к.

Субъект х относится к тому классу д*, которому соответствует минимальная возможность ошибки (1) (в котором есть набор тв)8,, имеющий минимальную возможность ошибки):

Р{ц*,ш5 ) = ттР{ц,ш5 ),

1 '

что в случае двоичности потерь 1(к,д) соответствует максимальной возможности р(д*\х) субъекту х принадлежать классу д*. Тогда условная возмож-

ность ошибки классификации субъек-

та х с т8 * при отнесении его к классу д* также будет минимальна.

3. Результаты вычислительного эксперимента

Классификация синдрома раздраженной толстой

жишжи на две группы

Алгоритм возможностной классификации был вначале применен к двум группам СРТК, подробно описанным в работе [2], в которых ранее ранжировались условные возможности замедленной (ускоренной) моторики при условии определенных наборов симптомов у пациента [3]. При классификации по гастроэнтерологическим признакам и предпосылкам болей и при анализе факторов, предшествующих заболеванию [2], в 75% случаев было принято верное решение. Следовательно, можно говорить о том, что даже в рамках одного заболевания СРТК надо устранять несколько различные наборы предпосылок при ускоренной и замедленной моторике. Несмотря на невысокую точность классификации, вызванную тесным переплетением симптомов разных групп одного заболевания, результаты предварительной диагностики имеют большое значение для врача. Так как органических нарушений при СРТК, как правило, нет, картина заболевания отражена прежде всего в тестах. Теперь кропотливую работу по всестороннему анализу опросников берет на себя компьютерный метод оценки состояния больного. Врач, пользуясь полученными результатами, ставит окончательный диагноз и назначает лечение.

Диагностика острого аппендицита

Не вызывает сомнения чрезвычайная важность своевременного обнаружения острого аппендицита для здоровья и жизни больного. При подозрении на острый аппендицит очень важно опираться не на отдельные симптомы желудочно-кишечных расстройств, а выделить такие группы признаков, которые действительно характеризуют данное заболевание и позволяют отличить больного человека от здорового. Острый аппендицит, как класс заболеваний, в свою очередь делится на три группы: гангренозный, флегмонозный и катаральный. Врачи отмечают, что их признаки сильно пересекаются, и привлечение компьютерных методов классификации к анализу симптоматики и диагностике трех форм острого аппендицита также является актуальным.

Обучающая выборка — результаты обследования 103 человек из четырех классов: три группы острого аппендицита: гангренозный (28 человек), флегмонозный (25), катаральный (26) и группа больных с неподтвержденным диагнозом (24). В качестве признаков врачами выбрано 8 различных симптомов (таблица). Каждый признак может принимать

Типичные признаки острого аппендицита жаж жласса

Интенсивность болей Продолжительность болей Частота пульса Лейкоциты крови Изменение языка Симптом Щеткина Симптом Ровзинга Защитное мышечное напряжение

2 1

2 2

1 2

1 2

2 2

2 2

2 2

Различные для трех видов аппендицита признаки

гангренозный аппендицит

2 3

2 2

2 3 2

2 2

3 2

2 1 2

2 1 2

1 2

2 1 2

2 2 2

2 2 2

2 2 2

флегмонозный аппендицит

4 2

1 2

2 2

катаральный аппендицит

2 1

1 1

1 2

2 1

Значения признаков, указанные в таблице, отражают степень выраженности симптома.

от двух до четырех значений в ранговой шкале в зависимости от выраженности симптома. Образом каждого субъекта здесь также является «-мерный нечеткий вектор признаков х = (х1 > Х2> • • • > X") > п = 8, принимающий значение х = (х1,х2,... ,хп), где х> — значение /-го признака (симптома).

Ранее для диагностики острого аппендицита использовался метод дискриминантного анализа [5], требующий существенных ограничений. Во-первых, необходима линейная независимость признаков. Во-вторых, ковариационные матрицы классов должны быть одинаковы. В-третьих, необходимо, чтобы образы всех классов подчинялись нормальному закону распределения. Недостатком метода является также отсутствие математического критерия качества классификации. Результат целиком зависит от положения центроидов в пространстве диекриминантных функций и считается тем лучше, чем большее число образов имеет правильную классификацию. Невозможно выявить группы симптомов, характеризующие классы, в пространстве

диекриминантных функций. Врачам непонятно, на каком основании компьютер ставит диагнозы их пациентам, и подобный способ диагностики вызывает естественное недоверие.

Теоретико-возможноетный метод классификации не требует ограничений на свойства образов и осуществляет классификацию больных острым аппендицитом на основании решающего правила, минимизирующего возможность ошибки классификации. Возможноетный алгоритм прост в программной реализации, результаты представлены в привычном для врачей виде. В таблице наглядно демонстрируются характерные наборы симптомов четырех групп заболеваний. Как и при дискриминантном анализе [5], отмечено, что 4-я группа (неподтвержденный диагноз) резко отличается от первых трех. Но если ранее она образовывала отдельный кластер в пространстве диекриминантных функций, то теперь врачам представлены те сочетания симптомов, которые отличают данный класс от других. Семь типичных наборов признаков острого аппендицита

как класса в целом, выявленные возможноетным методом, являются диагностическим критерием данного класса. Возможность диагноза «острый аппендицит» равна единице, если у больного присутствуют данные наборы, присущие всем трем группам. И наконец, найдены характерные для каждой группы аппендицита комбинации симптомов.

4. Сравнительная характеристика

возможностного метода распознавания в медицине и алгоритма «Кора»

Метод «Кора» использует аналог байесового решающего правила, минимизирующего вероятность ошибки классификации [2]. Предварительно в каждом классе находятся так называемые представительные наборы, состоящие из признаков, частота встречаемости которых в обучающей выборке превышает некоторый порог, задаваемый самим исследователем, что вносит произвол в выбор существенных характеристик заболевания (класса). Все признаки представляются в бинарном виде. В процессе бинаризации также используется пороговое значение, в пределах которого признаки считаются «неразличимыми» при классификации. При этом выбор обоих порогов обусловлен лишь здравым смыслом, математическое обоснование отсутствует. Объект сравнивается по всем признакам с каждым другим объектом обучающей выборки в отдельности, и такая «близость» не ассоциативна.

Близость признаков при возможностном подходе устанавливается самим алгоритмом индивидуально для каждого класса. Признаки, объединенные в группу т'[, т.е. имеющие одинаковую возмож-

ность pf = p(wj\k) для каждого i, будут «неразличимы» с точки зрения их значимости в классе. Соответственно признаки принципиально «различны», если принадлежат группам, имеющим разную возможность в классе k. Процессы сравнения признаков и выбора характерных в классе в возможностном подходе объединены.

На этапе распознавания механизмы принятия решений схожи. «Кора» осуществляет выбор класса, используя представительный набор субъекта, «наилучший» с вероятностной точки зрения, при возможностном распознавании выбирается класс, в котором возможность наиболее значимой группы максимальна.

Литература

1. Шаховская А.К., Есаулов В.И., Лоранская Т.П. // Мат-лы III Российской гастроэнтерологической недели. М.. 1997. С. 65.

2. Газарян В.А., Иваницкая Н.В., Пытьев Ю.П., Шаховская А.К. II Вестн. Моск. ун-та. Физ. Астрон. 2003. № 2. С. 12 (Moscow University Phys. Bull. 2003. N 2. P. 12).

3. Газарян В.А., Илюшин В.Jl., Пытьев Ю.П., Шаховская А.К. II Вестн. Моск. ун-та. Физ. Астрон. 2005. № 4. С. 3 (Moscow University Phys. Bull. 2005. N 4. P. 1).

4. Пытьев Ю.П. Возможность. Элементы теории и применения. М., 2000.

5. Айвазян С.А., Бухштабер В.М., Енюков И.С., Ме-шалкин Л.Д. Прикладная статистика. Классификация и снижение размерности. М., 1989.

Поступила в редакцию 26.12.05

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.