3
БИОТЕХНИЧЕСКИЕ ИЗМЕРИТЕЛЬНО-ВЫЧИСЛИТЕЛЬНЫЕ СИСТЕМЫ
ЭКСПЕРТНЫЕ СИСТЕМЫ ДЛЯ КЛАССИФИКАЦИИ БОЛЕЗНЕЙ В МЕДИЦИНСКОЙ ДИАГНОСТИКЕ
П.А. Головин, В.А. Нечаев, Д.А. Нечаев Научный руководитель - доктор технических наук, профессор К.Г. Коротков
Произведен анализ методов разработки экспертных систем для классификации болезней в медицинской диагностике. Изложены достоинства и недостатки каждого из методов. Приведен обзор существующих медицинских экспертных систем.
Развитие новых методов диагностики, а также расширение возможностей уже существующих методов было и остается актуальной задачей в медицине. Появление новейших диагностических и лечебных технологий требуют использования методов искусственного интеллекта для обработки и интерпретации данных с возможностью накопления, хранения и многократного использования медицинских данных [1]. Одним из наиболее эффективных средств в данной области являются экспертные системы. Они позволяют автоматизировать процесс принятия решения при освидетельствовании пациентов, повышая уровень квалификации пользователя до уровня опытных экспертов [3]. Поэтому необходимо, чтобы экспертные системы обладали возможностью гибкой постановки задач, были применимы ко всем областям биологии и медицины, обладали большой информационной емкостью и помехоустойчивостью, не нуждались в длительном времени для разработки [1]. Непрерывное развитие средств вычислительной техники расширяет потенциальные возможности подобных систем, в связи с чем необходимо постоянно пополнять знания в данной области.
Экспертные системы в течение длительного времени применяются в медицине для диагностики заболеваний. Каждая система при этом обладает ограниченной областью применения, в связи с изначальной направленностью разработки. Применение этих экспертных систем в областях, для которых они изначально не были предназначены, затруднено и зачастую просто невозможно, в том числе потому, что они ограничены встроенными способами вывода [3].
В настоящее время медицинские диагностические системы строятся на основе нескольких методов обработки информации:
• построение дерева решений;
• статистическая обработка данных;
• использование элементов искусственного интеллекта [3].
Цель данной работы - провести анализ существующих методов разработки экспертных систем и выявить достоинства и недостатки каждого из методов.
Решение задач разработки экспертных систем можно подразделить на две большие категории:
• задачи, решаемые по явным алгоритмам;
• задачи принятия решений на основе опыта и знаний.
Соответственно, можно выделить 2 способа решения задачи - логический и интуитивный. Логический метод оперирует набором формальных правил, интуитивный -
Введение
Основная часть
накопленным опытом. При решении задачи первым способом задача обычно разбивается на подзадачи, каждая из которых, в свою очередь, разбивается на несколько элементарных функций с известным алгоритмом вычислений. Зная алгоритм каждой элементарной функции, можно решать сложнейшие задачи, соединяя элементарные функции в нужной последовательности. При попытке применить такой метод к решению интуитивных задач программист может столкнуться с невозможностью выделить алгоритм элементарной функции или вообще разбить задачу на такие функции [3].
Существующие традиционные системы принятия решений, основанные на явных правилах вывода, создаются, как правило, группой специалистов, в числе которых -математики, программисты и предметные специалисты, ставящие задачи. Возможности настройки таких систем на конечного потребителя часто недостаточны.
Самообучающиеся медицинские экспертные системы (ЭС) принятия решений должны удовлетворять следующим требованиям:
• индивидуализация (настройка на традиции клинических школ, геосоциальные особенности региона применения, наборы медико-биологических данных, особенности лечебно-диагностических технологий, индивидуальный опыт и знания специалиста);
• динамическое развитие (накопление опыта системы в процессе функционирования, следуя изменениям в пунктах, перечисленных в предыдущем требовании);
• возможность перенастройки при резком изменении условий, например, при перенесении в другой регион;
• способность к экстраполяции результата - требование, обратное индивидуальности. Система не должна резко терять качество работы при изменении условий;
• возможность конструирования с нуля конечным пользователем (специалист должен иметь возможность придумать совершенно новую ЭС и иметь возможность просто и быстро создать ее);
• «нечеткий» характер результата. Решение, выдаваемое системой, не должно быть окончательным. Оно может быть вероятностным или предлагать сразу несколько вариантов на выбор. Это дает возможность специалисту критически оценивать решение системы и не лишает его инициативы в принятии окончательного решения;
• ЭС является только советчиком специалиста, не претендуя на абсолютную точность решения. Она должна накапливать опыт и знания и значительно ускорять доступ к ним, моделировать результат при изменении условий задачи. Ответственность за решение всегда лежит на специалисте [1].
Большинство разработанных экспертных систем удовлетворяют этим требованиям. Перечислим наиболее известные из них:
• PUFF - экспертная система, осуществляющая диагностику легочных заболеваний на основе легочных функциональных тестов;
• SPE - производит диагностику состояний при воспалительных процессах;
• ABEL - осуществляет диагностику кислотных и электролитных заболеваний;
• AI/RHEUM - диагностика заболеваний соединительных тканей;
• CADUCEOS - диагностика внутренних заболеваний общего профиля;
• BLUE FOX - диагностика и лечение депрессивных состояний;
• CASNET/GLACOMA - диагностика и лечение глазных заболеваний, связанных с глаукомой;
• MYCIN - диагностика и лечение инфекционных заболеваний;
• ONCOCIN - лечение больных раком химиотерапией и наблюдение за ними;
• PIP - диагностика заболеваний почек;
• МОДИС-2 - диагностика симптоматической гипертонии;
• GUIDON - обучающая система диагностики и лечения инфекционных заболеваний [2].
Каждая из этих систем обладает узкой областью применения и может использоваться по назначению только в ней.
Медицинские экспертные системы строятся на основе нескольких подходов к обработке информации. Используются следующие подходы.
Построение дерева решений. При использовании этого подхода в программе протоколируется последовательность вопросов, задаваемых врачом при решении диагностической проблемы. Такой протокол структурируется в виде дерева. Каждая вершина такого дерева представляет собой определенный вопрос, задаваемый больному, а ветвления, исходящие из вершины, соответствуют альтернативным ответам на вопрос и ведут, в свою очередь, к новым вопросам. Программа осуществляет переход от вопроса к вопросу до тех пор, пока не будет найдено решение или исчерпаны возможные переходы. Недостатком такого подхода можно считать следующее:
• при попытке построить подобные деревья для решения сложных диагностических задач количество вершин и ветвлений становится настолько большим, что анализ логического дерева оказывается крайне сложным;
• малейшие изменения, вносимые в логику программы, приводят к необходимости строить дерево заново и перепрограммировать всю задачу.
В то же время такой подход крайне удобен, так как позволяет представить в программе логику составления последовательности вопросов врачом при решении диагностической задачи в клинических условиях. Этот подход позволяет имитировать процесс принятия решения врачом при постановке диагноза.
Статистическая обработка данных. Этот подход заключается в применении методов математической статистики. Он основывается на обработке больших массивов информации, собранных по заболеваниям, подлежащим машинной диагностике. Обработанная информация может использоваться различным образом.
Часть медицинских экспертных систем базируется на использовании теории распознавания образов. При этом необходимо иметь некоторое множество конкретных историй болезней с известными диагнозами. Такие множества анализируются с целью определения статистически «типичной» для каждого заболевания картины - образа. Определяются те признаки заболевания, которые наиболее характерны для него, исходя из собранной информации, подвергнутой статистической обработке. «Типичные» картины заболеваний используются при анализе истории каждого конкретного пациента, для определения того, насколько «похож» рассматриваемый случай на «типичный». Оценивая «расстояние» между сравниваемыми картинами, программа формирует решение о диагнозе.
Ряд методов компьютерной диагностики основан на применении теоремы Байеса. Такой подход позволяет определить вероятности заболевания у человека и базируется на установлении частоты появления признаков при заболевании. Например, предположим, что Di - одно из n заболеваний, подлежащих диагностике, а E - признаки, наблюдаемые у больного. Тогда если P( Di) - вероятность появления i-го заболевания, то вероятность i-го заболевания при условии наличия признаков E будет
P(Di / E) = p(D )P(E ' D ) ,
¿P( D,) P( E / Dj)
j=1
где P(Di / E) - условная (апостериорная) вероятность появления признаков E при заболевании D..
Несомненными достоинствами статистических методов является то, что с их помощью делается попытка объективизировать имеющуюся информацию о заболеваниях. Присутствуют у них также и существенные недостатки.
Первый из них связан с тем, что информация, необходимая для построения статистических моделей, часто отсутствует. Для ее накопления, хранения и обработки требуются специальные средства вычислительной техники, создание банков данных по заболеваниям. Количество систематизированной информации по отдельным областям медицины еще мало. Да и само построение статистических моделей является непростым делом.
Использование теоремы Байеса имеет некоторые ограничения, связанные с тем, что оно основывается на использовании некоторых предположений. Прежде всего, предполагается, что каждое заболевание имеет свои непересекающиеся наборы симптомов, в то время как на практике часто встречается ситуация, когда одинаковые симптомы встречаются у разных заболеваний. Другое допущение используется при определении условных вероятностей появления признаков при заболевании и основано на независимости симптомов между собой. Такие зависимости, тем не менее, имеются и налагают существенные ограничения на применимость теоремы.
Еще один существенный недостаток этих методов состоит в том, что внесение в модели новой информации представляет собой значительную трудность, так как ведет к изменению самой модели и пересчету всех вероятностей.
Также недостатком является невозможность объяснения врачу и больному того, каким именно образом получен данный результат. Причиной этого является то, что данный результат является следствием математических операций и не имеет ничего общего с обычным процессом принятия решения врачом при обследовании пациента.
Обработка данных, построенная на основе использования элементов искусственного интеллекта (ИИ). В таких системах делается попытка моделирования способности человека к рассмотрению предметной области и совершения умозаключений с отбрасыванием наименее перспективных направлений поиска. Для этого используются наборы правил, задаваемые априорно и являющиеся, по сути, знаниями экспертов в определенной проблемной области. Именно качество знаний определяет «компетентность» проблемно-ориентированной экспертной системы. Знания о проблемной области, формализованные определенным образом, хранятся отдельно от остальных программ, что позволяет модифицировать работу системы ИИ, меняя набор знаний и не затрагивая остальных компонентов системы. Совокупность таких правил принято называть базой знаний, в то время как совокупность данных о пациентах - базой данных.
Существует два основных подхода к организации баз знаний, выражающиеся в разной структуре соответствующих систем:
• описание отношений между описываемыми объектами;
• представление обработки знаний в виде процедур.
Среди наиболее известных способов представления знаний упомянем продукционный. При данном подходе реализуется четкое разделение между данными, операциями и управлением. Можно выделить некую глобальную базу данных (не следует ее путать с базой данных в традиционном понимании), над которой выполняются некоторые действия, описываемые совокупностью правил продукции. Управление этим процессом происходит в соответствии с некоторой глобальной стратегией управления.
Глобальная база данных - это структура данных, анализируемая и преобразуемая системой ИИ. Вид базы зависит от решаемой задачи и может быть простым (как, например, списочная структура) или сложным.
Правила продукции состоят из двух частей: условие (левая часть) и действие (правая часть). Условие устанавливает применимость правила к базе данных. Действие заключается в изменении информации в глобальной базе данных.
Система управления выбирает, какое из нескольких применимых правил должно быть использовано, а также определяет момент прекращения дальнейших действий путем проверки терминальных условий на базе данных.
Поиск решения осуществляется на основе двух основных подходов. Метод «от данных к цели» заключается в последовательном изменении базы данных всеми правилами, которые могут быть применены, и в поиске после изменения новых применимых правил. Поиск заканчивается при наличии утверждения, являющегося решением, или при выполнении условия прекращения поиска. Метод «от цели к данным» сводится к проверке некоторых утверждений, которые могут выступать в качестве наиболее вероятных решений. При этом проводится поиск правых частей правил с целью обнаружения искомого отверждения и проверка левых частей соответствующих правил на базе данных - при подтверждении либо гипотеза считается истинной, либо левая часть рассматривается в качестве новой гипотезы.
Заключение
В работе рассмотрены основные концепции и принципы, лежащие в основе методов разработки экспертных систем. Уровень биомедицинского анализа и диагностики болезней зависит также от внедрения новых биомедицинских приборов. В работе [4] показано, что ГРВ-камера с помощью соответствующего программного обеспечения позволяет оценить функциональное состояние систем и органов человека. Имея эти данные, эксперт может сделать заключение о наличии заболевания. Создание экспертной системы для ГРВ-диагностики является задачей дальнейшей работы. Разрабатываемая экспертная система должна обладать необходимой гибкостью и простотой в использовании. Анализ методов разработки экспертных систем показал, что данным требованиям удовлетворяют статистические методы в сочетании с методами искусственного интеллекта.
Литература
1. Kononenko W. Machine learning for medical diagnosis: history, state of the art and perspective. // Artificial Intelligence in Medicine. Ljubjana. 2001. P. 89-109.
2. Россиев Д.А. Нейросетевые самообучающиеся экспертные системы в медицине. / Молодые ученые - практическому здравоохранению. Красноярск, 1994. С. 17.
3. Смолин Д.В. Введение в искусственный интеллект. М.: ФИЗМАТЛИТ, 2004. 208 с.
4. Коротков К Г. Основы ГРВ биоэлектрографии. СПб: СПбГИТМО (ТУ), 2001. 360 с.