ОРИГИНАЛЬНЫЕ СТАТЬИ ПРИМЕНЕНИЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ТИПА ДСМ... 57
УДК 616.37-002-02:616.379-008.641-036:518.5
1 1 1 2 2 2 Л.В. Винокурова , М.А. Агафонов , Г.Г. Варванина , В.К. Финн , Е.С. Панкратова Д.А. Добрынин
ПРИМЕНЕНИЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ТИПА ДСМ
ДЛЯ АНАЛИЗА КЛИНИЧЕСКИХ ДАННЫХ
1МКНЦГБУЗ Центральный научно-исследовательский институт гастроэнтерологии ДЗМ, Москва 2Всероссийский институт научной и технической информации РАН, Москва
Контактная информация
Винокурова Людмила Васильевна, д.м.н., ведущий научный сотрудник 1 гастроэнтерологического отделения адрес: 111123, Москва, ул. Шоссе Энтузиастов, 86; тел. +7(495)304-95-51, e-mail: vinokurova5 [email protected]
Статья поступила 02.07.2014, принята к печати 08.09.2014.
Резюме
За последнее время на помощь практикующему врачу всё чаще приходят математические методы анализа и математическое моделирование патологических процессов. Цель исследования - применить метод ИнтДСМ для прогнозирования развития сахарного диабета панкреатогенного генеза у больных ХП.
В секторе интеллектуальных систем ВИНИТИ РАН создана интеллектуальная система типа ДСМ1 (ИнтДСМ), основанная на ДСМ-методе автоматического порождения гипотез. Существующая ИнтДСМ включает в себя: ИнтДСМ = Решатель задач + Информационная среда БФ и БЗ + интеллектуальный интерфейс (диалог + представление результатов + научение работе с системой).
На первом этапе средствами ДСМ-системы правилами правдоподобного вывода первого рода (индукцией) на обучающей выборке из 81 больных порождались гипотезы 1 рода: наличие у больного конкретного набора признаков есть причина наличия или отсутствия диагноза "сахарный диабет панкреатогенного генеза". На втором этапе с использованием гипотез первого рода правилами 2 рода доопределялось наличие или отсутствие сахарного диабета панкреатогенного генеза у 42 больных, представленных на прогноз.
В результате компьютерных исследований 10 больных были доопределены положительно, т.е. им был поставлен диагноз "сахарный диабет панкреатогенного генеза", 28 больных были доопределены отрицательно, т.е. у них не прогнозировался сахарный диабет панкреатогенного генеза. Результаты доопределений совпали с реальными медицинскими данными. Таким образом, в данном компьютерном исследовании точность доопределений - 100%, полнота - 90%.
Предлагаемая интеллектуальная система является инструментом поддержки медицинских исследований со сложно структурированными данными и множеством фактов, необозримых без использования компьютерных технологий. Результаты применения ДСМ-метода, как средства анализа медицинских данных, демонстрируют полезность этого метода, являющегося новым инструментом доказательной медицины.
Ключевые слова: хронический панкреатит, ДСМ-метод, сахарный диабет.
L.V. Vinokurova1, M. A. Agafonov1, G.G. Varvanina1, V. K. Fynn2, E.S. Pankratova2, D. A. Dobrynin2 PREDICTIVE CRITERIA OF THE COMPLICATED COURSE OF CHRONIC PANCREATITIS
1MCSC, Central research institute of gastroenterology, Moscow 2Russian institute of scientific and technical information RAS, Moscow
Abstract
Lately to the aid of the practicing doctor mathematical methods of the analysis and mathematical modeling of pathological processes even more often come. Research objective: to apply a JSM-method of data analysis in intelligent systems to forecasting of development of diabetes of pankreatogenny genesis at sick chronic pancreatitis.
In sector of intellectual systems of VINITI RAS the intellectual system like JSM-method of data analysis in intelligent systems, based on the JSM-method of automatic generation of hypotheses is created. Existing JSM-method includes: JSM-method = the Solver of tasks + the Information environment (the base of the facts (BF) and the knowledge base (KB) + the intelligent interface (dialogue + representation of results + learning to work with system).
At the first stage means of JSM-system rules of a plausible conclusion of the first sort (induction) on training selection of 81 patients generated hypotheses of the 1st sort: the sick concrete feature set has an existence the reason of existence or absence of the diagnosis diabetes of pancreatic genesis. At the second stage with use of hypotheses of the first sort by rules of the 2nd sort was defined existence or absence of diabetes of pancreatic genesis at 42 patients presented on the forecast.
As a result of computer researches of 10 patients were predetermined positively, i.e. the diagnosis diabetes of pancreatic genesis was made to them, 28 patients were predetermined negatively, i.e. they didn't predict diabetes of pancreatic genesis. Results of to definition coincided with real medical data. Thus, in this computer research the accuracy of certain - 100%, and completeness - 90%.
The offered intellectual system is the instrument of support of medical researches with difficult structured data and a set of the facts, vast without use of computer technologies. Results of application of the JSM-method as means of the analysis of medical data, show usefulness of this method which is the new tool of evidential medicine.
Keywords: chronic pancreatitis, JSM-method, diabetes.
№ 3/tom 13/2014 РОССИЙСКИЙ БИОТЕРАПЕВТИЧЕСКИЙ ЖУРНАЛ
RBG_3_2014.indd 57
15.10.2014 14:27:33
ОРИГИНАЛЬНЫЕ СТАТЬИ ПРИМЕНЕНИЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ТИПА ДСМ...
Введение
В последние годы увеличилось число пациентов с осложнёнными формами ХП (20 - 80 больных на 100 000 населения), что приводит к постоянному увеличению тяжести этих осложнений и заставляет чаще прибегать к хирургическому лечению [10]. С дифференциально-диагностической целью, в том числе для исключения рака ПЖ, этим больным проводят общеклиническое, лабораторное и инструментальное обследование [1; 3; 12]. Однако достоверность сведений о клинических признаках заболевания очень часто зависит от таких субъективных параметров как опыт врача и контактность пациента. Применение компьютерной томографии расширило диагностические возможности выявления осложнений при ХП. Развитие медицинских технологий обусловило появление новых инструментальных методик диагностики заболеваний органов панкреатодуоденальной зоны, в том числе -- эндоскопической ультрасонографии с проведением тонкоигольной биопсии. При этом субъективного фактора оценки результатов исследований также сложно избежать [11].
Классификация 2007 г М-АШНЕ1М включает оценочную балльную систему для определения тяжести заболевания. Подобные системы были разработаны для болезни Крона и некоторых заболеваний печени, при которых эта система помогает правильно выбрать тактику лечения и оценить прогноз заболевания [13].
Градация панкреатической боли проводится по сумме особенностей течения болевого синдрома и необходимости назначения различных анальгетиков. Например, если пациенту необходимо назначать мощные наркотические анальгетики (2 балла), и у него отмечаются периодические атаки острого панкреатита (3 балла), тяжесть боли оценивают в 5 баллов. В расчёт индекса тяжести ХП включаются все оперативные вмешательства на ПЖ и все тяжелые осложнения панкреатита, начиная с первых проявлений заболевания и далее на протяжении всего анамнеза. Если у пациента имели место два и более тяжелых осложнения, то каждое из них отдельно должно включаться в расчет индекса тяжести ХП. После заполнения оценочной балльной системы М-АЫКНЕМ необходимо суммировать баллы. Сумма баллов и является индексом тяжести М-АЫКНЕМ. За последнее время на помощь практикующему врачу всё чаще приходят математические методы анализа, математическое моделирование патологических процессов [4; 9].
Материалы и методы
В секторе интеллектуальных систем ВИНИТИ РАН создана интеллектуальная система типа ДСМ1 (ИнтДСМ) [2; 4; 5; 6; 7], основанная на ДСМ-методе автоматического порождения гипотез. Существующая ИнтДСМ включает в себя:
ИнтДСМ = Решатель задач + Информационная среда БФ и БЗ + интеллектуальный интерфейс (диалог + представление результатов + научение работе с системой).
Решатель ИнтДСМ основан на ДСМ-методе автоматического порождения гипотез, реализующем автоматизированные правдоподобные рассуждения. Разрабатываемые правдоподобные рассуждения образуют формализованную эвристику из-
1Название в честь английского мыслителя Джона Стюарта Милля.
влечения зависимостей причинно-следственного типа из баз структурированных фактов.
Гипотезы о (±) - причинах, извлекаемых из БФ, порождаются посредством специально созданной процедуры индукции, основанной на сходстве объектов - источнике или причине наличия (отсутствия) изучаемого эффекта. Предсказание этого эффекта осуществляется посредством аналогии, использующей гипотезы о (±) - причинах, содержащихся в базе знаний и порожденных индукцией. И, наконец, ДСМ-рассуждение завершается абдук-тивной процедурой - объяснением начального состояния БФ, которое является или достаточным основанием для принятия гипотез, или средством расширения БФ для итерации ДСМ - рассуждения, если существуют необъясненные факты из БФ.
Особенности ДСМ-метода
1. Извлечение знаний типа «причина -следствие» основано на принципе: «сходство фактов порождает сходство эффектов и их повторяемость» (этот принцип отличен от вероятностного подхода к анализу данных: «повторяемость эффектов определяет сходство фактов»).
2. ДСМ-метод, будучи нестатистическим методом анализа данных, в состоянии учитывать индивидуальные особенности изучаемых объектов исследования.
3. ДСМ-метод способен порождать полезные гипотезы на малых массивах данных.
4. ДСМ-метод работает с открытыми массивами данных (а не с замкнутыми таблицами!), указывая на необходимость расширения базы фактов, если таковая возникает, (это осуществляется посредством абдуктивного объяснения базы фактов).
Условия применимости
ДСМ-метод применим к исследуемой предметной области, так как здесь выполняются следующие условия:
1. возможность структурирования данных и формального определения сходства фактов из базы фактов (БФ);
2. наличие положительных и отрицательных примеров (±)-примеров в БФ;
3. наличие в БФ неявно заданных зависимостей причинно-следственного типа ((±)-причины изучаемых эффектов).
Постановка задачи
В настоящей статье описано применение ИнтДСМ для прогнозирование развития сахарного диабета панкреатогенного генеза у больных ХП.
Результаты
Создание БФ
Первым этапом совместной работы была разработка подсистемы представления знаний и создание БФ - одной из составных частей ИнтДСМ. Атрибутами этой БФ являются сведения о больных, представленные в медицинских картах и описанные в соответствие с языком представления данных.
Для задачи прогнозирования сахарного диабета панкреатогенного генеза были выделены следующие признаки-атрибуты (всего 39):
№ 3/том 13/2014
РОССИИСКИИ БИОТЕРАПЕВТИЧЕСКИИ ЖУРНАЛ
ВВй_3_2014.ЫС 58
15.10.2014 14:27:34
ОРИГИНАЛЬНЫЕ СТАТЬИ ПРИМЕНЕНИЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ТИПА ДСМ.
возраст больного, индекс массы тела,
вредные привычки (алкоголь и табакокурение),
длительность заболевания, наличие хронического кальцифицирую-щего панкреатита, вирсунголитиаз, панкреатическая гипертензия, резекционные или дренирующие операции в анамнезе, панкреонекрозы в анамнезе, гликемический профиль, уровень С-пептида, размеры ПЖ, её контуры, наличие кальцинатов, ширина главного панкреатического протока (ГПП),
■ концентрации гастроинтестинальных гормонов в периферической крови (глю-козозависимыйинсулинотропный полипептид, соматостатин, холецистокинин, секретин, гастрин),
■ наличие развёрнутой клинической картины сахарного диабета и т.д.
В БФ выполняются требования структурированности данных.
В основу работы положены данные о 158 больных осложненным хроническим панкреатитом. Они разделены на 2 возрастные группы: от 20 до 60 лет - 119 больных и от 61 до 74 лет - 39 больных.
Настройка на предметную область
Для возможности применения ИНТ ДСМ к конкретной задаче необходима настройка, включающая следующее:
1. разработка языка представления данных;
2. определение понятий «объект» и «свойство» в терминологии ДСМ-метода;
3. задание операции сходства;
4. задание отношения вложения.
(1) Разработка языка представления данных
Эффективность анализа результатов различных исследований зависит от максимально полного описания обследований больного.
Анализируя эти многочисленные медицинские факты, представленные в БФ, из всех возможных выбирается один тип данных: указывается один из возможных качественных признаков представленных списком.
Пример 1.
Резекционные операции в анамнезе: Л(1 -гПДР; Л^ -пПДР; Л13 -дисталъная резекция; Л(4 -операция по Бегеру
Пример 2.
Индекс массы тела: Л(1 — 16 и меньше - выраженный дефицит массы; Л(2 - 16,1—18,5 недостаток (дефицит) массы тела; Л(3 - 18,5—25 — норма; Л(4 — 25,1—30 избыточная масса тела; и т.д.
Пример 3.
ГИП: Л11 - меньше 0,002; Л^- 0,002-2; Л3 -2-4; Ли - 4-6 нг/мл.
Таким образом, создан язык представления медицинских данных, разработаны программы ввода медицинской информации. Полученная система содержит автоматизированные истории болезни пациентов. Форма ввода медицинских данных очень удобна для врача. Можно просматривать БФ, добавлять информацию о заболевании, по мере ее получения, дополнительно включать результаты различных
исследований. При необходимости возможно наполнение БФ новыми терминами и понятиями.
(2) В нашей задаче объект представляет собой упорядоченный набор из 39 клинических, инструментальных и лабораторных признаков. Свойство в данном случае одно - сахарный диабет панкреатогенного генеза.
(3) Для выбранного типа данных результатом операции сходства является совпадение признаков.
(4) Отношения вложения определяется по наличию конкретных признаков.
Настройка
на экспериментальное исследование
Настройка системы на экспериментальное исследование включает в себя следующее:
1. Выбор стратегии: простой метод сходства, метод сходства с запретом на контрпримеры (невложение полученных методом сходства гипотез в исходные примеры противоположного знака) отдельно для (+)- и (-)-примеров.
2. Подбор нужного количества родителей2.
Возможный критерий оценки подбора параметров и стратегии эксперимента - применение процедуры «доопределение по одному»: последовательно каждому объекту выборки присваивается значение «неопределенность», производится доопределение этого объекта средствами ДСМ-системы с выбранными параметрами и сравнивается доопределенное значение с существующим. Подсчитывается общее количество правильных и неправильных доопределений.
Выбираются параметры пп.1-2, при которых при применении процедуры «доопределение по одному» будет наилучший результат, т.е. наибольшее количество правильных доопределений и наименьшее количество неправильных. Эти параметры настройки логично использовать для доопределений вновь заносимых в базу фактов пациентов, у которых необходимо поставить диагноз.
Результаты компьютерных исследований
Данные для компьютерных исследований были предоставлены сотрудниками МКНЦ ГБУЗ Центральный научно-исследовательский институт гастроэнтерологии ДЗМ. Первое компьютерное исследование по диагностике сахарного диабета панкреатогенного генеза проводилось на данных обследования 81 больного ХП, у 21 из которых был поставлен диагноз сахарный диабет панкреатогенного генеза -«свойство» в терминологии ДСМ-метода. На прогноз были представлены данные о 42 больных.
Для этого компьютерного исследования с использованием критерия «доопределение по одному» была выбрана стратегия и параметры эксперимента:
1) простой метод с запретом на контрпримеры;
2) количество родителей «+» - 12;
3) количество родителей «-» - 22.
На первом этапе средствами ДСМ-системы правилами правдоподобного вывода первого рода (индукцией) на обучающей выборке из 81 больных порождались гипотезы 1-го рода: «Наличие у больного конкретного набора признаков есть причина наличия или отсутствия диагноза сахарный диабет панкреатогенного генеза». Например, набор следующих признаков: «наличие хронического кальци-фицирующего панкреатита; резекционные операции ПЖ в анамнезе; панкреонекрозы в анамнезе; дли-
2примеров, формирующих гипотезу.
№ 3/том 13/2014
РОССИИСКИИ БИОТЕРАПЕВТИЧЕСКИИ ЖУРНАЛ
ВВй_3_2014.ЫС 59
15.10.2014 14:27:34
ОРИГИНАЛЬНЫЕ СТАТЬИ ПРИМЕНЕНИЕ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ТИПА ДСМ...
тельность ХП; показатели гликемического профиля; показатели гастроинтестинальных гормонов, степень выраженности экзокринной недостаточности, болевого синдрома, наличие или отсутствие мутаций». Порожденные гипотезы являлись фрагментами БЗ.
На втором этапе с использованием гипотез первого рода правилами 2-го рода (п.п.в.2 - аналогией) доопределялось наличие или отсутствие сахарного диабета панкреатогенного генеза у 42 больных, представленных на прогноз.
В результате компьютерных исследований 10 больных были доопределены положительно, т.е. им был поставлен диагноз сахарный диабет панкреатогенного генеза, 28 больных были доопределены отрицательно, т.е. у них не прогнозировался сахарный диабет панкреатогенного генеза, причем 19 из этих больных были старшей возрастной группы. Результаты доопределений совпали с реальными медицинскими данными. Таким образом, в данном компьютерном исследовании точность доопределений - 100%, а полнота - 90%.
Второе компьютерное исследование проводилось на данных обследования 123 больных (к обучающей выборке из 81 больного были присоединены данные о 42 больных, которые в первом компьютерном исследовании были даны на прогноз). 33 больным поставлен "диагноз сахарный диабет панкреатогенного генеза", 89 - отсутствие этого диагноза. Результаты обследования 35 больных были даны на прогноз.
Для этого случая с использованием критерия «доопределение по одному» была выбрана стратегия и параметры эксперимента:
1) простой метод с запретом на контрпримеры;
2) количество родителей «+» - 20;
3) количество родителей «-» - 30.
Результаты компьютерного исследования: в
8 случаях - правильное положительное доопределение, в 24 случаях - правильное отрицательное доопределение, а в 1 случае - неправильное положительное доопределение.
Таким образом, точность данного исследования - 95%, полнота - 92%.
Обсуждение
Предлагаемая интеллектуальная система является инструментом поддержки медицинских ис-
следовании со сложно структурированными данными и множеством фактов, необозримых без использования компьютерных технологий. Результаты применения ДСМ-метода как средства анализа медицинских данных демонстрируют полезность этого метода, являющегося новым инструментом доказательной медицины.
Распространенный сейчас термин evidence based medicine, к сожалению, переведен как «доказательная медицина», а не как «медицина, основанная на очевидных фактах». Методы, относящиеся к evidence based medicine, основаны на установленных фактах и используют эти факты как аргументы при принятии решений в медицине, в частности, для диагностики.
Но смысл этого термина состоит в том, что решения, принимаемые врачами, должны быть аргументированными (но не доказанными - ведь авторы говорят о вероятных прогнозах, т.е. о гипотезах!). Это означает, что принимаемые решения используют аргументы, извлеченные из клинических данных.
В самом деле, гипотезы о причинах эффектов, обнаруженные в базе фактов посредством выявления сходства, являются аргументами или контраргументами в пользу порождаемой интеллектуальной системой гипотезы о наличии или отсутствии изучаемого эффекта.
Сказанное является аргументом в пользу утверждения о том, что ДСМ-метод является полезным аппаратом доказательной медицины [4; 8].
Заключение
Подтверждается возможность использования ДСМ-метода автоматического порождения гипотез в области медицинской диагностики, где недостаток формальных знаний может быть «скомпенсирован» богатым фактическим материалом. В некоторых областях медицины, находящихся на стадии феноменологического описания и накопления данных, развитые логико-математические методы восстанавливают причинно-следственные зависимости, служат для пополнения знаний на основе имеющихся фактических данных и являются средством поддержки интеллектуальных возможностей экспертов-медиков.
2. 3.
Литература
журов. //Кли
развития панкреатической недостаточности при хроническом панкреа-
ВинокуроваЛ.В., Трубицына И.Е., Дубцова Е.А. и др. Механизм тите // Клиническая геронтология. - 2014. - Т. 20, № 1-2. - С. 4( ДСМ-метод автоматического порождения гипотез: Логические и эпистемологические основания. М.: Книжный дом «ЛИБРОКОМ», 2009. - 432 с. Лазебник Л.Б., Винокурова Л.В., Яшина Н.И. и др. Хронический панкреатит и рак поджелудочной железы // Клиническая и экспериментальная гастроэнтерология. - 2012. - № 7. - С. 3-9.
Михайлова И.Н., Панкратова Е.С., Добрынин Д.А. и др. О применении интеллектуальной компьютерной системы для анализа клинических данных больных меланомой // Российский биотерапевтичский журнал. - 2010. - Т. 9, № 2. - С. 54.
Финн В.К., Блинова В.Г., Панкратова Е.С., Фабрикантова Е.Ф. Интеллектуальные системы для анализа медицинских данных. Ч. 3 // Врач и информационные технологии. - 2007. - 1. - С. 51-7.
Финн В.К., Блинова В.Г, Панкратова Е.С., Фабрикантова Е.Ф. Интеллектуальные системы для анализа медицинских данных. Ч. Врач и информационные технологии. - 2006. - 5. - С. 62-70. Финн В.К., Блинова В.Г., Панкратова Е.С., Фабрикантова Е.Ф. Интеллектуальные системы для анализа медицинских данных. Ч. 2 // Врач и информационные технологии. - 2006. - 6. - С. 50-60.
Флетчер Р., Флетчер С., Вагнер Э. Клиническая эпидемиология. Основы доказательной медицины. - М.:Медиа Сфера, 2004. Федулова Э.Н., Шубанина Е.И., Жукова Е.А. и др. Алгоритм прогнозирования рецидивирующего непрерывного течения язвенного колита у^детей на основе математического моделирования // Фарматека. - 2014. - 6. - С. 74-9.
1 //
10.
11.
12. 13.
Харнас С. С., Ку. ной железы // Xi
•лезнева Ю.А., Лачман
1ооперационная и интраоперационная диагностика хирургических заболеваний поджелудоч-_ эгия. - 2003. - 3. - С. 62-5.
CantoM.I., Hruban R.H., Fishman E.K.et al. Frequent detection of pancreatic lesions in asymptomatic high-risk individuals // Gastroenterology. - 2012. - 142(4). - P. 796-804.
Krejs G.J. Pancreatic cancer: epidemiology and risk factors // Digestive Diseases. - 2010. - 28(2). - P. 355-8.
Schneider A., Lohr J.M., Singer M.V. The M-ANNHEIN - classification of chronic pancreatitis: Introduction of a unifying classification system based on revien of previous classification of the disease // J.Gastroenterol. - 2007. - 42(101). - 119.
СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ
ГИП - глюкозозависимый инсулинотропный пептид; БЗ - база знаний;
БФ - база фактов; ПЖ - поджелудочная железа; ХП - хронический панкреатит
№ 3/том 13/2014
РОССИИСКИИ БИОТЕРАПЕВТИЧЕСКИИ ЖУРНАЛ
RBG_3_2014.indd 60
15.10.2014 14:27:34
5
6
7