Информатика, вычислительная техника и управление
УДК 681.3
РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ ДИАГНОСТИКИ И ВЫБОРА ТАКТИКИ ЛЕЧЕНИЯ ГИПЕРПЛАСТИЧЕСКИХ ПРОЦЕССОВ ЭНДОМЕТРИЯ
Е.Н. Коровин, О.В. Родионов, М.А. Сергеева
В статье рассматриваются вопросы построения автоматизированной информационной системы диагностики и выбора схемы лечения гиперпластических процессов эндометрия на основе статистического и нейросетевого моделирования. Для построения математических моделей диагностики и выбора тактики лечения использовались статистические данные по 230 пациенткам с гиперпластическими процессами эндометрия: гиперплазия эндометрия, полип эндометрия и полип цервикального канала. Для повышения эффективности диагностики гиперпластических процессов эндометрия и оценки значимости клинических признаков на первом этапе исследования предлагается использовать метод построения дерева решений. В результате было построено несколько деревьев решений: полное (бинарное), полное с множеством потомков в узле, компактное (бинарное), компактное с множеством потомков в узле. В результате анализа полученных результатов было выбрано «полное (бинарное) дерево решения». Апробация построенной модели была проведена на тестовой выборке, где достоверность постановки диагноза по методу «деревьев решений» составляет 77,5 %. На следующем этапе исследования были получены классификационные функции Фишера для поставки предварительного диагноза для каждого типа патологии эндометрия. В результате анализа и тестирования полученных классификационных моделей было установлено, что точность диагностических моделей на основе дискриминантного анализа составляет 85,5 %. Для уточнения диагноза на втором этапе исследования была построена нейросетевая модель, где использовалась нейронная сеть в виде многослойного персептрона, где на вход сенсорного слоя подаются значения 12 признаков заболевания, а на выходе результативного слоя получаем данные о виде гиперпластического процесса эндометрия. На основе тестирования контрольной группы больных было установлено, что точность диагностирования на основе нейросетевого моделирования составляет 93,9 %. Полученные модели на основе метода построения дерева решений, дискриминантного анализа и нейросетевого моделирования используются в автоматизированной информационной системе, которая способствуют повышению эффективности диагностики и выбора тактики лечения гиперпластических процессов эндометрия
Ключевые слова: информационные системы, диагностика, лечение, гинекология
ВВЕДЕНИЕ Гиперпластические процессы эндометрия - это доброкачественная патология слизистой оболочки матки, которая развивается на фоне относительной или абсолютной гиперэстрогении. Проблема развития гиперпластических процессов в эндометрии актуальна, с одной стороны, из-за высокого риска их малигнизации, с другой стороны, единого, с эндокринным бесплодием, механизмами развития. Среди онкологических заболеваний женского населения рак эндометрия занимает 2-е место после злокачественного поражения молочных желез и составляет 20% от числа всех опухолей гениталий. Перерождение гиперпластических процессов эндометрия в состояние рака происходит в 0,20—50% случаев и зависит от морфологических особенностей заболевания, длительностью его рецидивов, возрастом пациентки. Процесс имплантации плодного яйца весьма сложен и обусловливает необходимость соблюдения ряда условий: высокой степени одновременности между эндометрием и эмбрионом, адекватного гормонального окружения, нормальных анатомических
Коровин Евгений Николаевич - ВГТУ, д-р техн. наук, профессор, e-mail: [email protected] Родионов Олег Валерьевич - ВГТУ, д-р техн. наук, профессор, e-mail: [email protected] Сергеева Маргарита Анатольевна - ВГТУ, ассистент, e-mail: [email protected]
взаимоотношений и функции половых клеток. Из-за сложности процесса становится неудивительным факт частых неудач имплантации, особенно в условиях патологии эндометрия. С клинической точки зрения, эти неудачи становятся все более значимой проблемой. Бесплодие встречается в среднем у каждой 6-й пары, и это число продолжает расти.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Для построения «дерева решений», ориентированного на диагностику развития гиперплазии эндометрия, полипа эндометрии и полипа цервикаль-ного канала пациенток по набору входных признаков, использовалась программа Deductor и алгоритм С4.5. Обучающая выборка, состояла из 150 историй больных, из них 57 пациентов с вероятностью развития гиперплазии эндометрия, 50 - полип эндометрия, 43 - полип цервикального канала. В результате было построено несколько деревьев решений: полное (бинарное), полное с множеством потомков в узле, компактное (бинарное), компактное с множеством потомков в узле.
Достоверность построенных «деревьев решений» было выявлено путем проверки тестовой выборки из 80 историй больных (39 пациенток с вероятностью развития гиперплазии эндометрия, 28 пациенток с полипом эндометрии, 13 пациенток с полипом цервикального канала), не вошедших в обучающую выборку. Сравнительная характеристика
эффективности разработанных «деревьев решений» представлены в табл. 1.
Таблица 1
Результаты работы алгоритма программы
Как видно из результатов табл. 1, целесообразным является использование «полное (бинарное) дерево решения». Полное бинарное дерево, построенное без применения жестких мер по обрезанию ветвей, применяет 12 предикторных переменных, состоит из 140 узлов и использует 109 логических правил. Фрагмент «Дерева решений» для диагностики гиперплазии эндометрии, полипа цервикаль-ного канала и полипа эндометрии представлено на рис. 1.
Й-- осложнения родов = нет В - кол-во родов = 1 роды
; НМЦ с менархе = да ТОГДА Диагноз = вероятность развития гиперплазии эндометрия I НМЦ с менархе = нет
В - Отягощенный гинекологический анамнез = воспаление придатков Й- Наступление менархе = 11-12 лет
возраст = 18-20 лет ТОГДА Диагноз = вероятность развития гиперплазии эндометрия возраст = 21 -25 лет ТОГДА Диагноз = вероятность развития гиперплазии эндометрия возраст = 26-30 лет ТОГДА Диагноз = полип эндометрия
возраст = 31 -35 лет ТОГДА Диагноз = вероятность развития гиперплазии эндометрия возраст = 36-40 лет ТОГДА Диагноз = вероятность развития гиперплазии эндометрия возраст = 41 -45 лет ТОГДА Диагноз = вероятность развития гиперплазии эндометрия ;■■■■ Наступление менархе = 13-14 лет ТОГДА Диагноз = вероятность развития гиперплазии эндометрия ;■■■■ Наступление менархе = 15 лет и старше ТОГДА Диагноз = вероятность развития гиперплазии эндометрия 1 Наступление менархе = 9-10 лет ТО Г ДА Диагноз = вероятность развития гиперплазии эндометрия
Рис. 1. Фрагмент «Дерева решений» по классификации гинекологических заболеваний
Просмотр «дерева решений» позволяет определить, какие факторы являются более значимыми (верхние узлы дерева), а какие вообще не оказывают влияния (отсечены алгоритмом).
В табл. 2 приведены наиболее значимые признаки и процентная зависимость выходного поля от входных факторов.
Таблица 2
Значимость атрибутов
Для постановки диагноза «вероятность развития гиперплазии эндометрия» построенным «деревом решения» было сгенерировано 51 правил: 16 правил со 100 % достоверностью (из них с поддержкой 2 % 4 правила; с 1,33 % 4 правила и с 0,67 % 8 правил); 1 правило с 75 % достоверностью и поддержкой 2,67 %; 2 правила с 66,67 % достоверностью и поддержкой 2 %; 12 правил с 50 % достоверностью (из них с поддержкой 2,67 % 1 правило и с 1,33 % 11 правил); 1 правило с 33,33 % достоверностью и поддержкой 2 %; 19 правил без поддержки достоверности.
Для постановки диагноза «полип цервикально-го канала» было сформировано 36 правил: 13 правил со 100 % достоверностью (из них с поддержкой 2 % 1 правило; с 1,33 % 5 правил и с 0,67 % 7 правил); 5 правил с 66,67 % достоверностью и поддержкой 2 %; 2 правила с 50 % достоверностью и поддержкой 1,33 %; 16 правил без поддержки достоверности.
Для постановки диагноза «полип эндометрии» было сформировано 22 правила: 7 правил со 100 % достоверностью (из них с поддержкой 3,33 % 1 правило; с 1,33 % 1 правило и с 0,67 % 5 правил); 1 правило с 80 % достоверностью и поддержкой 3,33 %; 2 правила с 75 % достоверностью и поддержкой 2,67 %; 4 правила с 66,67 % достоверностью и поддержкой 2 %; 1 правило с 57,14 % достоверностью и поддержкой 4,67 %; 7 правил без поддержки достоверности.
Апробация построенной модели была проведена на тестовой выборке: неправильный диагноз был поставлен семи пациенткам с вероятностью развития гиперплазии эндометрии, трем пациенткам с полипом цервикального канала и восьми пациенткам с полипом эндометрии. Таким образом, достоверность постановки диагноза по методу «деревьев решений» составляет 77,5 %, а именно 82,05 %, 76,92 %, и 71,43 % для развития гиперплазии эндометрии, полипа цервикального канала и полипа эндометрии соответственно.
Для построения дискриминантных классификационных функций исходные данные о пациентках были разбиты на 2 группы, на основе первой группы (115 пациенток) строились функции Фишера, а достоверность построенных классификационных моделей оценивалась с помощью контрольной группы, состоящей также из 115 пациенток.
Классификационные функции Фишера для определенного вида патологии эндометрия определяются следующим образом:
Y1 = -54,5 +17,0 ■Х1 +10,8 Х2 -22,1 -Х3 + + 12,5 -Х4-14,4 X + 11,6 Хб +12,7 Х7+
+2,1 -Х8 +47,8 X -1,7 Х10+1,1 Х11- 6,4 Х12,
Атрибут Значимость, %
Отягощенный гинекологический анамнез 21,46
Возраст 19,381
Наступление менархе 15,078
Отягощенный соматический анамнез 9,597
Кол-во родов 8,203
Кол-во беременностей 7,575
Кол-во абортов 5,681
Гормональное лечение 4,71
НМЦ в анамнезе 4,075
НМЦ с менархе 2,635
Осложнения родов 1,607
Отягощенный гинекологический анамнез 21,46
№ Дерево решения Обучающее Тестовое
Кол-во % Кол-во %
1 Полное дерево решения 110 73 63 79
2 Полное дерево решения с множеством потомков в узле 84 56 50 63
3 Компактное дерево решения 90 60 52 65
4 Компактное дерево решения с множеством потомков в узле 82 55 36 45
5 Полное дерево решения с тремя потомками в узле 79 53 40 50
6 Компактное дерево решения с тремя потомками в узле 65 43 48 60
Y2 = -28,8 +15,5 ■Х1 +7,6 Х2 -19,8 Х3 + +13,4 Х4-13,7 Х5 + 6,6 -Хб +8,6 Х7+ +4,3 Х8 +26,9 -ХР -0,9 Х10 +0,4 ■Х11 -5,3 ■Х1
Y3 = -21,9 +6,3 ■Х1 +5,5 Х2 -4,1 Х3+ +0,2 Х4 -5,7 Х5 + 3,7 -Хб +8,5 Х7 +
+0,5 X8 +26,6-X9-1,1 X10 + 0,8■X11 -3,0X12,
где, Y1 - диагноз «гиперплазия эндометрия»; Y2 -диагноз «полип эндометрия»; Y3 - диагноз «полип цервикального канала»; X1 - вид аборта; X2 - возраст; X3 - количество беременностей; X4 -количество родов; X5 - количество абортов; X6 - осложнения родов; X7 - наступление менархе; X8 - НМЦ в анамнезе; X9 - НМЦ в менархе; X10 - отягощенный гинекологический анамнез; X11 - отягощенный соматический анамнез; X12 - гормональное лечение. Значение критерия Уилкса: Л=0,06947, что свидетельствует об оптимальном различии между классами заболеваний. Анализ контрольной группы показал, что достоверность полученных классификационных моделей на основе дискриминантного анализа составляет 85,5 %.
На следующем этапе исследования было проведено построение нейросетевой модели для оценки состояния развития гиперпластических процессов эндометрия у пациенток. Для построения нейросе-тевой модели использовался многослойный персеп-трон, с 3-мя скрытыми слоями, с 10 нейронами в каждом слое, где на вход сети подаются значения 12 признаков, а на выходе результативного слоя фиксируются данные о виде патологии эндометрия.
Так как рассматриваемые показатели, используемые для постановки диагноза развития патологий эндометрия представляют собой величины, имеющие разные единицы измерения, то перед их подачей на вход сети, они нормируются в диапазоне [-1, 1].
В качестве нелинейного элемента нейрона используется нелинейный функциональный сигмоид-ный преобразователь f(A)=A/(c+|A|), где A - выход сумматора нейрона, а константа c - параметр крутизны сигмоиды.
В результате построения нейронной сети была определена значимость каждого рассматриваемого признака. Диаграмма значимости признаков приведена на рис. 2.
:■:] лЗ Ä4 Ä5 Х8 Ш :■: 11 л12
Рис. 2. Значимость признаков при определении гиперпластических процессов эндометрия
Как видно из рис.2 наиболее значимыми признаками при постановки диагноза развития гиперпластических процессов эндометрия являются: вид
аборта (X1), отягощенный гинекологический анамнез (X10) и отягощенный соматический анамнез (Xii).
На основе тестирования контрольной группы больных было установлено, что точность полученных результатов диагностирования на основе нейросетевого моделирования составляет 93,9 %.
Таким образом, полученные результаты нейросетевого моделирования способствуют повышению эффективности диагностики гиперпластических процессов эндометрия.
На рис. 3 представлен интерфейс автоматизированной информационной системы диагностики гиперпластических процессов эндометрия.
"а ,.у„, ,.■■..,„ l-1—y
Медицинская карта №1 34 клинического обследования пациента
- - в
^--,„„т |,цт„„..ч„™"-
Рис. 3. Интерфейс заполнения медицинской карты с постановкой диагноза
ЗАКЛЮЧЕНИЕ
На основе полученных моделей возможна постановка предварительного диагноза развития гиперпластических процессов эндометрия для каждой пациентки, что может служить в качестве интеллектуальной поддержки принятия решений для практикующего врача.
Литература
1. Хоц, Е.С. Факторы риска развития гиперпластических процессов эндометрия [Текст] / Е.С. Хоц, В.И. Бычков, М.В. Фролов // Журнал теоретической и практической медицины. - 2008. Т.6. - №1 - С. 32-35.
2. Новикова, Е.И. Моделирование биомедицинских систем [Текст] / Е.И. Новикова, О.В. Родионов, Е.Н. Коровин. - Воронеж: ВГТУ, 2008. - 196 с.
3. Родионов, О.В. Построение имитационной модели диагностики и лечения гиперпластических процессов эндометрия на основе сетей Петри [Текст] / О.В. Родионов, М.А. Сергеева, А.К. Сидорова // Системный анализ и управление в биомедицинских системах. - 2015. - Т.14.-№. 3. - С. 574-576.
4. Родионов, О.В. Процедура оценки состояния развития патологии эндометрия у женщин на основе нейростатистического моделирования [Текст] / О.В. Родионов, М.А. Сергеева // Системный анализ и управление в биомедицинских системах. - 2016. - Т.15. - №. 1. - С. 110114.
5. Коровин, Е.Н. Методы обработки биомедицинских данных [Текст] / Е.Н. Коровин, О.В. Родионов. -Воронеж: ВГТУ, 2007. - 152 с.
6. Коровин, Е.Н. Разработка информационно-программного обеспечения подсистемы диагностики ги-
перпластических процессов эндометрия на основе дис-криминантного анализа [Текст] / Е.Н. Коровин, М.А. Сергеева, А.К. Сидорова // Управление в биомедицинских, социальных и экономических системах: межвуз. сб. науч. тр. - Воронеж: ВГТУ, 2013. - С. 54-58.
Воронежский государственный технический университет
DEVELOPMENT OF AUTOMATED INFORMATION SYSTEMS DIAGNOSIS AND CHOICE OF TREATMENT ENDOMETRIAL HYPERPLASIA
E.N. Korovin, Doctor of Technical Sciences, Professor, Voronezh State Technical University, Voronezh, Russian Federation, e-mail: [email protected]
O.V. Rodionov, Doctor of Technical Sciences, Professor, Voronezh State Technical University, Voronezh, Russian Federation, e-mail: [email protected]
M.A. Sergeeva, assistant, Voronezh State Technical University, Voronezh, Russian Federation, e-mail: [email protected]
The article deals with the construction of the automated information system of diagnosis and the type of treatment of endometrial hyperplastic processes based on statistical and neural network modeling. To build mathematical models of diagnosis and choice of treatment were used statistical data on 230 patients with endometrial hyperplasia: endometrial hyperplasia, endometrial polyp and the polyp of the cervical canal. To improve the efficiency of diagnostics of hyperplastic processes of the endometrium and assessment of the significance of clinical signs in the first stage of the study it is proposed to use a method of constructing a decision tree. The result was built several decision trees: full binary, complete with many descendants in the node a compact (binary), compact with many descendants in the node. The analysis of the obtained results was selected a complete binary tree of solutions". Testing of the constructed model was performed on the test sample, where the accuracy of diagnosis by the method of "decision trees" is 77.5 %. In the next phase of the study were obtained classification Fisher's function to supply the preliminary diagnosis for each type of endometrial pathology. The analysis and testing of classification models, it was found that the accuracy of diagnostic models based on discriminant analysis is of 85.5 %. For specification of the diagnosis in the second stage of the study built a neural network model, where it was used the neural network in the form of multilayer perceptron where the input sensor layer serves the values of the 12 signs of illness, and the output resultant layer obtained data on the type of hyperplastic process of the endometrium. Based on testing of the control group patients it was found that the accuracy of diagnosis based on neural network modeling is 93.9 %. The resulting model-based method build a decision tree, discriminant analysis and neroserial simulation are used in the automated information system, which contribute to improve the diagnosis and choice of treatment of endometrial hyperplastic processes
Key words: information systems, diagnosis, treatment, gynecology
References
1. Hotz E.S., Bychkov V.I., Frolov M.V. Faktory riska razvitija giperplasticheskih processov jendometrija [Factors of risk for development of endometrial hyperplastic processes] // Journal of theoretical and practical cal medicine. - M, 2008. - Vol. 6. N. 1 P. 32-35.
2. Novikova E.I., Rodionov O.V., Korovin E.N. Modelirovanie biomedicinskih sistem [Modeling of biomedical systems] // Voronezh: VSTU, 2008. - 196 p.
3. Rodionov O.V., Sergeeva M.A., Sidorova A.K. Postroenie imitacionnoj modeli diagnostiki i lechenija giperplasticheskih processov jendometrija na osnove setej Petri [Construction of a simulation model of diagnosis and treatment of endometrial hyperplastic processes based on Petri nets] // System analysis and management in biomedical systems - M., 2015. - Vol. 14. N. 3. - P. 574-576.
4. Rodionov O.V., Sergeeva M.A. Procedura ocenki sostojanija razvitija patologii jendometrija u zhenshhin na osnove nejrostatisticheskogo modelirovanija [Procedure of assessing the development of endometrial pathology in women on the basis of neurostatistical modeling] // System analysis and management in biomedical systems - М., 2016. - Vol. 15. N 1. - P. 110-114.
5. Korovin E.N., Rodionov O.V. Metody obrabotki biomedicinskih dannyh [Methods of processing of biomedical data] // Voronezh: VSTU, 2007. - 152 p.
6. Korovin E.N., Sergeeva M.A., Sidorova A.K. Razrabotka informacionno-programmnogo obespechenija podsistemy diagnostiki giperplasticheskih processov jendometrija na osnove diskriminantnogo analiza [The development of information and software subsystem of diagnostics of hyperplastic processes of the endometrium based on discriminant analysis] / Management in biomedical, social and economic systems - Voronezh: VSTU. 2013. - P. 54-58.