УДК 519.95
ГЕНЕРАЛИЗАЦИЯ МЕДИЦИНСКИХ ЭМПИРИЧЕСКИХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ ИНС-МОДЕЛЕЙ
© А.А. Арзамасцев, Н.А. Зенкова, В.Н. Чичук
Ключевые слова: математическая модель; ИНС-модель; медицинский объект.
Представлены результаты моделирования медицинского объекта (с целью прогнозирования течения алкогольной болезни печени) на основе эмпирических данных с использованием аппарата искусственных нейронных сетей. Приведены структура, анализ и результаты расчета коэффициентов полученных ИНС-моделей.
В настоящее время математическое моделирование и математические методы обработки и генерализации результатов экспериментов стали одним из наиболее быстро прогрессирующих научных направлений. H использовании математического моделирования как ядра интеллектуальных технологий базируются: построение экспертных систем различного назначения, методики обработки научных данных и поиск скрытых закономерностей, прогнозирование в различных сферах человеческой деятельности, управление социальными и техническими объектами и их системами, идентификация внутренней структуры объектов различной природы и др. [1].
Ранее нами было показано, что математическим аппаратом, хорошо зарекомендовавшим себя в качестве инструментария для построения моделей различных объектов на основе эмпирических данных (в т. ч. для построения моделей в медицине), является аппарат искусственных нейронных сетей (MHC). Достоинством MHC-моделей является также их достаточно простая интегрируемость в экспертные системы [2—12].
Целью данной работы является изучение медицинского объекта на основе эмпирического материала по течению алкогольной болезни печени, построение линейной и нелинейной MHC-моделей, а также выбор наиболее адекватной из них.
Алкогольное поражение печени и его осложнения остаются одной из самых частых причин смерти в Европе и CШЛ. Актуальным вопросом современности названа алкогольная болезнь печени, которая представляет собой последовательные стадии: стеатоз, хронический гепатит и цирроз печени [ 1З].
В предыдущей работе нами была разработана MHC-модель на основе эмпирических данных здоровых людей, больных стеатозом, больных хроническим гепатитом, больных циррозом печени. Данные представляли собой прямоугольную матрицу, содержащую 11S строк и 58 столбцов. Каждая строка соответствовала одному пациенту, столбцы содержали данные об истории болезни, результатах инструментально-лабораторных обследований и других характеристиках пациентов. При дальнейшей идентификации модели были выявлены и удалены незначимые входные параметры. В результате были оставлены лишь 20 входных перемен-
ных, оказывающих существенное влияние на результат моделирования [14].
Оставшиеся значимые показатели легли в основу для сбора новых эмпирических данных (В.К Чичук) и разработке на их основе линейной и нелинейной MHC-моделей, что и составляет содержание данной работы.
Медицинские данные по влиянию различных факторов на заболевания печени представляют собой таблицу, содержащую 209 строк и 20 столбцов. Каждая строка соответствует одному пациенту, условно отнесенному к одному из следующих состояний: здоров, стеатоз, гепатит, цирроз.
Для разработки MHC-модели таблица дополнена 21-м столбцом с использованием следующей кодировки: здоров - 1, стеатоз - 2, гепатит - З, цирроз - 4. Это состояния выхода модели - Y. Входными параметрами модели являются следующие 20 параметров: х! - пол (l - мужской, 2 - женский; х2 - бессонница (0 - нет, 1 -есть); х3 - кожный зуд (0 - нет, 1 - есть); х4 - кровотечения (0 - нет, 1 - из десен, 2 - носовые, З - кожные геморрагии, 4 - маточные, 5 - геморроид); х5 - частота приема алкоголя (1 - менее одного раза в неделю, 2 -один раз в неделю, З - от двух до пяти раз в неделю; 4 - ежедневно); х6 - индекс массы тела (ИМТ); х7 -печень при пальпации (1 - норма, 2 - уменьшена, З -увеличена); х8 - поверхность печени (1 - гладкая, 2 -бугристая); х9 - размеры по Курлову (l - норма, 2 -уменьшены, З - увеличены); х10 - асцит (0 - нет, 1 -да); х11 - холестерин; х12 - билирубин общий; х13 - билирубин прямой; х14 - АЛТ; х15 - ACT; х16 - ГГТП; х17 -общий белок; х18 - альбумин; х19 - протромбиновое время; х20 - коэфициент де Ритиса.
Параметрическую идентификацию ИЖ-моделей осуществляли методами минимизации функций многих переменных - градиентным методом (вдали от точки минимума) и методом покоординатного спуска (вблизи точки минимума). Программы данных методов разработаны специально для решения данной задачи.
В результате моделирования были построены две MHC-модели, схемы которых приведены на рис. 1 и рис. 2 соответственно.
В первом случае была разработана искусственная нейронная сеть с одним функциональным линейным нейроном (однослойный персептрон) (рис. 1).
Рис. 1. Схема искусственной нейронной сети с одним функциональным линейным нейроном - однослойный персеп-трон
w[15] = -6,4639998490E-03, w[16] = 7,1090999424E-03, w[17] = -7,0323000145E-03, w[18] = 9,9013999881E-03, w[19] = -7,9502004456E-03, w[20] = 3,8129899816Б-01, w[21] = 3,2123449379E-01, w[22] = 5,1020619633E-01.
Таким образом, в данном случае было допущено 32 ошибки в расчетах на 209 строк данных. Во всех случаях ошибка составила одну единицу, что соответствует при принятой системе кодировок ближайшему диагнозу.
Во втором случае была разработана искусственная нейронная сеть с двумя (линейным и квадратичным) функциональными нейронами (рис. 2).
Уравнение ИНС-модели для схемы (рис. 2) имеет следующий вид:
ґ ' 20 > ' 40 > 2 > >
Y = Entier X wixi + w41 ■ w43 + + w42 ■ w44 , (2)
v i=1 У V V i=21 У У У
где м>,-, I = 1, ..., 44 - весовые коэффициенты; функция Епйег обозначает округление до ближайшего целого значения.
Для схемы рис. 2 и уравнения (2) получены следующие значения весовых коэффициентов ИНС-мо-дели:
Уравнение ИНС-модели для схемы (рис. 1) имеет следующий вид:
((
Y = Entier
20
X w,X, + w21
V i=1
■ w22
УУ
(1)
где, м>,-, I = 1, ..., 22 - весовые коэффициенты; функция Епйег обозначает округление до ближайшего целого значения.
Для схемы рис. 1 и уравнения (1) получены следующие значения весовых коэффициентов ИНС-модели:
Mean square 1.3771447211E-01:
error of the ANN-model is:
w[l] = -3,6857599245E-02, w[2] = 2,4369ll9770E-0l, w[3] = -9,9749l99869E-02, w[4] = 5,7938400236E-02, w[5] = 3,9803560249E-01, w[6] = -5,4258006336E-03, w[7] = -2,l74396004lE-0l, w[8] = l,4l592335l7E+00, w[9] = l,l5487400l6E-0l, w[l0] = 1,2813840116E-01, w[ll] = l,8538799904E-0l, w[l2] = -l,l342999645E-03, w[l3] = 2,9297997979E-03, w[l4] = 2,3189899714E-02,
Рис. 2. Схема искусственной нейронной сети с двумя (линейным и квадратичным) функциональными нейронами
Mean square error of the ANN-model is: 9.5630518547E-02
w[1] = -3,0939399887E-01, w[2] = 1,0072580036E+00, w[3] = -1,3844160019E+00, w[4] = 5,4790000040E-01, w[5] = 4,1882000197E-01, w[6] = -4,0460000037E-02, w[7] = -1,8122799992E-01, w[8] = 6,7949199957E-01, w[9] = -1,3871200034E-01, w[10] = 1,2121420062E+00, w[11] = 6,2902599989E-01, w[12] = -1,3620000610E-03, w[13] = 7,0629999412E-03, w[14] = 7,6133999932E-02, w[15] = -3,2400000068E-02, w[16] = 2,6167999949E-02, w[17] = -1,0596000059E-02, w[18] = -2,3490000073E-02, w[19] = -1,8336000067E-02, w[20] = 2,7068940093E+00, w[21] = 4,5878799974E-01, w[22] = -3,9990199960E-01, w[23] = 5,5632400127E-01, w[24] = -2,7460999974E-01, w[25] = 4,5868999999E-01, w[26] = 6,0279999372E-03, w[27] = -2,8430000004E-01, w[28] = 8,7280000127E-01, w[29] = 1,4141000019E-01, w[30] = -4,7252000087E-01, w[31] = -1,1423600008E-01, w[32] = -4,0850000613E-03, w[33] = 5,2119999395E-03, w[34] = -1,3979000061E-02, w[35] = 1,0545999939E-02, w[36] = -2,5920000608E-03, w[37] = -1,3590000618E-03, w[38] = 1,1799999942E-02, w[39] = -6,8480000587E-03, w[40] = -9,7938400222E-01, w[41] = 2,6518100064E+00, w[42] = 2,2707999951E-01, w[43] = 2,1797999958E-01, w[44] = 3,2772000038E-01.
Во втором случае допущена 21 ошибка в расчетах на 209 строк данных. Во всех случаях ошибка составила одну единицу, что соответствует при принятой системе кодировок ближайшему диагнозу.
Таким образом, нами были построены две адекватные ИНС-модели для моделирования и прогнозирования течения алкогольной болезни печени. В результате анализа было выявлено, что нелинейная модель (2) делает в полтора раза меньше ошибок и представляет интерес для дальнейших разработок.
ЛИТЕРАТУРА
1. Арзамасцев А. А. Математическое и компьютерное моделирование. Тамбов: Издат. дом ТГУ им. Г.Р. Державина, 2010. 257 с.
2. Арзамасцев А.А., Зенкова Н.А. Искусственный интеллект и распознавание образов. Тамбов: Издат. дом ТГУ им. Г.Р. Державина, 2010. 196 с.
3. Зенкова Н.А. Компьютерное моделирование в психологии. Тамбов: ИМФИ ТГУ им. Г.Р. Державина, 2007. 55 с.
4. Арзамасцев А.А., Зенкова Н.А. Система психологического тестирования на основе аппарата искусственных нейронных сетей // Искусственный интеллект. 2004. № 2. С. 237-242.
5. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Разработка экспертной системы с развивающимся интеллектуальным ядром на базе ИНС-моделей // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2010. Т. 15. Вып. 6. С. 1849-1857.
6. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Технология построения медицинской экспертной системы на основе аппарата искусственных нейронных сетей // Информационные технологии. 2009. № 8. С. 60-63.
7. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Формализация проблемы разработки экспертной информационной системы с развивающимся интеллектуальным ядром на базе ИНС-моделей // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2010. Т. 15. Вып. 1. С. 287-290.
8. Крючин О.В., Зенкова Н.А. Использование искусственных нейронных сетей для решения задач классификации на примере моделирования медицинского объекта // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2011. Т. 16. Вып. 3. С. 789-792.
9. Мишин А.С., Арзамасцев А.А., Зенкова Н.А. Экспертная система для прогнозирования результатов хирургического лечения больных колоректальным раком, осложненных острой кишечной непроходимостью // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2012. Т. 17. Вып. 2. С. 649-658.
10. Zenkova N.A., Arzamastsev A.A., Troitzsch K.G. Development of a
technology of designing intelligent information systems for the estimation of social objects // Institut fur Wirtschafts- und Verwaltungsinfor-matik Fachbereich Informatik Universitat Koblenz-Landau. 2011. № 1. URL: http://www.uni-koblenz.de/~fb4re-
ports/2011/2011_01_Arbeitsberichte.pdf. Загл. с экрана.
11. Kryuchin O.V., Arzamastsev A.A., Zenkova N.A., Troitzsch K.G., Sletkov D. V. Simulating medical objects simulation using an artificial neural network whose structure is based on adaptive resonance theory // Institut fur Wirtschafts- und Verwaltungsinformatik Fachbereich Infor-matik Universitat Koblenz-Landau. 2011. № 14. URL: http://www.uni-koblenz.de/~fb4reports/2011/2011_14_Arbeits-
berichte.pdf. Загл. с экрана.
12. Kryuchin O.V., Arzamastev A.A., Troitzsch K.G., Zenkova N.A. Simulating social objects with an artificial neural network using a computer cluster // Institut fhr Wirtschafts- und Verwaltungsinformatik Fachbereich Informatik University Koblenz-Landau. 2011. № 15. URL: http://www.unikoblenz.de/~fb4reports/2011/2011_15_Arbeits-berichte.pdf. Загл. с экрана.
13. Сернов С.П., Лифшиц В.Б., Субботина В.Г., Папшицкая Н.Ю., Мартынова А.Г., Аредаков К.Г., Шульгин В.И. Эпидемиология алкогольной болезни печени // Саратовский научно-медицинский журнал. 2009. Т. 5. № 4. С. 564-568.
14. Арзамасцев А.А., Лифшиц В.Б., Чичук В.Н. Разработка математической модели прогнозирования течения алкогольной болезни печени // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2012. Т. 17. Вып. 4. С. 1246-1253.
Поступила в редакцию 23 ноября 2012 г.
Arzamastsev A.A., Zenkova N.A., Chichuk V.N. GENERALIZATION OF MEDICAL EMPIRICAL DATA USING ANN-MODELS
The simulation results of medical object (to predict the course of alcoholic liver disease) on the basis of empirical data using artificial neural networks are presented. The structure, analysis and results obtained by calculating of the coefficients of ANN-models are given.
Key words: mathematical model; ANN-model; medical object.