УДК 616.345-006.6-007.271-089 (043.2)
ЭКСПЕРТНАЯ СИСТЕМА ДЛЯ ПРОГНОЗИРОВАНИЯ РЕЗУЛЬТАТОВ ХИРУРГИЧЕСКОГО ЛЕЧЕНИЯ БОЛЬНЫХ КОЛОРЕКТАЛЬНЫМ РАКОМ, ОСЛОЖНЕННЫХ ОСТРОЙ КИШЕЧНОЙ НЕПРОХОДИМОСТЬЮ
© А.С. Мишин, А.А. Арзамасцев, Н.А. Зенкова
Ключевые слова: экспертная система; математические методы обработки экспериментальных данных; ИНС-модель; кишечная непроходимость; прогнозирование результатов хирургического лечения.
Статья посвящена разработке экспертной системы для прогнозирования исходов хирургического лечения колоректального рака, осложненного острой непроходимостью на основе аппарата искусственных нейронных сетей. Приведены результаты расчета коэффициентов ИНС-модели и ее структура. По результатам обработки эмпирических данных получена математическая модель и ее программная реализация.
ВВЕДЕНИЕ
Компьютерные экспертные системы (ЭС) в настоящее время используются для прогнозирования, определения оптимальных и благоприятных управляющих воздействий при принятии решений в различных областях науки, техники, медицины, а также анализе социологических явлений и объектом. В подавляющем большинстве случаев ядром такой системы является решатель - своеобразная конструкция, объединяющая данные и связи между ними в единую базу знаний. В качестве такого решателя в подавляющем большинстве случаев может быть использована математическая (в широком смысле) модель объекта или явления. По этой причине разработка реальной экспертной системы предполагает следующие основные этапы: накопление эмпирической информации об объекте, ее генерализация различными математическими методами и разработка математической модели, адекватной такому объекту, разработка соответствующего компьютерного приложения (программы), сочетающего в себе интерфейс с пользователем, интеллектуальное ядро (математическую модель) и интерфейс вывода результатов.
Целью настоящей статьи является разработка специализированной экспертной системы, позволяющей прогнозировать исход онкологических операций при осложненном колоректальном раке на основе эмпирического материала, представляющего собой таблицу медицинских показателей и исходов операций для 156 больных, реально прооперированных в городской клинической больнице имени архиепископа Луки, г. Тамбов.
В качестве медицинских показателей взяты: возраст больного; пол больного; наличие сопутствующей патологии - нарушение мозгового кровообращения, почечная недостаточность, перенесенный острый инфаркт миокарда, сердечная недостаточность, дыхательная недостаточность, сахарный диабет, другие сопутствующие заболевания; пульс; длительность заболевания; систологическое артериальное давление; частота дыхательных движений; лейкоциты крови; сдвиг лей-
коцитарной формулы влево; ядерный индекс интоксикации; наличие метастазов; размеры толстой и тонкой кишки; длительность операции; прорастание опухоли в окружающие структуры; наличие осложнений; наличие рвоты; наличие выпота в брюшной полости и объем операции (радикальная - по типу обструктивной резекции и паллиативная - наложение колостомы). Выходным показателем во всех случаях является исход (выписан, выздоровление или летальный исход).
Экспертная система должна быть спроектирована и реализована таким образом, чтобы по набору медицинских показателей вновь поступившего больного и объему операции прогнозировать возможный исход.
В качестве интеллектуального ядра такой системы должна быть построена математическая модель, связывающая медицинские показатели больного, объем операции и возможный исход операции, закодированные определенным образом.
В настоящее время математическое моделирование и математические методы обработки и генерализации результатов экспериментов стали одним из наиболее быстро прогрессирующих научных направлений, которое органично вошло во многие сферы научной и повседневной жизни [1-2]. На использовании математического моделирования как ядра интеллектуальных технологий базируются: построение экспертных систем различного назначения [1, 3-12], методики обработки научных данных и поиск скрытых закономерностей [2, 13-15], прогнозирование в различных сферах человеческой деятельности [4, 16], управление социальными и техническими объектами и их системами [3-4, 17-18], идентификация внутренней структуры объектов различной природы [3-4, 19-21], научнотехнические расчеты [1, 9-10] и др.
Сущность методологии моделирования заключается в замене реального объекта его «образом» - моделью, изучение которой для исследователя оказывается более предпочтительным, нежели изучение самого объекта [1]. Такое предпочтение может быть вызвано следующими причинами [3]:
- исследование реального объекта в принципе невозможно. Такая ситуация имеет место, например, при
прогнозировании в будущее или в прошлое, ведь машина времени пока еще не изобретена, и «посмотреть», что будет с объектом через некоторое время или что было с ним в прошлом, возможно только с помощью модели. Другой пример - проектирование новой технологии или технологического процесса: технология еще не существует в виде реальной конструкции, но на этапе ее проектирования уже необходимо просчитать основные технико-экономические и технологические параметры;
- исследование реального объекта в принципе возможно, но затруднено. Такая ситуация имеет место, например, когда проведение натурных экспериментов является «дорогим удовольствием» или когда объект существует в единственном экземпляре, а также, например, при изучении природных объектов;
- реальный объект является чрезвычайно сложным, но исследователя интересует изучение поведения или свойств некоторой его относительно независимой части; в этой ситуации вместо сложного реального объекта возможно построить относительно простую модель, касающуюся лишь этой части; именно так и поступают в естественных науках, ограничиваясь в изучении явления лишь наиболее существенными параметрами, влияющими на его характеристики;
- моделируется гипотетический (реально не существующий) объект.
Построение математических моделей в различных областях знаний - естественных, технических науках, а также социальной сфере принципиально возможно на основе теоретического, эмпирического и комбинированного подходов. В первом случае модель строится «за столом», т. е. ее основу составляют хорошо известные и проверенные теоретические положения и эмпирические данные. Никаких дополнительных экспериментов для ее разработки проводить не нужно. Эмпирический подход предполагает разработку модели исключительно на основе экспериментальных данных. Так обычно поступают в областях, в которых не существует развитой теоретической базы или трудно связать явления различных уровней. При таком подходе математическая модель обычно практически полностью лишена физичности, однако ее достоинствами являются относительная простота и универсальность используемых математических аппаратов. При комбинированном подходе математическая модель обычно строится, исходя из теоретических соображений, а ее параметры определяются на основе эмпирических данных [3].
В нашем случае необходимо построение модели на основе эмпирического подхода, т. к. теоретические данные о связи выходного и входных параметров отсутствуют, но имеется значительный набор эмпирических данных по пациентам.
Способами реализации эмпирических моделей могут быть: регрессионный анализ, интерполирование, аппроксимация [2, 13, 15]; статистический анализ [2]; корреляционный анализ совместно с аппроксимацией [2, 13, 15]; планированный эксперимент [13] и временные ряды [2]; искусственные нейронные сети [4, 2223].
Для использования регрессионного анализа, интерполирования или аппроксимации входные и выходные переменные должны представлять собой действительные числа, что не выполняется в нашем случае (см. раздел 1). Для использования методов математической
статистики и корреляционного анализа необходимо иметь значительное число измерений выходного параметра при одинаковых значениях входного вектора, что также не выполняется в нашем случае (см. раздел 1). Планированный эксперимент также неприменим ввиду того, что выборка эмпирических данных должна быть составлена таким образом, что каждый фактор должен принимать как минимум (для получения линейной модели) максимальное и минимальное значения. В нашем случае это потребовало бы 224 = 16777216 экспериментов! Временные ряды к данной ситуации неприменимы по своей сути.
В связи с вышеизложенным будем считать, что единственным математическим аппаратом, приемлемым в нашем случае, является аппарат искусственных нейронных сетей (ИНС) [4, 22-24], ранее хорошо зарекомендовавший себя в качестве инструментария для построения моделей различных объектов на основе эмпирических данных [2, 4, 11-12, 16-21, 23, 25-29]. Необходимо отметить также, что имеется опыт использования этого аппарата для построения моделей в медицине [25, 29-30].
Достоинством моделей на ИНС (далее ИНС-моделей) является их достаточно простая интегрируемость в экспертные системы [5, 12, 30-31].
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
Искусственная нейронная сеть (ИНС) - это адекватная компьютерная модель биологической нейронной сети, отличающаяся от аналога в количественном отношении, но использующая базовые принципы устройства прототипа, что можно считать применением бионических принципов и моделей в информационных технологиях. В математическом плане симулятор ИНС -это набор определенных процедур, хорошо известных в различных областях математики (теория графов, численные методы, методы аппроксимации, методы нелинейного программирования и др.), объединенных в единое целое.
ИНС-модель - это математическая модель объекта, построенная на основе ИНС. При ее разработке выполняются процедуры структурной и параметрической идентификации. Структурная идентификация в ИНС хорошо визуализирована, что позволяет быстро подбирать подходящие (для описания эмпирических данных) структуры моделей. Параметрическая идентификация (в ИНС эта процедура называется обучением) заключается в минимизации невязки эмпирических данных и модельных расчетов методами нелинейного программирования.
Обучение ИНС-модели - целенаправленный процесс изменения значений весовых коэффициентов, повторяемый до тех пор, пока сеть не приобретет необходимые свойства.
Экспертная система - специальная программа, генерализующая опыт экспертов в определенной предметной области и позволяющая делать различные расчеты (прогнозы, классификация, анализ чувствительности факторов и т. д.) на основе интеллектуального ядра-решателя. В качестве решателя в нашем случае будет использована ИНС-модель.
Более широкие описания устройства искусственных нейронных сетей, процессов их обучения и др. приведены в специальной литературе [4-5, 17, 19-23, 29-32].
Таблица 1
Эмпирические данные наблюдений за объектом
№ X1 X2 Xn Y1 Y2 Yk
1 X11 X21 Xn1 Y11 Y21 Yk1
2 X12 X22 Xn2 Y12 Y22 Yk2
P X1P X2p у Xnp y1p Y2p Ykp
ОБРАБОТКА ДАННЫХ И СОЗДАНИЕ МОДЕЛИ
Разработка ИНС-модели начинается с накопления эмпирической информации о входных и выходных значениях объекта. Такая информация обычно может быть представлена в табличном виде (табл. 1).
Для того чтобы ИНС-модель была способна к генерализации эмпирических данных, число строк в обучающей выборке - р в общем случае должно быть больше, чем число степеней свободы искусственной нейронной сети. Отметим, что для гомогенной ИНС с фиксированной структурой связей число степеней свободы равно числу независимых весовых коэффициентов. Для гетерогенной сети число степеней свободы равно числу независимых весовых коэффициентов плюс число нейронов, для которых в процессе обучения ИНС-модели выбираются функции активации.
Таким образом, количество строк эмпирических данных об объекте в табл. 1 должно быть достаточно большим. Поскольку в процессе обучения ИНС-модели структура искусственной нейронной сети часто не задана изначально, в процессе обучения приходится пополнять таблицу эмпирических данных новыми записями.
Обозначим через Е(у>) функцию невязки, зависящую от вектора весовых коэффициентов ^ и представляющую собой расстояние между векторами выходных координат объекта, содержащихся в обучающей выборке 7“ и полученных по ИНС-модели - 7”*:
F (w)
| = Wtabl - Ynet (W)l =
І ІY
I j=1 i=1
tabl Т/ net
(w))
(1)
Под обучением ИНС будем понимать процесс минимизации невязки (1) за счет выбора значений вектора я. Сеть со значениями компонент вектора w*=(w ь я 2,.. .,я т), при которых достигается минимум невязки (1), будем называть обученной. Значение ^(я*), полученное при таких значениях компонент вектора я, численно характеризует несоответствие обучающей выборки и ИНС-модели.
Таким образом, задача обучения ИНС может быть сформулирована как задача нахождения минимума функции многих переменных. Поскольку в искусственной нейронной сети каждый нейрон имеет нелинейный элемент, такая задача является задачей нелинейного программирования.
Если после обучения сети величина невязки равна нулю - это значит, что сеть обучилась абсолютно точно.
Причинами того, что невязка Дя*) не равна нулю, могут быть:
- погрешность эмпирических данных обучающей выборки или их противоречивость. Такая погрешность является непреодолимой на этапе предварительной подготовки данных;
- неверно выбрана структура ИНС; это можно преодолеть путем выбора новой структуры, например, с большим числом нейронов в слое и большим числом скрытых слоев;
- метод минимизации невязки (1) «зашел» в локальный минимум; можно попробовать выбраться из него или совершить «спуск» из другой начальной точки.
Для минимизации ошибок (функций невязки) часто используют различные методы нелинейного программирования [2].
Для предварительной обработки данных использовали симулятор ИНС (Neural Network Constructor -NNC), являющийся свободно распространяемой программой (freeware)1. Используя NNC, пользователь может легко создавать, обучать и использовать нейронные сети. Так как нейронные сети могут аппроксимировать любые непрерывные и дискретные функции, отображающие одно конечномерное пространство в другое с любой желаемой степенью точности, это позволяет пользователю создавать прогностические модели в различных предметных областях. Данная программа позволяет использовать до 60 входных нейронов, варьировать функцией нейрона, количеством слоев и связей сети. Она содержит в себе готовые алгоритмы обучения по следующим методам: покоординатный спуск, случайный поиск, метод Ньютона, статистический градиентный метод, комбинации этих методов.
Наращивание структуры сети, как правило, производят от простого к сложному до тех пор, пока не будет достигнута удовлетворительная погрешность генерализации эмпирических данных.
По этой причине на первом этапе обучали нейронную сеть, имеющую 24 входа, один скрытый слой, включающий один линейный нейрон и один выходной слой, также содержащий один нейрон (рис. 1). Необходимо отметить, что такая линейная аппроксимация имеет особый смысл, т. к. в результате получается линейное приближение ряда Тейлора
f (x) = f (a) + ~~~~(Xi - a) +
дхі
1 д2 f (x) .2
+—■- — ( Xi — a) + ... +
(2)
2! дх,2
1 д (n-1)f (x)
(n -1)! дх,’
P( x - a)n-1 + On (x),
1 http://lmgdd.ibmh.msk.su/NNC/. Инструкцию по работе с
этой программой можно найти на этом же сайте или в более подробном виде в третьей части нашего учебного пособия [4].
W
по которому легко оценить чувствительность каналов:
/(х) = /(а) + /Х)(х - а) + °2ІХ) , (3)
охі
где у(х) - функция нескольких переменных, а - рабочая точка, і - порядковый номер рассматриваемой переменной.
На рис. 2 и 3 показан процесс обучения нейронной сети при использовании метода покоординатного спуска. Из рис. 2 видно, что погрешность ИНС-модели быстро снижается за счет изменения весовых коэффициентов. Рис. 3, построенный в логарифмических координатах, свидетельствует об экспоненциальном характере снижения погрешности при использовании данного метода обучения ИНС.
Среднеквадратичная погрешность обучения составила 0,08, количество случаев неверного обучения - 12 из 156, что нельзя считать приемлемым результатом. На рис. 4 представлен фрагмент таблицы весовых коэффициентов ИНС, показанной на рис. 1. На диаграмме (рис. 5) показана чувствительность выхода - исход (выписан, выздоровление или летальный исход) - к входным параметрам. Из этой диаграммы можно сделать вывод о том, что исход крайне малочувствителен к возрасту больного, нарушениям мозгового кровообращения, сахарному диабету и другим сопутствующим
Рис. 1. Структура сети - однослойный персептрон. Входные нейроны, соответствующие хі-х24, показаны серым цветом, нейрон с линейной передаточной функцией - желтым цветом, выходной нейрон (у) - белым цветом
патологиям. Вместе с тем наиболее значимыми факторами с точки зрения исхода являются: почечная недостаточность, сердечная недостаточность, частота дыхательных движений, наличие метастазов, размеры толстой кишки, наличие осложнений. Влияние на исход таких факторов, как пол больного, перенесенный острый инфаркт миокарда, дыхательная недостаточность, пульс, длительность заболевания, систологическое артериальное давление, лейкоциты крови, ядерный индекс интоксикации, длительность операции, прорастание опухоли, рвота, наличие выпота в брюшной полости и объем операции прослеживается на среднем уровне.
Необходимо отметить, что рис. 5 позволяет оценить и направление влияния фактора. Например, чувствительность фактора 2 (пол больного) является отрицательной, что в силу принятого шифрования означает, что женщины чаще выздоравливают, чем мужчины. Вероятность летального исхода возрастает при почечной и сердечной недостаточности, высокой частоте дыхательных движений, высоком уровне лейкоцитов крови, наличии метастазов, повышенного размера толстой и тонкой кишки, наличии осложнений. В то же время вероятность летального исхода снижается при
In S
In m
Рис. 3. Процесс обучения ИНС-модели (линейная функция нейрона) методом покоординатного спуска в логарифмических координатах
S
О 2000 4000 6000 8000 10000
ГГ1
Рис. 2. Процесс обучения ИНС-модели (линейная функция нейрона) методом покоординатного спуска: б - среднеквадратическая погрешность, m - число тактов обучения
Рис. 4. Фрагмент таблицы весовых коэффициентов ИНС, показанной на рис. 1
Рис. 5. Относительная чувствительность выхода ИНС-модели (исход) к входным параметрам: 1 - возраст больного, 2 - пол больного, 3 - нарушение мозгового кровообращения, 4 - почечная недостаточность, 5 - перенесенный острый инфаркт миокарда, 6 - сердечная недостаточность, 7 - дыхательная недостаточность, 8 - сахарный диабет, 9 - другие сопутствующие патологии, 10 - пульс, 11 - длительность заболевания, 12 - систологическое артериальное давление, 13 - частота дыхательных движений, 14 - лейкоциты крови, 15 - ядерный индекс интоксикации, 16 - наличие метастазов, 17 - размеры толстой кишки, 18 - размеры тонкой кишки, 19 - длительность операции, 20 - прорастание опухоли, 21 - наличие осложнений, 22 - рвота, 23 - наличие выпота в брюшной полости, 24 - объем операции
NC v3J31 - [fcVAn\_OOO_Eipeft.5ystem5_Ltd\_ProjKt_01_5TART_2011\Mo<lel_af_Wedic^Oj|HH линейный нейрон 0®^
File Edrt View Run Help
П|в|Н| ЩЩ и®
t N15 <1л)|n16 I la H17 (ГлЭ N18 (In! 1K1S С In! |n20 (Іп>|к21 ;ію)|н22 (3с)|1і23 (In > | N2 4 (Id) Ї26 (due) |xodelYal| -
33 22300001 1 1 21828
34 2 1 3 0 0 0 0 1 L 0 90797
ЗБ 3 2 3 0 0 0 12 2 1 07Э26
Зг 2 110 0 0 0 2 1 0 87164
37 2 1 1 0 0 0 0 2 1 0 31313
33 2 2 2 0 0 0 1 2 1 1 07055
39 3 2 13 0 4 111 1 1 S76S6
40 2 2 10 0 10 2 1 1 23953
41 l| 2 14 0 4 111 1 1 127S4
42 l| 3 3 3 0 4 112 2 1 66325
43 1 2 2 2 2 0 1 0 2 2 1 33074
44 1 3 2 2 0 0 0 1 2 2 1 €4311
45 2 3 2 2 0 0 0 0 2 2 1 41437
*
І» 15? 1
Рис. 6. Фрагмент таблицы соответствия вличин у, полученных из эмпирических данных (N26 (Out)) и по ИНС-модели (Mod-elVal) для однослойного персептрона - обведено красным
повышении пульса и ядерного индекса интоксикации, увеличении длительности операции, смещении объема операции в сторону паллиативной.
Следует отметить также, что вход 24 (объем операции) в силу принятого технического задания является управляющим фактором, так как, только изменяя его, врач может влиять на исход операции. Однако в соответствии с рис. 5 степень его влияния надо признать весьма умеренной.
На рис. 6 показан фрагмент сравнения эмпирических и расчетных значений, позволяющий сделать вывод о необходимости повышения точности ИНС-модели, что будет сделано далее путем введения дополнительных нейронов в скрытый слой.
Так, на рис. 7-9 показаны вычислительные эксперименты с ИНС-моделью, включающей линейный и
квадратичный нейроны в скрытом слое. Среднеквадратичная погрешность обучения составила 0,06, количество случаев неверного обучения - 7 из 156, что также нельзя считать приемлемым результатом.
В ходе вычислительных экспериментов пробовали также передаточную функцию нейрона типа «сигмоид», однако и в этом случае не были получены удовлетворительные результаты.
I 0. « I [
Рис. 7. Структура сети - однослойный персептрон. Входные нейроны, соответствующие Х1-Л24, показаны серым цветом, нейрон с линейной передаточной функцией - желтым, нейрон с квадратичной передаточной функцией - зеленым, выходной нейрон (у) - белым цветом
fr* NNC v.3.01 - D:\Arz\_000_Expert_Systems_Ltd\_Project_01_START_2011\Mоdel_of_Medіca 1\0дим линейный и один квадрат... [ □ || В~||
Fil D E & it View Run Help Q| ЩЩ ИІіиІ
і E v )~vs~ |:---;::т:-;г||||||| |||||||: •-- "І:--- :ф--- " □
-0,04338 0,00723
Input -0,0448 0,41629
і 3 Input -0,00562 -0,12161
4 4 Input 0,16775 0,04523
5 5 Input -0,05488 0,07839
6 6 Input 0,15846 -0,21791
7 7 Input -0,06382 0,23995
■ 8 Input 0,0083 -0,02028
9 9 Input -0,00223 -0,06642
10 10 Input -0,03774 0,21555
11 11 Input 0,09876 0,13025
12 12 Input 0,02294 -0,2596
13 13 1 Input 0,24044 0,03118
14 Input 0,0567 -0,0235
15 15 Input -0,00493 0,04817
1_^_____________________________ і
Рис. 8. Фрагмент таблицы весовых коэффициентов ИНС-модели, показанной на рис. 7
$> NNC v.3.01 D:\Arz\_000_Expert_Systems_Ltd\_Project_01_START_2011\Mod еІ_оШес!ісаІ\Один линейный и один квадрат,.. | а Ц В
File Edit View Run Help
0 &|H щ\ ф[в ч|ч|
# ms |in> N16 (In) N17 (In) N18 (In) N19 (In) N20 (In) N21 (In) N22 (In) N23 (In) N24 (In) N26(Out) McdelVal *
146 і 3 3 0 0 0 0 1 1 1,38282
147 3 3 0 0 0 1 1 1 1,36709
148 2 4 0 0 1 1 1 1,08387
149 2 3 3 1 0 0 1 1,80671
ISO 1 3 1 1 0 0 0 0 1 1 1,06511
1S1 2 1 3 1 0 1 1 1 1 1,29142
1S2 2 1 3 1 0 0 0 0 1 1,29654
153 1 3 1 1 0 0 0 0 1 1 1,16268
154 1 3 2 2 1 0 0 0 0 1 1 1,31938
155 3 3 3 3 2 2 4 1 1 2 2 2,07091
156 3 3 3 3 2 0 1 1 1 2 2 1,92575
> II
▼
-
1, 157 |
Рис. 9. Фрагмент таблицы соответствия вличин у, полученных из эмпирических данных (N26 (Out)) и по ИНС-модели (Mod-elVal) для однослойного персептрона с линейным и квадратичным функциональными нейронами - обведено красным
В ходе указанных действий из рассмотрения были удалены следующие факторы: 1 - возраст больного, 3 -нарушение мозгового кровообращения, 5 - перенесенный острый инфаркт миокарда, 7 - дыхательная недоста-
: NNC v.3.0 - D:lArz\ ООО Expert Systems Ltdl Project 01 START 2011\Model of МеїВсаПОди
Edt '.to Fin Нес
6И 4J S s::Jn ЧЩ
, ,
f ІНІ5 (In) |кі6 Ha. I 1117 (In) 1*19 [Ш>||Г19 |ІВ||Я20 <Ы] |н21 (Ы||н22 <Ей)|іГ23 (ІЕ(|н24 (In HodelUa-lj
144 > з г і з г о і о 1,22795
144 г 1 3 2 1 0 0 1 0 1 1,13713
146 і 3 3 2 2 0 0 0 0 1 1.39694
147 3 г з 2 г о о в і 1 1,14*85
на г г г г 4 о г в і 1 0,9651
14Э г 3 3 1 2 2 0 0 1 2 1.32817
150 і 3 2 1 1 0 0 0 0 1 0,96972
151 2 і 3 12 0 111 1 1,19631
152 2 і 3 2 1 0 0 0 0 1 0,94274
153 1 3 2 1 1 0 0 0 0 1 1,07349
154 . 3 2 2 1 0 0 0 0 1 1,10293
І55 3 3 3 3 2 2 1 1 1 г 2,01006
І56 3 3 3 3 2 0 111 г 1,99213 т
4 '
В >
| 1, 1S7
Рис. 10. Структура сети - однослойный персептрон. Входные нейроны, соответствующие х1-х24, показаны серым цветом, нейрон с линейной передаточной функцией - желтым, нейрон с квадратичной передаточной функцией - зеленым, нейрон с кубической передаточной функцией - синим, выходной нейрон (у) - белым цветом
: NNCv.3.01 - D:VArz\ 000 Expert Systems =1
Fife Edt Ией Rur Help
□ BB4J
t , \, ™ 1 DBSCIIPTItrclHI III |uj!fclo27|LinkTo2s| -
1 HI 1 Input 0.07719 -0,11945 -0,04963
: г i input -0,28203 0,22009 -0,08434
i 3 1 Input 0,12674 0,00728 -0,08898
4 4 1 Input 8,22012
■5 5 1 Input В,04896 -0,1254 0,00302
£ 6 1 Input -0,20795 0,16725 0,10821
7 1 Input -5,45485 0,86941 0,2068
9 1 Input 0,1548$
9 9 1 Input -0,2205
10 10 1 Input 0.16093
її 11 1 Input -0,04366 0,0803 0,06696
12 1 Input -0,00259
із 13 1 Input 0,13757
14 14 1 Input -0.24829 0,07788 0.13004
IS 15 1 Input -0,37069 0,21098 0,07471
IS 1 Input 0,05119 -0,14212 0,26831
- ‘
Рис. 11. Фрагмент таблицы весовых коэффициентов ИНС-модели, показанной на рис. 10
Рис. 12. Фрагмент таблицы соответствия величин y, полученных из эмпирических данных (N26 (Out)) и по ИHC-модели (ModelVal) для однослойного персептрона с линейным, квадратичным и кубическим функциональными нейронами - обведено красным
точность, 8 - сахарный диабет, 9 - другие сопутствующие патологии, 23 - наличие выпота в брюшной полости. Однако при их удалении погрешность моделей увеличилась. По этой причине было принято решение не удалять указанные связи.
Удовлетворительное описание эмпирических данных получено лишь при введении в скрытый слой третьего - кубического нейрона (рис. 10-12). Этот результат свидетельствует о нелинейности исхода к входным факторам. Из рис. 12 видно также, что соответствие выхода модели и эмпирических данных находится на приемлемом уровне и после округления может быть использовано в ИНС-модели и экспертной системе.
Формальные результаты, полученные по модели (рис. 10): среднеквадратическая ошибка - 0,0324, число неправильных вычислений исхода - 2 на 156 случаев.
Необходимо отметить, что после анализа чувствительности входных параметров на исход была сделана попытка исключить слабо влияющие факторы из рассмотрения.
Рис. 13. Структурная схема разрабатываемой ИHC-модели 654
Программа NNC не предназначена для визуализации всей обученной структуры ИНС-модели. В ней, например, невозможно увидеть коэффициенты, полученные при нормировании входных данных, нормирующий выходной показатель, ровно как и добавки для каждого нейрона, нарушающие однородность сети. Поскольку одной из задач данного исследования является разработка адекватной ИНС-модели и экспертной системы на ее основе, необходимо было разработать новую программу, включающую нейронную сеть с уже известной структурой (см. рис. 10), эффективный алгоритм ее обучения по эмпирическим данным, вывод результатов в отдельный файл.
Визуально такая ИНС-модель показана на рис. 13. Программа написана на языке высокого уровня Borland Pascal.
ИНС-модель обучена на основе эмпирических данных. При этом получены значения весовых коэффициентов ИнС (рис. 13).
Mean square error of the ANN-model is: 2.8304260957E-02
The weight coefficients of the model are:
w[1] = 2.3015998946E-01
w[2] = 1.7209418639E+00
w[3] = -1.2359808917E+01
w[4] = 1.1115302471E+01
w[5] = 2.7158935930E+00
w[6] = -1. 1748413689E+00
w[7] = -3.4919043683E+00
w[8] = 2.0529339953E+00
w[9] = -2.3700940981E+00
w[10] = 1.0465730006E+00
w[11] = 2.1188599892E-01
w[12] = -1.400800013 3E-01
w[13] = -5.1521609583E-01
w[14] = -2.1716430406E+00
w[15] = 6.2039201483E-01
w[16] = -1.1938880542E+00
w[17] = 3.0240000415E-02
w[18] = 1.8021000469E-01
w[19] = 6.9544799760E-01
w[20] = 3.9233101266E-01
w[21] = -1.4157065810E+00
w[22] = -2.0661396170E+00
w[23] = 4.9599468701E+00
w[24] = 7.2239003946E-01
w[25] = 2.5577700011E-02
w[26] = -2.4091679932E-01
w[27] = 4.2861940457E-01
w[28] = -7.7567501030E-02
w[29] = -1.7685020290E-01
w[30] = 1.5481900046E-01
w[31] = -3.8774520120E-01
w[32] = -3.5285900248E-02
w[33] = -9.9368004084E-03
w[34] = -8.2066999885E-02
w[35] = -2.9356999954E-02
w[36] = 1.5356579994E-01
w[37] = 1.7336339902E-01
w[38] = 5.4279399999E-02
w[39] = -6.0626300059E-02
w[40] = 1.8765500015E-01
w[41] = -9.0538199600E-02
w[42] = 2.1794060050E-01
w[43] = -4.5073400097E-02
™[44] = -6.7508899906E-02 w[45] = 1.2132110007E-01 w[46] = 2.3612400000E-01 w[47] = 6.0452699949E-02 w[48] = -1.8739859921E-01 w[49] = -4.6936519690E-01 w[50] = -3.6592360563E-01 w[51] = 1.3161573742E+00 w[52] = 9.1846354644E-02 w[53] = -1.1995788002E+00 w[54] = 1.6052586455E+00 w[55] = 1.1784468166E+00 w[56] = -1.6390204479E+00 w[57] = 7.1836560487E-01 w[58] = -2.1375539901E-01 w[59] = 4.9231560747E-01 w[60] = -7.0463719410E-01 w[61] = 5.5986478695E-01 w[62] = 9.5872279907E-01 w[63] = 2.0880299933E-01 w[64] = 1.4178800334E-01 w[65] = 7.1580381057E-01 w[66] = 5.20500013^-01 w[67] = -4.2753861398E-01 w[68] = -1.4150072994E-02 w[69] = 2.7290770284E-01 w[70] = 3.1039979747E-02 w[71] = -2.6439161264E+00 w[72] = 3.0163000457E-01 w[73] = -5.3074314842E+00 w[74] = 3.0424280087E-01 w[75] = 3.7713756437E+00 w[76] = 4.6645099683E-02 w[77] = 1.3069249891E+00 w[78] = 3.1550467010E-03 w[79] = 4.971036016Ш-01
Средняя квадратичная ошибка моделирования эмпирических данных без округления выхода модели составляет 0,028304260957, что при единице шкалы исхода в одну единицу (разница между 2 и 1) является хорошим результатом.
Можно заметить, что при представлении эмпирических данных модель содержит всего 1 ошибку на 156 строк, что, безусловно, может быть расценено как хороший результат. Эту ошибку можно связать с противоречивостью выборки эмпирических данных.
Значения коэффициентов ^-^79 в модели (3) необходимо использовать с максимально возможной точностью, сохранив везде 11 значимых цифр в мантиссе числа. Таким образом, в ходе обработки эмпирических данных по 156 пациентам получена математическая модель, позволяющая по входным параметрам (вектор входных координат - хі-х2з) и управляющему параметру х24 адекватно рассчитывать исход:
(
Y =
24
W+
W+
' 48
I xi-24w ч i=25
' 72 А3
I xi-48wi ч i=49
W+
(4)
73
i=1
+
+
W75 +
W78 + W79
Данное уравнение использовалось для разработки компьютерной программы - экспертной системы, предназначенной для предоперационного исследования возможных исходов операции.
H рис. 14 представлена блок-схема алгоритма программы.
В блоках 1-3 происходит чтение эмпирических данных из файла «data». Этот файл представляет собой прямоугольную матрицу, содержащую 156 строк (по числу пациентов) и 25 столбцов (24 входа и один выход - исход операции). Файл для удобства имеет текстовый формат, что позволяет добавлять повую ип-формацию при появлении сведений о новых больных.
В блоках 4-5 происходит чтение коэффициентов MHC-модели из файла «coeff». Этот файл представляет собой вектор-строку, содержащую 79 элементов. Файл для удобства имеет текстовый формат, что позволяет легко изменять коэффициенты модели при переучивании MHC.
В блоке б пользователь вводит исходные данные по новому пациенту. При этом пользователю нет необходимости знать варианты кодировок. Он просто отвечает на предлагаемые вопросы и ставит соответствующие «галочки». После заполнения всех полей пользователь нажимает кнопку «Расчет исхода». При необходимости
он может изменить один из показателей, например, сложность операции, и снова нажать кнопку «Расчет исхода».
В блоках 7-9 производится расчет исхода по ИНС-модели (рис. 13 и уравнение (4)).
При необходимости результаты могут быть сохранены в текстовом файле (блок 10).
Экспертная система реализована в виде программного комплекса на языке программирования Delphi. Она включает специальные программы по обучению ИНС-модели и саму ЭС, интерфейс которой представлен на рис. 15.
Тестирование ЭС показало, что прогнозирование исходов операций с ее помощью оказывается верным в 97 % случаев.
Таким образом, в данной работе проведена предварительная структурная и параметрическая идентификация различных ИНС-моделей на основе специализированной программы ЫЫС; разработана специальная программа, реализующая градиентный метод для параметрической идентификации ИНС-модели; рассчитаны коэффициенты ИНС-модели, ее структура и проведена адекватность модели; предложена блок-схема экспертной системы и реализующий ее программный комплекс.
Рис. 14. Блок-схема алгоритма программы экспертной системы
Рис. 15. Интерфейс программы, реализующей ЭС
ЛИТЕРАТУРА
Самарский А.А., Михайлов А.П. Математическое моделирование. М.: Физматлит, 2002. 320 с.
Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. М.: ИНФА-М, Финансы и статистика, 2003. 544 с.
Арзамасцев А.А. Математическое и компьютерное моделирование. Тамбов: Издат. дом ТГУ им. Г.Р. Державина, 2010. 257 с. Арзамасцев А.А., Зенкова Н.А. Искусственный интеллект и распознавание образов. Тамбов: Издат. дом ТГУ им. Г.Р. Державина, 2010. 196 с.
Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Формализация проблемы разработки экспертной информационной системы с развивающимся интеллектуальным ядром на базе ИНС-моделей // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2010. Т. 15. Вып. 1. С. 287-290.
Введение в математическое моделирование / Ашихмин В.Н. [и др.] М.: Изд-во «Университетская книга», 2007. 440 с.
Вабищевич П.Н. Численное моделирование. М.: Изд-во МГУ, 1993. 152 с.
Краснощеков П.С., Петров А.А. Принципы построения моделей. М.: Изд-во МГУ, 1983. 264 с.
Мышкис А.Д. Элементы теории математических моделей. М.: Книжный дом «ЛИБРОКОМ», 2009. 192 с.
Тарасевич Ю.Ю. Математическое и компьютерное моделирование. М.: Эдиториал УРСС, 2004. 152 с.
Arzamastsev A.A., Zenkova N.A., Troitzsch K.G., Neuakhin A.V. Technology of intellectual information system design for estimation of social objects // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2011. Т. 16. Вып. 1. С. 169173.
Zenkova N.A., Arzamastsev A.A., Troitzsch K.G. Development of a technology of designing intelligent information systems for the estimation of social objects // Institut fur Wirtschafts- und Verwaltungsinfor-matik Fachbereich Informatik Universitat. Koblenz-Landau, 2011. № 11. URL: http://www.uni-koblenz.de/~fb4reports/2011/2011_01_Arbeits-berichte.pdf. Загл. с экрана.
Дюк В. Обработка данных на ПК в примерах. Санкт-Петербург; Москва; Харьков; Минск, 1997. 231 с.
Кубенский А.А. Структуры и алгоритмы обработки данных. СПб.: Изд-во БХВ-Петербург, 2004. 466 с.
Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. М.: ИНФА-М, 1998. 528 с.
Kryuchin O.V., Arzamastsev A.A., Troitzsch K.G. The prediction of currency exchange rates using artificial neural networks // Institut fur
20.
22.
24.
26.
27.
Wirtschafts- und Verwaltungsinformatik Fachbereich Informatik Un-iversitat. Koblenz-Landau, 2011. № 4. URL: http://www.uni-
koblenz.de/~fb4reports/2011/2011_04_Arbeitsberichte.pdf. Загл. с экрана.
Арзамасцев А.А., Зенкова Н.А. Моделирование в психологии на основе аппарата искусственных нейронных сетей. Тамбов: ИМФИ ТГУ им. Г.Р. Державина, 2003. 106 с.
Зенкова Н.А. Компьютерное моделирование в психологии. Тамбов: ИМФИ ТГУ им. Г.Р. Державина, 2007. 55 с.
Арзамасцев А.А., Зенкова Н.А. Использование аппарата искусственных нейронных сетей для разработки систем психологического и профессионального тестирования // Математические методы и информационные технологии в экономике, социологии и образовании: сборник статей 11 Международной научно-технической конференции. Пенза, 2003. С. 258-260.
Арзамасцев А.А., Зенкова Н.А. Нейросетевая технология психологического тестирования степени готовности абитуриентов к образовательной деятельности // Новые биокибернетические и телемедицинские технологии XXI века для диагностики заболеваний человека (НБИТТ-21): материалы междисциплинарной конференции с международным участием. Петрозаводск, 2002. C. 37.
Арзамасцев А.А., Зенкова Н.А. Система психологического тестирования на основе аппарата искусственных нейронных сетей // Искусственный интеллект. 2004. № 2. С. 237-242.
Барский А.Б. Нейронные сети: распознавание, управление, принятие решений. М.: Финансы и статистика, 2004. 176 с.
Осовский С. Нейронные сети для обработки информации. М.: Финансы и статистика, 2004. 344 с.
Уоссермен Ф. Нейрокомпьютерная техника: теория и практика. М.: Мир, 1992. 240 с.
Kryuchin O.V., Arzamastsev A.A., Zenkova N.A., Troitzsch K.G., Sletkov D. V. Simulating medical objects simulation using an artificial neural network whose structure is based on adaptive resonance theory // Institut fur Wirtschafts- und Verwaltungsinformatik Fachbereich In-formatik Universitat. Koblenz-Landau, 2011. № 1. URL:
http://www.uni-koblenz.de/~fb4reports/2011/2011_14_Arbeits-berichte.pdf. Загл. с экрана.
Kryuchin O.V., Arzamastsev A.A., Troitzsch K.G. A parallel algorithm for selecting activation functions of an artificial network // Institut fur Wirtschafts- und Verwaltungsinformatik Fachbereich Informatik Un-iversitat. Koblenz-Landau, 2011. № 12. URL: http://www.uni-
koblenz.de/~fb4reports/2011/2011_12_Arbeitsberichte.pdf. Загл. с экрана.
Kryuchin O. V., Arzamastsev A.A., Troitzsch K.G. A universal simulator based on artificial neural networks for computer clusters // Institut fur
Wirtschafts- und Verwaltungsinformatik Fachbereich Informatik Un-iversitat. Koblenz-Landau, 2011. № 2. URL: http://www.uni-
koblenz.de/~fb4reports/2011/2011_02_Arbeitsberichte.pdf. Загл. с экрана.
28. Kryuchin O.V., Arzamastsev A.A., Troitzsch K.G. Comparing the efficiency of serial and parallel algorithms for training artificial neural networks using computer clusters // Institut fur Wirtschafts- und Ver-waltungsinformatik Fachbereich Informatik Universitat Koblenz-Landau, 2011. № 13. URL: http://www.uni-koblenz.de/~fb4reports/ 2011/2011_13_Arbeitsberichte.pdf. Загл. с экрана.
29. Крючин О.В., Зенкова Н.А. Использование искусственных нейронных сетей для решения задач классификации на примере моделирования медицинского объекта // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2011. Т. 1б. Вып. 3. С. 789-792.
30. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Технология построения медицинской экспертной системы на основе аппарата искусственных нейронных сетей // Информационные технологии. 2009. № 8. С. б0-63.
31. Арзамасцев А.А., Зенкова Н.А., Неудахин А.В. Pазработка экспертной системы с развивающимся интеллектуальным ядром на базе HHC-моделей // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2010. Т. 15. Вып. б. С. 1849-1857.
32. Неудахин А.В., Арзамасцев А.А., Зенкова Н.А. Построение нейро-сетевых экспертных систем с помощью автоматизированной технологии // Вопросы современной науки и практики. Университет им. В.И. Вернадского. 2009. № 4 (18). С. 179-183.
Поступила в редакцию 27 февраля 2012 г.
Mishin A.S., Arzamastsev A.A., Zenkova N.A. EXPERT SYSTEM FOR RESULTS PROGNOSIS OF SURGERY TREATMENT OF COLORECTAL CANCER PATIENTS COMPLICATED BY ACUTE INTESTINAL OBSTRUCTION
This paper describes results of the developing expert system for prediction surgery operations results. The simulation tool is the artificial neural network. Results of the weight coefficients calculation and the structure of the ANN-model are presented. Mathematical model and its program realization have been developed as a result of the empirical data processing.
Key words: expert system; mathematical methods of data processing; ANN-model; colon obstruction; prediction of surgery operations results.