Научная статья на тему 'Интеллектуальный анализ данных микроволновой радиотермометрии в диагностике рака молочной железы'

Интеллектуальный анализ данных микроволновой радиотермометрии в диагностике рака молочной железы Текст научной статьи по специальности «Медицинские технологии»

CC BY
324
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
DATA MINING / MICROWAVE RADIOTHERMOMETRY / INTELLIGENT ADVISORY SYSTEMS / HIGHLY INFORMATIVE SIGNS / BREAST CANCER / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / МИКРОВОЛНОВАЯ РАДИОТЕРМОМЕТРИЯ / КОНСУЛЬТАТИВНЫЕ ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ / ВЫСОКОИНФОРМАТИВНЫЕ ПРИЗНАКИ / РАК МОЛОЧНОЙ ЖЕЛЕЗЫ

Аннотация научной статьи по медицинским технологиям, автор научной работы — Лосев Александр Георгиевич, Левшинский Владислав Викторович

Статья посвящена разработке нового метода формирования пространства диагностических признаков по данным микроволновой радиотермометрии, предназначенного для создания на его основе консультативной интеллектуальной диагностической системы. Предъявлен метод формирования высокоинформативных признаков на базе количественного описания медицинских знаний и математических моделей поведения температурных полей молочных желез.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Лосев Александр Георгиевич, Левшинский Владислав Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DATA MINING OF MICROWAVE RADIOMETRY DATA IN THE DIAGNOSIS OF BREAST CANCER

The paper deals with development of a new method for the thermometry data mining, which is designed as a basis for creation of the intelligent diagnostic-advisory systems. The method is based on quantitative descriptions of medical knowledge about the behavior of the temperature fields of the mammary glands. Previously gained knowledge has been represented as a base set of grouped functions of temperatures, e.g. qualitative feature “a large temperature difference between nipple and a certain point of mammary gland” can be described by a set of functions of the form |t0 ti |, i = 1,..., 9, where ti is the temperature of the point number i. According to the qualitative feature, a large value of such functions may be an indication of pathology. Hence, we will bind a range of unacceptable values with certain functions and denote produced pairs as features. Thus, on the base of features we can determine possible anomalies of the temperature fields of mammary glands. It’s clear that some features probably are false features, so a set of features requires preprocessing. One way to do this is to assign a weight to a feature and analyze it only if the weight is larger than some minimum acceptable value. Weighted features were applied in a logistic regression algorithm. With the features gained, the average breast cancer diagnosis accuracy on the test sample is about 67 percent. Moreover, each received feature has a qualitative description and can be applied in more complex algorithms.

Текст научной работы на тему «Интеллектуальный анализ данных микроволновой радиотермометрии в диагностике рака молочной железы»

www.volsu.ru

МОДЕЛИРОВАНИЕ, ИНФОРМАТИКА И УПРАВЛЕНИЕ

DOI: https://doi.org/10.15688/mpcm.jvolsu.2017.5.6

УДК 004.89 ББК 55.6

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ МИКРОВОЛНОВОЙ РАДИОТЕРМОМЕТРИИ

________о _____л

В ДИАГНОСТИКЕ РАКА МОЛОЧНОЙ ЖЕЛЕЗЫ1

Александр Георгиевич Лосев

Доктор физико-математических наук, профессор кафедры математического анализа и теории функций,

Волгоградский государственный университет [email protected]

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

Владислав Викторович Левшинский

Студент,

Волгоградский государственный университет [email protected]

просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация

о

CS

Аннотация. Статья посвящена разработке нового метода формирования

я пространства диагностических признаков по данным микроволновой радио-£

к термометрии, предназначенного для создания на его основе консультативной

| интеллектуальной диагностической системы. Предъявлен метод формирова-

к ния высокоинформативных признаков на базе количественного описания ме-

5 дицинских знаний и математических моделей поведения температурных полей

^ молочных желез.

<

m

&

о

о ©

Ключевые слова: интеллектуальный анализ данных, микроволновая радиотермометрия, консультативные интеллектуальные системы, высокоинформативные признаки, рак молочной железы.

Введение

Одной из актуальных задач медицины и информационных технологий является разработка и внедрение эффективных систем поддержки принятия решений, которые, используя методы интеллектуального анализа данных, помогают специалистам в задачах постановки диагнозов, прогнозирования развития заболеваний и т. д. В подавляющем большинстве случаев применение современного медицинского оборудования, решая одни проблемы — порождает другие. В настоящее время трудности диагностики возникают не из-за дефицита информации, а из-за недостаточной эффективности методов ее обработки. В какой-то мере решение указанных проблем обеспечивает создание систем интерпретации и анализа медицинских данных. При этом наибольший интерес вызывает разработка консультативных интеллектуальных систем, то есть экспертных систем, содержащих механизм объяснения и обоснования предлагаемых решений на языке, понятном пользователю [4].

Целью данного исследования является разработка некоторых методов анализа и интерпретации медицинских данных, получаемых с помощью микроволновой радиотермометрии.

1. Описание задачи

Одним из действенных способов повышения эффективности диагностики является автоматизация обработки медицинских данных с помощью методов искусственного интеллекта [11-15]. Однако большинство экспертных систем свои решения предлагает врачу или в детерминированной форме однозначного заключения, или в виде вероятностных оценок каждого из возможных диагнозов. В настоящее время идет процесс формирования новых подходов к созданию диагностических систем, «объясняющих» предлагаемые ими решения [4; 5].

Одним из наиболее перспективных методов функциональной диагностики, на основе которого вполне возможно создание эффективной консультативной интеллектуальной системы, является микроволновая радиотермометрия. Это биофизический метод неинва-зивного обследования, заключающийся в измерении внутренних и поверхностных температур тканей по интенсивности их теплового излучения, соответственно в микроволновом (РТМ) и инфракрасном (ИК) диапазонах. В течение последнего десятилетия данный метод получил распространение в различных областях медицины [9]. Однако существующий на данный момент диагностический комплекс РТМ-01-РЭС является системой поддержки принятия решений специалиста высокой квалификации. Сложность восприятия информации, возникающая у медицинского персонала без специальной длительной подготовки, значительно снижает потенциальную возможность его широкого использования в скрининге. Таким образом, актуальной задачей является создание экспертной системы, обладающей возможностями обоснования предполагаемого диагностического решения.

Особую сложность в данной проблеме вызывает нахождение высокоинформативных признаков заболеваний. Как отмечается большинством специалистов, на будущее качество алгоритмов классификации влияют качественный и количественный составы пространства информационных признаков. Основной задачей данного исследования является разработка метода формирования пространства информационных признаков.

2. Качественные составляющие информационных признаков

Вначале опишем подробнее существующую методику диагностики рака молочной железы по данным микроволновой радиотермометрии. Комплекс РТМ-01-РЭС позволяет оценивать функциональное состояние тканей путем измерения внутренней температуры (РТМ) на глубине до 5 см и температуры кожи (ИК). Обследование пациентки (см., например, [2]) проводится в горизонтальном положении, обнаженной по пояс, руки под головой. Обследование начиналось с измерения температур в опорных точках ^ и T2, расположенных: первая — в центре грудной клетки сразу под и между молочными железами, вторая — непосредственно под мечевидным отростком. Далее измерения проводятся в 10 точках на каждой железе, и в аксилярной области. При этом получаемые данные сразу выводятся на экран монитора (рис. 1).

Рис. 1. Методика обследования молочных желез

После анализа информации о температурных полях молочных желез, в частности с помощью термокарт (см., например, рисунок 2), врач ставит диагноз пациентке. Здесь каждое значение температуры передается на экране монитора своим цветом. Участки с пониженной температурой передаются «холодными» цветами (синим), а с повышенной температурой — «теплыми» цветами (розовым, красным).

На основе данных, предоставленных онкологическими центрами России, была сформирована экспертная база термометрических данных. В настоящее время она включает в себя информацию о 734 молочных железах пациенток, которые делятся на два контрольных класса: «Здоровые» — 148 молочных желез и «Больные» — 586 молочных желез. Класс «Больные» в свою очередь делится на несколько групп: «Узловой рак» (185 молочных желез), «Диффузный рак» (13 молочных желез), «Узловые изменения, но не рак» (90 молочных желез), «Диффузные изменения, но не рак» (125 молочных желез), «Неот-дифференцированные гистологически» (8 молочных желез), «Норма-2» (165 молочных желез). В класс «Норма-2» входят термометрические данные здоровых молочных желез больных пациенток. В рамках данного исследования молочные железы пациенток в базе были разделены на два новых класса: «Рак» — 326 молочных желез и «Не рак» — 408 желез. Статистический анализ используемых термометрических данных был проведен в работе [7].

Шаг изотерм- 0.120°С Правая МЖ Левая МЖ

32.70 32.94 33.18 33.42 33.66 33.90 34.14 34.38 34.62 34.86 35.10 Температура(°С): минимальная- 33.0, средняя- 34.1, максимальная- 35.2 ^ 35.20

Рис. 2. Термокарты

В ходе исследований и анализа данных специалистами были выявлены следующие признаки рака молочной железы [2;3;8] (далее будем называть их качественными):

• повышенная величина термоасимметрии между одноименными точками молочных желез;

• повышенный разброс температур между отдельными точками в пораженной молочной железе;

• разница температур сосков;

• повышенная температура соска в пораженной молочной железе по сравнению со средней температурой молочной железы с учетом возрастных изменений температуры;

• соотношение кожной и глубинной температур и некоторые другие.

Важным этапом создания эффективной консультационной интеллектуальной системы является математическое описание данных признаков, выявление их количественных характеристик, а также выявление новых признаков.

1) Группа признаков, характеризующая асимметрию температурных полей молочных желез.

Данный класс признаков исходит из гипотезы о «зеркальной» симметрии температурных полей правой и левой молочных желез здоровых пациенток. Данная гипотеза используется при анализе термометрических данных не только молочных желез, но практически всех парных органов человека [9]. Опишем вначале известные признаки заболеваний, относящиеся к данному классу.

1.1) Повышенное значение разности температур между одноименными точками правой и левой молочных желез.

В качестве характеристик, описывающих этот эффект, могут быть использованы функции вида

tí,l11

или

где 1г,г и Ьгг1 — температуры в г-х точках правой и левой молочных желез соответственно.

.2) Повышенная разница температур сосков правой и левой молочных желез:

\ко,г —

или

^0,г — I.

.3) Повышенное среднеквадратичное значение разностей температур между одноименными точками правой и левой молочных желез:

\

E{ti,r ti,l )2

9 '

г=0 9

В общем виде асимметрия полей температур молочных желез может быть описана различными функциями вида

9(f (U,r,..., tn,r) — f (ti,i,..., tn,i)),

где f (ti,r,... ,tn,r) — значение функции температур для точек t0,... ,tn правой молочной железы, f (U,i,... ,tn,i) — значение аналогичной функции температур для точек t0,...,tn левой молочный железы, а д(х) — некоторая функция одного переменного. Таким образом, значительно расширяется множество исследуемых параметров. В частности, таким способом можно описать следующие характеристики.

1.4) Разница средних значений температур «зеркально-симметрично» расположенных подобластей молочных желез, например:

I to,MW,r + ti,MW,r + t(i mod 8) + l,MW,r to,MW,l + U,MW,l + t(i mod 8)+1,MW,l ,

1 3 3 h

i = 1,..., 8.

1.5) Разница среднеквадратичных отклонений температур молочных желез:

i/V^ (ti,MW — tMW,m)\ /V^ (ti,MW — tMW,m)2 s ,

-8-)r - (^-8-)l|,

i=l i=l

где tMw,m = 8=l — среднее значение точек 1,...,8 правой или левой молочных желез соответственно и т. д.

2) Группа признаков, характеризующих повышенный разброс температур в пораженной молочной железе.

2.1) Повышенное среднеквадратичное отклонение температур в одной из молочных желез:

\

8 (+■ — i )2

Е\°г bmJ

9 ;

г=0 9

где tm — 8=0 9 .

2.2) Повышенный разброс температур между отдельными точками в пораженной молочной железе:

t-m ti,

где tm = I", ti — температура в г-й точке молочной железы. В общем виде разброс температур молочных желез может быть описан различными функциями вида

g{fi(to,...,tn) - f2{to,...,tn)),

где f1(t0, . . . ,tn) и f2(t0,... ,tn) — функции температур точек t0,... ,tn соответствующей молочной железы, а д(х) — некоторая функция одного переменного. В частности, таким способом можно описать следующие характеристики.

2.3) Повышенные средние значения температур соседних точек вплоть до средней температуры молочной железы, то есть функции вида:

ti + tH mod 8)+1 + t(i mod 8)+2

m 3

и т. п.

3) Группа признаков, характеризующих повышенное значение температуры соска в пораженной молочной железе.

3.1) Аномальная разность температуры соска и средней температуры молочной железы:

to tm,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где tm = 8=1 "g .

3.2) Аномальная разность температуры соска и температур отдельных точек молочной железы:

t0 — ti,i = 1,..., 8.

В целом аномальные значения температуры соска по отношению к другим параметрам можно описать функциями вида

9(to — fl{to,...,tn)),

где f1(t0,... ,tn) — функция температур точек t0,... ,tn молочной железы, а д(х) — некоторая функция одного переменного. В частности, таким способом можно описать следующие характеристики.

3.3) Аномальная разность температуры соска и средней температуры различных подобластей молочной железы, например:

ti + t(i mod 8)+1 to--2

и т. п.

4) Признаки, характеризующие соотношение кожной и глубинной температур:

Аномальное значение разности между кожной и глубинной температурами точки пораженной молочной железы (внутренний градиент):

tiMW — ti,j

где — глубинные и — кожные температуры в г-й точке молочной же-

лезы. Разность температур молочных желез, измеренных в РТМ и ИК-диапазонах (так называемый внутренний градиент), может быть описана функциями вида

, . . . ) — / ... ,tn,IR)),

где / (10,... ,Ьп) — функция температур точек Ь0,... ,Ьп молочной железы, а д(х) — некоторая функция одного переменного.

Отметим, что сформированный выше набор функций представляет собой расширенное описание известных качественных признаков, и получен на базе уже известных медицинских фактов. Но особенно важной, хотя и достаточно сложной задачей, является выявление новых знаний.

5) Признаки, базирующиеся на параметрах физико-математических моделей поведения температурных полей.

В течение последних лет было построено несколько математических моделей, описывающих поведение температурных полей молочных желез с помощью уравнений в частных производных второго порядка [9; 10]. Кроме того, отметим, что в предъявленном выше наборе функций присутствуют как функции температур, так и разностные аналоги их производных по различным направлениям. Например, величина ¿0 — и является разностным аналогом производной в радиальном направлении (радиальный градиент). Аналогично величина и^мш — tг,IR является разностным аналогом производной во внутреннем направлении (внутренний градиент).

Учитывая вышесказанное, в работе было решено рассматривать и разностные аналоги вторых производных функций температур, то есть функции вида:

— f ^о,..., Ьп)) = — / ,..., ) — + / (¿1 ,т,..., ).

Перейдем к формальному описанию задачи поиска информативных признаков. Введем следующие обозначения.

Пусть ^,1 = 0,..., 9 — температуры г-й точки правой молочной железы ]-й пациентки в диапазоне РТМ;

^,1 = 10,..., 19 — температура [г — 10] точки правой молочной железы ]-й пациентки в диапазоне ИК;

^,1 = 20,..., 29 — температура [г—20] точки левой молочной железы ]-й пациентки в диапазоне РТМ;

^,1 = 30,..., 39 — температура [г—30] точки левой молочной железы ]-й пациентки в диапазоне ИК;

Т2 — глубинные температуры опорных точек ]-й пациентки; Т2 — кожные температуры опорных точек ]-й пациентки. Тогда обучающую выборку можно представить в виде матрицы

t3

t3 l42

T l,^

т i,4

s =

/4

,k ll fk+l

tn \ ll

t\3\

,k L43 fk+l

tn

/

где ^ при ] = 1,... ,к — температуры молочных желез пациенток класса «Не рак», ^ при ] = к + 1,... ,п — температуры молочных желез пациенток класса «Рак».

Пусть — д-я исследуемая функция, рассматриваемая на множестве векторов Пд = (г30,..., ¿4з), где ] = 1,...,п. Обозначим ^ = р(ь0,..., *4з).

Высокоинформативным признаком будем называть тройку ( ¡Я,У,Х), где — функция, описывающая поведение температурных полей; V = 1(/9,Х) — информативность признака; Х — «информативная» область множества значений функции .

Определим указанные выше характеристики. Под информативностью традиционно понимается количественный параметр, определяющий, насколько хорошо закономерность описывает различия между искомой и отделяемой группами. В качестве ( , Х) в данной работе использовался ряд характеристик, в том числе следующие функционалы.

Статистическая информативность, вычисляемая по формуле

— к—в

вт а 1,Х) = - 1п( -к---),

—к+(п-к)

где п — количество векторов с температурными данными пациенток в обучающей выборке; — количество векторов с температурными данными пациенток класса «Не рак» в обучающей выборке; к — количество молочных желез класса «Не рак», для которых & Х, а 5 — количество молочных желез класса «Рак», для которых & Х.

Эвристическая информативность, вычисляемая по формуле

нпи \х)

тах( к, п-к) тт(к, п--к) '

Энтропийная информативность, вычисляемая по формуле

ЕМх) = Н(--¿^тг,, П-к м ) -

и Ук + (п - к) к + (п - к)'

к + (п - к) - к - 8 , к - к (п - к) -в .

( и I /,л г, „, и I ^ /,л г, „),

к + (п - к) к + (п - к) - к - в' к + (п - к) - к -в'

где Н(д0, д1) = -д01с^2(до) - д1 1с^2(д1) — математическое ожидание количества информации.

Комбинированная информативность, которая вычисляется по формуле

С1 (/",Х) = ^ (ла Я,Х) ш *,Х )... ш *,Х )),

где 11, 12,..., 1п — другие информативности.

Среднее гармоническое информативностей, которое вычисляется по формуле

п

НМ (1 \Х)

1 + ■■■ + 1

,х) 1 1 /„(/« ,х)

Далее пусть

13 = 8Пр/( f\Х ),

X а

где Ха — все возможные подобласти числовой прямой, на которых указанная информативность имеет смысл. «Информативной» областью множества значений функции

будем называть подмножество числовой прямой, обеспечивающее достижение величины Is. Для j-х молочных желез признак ( /J,V,X) считается выполненным, если /J G X.

Оценка эффективности алгоритмов классификации, в частности и диагностических методов в медицине, традиционно выполняется при помощи следующих показателей.

Чувствительность (Sensitivity), также известная как полнота (Recall), вычисляется по формуле

о TP

Sens

TP + FN

где TP — количество молочных желез класса «Рак», которые были классифицированы как «Рак»; FN — количество молочных желез класса «Рак», которые не были классифицированы как «Рак».

Специфичность (Specificity) вычисляется по формуле

T N

Spe С= TN+FP,

где TN — количество молочных желез класса «Не рак», которые не были классифицированы как «Рак»; F P — количество молочных желез класса «Не рак», которые были классифицированы как «Рак».

Точность (Precision) вычисляется по формуле

T P

Prec

TP + FP

Достоверность (Accuracy) вычисляется по формуле

TP + TN

Acc

ТР + РР + РМ + ТМ Некоторые примеры высокоинформативных признаков приведены в таблице 1. В данном случае при поиске использовался показатель комбинированной информативности статистической и эвристической информативностей.

Отметим, что применяя более сложные конструкции из данных признаков, например, на основе генетических алгоритмов [1], можно получить признаки, обладающие большей информативностью, специфичностью и чувствительностью. Однако резко осложняется возможность их применения в блоке обоснования предлагаемого диагностического решения.

3. Алгоритм классификации

Полученные наборы высокоинформативных признаков в первую очередь предназначены для обнаружения аномалий поведения температурных полей и обоснования предполагаемого диагноза в консультативной интеллектуальной системе. При этом возможно их использование в различных алгоритмах классификации. Для иллюстрации проверим данную возможность на алгоритме логистической регрессии.

В качестве метрики эффективности классификации чаще всего используются различные варианты F-мер, в частности — среднее гармоническое между точностью (Prec) и полнотой, иначе называемой чувствительностью (Sens):

Pre с ■ Sens

F1 = 2

Pre с + Sens

Таблица 1

Высокоинформативные признаки

Признак Диапазон Sens Spec Acc

У(£о 41+*32+*3), 16, 66, ( те, 0, 89) — 0,13 0,99 0,3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

У(шах(£о ^^ т°а8)+1), 15, 43, ( те, 0, 6) ¿=1,8 — 0,1 0,99 0,28

У(*о *2+*3, 15,18, ( те, 0, 94) — 0,12 0,99 0,29

, 15, 05, ( - те, - 0, 9) ИК 0,14 0,99 0,31

У(*о - ¿о), 14, 7, ( - те, - 1, 49) — 0,11 0,99 0,29

¿о - ¿в, 13, 72, (1, 4, те) РТМ 0,11 0,99 0,28

Е8 1 8 4+15+и +7, 13, 48, (0, 3, те) РТМ 0,1 0,99 0,28

£8/8 *8+* 1+*2+*3, 13, 48, ( те, 0, 31) РТМ 0,1 0,99 0,28

ч+г Б+«б+«7 ¿8+м+ъ+г3, 13, 48, ( те, 0, 62) РТМ 0,1 0,99 0,28

¿о 44+435+46, 13, 24, (1,13, те) РТМ 0,1 0,99 0,28

¿о *4+*5+ч+г7, 13, 24, (1, 25, те) РТМ 0,1 0,99 0,28

¿0+£8+*1+£2+£3+£4 ¿6+¿6+47 13 24 (0 72 те) РТМ 0,1 0,99 0,28

£8 1 8 *Б+*36+*7, 13, 0, (0, 45, те) РТМ 0,1 0,99 0,28

4б+4з+*т 1+г^+п+и , 13, 0, ( те, 0, 73) РТМ 0,1 0,99 0,28

Е8 1 8 *"+41+5+ *3+*4, 12, 76, ( те, 0, 28) РТМ 0,09 0,99 0,27

У(£о 12+11+и, 12, 76, ( те, 0, 93) — 0,09 0,99 0,27

\1 £• о№'г М Е98=0 9 ) , 12, 27, (0, 59, те) РТМ 0,14 0,99 0,31

В процессе исследования были проведены вычислительные эксперименты с различным выбором информативности, различными наборами высокоинформативных признаков, различными методами формирования обучающей и тестовой выборок. Ниже приведены результаты расчетов для случая, когда обучающая выборка составляла 62%, а тестовая — 38% от всей имеющейся базы данных.

Таким образом, в лучших на тестовой выборке чувствительность и специфичность получена в районе 70%. Заметим, что в данном случае при классификации не использовались результаты анамнеза и другие медицинские данные, традиционно применяемые при диагностике рака молочных желез.

Заключение

В работе предложен новый метод формирования информационных признаков диагностики рака молочной железы на базе количественного описания качественных признаков, получаемых с помощью анализа медицинских знаний и физико-математических моделей поведения температурных полей молочных желез. Отметим, что данный подход позволил получить новую медицинскую информацию об особенностях поведения температурных полей пациенток. А именно, с помощью исследования разностных аналогов вторых производных функции температур по различным направлениям была обнаружена целая группа достаточно эффективных, качественно новых диагностических признаков. Аналогичный способ обнаружения информативных признаков, предназначенных для недифференциальной диагностики заболеваний молочных желез, был применен в [6]. Однако в данном случае метод был изменен, т. к. некоторые используемые в [6] приемы и алгоритмы для диагностики рака молочных желез оказались неэффективными.

Таблица 2

Результаты работы алгоритма логистической регрессии

Информативность Выборка Sens Spec Acc Fi

Комбинированная эвристической и энтропийной Обучающая 0,67 0,72 0,7 0,67

Тестовая 0,67 0,69 0,68 0,64

Комбинированная статистической, эвристической и энтропийной Обучающая 0,66 0,71 0,69 0,66

Тестовая 0,66 0,69 0,68 0,64

Энтропийная Обучающая 0,67 0,67 0,67 0,65

Тестовая 0,67 0,64 0,65 0,62

Статистическая Обучающая 0,66 0,68 0,67 0,65

Тестовая 0,66 0,66 0,66 0,62

Среднее гармоническое статистической и энтропийной Обучающая 0,68 0,62 0,65 0,64

Тестовая 0,68 0,64 0,66 0,63

Комбинированная статистической и энтропийной Обучающая 0,68 0,62 0,65 0,64

Тестовая 0,68 0,64 0,66 0,63

Комбинированная статистической и эвристической Обучающая 0,67 0,75 0,72 0,68

Тестовая 0,57 0,67 0,62 0,56

Среднее гармоническое эвристической и энтропийной Обучающая 0,39 0,9 0,67 0,52

Тестовая 0,45 0,88 0,69 0,56

Среднее гармоническое статистической, эвристической и энтропийной Обучающая 0,4 0,9 0,67 0,53

Тестовая 0,45 0,86 0,69 0,55

Среднее гармоническое статистической и эвристической Обучающая 0,51 0,92 0,73 0,63

Тестовая 0,39 0,82 0,64 0,48

Эвристическая Обучающая 0,4 0,95 0,7 0,54

Тестовая 0,34 0,88 0,65 0,45

Применение на базе полученных признаков более мощных алгоритмов классификации улучшает результаты диагностики. Например, применение нейронных сетей каскадной корреляции с методом имитации отжига в качестве обучения [1] позволяет получить чувствительность и специфичность в районе 80%. Более того, в разрабатываемой консультационной системе и предполагается применять алгоритмы классификации на базе нейронных сетей, генетических алгоритмов, нечеткой логики и т. д. Однако обоснование получаемых результатов будет производиться на основе полученных признаков. Отдельно отметим, что реальная чувствительность и специфичность консультационной системы должна выявляться путем опытной эксплуатации, то есть более интересным является вопрос, насколько полученные признаки улучшат диагностику, осуществляемую специалистами.

ПРИМЕЧАНИЕ

1 Работа выполнена при финансовой поддержке РФФИ и Администрации Волгоградской области (проект № 15-47-02475-р_поволжье_а).

СПИСОК ЛИТЕРАТУРЫ

1. Алгоритмы принятия решений в консультативной интеллектуальной системе диагностики молочных желез / А. В. Зенович, В. А. Глазунов, А. С. Опарин, Ф. Г. Примаченко // Вестник Волгоградского государственного университета. Серия 1, Математика. Физи-

ка. - 2016. - № 6 (37). - C. 129-142. - DOI: http://dx.doi.Org/10.15688/jvolsu1.2016.6.13.

2. Вайсблат, А. В. Использование микроволновой радиотермометрии в диагностике рака молочной железы / А. В. Вайсблат, С. Г. Веснин, М. А. Конкин. — Электрон. текстовые дан. — Режим доступа: http://www.resltd.ru/rus/literature/cancer.htm. — Загл. с экрана.

3. Веснин, С. Г. Современная микроволновая радиотермометрия молочных желез / С. Г. Веснин, М. А. Каплан, Р. С. Авакян // Опухоли женской репродуктивной системы. - 2008. - № 3. - C. 28-33.

4. Кобринский, Б. А. Консультативные интеллектуальные медицинские системы: классификация, принципы построения, эффективность / Б. А. Кобринский // Врач и информационные технологии. - 2008. - № 2. - C. 38-47.

5. Кобринский, Б. А. Системы искусственного интеллекта в медицине: состояние, проблемы и перспективы / Б. А. Кобринский // Новости искусственного интеллекта. — 1995. — № 2. — C. 65-79.

6. Лосев, А. Г. Интеллектуальный анализ термометрических данных в диагностике молочных желез / А. Г. Лосев, В. В. Левшинский // Управление большими системами. — 2017. — Вып. 70. — C. 113-135.

7. Лосев, А. Г. О взаимосвязи некоторых признаков РТМ-диагностики заболеваний молочных желез / А. Г. Лосев, Е. А. Мазепа, Х. М. Сулейманова // Вестник Волгоградского государственного университета. Серия 1, Математика. Физика. — 2015. — № 4 (29). — C. 35-44. — DOI: http://dx.doi.Org/10.15688/jvolsu1.2015.4.4.

8. Лосев, А. Г. О некоторых характерных признаках в диагностике патологии молочных желез по данным микроволновой радиотермометрии / А. Г. Лосев, Е. А. Мазепа, Т. В. За-мечник // Современные проблемы науки и образования. — 2014. — № 6. — Article ID: 16587.

9. Проблемы измерения и моделирования тепловых и радиационных полей в биотканях: анализ данных микроволновой радиотермометрии / А. Г. Лосев, А. В. Хоперсков, А. С. Астахов, Х. М. Сулейманова // Вестник Волгоградского государственного университета. Серия 1, Математика. Физика. — 2015. — № 6. — C. 31-71. — DOI: http://dx.doi.org/10.15688/jvolsu1.2015.6.3.

10. Поляков, М. В. Математическое моделирование пространственного распределения радиационного поля в биоткани: определение яркостной температуры для диагностики / М. В. Поляков, А. В. Хоперсков // Вестник Волгоградского государственного университета. Серия 1, Математика. Физика. — 2016. — № 5 (36). — C. 73-84. — DOI: http://dx.doi.org/10.15688/jvolsu1.2016.57.

11. Ясницкий, Л. Н. Введение в искусственный интеллект : учебн. пособие для студ. вузов / Л. Н. Ясницкий. — М. : Academia, 2005. — 176 c.

12. Burke, H. B. Artificial neural networks for cancer research: outcome prediction / H. B. Burke // Seminars in Surgical Oncology. — 1994. — Vol. 10, № 1. — P. 73-79.

13. Kononenko, I. Application of machine learning to medical diagnosis. / I. Kononenko, I. Bratko, M. Kukar // Machine Learning, Data Mining and Knowledge Discovery: Methods and Applications. — New York : John Wiley & Sons, 1998. — P. 389-408.

14. Kononenko, I. Machine Learning for Medical Diagnosis: History, State of the Art and Perspective / I. Kononenko // Artificial Intelligence in Medicine. — 2001. — Vol. 23, № 1. — P. 89-109. — DOI: http://doi.org/10.1016/S0933-3657(01)00077-X.

15. Lesmo, L. Learning of Fuzzy Production Rules for Medical Diagnoses / L. Lesmo, L. Saitta, P. Torasso // Approximate Reasoning in Decision Analysis. — 1982. — P. 249-260.

REFERENCES

1. Zenovich A.V., Glazunov V.A., Oparin A.S., Primachenko F.G. Algoritmy prinyatiya resheniy v konsultativnoy intellektualnoy sisteme diagnostiki molochnykh zhelez [Algorithms of Decision-Making in Intelligent Advisory System for Diagnostics of the Mammary Glands]. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 1, Matematika. Fizika [Science Journal of Volgograd State University. Mathematics. Physics], 2016, no. 6 (37), pp. 129-142. DOI: http://dx.doi.org/10.15688/jvolsu1.2016.643.

2. Vaysblat A.V., Vesnin S.G., Konkin M.A. Ispolzovanie mikrovolnovoy radiotermometrii v diagnostike raka molochnoy zhelezy [The Use of Microwave Radiothermometry in the Diagnosis of Breast Cancer]. URL: http://www.resltd.ru/rus/literature/cancer.htm.

3. Vesnin S.G., Kaplan M.A., Avakyan R.S. Sovremennaya mikrovolnovaya radiotermometriya molochnykh zhelez [Modern Microwave Radiothermometry of Mammary Glands]. Opukholi zhenskoy reproduktivnoy sistemy, 2008, no. 3, pp. 28-33.

4. Kobrinskiy B.A. Konsultativnye intellektualnye meditsinskie sistemy: klassifikatsiya, printsipy postroeniya, effektivnost [Advisory Intelligent Medical Systems: Classification, Principles of Construction, Efficiency]. Vrach i informatsionnye tekhnologii, 2008, no. 2, pp. 38-47.

5. Kobrinskiy B.A. Sistemy iskusstvennogo intellekta v meditsine: sostoyanie, problemy i perspektivy [Artificial Intelligence Systems in Medicine: State, Problems and Prospects]. Novosti iskusstvennogo intellekta, 1995, no. 2, pp. 65-79.

6. Losev A.G., Levshinskiy V.V. Intellektualnyy analiz termometricheskikh dannykh v diagnostike molochnykh zhelez [The Thermometry Data Mining in the Diagnostics of Mammary Glands]. Upravlenie bolshimi sistemami, 2017, iss. 70, pp. 113-135.

7. Losev A.G., Mazepa E.A., Suleymanova Kh.M. O vzaimosvyazi nekotorykh priznakov RTM-diagnostiki zabolevaniy molochnykh zhelez [On Interrelation of Some Signs of Rtm Diagnostics of Mammary Glands Diseases]. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 1, Matematika. Fizika [Science Journal of Volgograd State University. Mathematics. Physics], 2015, no. 4 (29), pp. 35-44. DOI: http://dx.doi.org/10.15688/jvolsu1.2015.4.4.

8. Losev A.G., Mazepa E.A., Zamechnik T.V. O nekotorykh kharakternykh priznakakh v diagnostike patologii molochnykh zhelez po dannym mikrovolnovoy radiotermometrii [About Several Typical Traits in the Diagnosis of Mammary Glands Pathology According to the Data of Microwave Radiothemometry]. Sovremennye problemy nauki i obrazovaniya, 2014, no. 6, article ID: 16587.

9. Losev A.G., Khoperskov A.V., Astakhov A.S., Suleymanova Kh.M. Problemy izmereniya i modelirovaniya teplovykh i radiatsionnykh poley v biotkanyakh: analiz dannykh mikrovolnovoy radiotermometrii [Problems of Measurement and Modeling of Thermal and Radiation Fields in Biological Tissues: Analysis of Microwave Thermometry Data]. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 1, Matematika. Fizika [Science Journal of Volgograd State University. Mathematics. Physics], 2015, no. 6, pp. 31-71. DOI: http://dx.doi.org/10.15688/jvolsu1.2015.6.3.

10. Polyakov M.V., Khoperskov A.V. Matematicheskoe modelirovanie prostranstvennogo raspredeleniya radiatsionnogo polya v biotkani: opredelenie yarkostnoy temperatury dlya diagnostiki [Mathematical Modeling of Radiation Fields in Biological Tissues: the Definition of the Brightness Temperature for the Diagnosis]. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 1, Matematika. Fizika [Science Journal of Volgograd State University. Mathematics. Physics], 2016, no. 5 (36), pp. 73-84. DOI: http://dx.doi.org/10.15688/jvolsu1.2016.5.7.

11. Yasnitskiy L.N. Vvedenie v iskusstvennyy intellekt: uchebn. posobie dlya stud. vuzov [Introduction to Artificial Intelligence: a Tutorial for University Students]. Moscow, Academia Publ., 2005. 176 p.

12. Burke H.B. Artificial Neural Networks for Cancer Research: Outcome Prediction. Seminars in Surgical Oncology, 1994, vol. 10, no. 1, pp. 73-79.

13. Kononenko I., Bratko I., Kukar M. Application of machine learning to medical diagnosis. Machine Learning, Data Mining and Knowledge Discovery: Methods and Applications. New York, John Wiley & Sons, 1998, pp. 389-408.

14. Kononenko I. Machine Learning for Medical Diagnosis: History, State of the Art and Perspective. Artificial Intelligence in Medicine, 2001, vol. 23, no. 1, pp. 89-109. DOI: http://doi.org/10.1016/S0933-3657(01)00077-X.

15. Lesmo L., Saitta L., Torasso P. Learning of Fuzzy Production Rules for Medical Diagnoses. Approximate Reasoning in Decision Analysis, 1982, pp. 249-260.

DATA MINING OF MICROWAVE RADIOMETRY DATA IN THE DIAGNOSIS OF BREAST CANCER

Alexander Georgievich Losev

Doctor of Physical and Mathematical Sciences, Professor, Department of Mathematical Analysis and Function Theory, Volgograd State University [email protected]

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Vladislav Viktorovich Levshinskiy

Student,

Volgograd State University [email protected]

Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation

Abstract. The paper deals with development of a new method for the thermometry data mining, which is designed as a basis for creation of the intelligent diagnostic-advisory systems. The method is based on quantitative descriptions of medical knowledge about the behavior of the temperature fields of the mammary glands.

Previously gained knowledge has been represented as a base set of grouped functions of temperatures, e.g. qualitative feature "a large temperature difference between nipple and a certain point of mammary gland" can be described by a set of functions of the form 110 — Ul,i = 1,..., 9, where U is the temperature of the point number i. According to the qualitative feature, a large value of such functions may be an indication of pathology. Hence, we will bind a range of unacceptable values with certain functions and denote produced pairs as features. Thus, on the base of features we can determine possible anomalies of the temperature fields of mammary glands. It's clear that some features probably are false features, so a set of features requires preprocessing. One way to do this is to assign a weight to a feature and analyze it only if the weight is larger than some minimum acceptable value. Weighted features were applied in a logistic regression algorithm.

With the features gained, the average breast cancer diagnosis accuracy on the test sample is about 67 percent. Moreover, each received feature has a qualitative description and can be applied in more complex algorithms.

Key words: data mining, microwave radiothermometry, intelligent advisory systems, highly informative signs, breast cancer.

i Надоели баннеры? Вы всегда можете отключить рекламу.