www.volsu.ru
ПРИКЛАДНАЯ МАТЕМАТИКА
DOI: http://dx.doi.Org/10.15688/jvolsu1.2015.5.6
УДК 618.19+004.021 ББК 55.6
ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ ОПРЕДЕЛЕНИЯ ВЫСОКОИНФОРМАТИВНЫХ ПРИЗНАКОВ ЗАБОЛЕВАНИЙ
МОЛОЧНЫХ ЖЕЛЕЗ1
Виктор Анатольевич Глазунов
Студент Института математики и информационных технологий, Волгоградский государственный университет [email protected], [email protected]
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Андрей Васильевич Зенович
Старший преподаватель кафедры фундаментальной информатики и оптимального управления, Волгоградский государственный университет [email protected], [email protected]
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Александр Георгиевич Лосев
Доктор физико-математических наук, ^ профессор кафедры математического анализа и теории функций, ^ Волгоградский государственный университет
[email protected], [email protected] ¡а просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация о
В Аннотация. В недавней работе А.Г. Лосева, Е.А. Мазепы и Т.В. Замечник [5]
<С был предложен алгоритм получения высокоинформативных диагностических призна-§ ков патологий молочных желез на основе данных микроволновой радиотермометрии.
§ В данной статье исследуется возможность получения признаков большей информа-
ш СП
тивности на основе линейных комбинаций полученных ранее признаков. Подбирая ге-
< нетическим алгоритмом весовые коэффициенты в указанных комбинациях, удается
® получить признаки, информативность которых в два раза выше ранее полученных. ё Ключевые слова: микроволновая радиотермометрия, интеллектуальный анализ
Ц данных, скрининг молочной железы, экспресс-диагностика злокачественных опухолей
^ молочной железы, маммология.
©
Введение
В настоящее время на основе опыта дистанционного зондирования космоса, земли и океана создается новое поколение медицинской аппаратуры, а также разрабатываются новые методы функциональной диагностики, основанные на динамическом картировании физических полей и излучений организма человека. Одним из таких методов является микроволновая радиотермометрия, называемая также комбинированной термометрией (см., например, [2]). Микроволновая радиотермометрия - это биофизический метод неин-вазивного обследования, заключающийся в измерении внутренних и поверхностных температур тканей по интенсивности их теплового излучения, соответственно, в микроволновом и инфракрасном диапазоне и последующей их регистрацией в виде числовых данных.
В последние годы метод микроволновой радиотермометрии получил достаточно широкое применение в маммологии (см.: [2; 5; 6]), флебологии (см.: [1; 3; 7; 8]), хирургии, гинекологии и многих других областях медицины. Приведем в качестве примера проблемы, возникающие при диагностике заболеваний молочных желез. Согласно современным представлениям, для того, чтобы своевременно выявлять большинство опухолей, они должны иметь диаметр не более 5-7 мм. Однако, согласно статистическим данным, средний размер впервые выявляемых опухолей значительно больше (1,34 см), а частота выявления опухолей до 1 см в диаметре составляет 10-20 %. Таким образом, традиционно применяемые в настоящее время методы не позволяют выявить опухоль на ранней стадии. Как отмечено в ряде публикаций (см., например, [2]), одним из наиболее перспективных направлений повышения эффективности маммологических обследований видится метод микроволновой радиотермометрии.
Опишем подробнее существующую методику диагностики рака молочной железы по данным микроволновой радиотермометрии. Комплекс РТМ-01-РЭС позволяет оценивать функциональное состояние тканей путем измерения внутренней температуры (РТМ) на глубине до 5 см и температуры кожи (ИК). Обследование пациентки проводится в горизонтальном положении, обнаженной по пояс, руки под головой. Обследование начиналось с измерения температур в опорных точках Т1 и Т2, первая расположена в центре грудной клетки сразу под и между молочными железами, вторая - непосредственно под мечевидным отростком. Далее измерения проводятся в 10 точках на каждой железе (см. рисунок), а также в аксиллярной области.
Рисунок. Схема обследования молочных желез
Однако, несмотря на то что данные о температурных полях пациентки носят объективный характер, постановка диагноза на их основании по-прежнему остается «искусством» врача, и во многом носит субъективный характер. Последнее серьезно сужает уникальные возможности микроволновой радиотермометрии в первичной диагностике.
Разработка диагностических методик на основе интеграции медицинских знаний и математических методов искусственного интеллекта является актуальной задачей. Рядом исследователей отмечалось, что при современном развитии технологий, трудности диагностики зачастую возникают не из-за дефицита необходимой информации, а из-за отсутствия соответствующих методов ее структуризации. Данную проблему можно решить созданием консультативных интеллектуальных диагностических систем. Консультативными их принято называть в связи с тем, что в них предусмотрен механизм обоснования предлагаемых решений [4], использующий множество высококачественных специальных знаний из предметной области. В настоящее время в области интеллектуального анализа данных широкое применение получили статистические алгоритмы, в том числе - нейронные сети, байесовский классификатор и другие (см., например: [1; 3; 8]). Однако при использовании подобных алгоритмов возникают сложности при создании консультативных экспертных систем, требующих обоснования предлагаемого решения, причем эти объяснения должны быть достаточно просты и понятны медикам. Более обоснованным выглядит подход, основанный на формализации знаний врачей и нахождении соответствующих высокоинформативных диагностических признаков (см., например, [7]).
В ходе исследований и анализа данных, полученных при обследованиях молочных желез, специалистами были выявлены следующие качественные признаки их заболеваний, в том числе - рака молочной железы (см., например, [8]):
1) повышенная величина термоасимметрии между одноименными точками молочных желез;
2) повышенный разброс температур между отдельными точками в пораженной молочной железе;
3) повышенная дисперсия разности температур между железами;
4) разница температур сосков;
5) повышенная температура соска в пораженной молочной железе по сравнению со средней температурой молочной железы с учетом возрастных изменений температуры;
6) соотношение кожной и глубинной температур;
7) повышенное значение осцилляции температур в областях и другие.
При создании консультативных диагностических систем существенное значение имеют выявление и анализ числовых функций, описывающих качественные признаки (см.: [5; 7]). Очевидно, что таких функций существует достаточно много. Приведем некоторые примеры.
1. Повышенная величина термоасимметрии между одноименными точками молочных желез. В качестве функции, которая описывает данный эффект, можно использовать, например, |£пр.г — £л.г1, где ¿пр.; и - температуры в i-х точках правой и левой молочных желез соответственно.
2. Повышенная дисперсия разности температур между железами. В качестве функции, которая описывает данный эффект, можно использовать, например,
Высокоинформативные диагностические признаки
8
О
л - V8 Atj
где At[ — ¿пр.! — ^Л.1, ^мж — Z0~.
3. Разница температур сосков. В качестве функции, которая описывает данный эффект, можно использовать 110 пр. — t0 л \.
4. Повышенный разброс температур между отдельными точками в пораженной молочной железе. В качестве функции, которая описывает данный эффект, можно использовать, например, iCp. — tj, где iCp. — Zi"1, t; - температура в i-й точке молочной железы. Аналогично вполне можно использовать ряд функций, описывающих разброс температур между различными областями молочной железы.
5. Повышенная температура соска в пораженной молочной железе по сравнению со средней температурой молочной железы. В качестве функции, которая описывает данный эффект, можно использовать t0 — iCp..
6. Повышенное значение температуры соска по сравнению с каждой точкой молочной железы. В качестве соответствующих функций можно использовать, например, t0 - t. Аналогично можно использовать ряд функций, описывающих сравнение температуры соска со средней температурой различных областей молочной железы. Например, повышенное значение температуры соска по сравнению со средними значениями соседних точек молочной железы можно описать функциями t0 — tt+^'+1.
7. Соотношение кожной и глубинной температур. В качестве функций, которые описывают данный эффект, можно использовать ¿¿,РТМ — £;,ИК, где ¿¿,РТМ - глубинные и ¿г,ИК - кожные температуры в i-х точках молочной железы. Аналогично среднее значение между разностями кожной и глубинной температур соседних точек пораженной молочной железы можно описать
1 (г1,РТМ_г1,Ик) + (г1+1,РТМ_г1+1,Ик)
функциями---.
8. Повышенное значение осцилляции областей описывается функцией
max tj — min i;.
1 = 1,8 1 = 1,8
В целом при исследовании было проанализировано более сотни числовых функций, которые характеризовали степень симметрии температурных полей, наличие (отсутствие) зон аномальной высокой (низкой) температуры и другие качественные диагностические признаки.
Введем следующие обозначения. Пусть tj, i — 0,... ,9 - температура i-й точки j-й молочной железы; t(0 — Т1, — Т2 - температуры опорных точек j-й молочной железы, измеренные в РТМ-диапазоне. Аналогично, пусть t-, i — 12, .,22 - температура i-й точки j-й молочной железы; ¿23 — 7\, ¿24 — Т2 - температуры опорных точек j-й молочной железы, измеренные в ИК-диапазоне. Тогда обучающую выборку можно представить в виде матрицы
t
tk • i-k+i го • tk t24 i-k+1 t24
v t0 t
где ^ при _/ = 1, - температуры молочных желез здоровых пациенток; ^ при } = к + 1, ...,п - температуры молочных желез больных пациенток.
Пусть fq - q-я исследуемая функция, определенная на множестве векторов =
{(¿¿, ...Д24,)},где] = 1, ...,п. Обозначим = ...Д^). В работе исследуются всевозмож-
ные пары (fq,X), где X - подобласти множества D.q. Характеристический признак считается выполненным, если f? £ 0.q\X для некоторых j = к + 1, ...,п и f? EX для всех j = 1, ..., к.
Таким образом, поиск характеристических признаков заключался в нахождении подобластей, на которых множество значений функций fq, соответствующих множеству векторов ...Д24) при j = 1, ...,к, будет пустым. Из этих подобластей выбирается подобласть, содержащая множество значений функций fq, которому соответствует наибольшее количество векторов (t]0,..., ¿24) при j = к + 1,..., п.
Однако у характеристических признаков есть один недостаток. А именно, их использование позволяет обнаружить примерно 60 % больных пациенток. Поэтому при создании алгоритма классификации было предложено использовать высокоинформативные признаки.
Высокоинформативным признаком будем считать тройку (fq, (aq, bq), /), где I - величина информативности. Информативность - количественный параметр, определяющий, насколько хорошо одна или несколько закономерностей описывают различия одной группы (искомой) от другой (отделяемой). При этом чем выше значение информативности признака классификации, тем лучше данный признак определяет различия искомой группы от отделяемой. В данной работе рассматриваются только односторонние признаки, в которых (aq,bq) является лучом (-да; с], либо [с; +да), что в подавляющем большинстве случаев соответствует реальности. В качестве оценки использовались следующие варианты информативности:
- статистическая информативность:
(птп~к
Щк
пт+к ьМ+К
где M - количество молочных желез класса «Здоровые»; m - количество молочных желез класса «Здоровые», у которых выполнен признак; K - количество молочных желез класса «Больные»; k - количество молочных желез класса «Больные», у которых выполнен признак;
- эвристическая информативность:
q = max {х,у) min {x, у) ,
где x - доля молочных желез класса «Здоровые», у которых выполнен признак; y - доля молочных желез класса «Больные», у которых выполнен признак;
- комбинированная информативность:
с4 = hq •bq
В процессе исследования было получено около сотни достаточно информативных первичных признаков. Однако их комбинированная информативность не превышала величины 12,2 [5]. В данной работе предлагается способ построения новых признаков с высокой комбинированной информативностью.
Алгоритм
В качестве функции / берется линейная комбинация функций какой-нибудь группы первичных признаков.
При любых весовых коэффициентах мы можем найти новую границу луча из диагностического признака - ^ для которой обеспечивается наибольшая комбинированная информативность. Далее генетическим алгоритмом подбирается линейная комбинация, дающая наибольшую информативность.
Опишем шаги генетического алгоритма. Назовем «особью» признак, у которого f является линейной комбинацией функций первичных признаков, а граница c обеспечивает наибольшую для данных весов комбинированную информативность. Функция приспособленности особи - ее комбинированная информативность. Строим эволюционный процесс.
Вероятность k-й особи стать родителем при этом зададим:
(1) Р(к) = ynInf(fc) , n - количество особей в поколении; Inf(i) - комбинированная информативность i-й особи.
Скрещивание «особей» осуществляется поэлементно, каждый свой ген потомок с равной вероятностью получает от одного из родителей. Предусмотрены мутации, в процессе которых один из генов меняется случайным образом.
В процессе искусственного отбора выбираем «особей» с наибольшей комбинированной информативностью.
Полученные результаты
В результате работы было получено около двух тысяч признаков с комбинированной информативностью до 23,9. Комбинирование осуществлялось на разных выборках признаков.
Исходные признаки можно разделить на несколько групп, внутри которых их функции имеют сходный вид и отличаются лишь номерами используемых точек.
Группа 1. В качестве первичных берем признаки, характеризующие пониженное значение температуры соска по сравнению с температурами соседних точек. Функции этих признаков имеют вид ?о,ртм - (^ртм + ^+1,ртм)/2.
Здесь ^,ртм и ti,HK обозначают температуры в i-й точке на рисунке.
Таблица 1
Примеры признаков группы 1
Комбинированная информативность Здоровые, % С патологиями, % Признак Граница с
11,8 3,6 29,2 15,560,ртм - 2,16А,ртм - 2,162,ртм - - 4,Шз,ртм - 5,62?4,ртм - 1,49/з,ртм < -7,32
11,6 2,4 23,0 0,880,ртм - 0,11?2,ртм - 0,443,ртм -- 0,33?4,ртм < -0,58
11,3 2,4 22,6 7,180,ртм - 0,8111 ,ртм - 3,59?2,ртм -- 2,78?3,ртм < -4,41
10,7 2,4 21,5 3,970,ртм - 1,482,ртм - 1,483,ртм -- 0,51^5,ртм - 0,51^,ртм < -2,28
Группа 2. Комбинируем признаки, характеризующие пониженное значение разности глубинной и поверхностной температуры в нескольких точках молочной железы. Их функции
ртм
Таблица 2
Примеры признаков группы 2
Комбинированная информативность Здоровые, % С патологиями, % Признак Граница с
12,6 1,2 17,0 7,330,ртм + 2,845,ртм - 7,33^0,ик - - 2,84?5,ик < 9,09
10,3 2,4 20,9 9,76?0,ртм + 2,Ширтм + 0,20?7,ртм -- 9,76?0,ик - 2,Ш1,ик - 0,20?7,ик < 10,71
10,1 2,4 20,4 4,36?0,ртм + 0,43?4,ртм -- 4,36?0,ик - 0,43?4,ик < 3,92
8,6 2,4 17,9 7,54>,ртм + 2,572,ртм + 3,04^5,ртм + 1,364,ртм - - 7,5?0,ик - 2,57/2,ик - 3,04^5,ик - 1,37/б,ик < 17,26
Группа 3. Комбинируем признаки, характеризующие повышенный разброс температур между отдельными точками в пораженной молочной железе. Их функции ¿ср.ртм - ¿¿,ртм.
Таблица 3
Примеры признаков группы 3
Комбинированная ин-форматив-ность Здоровые, % С патологиями, % Признак Граница с
11,7 1,2 15,9 7,330,ртм + 2,845,ртм - 7,33^0,ик - 2,845,ик < 2,12
11,2 1,2 15,3 9,76?0,ртм + 2,11?1,ртм + 0,20?7,ртм -- 9,76?0,ик - 2,11^ - 0,20?7,ик< 7,07
10,7 1,2 14,7 4,36?0,ртм + 0,43?4,ртм -- 4,36?0,ик - 0,43?4,ик < 3,01
9,7 1,2 13,40 7,5^0,ртм + 2,572,ртм + 3,04^5,ртм + 1,374,ртм - - 7,5?0,ик - 2,57/2,ик - 3,04/5,ик - 1,37/б,ик < 7,56
Группа 4. Комбинируем признаки, характеризующие повышенный разброс глубинных температур между отдельными точками.
Их функции- ¿ср.ртм tг,ртм, ^ср.ртм tг+1,ртм, ^ср.ртм t0,ртм, ^0,ртм (^',ртм + ^+1,ртм)/2.
Таблица 4
Примеры признаков группы 4
Комбинированная информативность Здоровые, % С патологиями, % Признак Граница с
17,8 1,2 23,2 13,020,ртм - 7,70t1,pXM - 17,05t2,pTM - - 4,50t3,pTM + 16,23tCp.pxM < -11,1
16,3 1,2 21,5 10,92to,pxM - 9,93tj,pxM - 17,43t2,pxM -- 10,19t3,pxM + 26,63tCp.pxM < -12,28
12,1 1,2 16,4 8,12t0,pTM - 13,96t2,pxM - 8,21t3,pxM - - 6,05t4,pxM + 20,09tCp.pxM < -12,70
10,3 1,2 14,3 10,98t0,pxM - 8,10t2,pxM - 12,52t3,pxM -- 4,20t4,pxM + 13,85tcp.pxM < 13,49
Группа 5. Предпринимались попытки комбинировать признаки из далеких с точки зрения медицины групп. При данных комбинациях удается получить самую большую комбинированную информативность.
Таблица 5
Примеры признаков группы 5
Комбинированная ин-форматив-ность Здоровые, % С патологиями, % Признак Граница с
23,9 1,2 30,0 13 15t 3 35t 3 35t - 6,45?0,ик < 3,78
23,5 1,2 29,6 14,96t0,pxM - 1,67t1,pxM - 2,99t2,pxM -- 8,09?0,ик - 1,77?!,ик - 0,44?2,ик < 8,21
19,9 1,2 25,5 14,72t0,pxM- 3,6t2,pxM 0,98t3,pxM - - 7,24?0,ик - 0,14?2,ик - 2,76/э ик < 7,46
Окончание таблицы 5
Комбинированная ин-форматив-ность Здоровые, % С патологиями, % Признак Граница с
18,7 1,2 24,3 8,900,ртм - 1,161,ртм - 1,164,ртм - - 6,57?0,ик < 6,79
Однако у данных комбинаций признаков отсутствует какое-либо медицинское обоснование. Вполне возможно, что данные признаки просто отслеживают нюансы обучающей выборки.
ПРИМЕЧАНИЕ
1 Работа выполнена при финансовой поддержке РФФИ (проект № 15-47-02475-р_поволжье_а).
СПИСОК ЛИТЕРАТУРЫ
1. Веденяпин, Д. А. Об одной нейросетевой модели диагностики венозных заболеваний / Д. А. Веденяпин, А. Г. Лосев // Управление большими системами. - 2012. - № 39. - С. 219-229.
2. Веснин, С. Г. Современная микроволновая радиотермометрия молочных желез / С. Г. Веснин, М. А. Каплан, Р. С. Авакян // Опухоли женской репродуктивной системы. - 2008. - № 3. -С. 28-35.
3. Изучение надежности комбинированной термографии как метода диагностики состояния вен нижних конечностей / Т. В. Замечник, Н. С. Овчаренко, С. И. Ларин, А. Г. Лосев // Флебология. - 2010. - Т. 4, № 3. - С. 23-26.
4. Кобринский Б. А. Консультативные интеллектуальные медицинские системы: классификация, принципы построения, эффективность / Б. А. Кобринский // Врач и информационные технологии. - 2008. - № 2. - С. 38-47.
5. Лосев, А. Г. О некоторых характерных признаках в диагностике патологии молочных желез по данным микроволновой радиотермометрии / А. Г. Лосев, Е. А. Мазепа, Т. В. Замечник // Современные проблемы науки и образования. - 2014. - № 6.
6. Лосев, А. Г. О взаимосвязи некоторых признаков РТМ-диагностики заболеваний молочных желез / А. Г. Лосев, Е. А. Мазепа, Х. М. Сулейманова // Вестник Волгоградского государственного университет. Серия 1, Математика. Физика. - 2015. - № 4 (29). - С. 36-46.
7. О некоторых характерных признаках в диагностике венозных заболеваний нижних конечностей методом комбинированной термографии / Е. В. Анисимова, Т. В. Замечник, А. Г. Лосев, Е. А. Мазепа // Вестник новых медицинских технологий. - 2011. - Т. 18, № 2. -С. 329-330.
8. Способ комбинированной термометрии и математические модели вероятностной диагностики заболеваний вен нижних конечностей / Т. В. Замечник, С. И. Ларин, А. Г. Лосев, Н. С. Овчаренко // Вестник новых медицинских технологий. - 2009. - Т. 16, № 4. - С. 14-16.
REFERENCES
1. Vedenyapin D.A., Losev A.G. Ob odnoy neyrosetevoy modeli diagnostiki venoznykh zabole-vaniy [About One Neural Network Model of Diagnosis of Venous Diseases]. Management of big systems: collection of works, 2012, no. 39, pp. 219-229.
2. Vesnin S.G., Kaplan M.A., Avakian R.S. Sovremennaya mikrovolnovaya radiotermome-triya molochnykh zhelez [About One Neural Network Model of Diagnosis of Venous Diseases]. Opukholi zhenskoy reproduktivnoy sistemy [Tumors of the Female Reproductive System], 2008, no. 3, pp. 28-35.
3. Zamechnik T.V., Ovcharenko N.S., Larin S.I., Losev A.G. Izuchenie nadezhnosti kombiniro-vannoy termografii kak metoda diagnostiki sostoyaniya ven nizhnikh konechnostey [Studying the Reliability of the Combined Termography as a Method of Diagnostics of the Condition of Veins of the Lower Extremities]. Flebologiya, 2010, vol. 4, no. 3, pp. 23-26.
4. Kobrinskiy B.A. Konsultativnye intellektualnye meditsinskie sistemy: klassifikatsiya, printsipy postroeniya, effektivnost [Intelligent Advisory Medical Systems: Classification, Principles of Construction, Efficiency]. Vrach i informatsionnye tekhnologii [Doctor and Information Technologies], 2008, no. 2, pp. 38-47.
5. Losev A.G., Mazepa E.A., Zamechnik T.V. O nekotorykh kharakternykh priznakakh v diag-nostike patologii molochnykh zhelez po dannym mikrovolnovoy radiotermometrii [About Some Characteristic Signs in Diagnosis of Pathology of Mammary Glands According to Microwave Radio Thermometry]. Sovremennye problemy nauki i obrazovaniya [Modern Problems of Science and Education], 2014, no. 6.
6. Losev A.G., Mazepa E.A., Suleymanova Kh.M. O vzaimosvyazi nekotorykh priznakov RTM-diagnostiki zabolevaniy molochnykh zhelez [On the Relationship of Some Features of RTM-Diagnosis of Breast Diseases]. Vestnik Volgogradskogo gosudarstvennogo universiteta. Seriya 1, Ma-tematika. Fizika [Science Journal of Volgograd State University. Mathematics. Physics], 2015, no. 4 (29), pp. 36-46.
7. Anisimova E.V., Zamechnik T.V., Losev A.G., Mazepa E.A. O nekotorykh kharakternykh priznakakh v diagnostike venoznykh zabolevaniy nizhnikh konechnostey metodom kombinirovannoy termografii [On Some Characteristic Signs in Diagnosis of Venous Diseases of the Lower Extremities by the Method of Combined Thermography]. Vestnik novykh meditsinskikh tekhnologiy [Messenger of New Medical Technologies], 2011, vol. 18, no. 2, pp. 329-330.
8. Zamechnik T.V., Larin S.I., Losev A.G., Ovcharenko N.S. Sposob kombinirovannoy termo-metrii i matematicheskie modeli veroyatnostnoy diagnostiki zabolevaniy ven nizhnikh konechnostey [The Combined Thermometry and Mathematical Model of Probabilistic Diagnostics of Diseases of Lower Limb Veins]. Vestnik novykh meditsinskikh tekhnologiy [Messenger of New Medical Technologies], 2009, vol. 16, no. 4, pp. 14-16.
GENETIC ALGORITHMS FOR DETERMINATION OF THE HIGHLY INFORMATIVE SIGNS OF MAMMARY GLANDS DESEASES
Viktor Anatolyevich Glazunov
Student, Institute of Mathematics and IT, Volgograd State University [email protected], [email protected]
Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation
Andrey Vasilyevich Zenovich
Assistant Professor, Department of Fundamental Computer Science and Optimal Control, Volgograd State University [email protected], [email protected]
Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation
Aleksander Georgievich Losev
Doctor of Physical and Mathematical Sciences, Professor, Department of Mathematical Analysis and Function Theory, Volgograd State University allosev59@gmail. com, math@volsu. ru
Prosp. Universitetsky, 100, 400062 Volgograd, Russian Federation
Abstract. A.G. Losev, E.A. Mazepa and T.V. Zamechnik in a recent paper [5] proposed an algorithm for obtaining highly informative primary diagnostic features of breast health based on microwave radiometry. The primary diagnostic features are based on the analysis of numerical functions describing the known high-quality medical signs identified by experts-mammologists in research data obtained during breast examination (see. [8]). For example, the increased value of thermo-asymmetry between the same points of the breast can be described by functions of the form |*:пр.г — tn i |, where t^ and tn i are temperatures at i points on right and left breasts respectively. To characterize the quality of the diagnostic feature A.G. Losev introduced the concept of the combined informativeness. The higher value of combined informativeness of classification is the better sign for defining the difference between required and separated groups. This article explores the possibility of obtaining more informative signs based on linear combinations of previously obtained primary symptoms. Selecting weights by the genetic algorithm in the mentioned combinations, we can obtain signs with twice-higher informativeness than in the primary ones. Initial symptoms can be divided into groups, each of which describes a qualitative clinical symptom. We investigated the linear combinations of primary features that describe the following qualitative medical symptoms: reduced value of nipple temperature compared with the temperatures of neighboring points, a reduced value of the difference between deep and surface temperatures at several points of the breast, increased dispersion of surface tempera-
tures between separate points in the affected mammary gland, increased dispersion of deep temperatures between separate points. In each group, we found new features with greater in-formativeness than the primary characteristics of the group.
We attempted to combine the primary signs of the distant groups in terms of medicine. In these combinations we obtain the largest combined informativeness. However, these combinations of symptoms have no medical justification. It is possible that these symptoms just track the nuances of training sample.
Key words: microwave radio thermometry, breast screening, correlation analysis, express diagnostics of malignant breast tumors, mammology.