СадыковС.С., БулановаЮ.А., ЗахароваЕ .А., Каряев В. В.
Муромскийинститут (филиал) ГОУ ВПО "Владимирский государственный университетимени Александра Григорьевича и Николая Григорьевича Столетовых», г. Муром
АВТОМАТИЗАЦИЯ ОБНАРУЖЕНИЯ НОВООБРАЗОВАНИЙ НА МАММОГРАФИЧЕСКИХ СНИМКАХ
Статистика онкологических заболеваний молочной железы во всем мире дает неутешительные результаты. По данным Всемирной организации здравоохранения (ВОЗ) [1] каждая 5 женщина в Европе заболе-
вает раком до достижения 75 лет. По отношению к общей доли заболеваемости раком, наиболее распространяемые формы рака среди женского населения Европейского региона следующие: рак молочной железы (28%), колоректальный рак (13,2%), рак легких (6,7%), рак матки (5,8%), рак яичников (4,3%), рак желудка (4,1%), рак шейки матки (3,8%), рак поджелудочной железы (3%) . Статистические данные о смертности в результате онкологических заболеваний в зависимости от различных форм рака выглядят следующим образом:от рака молочной железы (17.0%), от колоректального рака (13.1%), от рака легких (11.2%), от рака желудка (6.6%), от рака поджелудочной железы (6.0%). Как видно из представленной выше статистической информации, рак молочной железы лидирует по сравнению с другими формами онкологических заболеваний среди женщин, его процентная доля в Европе составляет 28%.
Международное агентство по изучению рака (МАИР) опубликовало в 2011 году в "British Medical Journal" [2]результаты исследования тенденции смертности от рака молочной железы между 30 странами Европы. За 17 лет (1989-2006 гг.) смертность снизилась более чем на 20% в 15 странах, в странах Центральной Европы она осталась на том же уровне. Доля смертности в Исландии снизилася на 45%, в Румынии на 17%. В Греции, Латвии и Эстонии.
По данным Министерства Здравоохранения России [3] число впервые выявленных злокачественных новообразований также растет с каждым годом, например в 1992 г. показатель впервые выявленного рака молочной железы составил 45 человек на 100 000 женского населения, в1995 г. - 48, в 2001 г. - 59, в2007 - 67,9, в 2008 - 68,8, в 2009 - 71,2, в 2010 - 75. Это просто угрожающие цифры.
Результаты всех проведенных исследований говорят: чем больше опухоль, тем хуже прогноз, другими словами, чем позже выявили опухоль, чем больше ее размер, тем труднее будет проходить процесс выздоровления, тем сложнее лечение опухоли. Эта взаимосвязь важна для понимания, почему так необходима своевременная диагностика опухоли. Если обнаружить рак молочной железы в ранней стадии, когда шансы терапии и излечения намного выше, то борьба с опухолью идет более эффективно, а значит, это излечимая стадия, следовательно, такой процесс приводит к снижению уровня смертности женского населения всего света.
Маммография - основной и единственный метод, который способен выявить рак молочной железы в ранней фазе. Скрининговые исследования молочных желез предназначены для женщин, у которых развитие опухоли происходит бессимптомно. Скрининг рака молочной железы дает больше шансов для выздоровления, возможность подвергнуться минимальному хирургическому вмешательству, без эстетического и физиологического увечья, а также успокоение здоровых пациентов, если рак не обнаружен.
В развитых странах успешно используются современные цифровые технологии путем построения системы на базе цифрового маммографа и методов обработки изображений для выявления онкологических заболеваний молочной железы. Такая система позволяет врачу-рентгенологу достигнуть высокого уровня обнаружения и оценки новообразований в молочной железе.
В России подавляющее большинство лечебно-профилактических учреждений до сих пор оснащены аналоговыми маммографами.
Пленочная (аналоговая) маммография имеет ряд существенных недостатков:невозможность изменения характеристик снимка, ограничения при диагностике небольших и малоконтрастных образований, появление на пленке артефактов, грязи, пыли, отпечатков пальцев, порча пленки, сравнительно высокая доза облучения женщины.
В связи с этим актуальным является разработка системы, позволяющей хранение, обработку и анализ аналоговых маммографических снимков в цифровой форме.
Статья посвящена разработке системы цифрового хранения, обработке и анализу маммографических снимков.
Общая блок-схема системы представлена на рисунке 1.
Рисунок 1 - Блок-схема системы обработки, анализа и хранения маммографических снимков
Разработанная система обработки, анализа и хранения маммографических снимков состоит из таких блоков как:
Блок предварительной обработки - включает в себя коррекцию яркости и контраста, изменение резкости изображения, фильтры шумоподавления, функции выделения контуров.
Блок сегментации - необходимый раздел системы, благодаря которому можно выявить новообразования, определить количество классов сегментов на снимке.
Блок распознавания новообразований на основе эталонов.
Блок формирования отчетов - необходим для распечатки заключений и формирования статистики.
Рассмотрим эффективность использования каждого блока в обработке аналоговой маммограммы.
Для оцифровки маммографического снимка использовался сканер Epson Perfection V750 Photo [4] с разрешением 6400x9600 dpi.
Аналоговые маммограммы - это малоконтрастные изображения, поэтому особое внимание уделяется блоку предварительной обработки.Предобработка медицинских изображений с использованием современных информационных технологий и математических методов позволяет ускорить процесс обработки, а также повысить точность результатов исследований. Благодаря цифровой обработке маммографических изображений аналоговый снимок приводится к такому виду, где не только различимы области интереса (ROI), но и, в большинстве своем удалено все лишнее со снимка (артефакты, пыль, грязь, отпечатки пальцев и так далее). Система обработки, анализа и хранения маммографических снимков [5] обеспечивает большой набор функций: изменение палитры изображений (линейное контрастирование [6], косинус [7], треугольник [7], и т.д.), гистограммные преобразования [6], градиент, фильтрация, выделение контуров.
Самый распространенный дефект маммограммы - значительный удельный вес темных участков и сравнительно малое число участков с высокой яркостью. Контраст - это разность максимального и минимального значений яркости изображений. Путем цифровой обработки контраст можно повысить, изменяя яркость каждого элемента изображения и увеличивая диапазон яркостей. Существуют три основных метода улучшения контраста изображений: линейное контрастирование, нормализация и эквализация [6].
Линейное контрастирование заключается в присвоении всем пикселам исходного изображения новых значений яркости с целью охватить весь возможный интервал ее изменения [0, 255]. g = k * K + Y, (1)
где g - новое значение яркости точки, k - уровень яркости (0, 255), K - новое значение контра-ста,У- новое значение яркости изображения.
g =
255 ■ cos((k - Y)* CosK) 0
при
other
k min < k < k max
, (2)
где g - новое значение точки,к - уровень яркости (0..255),kmin, kmax - минимальное и максимальное значения яркости снимка,У- новое значение яркости,СоБК=п/К, где К- новое значение контраста .
TriK (k - k min) при k min < k < Y
g = « TriK • (k max - i) при Y < k < k max , (3)
0 other
где g - новое значение точки,к- уровень яркости (0..255),kmin, kmax - минимальное и максимальное значения яркости снимка,TriK=510/K, где К - новое значение контраста.
Нормализация представляет собой процесс растягивания на весь максимальный интервал уровней яркости [0,255] не всей гистограммы, а ее наиболее интенсивного участка (gmin',gmax') .
Эквализация гистограммы приводит к выравниванию интегральных площадей равномерно распределенных диапазонов яркостей. Сравнение исходного(рисунок 2(а))и обработанного(рисунок
2(в))изображений показывает, что перераспределение яркостей,происходящее при обработке, приводит к улучшению визуального восприятия.
а) б) в) г) д) е)
Рисунок 2 - Исходное изображение (а) , линейное контрастирование (б) , косинус (в), треугольник (г), изображение с нормализованным контрастом (д), эквализация контраста (е)
Но эти методы все же не достаточны для точности постановки диагноза, необходимо применение дополнительных алгоритмов обработки снимков.
Применение градиента к снимку используется для объемной визуализации рельефа снимка, с помощью которого видна форма новообразования, на рисунке 4 (б) отчетливо видно новообразование, форма,
сосуды, идущие к нему, втяженность соска, что именно и говорит о злокачественности новообразования. Градиент выполнен по методу Собела [8, 9] и Лапласа [6, 8].
Вместе с градиентом, необходимо применение алгоритмов выделения границ.В разработанной системе выделение границ выполняется с помощью операторов Робертса, Собела. Метод Робертса [10] для выделения контуров на изображении является самым простым, и в тоже время самым действенным. Он рабо-
тает с апертурой
f (X -1, у - 1) f (X, у - 1) f (X - 1, у) f (X, у)
новая яркость в точке определяется по формуле:
g = V( f (X - 1, у - 1) - f (X, у))2 + ( f (X - 1, у) - f (X, у - 1))2 .(4)
Метод Собела [10] работает с двумерной апертурой 3х3 вида
A A2 A3
As F A,
A7 As A5
X = (A3 + 2 • A, + As) - ( а + 2 • A + A)
Y = (A + 2 • A + Аз) - (A7 + 2 • A + As) (5)
F =VX 2 + Y 2
а) б) в) г)
Рисунок 3 - Выделение границ исходного изображения: а) - градиент по методу Собела, б) - градиент по методу Лапласа, в) - выделение контуров по методу Робертса, г) выделение границ по методу Лапласа.
Поскольку применение методов выделения границ невозможно без применения фильтров шумоподавления, в разработанной диалоговой системе присутствует целый набор различных фильтров, благодаря которому к каждомумаммографическому снимку имеется возможность подбора алгоритма шумоподавления.
Сегментация - процесс поиска однородных областей на изображении, который характеризуется переходом от рассмотрения изображения как совокупности отдельных пикселей, каждый из которых обладает определенными свойствами (яркостью и положением), к совокупности областей точек, обладающих большим числом различных характеристик: геометрических, текстурных, распределение яркости по сегменту и целым рядом иных.
В системе обработки маммографических снимков реализован алгоритм водораздела [11] в качестве алгоритма текстурной сегментации.
Li(х) = L(х, М,) = jnf L(x, y) (6)
ye M j
lx e X|"j * i,1 < j < K :
CB, = l 1 (7)
j [ a + L (x) <a + Lj (x)
f (x) = min {a + Li(x)} (8)
На рисунке 4 отображены схемы формирования линий водораздела, а также водосборных бассейнов.
Рисунок 4 - Линии водораздела (СВ - Водосборный бассейн, М - Маркер)
а)
исходное
а) б)в)
Рисунок 5 - Применение алгоритма водораздела к маммографическому снимку:
изображение, б) карта водораздела, в) выделение контуров после водораздела
Блок распознавания также занимает особое место в системе обработки, анализа и хранения маммографических снимков. С помощью данного блока на снимке можно выделить области новообразований, найденных по эталонам из базы данных эталонов. В этой базе данные на данный момент хранятся 52 эталона новообразований, которые характеризуются вектором из 6 признаков. Признаки рассчитываются из статистических яркостных характеристик [12] по гистограмме и матрицы Харалика [13]:
L -1
b = X b ■ P(b) - средняя яркость(9)
L-1 _
s = X (b - b )2 ■ P (b) - дисперсия(10)
b=0
b = X1 x1 p(j, j) m)
bodn = X Х~л---T---Г - однородность (11)
i=0 j=0 1 + j - J\
L -1
bN = X P(b)2 - энергия (12) b=0 L -1
bE =-x P(b) ■ \0Q2[P(b)] - энтропия(13) b=0
L -1 _
bK = (1 s4) ■ X (b - b )4 ■ P(b) - 3 - коэффициент эксцесса (14)
b=0
Алгоритм распознавания новообразования по эталонам последовательно вычисляет статистические характеристики фрагментов снимка, формируя при этом векторы признаков этих областей. Полученные векторы признаков сравниваются с векторами признаков эталонов, вычисляя минимумы средних сумм квадратов отклонения (СКО) [12].
М N
ак = min XX(Pi - Рэ,1 )2 . (15)
ij
Если найдено минимальное СКО, выделяется фрагмент новообразования с центром в этой точке.
Рисунок 6 - Пример распознования новообразования по эталону
С помощью данной системы обрабатывалось 75 снимков, из них на 50 снимках (67%) правильно выявлены новообразования, и установлено, что среди этих новообразований выделено 20 раковых опухолей молочной железы (62%). Параллельно с системой обработки, анализа и хранения маммографических снимков, маммограммы анализировал врач-рентгенолог, который выявил рак на 25 снимках. Таким образом, отклонение результатов системы от экспертных в среднем составляет 15-20%.
Блок формирования отчетов предназначен для печати заключений рентгенолога, для формирования статистики [14] по нозологическим формам заболеваний, по возрасту заболевших, по месту работы и так далее.
Исходя из всего вышесказанного, можно сделать вывод о необходимости использования современных информационных технологий и математических методов в обработке аналоговых маммографических снимков. Благодаря компьютерной обработке увеличивается точность определения типов новообразований, возможность раннего выявления рака молочной железы и скорейшего лечения заболеваний молочной железы, а также снижение дозы облучения женщины.
ЛИТЕРАТУРА
1. Женщины и рак: скрининг и лечение спасают жизни// ЕРБ ВОЗ, - 2011г.
2. Philippe Autier, Mathieu Boniol, Anna Gavin, Lars J, Vatten.Breast cancer mortality in neighbouring European countries with different levels of screening but similar access to treatment: trend analysis of WHO mortality database // BMJ 2011;343:d4411 doi: 10.1136/bmj.d4411.
3. Социально значимые заболевания населения России в 2010 году (Статистические материалы) //
Департамент организации медицинской профилактики, медицинской помощи и развития здравоохранения ФГУ «Центральный научно-исследовательский институт огранизации и информатизации здравоохранения и Росздрава», Москва, 2011 - 66 с.
4. С. Щербаков. На стыке двух эпох: Планшетный сканер Epson Perfection V750 Pro// Foto&Video № 7, 2006 - с. 60-65.
5. С.С. Садыков, Ю.А. Буланова, Е.А. Захарова Диалоговая система анализа маммографических снимков // Алгоритмы, методы и системы обработки данных. - 2012. №19.С.11.
6. В.Т.Фисенко, Т.Ю.Фисенко.Компьютерная обработка и распознавание изображений: учеб. пособие.
- СПб: СПбГУ ИТМО, 2008. - 192 с.
7. Р. Гонсалес, Р. Вудс, С.Эддинс. Цифровая обработка изображений в среде MATLAB. - М.: Техносфера, 2006. - 616 с.
8. Методы компьютерной обработки изображений / Под ред. В.А. Сойфера. - 2-е изд., испр. - М.: ФИЗМАТЛИТ, 2003. - 784 с. - ISBN 5-9221-0270-2.
9. Прэтт У.К. Цифровая обработка изображений. - М.: Мир, 1982. Т.1.-2. 792 с.
10. Грищенко А.А. «Обработка изображений, цифровая обработка сигналов, распознавание образов», САТИ ИАЭТ СОРАН, 2003.121с.
11. Nguyen et al.: Watershakes: Energy-driven watershed segmentation, IEEE Transactionsonpat-ternanalysisandmachineintelligence, vol. 25, no. 3, March 2 003. р .12-15.
12. Садыков С.С., Савичева С.В. Алгоритм идентификации плоских объектов с использованием минимального числа признаков /Автоматизация и современные технологии (июль 2011).с.56-63.
13. Haralick R.M., Shanmugam K., Distein I. Textural features for image classification. IEEE Transactions on systems, man and cybernetics, 1973, V. SMC-3. № 6, p. 610-621.
14. Евстигнеева О.И., Садыков С.С., Суслова Е.Е., Белякова А.С. Критерии выделения групп риска из лиц трудоспособного возраста при медицинских исследованиях системе АСПО // Алгоритмы, методы и системы обработки данных. - 2012. №19. С.4.