Научная статья на тему 'Описание объектов изображения методами численной динамики'

Описание объектов изображения методами численной динамики Текст научной статьи по специальности «Математика»

CC BY
216
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕРЫЙ ТОН / ФАЗОВЫЕ ТРАЕКТОРИИ / АДАПТАЦИЯ

Аннотация научной статьи по математике, автор научной работы — Ганцева Е. А., Каладзе В. А., Шуляев А. В.

Численный анализ изображений сосудистых систем глазного дна с оценкой их морфологических признаков позволяет существенно повысить качество диагностики в офтальмологии и обеспечить автоматическую оценку состояния сосудистых систем. Исследования снимка глазного дна в работе проводятся на монохроматическом изображении, что значительно снижает трудоёмкость численного решения задачи выделения системы кровеносных сосудов, которое основано на применении разработанной динамической модели сосудистой системы в фазовом пространстве изображения

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Ганцева Е. А., Каладзе В. А., Шуляев А. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EXPOSITION OF OBJECTS OF THE IMAGE OVER METHODS OF NUMERICAL DYNAMICS

The numerical analysis of images of vascular systems of an eye bottom with an estimation of their morphological indications allows to raise essentially quality of diagnostics in ophthalmology and to ensure an automatic estimation of a condition of vascular systems. Researches of a picture of an eye bottom in work are spent on the monochromatic image, that considerably reduces labour input of a numerical solution of a problem of allocation of system of blood vessels which is based on application of the developed dynamic model of vascular system in an image phase space

Текст научной работы на тему «Описание объектов изображения методами численной динамики»

УДК 681.5

ОПИСАНИЕ ОБЪЕКТОВ ИЗОБРАЖЕНИЯ МЕТОДАМИ ЧИСЛЕННОЙ ДИНАМИКИ

Е.А. Ганцева, В.А. Каладзе, А.В. Шуляев

Численный анализ изображений сосудистых систем глазного дна с оценкой их морфологических признаков позволяет существенно повысить качество диагностики в офтальмологии и обеспечить автоматическую оценку состояния сосудистых систем. Исследования снимка глазного дна в работе проводятся на монохроматическом изображении, что значительно снижает трудоёмкость численного решения задачи выделения системы кровеносных сосудов, которое основано на применении разработанной динамической модели сосудистой системы в фазовом пространстве изображения

Ключевые слова: серый тон, фазовые траектории, адаптация

Проблема адаптивной кластеризации и динамической фильтрации изображения, рассматриваемая в данной работе, возникла при решении задачи оценки состояния сетчатки глаза (ОСГ), где достаточно мутный снимок глазного дна (рис. 1) требуется преобразовать в контрастное изображение с выделенной сетью кровоснабжения -крупных сосудов и капилляров (рис. 2).

В офтальмологической практике исследований сетчатки глаза к основным объектам исследования относятся кровеносные сосуды, оптический диск, макулярная область. Достаточно большой список работ посвящён аутентификации кровеносных сосудов глазного дна [1], в которых кровеносные сосуды рассматриваются как уникальный, легко различимый признак при условии обеспечения контрастности высокого уровня на изображении.

Рис. 1. Снимок глазного Рис. 2. Искомое дна камерой изображение сети

кровоснабжения

Результирующая процедура в задаче диагностики сетчатки глаза заключается в сличении снимка глазного дна пациента со снимком нормального состояния сетчатки, когда используется массив достоверной информации, полученной из снимка пациента, и формирование точного диагноза на его основе.

Ганцева Екатерина Александровна - ВГТУ, канд. техн. наук, доцент, e-mail:[email protected] Каладзе Владимир Александрович - МИКТ, д-р техн. наук, ст. науч. сотрудник, e-mail: [email protected] Шуляев Антон Владимирович - ВИВТ, аспирант, e-mail: a.v. [email protected]

Для получения истинных данных о состоянии глазного дна пациента на основе традиционного подхода [2] была принята концепция проведения исследований, включающая выбор цветового пространства, преобразование хроматических характеристик исходного изображения в монохроматическое, нормализацию фона, контрастирование искомых объектов, селекцию элементов изображения, их кластеризацию, трассировку изображений сосудов, подбор и формирование адекватного математического аппарата.

Из-за неоднозначной терминологии в задачах числовой обработки цветовых изображений уточним необходимые понятия.

В работе использована терминология по координатным цветовым пространствам, принятая Международной комиссией по освещению (CIE) и стандартизованная [3].

В настоящее время численная оценка состояния сетчатки глаза проводится в 3-х компонентных аддитивных, линейных цветовых координатных системах (пространствах). Наиболее физиологичным считается пространство RGB с базисными векторами (R,G,B) [4], являющееся международной координатной колориметрической системой, в которой любой измеряемый цвет, в соответствии с экспериментально выверенным законом Юнга-Гельмгольца, может быть получен из линейной комбинации трёх базисных цветов. Так любая точка искомого цвета в координатном пространстве RGB может быть представлена цветовой точкой с барицентрическими координатами (r\g\b"), оцениваемыми по цветовым шкалам, или представлена цветовым векторным уравнением [5]

S = r\R + g G + KB. (1)

При необходимости эти координаты можно пересчитать в международную цветовую систему XYZ, из которой легко можно перейти в любое другое цветовое пространство.

Численное описание цветового изображения, использующего три числовых матрицы цветовых компонент, содержащие данные базисных цветов, приводит к большому числу расчётов, экспоненциально связанному с количеством базовых цветов (3). Соответственно, при расчётах

возникает необходимость применения технологий параллельных вычислений. Более того, цветовые координатные системы нелинейны, что выражается в неравномерности (неодинаковости) расстояний в их цветовых координатах.

С точки зрения сложности алгоритмов расчёта и величины потребного машинного времени численные исследования и преобразования изображения выгоднее проводить на монохроматических изображениях с одним цветовым каналом, представляемых одной числовой матрицей, чем на полноцветных - с тремя матрицами.

Для такого перехода удобна 3-х компонентная система HSB, представленная тоном (Hue), насыщенностью (Saturation) и яркостью (Brightness), которая, если заменяется интенсивностью (Intensity), приводит к названию системы HSI [6].

Тон и насыщенность определяют хроматическую составляющую цвета, а интенсивность является ахроматической

составляющей [4], которая определяет так называемую серую шкалу Greyscale.

Кроме того, для описания мощности наблюдаемого цвета в пространстве RGB используется, так называемая, координата яркости

Y' = 0.299Ra + 0.587Ga + 0.114Ba , (2)

выражающая его интенсивность через регистрируемые цветовые амплитуды смешиваемых базисных цветов Ra, Ga, Ba.

Эта зависимость определяет основной показатель, который в данной ситуации является единственной числовой характеристикой точки монохроматического изображения, представляющей величину интенсивности тона выбранного цвета.

Наиболее приемлемым в данной задаче следует считать переход к серой тональности, поскольку в этом случае сохранится баланс между цветами исходного снимка, и преобразованное изображение уравновесится без потери существенных элементов.

В пользу перехода к серому монохрому говорит и тот факт, что разброс цветовых характеристик сосудов относительно их основного цвета достаточно мал и отличается в Greyscale только значениями амплитуд интенсивности.

Понятие «серый тон» определяется как разреженный чёрный цвет различной плотности. Интенсивность поля серой шкалы - это плотность серого тона, количество равномерного чёрного. Серая шкала, представленная на рис. 3, рассматривается как упорядоченный ряд равновеликих полей изобразительных плотностей серого тона, предназначенный для определения количественной характеристики тонопередачи элементов изображения. Значения оттенков (градаций) полей серой шкалы иногда выражают в долях или процентах.

Рис. 3

В органолептической практике пользуются 10-польной шкалой (со светлотами), где градации соседних полей отличаются друг от друга в два раза, например, P = {0.0015, 0.003, 0.006, 0.012, 0.025, 0.05, 0.1, 0.2, 0.42, 0.85}.

Информационная точность сохранения изображения при переходе от полноцветного изображения к монохроматическому серому определяется количеством оттенков, т.е. полей серой шкалы.

Для высокоточного численного описания серых изображений используется шкала, составленная из значений функции интенсивности серого тона, которая определена в вершинах n-мерного бинарного куба. Значения этой функции представляют собой десятичные формы соответствующих двоичных значений аргумента.

Следовательно, область определения функции интенсивности представляет собой бинарную сетку, в строках которой расположены n-разрядные бинарные кортежи, устанавливающие разрядность цифрового изображения и используемые для кодирования цвета точки (единичного пикселя). Они составляют упорядоченное множество мощности 2n, и размерность вектора значений функции интенсивности поэтому равна 2n. Каждой точке изображения ставится в соответствие один кортеж, представляющий величину амплитуды серого тона в этой точке.

В компьютерной реализации серой шкалы часто используют на каждый пиксель изображения 8-разрядный бинарный кортеж - 8 бит информации, что обеспечивает высокое тоновое разрешение изображения. Такая шкала передаёт 256 = 28 градаций серого тона, где 0 соответствует белому цвету, а 255 - чёрному. Если оценивается не плотность чёрного цвета, а яркость белого, то базовая форма шкалы инвертируется.

Для сравнения - цветовое 8-разрядное изображение содержит по 265 градаций в матрице каждой из трёх координат пространства RGB (красной, зелёной, синей), т.е. в общей сложности

(256 х 256 х 256) = 16777216 (3)

цветовых комбинаций.

В работе используется базовая форма, поскольку значения амплитуд плотностей чёрного цвета являются характеристикой интенсивности искомого изображения.

Поскольку в задаче оценки состояния глазного дна надо выделить искомые объекты, и если они закрашены определённым, титульным цветом, как кровеносные сосуды, то для повышения значений интенсивности серого на этих объектах следует ввести поправку, повышающую компоненту цвета искомого объекта изображения в уравнении интенсивности. Такой подход изначально увеличит контрастность искомого объекта тонального изображения. Эти преобразования фактически

являются аналогом применения оптических фильтров.

Следует также отметить, что вместе с преобразованием полноцветного изображения в монохроматическое, существует возможность и обратного преобразования.

Исходя из этих соображений, в работе исследуется монохроматическое изображение, состоящее из градаций серых тонов и не несущее в себе участков цветовой гаммы. Для хранения полученных изображений серого тона используется формат TIFF, позволяющий сохранять точные их колометрические характеристики и импортировать растровые изображения в градиентные.

Сравнительная характеристика элементов изображения - контрастность определяется как производная интенсивности, поскольку представима разностью между амплитудами соседних точек и может рассматриваться как дифференцированная характеристика яркости соседних точек или целых объектов исследуемого изображения.

Область исследований в данной задаче -плоское поле монохроматического изображения (Пи), полученного из единственного цветового снимка, с числовой матрицей I, рассматриваемого как полезный сигнал на фоне статистического шума. Объекты исследования - точки и группы точек с числовой характеристикой интенсивности.

Контрастное отличие точки u0 от других точек на Пи можно определить как среднеквадратическое отклонение или модуль разности амплитуд, поскольку контрастность - чётная функция.

Схожие задачи решают техническим применением библиотечных процедур Computer Vision, позволяющих выделять границы объектов изображения. Но специфика задачи ОСГ определяет её особое место среди задач выделения текстуры, водяных знаков, распознавания лиц и т.п. В ней не предполагается наличия опорных точек или псевдопериодичности структуры искомого «иероглифа» на Пи, также отсутствуют регулярные закономерности поведения полезного сигнала.

В большинстве работ нормализация фона решается применением традиционной фильтрации. Так фильтр на базе оператора скользящего среднего позволяет настраивать размер окна фильтрации в соответствии с толщиной сосуда, а его многократное применение повышает точность кластеризации [7], но он не улавливает сложное поведение траекторий и не определяет точки ветвления.

Применяемый в комплексной области фильтр Габора с ядром Фурье [8], как и его вещественная проекция, предназначен для выделения стационарных закономерностей; соответственно, он эффективен при обработке изображений с квазипериодической структурой, т.к. пространство Габора - это свёртка ядра фильтра с периодическим сигналом. Сложность расчётов при большом числе итераций приводит к высокой трудоёмкости алгоритмов на его основе.

В работе предложена дифференциальная форма математической модели, где кровеносные сосуды, форма которых определяется случайным направлением, рассматриваются как траектории динамического случайного процесса (ДСП) [9], основная тенденция которого может быть описана дифференциальной зависимостью вида

D (п) (х,у) = 0, (4)

при п < 4, или системой уравнений в нормальной форме у' = /(х,у).

В такой постановке решение задачи традиционно рассматривается на комплексной плоскости, а геометрическая интерпретация решения представляет собой поле изоклин. Данная работа проводится в пространственно-временной области, а не в частотно-временной; а поскольку задача ставится на дискретном множестве, то и решается в конечноразностной форме. Но в допустимых случаях используется

дифференциальная терминология.

Рассмотрение кровеносных сосудов, как интегральных кривых математической модели (аналитических функций), на которые расслаивается исследуемая Пи в окрестности каждой точки (х,у,у'), позволяет считать, что на Пи задаётся поле изоклин Ах,У) = k = tg(a), где а - угол наклона изоклины. В зависимости от близости числовых значений параметра k в наборе можно регулировать плотность семейства интегральных кривых в исследуемой окрестности и обеспечивать точность фильтрации.

Параметризуя (от Г) координаты точки (х,у), рассмотрим Пи как фазовую плоскость, а изображающие сосуды интегральные кривые х = х(0, у = у(0 как фазовые траектории динамической системы. В дискретном случае параметр t представляет собой индекс точки фазовой траектории, а набор числовых значений параметра k определяет систему эквидистантных точек окна фильтрации, при этом указывает на качественные особенности траекторий решений: k = 0 определяет экстремумы траектории, а у" = 0 -точку перегиба. В точках ветвления сосудов происходит нарушение аналитичности интегральной кривой, что можно рассматривать как точки пересечения изоклин.

Для глобальной и локальной моделей системы кровеносных сосудов (СКС) с одним корневым узлом в качестве аналога выбрана классическая динамическая система - брюсселятор [10, 11] с искомыми функциями х(Г) и у(Г) и параметром ^

-(¡ +1) х + х2 у + 1,

(5)

¡¡х - х1 у.

Графическим представлением решения этой системы ОДУ на фазовой плоскости х0у может быть рис. 4.

dx _ dt dy , dt

математической индукции, а для небольших значений г - очевидны.

Рис. 4

На рис. 4 представлен график интересующего нас фазового портрета брюсселятора при ¡л = 0.5 с несколькими траекториями (для разных начальных условий), которые асимптотически стремятся к одной и той же точке - устойчивому узлу. Данный аттрактор соответствует корневому узлу локальной или глобальной модели системы кровеносных сосудов. В глобальной модели корневому узлу сопоставлен оптический диск. Однако, не углубляясь в формализм, отметим, что количество начальных точек решения будет соответствовать числу концевых «отрезков» рассматриваемой системы кровеносных сосудов. Следует учитывать, что начиная с бифуркационного значения параметра Л = 2, узел фазового портрета вырождается в предельный цикл. Этот случай не представляет интереса на данном этапе работы, но может быть использован при поиске патологических зон.

Кроме того, фазовый портрет с градиентными переходами серого тона в точках траекторий (рис. 4) удобно использовать при фильтрации и реконструкции морфологии сосудов в точках Пи.

Дискретность динамической задачи, в которой точки на изображении выделены конечными растровыми геометрическими границами (так называемые пиксели), приводит к поиску решения на множествах точек Пи Э = {эквидистантных} и Р = {радиальных}, с использованием множества точек F = {окна} фильтрации и результирующего множества Ф = {отклика} процедуры фильтрации, как множества отображения точек первых двух множеств. Термином «пиксель» при необходимости будем пользоваться в случаях дискретного представления Пи или рассмотрения изображения на мониторе.

В условиях дискретизации Пи окрестность Е0г исследуемой точки х0 рассматривается как множество наборов эквидистантных {е.} и радиальных {г.} точек относительно центровой точки и0 модели объекта. С этой целью, для визуализации Е0г и расчётов используется схема, представленная на рис. 5.

Для количественных оценок множества Е0г и его подмножеств воспользуемся двумя леммами, которые легко доказываются методом

5 5

4 4

3 3

2 2

1 1

ио

1 1

2 2

3 3

4 4

5 5

Рис. 5. Множество Е0г точки и0 с радиальным расстоянием г = 5

Лемма 1. Мощность г-го множества эквидистантных точек Ег равна увосьмирённому радиальному расстоянию.

Лемма 2. Мощность множества точек Е0г, эквивалентного г-окрестности точки и0 радиуса гп = г, равна

Е

(6)

, о,, = 8!г

1=1

В самом деле, для конкретного случая, представленного на рис. 5

|Е05| = 8(1 + 2 + 3 + 4 + 5) = 120.

Динамический фильтр (ДФ), отслеживающий поведение траекторий ДСП [12], с экспоненциальным ядром в численной, дискретной форме, имеет, в соответствии с требованием к (4), третий порядок из-за сложной конфигурации сосудов:

(к) , , / / \к к

= ^ \ 1%-а) ,

/ = у. = 4S. -6S2 + 4S3 -S4

и г т г г 1 г г

у = 6S -14S2 + Ш3 - 3S4,

11 I I 1 I У

(7)

(8) (9)

(10) (11)

где

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

у. = 4S .-Ш2 + 10S 3 -3S4,

II I I I 1 5

у . = ^ - 3S2 + 3S3 - S4,

Тг г г I I у

Skl+1(z) = (1 -а)^(г) + аS. , (12)

ае (0,1), S0 = z¡.

Помимо отслеживания эволюционирующих траекторий, алгоритм динамической фильтрации позволяет выровнять, сделать однородной интенсивность фона изображения. Фильтрация проводится на множестве Е0г по амплитудам пикселей, расположенных на эквидистантных и радиальных направлениях относительно точки и0.

В алгоритме используются две матрицы: матрица монохроматического изображения I размерности М х N (исходные данные) и матрица окна фильтра F размерности (2 г + 1) х (2г +1) для

к =0

размещения оперативных данных процедуры фильтрации, содержащая текущие оценки характеристик исследуемой точки и её окрестности, где М, N - количества точек по краям изображения; 8г - ранг множества г-эквидистантных точек, г -радиус эквидистантности. Результаты итераций размещаются в числовой маске Т матрицы I на месте отображаемых значений.

Фильтрация проводится как по точкам, эквидистантным относительно центра окна фильтрации, так и по радиальным точкам матрицы F. По краям Пи оценки получаются с меньшей точностью за счёт существования там «мёртвой зоны», связанной с уменьшения числа степеней свободы в используемых граничных выборках. Повысить точность оценок на границах поля изображения можно за счёт применения экстраполирующей процедуры в динамическом фильтре.

В целом процесс кластеризации на Пи, кроме первого уровня динамической фильтрации, содержит ещё два уровня. На втором уровне проводится селекция точек двумя процедурами, по результатам сравнения которых формируется текущий для данного этапа набор объектных кластеров. Первая процедура определяет в соответствии с селективными признаками принадлежность точки одному из кластеров контрастности. Вторая процедура выполняется по правилу парных сравнений. Для этого формируется треугольная матрица сравнений, в которой величина приоритета определяется на основе бинарного отношения пар точек с минимизацией расстояния между ними, при этом одна из них заведомо принадлежит одному из объектных кластеров [13].

Для обеспечения необходимой контрастности отклика, полученного по результатам динамической фильтрации, можно использовать любой из двух наборов селективных порогов: П1 = {1,0.5,0} и П2 = {1,0} с их соответствующей интерпретацией: либо П1 = {"чёрный", "серый", "белый"}, либо П2 = {"чёрный", "белый"}.

Макрошаг (назовём его эпохой) третьего уровня включает в себя повтор двух предыдущих уровней, исходными данными для которого являются результаты предыдущей эпохи. На этом

уровне происходит адаптация полученной на предыдущем уровне системы кластеров.

Множество полученных на двух уровнях результатов является исходным для финальной процедуры - трассировки русел сосудов кровеносной системы, позволяющей отделить возможные пространственные наложения различных русел, не допуская их слияния.

Литература

1. American Academy of Ophthalmology, Ophthalmic Pathology // In Basic and Clinical Science Courses. - 1991. -Section 11. - 179 р.

2. Goldbaum, M. Automated diagnosis and image understanding with object extraction, object classification, and inferencing in retinal images / M. Goldbaum, S. Moezzi, A. Taylor, S. Chatteijee, J. Boyd, E. Hunter, R. Jain // IEEE conference on ICIP. - 1996. - Vol. 3. - P. 695-698.

3. ГОСТ Р ИСО 9241-8-2007 (Стандарт на цветные изображения).

4. http://avtocvet.net/stati/statcolor/statcolor2.php

5. http://femto.com.ua/articles/part 1/1692.html

6. http://aco.ifmo.ru/el books/image processing/3 02.

html

7. http://habrahabr.ru/post/259017/

8. Сойфер В.А. Методы компьютерной обработки изображений / В.А. Сойфер. - М.: Физматлит, 2003. - 459 с.

9. Каладзе, В.А. Алгоритмические модели и структурные функции динамических случайных процессов [Текст] / В.А. Каладзе // Системы управления и информационные технологии. - 2010. - № 3 (41). - С. 4-7.

10. Пригожин, И. Порядок из хаоса: Новый диалог человека с природой [Текст] / И. Пригожин, И. Стенгерс. - Париж, 1979. (русский перевод 1986 г.)

11. Николис, Г. Самоорганизация в неравновесных системах / Г. Николис, И. Пригожин. - М.: Мир, 1979.

12. Kaladze, V.A. Mathematical models of casual processes with stationary increments and the non-uniform information dynamic processing: Monograph. - Lorman, MS, USA: Science Book Publishing House, 2012. -136 p.

13. Подвальный, С.Л. Многоальтернативность как основа обеспечения интеллектуальности систем управления [Текст] / С.Л. Подвальный, Т.М. Леденева // Вестник Воронежского государственного технического университета. - 2012. - Т. 8. - № 11. - С. 17-23.

Воронежский государственный технический университет Международный институт компьютерных технологий, г. Воронеж Воронежский институт высоких технологий

EXPOSITION OF OBJECTS OF THE IMAGE OVER METHODS OF NUMERICAL DYNAMICS

E.A. Gantseva, V.A. Kaladze, A.V. Shulyaev

The numerical analysis of images of vascular systems of an eye bottom with an estimation of their morphological indications allows to raise essentially quality of diagnostics in ophthalmology and to ensure an automatic estimation of a condition of vascular systems. Researches of a picture of an eye bottom in work are spent on the monochromatic image, that considerably reduces labour input of a numerical solution of a problem of allocation ofsystem of blood vessels which is based on application of the developed dynamic model of vascular system in an image phase space

Key words: grey tone, phase trajectories, adaptation

i Надоели баннеры? Вы всегда можете отключить рекламу.