НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н.Э. ЬАУМЛНЛ
НАУКА и ОБРАЗОВАНИЕ
Эл JVa ФС 77 - 48211. Государственная регистрация №(I4212Ü0025. ISSN 1994-0408
электронный научно-технический журнал
Обзор методов фильтрации и сегментации цифровых изображений
# 05, май 2012
Б01: 10.7463/0512.0411847
Стругайло В. В.
УДК 004.932
Россия, Московский автомобильно-дорожный государственный технический университет
Введение
Методы цифровой обработки позволяют преобразовывать изображения для улучшения их визуального восприятия. Также в данной области решаются задачи изменения представления изображений для обеспечения их хранения, передачи, визуализации в электронном виде и дальнейшего анализа заложенной в них информации. Цифровая обработка изображений является бурно развивающейся областью науки. Исследование и разработка методов и алгоритмов обработки и анализа информации представленной в виде цифровых изображений является очень актуальной задачей.
В данной работе осуществляется обзор методов фильтрации и сегментации изображений. Приводятся примеры рассмотренных методов для решения задач улучшения визуального представления и выделения контуров объектов на изображениях.
1. Фильтрация изображений
Цифровые изображения подвержены воздействию различных типов шумов, которые могут возникать от способа получения изображений, технологий передачи информации, методов оцифровывания данных. Процесс устранения различных видов шумов на изображениях, называется фильтрацией.
При осуществлении фильтрации яркостные характеристики каждой точки цифрового изображения, заменяются другим значением яркости, которое признается в наименьшей степени искаженным помехой [1, 2]. Выделяют частотную и пространственную фильтрацию [1].
Частотные методы преобразований изображений [ 1 -6] основываются на идее Фурье преобразования, смысл которого заключается в представлении исходной функции в виде
суммы тригонометрических функций различных частот, умноженных на заданные коэффициенты. В случае, если функция является периодической такое представление называется рядом Фурье. Иначе, непериодическая функция, имеющая конечную площадь под графиком, может быть выражена в виде интеграла от тригонометрических функций, умноженных на некоторую весовую функцию [1]. Такой вариант называется преобразованием Фурье и в большинстве практических задач оказывается более полезным, чем ряд Фурье. Важным свойством является то, что функцию, представленную Фурье-преобразованием, после осуществления над ней преобразований можно обратно вернуть к исходному виду. Таким образом, данный подход позволяет обрабатывать функцию в частотной области, после чего без потери информации вернуться к исходному виду. Для решения задач фильтрации изображений преобразование Фурье также могут применяться. В практическом приложении реализация частотных подходов может быть аналогична пространственным методам фильтрации [1].
Пространственные методы улучшения изображений применятся к растровым изображениям, представленным в виде двумерных матриц. Принцип пространственных алгоритмов заключается в применении специальных операторов к каждой точке исходного изображения. В качестве операторов выступают прямоугольные или квадратные матрицы называемые масками, ядрами или окнами [1,7,8]. Чаще всего маска представляет собой небольшой двумерный массив, а методы улучшения, базирующиеся на таком подходе, часто называют обработкой по маске или фильтрацией по маске.
При осуществлении линейной фильтрации отклик маски задается суммой произведений пикселей в области покрытия фильтра. В качестве линейного сглаживающего фильтра используется усредняющий фильтр выходным значением, которого является среднее значение по окрестности маски фильтра [1]. Подобный фильтр используется для задач удаления зернистости изображения вызванной импульсным шумом [9,7]. Общая формула отклика д(х, у) усредняющего фильтра, предназначенного для фильтрации изображения/с размерами М X имеет вид [1]
где h/Cs, t) - элемент ядра свертки изображения, имеющей размеры т Хп, s £ [—m/2, m/2], £ Е [—п/2,п/2\ - координаты ядра свертки по оси абсцисс и ординат; x=0,1,2,..,M-1, y=0,1,2,..,N-1 - координаты исходного изображения f.
В форме удобной для программного представления подобный фильтр можно представить в виде
(m-l)/2 (п-1)/2
(m-l)t_(n-l)
2 2
где [¿7^ ,] - элемент матрицы изображения после фильтрации;
- элемент массива ядра свертки изображения, имеющий размеры т X п; [£■■ - элемент матрицы исходного изображения.
Принцип работы нелинейных пространственных методов подобен линейным фильтрам. Операции, выполняемые нелинейным фильтром, зависят от значений элементов матрицы изображения, которые находятся в анализируемой окрестности. Например, действие нелинейного фильтра может заключаться в вычислении медианы значений элементов изображения анализируемой окрестности [1].
При медианной фильтрации значения пикселей представляют собой усредненное значение точек соответствующей окрестности. Часто при решении задач устранения шума медианный фильтр является более эффективным, чем обычное усреднение, так как приводит к меньшим искажениям границ выделяемых объектов. В качестве маски при медианной фильтрации используется двумерное окно с центральной симметрией, при этом его центр располагается в текущей точке фильтрации [2]. Формулу двумерного медианного фильтра определяет выражение
где [С*;] - элемент матрицы изображения после фильтрации;
[Ж, (.] - элемент массива апертуры изображения, имеющий размеры т X п\
[Е- ■ - элемент матрицы исходного изображения.
В основе адаптивной фильтрации положен винеровский фильтр, являющийся одним из типов линейного фильтра для адаптивной локальной обработки изображений [2]. Если значение среднеквадратичного отклонения интенсивностей пикселей в данной локальной области большое, то винеровский фильтр выполняет небольшое сглаживание и, наоборот, при меньшем отклонении область сглаживания больше [2]. Этот подход часто бывает более эффективным, чем обычная линейная фильтрация. Преимущество адаптивный фильтра еще заключается в том, что он сохраняет края и другие высокочастотные части объектов изображения. Однако, винеровский фильтр требует большего времени для вычислений, чем линейный фильтр [2].
Среднее значение яркости вычисляется для центрального пикселя маски И/^, содержащей значения яркости исходного изображения в покрытой маской локальной области изображения по формуле
Дисперсия маски равна
В данном алгоритме для каждого нового положения окна маски заново вычисляются соответствующие значения.
Сглаживание шума оценивается через среднее квадратичное отклонение
На рисунке 1 приведены результаты фильтрации при наложении импульсного шума на цифровое изображение. На рисунке 2 представлены результаты фильтрации наложенного на цифровое изображение гауссовского белого шума.
Исходное изображение Импульсный шум
• # V.!
Вид фильтрации
Линейная Медианная Адаптивная
И V.« Л.?;. г .V • • •• • • • (
Рисунок 1 - Результаты фильтрации импульсного шума на изображении
Исходное изображение Белый шум
Л.?:. • г А § ч*
Вид фильтрации
Линейная Медианная Адаптивная
• •• • -Г •• V.« т ► • V . ( • г А§
Рисунок 2 - Результаты фильтрации белого шума на изображении
2. Методы сегментации изображений
Конечный результат анализа изображений во многом определяется качеством сегментации [1], а степень детализации выделяемых характеристик зависит от конкретной задачи. Поэтому не существует отдельного метода или алгоритма подходящего для решения всех типов задач сегментации, каждый из методов имеет свои достоинства и недостатки. В большинстве случаев выбирается один или несколько алгоритмов, и модифицируются под специфичные условия задачи.
Сегментация решает в общем смысле две основные задачи [9]:
1) разделение изображения на части, для осуществления дальнейшего анализа.
2) изменение формы описания элементов изображения, что позволяет представить точки как высокоуровневые структуры, обеспечивающие эффективность дальнейшего анализа изображения.
Ввыделяются различные классификации методов, но большинство из них основываются на двух следующих свойствах сигнала яркости - это разрывность и однородность.
Разделение изображения на части базируется на идеях, основанных на резких перепадах яркости. Изменение формы описания элементов изображения основывается на разделении изображения на однородные области с учетом заранее выбранных критериев [1].
К методам на основе разрывности яркости относится обнаружение точек линий и перепадов [1]. При обнаружении точек и линий с помощью специальных масок организуется соответствующий поиск. В качестве методов обнаружения перепадов используются производные и градиенты от функций яркости, такие методы основаны на более общих идеях [1, 9].
Методы пороговой обработки основываются на идеях разделения значимых характеристик по некоторому порогу. Порог может быть глобальным, то есть определенным на всем изображении или локальным, который определен на некоторой области [1, 2, 9].
Метод выращивания областей, основывается на обнаружении разрывов яркости. В методах выделяются несколько центральных точек или групп точек, после чего, к ним присоединяются пиксели, удовлетворяющие заданным условиям [1, 9].
Гистограммные методы основаны на выборе минимальных и максимальных значений или интервалов между экстремумами [9, 1].
Методы на основе преобразований Хафа, основываются на связывании точек друг с другом путем предварительного выяснения их принадлежности к некоторой кривой заданной формы или обнаружения прямых и кривых линий по семейству заданных прямолинейных отрезков и дуг [9].
Методы теории графов, основываются на обнаружении и связывании контуров с помощью представления отрезков контуров в виде графа и осуществлении поиска на этом графе путей, соответствующих искомым контурам [1].
Методы водоразделов заключается в поиске линий разделяющих локальные минимумы и максимумы значений яркостей элементов изображения [1, 9].
Существует множество методов решающих задачи сегментации, как и подходов к их классификации. Для сравнения методов сегментации цифровых изображений, были смоделированы методы, представляемые в виде масок. Принцип работы таких методов основан на разности яркости элементов и фона изображения [1]. Математическое обоснование методов заключается в вычислении производных, представленных для цифровых изображений в виде дискретных приближений градиента. В качестве градиентных методов выделяют операторы, представляющие собой матричные маски [1,8,9]:
1) перекрестный оператор Робертса (Roberts' Cross operator);
2) оператор Превитта (Prewitt method, Compass Edge Detector);
3) оператор Собела (Sobel operator).
Оператор Робертса прост в реализации и обладает высоким быстродействием, однако сильно чувствителен к помехам [1, 8, 9]. На практике для вычисления дискретных градиентов чаще всего используются операторы Превитта и Собела. Маски оператора Превитта проще реализовать, чем маски оператора Собела, однако у последнего оператора влияние шума угловых элементов маски несколько меньше, что существенно при работе с производными [1, 4, 5]. Следует отметить, что у каждой из масок сумма коэффициентов равна нулю [1].
Оператор Робертса использует четыре значения яркости на изображении [8] и имеет следующий вид
сч - (£'(1+1).а+1) ~~ Еч) + {Еа+т ~ Ещ+1>) '
или
где ] - элемент матрицы исходного изображения.
Оператор Собела использует восемь отсчетов яркости в области анализируемого элемента:
Су = + . Матрицы оператора Собела имеют вид [8]
где: Е - матрица исходного изображения.
В программном представлении изображения [8]
СЧ -,ГУМ + Л(у) или СЧ - IСЧЮ + С1.]Ш >
где
Оператор Превитта подобен оператору Собела и отличается от него маской. Матрицы оператора Собела имеют вид [8]
В качестве методов основанных на производной второго порядка выделяют оператор Лапласиана [1, 8, 9]. Данный оператор обнаруживает границы в местах смены знака производной функции яркости. Но оператор лапласиана очень чувствителен к шуму.
Кроме того, использование модуля лапласиана приводит к удвоению контуров, что дает нежелательный эффект и усложняет сегментацию [9, 1, 8]. С целью уменьшить влияние шума часто используют лапласиан в сочетании со сглаживанием, например, по методу Гаусса. Такое сочетание называют оператором лапласиан гауссиана (Laplacian of Gaussian - LoG) [1, 9].
Маска оператора Лапласиана гауссиана создается по формуле
где а - среднеквадратичное отклонение распределения Гаусса. Маска фильтра имеет вид:
—а а - 1 —а а — 1 а -Ь 5 а — 1 , . —а а - 1 —а .
где a - параметр в диапазоне [0,1].
Еще одним часто реализуемым программно методом является Canny [1, 8, 9]. Фактически это набор последовательно применяемых алгоритмов. Данный подход устойчивый к шуму и дает, как правило, лучшие результаты по сравнению с градиентными методами. Но, так как это в принципе набор алгоритмов, то и быстродействие данного метода уступает более простым операторам.
На рисунке 3 приводятся результаты сегментации цифрового изображения с помощью рассмотренных алгоритмов.
Исходное изображение LoG Метод-Canny
►.•//Л • Tel ?°9vpo.< _ CUT О0 о о О О3 пО/ > ГЛ ® vj w ( J О с~ч о ^ О ~ ^ пС V пО оО Ро%ор< Г) _ пС
Оператор Робертса Оператор Превитта Оператор С о бела
) 0оР о о 9 ° о ° ( О „ пС о u°wo и V пО оО О „ о С V о о. °°г ; о onOo ( оО: о0 о о Йоо( О о о „ ч, пс
Рисунок 3 - Результаты сегментации изображения
Заключение
На основе реализованных методов фильтрации делается вывод, что для импульсных помех более подходит медианный фильтр, хорошо сохраняющий границы элементов и обладающий быстродействием. Для удаления белого шума наилучшие результаты показаны адаптивным винеровским фильтром.
Градиентные алгоритмы, применяемые для выделения контуров элементов изображений более просты в реализации программными средствами, однако результаты, получаемые с их помощью, зависят от качества исследуемых изображений. Качество выделения контуров методом Canny выше. Однако данный алгоритм медленнее, что становится заметно на большом количестве анализируемых изображений.
Литература
1. Гонзалес Р., Вудс Р. Цифровая обработка изображений. - М.: Техносфера, 2006. -1072с.
2. Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах: Учеб. пособие. - Новосибирск.: Изд-во НГТУ, 2003. - 352 с.
3. Сато Ю. Обработка сигналов. Первое знакомство. 2-е издание. - М.: Додэка XXI, 2009. - 176 с.
4. Оппенгейм А. Шафер Р. Цифровая обработка сигналов. 2-е издание. - М.: Техносфера, 2007. - 856 с.
5. Лайонс Ричард. Цифровая обработка сигналов: 2 изд. - М.: ООО Бином-Пресс, 2006. -656 с.
6. Сергиенко А.Б. Цифровая обработка сигналов. - СПб.: Питер, 2007. - 752 с.
7. Фисенко В.Т., Фисенко Т.Ю., Компьютерная обработка и распознавание изображений: учеб. пособие. - СПб: СПбГУ ИТМО, 2008. - 192 с.
8. Яне Б. Цифровая обработка изображений. - М.: Техносфера, 2007. - 584 с.
9. Шапиро Л., Стокман Дж. Компьютерное зрение. - М.: БИНОМ. Лаборатория знаний, 2006. - 752 с.
SCIENTIFIC PERIODICAL OF THE BAUMAN MSTÜ
SCIENCE and EDUCATION
EL JV® FS 77 - 4821 1. №0421200025. ISSN 1994-0408 electronic scientific and technical journal
Review of filtration and segmentation methods for digital images
# 05, May 2012
DOI: 10.7463/0512.0411847
Strugailo V.V.
Russia, State Technical University - MADI
This article presents a review of approaches to filtration of digital images. Algorithms of linear, median and adaptive filters were simulated in order to filter pulse and white noises. Analyses of algorithms were carried out; the results of these algorithms application were also included in the article. Gradient operators and set of algorithms Canny for segmentation of digital images were simulated. Analyses of algorithms and results of implemented algorithms' application for segmentation were carried out.
Publications with keywords: adaptive filter, digital image filtering, linear filter, median filter Publications with words: adaptive filter, digital image filtering, linear filter, median filter
References
1. Gonzales R.C., Woods R.E. Digital Image Processing. 2 ed. PH, 2001. (Russ ed.: Gonzales R., Vuds R. Tsifrovaia obrabotka izobrazhenii. Moscow, Tekhnosfera, 2006. 1072 p.).
2. Gruzman I.S., Kirichuk V.S., Kosykh V.P., Peretiagin G.I., Spektor A.A. Tsifrovaia obrabotka izobrazhenii v informatsionnykh sistemakh [Digital image processing in the information systems]. Novosibirsk. NSTU Publ., 2003. 352 p.
3. Sato Iu. Obrabotka signalov. Pervoe znakomstvo. Per.s iap. [Signal processing. The first acquaintance. Trans. from Japanese]. Moscow, Dodeka-21, 2009. 176 p.
4. Oppenheim A.V., Schafer R.W. Discrete-Time Signal Processing. Pearson Education, 1999, 870 p. (Russ. ed.: Oppengeim A. Shafer R. Tsifrovaia obrabotka signalov. Moscow, Tekhnosfera, 2007. 856 p.).
5. Lyons R.G. Understanding Digital Signal Processing. Prentice Hall, 2001. 538 p. (Russ ed.: Laions R. Tsifrovaia obrabotka signalov. Moscow, Binom-Press, 2006. 656 p.).
6. Sergienko A.B. Tsifrovaia obrabotka signalov [Digital signal processing]. St. Petersburg, Piter, 2007. 752 p.
7. Fisenko V.T., Fisenko T.Iu. Komp'iuternaia obrabotka i raspoznavanie izobrazhenii [Computer processing and recognition of images]. St. Petersburg, SPbGU ITMO Publ., 2008. 192 p.
8. Jahne B. Digital image processing. 6th ed. Springer, 2005. 607p. (Russ ed.: Iane B. Tsifrovaia obrabotka izobrazhenii. Moscow, Tekhnosfera, 2007. 584 p.).
9. Shapiro L., Stockman G. Computer Vision. Prentice Hall, 2001. 617 p. (Russ. ed.: Shapiro L., Stokman Dzh. Komp'iuternoe zrenie. Moscow, BINOM. Laboratoriia znanii, 2006. 752 p.).