Научная статья на тему 'Анализ методов фрактального кодирования и применение метода LBP (local binary patterns) для обработки изображения'

Анализ методов фрактального кодирования и применение метода LBP (local binary patterns) для обработки изображения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
581
215
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФРАКТАЛЬНОЕ КОДИРОВАНИЕ ИЗОБРАЖЕНИЯ / СЖАТИЕ ИНФОРМАЦИИ / МЕТОД LBP (LOCAL BINARY PATTERNS) / METHOD LBP (LOCAL BINARY PATTERNS) / FRACTAL IMAGE CODING / COMPRESSION OF THE INFORMATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Карцов Сергей Константинович, Куприянов Дмитрий Юрьевич, Зыков Алексей Николаевич

Настоящая статья включает в себя анализ и применение метода LBP (Local Binary Patterns) для фрактального кодирования изображения. В основе метода LBP лежит модель, описывающая окрестности элементов изображения с помощью двоичных кодов. Этот метод применяется для исследования их локальных свойств и выявления эффективных характеристик отдельных частей изображения для его последующего сжатия.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Карцов Сергей Константинович, Куприянов Дмитрий Юрьевич, Зыков Алексей Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ANALYSIS AND APPLICATION OF METHOD LBP (LOCAL BINARY PATTERNS) FOR FRACTAL IMAGE CODINGS

Present article represents the analysis and application of method LBP (Local Binary Patterns) for fractal image codings. Being based on local binary model, LBP it is applied to research of local properties of a structure of the image, being its effective characteristic.

Текст научной работы на тему «Анализ методов фрактального кодирования и применение метода LBP (local binary patterns) для обработки изображения»

УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

УДК 004.932

АНАЛИЗ МЕТОДОВ ФРАКТАЛЬНОГО КОДИРОВАНИЯ И ПРИМЕНЕНИЕ МЕТОДА LBP (LOCAL BINARY PATTERNS) ДЛЯ ОБРАБОТКИ ИЗОБРАЖЕНИЯ

С.К. Карцов, Д.Ю. Куприянов, А.Н. Зыков

Настоящая статья включает в себя анализ и применение метода LBP (Local Binary Patterns) для фрактального кодирования изображения. В основе метода LBP лежит модель, описывающая окрестности элементов изображения с помощью двоичных кодов. Этот метод применяется для исследования их локальных свойств и выявления эффективных характеристик отдельных частей изображения для его последующего сжатия.

Ключевые слова: фрактальное кодирование изображения, сжатие информации, метод LBP (Local Binary Patterns).

В настоящее время, с резким ростом информационных потоков, становится актуальной задача хранения и передачи цифровой информации. При этом значительную долю объема этой информации занимают графические цифровые изображения. В результате размер хранилищ, а также пропускная способность сетей передачи данных увеличивается. Возникает дилемма: чем большая емкость и пропускная способность обеспечивается инженерами, тем более высокие требования предъявляются к техническому обеспечению пользователей. Поэтому проблема организации эффективного хранения и передачи графической информации становится достаточно значимой, а вместе с ней приобретает важность разработка эффективных методов, алгоритмов и технологий сжатия графической информации.

Анализ классических методов фрактального кодирования изображения. Фрактальное кодирование изображений [1] является одним из наиболее эффективных на сегодняшний день методов сжатия информации с потерями и, как следствие, достаточно перспективным для использования при разработке компьютерных мультимедиа приложений и обработке цифрового видео. Оно отличается как высокой степенью сжатия, сравнимой со степенью сжатия других известных современных методов кодирования (например, JPEG), так и скоростью восстановления изображения, ко-

торая у этого алгоритма значительно выше. При этом математическое описание изображения, как результат фрактального кодирования, позволяет восстановить изображение любого размера без каких-либо значительных масштабных искажений, которые свойственны другим методам кодирования. Однако, алгоритм фрактального кодирования обладает и недостатками. Основным среди них является большая вычислительная сложность этапа кодирования изображения.

Фрактальное кодирование изображения подразумевает нахождение множества сжимающих преобразований, которые отображают доменные блоки во множество ранговых блоков (рис. 1). Ранговые блоки покрывают всё изображение. При этом они могут быть как фиксированного, так и переменного размера, если используется построение с помощью адаптивного р аз биения.

Рис. 1. Отображение ранговых блоков в доменные блоки

Рассмотрим базовый алгоритм фрактального кодирования изображений. Изображение I разбивается на прямоугольные ранговые блоки Д таким образом, что ранговые блоки не пересекаются, но при этом покрывают всё изображение. Далее изображение I покрывается множеством доменных блоков Di. Доменные блоки могут пересекаться и иметь разный размер, а их количество может достигать сотен или тысяч единиц. После построений, для каждого рангового блока Д необходимо найти сжимающее аффинное преобразование , которое наилучшим образом аппроксимирует доменный блок Di. В общем случае, аффинное преобразование может включать в себя сдвиг, поворот и масштабирование, а для того чтобы оно было сжимающим, размеры доменной области должны превышать размеры ранговой области. Параметры преобразования необходимо сохранять для последующего восстановления рангового блока.

Степень сжатия изображения зависит от отображения доменных блоков в ранговые. Поиск наилучшего отображения требует больших вычислительных затрат, для сокращения которых в настоящее время исполь-

зуют несколько подходов увеличения скорости кодирования. Первый подход заключается в том, чтобы классифицировать домены, что в свою очередь позволяет значительно уменьшить множество используемых доменов, среди которых ведется поиск. Второй подход заключается в поиске определенных характеристических особенностей, с помощью которых можно оценивать доменные и ранговые области. Использование этих оценочных характеристик для сравнения доменных и ранговых блоков, взамен их по-пиксельного сравнения, позволяет ускорить процесс фрактального кодирования за счет существенного сокращения объема вычислений. При этом сами характеристики могут быть получены на основе спектрального анализа Фурье, вейвлет-анализа или показателей оттенков и цветового представления изображения.

Применение метода LBP для кодирования изображения. Текстурный анализ изображений является одним из наиболее используемых методов при реализации компьютерного зрения и распознавания образов. Обычно под текстурой изображения понимают распределение спектральной яркости (тона, цвета), обусловленное взаимным расположением неоднородных по спектральной яркости образующих изображение элементов. Текстура отображает внутреннее строение изображения, а также взаимное расположение образующих его элементов, и, таким образом, является важной характеристикой изображения. Существующие методы анализа текстуры в целом можно разделить на три категории: статистические, спектральные и структурные методы. Текстура со структурной точки зрения состоит из элементов, которые организованы в соответствии с определенными правилами размещения.

Метод двоичных локальных шаблонов (LBP - Local Binary Patterns) используется для анализа текстуры изображения при фрактальном кодировании изображения и представляет собой комбинацию статистических и структурных методов. Впервые этот метод был предложен T.Ojala, M.Pietikanen, T.Maehpaa [2] и после получил развитие в работах [3, 4]. Он является теоретически простым и одновременно эффективным методом, показывающим хорошие результаты во многих эмпирических исследованиях. Кроме того, метод инвариантен к монотонным полутоновым преобразованиям и, следовательно, может быть менее чувствительным к изменениям освещенности. Текстура, с точки зрения метода LBP, описывается микро-примитивами (textons) и статистикой их размещения. В основе метода лежат двоичные шаблоны областей размера 3x3, которые являются непараметрическими ядрами, суммирующими локальную пространственную структуру изображения.

Рассмотрим алгоритм метода LBP. Для каждого пикселя изображения выделим окрестность размера 3х3 (рис. 2). Создадим матрицу значений, в которой для всех соседних по отношению к центральному пикселям, имеющим значение интенсивности большее или равное чем значение ин-

тенсивности центрального пикселя, положим значение 1, а в противном случае - значение 0. Затем, последовательно по часовой стрелке запишем двоичное число, состоящее из цифр соседних к центральному пикселю. Это двоичное число (или его десятичный эквивалент) называется ЬБР-кодом центрального пикселя и, далее, используется как характеристика выбранной локальной текстуры.

Рис. 2. Вычисление оригинального ЬБР кода

Десятичная форма полученного 8-битного слова (ЬБР-кода) для пикселя с координатами (хс, ус) может быть выражена следующим образом:

7

ЬВР(хс, Ус ) = Ё ї(Іп - іс )1П , (1)

п=0

где іс - значение интенсивности центрального пикселя (хс, ус), іп - значение интенсивности соседнего пикселя с индексом п, а функция ^(х) - пороговая функция, которая определена так:

1 і/ х > 0

¿(х) :

(2)

0 / х < 0.

На практике ЬБР-код может быть истолкован как индекс ядра структуры изображения. Следует отметить, что оператор ЬБР не зависит от любого монотонного полутонового преобразования, которое сохраняет порядок интенсивности пикселя в локальной области.

Экспериментальные исследования. Возьмем изображение и вычислим ЬБР-код для каждого его пикселя. Для крайних и угловых пикселей значение недостающих внешних пикселей можно принять равным нулю. Получим матрицу размера соответствующего размеру исходного изображения, где вместо значений интенсивности пикселей будут находиться вычисленные их ЬБР-коды. Необходимо отметить, что ЬБР-код чувствителен к вращению (рис 3.), а именно, выбор порядка соседних пикселей, участвующих в формировании ЬБР-кода, определяет его значение и играет не последнюю роль при реализации метода. Для того, чтобы сделать данный код инвариантным к вращению, можно в качестве ЬБР-кода использовать максимальное, минимальное или среднее значение среди всех возможных вариантов для конкретного пикселя. Полученная матрица описы-

238

вает ранговые области.

0 0 1

1 1

1 1 1

00111111-63

01111110=126

11111100=252

11111001=249

11110011=243

11100111=231

11001111=207

10011111=159

Рис 3. Варианты формирования ЬБР-кода в зависимости от порядка выбора соседей

Уменьшим исходное изображение в два раза и вычислим его ЬБР-код. Получим новую матрицу значений ЬБР-кодов, размер которой будет в два раза меньше размера предыдущей матрицы. Новая матрица описывает доменные области. Далее, перебирая значения из ранговой матрицы, находим эквивалентные им значения в доменной матрице. Процедура поиска эквивалентных значений соответствует поиску подобных областей на исходном и уменьшенном изображениях. Таким образом, находятся ранговые и доменные области, а также устанавливаются соответствия между ними. Необходимо отметить, что поскольку доменная матрица характеризует уменьшенное в два раза исходное изображение, то значения ЬБР-кодов, находящихся в этой матрице, в свою очередь, наоборот, характеризуют области, которые в два раза превосходят по размеру свои исходные образы.

Экспериментальные исследования показали, что применение метода ЬБР позволяет значительно сократить временные и вычислительные расходы при фрактальном кодировании изображений. Среди преимуществ метода ЬБР можно выделить такие, как вычислительная проста, эффективность и универсальность. Метод ЬБР может применяться для классификации текстур полутоновых изображений и инвариантен к масштабированию.

Список литературы

1. Barnsley, M., and L. Hurd. 1993. Fractal Image Compression, Wellesley, MA: A.K.Peters, Ltd.

2. Ojala, T., Pietikainen, M., Maenpaa, T. “Multi resolution gray-scale and rotation invariant texture classification with local binary patterns.” IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol. 24, № 7, 2002. P. 971-987.

3. Ahonen T., Hadid A. and Pietikainen M., “Face recognition with local binary patterns,” in Proc. Euro. Conf. Comput. Vis., 2004. P. 469-481.

4. Takala V., Ahonen T., Pietikainen M. “Block-based methods for image retrieval using local binary patterns”, Scandinavian Conference on Image Analysis, Joensuu, Finland, 2005. P. 882-891.

Карцов Сергей Константинович, д-р техн. наук, проф., [email protected], Россия, Москва, Московский государственный индустриальный университет,

Куприянов Дмитрий Юрьевич, канд. техн. наук, доц., [email protected], Россия, Москва, Московский государственный индустриальный университет,

Зыков Алексей Николаевич, аспирант, kartsov@yandex. ru, Россия, Москва, Московский государственный индустриальный университет

THE ANALYSIS AND APPLICATION OF METHOD LBP (LOCAL BINARY PATTERNS)

FOR FRACTAL IMAGE CODINGS

S.K. Kartsov, D.Yu. Kupriajnov, A.N.Zykov

Present article represents the analysis and application of method LBP (Local Binary Patterns) for fractal image codings. Being based on local binary model, LBP it is applied to research of local properties of a structure of the image, being its effective characteristic.

Key words: fractal image coding, compression of the information, method LBP (Local Binary Patterns).

Kartsov Sergey Konstantinovich, doctor of technical science, professor, kartsov@yandex. ru, Russia, Moscow, Moscow State Industrial University,

Kuprijanov Dmitry Yurevich, candidate of technical science, docent, [email protected], Russia, Moscow, Moscow State Industrial University,

Zykov Aleksey Nikolaevich, postgraduete, [email protected], Russia, Moscow, Moscow State Industrial University

i Надоели баннеры? Вы всегда можете отключить рекламу.