СЕТИ ЭВМ
И ТЕЛЕКОММУНИКАЦИОННЫЕ СИСТЕМЫ
СЖАТИЕ ИНТЕРФЕРОМЕТРИЧЕСКИХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ СЕГМЕНТАЦИИ И ОПИСАНИЯ КОНТУРОВ ПОЛОС А.Ю. Тропченко, А.А. Тропченко, М.М.Федосов
Введение
В настоящее время известны различные методы сжатия изображений. Они являются универсальными и ориентированы на достаточно широкий класс изображений [1]. Самым известным из них является метод JPEG, однако одним из основных недостатков такого метода является жесткое разбиение исходного изображения на фрагменты без учета структуры самого изображения [2].
Рассмотрим задачу сжатия достаточно специфических изображений - интерферо-метрических изображений. Алгоритм сжатия подобных изображений требует учета специфических особенностей этих изображений. Интерферометрические изображения являются полутоновыми и имеют повторяющийся характер полос (см. рис. 1,а и рис. 2,а). Отдельные полосы на изображении можно рассматривать как отдельные области изображения, пикселы которых обладают в силу статистической зависимости близкой яркостью. При этом полосы имеют строго определенную форму и достаточно большую площадь [3]. Наиболее известным методом, учитывающим структуру изображений, является фрактальный метод [4, 5]. Однако такой метод имеет немало недостатков, основной из которых - большая вычислительная сложность [2]. В предлагаемом алгоритме сжатия интерферометрических изображений за типовую область (своего рода фрактал) выбирается отдельная полоса интерферограммы, а все изображение рассматривается как совокупность таких полос. Поэтому, если учитывать повторяющийся характер полос, то можно добиться более высоких коэффициентов сжатия, чем позволяет JPEG.
Алгоритм компрессии интерферометрических изображений
При сжатии прежде всего требуется выполнить выделение локальных областей различной яркости на интерферограмме, каждой из которых соответствует отдельная полоса, образуемая пикселами с близкой яркостью. Для выделения областей с близкой яркостью пикселов на изображении можно использовать различные методы сегментации изображения. Классические методы сегментации основаны на использовании порога интенсивности [6]. Достаточно эффективным методом сегментации является сегментация на основе адаптивно выбираемого порога [7, 8].
Определение порогов в этом случае связано с анализом гистограммы - отображения из множества { а, ..., в } значений яркости в множество натуральных чисел, каждому b е { а, ..., в } сопоставляется число точек (m, n), для которых B (m, n) = b.
Глобальный максимум гистограммы соответствует наиболее часто встречающемуся значению яркости b°max. В большинстве задач доминирует фон, так что значение b°max отвечает фону. Следует ожидать, что и близкие к b°max значения яркости также соответствуют фону. Для определения порога, отделяющего яркость объектов от яркости фона, достаточно располагать дополнительной информацией.
Допустим, что известно соотношение, связывающее яркость любой точки фона и объектов, например,
B (m, n) - B (u, v) > T, (1)
4
для любых точек (т, п), принадлежащих фону, и (и, у), принадлежащих объектам сцены. На основании (1) можно заключить, что для любой точки (и, V) любого объекта выполнено условие
В (и, V) < Ь^ - Т . (2)
Найдем теперь глобальный максимум части гистограммы - в области [ а, Ь0тах - Т]. Пусть он достигается в точке Ь*тах. Следует ожидать, что Ь*тах - яркость наиболее встречающаяся в точках объектов. Таким образом, можно заключить, что для любой точки (т, п) области фона выполнено условие
В (т, п) > Ь'тах + Т. (3)
Соотношения (2) и (3) и определяют пороги яркости для точек объектов и фона.
После сегментации можно получить бинарное изображение - маску, единичные биты которой соответствуют выделенным локальным областям (светлым полосам ин-терферограммы), а нулевые биты - черным полосам или фону. Тогда можно считать, что единичные области маски - это сжимаемые объекты, а нулевые - фон. Тем самым объем бинарной маски можно сжать уже минимум в 2 раза.
Объем изображения можно существенно сократить, если описать контур каждой выделенной области с помощью цепного кода Фримена, что достаточно просто производится на практике. Такой подход позволяет от двумерных объектов перейти к их одномерному (векторному) описанию, т.е. построение цепного кода может рассматриваться как процедура векторизации изображения. Как известно, цепной код для каждой точки контура строится как трехбитовый код, определяющий направление перехода к следующей точке согласно матрице связности [9]. В результате векторизации получаем набор начальных точек и вектора, подробно описывающих каждую область. Это основной этап компрессии, так как именно на этом этапе происходит основное уменьшение объема исходного изображения.
Так как любое из направлений кодируется трехбитным кодом, то для их представления можно использовать формат данных типа упакованных байтов. Иначе говоря, в одно 16-ти разрядное машинное полуслово записывается пять векторов направлений для пяти соседних точек контура. Очевидно, что это позволяет сократить объем векторизованного изображения не менее чем в 3-4 раза.
Для дальнейшего сжатия данных используются процедуры выделения КЬЕ-цепочек, описывающих повторяющиеся коды направлений, и последующего оптимального кодирования, например, с использованием кода Хаффмана или метода арифметического кодирования [10].
Таким образом, предлагаемый алгоритм компрессии интерферометрического изображения состоит из следующих этапов:
• сегментации исходного изображения, например, на основе адаптивно выбираемого порогового ограничения;
• построение бинарной маски, у которой светлым полосам интерферограммы соответствуют едичные области;
• векторизация изображения с помощью цепного кода Фримена;
• упаковка трехбитных кодов направления в полуслова;
• выделение КЬЕ-цепочек и кодирование данных с использованием оптимального кода.
Нетрудно видеть, что первые два этапа приводят к потерям при восстановлении изображения, в связи с чем данный метод относится к алгоритмам сжатия с потерями.
Алгоритм декомпрессии интерферометрических изображений
Для декомпрессии необходимо выполнить указанные выше этапы в обратном порядке. Заметим, что декодирование оптимального кода и получение цепочек повто-
ряющихся кодов направлений выполняется по традиционной схеме, например, также как и для метода JPEG. Затем необходимо распаковать данные, т.е. из каждого полуслова выделить пять соседних кодов направлений. Далее выполняется растеризация изображения, т.е. из векторного представления оно преобразуется в растровое. Для этого, начиная с начальной точки, с помощью вектора направления строится контур области. Затем необходимо закрасить область, ограниченную контуром. Для заливки может использоваться растровая развертка или затравочное заполнение.
Так как области имеют достаточно большой размер, то быстрее будет выполняться метод растровой развертки. Он состоит в следующем. Для каждой сканирующей строки, пересекающей ребра многоугольника, если пересечение находится слева от перегородки, то перекрасить все пикселы, центры которых лежат справа от пересечения сканирующей строки с ребром и слева от перегородки. Если пересечение находится справа от перегородки, то перекрасить все пикселы, центры которых находятся слева от пересечения строки с ребром и справа от перегородки. Перегородку проводят через одну из точек области, например, начальную.
После того, как выполнена заливка, изображение имеет резкие границы локальных областей. В целях сглаживания границ целесообразно выполнить усредняющую (медианную) фильтрацию всех граничных фрагментов области [6]. Заметим, что медианная фильтрация эффективна только в тех случаях, когда изображение имеет достаточно резкие границы.
При медианной фильтрации выбирается окно размером (2к + 1) х (2k + 1), и в каждой точке (i, j) растра яркость пересчитывается по следующему правилу. Расположим окно так, чтобы центр совпадал с точкой (i, j), и пронумеруем яркости (2к + 1)2 элементов изображения, попавших в окно, в порядке возрастания: b1 < b2 < ... < bi. Набор b1, ..., bl может содержать пронумерованные различными индексами равные значения. Медианой неубывающего набора b1, ..., bl называется ее средний элемент bm, т = (l + 1)/2. Медианная фильтрация заключается в замене значения яркости центрального элемента окна значением медианы неубывающего набора яркостей элементов, попавших в окно.
Заметим, что если объект состоит из l < / (2k + 1)2 точек (т.е. по площади не превосходит половины площади окна), он заведомо уничтожается, что вносит некоторые искажения.
Анализ эффективности предложенного метода сжатия
Предложенный метод достаточно прост для реализации. Но вместе с тем он должен давать высокие результаты (коэффициент сжатия), так как учитывает специфические особенности интерферометрических изображений. Для определения эффективности предложенного алгоритма сжатия-восстановления выбраны следующие основные величины, характеризующие метод сжатия:
• коэффициент сжатия (Ксж), определяющий, во сколько раз файл, хранящий сжатое изображение, меньше файла, хранящего исходное изображение;
• относительное среднеквадратичное отклонение (СКО) между исходным и полученным после сжатия изображением, которое выражается в процентах от динамического диапазона допустимых значений пикселов.
Рассмотрим эффективность разработанного алгоритма на примере двух изображений FourOpt.bmp и FromPhase.bmp (рис. 1,а и рис. 2,а). Для большей наглядности эффективности сравним результаты разработанного алгоритма и алгоритма JPEG.. Необходимо отметить, что использовался коэффициент сжатия JPEG, обеспечивающий сравнимую погрешность при восстановлении. Результаты для двух изображений приведены в таблице, а восстановленное изображение для первого примера представлено
на рис. 1,б), а для второго - на рис. 2,б. Исходя из рассчитанной относительной среднеквадратичной погрешности восстановленных изображений и полученных значений коэффициента сжатия, видно, что разработанный алгоритм является очень эффективным для сжатия интерферометрических изображений.
«О 20& ЭОЭ «О а» КО 70Э ODO 100 ™ «И 730
а) б)
Рис. 1. Изображение FourOpt.bmp: а) исходное изображение, б) восстановленное изображение
Рис. 2. Сравнительное изображение FromPhase.bmp: а) исходное изображение, б) восстановленное изображение
Характеристики Исходный файл JPEG Разработанный алгоритм
FourOpt.bmp
Размер файла 481 078 81 946 24 153
Коффициент сжатия 5,87 19,92
СКО 5,5% 5,34%
FromPhase.bmp
Размер файла 205 878 33 045 13 033
Коффициент сжатия 14,56 36,91
СКО 8% 7,68%
Таблица. Сравнительные характеристики сжатия Заключение
Таким образом, результаты, полученные при сжатии интерферограмм и их последующей декомпрессии, свидетельствуют об эффективности предложенного метода сжатия. К достоинствам данного метода можно отнести высокую степень сжатия и малую степень искажения. Недостаткам является невозможность регулирования степени сжатия изображения.
Характеристики предложенного метода сжатия можно улучшить, если при компрессии исходного изображения после упаковки кодов вектора направления дополнительно использовать более эффективные методы квазиоптимального кодирования [10].
Литература
1. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных.М.: Диалог-МИФИ, 2002.
2. Вотолин Д.С. Алгоритмы сжатия изображений. / Учебное пособие. М.: МГУ, 1998. 52 с.
3. Васильев В.Н., Гуров И.П. Компьютерная обработка сигналов в приложении к ин-терферометрическим системам. СПб: bhv, 1998.
4. Fisher Y. Fractal image compression. // Sig-Graf 92. 1992. № 4.
5. Jacquin A. Fractal image coding based on a theory of iterated contractive image transformations. // Open systems. 1995. № 5.
6. Прэтт У. Цифровая обработка изображений. Т.1, 2. М.: Мир, 1982.
7. Глущик Р.В. Процедуры распознавания и локализации объектов на изображении. / В сб. «Современные технологии. Труды молодых ученых ИТМО». СПб, СПбГИТМО, 2001. С.106-109.
8. Ожиганов А.А., Тропченко А.А., Тропченко А.Ю. Модифицированный фрактальный метод сжатия многоуровневых изображений. // Информационные технологии. 2003. № 4.
9. Бутаков Е.А., Островский В.И., Фадеев И.Л. Обработка изображений на ЭВМ. // М.: Радио и связь, 1987.
10. Семенюк В.В. Экономное кодирование дискретной информации. СПб: СПБ ГИТМО (ТУ), 2001.
ИСПОЛЬЗОВАНИЕ ДИСКРЕТНЫХ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЙ ДЛЯ ЦИФРОВОГО МАРКИРОВАНИЯ ИЗОБРАЖЕНИЙ М.В. Гришин, А.А. Ожиганов, А.Ю. Тропченко
Рассматривается модификация метода маркирования изображений на основе дискретных ортогональных вейвлет преобразований.
Введение
Проблема защиты авторского права на мультимедиа информацию существовала всегда, но стала особенно актуальной с развитием средств вычислительной техники и средств телекоммуникации.
Для защиты данных можно использовать хорошо зарекомендовавшие себя алгоритмы шифрования, но для мультимедиа данных это не лучший выбор. Зашифрованную мультимедиа информацию невозможно ни увидеть, ни услышать без расшифровки. Для данной категории информации хотелось бы иметь такие средства защиты, которые позволяли бы «подписывать» данные без потери информативности, т.е. заметного ухудшения качества изображения или звука. В этом случае «подписанный» объект можно слушать или просматривать, но одновременно можно в любой момент доказать, кому он принадлежит. При этом особенно важным является устойчивость цифровой подписи. Сжатие мультимедийных данных, стандартные методы цифровой обработки сигналов: фильтрации, масштабирование, повороты - все это оказывает влияние на цифровую подпись.
Этим искажениям в той или иной степени противостоят методы цифрового маркирования мультимедиа информации.
Подпись, скрываемую в данных, называют «цифровым водяным знаком» - ЦВЗ. ЦВЗ может иметь различную природу: логотип компании, случайная последовательность чисел или начальные параметры для ее генерации. Цель маркирования - определение:
• владельца объекта маркирования;
• изменений, произведенных над объектом маркирования;
• легальности объекта маркирования (права его использования).
Вне зависимости от типа ЦВЗ и области его применения можно привести некоторые обобщенные схемы создания и извлечения ЦВЗ. В общем виде проблема маркирования изображений рассматривается как проблема передачи слабого сигнала малой мощности (ЦВЗ) в широкополосном сигнале (изображении) таким образом, чтобы быть визуально не воспринимаемым и устойчивым к искажениям, которые могут появиться в процессе передачи информации.
На рис. 1 представлен процесс получения маркированного изображения.
Водяной знак(УГ) Стего -ко нтейнер (I)
КлючСК)
Создание В.З. Ж
Маркированное о бр ажение (Г)
Рис. 1. Процесс маркирования изображения: I - оригинал изображения; W - водяной знак; К - ключ (начальное значение для источника гененирования случайной
величины)