Научная статья на тему 'Принцип сжатия изображений на основе дискретного вейвлет-преобразования'

Принцип сжатия изображений на основе дискретного вейвлет-преобразования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1385
196
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСКРЕТНОЕ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕ / АЛГОРИТМ НУЛЬДЕРЕВА / МЕТОД EZW / МЕТОД SPIHT / СЖАТИЕ ИЗОБРАЖЕНИЯ / DISCRETE WAVELET TRANSFORM / ZERO-TREE ALGORITHM / EZW METHOD / SPIHT METHOD / IMAGE COMPRESSION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Червяков Николай Иванович, Ляхов Павел Алексеевич, Калита Диана Ивановна, Шульженко Кирилл Сергеевич

В статье исследованы основные принципы сжатия изображений с применением дискретного вейвлет-преобразования. Рассмотрены перспективные методы обработки изображений EZW и SPIHT, основанные на алгоритме нульдерева. На примере показана работа метода обработки изображений SPIHT со встроенной структурой алгоритма нульдерева. Проведено моделирование в пакете прикладных программ среды MATLAB сжатия изображения в оттенках серого на основе дискретного вейвлет-преобразования. Сделан вывод о том, что пригодное для практических целей и визуально хорошего качества изображение можно получить при обнулении до 85% коэффициентов обрабатываемого изображения. При обнулении коэффициентов изображения в два раза можно получить изображение, не отличающееся по числовым характеристикам сигнал-шум и индекс структурного сходства от исходного изображения в оттенках серого.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Principle of compression images based on discrete wavelet transform

In the article the basic principles of image compression using discrete wavelet transform is presented. Promising imaging techniques EZW and SPIHT, based on zero-tree algorithm are shown. An example shows the operation of SPIHT image processing method with an integrated zero-tree algorithm structure. The simulation package application environment MATLAB compress grayscale images based on discrete wavelet transform. The conclusion is that suitable for practical purposes and visually high quality image can be obtained by resetting up to 85% of the processed image coefficients. Resetting up to 50% of the processed image coefficients allows to obtain the picture, do not differ in the numerical characteristics of the peak signal to noise ratio and the structural similarity index of the original grayscale image.

Текст научной работы на тему «Принцип сжатия изображений на основе дискретного вейвлет-преобразования»

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

НАУКА. ИННОВАЦИИ ТЕХНОЛОГИИ, №3, 2016

УДК 004.315 Червяков Н.И. [Chervyakov N.I], Ляхов П.А. [Lyakhov Р.А.], Калита Д.И. [Kalita D.I.], Шульженко К.С. [Shulzhenko K.S.]

ПРИНЦИП СЖАТИЯ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ДИСКРЕТНОГО ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ

Principle of compression images based on discrete wavelet transform

В статье исследованы основные принципы сжатия изображений с применением дискретного вейвлет-преобразования. Рассмотрены перспективные методы обработки изображений EZW и SPIHT, основанные на алгоритме нульдерева. На примере показана работа метода обработки изображений SPIHTco встроенной структурой алгоритма нульдерева. Проведено моделирование в пакете прикладных программ среды MATLAB сжатия изображения в оттенках серого на основе дискретного вейвлет-преобразования. Сделан вывод о том, что пригодное для практических целей и визуально хорошего качества изображение можно получить при обнулении до 85% коэффициентов обрабатываемого изображения. При обнулении коэффициентов изображения в два раза можно получить изображение, не отличающееся по числовым характеристикам сигнал-шум и индекс структурного сходства от исходного изображения в оттенках серого.

Ключевые слова: дискретное вейвлет-преобразование, алгоритм нульдерева, метод EZW, метод SPIHT, сжатие изображения.

In the article the basic principles of image compression using discrete wavelet transform is presented. Promising imaging techniques EZW and SPIHT, based on zero-tree algorithm are shown. An example shows the operation of SPIHT image processing method with an integrated zero-tree algorithm structure. The simulation package application environment MATLAB compress grayscale images based on discrete wavelet transform. The conclusion is that suitable for practical purposes and visually high quality image can be obtained by resetting up to 85% of the processed image coefficients. Resetting up to 50% of the processed image coefficients allows to obtain the picture, do not differ in the numerical characteristics of the peak signal to noise ratio and the structural similarity index of the original grayscale image.

Key words: discrete wavelet transform, zero-tree algorithm, EZW method, SPIHT method, image compression.

ВВЕДЕНИЕ

В настоящее время особую популярность в практическом применении цифровой обработки сигналов получило вейвлет-преобразование. Вейвлеты широко применяются при обработке и синтезе различных сигналов, в задачах распознавания образов, сжатия и обработки изображений [1-2].

Самой актуальной и основной проблемой сжатия изображений, является решение проблемы сжатия без потерь. Цель ее решения состоит в том, чтобы сжать источник информации с наименьшей потерей, содержащейся в ней информации [2]. По этой причине существуют разные методы обработки изображений, дающие в практическом применении улучшенные показатели повышения эффективности кодеров и наименьший коэффициент потери информации при кодировании [3, 4].

Наиболее популярным методом для сжатия изображений, использующимся на практике является дискретное косинусное преобразование [5], в основе которого лежит Фурье анализ. Дискретное косинусное преобразование составляет основу современных методов сжатия изображений и видео, таких как JPEG и MPEG [6,7]. Однако, методы, основанные на преобразовании Фурье, имеют ряд недостатков, что приводит к снижению качества изображения. Использование вейвлет-преобразования в этой области помогает достичь снижение сложности и эффективности кодеров [8]. В связи с чем, возникает необходимость применять наиболее подходящий метод для сжатия изображений, использующий вейвлет-преобразо-вание, который будет давать более высокое качество изображения после сжатия [9].

В данной статье будут рассмотрены и проанализированы основные методы сжатия изображений в основе которых лежит вейвлет-преобразо-вание и Фурье анализ [10].

ВЕЙВ ЛЕТ-ПРЕОБРАЗОВАНИЕ

Наиболее популярным преобразованием, являющимся хорошей альтернативой традиционного преобразования Фурье, при применении методов цифрового сжатия и обработки изображений, является вейвлет-преобразование.

В основе вейвлет-преобразования лежит использование двух непрерывных и интегрируемых по всей оси функций вейвлет-функции ///(7) и масштабирующей или с кс й л и н г - фу н к ц и и (pit), таких что [10]:

l/(t)dt = 0 (p(t)dt = 1 (1)

—00 -QD

В с й в л с т - ф у н к ц и я также должна обладать свойством смещения во времени и масштабируемости:

y/(t,a,b) = y/(a,b,t) = a Vof^j (2)

Прямое непрерывное вейвлет-преобразование сигнала s(t) задается вычислением вейвлет-коэффициентов по формуле:

00 -- (t-ьЛ

C(a,b)= (s(t),y/(a,b,t)) = j"s(V)a 2у/ - dt (3)

V & У

—со v /

Обратное непрерывное вейвлет-преобразование осуществляется по формуле восстановления во временной области [11]:

—00—00

/=c;lii^(/>*V' м)

В связи со значительным неудобством вычисления интегралов, на практике величины а и Ъ обычно задаются дискретно [12]. В этом случае реализуется дискретное вейвлет-преобразование. В численном и функциональном анализе дискретные вейвлет-преобразования (ДВП) относятся к вейвлет-иреобразованиям, в которых вейвлеты представлены дискретными сигналами (выборками) [13] в следующем виде:

JV-1

s(t) = £ s(m)S(t - iAt), (5)

¿=1

В настоящее время основным методом вейвлет обработки сигналов является использование ДВП, на основе которого построены КИХ-фильтры. При применении такого фильтра в процессе вейвлет-об-работки изображения, требуется двухкратное его использование, так как изображение представляется в виде двумерного массива данных. Обработка происходит в два этапа, сначала обрабатываются строки массива

Обработка столбцов

Рис. 1. Структура набора фильтров обработки изображений.

данных, а потом его столбцы. Таким же образом происходит процесс восстановление исходного изображения. На рисунке 1 представлены этапы процесса обработки изображения, описанного выше.

ОБЗОР ОСНОВНЫХ КЛАССОВ

ВЕЙВ ЛЕТ-ПРЕОБРАЗОВАНИЯ

Наиболее распространенные методы сжатия изображений, применяются в стандартах JPEG и MJPEG. В основе этих стандартов сжатия изображений и видео лежит Фурье преобразование, которое представляет собой набор гармонических колебаний функции с различной частотой и амплитудой [11]. Перед тем как обработать изображение JPEG и MJPEG делят исходное изображение на блоки, что приводит к снижению качества результата. Результирующее изображение получается сильно дискретизованным и четко видна блочная структура изображения [12].

Вейвлет преобразование способно давать наиболее полную информацию, которую несет изображение в высоких субдескретизированных низких частотах, а также дополнительно локализует информацию на краях в пространственной группе коэффициентов в высокочастотных полосах. Еще одной особенностью вейвлет-преобразования является то, что оно облегчает схему передачи данных, которая постепенно уточняет качество принимаемого изображения [13]. То есть, использует кодированный битовый поток, который может быть обрезан в любой желаемой точке, для того, чтобы обеспечить соответствующее качество реконструкции изображения.

Ключевым моментом при применении вейвлет-преобразования в методах сжатия изображений является расчет эффективности квантования или другими словами, функции потери теоретически достигаемого предела сжатия источника информации

£>(*) = о-2

дисперсия,

скорость передачи данных, измеряемая в битах. При этом, каждый дополнительный бит уменьшает рассчитываемое искажение в 4 раза (или увеличивает отношение сигнал-шум на 6 дБ). Таким образом, если качество исходного изображения имеет высокое разрешение, искажение при этом экспоненциально убывает [14].

Несмотря на свои преимущества, которые обеспечивают хорошую пропускную способность, вейвлет-преобразование имеет и некоторые недостатки. Основным недостатком является небольшая пространственная поддержка высоко-частотных коэффициентов, которые используются для представления локальных частей изображение, например края изображения. Этот недостаток влечет за собой поиск новых методов квантования, которые выходят за рамки традиционных методов кодирования. Одними из таких методов являются методы Е2\У и 8Р1НТ [15].

где о2 -

Рис. 2. Структурное представление алгоритма нульдерева диск-

ретного вейвлет-преобразования.

Оба метода Е2\¥ и 8Р1НТ [16], [17] основаны на идее использования многопроходного кодирования с обнулением дерева (гегсЛгее) для передачи в первую очередь наибольших по величине вейвлет коэффициентов.

Суть алгоритма нульдерева состоит в применении древовидной структуры данных для описания вейвлет-преобразования. Схематично весь алгоритм представлен на рисунке 1.

После применения двухканального разделимого вейвлет-преобразования, корневой узел дерева представляет собой коэффициент масштабирующей функции, который имеет три потомка [18]. Высота узлов дерева соответствуют мастштабу вейвлет преобразования. Каждый узел дерева имеет четыре дочерних потомка, соответствующих вейвлет коэффициентам следующего уровня дерева и т.д. Внизу дерева располагаются лис-

тьевые узлы, которые не имеют потомков. Далее происходит квантование нульдеревом, основанное на процессе сравнения значимости коэффициентов. Если коэффициент узла дерева мал, то и его потомки скорее всего также будут малы. Таким образом, вначале квантователем квантуется каждый узел дерева. Если значение узла дерева меньше некоторого порога, его потомки игнорируются. Позже эти потомки восстанавливаются декодером как нули. Далее процесс квантования переходит на четыре потомка узла. Если корневой узел мал по сравнению с пороговым значением, обрабатывается следующий корневой узел, а его потомки обнуляются и т.д.

Алгоритм нульдерева считается эффективным алгоритмом, в связи с хорошо распределенной энергии вейвлет-преобразования и за счет совместного кодирования нулей [16]. Однако, данный алгоритм имеет и свой очевидный недостаток. Недостатком алгоритма является неточное порождение нулевых потомков, что связано с предположением, что если коэффициент узла мал в сравнении с пороговым значением, то, скорее всего, малы и его потомки. Однако, априорное предположение на практике может и не подтвердиться, что влечет за собой обнуление значимых коэффициентов. Таким образом, данный алгоритм может привести к существенным искажениям обрабатываемой информации [19].

Метод EZW (Embedded Zerotree Wavelet coded) алгоритма вложенного нульдерева исключает недостаток алгоритма zerotree посредством совместной передачи как ненулевых значений дерева, так и карты значений [20]. При этом биты, которые отводятся для кодирования карты значений, используются в общем потоке бит. При этом карта значений, которая имеет большую избыточность входящих в нее значений, может приводить к снижению скорости кодирования. Для того чтобы не допустить значительного искажения изображения за счет ошибочного определения нуль-дерева применяется алгоритм zerotree, но при этом теперь проверяется на значимость каждый потомок незначимого узла дерева. Если один или более потомков незначимого узла является значимым, то генерируется коэффициент изолированного нуля. Вероятность этого события меньше вероятности значимого потомка, поэтому среднее число бит, требующих-

ся для кодирования карты значений мало. Таким образом, алгоритм Е7Ж аппроксимирует исходное изображение небольшим количеством бит, а потом эта аппроксимация уточняется [21].

Весь алгоритм Е2\¥ заключается в выполнении следующих основных операций [20]:

1. Упорядочивание коэффициентов по амплитуде. На данном этапе происходит сравнение каждого вейвлет коэффициента к с некоторым пороговым значением Т. Если к > Т. то коэффициент считается значимым и наоборот. Упорядочивание происходит от низкочастотных полос к высокочастотным.

2. Межполосная, пространственная корреляция коэффициентов. На этом этапе для кодирования знака и позиции всех коэффициентов используется двухбитный символ: «±» - знак коэффициента; «0» - коэффициент незначащий; «узел нульдерева» - коэффициент незначащий вместе со всеми вейвлет коэффициентами в данной области.

3. Передача карты данных. После того, как коэффициенты вычислены и карта значений передана, должны быть переданы биты, которые уточняют их значения.

4. Сжатие карты значении и карты данных арифметическим кодером. Если скорость передачи данных допустима, то порог Т делится на два и процесс повторяется снова.

Таким образом, роль нульдерева в методе состоит в том, чтобы предотвратить передачу нулей. При этом алгоритм нульдерева

для коэффициента к используется до тех пор, пока значение данного коэффициента не станет больше текущего порога Т. После чего далее передается его квантованное значение [20].

Основные преимущества данного метода с точки зрения практического применения можно сформулировать следующим образом:

1) возможность точного регулирования скорости передачи;

2) возможность восстановления всего изображения при прекращении приема декодером бит в любой точке. При этом изображение будет максимально хорошего качества для данного числа бит.

3) возможность быстрого просмотра изображений в удаленной базе данных.

Улучшенным методом, использующим в своей структуре также алгоритм нульдерева, является метод SPIHT (Set Partition In Hierarchical Trees - установка подразделений в иерархических деревьях). Главное отличие данного метода состоит в том, что он использует кодирование не одиночных, а параллельных нульдеревьев. По своей эффективности метод SPIHT превосходит EZW на 0,3-6 Дб [20, 21].

Рассмотрим данный метод более подробно на конкретном примере. Пусть имеется простое трехуровневое представление изображение размера 8 х 8, представленное в таблице 1. Величина наибольшего коэффициента в нем равна 63. Тогда допустимый предел кодирования выберем в интервале величин 31,5 и 63. Пусть Т{ = 32.

Коэффициент родительского узла 63 имеет три дочерних потомка {-34,31,23}. Каждый из этих потомков, называемых теперь родительскими узлами, в свою очередь имеет по четыре дочерних потомка. Для родительского узла - 34 дочерними потомками считаются {49,10,14,-13}, для узла - 31 потомками являются {15,14,9,-7}, для узла 23потомки

Табл. 1. ВЕЙВЛЕТ ПРЕДСТАВЛЕНИЕ ИЗОБРАЖЕНИЯ РАЗМЕРА 8 х 8.

63 -34 49 10 7 13 -12 7

-31 23 14 -13 3 4 6 -1

15 14 3 -12 5 -7 3 9

-9 7 -14 8 4 2 3 2

-5 9 -1 47 4 6 -2 2

3 0 -3 2 3 -2 0 4

2 -3 6 -4 3 6 3 6

5 11 5 6 0 3 -4 4

{3,-12,-14,8}. На следующем этапе выделение потомков происходит аналогичным образом. Каждая величина коэффициента в данном представлении имеет свои координаты. После определения родительских узлов и их потомков происходит выделение из них значимых, путем сравнения с допустимым пределом Т. При этом используется следующее правило: если коэффициент или набор его потомков значимые, то генерируется «1», или «0» в случае их не значимости. Однако, при фактическом применении метода ЯР1НТ [19], это правило не всегда применимо. То есть если набор внука является значимым, генерируется «0», или «1» если набор незначимый. При этом также учитывается знаковый бит коэффициента: если коэффициент положителен, то генерируется «0», в противном случае «1». Декодер определяет только коэффициенты находящиеся в пределе 32 и 64, поэтому после декодирования в качестве оценки берется средняя точка 48.

Опишем поэтапно процесс кодирования данной таблицы коэффициентов изображения посредством нульдерева для предела Г, = 32.

1. Значение коэффициента родительского узла 63 больше, чем предел 32 и положительно, значит он значимый, генерируются 1 и 0 и записывается коэффициент 48 как результат.

2. Потомок - 34 значимый, отрицательный, значение имеет генерация бита 1. Записывается 48 и происходит проверка на значимость каждого из четырех потомков {49,10,14,-13}. Среди них значимым является только коэффициент 49.

3. Потомок - 31 значимый, отрицательный, значение имеет генерация бита 1. Происходит проверка на значимость каждого из четырех его потомков {15,14,-9,-7}.

4. Потомок 23 незначимый, положительный, генерация бита 0 незначительна. Его соответствующие потомки ¡3. 12,-14,8} обнуляются.

5. Набор потомков внука коэффициента - 34 незначительный, генерируется 0.

6. Набор потомков внука коэффициента - 31 значительный, генерируется 1.

7. Потомок 15 набора коэффициентов незначительный, генерация 0 незначительна.

8. Потомок 14 набора коэффициентов значительный, происходит генерация бита 1, а затем происходит проверка на значимость каждого из потомков коэффициентов {-1,47,-3,2}.

9. Внук набора коэффициента - 34 незначительный; генерируется двоичный бит «0».

10. Коэффициент - 31 имеет четыре потомка {15,14,-9,7}. Значимость коэффициентов 15 и 14 была проверена ранее, значит, проверяются на значимость коэффициенты -9 и 7.

Результаты проведенного кодирования посредством нульдерева для предела / 32 представлены в таблице 2.

Таким образом, на первом проходе кодер БРИТ генерирует 29 бит и одновременно определяет четыре значимых коэффициента {63,-34,49,47}. В дальнейшем декодер восстанавливает каждый коэффициент на основе генерированных бит. При этом, если набор значимых коэффициентов не велик, то декодер определяет каждый коэффициент в интервале от - 32 до 32 и берет среднюю точку 0 в качестве оценки. Результат кодирования на первом этапе показан в таблице 3.

Во втором проходе кодирования, предел кодирования делится пополам (Т2 = Т] I 2 = 16) и теперь, незначительные коэффициенты и наборы коэффициентов, найденные при первом проходе снова тестируются на значимость, но теперь для предела 7\ = 16. Таким образом, второй проход кодирования состоит в следующем:

1. Тестирование на значимость 12 незначительных коэффициентов, найденных при первом проходе, т.е. тех коэффициентов, которые имеют значение результата восстановления равным 0. При этом, коэффициенты - 31 при (0,1) и 23 при (1,1), являются значимыми на данном этапе кодирования. Декодер определяет величину каждого коэффициента, находящегося в интервале между 16 и 32 и декодирует их как значения - 24 и 24.

2. Потомок набора коэффициента 23 при (1,1) является незначимым, поэтому он внук набора коэффициента 49 при

Табл. 2. РЕЗУЛЬТАТЫ КОДИРОВАНИЯ КОЭФФИЦИЕНТОВ

С ПРИМЕНЕНИЕМ НУЛЬДЕРЕВА

№ комментария Координаты Значение Двоичный Результат коэффициента коэффициента символ восстановления

1 (0,0) 63 1 48 0 (1.0) -34 1 -48 1 (0,1) -31 0 0 (1.1) 23 0 0

2 (1,0) -34 1 (2,0) 49 1 48 0 (3.0) 10 0 0 (2.1) 14 0 0 (3,1) -13 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3 (0,1) -31 1 (0,2) 15 0 0 (1.2) 14 0 0 (0,3) -9 0 0 (1.3) -7 0 0

4 (1,1) 23 0

5 (1,0) -34 0

6 (0,1) -31 1

7 (0,2) 15 0

8 (1,2) 14 1 (2,4) -10 0 (3.4) 47 1 48 0 (2.5) -3 0 0 (3,5) 2 0 0

9 (0,3) -9 0 (1,3) -7 0

Табл. 3. РЕЗУЛЬТАТЫ КОДИРОВАНИЯ ТАБЛИЦЫ КОЭФФИЦИЕНТОВ

ИЗОБРАЖЕНИЯ ПОСРЕДСТВОМ НУЛЬДЕРЕВА ПРИ Т, = 32

48 -48 48 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 48 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

(2,0) и потомок набора коэффициентов 15 при (0,2), -9 при (0,3) и -7 при (1,3). Бит нульдерева генерируется в текущем проходе для каждого незначительного набора потомка.

3. Уточнение значимости четырех коэффициентов {63,— 34,49,47}, найденных на первом этапе кодирования. Значения этих коэффициентов определены в интервале между значениями 32 и 48, тогда они будут закодированы как 0 и декодированы как средняя точка равная 40; либо в интервале между значениями 48 и 64, тогда они будут закодированы как 1 и декодированы как средняя точка 56.

На этом проходе кодер генерирует 23 бита и определяет

Табл. 4. РЕЗУЛЬТАТЫ КОДИРОВАНИЯ ТАБЛИЦЫ КОЭФФИЦИЕНТОВ

ИЗОБРАЖЕНИЯ ПОСРЕДСТВОМ НУЛЬДЕРЕВА ПРИ Г, = 32

56 -40 56 0 0 0 0 0

-24 24 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 40 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

более двух значимых коэффициентов. Множеством значимых коэффициентов теперь становится множество {63,-34,49,47,-31,23}. Результаты кодирования представлены в таблице 4.

Описанный выше процесс кодирования продолжается от одного прохода к другому и может остановиться в любом момент [20]. Для повышения производительности может быть использовано арифметическое кодирование. При его использовании происходит сжатие двоичного потока битов кодера 8Р1НТ.

Из рассмотренного примера, отметим, что когда допустимые пределы кодирования являются степенями числа 2, то кодирование нульдеревом можно рассматривать как схему кодирования плоскости бит. Кодируется первый бит плоскости одновременно начиная с самого старшего бита. При этом, знаковые биты и биты уточнения (для коэффициентов, которые

становятся значимыми в следующем проходе) кодируются быстро, так как кодирование нульдеревом генерирует встроенный битовый поток, что эффективно сказывается на скорости передачи данных. Выбранное допустимое предельное значение кодирования коэффициентов сильно влияет на качество изображение. Использование слишком большого порогового значения повлечет за собой снижение качества результирующего изображения (сигнала), так как отброшенные значения близкие к нулю также участвуют в формировании изображения. Данное замечание, считается одним из существенных недостатков рассмотренного метода обработки изображений.

Современные вейвлет - кодеры основаны на предположении, что изображение порождается источником с флюктуирующсй дисперсией. Каждый кодер реализует определенный механизм для отображения локальной дисперсии вейвлет - и квантует их оптимальным или субоптимальным образом в соответствии с дисперсией. Кодеры отличаются друг от друга стратегиями квантования коэффициентов и тем, каким образом происходит оценка и передача значения дисперсии декодеру.

Кодеры, основанные на алгоритме нульдерева, предполагают у дисперсии наличие двух состояний: нуль или нет. Декодер}' передается дополнительная информация о местоположении значимых коэффициентов. Этот процесс приводит к нелинейной аппроксимации изображения. Множества нулевых коэффициентов выражаются в терминах деревьев вейвлетов или комбинаций этих деревьев. Нули передаются декодеру как дополнительная информация, так же как и квантованные данные. Кодеры, основанные на нульдеревьях, учитывают межполосные зависимости вейвлет коэффициентов.

В частотно-адаптивных кодерах применяются ортогональные адаптивные преобразования - метод вейвлет - пакетов. Локальные флюктуации корреляционных связей используют пространственно кодеры.

Другие вейвлет учитывают внутриполосные зависимости между вейвлет - коэффициентами (иногда одновременно и межполосные). Кодеры, основанные на решетчатом квантовании, делят коэффициенты на

группы в соответствии с их энергией. Для каждого коэффициента они оценивают и (или) передают информацию о группе и значение квантованного в соответствие с номинальной дисперсией группы коэффициента. Другой новый класс кодеров передает незначительное количество информации о дисперсии. Это показывает, что, возможно, информация о дисперсии имеет большую избыточность, чем считалось раньше.

МОДЕЛИРОВАНИЕ СЖАТИЯ ИЗОБРАЖЕНИЯ НА ОСНОВЕ ДИСКРЕТНОГО ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ

Для проведения моделирования метода использовалось изображение размера 255*255 «девушка» в оттенках серого. Моделирование проводилось в пакете прикладных программ среды Ма^аЬ. Для количественной оценки качества обработки изображений с обнулением коэффициентов были использованы две числовые характеристики.

1. или пиковое отношение сигнал-шум, между двумя изобра-

жениями (оригиналом и полученным изображением). Вычисляется данная характеристика по формуле:

РБШ = Ю\о$

ю

' Я2 Л

(6)

1х{т,п)-12(т,л)]2

где МБЕ =

мл

М-Ы

среднеквадратическая ошибка сравнения качества восстановленного изображения; Я - максимальное колебание входного сигнала изображения. Так как величина ЙХШ? имеет логарифмическую природу, единицей ее измерения является децибел (Дб). Чем больше величина УЯ, тем лучше качество восстановленного изображения, для тождественно равных изо б р а же н и й 1 \SNli = да. При исследовании алгоритмов сжатия и очистки от шума изображений в оттенках серого практически при-

годной считается величина УК, изменяющаяся в пределах от 20 Дб до 50 Дб [22, 23]. Для рассматриваемых нами случаев сжатия изображения величина РВРШ, вычислялась между изображением, полученным при использовании традиционной двоичной системы счисления и изображением, полученным посредством обнуления определенного количества коэффициентов.

2. 881М, или индекс структурного сходства между двумя изображениями, определяется на основе полного сопоставления исходного и полученного изображений [24]. Данная характеристика вычисляется по формуле:

881М (х, у) =

и

Му+с

2 2 + М1+С

Л20Г: Л

+ Сп

ху 7.1

Сг!+С7у2+С2>

(7)

где /их - среднее х,

- среднее у, о1 - дисперсия х, о| - дисперсия V, а„ - ко вариация х и у,

С\ = (/с,./.)2, с2 = Ф&Цг - две переменных, Ь - динамический диапазон пикселей, к} = 0,01 и к2 = 0,03 константы. Величина 881М находится в пределах между 0 и 1 и равна 1 для тождественно равных изображений. Для рассматриваемых нами случаев сжатия изображения величина 8ШМ вычислялась между изображением, полученным при использовании традиционной двоичной системы счисления и изображением, полученным посредством обнуления определенного количества коэффициентов.

Из полученных результатов видно (рис. 3), что при обнулении от 85% коэффициентов изображения, получаем визуально неотличимое от оригинала изображение. При сжатии изображения в два раза (в табл. 5 50% обнуленных коэффициентов) получаем изображение, не отличающееся по качеству от исходного.

Табл. 5. РЕЗУЛЬТАТЫ ОБНУЛЕНИЯ КОЭФФИЦИЕНТОВ

В ИЗОБРАЖЕНИИ «ДЕВУШКА» В ОТТЕНКАХ СЕРОГО

Количество обнуленных коэффициентов Рбпг, Дб

95% 34.3450 0.9430

90% 41,3717 0,9805

85% 46,3242 0,9914

80% 50.3398 0,9957

75% 53,7152 0,9976

70% 56,8869 0,9987

65% 61,2978 0,9994

60% 67,5576 0,9998

55% 76,5768 1,0000

50% со 1

45% со 1

40% со 1

35% со 1

30% СО 1

25% со 1

20% СО 1

15% со 1

10% СО 1

5% со 1

Рис. 3. Результаты моделирования посредством сжатия

изображения «девушка» в оттенках серого.

а) исходное изображение; б) 50% обнуленных коэффициентов; в) 75% обнуленных коэффициентов; г) 95% обнуленных коэффициентов

ю

о______

95 85 75 65 55

Количество обнуденных еоэффицентов, %

Рис. 4. Результаты РБ^ изображения «девушка» с уменьшением

количества обнуленных коэффициентов.

На рисунке 4 представлен график зависимости качества изображения от количества обнуленных коэффициентов вейвлет-преобразования.

ЗАКЛЮЧЕНИЕ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В статье проведен обзор основных методов вейвлет обработки изображений. Дана краткая характеристика перспективных методов обработки EZW и SPIHT в основе которых лежит алгоритм нульде-рева. Проиллюстрирована работа метода обработки изображений SPIHT со встроенной структурой алгоритма кодирования посредством нульдере-ва. Определены существенные различия между стандартом сжатия изображений JPEG и методами сжатия на основе вейвлет-преобразования.

Полученные в работе результаты, свидетельствуют о том, что пригодное для практических целей и визуально хорошего качества изображение можно получить при обнулении до 85% коэффициентов информации. Изображение, не отличающееся по качеству от исходного при сжатии его в два раза.

Данные результаты могут быть использованы для решения задач сжатия изображений в области медицины, астрономии, спутниковой съемки и других. Интересным направлением дальнейших исследований является разработка решений для практического внедрения сжатия изображений на основе вейвлет-анализа для указанных задач.

БЛАГОДАРНОСТИ

Работа написана в рамках базовой части Государственного задания №2563.

Работа выполнена при финансовой поддержке гранта Президента Российской Федерации МК-5980.2016.9.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. D. Taubman and М. Marceilin, JPEG2000: Image Compression Fundamentals, Standards, and Practice, Kluwer, 2001.

2. G. Strang and T. Nguyen, Wavelets and Filter Banks, Wellesley-Cambridge Press, New York, 1996.

3. M. Vetterii and J. Kovacevic, Wavelets and Subband Codings Prentice-Hall, Englewood Cliffs, NJ, 1995.

4. Т. M. Cover and I A. Thomas, Elements of Information Theory, Wiley & Sons, Inc, New York, 1991.

5. С. E. Shannon, "A mathematical theory of communication.» Bell Syst. Tech. J., 27, 379-423, 623-656, 1948.

6. С. E. Shannon, "Coding theorems for a discrete source with a fidelity criterion," IRE Nat. Cony. Rec.* 4,142-163, March 1939.

7. A. Gersho and R. M. Gray, Vector Quantization and Signal Compression, Kluwer Academic, Boston, MA, 1992.

8. N. S. Jayant and P. Noll, Digital Coding of waveforms, Prentice-Hall, Englewood Gilffs, NJ, 1984.

9. S. P. Lloyd, "Least squares quantization in РСМ», IEEE Tram, on Info. Theory, IT-28, 127-135, March 1982.

10. H. Gish and J. N. Pierce, "Asymptotically efficient quantizing," IEEE Trans, on Info. Theory, IT-14,5,676-683, September 1968.

11. Переберин А.В. О систематизации вейвлет-преобразований// Вычислительные методы и программирование. 2001. Т. 2. С. 15-40.

12. Дремин И.М., Иванов О.В., Нечитайло В.А. Вейвлеты и их использование. //Успехи физических наук. 2001. № 5. С. 465-501.

13. Блаттер К. Вейвлет-анализ. Основы теории. М.: Техносфера, 2006. 272 с.

14. М. W. Marceilin and Т. R. Fischer, "Trellis coded quantization of memoryless and Gauss-Markov sources," IEEE Trans, on Comm., 38, I, 82-93, January 1990.

15. T. Berger, Rate Distortion Theory, Prentice-Hall, Englewood Cliffs, NJ, 1971.

16. N. Farvardin and J. W. Modestino. "Optimum quantizer performance for a class of non-Gaussian memoryless sources," IEEE Trans, on Info. Theory, 30, 485-497, May 1984.

17. Аникуева О.В., Ляхов П.А., Червяков Н.И. Реализация дискретного вейвлет-преобразования в системе остаточных классов специального вида // Инфокоммуникационные технологии. 2014. Т. 12. №4. С 4-9.

18. D. A. Huffman, "A method for the construction of minimum redundancy codes," Proc. IRE, 40, 1098-1101» 1952.

19. T. C. Bell, J. G. Cleary, and I. H. Witten, Text Compression, Prentice-Haii, Englewood Cliffs, New Jersey, 1990.

20. J. W. Woods, Subband Image coding, Kluwer Academic, Boston, MA, 1991.

21. M. Antonini, M. Baiiaud, P. Mathieu, and I. Daubechies, "Image coding using wavelet transform," IEEE Trans, on Image Processl, 2, 205-220, April 1992.

22. Holland B. RAT: RC Amenability Test for Rapid Performance Prediction /URL: http://www.cse.sc.edu

23. Huynh-Thu Q., Ghanbari M. Scope of validity of PSNR in image/ video quality assessment// Electronics Letters. 2008. 44, No. 13. Pp 800-801.

24. Wang Z. Image quality assessment: from error visibility to structural similarity// IEEE Transactions image processing. 2004. 13, No. 4. Pp. 600-61.

i Надоели баннеры? Вы всегда можете отключить рекламу.