ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2018 Управление, вычислительная техника и информатика № 43
УДК 621.391
DOI: 10.17223/19988605/43/5
А.Н. Земцов
ПРЕДСТАВЛЕНИЕ ИЗОБРАЖЕНИЙ С ПОМОЩЬЮ ПРЕОБРАЗОВАНИЯ ЛЕ ГАЛЛА
Рассматривается проблема аппроксимации изображений с помощью вейвлетов. Предлагается методика аппроксимации изображений с помощью преобразования Ле Галла. Приведены результаты численных экспериментов, показывающие возможность использования методики для решения задач обработки изображений. Ключевые слова: кодирование изображений; сжатие изображений; вейвлет-преобразование; преобразование Ле Галла; метрика PSNR.
По мере развития информационных и телекоммуникационных систем, а также технических средств регистрации изображений, отмечается интенсивное расширение применения методов цифровой обработки изображений в различных сферах человеческой деятельности. Увеличение требований конечных пользователей к такого рода системам является одной из основных причин их постоянного совершенствования и развития, увеличения производительности и эффективности их функционирования.
В настоящее время очевидно, что традиционный подход к анализу стационарных сигналов на основе преобразования Фурье является малоэффективным для представления функций и сигналов с локальными особенности [1].
Одним из главных недостатков такого подхода является использование в качестве базовой функции синусоиды, имеющей область определения R. Как следствие, преобразование Фурье не обладает хорошей локализацией в пространстве и не способно описывать нестационарные сигналы [2].
1. Вейвлет-анализ сигналов
Обозначим через L (0,2п) множество всех измеримых функций f определенных на интервале (0,2п) и таких, что
2п
||/(x)f dx<да . (1)
о
Здесь f является периодически продолжаемой на R кусочно-непрерывной функцией, поэтому L (0,2п) называют 2п-периодической функцией со среднеквадратичной сходимостью. Функция f может быть представлена рядом Фурье [3]:
да
/(x)=Z cnen , (2)
п=—да
где сл - коэффициенты Фурье, которые определяются как
-i 2л
^ = I/ (x
2Л о
Из формулы (2) видно, что для получения преобразования необходимо иметь сведения о поведении сигнала не только в прошлом, но и в будущем [4]. Любая функция / е L2 (0,2л) представляется
суперпозицией целочисленных растяжений базисной функции ш(x) = e* = cos (x) + i sin (x), являющейся синусоидой. Необходимо отметить, что функция ши (x) = ш(nx) не принадлежит пространству L (R) , являющемуся одним из случаев гильбертова пространства, для которого
да
II / (x )|2 dx < да. (4)
) e-inxdx.
(3)
Из (4) следует, что любая / е I (Я) должна затухать при х ^ ±да и юп (х) € II (Я). Таким образом, для использования функций юи (х) для порождения II (Я) необходимо, чтобы юи (х) затухали до нуля при х ^ ±ю .
Основная идея вейвлет-анализа состоит в разложении сигнала / по базису функций [5]:
/ = Е С ^ ■, (5)
/
т.е. в представлении исходного сигнала/в виде взвешенной суммы базисных функций , помноженных на спектральные коэффициенты с1. Из формулы (5) следует, что только спектральные коэффициенты с представляют информацию об исходном сигнале / так как базисные функции предполагаются заданными. Как ранее отмечалось в (2), разложение в ряд Фурье также представляется в соответствии с данной концепцией [2, 6].
Для эффективного представления исходного сигнала / посредством малого количества спектральных коэффициентов с; необходимо потребовать соответствия базисной функции особенностям исходного сигнала /[7]. Реальные сигналы локализованы и в частотной, и во временной области [4, 8]. Первое множество сигналов эффективно представляется с помощью импульсной функции Кронекера:
(' )=в-(' 40,'* =Л', (б)
Компромиссным подходом для анализа сигналов является вейвлет-преобразование сигналов, основанное на кратномасштабном анализе. В противоположность оконному преобразованию Фурье базисные функции вейвлет-преобразования соответствуют эффективному окну по времени, подстроенному путем их масштабирования под основные частоты сигнала.
2. Кратномасштабный анализ
Кратномасштабный анализ есть последовательность V} ^ замкнутых подпространств II (Я), удовлетворяющая следующим свойствам:
V (7)
и (8)
ад={0}; (9)
/ / ( 2х)еУ]+{, (10)
/ ( х)еГ0 « / ( х - к ) е V- (11)
Существует функция фе ¥0, такая что |ф(х - к)} порождает базис Рисса в V .
Кратномасштабный анализ задает последовательность непересекающихся вложенных аппрокси-мационных пространств V- в II (Я). Если р является ортогональным проектором на V-, то из условия (8) следует, что Ит-^ р/ — / для любой функции / е II (Я) . В силу (10) все подпространства V однозначно определяются из пространства V при помощи соответствующего масштабирования одной функции ф. Функция ф называется масштабирующей функцией, если она порождает кратно-масштабное разложение. Пространства V и ^+1 связаны таким соотношением, что при изменении масштаба функции/пространства V- на 2, /становится элементом пространства .
Сигналы, представленные крадратично-интегрируемыми функциями, определенными на вещественной оси, образуют гильбертово пространство II (Я) , всегда имеющее ортонормированные базисы:
(епет) = Ьт , (11)
=Д / (- )|2 ^=Н а, 012.
(12)
В гильбертовом пространстве существуют и более общие семейства линейно независимых базисных векторов, носящие название базиса Рисса, для которых условие (12) обобщается на два неравенства:
а
1, <012 А Г
(13)
где а > 0, Р < да . Данные базисы являются безусловными, т.е. порядок размещения в базисе векторов может быть произвольным.
Существует такая функция ф^,к (х) = 22 ф( 2'' х - к); к е Z, что, как следствие из (10) и (11), последовательность {фу *} является базисом Рисса в V для любого ' е Z . Существует последовательность {Нк } , такая что
ф(х) = \ф(2х - к) . (14)
Выражение (14) называется масштабным соотношением для масштабирующих функций. Пространство ^ определяется как ортогональное дополнение к V. в , т.е. = V. Ф и
± V,' е Z. В силу (8) и (9) имеет место следствие:
Ь2 (Я) —... Ф W—1 Ф Ж0 Ф ^ Ф... — Фу^.. (15)
Схематическое представление кратномасштабного анализа с разложением пространства ¥.+1 на
пространство V. и ортогональное дополнение Wj показано на рис. 1.
Рис. 1. Схематическое представление кратномасштабного анализа
Рис. 2. Пример двумерного сигнала и его трехуровневое вейвлет-преобразование
Пусть существует вейвлет-функция УуД х) = 2'2 у( 2'х — к)к е Z . Тогда, как следствие из (14), последовательность является базисом Рисса в W для любого 'е Z и существует по-
следовательность {gk = (—1)к к1—к | , такая что
V ' kеZ
у(х) = л/2£gkф(2х — к) , (16)
kеZ
2
п
п
где {Нк} - коэффициенты фильтра для масштабирующей функции, {^} - коэффициенты фильтра для вейвлет-функции, позволяющие численно находить значения ф и у , а также спектральные коэффициенты дискретного вейвлет-преобразования } .
Пример разложения сигнала в пространстве К2 показан на рис. 2.
Вейвлет-преобразование эффективно локализует низкочастотные детали в частотной области и высокочастотные детали во временной [4], что является решающей характеристикой для использования при анализе сигналов сложной формы [9]. Еще одним достоинством вейвлет-преобразования по сравнению с преобразованием Фурье и дискретным косинусным преобразованием является возможность построения быстрых алгоритмов вычисления.
3. Преобразование Ле Галла
В силу того, что V = V-! ® ' представляется возможным определить функцию / (х) , записанную в терминах базисных функций пространства V ■, в терминах базисных функций пространств и с учетом (14) и (16):
P]f ( х) = Е сук Фук ( х ) = Е С-и Фу-1,к (х ) + Е (-и Уу-и (х ) . (17)
Соотношение (16) называется масштабным соотношением для вейвлет-функций.
Таким образом, дискретное вейвлет-преобразование определяется как отображение Ж , переводящее последовательности {сук} в последовательности {су-1 к,к}.
Выражение (17) называется быстрым вейвлет-преобразованием в связи с тем, что имеет сложность порядка 0(п), т.е. сложность вычислений пропорциональна длине сигнала.
Необходимо также отметить, что х) из (16) определяется коэффициентами {^} , если определена порождающая масштабирующая функция ф(х), которая определяется коэффициентами {Ик} соотношения (14). Следовательно, система вейвлет-функций и масштабирующих функций может быть определена множествами {^} и {кк }Ы2 .
Из (17) следует, что любая функция / е 11 (К) на некотором заданном уровне разрешения уп представима в виде:
/(х)=Ес,,* фу,,*(х)+ЕЕ У Уук(х). (18)
к Зп к
Видно, что первый член взвешенной суммы (18) является грубым приближением / , а члены (у,к -детализирующими, после добавления которых степень детализации / увеличивается. Другими словами, увеличивается разрешение представления некоторого заданного сигнала. Отметим, что переход от уровня ] к уровню j + 1 эквивалентен замене х на 2х.
Для вычисления преобразования Ле Галла [10] воспользуемся соответствующими коэффициентами фильтрации для масштабирующей и вейвлет-функции:
113 11 ] Г11
ь Н-^-4-8 , ^ = 12Л2г. (19)
С учетом (18) и (19) найдем выражения для декомпозиции сигнала в виде:
(у, = ^ .1-1 ♦ ),
2
Су,к = Су-1,2к + "( у -1 + (,к )
Реконструкция осуществляется в обратном порядке:
Cj-1,2k = Cj,k ~ 1 (dj,k-1 + dj,k )>
C:
j-1,2k+1 dj,k + i (Cj-1,2k + Cj-1,2k+2
Необходимо отметить, что кк и ^ в (19) являются коэффициентами вида с • 2', где с,г е Z. Следовательно, при вычислении преобразования Ле Галла вычислительно сложную операцию умножения можно заменить сдвигом на ' бит.
4. Численные эксперименты
Продемонстрируем на конкретном примере возможность применения описанной методики аппроксимации изображений. Для сравнения алгоритмов часто используется характеристика степени искажения изображения. Для оценки искажений будем использовать меру пикового отношения уровня сигнала к уровню шума (PSNR, Peak Signal-to-Noise Ratio), которая является общепринятой в данной предметной области [11]. Степень искажения, измеряемая через отношение уровня сигнала к уровню шума, определяется с помощью реконструкции сигнала и сравнения декодированного сигнала с исходным. Для оценки объема полученных изображений будем также оценивать необходимое для хранения закодированного изображения удельное количество бит (bpp, bit per pixel).
В качестве тестового изображения будем использовать фрагмент фотографии памятника А.П. Чехову в городе Томске. На рис. 3 показан результат реконструкции тестового изображения с помощью различных наборов спектральных коэффициентов, полученных путем декомпозиции исходного изображения.
На рис. 3 с каждым изображением, полученным с помощью аппроксимации исходного изображения, сопоставлено изображение, являющееся разностью этих двух изображений. Это изображение показывает пиксельную ошибку, т.е. степень искажения, вносимого алгоритмом кодирования в изображение.
PSNR = 29,34 дБ, 0,01 bpp
PSNR = 32,26 дБ, 0,04 bpp
PSNR = 35,26 дБ, 0,1 bpp
PSNR = 44,80 дБ, 0,04 bpp
Рис. 3. Аппроксимация изображения на основе преобразования Ле Галла
Из рис. 3 видно, что предложенная методика аппроксимации устойчива при использовании для реконструкции даже малого количества коэффициентов, сохраняя при этом качество изображения на приемлемом уровне.
Предлагаемая методика аппроксимации изображений с помощью преобразования Ле Галла является основным этапом построения множества последующих алгоритмов обработки и анализа. Над изображением, представленным в виде множества коэффициентов вейвлет-преобразования, можно выполнять операции фильтрации, выделения различных признаков, пороговой обработки и др. Предложенный подход к вычислению характеризуется низкой вычислительной сложностью. Для демонстрации возможности применения предлагаемой методики в работе приводятся результаты численных экспериментов, показывающие возможность использования методики для решения задач обработки изображений.
1. Unser M. Sampling - 50 years after Shannon // Proc. of the IEEE. 2000. V. 88. P. 569-587.
2. He K., Sun. J., Tang X. Guided image filtering // IEEE Trans. on Pattern Analysis and Machine Intelligence. 2013. V. 35. P. 1397-
1409.
3. Broughton S. Discrete Fourier Analysis and Wavelets: Applications to Signal and Image Processing. Wiley-Interscience, 2008. 360 p.
4. Daubechies I. Ten Lectures on Wavelets. Izhevsk : SPC "Regular and Chaotic Dynamics", 2001. 464 p.
5. Gall D., Tabiatai A. Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding techniques //
Speech and Signal Processing. 1988. P. 761-764.
6. Donoho D.L. Compressed sensing // IEEE Trans. on Information Theory. 2006. V. 52. P. 1289-1306.
7. Mallat S. A Wavelet Tour of Signal Processing. Elsevier Inc., 2009. 832 p.
8. Akansu A. Wavelet, Subband and Block Transforms in Communications and Multimedia. Springer US, 1999. 408 p.
9. Zitova B., Flusser J. Image registration methods: A survey // Image and Vision Computing. 2003. V. 21. P. 977-1000.
10. Sikora T. Trends and perspectives in image and video coding // Proc. of IEEE. 2005. V. 93. P. 6-17.
11. Lin W., Jay Kuo C. Perceptual visual quality metrics: a survey // Journal of Visual Communication and Image Representation. 2011. V. 22. P. 297-312.
Zemtsov A.N. (2018) REPRESENTATION OF IMAGES USING LE GALL TRANSFORM. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie vychislitelnaja tehnika i informatika [Tomsk State University Journal of Control and Computer Science]. 43. pp. 42-48
DOI: 10.17223/19988605/43/5
It is now obvious that the traditional approach to the analysis of stationary signals based on the Fourier transform is ineffective for the representation of functions and signals with local singularities. A compromise approach for signal analysis is the wavelet transform of signals based on a multiscale analysis. In this paper, we propose a technique for approximating images using Le Gall transform.
A multi-scale analysis defines a sequence of disjoint nested approximative spaces Vj in L2 (R). The space Wj is defined as the
orthogonal complement to Vj in Vj+j, i.e. Vj+i = Vj ©Wj and Wj ± Vj, j e Z .
As Vj = Vj_i © Wjit seems possible to define the function f (x), written in terms of basis functions of space Vj , in terms of
basis functions of spaces Vj_i and Wj_i a fast wavelet transformation having a complexity O(n) is written in the form:
Заключение
ЛИТЕРАТУРА
Поступила в редакцию 22 октября 2017 г.
k
k
k
from which it follows that any function f e l2 (r) at a certain resolution level jn is representable in the form:
k in k
To calculate the Le Gall transform, we use the appropriate filter coefficients for the scaling and wavelet functions:
then the expressions for the decomposition of the signal will be written in the form:
dj,4 = cj-1,24+1 - 1 (cj-1,24 + cj-1,24+2 )i
cj,k = cj-1,24 +1 (dj,4-1 + dj,4) Reconstruction is carried out in the reverse order:
cj-1,24 = cj,4 -1 (dj,4-1 + dj,4)
cj-1,24+1 = dj,4 +1 (cj-1,24 + cj-1,24+2 )
The application of the proposed image representation technique allows obtaining the required resolution, as well as controlled original image detalisation, which is especially important in image compression and pattern recognition problems in the multiscale representation of real-world objects in an image. Above the image represented as a set of wavelet transform coefficients, can be perform filtering operations, highlighting various characteristics, thresholding, and others. The proposed approach to computing is characterized by low computational complexity.
Keywords: image coding; image compression; wavelet transform; Le Gall transform; quality metrics, PSNR.
ZEMTSOVAndrey Nikolaevich (Candidate of Technical Sciences, Volgograd State Technical University, Russian Federation). E-mail: [email protected]
REFERENCES
1. Unser, M. (2000) Sampling - 50 years after Shannon. Proc. of the IEEE. 88. pp. 569-587.
2. He, K., Sun. J. & Tang, X. (2013) Guided image filtering. IEEE Trans. on Pattern Analysis and Machine Intelligence. 35. pp. 1397-
1409.
3. Broughton, S. & Bryan, K. (2008) Discrete Fourier Analysis and Wavelets: Applications to Signal and Image Processing. Wiley-
Interscience.
4. Daubechies, I. (2001) Ten Lectures on Wavelets. Izhevsk: Regular and Chaotic Dynamics.
5. Gall, D. & Tabiatai, A. (1998) Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding
techniques. Speech and Signal Processing. pp. 761-764. DOI: 10.1109/ICASSP.1988.196696
6. Donoho, D.L. (2006) Compressed sensing. IEEE Trans. on Information Theory. 52. pp. 1289-1306.
7. Mallat, S. (2009) A Wavelet Tour of Signal Processing. Elsevier Inc.
8. Akansu, A. (1999) Wavelet, Subband and Block Transforms in Communications and Multimedia. Springer US.
9. Zitova, B. & Flusser, J. (2003) Image registration methods: A survey. Image and Vision Computing. 21. pp. 977-1000. DOI:
10.1016/S0262-8856(03)00137-9
10. Sikora, T. (2005) Trends and perspectives in image and video coding. Proc. of IEEE. 93. pp. 6-17.
11. Lin, W. & Jay Kuo, C. (2011) Perceptual visual quality metrics: A survey. Journal of Visual Communication and Image Representation. 22. pp. 297-312. DOI: 10.1016/j.jvcir.2011.01.005