Доклады БГУИР
Doklady BGUIR
2017, № 1 (103) 2017, No. 1 (103)
УДК 004.932.72
СЖАТИЕ ИЗОБРАЖЕНИЙ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ НА ОСНОВЕ ВЕРОЯТНОСТНОГО КОДИРОВАНИЯ ДЛИН СЕРИЙ ПИКСЕЛЕЙ
Х.К. АЛЬ-БАХДИЛИ, В.Ю. ЦВЕТКОВ, В.К. КОНОПЕЛЬКО
Белорусский государственный университет информатики и радиоэлектроники, Республика Беларусь
Поступила в редакцию 3 января 2017
Предложены алгоритмы кодирования длин серий пикселей для сжатия полутоновых изображений без потерь и с потерями, учитывающие вероятность повтора значений пикселей и обеспечивающие за счет этого повышение коэффициента сжатия.
Ключевые слова: сжатие изображений, кодирование длин серий.
There are proposed run-length encoding algorithms to compress grayscale images lossless and loosy compression taking into account the likelihood of the occurrence of pixel values and providing thereby increasing the compression ratio.
Keywords: image compression, run length encoding. Doklady BGUIR. 2017. Vol. 103, No. 1, pp. 65-70
Halftone image compression based on probabilistic run length encoding H.K Al-Bahadily, V.Yu. Tsviatkou, V.K Kanapelka
Введение
Сжатие изображений дистанционного зондирования Земли (ДЗЗ) в реальном масштабе времени с использованием алгоритмов JPEG [1] и JPEG 2000 [2], RAR и ZIP [3] требует значительных вычислительных ресурсов. Для сжатия изображений в таких случаях представляет интерес алгоритм кодирования длин серий RLE (Run-Length Encoding) [4], основанный на учете повторов символов и имеющий малую вычислительную сложность. Недостатком данного алгоритма является отсутствие учета вероятности повтора значений пикселей в изображениях.
Целью работы является разработка алгоритмов сжатия полутоновых изображений без потерь и с потерями на основе кодирования длин серий пикселей, имеющих низкую вычислительную сложность и обеспечивающих высокое быстродействие.
Вероятность повтора пикселей в изображении и алгоритм RLE
Для анализа вероятности повтора пикселей рассмотрены 8-разрядные полутоновые изображения ДЗЗ с различным числом и резкостью перепадов яркости (рис. 1), представляющие соответствующие 5 классов изображений. На рис. 1 приведены гистограммы перепадов яркости и повторов пикселей в изображениях этих 5-ти классов.
г з м
Рис. 1. Тестовые изображения ДЗЗ и соответствующие им гистограммы перепадов яркости: а-г - полутоновые изображения M1-M4 соответственно размером 512*512 пикселей; д-з - гистограммы яркости тестовых изображений M1-M4; и-м - гистограммы длин серий пикселей в строках тестовых
изображений M1-M4
Из рис. 1 следует, что вероятность повтора имеет неравномерное распределение от длины серии и зависит от типа изображения. Алгоритм RLE не учитывает данную особенность и выделяет для кодирования повтора каждого символа одинаковое число бит, представленных в виде пары символов {¿(5), n(s)}, где i(s) - значение кодируемого 5-го символа; n(s) - число
повторов 5-го символа (длина серии); s = 0, S — 1 - порядковый номер символа; S - число кодируемых символов. Поэтому использование алгоритма RLE для сжатия изображений не эффективно. Размер RjjN (бит) кода, коэффициент сжатия CR и вычислительная сложность C^N
для
алгоритма RLE определяются с помощью выражений: R^ = S (BDj + BDN), CR = 8 YXjR
l/n
а
б
в
где YX- размер изображения, BD{ =|log2 (max(/(s))s=oS-1))| - битовая глубина изображения;
bdn = | log2 (max(n(S ))(s =o 5-i)) I - битовая глубина значений длин серий.
В таблице и на рис. 2 приведены коэффициенты сжатия тестовых изображений без потерь и с потерями с помощью алгоритма RLE и алгоритмов RAR, ZIP, JPEG, JPEG2000. Для сжатия изображений с потерями с помощью алгоритмов RLE, RAR, ZIP использовано предварительное квантование значений пикселей с помощью алгоритма двухпорогового квантования [5] и произведена оценка среднеквадратической ошибки квантования. В данном алгоритме используется оценка разности значений центрального пикселя и соседних пикселей в окрестности Мура по отношению к двум порогам. Один порог определяет условия разделения значений яркости соседних пикселей по соседним уровням квантования, а другой -условия приведения значения пикселя к несоответствующему ему уровню квантования из-за локального отличия яркости этого пикселя от яркости окрестных пикселей.
Несмотря на низкий коэффициент сжатия, алгоритм RLE, по сравнению с другими алгоритмами, имеет значительно меньшую вычислительную сложность, определяемую с помощью выражения CI/N = YX+4S .
Коэффициенты сжатия тестовых изображений без потерь
Алгоритмы Коэффициенты сжатия тестовых изображений
М1 М2 M3 M4
RLE 0,788 0,780 0,693 0,717
ZIP 9,069 4,786 1,709 2,837
RAR 10,818 5,812 1,796 3,170
I3BN 1,028 0,945 0,920 0,948
CR
в г
Рис. 2. Зависимости среднеквадратической ошибки восстановления изображений от коэффициента сжатия: а - для изображения M1; б - для изображения M2; в - для изображения M3; г - для изображения M4
Экспериментально установлено, что алгоритм RLE обеспечивает по сравнению с алгоритмами RAR и ZIP уменьшение времени кодирования в 10,0 и 13,5 раз соответственно при
размере изображения 256x256 пикселей, в 18,5 и 16,6 раза соответственно при размере изображения 1024x1024 пикселей, в 31,2 и 53,0 раза соответственно при размере изображения 8192x8192 пикселей (рис. 3).
Вероятностное RLE-кодирование изображений без ограничения длин серий пикселей
Предлагается алгоритм I3BN вероятностного кодирования длин серий с тремя подтверждениями повтора, использующий три бита подтверждения повтора для построения вложенного кода длины серии. При кодировании длины серии по алгоритму I3BN сначала формируется символ /(х). Если значение символа /(х) повторяется, то формируется бит 61(4 = 1, иначе 61(4 = 0 (первый бит повтора). Если символ /(х) повторяется снова, то формируется бит 62(4 = 1 , иначе 62(х) = 0 (второй бит повтора). Если символ ¡(4 повторяется снова, то формируется бит 63(х) = 1, 62(4 = 1, иначе 63(4 = 0 (третий бит повтора). Если символ / (х) повторяется снова, то формируется символ я(4, учитывающий число повторов (изначально я(4 = 0 , если символ /(х) повторяется снова, то я(4> 0). В результате могут формироваться серии вида: {¡(4 61(4 = 0}, { (у) 61(4 = 1, 62(4 = 0}, {(х ) бф) = 1, ¿2(4 = 1,63(4 = 0},
{ (?) 61 (*)=1,62(4=1, бз(4=1 , Ф)}.
ioV
_ JPEG
4101 V,
1016 32 64 128 256 512 1024 2048 4096 8192 Размер Изображения (пикселей)
Рис. 3. Зависимости среднего времени кодирования изображений M1-M4 от их размера по горизонтали и вертикали для алгоритмов ZIP, RAR, RLE в операционной системе Windows 7
Размер Rj /3B / N (бит) кода для алгоритма I3BN определяется с помощью выражения
S-1 S-1 S-1
Rj/2B/n = SiBDj +1) + £b1 (s) + £b2(s) + BDn£b3(s) .
s=0 s=0 s=0
Вычислительная сложность алгоритма I3BN оценивается с помощью выражения
S-1 S-1 S-1
C / 2B / N = YX + 4S + ^ b1 (s ) + £b2 (s ) + £63 (s )
s=0 s=0 s=0
Экспериментально установлено, что алгоритм I3BN обеспечивает примерно такой же выигрыш в скорости кодирования по отношению к алгоритмам RAR и ZIP, как и алгоритм RLE (рис. 3).
Коэффициенты сжатия тестовых изображений без потерь и с потерями с помощью алгоритма I3BN приведены в табл. 1 и на рис. 2. Из приведенных данных следует, что по коэффициенту сжатия алгоритм I3BN превосходит алгоритм RLE (в 1,2-1,3 раза при сжатии без потерь и в 1,1-1,3 раза при сжатии с потерями и значении среднеквадратической ошибки MSE = 22), но проигрывает алгоритмам RAR (в 2,0-10,5 раз при сжатии без потерь и в 1,2-3,0 раза при сжатии с потерями и значении среднеквадратической ошибки MSE = 22), ZIP (в 1,98,8 раз при сжатии без потерь и в 1,1-1,9 раза при сжатии с потерями и значении среднеквадратической ошибки MSE = 22), JPEG (до 2,5 раз при сжатии с потерями и MSE=20), JPEG2000 (до 6,0 раз при сжатии с потерями и MSE = 2,5) (оценка произведена с усреднением по типам изображений). При этом алгоритм I3BN практически не уступает алгоритму RLE в быстродействии и существенно превосходит алгоритмы RAR (в 20 раз при сжатии без потерь), ZIP (в 10 раз при сжатии без потерь), JPEG (в 100 раз при сжатии с потерями и MSE = 20), JPEG2000 (в 15 раз при сжатии с потерями и MSE = 2,5) (оценка произведена для сжатия без потерь с усреднением по типам изображений при размере изображений 8196x8196 пикселей).
Вероятностное RLE-кодирование изображений с ограничением длин серий пикселей
Предлагается алгоритм вероятностного кодирования с ограничением длины серии, использующий серию из К (К > 1) символов пь (к) (к = [о, К —1]) фиксированной разрядности Ь
для построения вложенного кода длины серии, где К(2Ь —1)< п(я). При кодировании длины серии по алгоритму сначала формируется символ /(я). Затем, если символ /(я) не повторяется, то формируется символ пь (о) = 0 и осуществляется переход к кодированию следующего символа. Если символ /(я) повторяется, то открывается цикл по к вложенного
М5) пРи п(^< 2
кодирования длины серии, в котором формируются символы пь (к) =
[(2l -1) при n(s)> 2l
ÎO при n(s) < 2l
уменьшается значение n(s) длины серии n(s) = S / г \ /\ L до тех пор, пока
[n(s)-(2 -1) при n(s)> 2
n(s)> O .
В результате могут формироваться серии вида: {/'(s),nL(o) = o}, {(s),nL(o)<2L},
{•(s),nL(o) = (2l -l\..,nL(K-1)<2l}.
Экспериментально установлено, что для большинства типов изображений максимальный коэффициент сжатия с помощью алгоритма INL достигается при L = 1. причем его значение примерно совпадает с коэффициентом сжатия алгоритма I3BN. При значениях L > 1 алгоритм INL существенно уступает по коэффициенту сжатия алгоритму I3BN.
Заключение
Предложены алгоритмы вероятностного кодирования длин серий без ограничения и с ограничением длины серии, учитывающие вероятность повтора значений пикселей при построении вложенного кода длины серии. Экспериментально установлено, что алгоритм вероятностного кодирования длин серий без ограничения длины серии превосходит базовый алгоритм RLE кодирования длин серий (1,2-1,3 раза при сжатии без потерь и в 1,1-1,3 раза при сжатии с потерями и значении среднеквадратической ошибки MSE = 22), но проигрывает алгоритмам RAR и ZIP (примерно до 10 раз при сжатии без потерь и до 3 раз при сжатии с потерями и значении среднеквадратической ошибки MSE = 22), JPEG (до 2,5 раз при сжатии с потерями и MSE = 20), JPEG2000 (до 6,0 раз при сжатии с потерями и MSE = 2,5). При этом предложенный алгоритм практически не уступает алгоритму RLE в быстродействии, но существенно превосходит алгоритмы RAR (в 20 раз при сжатии без потерь), ZIP (в 10 раз при сжатии без потерь), JPEG (в 100 раз при сжатии с потерями и MSE = 20), JPEG2000 (в 15 раз при сжатии с потерями и MSE = 2,5). Для алгоритма вероятностного кодирования длин серий с ограничением длины серии экспериментально установлено, что максимальный коэффициент сжатия достигается при длине серии, равной единице. При этом характеристики данного алгоритма примерно совпадают с характеристиками алгоритма вероятностного кодирования длин серий без ограничения длины серии.
Список литературы / References
1. Pennebaker W.B., Mitchell J.L. JPEG Still Image Compression Standard. New York: Van Nostrand Reinhold, 1993. 412 p.
2. JPEG2000 still image coding versus other standards / T. Ebrahimi [et al.] // Proc. of the SPIE. San Diego, CA, USA, July/August 2000. Vol. 4115. P. 446-454.
3. Richardson I. H.264 and MPEG-4 Video Compression and Video Coding for Next-generation Multimedia. UK, John Wiley & Sons Ltd, 2003. 281 p.
4. Golomb S.W. Run-Length Encoding // IEEE Transactions on Information Theory. July, 1966. P. 399-401.
5. New Modified RLE Algorithms to Compress Grayscale Images with Lossy and Lossless Compression / H.K. Albahadily [et. al.] // International Journal of Advanced Computer Science and Applications. 2016. Vol. 7, No. 7. P. 250-255.
Сведения об авторах
Аль-Бахдили Х.К., аспирант кафедры сетей и устройств телекоммуникаций Белорусского государственного университета информатики и радиоэлектроники.
Цветков В.Ю., д.т.н., доцент, заведующий кафедрой систем телекоммуникаций
Белорусского государственного университета информатики и радиоэлектроники.
Конопелько В.К., д.т.н., профессор, заведующий кафедрой сетей и устройств телекоммуникаций Белорусского государственного университета информатики и радиоэлектроники.
Адрес для корреспонденции
220013, Республика Беларусь,
г. Минск, ул. П. Бровки, д. 6,
Белорусский государственный
университет информатики и радиоэлектроники
тел. +375-17-293-84-08;
e-mail: [email protected];
Цветков Виктор Юрьевич
Information about the authors
Al-Bahadily H.K., postgraduate student of department of networks and telecommunication devices of Belarusian State University of Informatics and Radioelectronics.
Tsviatkou V.Yu.,. D.Sci., associate professor, chief of telecommunication systems department of Belarusian State University of Informatics and Radioelectronics.
Kanapelka V.K., D.Sci., professor, chief of department of networks and telecommunication devices of Belarusian State University of Informatics and Radioelectronics.
Address for correspondence
220013, Republic of Belarus, Minsk, P. Brovka st., 6, Belarusian State University of Informatics and Radioelectronics tel. +375-17- 293-84-08; e-mail: [email protected]; Tsviatkou Victor Yur'evich