УДК 629.391 П.Н. ГУРЖИЙ
КОМПРЕССИЯ СИЛЬНОНАСЫЩЕННЫХ ИЗОБРАЖЕНИИ НА БАЗЕ ПРЕОБРАЗОВАНИЙ УОЛША В СИСТЕМАХ МОНИТОРИНГА ЗЕМЛИ
Обосновывается направление повышения степени сжатия сильнонасыщенных изображений. Излагаются основные этапы метода компактного представления трансформант ортогональных преобразований на основе сокращения статистической избыточности.
1. Введение
Система сбора и передачи информации на основе аэрокосмического мониторинга -это одна из важнейших составляющих общегосударственных географических информационных систем, что обуславливает необходимость использования в них самых современных технологий обработки и передачи информации. Основным элементом для передачи в аэрокосмическом мониторинге являются статические изображения местности, которые представляют собой фотореалистичные, имеющие большое количество мелких деталей и соответственно сильнонасыщенные изображения. Следовательно, общий объем данных такого рода информации будет достигать сотни Мбит, что не всегда соответствует низкой пропускной способности существующих каналов передачи в системах аэрокосмического мониторинга и может привести к невозможности своевременной доставки информации [1 - 4]. Поэтому цель исследования заключается в необходимости разработки метода сжатия сильнонасыщенных изображений для уменьшения объемов видеоданных при заданном уровне качества для обеспечения соответствий пропускной способности существующих каналов передачи данных.
2. Разработка метода сжатия сильнонасыщенных изображений
Критерий эффективности подсистемы обработки и передачи данных должен строиться с учетом времени, затрачиваемого на сжатие Тсж, времени восстановления Тв
изображений и времени передачи Тп сжатых изображений по каналам связи. Также для оценки качества необходимо использовать среднеквадратический показатель погрешности для выполнения алгоритма сжатия/восстановления изображения. Следовательно, выражение для критерия эффективности примет вид:
Т = Т + Т + Т (1)
и сж п в У ■>
Поэтому метод сжатия, для которого, с одной стороны, выполняется равенство: 5разр « 5сущ, а с другой - одна из систем неравенств:
кр-р >ксжщ; (ТСж + тв)разр <(ТСж + Тв)сущ; (2)
кр-р < ксжщ; (Тсж + тв )разр < (Тсж + тв )сущ,
тразр < Тсущ (3)
и и , (3)
будет эффективным.
Методы, учитывающие психовизуальную избыточность и двумерные корреляционные зависимости в обрабатываемых блоках изображений, позволяют обеспечить наибольшую степень сжатия данных [1-3]. Поэтому предлагается использовать ортогональные преобразования как основу для совершенствования методов сжатия. Это позволит: снизить степень корреляционных зависимостей; повысить неравномерность распределения; распределить погрешность преобразования внутри блока.
Если в качестве критерия использовать сложность машинной реализации, то при обработке сильнонасыщенных изображений применение базиса кусочно-постоянных функций является более эффективно по сравнению с базисом тригонометрических функций. Это возникает из-за сложности практической реализации и оценивается временной сложностью аппроксимации последовательности элементов изображений.
Поэтому предлагается разработать метод сжатия изображений, основанный на совершенствовании тех методов, которые базируются на основе двумерных ортогональных преобразований и энтропийном кодировании.
Для решения поставленной задачи предложен метод сжатия изображений, который включает дискретное ортогональное преобразование Уолша. При этом исходное изображение предварительно разбивается на блоки размерностью 16х16 пикселей. Полученные трансформанты кодируются с помощью целочисленного арифметического преобразования Уолша. Это позволяет достичь значения коэффициента сжатия для сильнонасыщенных изображений в среднем до 3,2.
Дополнительно повышение значения коэффициента сжатия достигается при использовании классификационного кодирования трансформант преобразования Уолша. Он реализован на основе перегруппировки весовых коэффициентов низкочастотных составляющих трансформант в отдельный массив и проводит раздельную обработку высокочастотных и низкочастотных составляющих трансформант. Это дает возможность учитывать различия в их динамических диапазонах и позволяет увеличить коэффициент сжатия в среднем на 20%, что, в свою очередь, приводит к снижению объема данных изображений, поступающих в канал связи.
Следовательно, при использовании ортогонального преобразования Уолша, кроме снижения степени статистических взаимосвязей, существенно снижается психовизуальная избыточность.
Предлагается вести построение процесса сжатия изображений с предварительной разбивкой исходного изображения на блоки размерностью 16х16 пикселей и дальнейшей их обработкой с помощью дискретного ортогонального преобразования Уолша:
f.og2 п - 1
Y(n,n) = — Fу(n)X(n,n)Fу(n) ; Fу(k, £) = (-1) ; (4)
к, £ = 0, п - 1; и о(к)=Ц-1; и1(к)=кя-1 + кя-2 , где Y(n,n) - трансформанта ортогонального преобразования Уолша размерностью п х п ; Х(п,п) - массив размером п х п , составленный из элементов исходного изображения; Fу(n) - столбец матрицы дискретных значений базисной функции преобразования Уолша; и о(к) - учитывает особенности трансформант ДПУ, заключающиеся в том, что [4]:
1) низкочастотные и высокочастотные составляющие трансформант ДПУ содержат разный значимый объем информации. Максимальное значение компоненты приходится на элемент матрицы, расположенный в верхнем левом углу;
2) законы распределения вероятностей появления значений низкочастотных и высокочастотных компонент трансформант преобразования ДПУ реалистических изображений эффективно аппроксимируются соответственно нормальным законом и законом распределения Релея.
Учитывая рассмотренные особенности, предлагается осуществлять раздельную обработку низкочастотных и высокочастотных компонент (рисунок).
массив трансформант изображения .
G R
массив НЧ -составляющих
8х8
G "1 -----
1 —
/
tr- —■
/ ie
G
B
R
16х16
■ 16х16
MxN
Разделение массива трансформант изображения на НЧ- и ВЧ- составляющие из трансформант
Уолша
До такой разбивки количество информации H тр в трансформанте ДПУ равнялось [58,
59]:
S
тр
Нр = - n2H(y} = - n2 £ P(y(k;i)) ^og2P(y(k;i))
y(k;i)=0
(5)
где 8 тр - мощность трансформанты, равная количеству различных значений компонент;
Нту) - количество информации, приходящееся в среднем на одну компоненту ДПУ.
Поскольку значение, которое принимает низкочастотная составляющая, отличается от значений других трансформант, то, в случае разделения трансформанты, количество информации Н^ в оставшихся компонентах будет равно
Sтр 1
нтр) =-(n2 -1) £ P(y(k;i))iog2P(y(k;i))
т.е.
1
y(k;i)=0
Нтр = нтр) + P(y(l;l)) iog2 P(y(1;1)).
Поскольку P(y(1;1)) =—, то соотношение (7) примет вид
(6) (7)
Hтр = нтр) + -1 iog 2^2 .
n n
Из сравнения выражений (5) и (8) вытекает, что
H > н(в)
тр тр
(8) (9)
Для того чтобы количество информации Н(н), содержащееся в низкочастотной составляющей y (1; 1), удовлетворяло условию
Н(н) < P(y(1;1)) iog 2 P(y(1;1)) , (10)
требуется осуществить дополнительную обработку низкочастотных составляющих. Для этого необходимо учитывать то, что низкочастотные составляющие являются характеристикой средней яркости в фрагменте изображения. При этом данная характеристика локальных фрагментов является относительно однородной для соседних частей кадра
n
изображения. В связи с этим предлагается формировать массивы низкочастотных компонент. На рисунке также представлен механизм извлечения коэффициентов низкочастотных спектральных составляющих из трансформант размерностью 16х16 пикселей в отдельные матрицы размерностью 8х8 пикселей (размерность исходного изображения цветовой модели RGB 128х128 пикселей). При выборе способа обработки низкочастотных компонент необходимо учитывать то, что человеческий глаз воспринимает реалистическое изображение по частоте цветовых границ. Отсюда следует важность низкочастотных коэффициентов трансформанты ДПУ. Следовательно, потеря части низкочастотных коэффициентов может привести к значительной потере информации.
Поэтому предлагается осуществлять сжатие массивов низкочастотных составляющих на основе исключения статистической избыточности путем их арифметического кодирования. Количество информации Н(н), приходящееся на один элемент матрицы низкочастотных составляющих, равно
с(н) (н) Sm
Н(н) = - Z Рн(у(к;¿)) bg2PH(y(k;£)), (11)
у(М)=о
где SM^ - мощность массива низкочастотных компонент, равная количеству различных значений компонент; Рн (у (k; £)) - вероятность появления низкочастотной компоненты со значением y(k; I).
Такая обработка позволяет увеличить коэффициент сжатия на 20%. Сравнительная оценка разработанного и известных методов сжатия изображений представлена в таблице.
Зависимость качества сжатого/восстановленного изображения от типа исходных изображений
Тип изображения (коэффициент корреляции) Сильнонасыщенные (0,7) Средненасыщенные (0,85) Слабонасыщенные (0,95)
Метод сжатия К сж 5 JPEG 1 JPEG-2000 £ разработ. ЕВ о ^ W i EP G JE J EPJ 7,5 6,6 .то б а ра 6,61 62 JPEG 7 JPEG-2000 5 разработ.
Bpp 3,2 1,95 1,94 1,06 1,21 1,21 0,13 0,17 0,15
RMS, % 1,98 1,98 1,97 1,2 1,22 1 ,25 1,68 1,93 1,72
PSNR, дБ 45,1 45 ,1 5,2 7,3 47,3 47,1 5,9 45,3 45,8
3. Выводы
Разработанный метод сжатия, основанный на классификационном кодировании и преобразовании Уолша, обеспечивает:
1) В случае равенства RMS:
- выигрыш по коэффициенту сжатия относительно метода, реализованного в формате JPEG, для сильнонасыщенных изображений в среднем на 38 %;
- по сравнению с методом, реализованным в формате JPEG 2000, выигрыш по степени сжатия для слабонасыщенных изображений составляет в среднем 14 %, а для средне- и сильнонасыщенных изображений степень сжатия отличается незначительно (в среднем не превышает 1%).
2) Потеря качества сжатого/восстановленного изображения не превышает 2% по критерию RMS или не хуже 45 дБ по критерию PSNR, что не ощутимо для человеческого глаза.
3) Разработанный метод компрессии предусматривает только целочисленный тип арифметических операций, что существенно отражается на скорости выполнения алгоритма компрессии и снижении ошибок округления при вычислениях на ЭВМ по сравнению с существующими компрессорами.
4) Выигрыш по времени доведения сжатых изображений на основе разработанного метода относительно известных методов достигает в среднем 2 раза. Данный выигрыш обусловлен тем, что при незначительном отличии в коэффициенте сжатия сильнонасыщенных изображений в сравнении с методом JPEG-2000 для разработанного метода время обработки будет меньше минимум на 34%. При этом с ростом объемов передаваемых изображений и скорости передачи данных по каналу связи выигрыш по времени доведения для разработанного метода будет увеличиваться.
Список литературы: 1. Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифровых сигналов / Под ред. И.Б. Фоменко. М.: Связь, 1980. 248 с. 2. Бондарев В.Н., ТрестерГ., Чернега В.С. Цифровая обработка сигналов: методы и средства. Учебное пособие для вузов. Харьков: Конус, 2001. 398с. 3. ВатолинД., Ратушняк А., СмирновМ., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. М.: ДИАЛОГ - МИФИ, 2003. 384с. 4. Красноруцкий А.А., Яценко С.Я. Метод арифметического классификационного кодирования трансформант Уолша// Открытые информационные и компьютерные интегрированные технологии. Харьков: НАКУ «ХАИ», 2006. Вып. 31. С. 138-141.
Поступила в редколлегию 11.05.2015 Гуржий Павел Николаевич, начальник научно-исследовательского отдела электромагнитной совместимости радиоэлектронных средств Научного центра связи и информатизации. Военный институт телекоммуникаций и информатизации. Научные интересы: обработка и сжатие изображений и видеоданных. Адрес: Украина, Киев, ул. Московская, 45/1, тел. 066469-15-63.