УДК 621.327
В.В. БАРАННИК, А.Н. ДОДУХ
ТЕХНОЛОГИЯ СЖАТИЯ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ДВУХКОМПОНЕНТНОГО КОДИРОВАНИЯ
Излагаются основные этапы разработки информационной технологии сжатия изображений на основе обобщенного кодирования его координатно-структурной и построчно-масштабирующей составляющих, базирующейся на: формировании массивов длин коор-динатно-структурной и построчно-масштабирующей апертурных составляющих; вычислении оснований элементов массивов аппроксимирующих величин апертур и массивов длин апертур, рассматриваемых соответственно как адаптивное позиционное число с неравными соседними элементами и позиционное число в дифференциальном пространстве; построении двухкомпонентного кода.
1. Введение
Для обеспечения комплексной безопасности, развития космической отрасли, телекоммуникаций, связи и информатизации необходимо обеспечить [1 - 3]: мониторинг стратегических объектов; мониторинг и безопасность мероприятий международного значения; мониторинг ликвидации последствий чрезвычайных ситуаций естественного и техногенного характера. Необходимо усовершенствование существующих и внедрение новых форм и способов управления кризисными ситуациями. В первую очередь это касается повышения эффективности информационного обеспечения с использованием дистанционных средств аэрокосмического базирования. При этом основная научно-прикладная проблема, требующая своего решения, заключается в сокращении времени доставки видовых изображений с необходимой разрешающей способностью. В то же время, как показал анализ, существующие возможности бортовой аппаратуры передачи данных не обеспечивают своевременную доставку оцифрованных изображений [4; 5] . Возникает противоречие между требуемыми характеристиками процессов доставки данных, а именно временем обработки, передачи, качеством восстанавливаемых изображений и реальными характеристиками
для существующих комплексов беспилотных авиационных систем. Повышение оперативности доведения информации возможно на основе уменьшения объемов обрабатываемых и передаваемых видеоданных с использованием технологий компрессии. При этом в условиях аэрокосмического мониторинга требуется использовать методы, эффективно кодирующие насыщенные реалистические изображения с контролируемой сложностью технической реализации. В работе [5; 6] показано, что с таких позиций эффективной является технология с применением построения апертурных составляющих изображений. В данном случае видеоданные описываются апертурами, т.е. х%,у+г = И , г=0,1 %-1, где И - аппроксимирующее значение для % -й видеопоследовательности, элементы х%, у+г которой имеют ограниченные динамические диапазоны, 1 % - длина % -го участка с ограниченным динамическим диапазоном.
В то же время существующие технологии, реализующие сжатие на основе предварительного выявления апертур, базируются на раздельной обработке их составляющих. Это является одной из причин снижения уровня сжатия изображений. Поэтому необходимо использовать подход относительно обобщенной компрессии составляющих апертур. Отсюда цель исследований заключается в разработке информационной технологии компактного представления на основе обобщенного представления двух компонент апертурного описания изображений.
2. Обоснование концепции создания информационной технологии
двухкомпонентного кодирования
На организацию процессов обработки для методов компактного представления изображений существенно влияют:
1) характер обработки видеоданных, а именно для какой последующей обработки предназначены сжатые изображения, например, для хранения в информационных системах или/и для передачи между пользователями с использованием телекоммуникационных систем;
2) существующие ограничения на вычислительные возможности и на характеристики по скорости передачи данных в каналах связи для используемых информационно-телекоммуникационных систем.
Основными ключевыми механизмами, определяющими методологию процессов сжатия и восстановления изображений, являются:
1. Виды сокращаемой избыточности. Методология устранения избыточности изображений определяет класс используемых трансформаций и методов кодирования, оказывая, таким образом, влияние на потенциальные возможности относительно степени компактного представления, времени обработки и уровня вносимых искажений. Технология компрессии допускает возможность исключения нескольких видов избыточности. Для предложенного подхода методология сокращения избыточности базируется на формировании для фрагмента изображения двух составляющих, а именно:
- неравномерная координатно-структурная составляющая, которая формирует локально-структурную архитектуру фрагмента изображений. Компонентами такой составляющей являются длины апертур, выявляемых вдоль строк изображения;
- построчно-масштабирующая составляющая, которая определяет яркостную и цветовую насыщенность архитектурной формы фрагмента изображения. Компонентами такой формы являются аппроксимирующие яркостные (цветовые) величины апертур.
2. Наличие предварительного преобразования цветовой модели.
3. Типы и параметры кодеров, используемых для сокращения избыточности. Здесь определяется количество кодовой избыточности, временные затраты на обработку, механизмы сокращения различного количества психовизуальной избыточности.
4. Наличие возможности для дополнительного снижения времени обработки и передачи данных для фиксированного объема компактно представленных видеоданных.
В процессе построения метода кодирования предлагается организовывать следующие подходы, а именно формировать:
- кодовое описание заданной длины;
- двухкомпонентное кодовое представление на базе совместного использования элементов координатно-структурного и построчно-масштабного представления фрагмента
изображения (рис. 1). Это обеспечит обработку целостной информации о фрагменте изображения. В этом случае в отличие от бит-ориентированного принципа добавочная группа разрядов формируется на основе взвешенного добавления компоненты апертурно-ярко-стного описания фрагмента изображения.
Это позволяет:
Первое. Дополнительно повысить степень сжатия за счет сокращения количества незначимых старших разрядов в кодовых комбинациях. Это достигается в результате добавления элементов массивов длин апертур, имеющих меньшие значения динамических диапазонов, в процессе формирования двухкомпонентного кода (ДК).
Бф)^ АБ
Рис. 1. Схема формирования двухкомпонентного кода
С одной стороны, это обусловлено наличием избыточного количества двоичных разрядов в кодовом слове. Действительно, формирования ДК осуществляется на базе элементов массива аппроксимирующих величин апертур. При этом кодограмма будет заполняться не
полностью, т.е. Б^)^1) = ([1ов2Е(Ь)1(Х,у)] + 1)< Бпес. Здесь Е(Ь)[х,у) - значение интегрированного кодового описания для массива аппроксимирующих величин апертур, начиная с элемента на позиции (х; у) и заканчивая элементом на позиции (1; _)); Б(Ь)(х,у) - количество двоичных разрядов на представление величины E(h)1X,7); Бпес - заданное количество двоичных разрядов. Следовательно, в кодовом слове образуется избыточное количество АБ двоичных разрядов, равное АБ = Бпес -Б^)^у), что приводит к снижению коэффициента сжатия. С другой стороны - тем, что для реалистических изображений значения элементов массивов длин апертур в среднем имеют меньший динамический диапазон, чем элементы массивов аппроксимирующих величин. Отсюда избыточное количество разрядов предлагается заполнять за счет дополнительного (добавочного) добавления к интегрированному значению кодового описания, полученного для последовательности аппроксимирующих величин, элементов массива длин апертур.
Второе. Повысить оперативность обработки фрагментов изображений за счет:
1) возможности проводить восстановление фрагмента изображения сразу при реконструкции кодового представления;
2) отсутствия операций обращения к отдельным разрядам кодового слова, как это делается для бит-ориентированного принципа слияния кодов;
3) создания дополнительного механизма для повышения степени сжатия. В случае повышения степени сжатия можно разбивать длины апертур на несколько компонент, введя для этого специальные ограничения, тем самым увеличивая возможность для дополнительного исключения количества незначимых разрядов.
Третье. Снизить вычислительную сложность, необходимую для реализации процессов обработки (т.е. снизить требования к вычислительным системам), а именно: сократить количество обращений к ВЗУ; сократить объем памяти, отводимой для хранения промежу-
точных данных. Например, при раздельном кодировании массивов длин апертур и аппроксимирующих величин требуется полностью хранить восстановленные значения одних компонент апертур до получения других ее компонент.
На основе изложенного материала можно заключить, что для обеспечения дополнительного сокращения кодовой избыточности предлагается организовывать обобщенное формирование кодового описания на основе компонент координатно-структурной и построчно-масштабирующей формы. Двухкомпонентный код сроится в результате слияния кода аппроксимирующих величин апертур и взвешенных элементов длин апертур. Это позволяет: дополнительно повысить степень сжатия видеоданных; сократить время восстановления изображений.
3. Разработка технологии компрессии изображений на основе
двухкомпонентного кодирования
Избыточное количество разрядов, т.е. ДБ > 0, в процессе формирования ДК для элементов массивов аппроксимирующих величин обусловлено такими причинами:
- некратностью величины динамических диапазонов w(h)i -1 элементов массива аппроксимирующих значений степени двойки, т.е. w(h)i - ^(И); /2]2 Ф 0, в случае представления кодового описания машинным словом;
- формированием начального значения ДК для максимального значения логарифма
динамического диапазона величины 1og2(w(h)i -1).
Начальное значение ДК Е(Ь)(1-у) формируется на базе элементов строки массива ДН^ , рассматриваемых как адаптивное одномерное позиционное число с неравными соседними элементами. В общем случае значение Е(Ь)(1-у) определяется по формуле
Еф)) = £ (И;, ф - 8^(1 - - И;, ф )))ЫН - 1ГУ + 1-ф ,
ф = у
где (1; у), (1; _)) - координаты соответственно начального и конечного элементов 1 -й строки, на базе которых формируется ДК.
Отсюда получаем количество у(Ь,1)% элементов 1 -й строки, для которых формируется % -й код, где v(h,i)=)-у + 1. Величина динамического диапазона для элементов строки фиксирована и равна w(h); -1. Количество запрещенных последовательностей, обусловленное равенством соседних элементов, равно ДУ(Ь1,) = ^^^ = (^,тах -Ь^^-\ где (И1,шах - И^шп)"-) - количество последовательностей, элементы которых удовлетворяют ограничениям: ь% ф ь%+ь % = 1,п; ^ть < hl,...,hj,...,hn < ^тах .
С учетом этого количество элементов v(h)% определяется из условия
1og2E(h)l(ijY) < Б^)) ^(Ь,1)% -1) < Бпес,
что позволяет исключить возможность переполнения кодового слова, имеющего заранее заданную длину Бпес. Отсюда величина v(h,1)% равна v(h,1)% = [Бпес /.^2^(Ь)1 -1)].
Строчная обработка массивов аппроксимирующих величин апертур позволяет сократить вычислительные затраты для определения количества v(h,i)% элементов и проводить процесс кодирования за один проход.
В случае наличия избыточных разрядов, т.е. ДБ Ф 0, формирование второй компоненты ДК проводится на базе элементов текущей а -й строки массива ДЬ(т,п длин апертур. Для этого требуется выполнить следующие действия:
1. Определить избыточное количество разрядов ДБ в кодограмме. Для этого используется формула: ДБ = Бпес ^(^1)% -1)]-1.
После этого можно вычислить количество элементов v(1)% для элементов массива ДЬ^ , на базе которых формируется добавочный код ДЕ( 1)фа,у) второй компоненты. Здесь первый и последний элементы массива ДЬт^ , входящие в код ДЕ( 1)фс)у), имеют соответственно позиции (а; у) и (ф;)).
2. Определить количество добавляемых элементов v(1) ^ из условия необходимости исключить возможность переполнения длины ДБ последовательности избыточных разрядов кодового слова, т.е.
[1С82ДБ( 1)^] +1 <ДБ, (1)
где (а;у),(ф;.-) - координаты соответственно начального и конечного элементов второй составляющей на базе массива длин апертур.
Величина добавочного кода ДЕ(^ф"-у) формируется на базе элементов массива длин апертур, которые рассматриваются как одномерное позиционное число в дифференциальном пространстве с различными основаниями. Величина основания ПЧДП = 1 ¡,тах -1 ¡,тт +1 является константой в пределах одной строки. Отсюда выполняется неравенство
ф-1
ДЕ( 1)— < w(1)a-Y+1 п w(1)X w(1)ф . (2)
Х = а+1
В частном случае, если рассматриваются элементы, принадлежащие одной строке, т. е. а = ф, то ДЕ( 1)<—) < w(1)Jа-y+1.
На основе соотношения (2) для выполнения условия (1) требуется обеспечить выполне-
П - +1 Ф-1 п ■
ние следующего неравенства: у+ П w(1)П w(1)ф)] + 1<ДБ . При этом коли-
Х=а+1
чество элементов для второй составляющей ДК определяется по формуле v(1)i.= (п -у +1) + п(ф-а-1) + -.
В случае известного значения ДБ и выбора длин апертур в пределах а -й строки получим упрощенное выражение для вычисления количества v(1) ^ добавочных элементов v(1)^ ^(1,а)^ = [ДБ/ 1og2w(1)a]. Понятно, что поскольку значения оснований элементов ПЧДП в разных строках и величина ДБ являются различными, то количество элементов v(1) ^ второй составляющей будет переменным. В общем случае, если вторая составляющая ДК формируется на базе элементов нескольких строк массива длин апертур, то
а+р
величина v(1)^ будет равна v(1)^= £ v(1,i)^ . Здесь v(1,а)^ - количество элементов в
( ) i=а
а -й строке массива ДЬ(т„ , участвующих в построении второй составляющей; а , а + р -индексы соответственно начальной и конечной строки массива ДЬ(т„П , элементы которых образуют вторую составляющую ДК.
Это приводит к необходимости организовывать рекуррентный отбор элементов первой и второй составляющих для формирования ДК. Схема отбора элементов строк массивов ДН» и ДЬ(т,П для построения двухкомпонентного кода приведена на рис. 2, где рассматривается вариант построения ДК в случае неравномерного вклада по количеству компонент из различных массивов в двухкомпонентный код. Элементы строки массива длин апертур будут участвовать в образовании ДК совместно для различных строк массива аппроксимирующих величин.
ЛН(и) ЛН^+1Д)
- - г \
Рис. 2. Схема формирования двухкомпонентного кода для фрагмента изображения
Рассмотрим основные этапы технологии построения двухкомпонентного кода [6].
Первый этап заключается в формировании координатно-структурной и построчно-масштабных составляющих фрагмента изображении. Для этого осуществляется выявление апертур и построение массивов АН^п аппроксимирующих величин и ДЬт^ длин апертур. Образование массивов Днт,п и ДЬ(т,п проводится в направлении строк, что позволяет выявить дополнительные структурные закономерности и обеспечить потенциальные возможности для устранения избыточности.
Второй этап. Определяются основания элементов массивов ДН^т^ и ДЬт^ , рассматриваемых соответственно как адаптивное позиционное число с неравными соседними элементами и позиционное число в дифференциальном пространстве. Выполняются следующие действия:
1) для формирования системы оснований W(h), '(Ь) = ^'(^1}, 1 = 1,т элементов АПЧ с неравными соседними элементами
= Чтах - Чтт + 1-- 1), h1,max = тах {Ь1,)} + 1; hl,m1n = т1п ;
1<) < п } 1< )< п '-1
2) для системы оснований '(1), '(1) = ^(1);}, 1 = 1,т элементов ПЧДП
w(1)lj = 11,тах -1 ;,т;п + 1 = w(1)l, 11,тах = . + 1; 11,т1п ^М1 ^ .
Третий этап. Организуется оценка количества элементов v(h,i)% и v(1)% двухкомпо-нентных составляющих для построения обобщенного кода. Длина Бпес кодового слова для построения текущего обобщенного кода считается заданной. По условию формирования ДК выбор первой составляющей на основе построения кода проводится для элементов одной строки массива Днт,п . Отсюда v(h,i)% = [Бпес /-1)]. Вторая составляющая формируется на основе кодового описания элементов массива ДЬт^ , расположенных в общем случае на разных строках. Поэтому величина v(1) % определяется в несколько этапов. Суммарное количество элементов второй составляющей равно
а+р
v(1)%= £v(1,l)%,
1=а
где v(1,i)%= т1п{п;; [ДВ;-1/([-^^(1);] +1)]}; п; - количество свободных элементов в ;-й строке массива длин апертур.
В итоге получаем количество v(h,i)% элементов массива аппроксимирующих величин апертур и количество v(1)% элементов массивов длин апертур, участвующих в образовании двухкомпонентного кода.
Четвертый этап. Осуществляется построение ДК. Первая кодовая составляющая
е(ь)(1;^(ь ;)%-1, формируемая на основе v(h,i)% элементов строки массива аппроксимирующих величин,будет равна
Е(Ь)(;^(Ь,;)%-1 = £ (Ь;,) -8Щп(1 - s1gn(hl,j-l -hl,j)))(w(h)l-1)V(,l)% У- -\ (3) .=У
Структура ДК на основе первой компоненты задается таким выражением:
Е(Ь; 1) %= Е(Ь)(;;+) -1 П w(1) ^,Ф)% +ДЕ( 1)^ , где У(1)аа&=П w(1)ф(1,Ф)%
' ф=а ф=а
- весовой коэффициент первой компоненты Е^)^^ ;)%-1 двухкомпонентного кода.
Схемотехническая структура кодирующего устройства для получения значения кода первой составляющей приведена на рис. 3.
Рис. 3. Схемотехническая реализация кодера В блоке сравнения определяется максимальное значение из двух: предыдущего и текущего элементов массива аппроксимирующих величин апертур, после чего текущий элемент записывается в регистр предыдущего элемента для проведения сравнения с очередным элементом. Результат сравнения поступает на блок формирования величины
И;, j. Блок формирования И;, j (рис. 4) реализует и^ = -sign(1 - sign(hi,j_1 -.
Рис. 4. Схемотехническая реализация формирования величины и^
В блоке умножения осуществляется вычисление произведения Иу У(Ь)[у). При
этом
величина У(Ь)(у) поступает с блока формирования весового коэффициента. Блок пересчета кода выполняет функцию рекуррентного вычисления соотношения, заданного формулой
(3). Для этого на вход данного блока поступают значение произведения и^ У(Ь)(|,у) (с
блока умножения) и значение предыдущего кода-номера. В блоке сравнения осуществляется проверка условия на обработку последнего допустимого элемента массива аппроксимирующих величин апертур при формировании текущего кода. Если обработан последний элемент массива, то текущее значение кода является начальным значением двухкомпо-нентного кода, и происходит переход на обработку элементов массива длин апертур.
Пятый этап. Вычисление второй кодовой составляющей АБ( 1)0+р)х при условии рассмотрения массива длин апертур как позиционного числа в дифференциальном пространстве с учетом распределения элементов по строкам осуществляется следующим образом:
АЕ( = 1(1 а, _ 1 а,т;п^(1) Г "п^)^ w(1) ^р^ + Т £ (1 у _ 1 ,тт) X
j=Y %=а+1 ;=а+^=1
X w(1)n_jаí^_1w(1)^ w(1):(+ра+^ + £ (1 а+р0 _ 1 а+р,ттМ1)Г+р х=;+1 j=l
Значение дополнительного кода АЕ(1 )0+р)х в случае его рекуррентного вычисления разделяется на три составляющих, а именно: АЕ(1)0ХПУ) - долевой код для допустимых
элементов а -й строки массива длин апертур; ДЕ( 1)аа+1-11)п - долевой код для элементов полных строк, начиная с (а +1) -й строки и заканчивая (а + р -1) -й строкой; ДЕ( 1)а++вТ1) -
долевой код на основе допустимых элементов (а + Р) -й строки.
Значит, на основе полученных выражений осуществляется формирование двухкомпо-нентного кода на базе неравнозначного вклада элементов массива аппроксимирующих величин апертур и элементов массива длин апертур.
Для сокращения временных затрат на сжатие изображения предлагается совмещать во времени некоторые уровни обработки, т.е. организовывать конвейерную обработку. При этом особенностями данного метода является то, что для некоторых уровней переход на очередной уровень начнется только после завершения предыдущего. Такая ситуация возникает на этапе вычисления двухкомпонентного кода, когда его формирование начинается только после того, как получены все строки массива аппроксимирующих величин и массива длин апертур, т. е. реализуется иерархический вид обработки (это необходимо для проведения преобразования динамических диапазонов массивов, которое начинается после образования всего массива). Значит, учитывая особенности разработанного метода сжатия и необходимость снижения времени компрессии предлагаем организовывать иерархически - конвейерный порядок выполнения кодирующих действий. Для разработанного метода иерархически - конвейерная организация сжатия заключается в том, что ДЬ(т)п образовываются одновременно с формированием массивов ДЬ(т)п (конвейерная обработка). Это облегчается тем, что данные массивы имеют одинаковые размеры. Переход на этап формирования начального значения ДК осуществляется после завершения формирования массивов ДъЩп и Лнт,п (иерархическая обработка). Начальные значения ДК вычисляются одновременно на базе нескольких совокупностей элементов массива аппроксимирующих величин апертур. По мере получения начальных значений ДК осуществляется проверка условия на возможность и вычисление добавочного значения второй кодовой компоненты на основе элементов массива длин апертур. Процесс вычисления второй составляющей ДК проводится одновременно с вычислением остальных начальных значений единого кода (конвейерная обработка).
4. Выводы
1. Разработана информационная технология сжатия изображений на основе обобщенного кодирования его координатно-структурной и построчно-масштабирующей составляющих, базирующаяся на следующих составляющих:
- формировании массивов аппроксимирующих величин и массивов длин координатно-структурной и построчно-масштабирующей апертурных составляющих фрагмента изображения;
- вычислении оснований элементов массивов аппроксимирующих величин апертур и массивов длин апертур, рассматриваемых соответственно как адаптивное позиционное число с неравными соседними элементами и позиционное число в дифференциальном пространстве;
- нахождении позиций и количества элементов для массивов аппроксимирующих величин апертур и массивов длин апертур, участвующих в построении двухкомпонентных составляющих кода;
- построении двухкомпонентного кода на основе первой кодовой составляющей, формируемой на основе элементов строки массива аппроксимирующих величин;
- вычислении второй кодовой составляющей с учетом рассмотрения массива длин апертур как позиционного числа в дифференциальном пространстве.
2. Сжатие изображений достигается за счет:
1) исключения статистической избыточности, обусловленной учетом корреляционных зависимостей между элементами локальных областей в результате построения неравномерной координатно-структурной составляющей фрагмента изображения;
2) снижения психовизуальной избыточности путем аппроксимации последовательности элементов в составе апертуры одной усредненной величиной. Количество снижаемой психовизуальной избыточности регулируется в результате выбора высоты апертуры;
3) сокращения структурной избыточности, обусловленной: выявлением длин когерентных областей; выявлением структурно-комбинаторных закономерностей в координатно-структурной и построчно-масштабирующих формах фрагмента изображения.
Список литературы: 1. Лабутина И.А. Дешифрование аэрокосмических снимков: Учебное пособие. М: Аспект-Пресс, 2004. 184 с. 2. Кашкин В.Б. Цифровая обработка аэрокосмических изображений: Конспект лекций. Красноярск : ИПК СФУ, 2008. 121 с. 3. Баранник В.В. Методологический анализ системы аэрокосмического видеомониторинга чрезвычайных ситуаций / В.В. Баранник, А.В. Яковен-ко, А.Ю. Школьник // Сучасна спещальна техшка, К.: .№4(27). 2011. С. 12 - 22. 4. СэломонД. Сжатие данных, изображений и звука / Д. Сэломон. М: Техносфера, 2004. 368 с. 5. Баранник В.В. Структурно-комбинаторное представление данных в АСУ / В.В. Баранник, Ю.В. Стасев, Н. А. Королева. Х.: ХУПС, 2009. 252 с. 6. Баранник В.В. Информационная модель построчно-масштабирующих составляющих фрагмента изображения / В.В. Баранник, А.Ю. Школьник, Н.А. Королева // Системи обробки шфор-маци. Х.: ХУПС. 2011. Вип. 4. С. 55 - 59.
Поступила в редколлегию 14.10.2011 Баранник Владимир Викторович, д-р техн. наук, профессор, ведущий научный сотрудник научного центра Харьковского университета Воздушных Сил им. Ивана Кожедуба. Научные интересы: системы, технологии преобразования, кодирования, защиты и передачи информации, семантической обработки изображений. Адрес: Украина, 61023, Харьков, ул. Сумская, 77/79, тел. 8 050-3038971.
Додух Александр Николаевич, инженер Харьковского университета Воздушных Сил имени Ивана Кожедуба. Научные интересы: системы, технологии преобразования, кодирования, защиты и передачи информации, семантической обработки изображений. Адрес: Украина, 61023, Харьков, ул. Сумская, 77/79.