УДК629.391
КОДИРОВАНИЕ ЗНАЧИМЫХ КОМПОНЕНТ ТРАНСФОРМАНТ
БАРАННИК В.В., КРИВОНОС В.Н., ХАХАНОВА А.В.
Осуществляется выбор дальнейшего развития технологий компрессии трансформированных изображений в области компонентного представления. Обосновывается модель описания значимых компонент трансформанты на основе позиционных чисел с неравными соседними элементами. Излагаются этапы позиционного кодирования для сокращения объема на представление значимых компонент трансформанты. Для этого формируется система кодирующих выражений для сжатия без потери достоверности и целостности видеоинформационных ресурсов.
32
1. Введение
Постановка проблемы и анализ литературы. Особенности развития современного общества таковы, что зависят от возросшего потребления видеоинформа-ционных ресурсов. Это диктует необходимость обеспечивать соответствующие требования по достоверности, доступности и целостности видеоинформации. Одной из ключевых позиций на пути реализации таких требований является кодирование источников видеоинформации [1 - 3]. Это обуславливает актуальность тематики научно-прикладных исследований, проводимых в области компрессии цифровых изображений. Анализ систем сжатия показывает, что наибольшая эффективность обработки обеспечивается для предварительно трансформированных изображений [3 — 5]. Однако устранение избыточности в
РИ, 2012, №2
трансформантах проводится в основном путем учета психовизуальных и статистических закономерностей. В результате этого получается ограниченный уровень компрессии и резкое падение достоверности получаемой при декодировании видеоинформации. Отсюда цель исследований - разработка метода кодирования трансформант сегментированных изображений, обеспечивающего повышение доступности и целостности видеоинформации для заданного уровня достоверности.
2. Описание значимых компонент трансформант позиционными числами
В настоящее время для кодирования трансформант в JPEG ориентированных технологиях используются два базовых подхода, различающихся структурным подходом относительно рассмотрения трансформанты [4]. Первый подход базируется на обработке компонентной структуры трансформанты. Второй - осуществляет кодирование для битовой структуры трансформанты.
Из двух стратегий кодирования наименьшее время обработки затрачивается для компонентной структуры трансформанты. Это объясняется следующими причинами:
- битовая структура трансформанты строится на основе бинаризации ее компонент. В этом случае для каждой компоненты формируется двоичное представление длиной d бит. В итоге вместо обработки n х m компонент необходимо обработать d битовых плоскостей размером n х m каждая (n х m - размер трансформанты). Количество обрабатываемых данных для битового представления трансформанты увеличивается в d раз;
- требуется затратить дополнительное количество операций собственно на саму бинаризацию каждой компоненты трансформанты;
- обработка для компонентной структуры может реализовываться с использов анием кодовых таблиц Хаффмана. Это требует меньшего количества операций по сравнению с арифметическим кодированием.
Отсюда компонентная обработка обладает возможностями обеспечить выполнение условия
qc + qr < argument(t(qc + qr)), где t(qc + qr) < qp / t.
Отличительной особенностью процесса устранения избыточности в компонентной структуре трансформанты является учет:
- концентрации основной энергии исходного сигнала в низкочастотных компонентах, и наоборот, информация о мелких деталях формируется в высокочастотных компонентах трансформанты дискретного косинусного преобразования, значения которых зачастую близки к нулевому;
- наличия компонент трансформанты с нулевыми значениями.
Это позволяет организовывать обработку на основе устранения статистической и структурной избыточности. Для такого варианта трансформанта из двумерной растягивается по диагональному зигзагу в одномерную структуру. После этого формируется совокупность пар {ya, 1 а }, где уа , 1 а - соответственно значение а -й значимой компоненты развернутой трансформанты и количество компонент, имеющих
одинаковое значение. В результате n2 компонент трансформанты заменяются m пар амии {уа, 1 а }, т.е.
a=1,m. При выявлении значимых компонент трансформант создается возможность для устранения структурной избыточности.
Для трансформант в рамках их описания на основе структурного подхода последовательности Ym значимых компонент присущи следующие закономерности:
1. Две соседние компоненты у ; и У;+1 (где | = 1,m) имеют различные значения, т.е.
У; * У;+1, |= 1m. (1)
2. Если исключить из вектора Ym низкочастотную компоненту, т. е. у1 , то для полученного вектора Ym-1, значения значимых компонент будут находиться в ограниченном динамическом диапазоне, т. е.
У min < y2,-,yj,-,ym < У max . (2)
Здесь разница между верхним уровнем ymax и нижним уровнем ymin диапазона величин yj на интервале 2 < j < m будет меньше, чем динамический диапазон для вектора Ym .
Для учета закономерностей, задаваемых соотношениями (1) и (2), предлагается подход, заключающийся в рассмотрении значений значимых компонент yj, имеющих следующий динамический диапазон:
- для второй компоненты вектора Ym -1 он будет равен w(y)2 = ymax -ymin +1, так как y2 є[° ymax -Уіпіп] ;
- для всех остальных компонент вектора Ym -1 согласно условию (1) он определяется как w(y)j = У max - ymin , т.е. уменьшается на единицу, где j=3,m. Это обусловлено тем, что возможные значения компонент yj для j=3,m будут исключать одно из них, которое соответствует предыдущей компоненте, и У 2 є [0; У max - ymin - 1] .
Значит, на основе предложенных преобразований для трансформанты формируется вектор Ym значимых компонент, значения которых удовлетворяют следующим условиям:
y2 <w(y)2 = ymax -ymin +1; yj < w(y)j = ymax -ymin ,
РИ, 2012, № 2
j=3,m. (3) 33
В этом случае для вектора Ym_ можно сформулировать следующую интерпретацию.
Вектор Ym _i, для компонент которого выполняются условия (3), так, что в общем случае w(y)j фw(y)v , jфу и j,v=2,m, называется позиционным числом с неравными соседними элементами
(ПЧНСЭ) и системой оснований W(y)={w(y)j}.
Для такого подхода относительно представления последовательности значимых компонент оценка информативности сводится к определению количества допустимых ПЧНСЭ. В общем случае для позиционной системы со смешанными основаниями количество
m
допустимых чисел равно Пw(y)j . Следовательно, с
j = 2
учетом соотношений для величин оснований w(y)j получим следующее выражение для определения количества V^ допустимых ПЧНСЭ:
Vmy) = П w(y)j = (У max _ У min +l)(w(y)j)m _ 2 j = 2
Данное выражение учитывает: неизменность оснований для элементов вектора Ym_1; неравенство соседних компонент вектора Ym _1.
3. Позиционное кодирование значимых компонент трансформант в условиях неравенства соседних элементов
По определению позиционное число с неравными соседними элементами образуется на основе вектора значимых компонент трансформанты.
Формирование кодового описания предлагается осуществлять на базе построения кодовых конструкций для позиционных чисел. Вывод выражения для кодирования ПЧНСЭ осуществляется в два этапа:
1) первый этап заключается в определении кода вектора с учетом ограниченности динамического диапазона трансформанты (исключая низкочастотную компоненту);
2) на втором этапе выводятся выражения для получения кода позиционного числа с учетом ограничения на равенство соседних компонент вектора Ym _1.
Поскольку динамический диапазон для элементов вектора Ym_1 равен w(y), то
V(y)j = w(y)m _ j_1.
В результате этого значение позиционного кода E( y) u будет равно
E(y)u = Zyjw(y)m j . (4)
Выражение (4) позволяет вычислить значение кода для вектора значимых компонент трансформанты без учета условия неравенства между ними. Данное условие, а именно то, что yj ф yj+i, j = 2, n, учитывается на втором этапе построения кодового правила. Соотношение для вычисления кода вектора значимых компонент, рассматриваемого как позиционное число с неравными соседними элементами, будет иметь следующий вид:
m
E(y)u = EAv(y)j j = 2
Здесь AV(y)j определяется как количество допустимых последовательностей, предшествующих вектору AY(m _ j). Величина AV(y)j вычисляется по следующей формуле:
AV(y)j
yj(w(y) _ 1)(m j 1) _ AV(y'j = yj_i),
. ^yj_i<yj;
yj(w(y) _ 1)(m _ j_1), (5)
^ yj_i> yj,
где yj(w(y) _ 1)(m j 1) - суммарное количество последовательностей (длиной равной ^j), для всех эле-
ментов которых, кроме j -го, выполняются ограничения на динамический диапазон и на неравенство соседних элементов; AV(yj = yj_i) определяет количество запрещенных последовательностей, составленных из ^ j элементов, предшествующих кодируемой последовательности AY(m _ j).
Введем вспомогательную величину Mj, равную
М j =
yj, ^ yj < yj_i;
yj_1, ^ yj > yj_i-
(6)
Рассмотрим первый этап процесса кодирования позиционного числа с НСЭ. Кодирование позиционных
чисел как вектора Ym _1 значимых компонент трансформанты задается следующим выражением:
m
E(y)u = Z yjV(y)j j= 2
В результате этого соотношение для кода E( y) u вектора значимых компонент трансформанты примет вид
E(y)u = ZMj(w(y) _1)(m_ j_1) . (7)
При кодировании значимых компонент для второй компоненты должно выполняться два условия:
где V(y)j - весовой коэффициент j -го элемента позиционного числа; yj - j -я компонента вектора Ym_1.
- на значения компонент, предшествующих элементу y2 , не накладываются ограничения относительно нулевого элемента, т.е. не должно выполняться неравенство yj_1 <yj;
34
РИ, 2012, № 2
- обеспечиваться выполнение неравенства
УО = w(y) >У2 •
Поэтому для компоненты У2 в качестве предшествующей уО выбирается значение w(y), равное динамическому диапазону вектора Ym-1, т.е.
У О = w(y) • (8)
Таким образом, соотношения (6) - (8) позволяют определить кодовое значение для вектора значимых компонент трансформанты (исключая низкочастотную компоненту), представляющего собой позиционное число с неравными соседними элементами.
В этом случае в результате исключения последовательностей, содержащих равные соседние компоненты, достигается устранение структурной избыточности без внесения искажений. При этом устранение избыточности обеспечивается даже в тех случаях, когда динамический диапазон высокочастотных компонент трансформанты стремится к динамическому диапазону низкочастотной компоненты, т.е. yj ^ Уі.
Рассмотрим свойства позиционного представления значимых компонент трансформанты.
Верхней границей кода E(y)u для вектора значимых компонент трансформанты является величина AV(Y)u , равная накопленному произведению (w(y) - 1)(m-1) оснований элементов позиционного числа с неравными соседними элементами, т. е.
E(y)u < AV(Y)u = (w(y) - 1)(m-1),
где (w(y) - 1)(m-1) - количество позиционных чисел
с неравными соседними элементами, имеющими следующие параметры: динамический диапазон равен
w(y), длина числа равна (m -1).
Соответственно количество разрядов 1og2E(y)u, отводимое на представление E(y)u , будет ограничено сверху величиной D(y)u :
1og2E(y)u < D(y)u = (m - 1)1og2 (w(y) -1). (9)
Соотношение (9) обеспечивает определение верхней границы затрат количества двоичных разрядов на представление кода для вектора значимых компонент
трансформанты, имеющего параметры w(y) и (m -1).
4. Заключение
1. Обоснован подход для построения технологии компрессии изображений с использованием предварительного трансформирования, базирующийся на:
1) формировании двух составляющих трансформанты, а именно: вектора значимых компонент и вектора масштабирующих составляющих. Это позволяет:
- адаптироваться к структуре трансформанты, учиты -вая различную концентрацию высокочастотных компонент в сегменте изображения и различный уровень фактора квантизации;
РИ, 2О12, № 2
- выявлять дополнительные структурные закономерности в трансформантах сегментированного изображения.
2) описании вектора значимых компонент трансформанты в виде элементов позиционных чисел с неравными соседними элементами. Это позволяет адаптироваться к свойствам линеаризированных трансформант за счет учета: неравенства значений соседних компонент; ограниченности динамического диапазона компонент трансформанты.
2. Сжатие фрагментов изображений достигается в результате:
1) исключения статистической избыточности, обусловленной учетом интегрированных корреляционных зависимостей;
2) снижения психовизуальной избыточности за счет проведения нелинейной квантизации трансформанты;
3) сокращения структурной избыточности, обусловленной:
- выявлением масштабирующих составляющих трансформанты;
- выявлением закономерностей для вектора значимых компонент, а именно: исключения избыточного количества позиционных чисел, которые содержат равные соседние элементы; учета ограниченности и неравномерности динамических диапазонов элементов массивов длин апертур.
Литература: 1. Олифер В.Г. Компьютерные сети. Принципы, технологии, протоколы: Учебник для вузов / В.Г. Олифер, Н. А. Олифер. СПб.: Питер, 2ОО6. 958 с. 2. Gonzales R.C. Digital image processing / R.C. Gonzales, R.E. Woods. Prentice Inc. Upper Saddle River, New Jersey. 2ОО2. 779 p.
3. Баранник В.В. Кодирование трансформированных изображений в инфокоммуникационных системах / В.В. Баранник, В.П. Поляков. Х.: ХУПС, 2О1О. 212 с. 4. Баранник В.В. Метод сжатия изображений на основе неравновесного позиционного кодирования битовых плоскостей / В.В. Баранник, Н.К. Гулак, Н.А.Королева //Радіоелектронні і комп’ютерні системи. Х.: ХНАУ “ ХАІ”, 2ОО9. Вип. 1. С. 55- 61. 5. Баранник В.В. Информационная модель построчно-масштабирующих составляющих фрагмента изображения / В.В. Баранник, А.Ю. Школьник, Н.А. Королева // Системи обробки інформації. Х.: ХУПС. 2О11. Вип. 4. С. 55 - 59.
Поступила в редколлегию О6.О4.2О12
Рецензент: д-р техн. наук, проф. Безрук В.М.
Баранник Владимир Викторович, д-р техн. наук, профессор, ведущий научный сотрудник научного центра Харьковского университета Воздушных Сил им. Ивана Кожедуба. Научные интересы: системы, технологии преобразования, кодирования, защиты и передачи информации, семантической обработки изображений. Адрес: Украина, 61О23, Харьков, ул. Сумская, 77/79, тел. О5О-3О38971.
Кривонос Владимир Николаевич инженер Харьковского университета Воздушных Сил. Научные интересы: системы, технологии преобразования, кодирования, защиты и передачи информации.
Хаханова Анна Владимировна, канд. техн. наук, ст. пре-под. кафедры АПВТ ХНУРЭ. Научные интересы: системы, технологии преобразования, кодирования, передачи информации. Адрес: Украина, 61166, Харьков, пр. Ленина, 14.
35