Научная статья на тему 'Цветовые модели в системах сжатия видеоданных'

Цветовые модели в системах сжатия видеоданных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
307
52
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Стрюк Алексей Юрьевич, Бохан Константин Александрович

Оценивается влияние цветовых моделей на информационные характеристики видеоданных в контексте выбора оптимальной цветовой модели для методов их сжатия.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Стрюк Алексей Юрьевич, Бохан Константин Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Color models in systems of compression videodata

Color models of representation videodata considered. On the basis of experimental data the analysis of color models from the point of view of their use in systems of compression videodata.

Текст научной работы на тему «Цветовые модели в системах сжатия видеоданных»

ТЕЛ

Е

КОММУНИКАЦИИ

УДК 681.3.01

ЦВЕТОВЫЕ МОДЕЛИ В СИСТЕМАХ СЖАТИЯ ВИДЕОДАННЫХ

кодировки цветов указывается соответствующее 24-битное значение цветовой модели RGB.

С целью обеспечить решение ряда прикладных задач цветовая модель RGB может быть преобразована в иную цветовую модель. Прямое и обратное преобразование выполняется следующим образом.

Прямое преобразование:

Y(i,j) cll c12 c13 R(i,j)

X(i,j) = c21 c22 c23 X G(i,j)

Z(i,j) c31 c32 c33 B(i,j)

(1)

СТРЮКА.Ю., БОХАНК.А.

Обратное преобразование:

Оценивается влияние цветовых моделей на информационные характеристики видеоданных в контексте выбора оптимальной цветовой модели для методов их сжатия.

Резкое увеличение объёмов информации, передаваемой по линиям связи, необходимость хранения больших массивов данных, а также развитие цифровой техники (цифровые фотоаппараты, видеокамеры, студии цифрового монтажа и т.п.) требуют использования новых, более эффективных методов сжатия данных, особенно для оцифрованной аудиовизуальной информации. Эффективным и вместе с тем простым способом повышения степени сжатия, обеспечиваемой алгоритмами сжатия видеоданных, является подбор оптимальной цветовой модели, в которой представлены видеоданные [1, 5].

В растровых системах обработки видеоданных изображения представляются в виде матрицы целых чисел, значения которых описывают составляющие изображение точки в определённой цветовой модели — средстве формализованного представления цветов. Наиболее очевидным является применение в системах обработки видеоданных цветовой модели RGB (red, green, blue — красный, зелёный, синий). Данная модель базируется на основных принципах восприятия человеческим глазом и мозгом цветов в результате деления световых волн на красный, зелёный и синий цвета. С учётом того, что индикаторные устройства (дисплеи) цветного изображения формируют видимое изображение с использованием красных, зелёных и синих элементов с различным уровнем свечения, цветовая модель RGB позволяет обойтись без дополнительной перекодировки при выдаче цифрового представления изображения на отображение.

В полном виде значения цветовой модели RGB представляются 24-битными целыми числами, по 8 бит на каждую составляющую цвета (диапазон возможных значений от 0 до 255). В ряде случаев, для уменьшения объёма цифрового представления изображения, в системах обработки видеоданных используются “индексированные” или “табличные” цвета. При “индексированном” цвете каждому из n битных (обычно 8 или 16-битных) значений параметра визуализации в установленной для данного программно — аппаратного комплекса таблице

R'(i,j) cn c12 ct3 Y(i, j)

G'(i, j) = c21 c22 c23 X X(i,j)

B'(i,j) c31 c32 c33 Z(i,j)

(2)

Здесь R, G, B — матрицы значений цветовых координат точек изображения в цветовой модели RGB; Y, X, Z — матрицы значений цветовых координат точек изображения в новой цветовой модели; С — матрица прямого преобразования; С-1

— матрица обратного преобразования.

Анализ выражений (1) и (2) показывает, что в качестве матрицы цветового преобразования может быть использована любая матрица, имеющая обратную. На практике распространены цветовые модели, обеспечивающие решение следующих задач [1, 2]:

— обеспечение интуитивного выбора цветов компьютерными дизайнерами и художниками—цветовая модель HSB (hue, saturation, brightness — тон, насыщенность, яркость) и её разновидности HSV, HSL;

— точное установление цветов при изготовлении печатной продукции с компьютерных оригиналов

— цветовые модели CIE (Commission Internationale de l’Eclairage), Lab Color;

—приведение цифрового представления изображения к виду, обеспечивающему уменьшение объёма данных, необходимых для хранения и передачи изображения—цветовые модели YIQ, YUV, YDrDb, YCbCr.

Цветовые модели YIQ, YUV, YDrDb разработаны на этапе стандартизации систем аналогового цветного телевидения. При этом цветовая модель YIQ используется в системе телевидения NTSC, YUV — в системе PAL, YDrDb — в системе SECAM. Данные цветовые модели обеспечивают уменьшение полосы пропускания, необходимой для передачи телевизионного сигнала. Уменьшение полосы пропускания достигается путем концентрации большей части энергии сигнала в компоненте Y, передаваемой в максимально возможной полосе частот, и ограничением полосы частот цветоразностных компонент I, Q, U, V, Dr, Db (табл. 1). В монохромных системах в качестве информационного сигнала используется только компонента Y [ 1].

РИ, 2002, № 1

23

С развитием цифровых систем обработки и отображения видеоданных к унаследованным от аналоговых систем цветовым моделям были добавлены некоторые новые. Например, цветовая модель YCrCb, принятая в стандарте сжатия видеоданных JPEG. Значения матриц прямого и обратного преобразования, а также граничные значения компонент преобразованного сигнала для перечисленных цветовых моделей приведены в табл. 2 [1, 3].

Таблица 1

Система телевидения Компоненты сигнала Граничная частота сигналов яркости/цветности (МГц)

Монохромное Y 6

NTSC Y / I / Q 4,2 / 1,5 / 0,6

PAL Y / U / V 5,0 / 1,5 / 1,5

SECAM Y / Dr / Db 6,0 / 1,5 / 1,5

Как видно из табл. 2, цветоразностные компоненты во всех цветовых моделях могут принимать как положительные, так и отрицательные значения (потребуется один бит для представления знака). Динамический диапазон (общее число возможных значений) цветоразностных компонент I, Q, V, Dr, Db больше 255 (потребуется увеличить разрядность двоичных слов, используемых для описания компонент). Следовательно, применение выражения (1) для преобразования цветовых координат приведёт к увеличению объёма видеоданных. Для сохранения их разрядности предлагается рассчитывать значения цветоразностных компонент следующим образом:

int(X(i, j) +128), если -128 < int(X(i, j)) < 127 ;

X'(i,j) = ]

255,

0,

если int(X(i, j)) > 127 ; (3)

если int(X(i, j)) < 128,

где X — матрица значений цветоразностной компоненты, определённых с использованием выражения (1); X’ — матрица значений, ограниченных диапазоном [0, 255]; int(x) — любая из возможных операций приведения к целому виду.

Если прямое преобразование выполняется в соответствии с выражением (3), то обратное преобразование примет вид:

K(i, j) = c-jY(i,j) + c“2(X(i, j) -128) + с"] (Z(i,j) -128),

int(K(i, j)), если 0 < K(i, j) < 255 ;

K'(i,j) H

255,

если K(i, j) > 255;

0, если K(i,j) < 0.

(4)

Здесь Y, X, Z — матрицы значений точек изображения в одной из цветоразностных систем цветовых координат; K — матрица значений одной из компонент цветовой модели RGB; К’ — матрица значений, ограниченных диапазоном [0...255].

Для оценки влияния смены цветовых координат на эффективность алгоритмов сжатия видеоданных был выполнен следующий эксперимент. Для тестового набора из 500 фотореалистичных изображений с высокой степенью детализации (вероятность цветового перепада 0,7 — 1) определялось среднее значение энтропии компонент цветовых моделей и среднее значение среднеквадратичного отклонения изображения, подвергнутого прямому и обратному преобразованию от исходного изображения. Энтропия цветовых компонент определялась для источника с равновероятными и взаимонезависимыми отсчетами:

Таблица 2

М п атрица прямого реобразования Матрица обратного преобразования max min

R G B Y I Q

Y 0,299 0,587 0,114 1 0,956 0,621 255 0

I 0,596 -0,274 -0,322 1 -0,272 -0,647 151,98 -151,98

Q 0,211 -0,523 0,312 1 -1,106 1,703 133,37 -133,37

R G B Y U V

Y 0,299 0,587 0,114 1 -0,048 1,138 255 0

U -0,147 -0,289 0,437 1 -0,37 -0,579 111,44 -111,44

V 0,615 -0,515 -0,09 1 2,028 0 156,83 -154,49

R G B Y Dr Db

Y 0,299 0,587 0,114 1 0 0,526 255 0

Dr -0,449 -0,881 1,329 1 -0,1295 -0,2681 338.9 -339,15

Db 1,332 -1,115 -0,217 1 0,667 0 339,15 -339,15

R G B Y Cb Cr

Y 0,299 0,587 0,114 1 0 1,402 255 0

сг 0,5 -0,4187 -0,0813 1 1,772 0 127,5 -127.5

Cb -0,1687 -0,3313 0,5 1 -0,3441 -0,7141 127,5 -127.5

24

РИ, 2002, № 1

255

H = -£ p(xi)log2 p(xi), бит / отсчёт, (5)

i=1

где p(xi) — частота появления значения цветовой компоненты, равного Xj.

Безусловно, определяемые с помощью выражения (5) значения энтропии являются завышенными

[1-3].

В фотореалистичных изображениях существует ярко выраженная взаимосвязь между соседними значениями. Поэтому полученные в результате эксперимента значения энтропии могут быть использованы только для сравнительной оценки исследуемых цветовых моделей.

Среднеквадратическое отклонение восстановленного после цветового преобразования изображения от исходного имеет вид

(

ст =

— it £ (R(i, j) - R(ij))2 + (G(i, j) - G(i, j))2

n x — i=ij=iv

(B(i,j) - B(i,j)f

Здесь R, G, B — матрицы цветовых компонент изображения; R, G, B — матрицы цветовых компонент восстановленного изображения; n, m — размерности изображения.

Таблица 3

Цветовая Энтропия компонет, Среднеквадра-

модель бит/символ тическое

(стандартное отклонение

отклонение результатов (стандартное

эксперимента) отклонение

результатов

эксперимента)

RGB 6,99/6,85/6,74 0

(0,33/0,31/0,32) (0)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

YIQ 6,89/4,89/3,4 1,322

(0,32/0,3/0,27) (0.09)

YUV 6,89/4,25/4,66 1,755335

(0,32/0,26/0,29) (0,2)

YDrDb 6,89/3,4/5,83 12,73923

(0,32/0,22/0,24) (2,15)

YCrCb 6,89/4,37/4,45 1,262217

(0,32/0,25/0,26) (0,08)

Возникновение ошибки обусловлено округлением и ограничением диапазона значений цветовых координат в выражениях (3), (4). Результаты эксперимента приведены в табл. 3.

Анализ табл. 3 позволяет сделать следующий вывод. Лучшими цветовыми моделями для представления видеоданных в алгоритмах их сжатия являются цветовые модели YIQ и YCrCb, которые обеспечивают наименьшие значения энтропии компонент сигнала и вносят наименьшие искажения в видеоданные. Небольшая разница в показателях энтропии и среднеквадратичного отклонения для данных двух цветовых моделей вполне может быть объяснена погрешностью эксперимента. При необходимости выбора между цветовыми моделями YIQ и УСгСь во внимание могут быть приняты следующие соображения. Для сопряжения системы обработки видеоданных с видеооборудованием, способным работать в стандарте PAL, предпочтительней цветовая модель YIQ. Для цифровых систем и алгоритмов предпочтительней цветовая модель YCrCb, имеющая более простую (с нулевыми элементами) матрицу обратного преобразования.

Достаточно перспективной представляется разработка новых цветовых моделей, обеспечивающих по сравнению с существующими ещё более низкие значения энтропии компонент и вносящих меньшие искажения в обрабатываемые видеоданные.

Литература: 1. Цифровая обработка телевизионных и компьютерных изображений / Под ред. Ю.Б. Зубарева и В.П. Дворковича. М.: МЦНТИ, 1997. 212 с. 2. Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. 736 с. 3. Кенца Т. Форматы файлов Internet. СПб.: Питер, 1997. 320 с. 4. БондаревВ.Н., ТрестерГ., Чернега В.С. Цифровая обработка сигналов: методы и средства. Севастополь: Изд. СевГТУ, 1999. 398 с. 5. Ватолин Д. С. Алгоритмы сжатия изображений. Лаборатория компьютерной графики МГУ: http: // graphics. cs.msu.su / library / our publications / fractal / index.htm. 6. Гринберг АД, Гринберг С. Цифровые изображения. Мн.: Поур-ри, 1997. 400 с.

Поступила в редколлегию 22.06.2001

Рецензент: д-р техн. наук, проф. Стасев Ю.В.

Стрюк Алексей Юрьевич, адъюнкт ХВУ. Научные интересы: системы и алгоритмы сжатия видеоданных. Адрес: Украина, 61000, Харьков, ул. Ильинская, 61, кв. 59.

Бохан Константин Александрович, адъюнкт ХВУ. Научные интересы: системы и алгоритмы сжатия видеоданных. Адрес: Украина, 61000, Харьков, ул. Красноармейская, 26, кв 32.

РИ, 2002, № 1

25

i Надоели баннеры? Вы всегда можете отключить рекламу.