Научная статья на тему 'Выбор оптимальной цветовой модели изображения в целях его кодирования иерархическим алгоритмом'

Выбор оптимальной цветовой модели изображения в целях его кодирования иерархическим алгоритмом Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
237
40
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Чобану Михаил Константинович, Сержантов Антон Викторович, Зандер К.

Рассмотрен процесс предобработки цветных изображений для последующего их сжатия иерархическим алгоритмом кодирования. Проведена классификация методов обработки, обоснован выбор оптимального из них на основе требований алгоритма сжатия к входным данным. Приведены результаты тестирования выбранных методов, а также предложены некоторые модификации, улучшающие основные показатели предобработки качество и быстродействие.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Selection of Optimal Color Model of Image for its Coding with Hierarchic Algorithm

Preprocessing of color images is considered for the subsequent compressing of them using the hierarchic algorithm of coding. Methods of processing are classified and the selection of the optimal one is substantiated on the basis of requirements to input data by algorithm of coding. Results of testing of the selected methods are given. Some modifications that improve the main factors of preprocessing quality and speed of operation are offered.

Текст научной работы на тему «Выбор оптимальной цветовой модели изображения в целях его кодирования иерархическим алгоритмом»

7. Ф й е А. Рентабельный web-дизайн. - М.: Кудиц-образ, 2004. - 336 с.

8. Кирсанов Д. WEB-дизайн. - СПб.: Символ, 2003. - 368 с.

9. K a l b a c h J. The Myth of "Seven, Plus or Minus 2" http://www.ddj.com/184412300.

Статья поступила в редакцию 15.02.2007

Елена Валерьевна Ртищева родилась в 1979 г., окончила МГТУ им. Н.Э. Баумана в 2003 г. Аспирант кафедры "Системы обработки информации и управления" МГТУ им. Н.Э. Баумана. Автор шести научных работ в области проектирования программных систем. Специализируется в области проектирования веб-сайтов и систем управления веб-сайтами.

Ye. V. Rtishcheva (b. 1979) graduated from the Bauman Moscow State Technical University in 2003. Post-graduate of "Systems of Data Processing and Control" department of the Bauman Moscow State Technical University. Author of б publications in the field of program systems design. Specializes in the field of web-site design and systems of web-site management.

УДК 621.396

М. К. Ч о б а н у, А. В. Сержантов, К. З а н д е р

ВЫБОР ОПТИМАЛЬНОЙ ЦВЕТОВОЙ МОДЕЛИ ИЗОБРАЖЕНИЯ В ЦЕЛЯХ ЕГО КОДИРОВАНИЯ ИЕРАРХИЧЕСКИМ АЛГОРИТМОМ

Рассмотрен процесс предобработки цветных изображений для последующего их сжатия иерархическим алгоритмом кодирования. Проведена классификация методов обработки, обоснован выбор оптимального из них на основе требований алгоритма сжатия к входным данным. Приведены результаты тестирования выбранных методов, а также предложены некоторые модификации, улучшающие основные показатели предобработки — качество и быстродействие.

В связи с широким распространением цифровых устройств (фотоаппаратов, видеокамер и др.) проблема хранения цветных фото- и видеоизображений становится все более актуальной, так как изображения и видеосигналы занимают огромные объемы памяти. Основными вопросами при решении данной проблемы являются предобработка данных и их сжатие. Под предобработкой цветного изображения понимается его преобразование в такую цветовую систему, которая описывала бы цвет, удовлетворяя всем требованиям алгоритма сжатия.

Выбор цветовой системы, описывающей цветное изображение определяется требованиями иерархического алгоритма, применяемого

для сжатия изображений, а именно — локализацией энергии сигнала в одном из каналов изображения (в низкочастотном) и распределением бюджета бит по каналам изображения.

Алгоритм пространственно упорядоченных иерархических деревьев (Set Partitioning In Hierarchical Trees — SPIHT) является алгоритмом сжатия с потерями, работает с вейвлет-декомпозицией сигнала, полученной с применением разделимых и неразделимых фильтров, и реализует иерархический принцип передачи данных; SPIHT показывает хорошие характеристики качества при больших степенях сжатия, обладая при этом простой структурой.

В настоящей работе рассмотрена оптимальная цветовая система для представления цветного изображения в целях его дальнейшего кодирования SPIHT-алгоритмом, а также найдено оптимальное распределение бюджета бит по каналам изображения, не зависящее от входного сигнала и обеспечивающее максимальное качество сжатия.

Описание иерархического алгоритма. В последнее время появились эффективные кодеры, использующие вейвлет-декомпозицию сигнала. Стандартизован кодер JPEG2000, работающий с вейвлет-преобразованием. Существует также большое число не стандартизованных, но зачастую значительно более эффективных алгоритмов, одним из которых является SPIHT [1]. Реализуемый в нем принцип можно считать классическим. На его базе развиваются новые алгоритмы, и в оценках эффективности любого нового вейвлет-кодера обязательно можно найти сравнительные тесты с алгоритмом SPIHT.

Алгоритмы сжатия изображений можно разделить на две категории: алгоритмы сжатия без потерь и алгоритмы сжатия с потерями. SPIHT-алгоритм принадлежит ко второй категории. В настоящее время принято делить кодеры, работающие с вейвлет-декомпозицией, на два класса: междуполосные (inter-band) и внутриполосные (intra-band). Алгоритм SPIHT относится к классу межполосных кодеров, т.е. в нем используется избыточность, связанная с корреляцией между уровнями декомпозиции. Алгоритм SPIHT показывает хорошее качество изображения при больших степенях сжатия, обладая при этом простой структурой. Генерируемый при кодировании поток имеет ряд положительных свойств [2]:

1) возможность точного регулирования скорости передачи изображения, а при записи в файл его размер можно задать с точностью до байта;

2) возможность восстановления всего изображения при прекращении приема декодером бит в любой точке;

3) возможность быстрого просмотра изображений в удаленной базе данных.

Алгоритм SPIHT рассчитан на работу с вейвлет-декомпозицией, полученной с применением разделимых или неразделимых фильтров. При выборе банка фильтров [3, 4] важным критерием является способность системы концентрировать энергию сигнала в низкочастотной области.

При кодировании цветных изображений важной задачей является выбор цветовой системы. Удачной можно считать ту систему, в которой наиболее полно определены информационные параметры каждой составляющей цвета, а также введена неравномерность в распределение количества информации по составляющим. Знание информационных параметров такого представления (относительной важности составляющих) позволяет оптимально выбирать распределение бит по каналам (bitrate, или битрейт), т.е. выделять его в соответствии с количеством информации в составляющей цвета.

При реализации иерархического принципа передачи более важные отсчеты вейвлет-декомпозиции начинают передаваться раньше и на их уточнение отводится больший объем в общем потоке. Аналогично более важные составляющие цвета передаются в выходной поток раньше и в соответствии с распределением битрейта занимают больший объем в общем выходном потоке.

Оптимизация кодирования цветного изображения. Под оптимизацией кодирования цветного изображения понимается обработка входного сигнала таким образом, чтобы он максимально отвечал требованиям иерархического алгоритма кодирования. В нашем случае рассматривается SPIHT-алгоритм кодирования, основным требованием которого к входному сигналу является локализация энергии сигнала в одном из каналов цветного изображения (информационная неравномерность).

На рис. 1 приведена схема кодирования цветного изображения с помощью SPIHT-алгоритма. Весь процесс кодирования можно разделить на три части:

1. Преобразование исходного изображения в цветовую систему, которая максимально отвечает критериям SPIHT-алгоритма.

2. Вейвлет-декомпозиция каналов цветного изображения.

3. Квантование коэффициентов вейвлет-декомпозиции (если на предыдущем шаге не была реализована целочисленная фильтрация), распределение битрейта (число бит на пиксель) по каналам изображения и непосредственное кодирование данных.

Исходя из схемы (см. рис. 1) можно выделить основные этапы оптимизации кодирования цветного изображения SPIHT-алгоритмом: выбор оптимальной цветовой модели для описания входного сигнала; оптимальная вейвлет-декомпозиция сигнала — локализация энергии

д g OCS: other color system

image RGB РОВ ю 005 image OCS Wavelet KorJim- filter coefficients С SRI HT coding

3 charnels 3 channels position 3 channels

Рис. 1. Основные этапы преобразования цветного изображения

сигнала в низкочастотной области; оптимальное распределение битрейта по каналам.

В последнем случае важно знать (с точки зрения и быстродействия, и качества сжатия) оптимальный формат кодирования, т.е. такое распределение битрейта по каналам изображения, которое обеспечивает максимальное качество сжатия при заданном качестве восстановленного изображения.

Вопросы синтеза многоскоростных систем и фильтров, являющихся важнейшей их составной частью, рассмотрены в работах [3, 4]. Квантование коэффициентов вейвлет-декомпозиции — неотъемлемая часть алгоритма кодирования БИНТ, поэтому эти вопросы выходят за рамки настоящей работы.

Классификация цветовых систем и анализ их характеристик. В настоящее время существует достаточно большое разнообразие цветовых систем, ориентированных на различные прикладные задачи [5]. В настоящей работе рассматривается классификация цветовых систем по критериям, важным для алгоритма сжатия (для БРИТ), и выбор среди них оптимальной системы для представления цветного изображения (рис. 2). Исходя из принципов работы и особенностей организации БРИТ-алгоритма, можно выделить следующие требования к свойствам цветовой модели:

1. Большой цветовой охват модели (число цветов видимого спектра, которое данная модель может описать);

2. Локализация энергии сигнала в одном из каналов цветовой модели (информационная неравномерность);

3. Линейность преобразования между RGB-системой и данной цветовой системой (что вытекает из необходимости минимизировать время преобразования).

Распределения энергии каналов для различных цветовых систем и для одного и того же набора изображений даны на рис. 3 (см. 3-ю полосу обложки). Из диаграмм видно, что подходящими цветовыми системами для сжатия цветных изображений БРИТ-алгоритмом можно считать УИУ, У^, так как они одновременно удовлетворяют двум важным требованиям БРИТ-алгоритма: информационной неравномерности и линейности преобразования относительно RGB-системы.

Рис. 2. Схематическая диаграмма классификации цветовых систем

Краткий обзор существующих систем. В цветовых моделях HSV, HLS, HSB [6] описание цвета базируется на интуитивном восприятии цвета человеком. Цвет описывается через тон, насыщенность и яркость.

Системы CIE Lab, CIE Luv разработаны на основе исследований Д. Хьюбела и Т. Вайзела в 1981 г., которые показали разнородность информации о цвете, поступающей из человеческого глаза в мозг. Это информация о яркости светового излучения, об интенсивности зеленого и красного цветов и интенсивности синего и желтого цветов, где желтый — это сумма зеленого и красного цветов. Исходя из этого цветовые пространства семейства Lab, Luv представляют цвет в трех каналах: один канал выделен для значений яркости (L — Lightness) и два других — для цветовой информации (a, b или u, v).

Основным преимуществом систем YUV, YCrCb и YIQ является то, что в них на описание цвета отводятся только два канала (Cr и Cb, U и V, I и Q), а третий канал отвечает за яркостную составляющую цвета. Таким образом, видна "информационная неравномерность" по каналам данных систем, а именно — в яркостном канале содержится больше информации обо всем изображении, чем в цветовых каналах. Действительно, если энергию цветовых каналов приравнять нулю, т.е. обесцветить изображение, то основная его информация при этом сохранится (форма объектов, их очертания и т.д.). Таким образом, при сжатии изображения, описанного такими моделями, степень сжатия каналов должна быть разной.

Яркостный канал Y образуется в соответствии со спектральной характеристикой глаза человека. Зрительная система человека наиболее

чувствительна к изменениям цвета в диапазоне 530... 600 нм (зеленый (~ 530 нм), желто-зеленый, желтый (~ 570 нм), оранжевый цвета) видимого спектра светового излучения, поэтому энергия зеленого канала (Е^В-система) вносит наибольший вклад в образование яркостного канала систем УИУ, УЩ, УСгСЪ [7]:

У = 0,299Я + 0,587С + 0,114В,

где Я, С, В — значения интенсивностей Я-, С-, В-каналов соответственно.

Образование цветовых каналов данных систем является схожим. При равных значениях энергий красной, зеленой и синей составляющих RGB-сигнала (т.е. для градаций серого) значения энергий цветовых каналов УСгСЪ, УИУ, У^ систем становятся равными нулю. Тогда вся энергия RGB-сигнала "уходит" в один У-канал, значения которого лежат в диапазоне 0... 255 нм.

Зрительная система человека более чувствительна к изменениям в диапазоне цветов синий-оранжевый, чем в диапазоне цветов зеленый-фиолетовый. Для цветовых моделей УСгСЪ и УИУ оба цветоразностных канала содержат информацию о диапазоне цветов синий-оранжевый. Для УЩ-системы информация о синем-оранжевом диапазоне соответствует одному каналу (I), информация о зеленом-фиолетовом диапазоне — другому каналу (^). Это дает преимущество в распределении коэффициента сжатия по каналам цветовой модели.

Распределение бит по каналам цветного изображения. Динамический формат кодирования. После преобразования исходного сигнала в новую цветовую систему и его вейвлет-декомпозиции получены три канала с коэффициентами вейвлет-декомпозиции. Информативность каналов различна, поэтому важной задачей является распределение бюджета бит (битрейта), выделенного на все изображение, по каналам в соответствии с их информационным наполнением.

При решении данной задачи необходимо найти распределение, при котором достигается максимальное качество сжатия. Например, если выбрана цветовая система из семейства У^, УИУ, УСгСЪ, то очевидно, что на яркостной канал У будет выделено больше битрейта, чем на цветоразностные каналы. Но в то же время доля битрейта яркост-ного канала не должна быть слишком велика, иначе степень сжатия цветоразностных каналов будет настолько большой, что изображение начнет терять цветовую информацию (обесцвечиваться).

Чтобы оптимально распределить битрейт по каналам изображения, необходимо знать распределение информации по каналам. Зная относительную важность каждого канала, можно выделить ему соответствующую долю битрейта.

В качестве оценки информационной важности каналов используется отношение их энергий. При этом нормализация, как правило, происходит по одному из цветоразностных каналов (для У^ по Ц-каналу, для УЦУ по и - или по V-каналу):

\Еу/Ее 1] : [Ее2/Ес 1] : 1, (1)

где Еу — энергия яркостного канала; Ес1, Ес2 — энергии цветоразностных каналов; \], [] — операторы округления в верхнюю и нижнюю стороны соответственно.

Выражение (1) называется динамическим форматом кодирования [8]. При этом каждое число обозначает долю от общего битрейта, отводимую для кодирования соответствующего канала. Основным недостатком данного формата является то, что его нужно вычислять для каждого изображения (т.е. динамически, отсюда и его название), что не делает алгоритм сжатия в целом быстродействующим.

Зная коэффициенты динамического формата, легко найти битрейт для каждого канала. Пусть задан определенный бюджет бит (битрейт)

Еу

на все изображение и BY =

Ec2

— часть битрейта для яркостного

канала, ВС2 =

EC1

— для цветоразностного канала С2. Тогда

_Ео1

ВЖа1е = ВкЯа1еу + ВкЯа1ес 2 + В1Жа1еС1, (2)

где битрейты для яркостного канала У и для цветоразностных каналов можно представить как

Ву • ВкБ^е Вс2 • ВкБ^е В11ка1еу = —----, В11ка1ес2 =

Ву + Вс2 + 1 ' Ву + Вс 2 + 1 '

BitRate

BitRateCi =

(3)

Ву + Вс2 + 1

При этом нормализация энергий проводилась по каналу С1.

Аналогичные соотношения можно привести, оперируя понятием коэффициента сжатия, который связан с величиной битрейта следующим соотношением (для цветного изображения с битовой глубиной 24 бита, RGB-модель):

24

K = —.-. (4)

BitRate

Подставляя в соотношение (4) выражения для битрейта (2) и (3), получим распределение коэффициента сжатия по каналам:

т^ЕУ + EC 2 + EC1 Тг Т,,ЕУ + EC2 + EC1

Ky = K-—-, Kc2 = K-—-,

у Q TT ' C2 q TT

3Еу 3Ec2

„Еу + EC2 + Ec 1

kc 1 = K-

3 Е,

C1

где K = —j-J-1— — коэффициент сжатия всего изобра-

+ т^ +

Ky Kc2 Kc 1

жения.

Объективное и субъективное тестирование. Тестирование проводилось в два этапа.

1. Объективное тестирование — обычно используется одна определенная метрика (критерий качества), хотя число метрик может быть и больше одной [9]. В настоящей работе использовалась метрика ПОСШ (пиковое отношение сигнал/шум) или PSNR (Peak Signal to Noise Ratio), как одна из наиболее часто используемых метрик в области сжатия изображений, что позволяет сравнивать результаты, полученные авторами, с результатами, полученными при использовании других алгоритмов сжатия. Основным достоинством приведенной метрики является охват всего сигнала (в данном случае изображения) при подсчете значения, а не конкретной локальной области (частотной или временной), что является важным критерием для выбора метрики в области сжатия изображений.

2. Субъективное тестирование требует больших материальных и временных затрат. Однако субъективное тестирование отражает именно влияние человеческого фактора на оценку качества сжатого изображения, который пока не под силу выявить с помощью только объективного тестирования [9].

Рассмотрим результаты тестирования выбора оптимальной цветовой системы, а также оптимального распределения битрейта по каналам изображения.

Тестирование цветовых систем. Ранее была проведена классификация цветовых систем и отобраны те, которые пригодны для представления цветного изображения перед его сжатием SPIHT-алгоритмом, исходя из требований алгоритма сжатия. В табл. 1 приведены результаты тестирования. Для значений битрейта 0,1, 0,5 и 1 было проведено сжатие изображений (рис. 4, а-г, см. 4-ю полосу обложки) при использовании различных цветовых систем.

Из табл. 1 видно, насколько хуже по качеству сжатия системы (HLS, HSB, HSV), имеющие равномерное распределение информации по каналам изображения. Лучшие результаты показали YUV- и YIQ-системы, при этом для последней значения PSNR оказались выше.

Это определяется тем, что в YIQ-системе информация о диапазоне синий-оранжевый относится к одному каналу (I), в то время как в YUV-системе — эта информация содержится в обоих цветоразностных каналах, что является причиной для выделения равной доли битрейта на них.

-ab (Luv) - 27,26 27,83 28,66 25,83

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

CD 26,44 26,28 26,67 25,02

Ь-l CD 24,84 22,94 23,53 22,49

eq m К >" m К - 21,17 19,24 18,66 19,83

CD 19,73 17,75 16,95 18,22

&o L К CD 10,01 8,62 11,08 13,49

- 31,69 34,12 35,06 36,08

YUV CD 29,33 30,42 31,41 32,71

CD 26,16 24,81 25,82 27,20

- 29,8 29,78 32,02 30,66

YCbCr CD 28,11 27,2 29,04 28,2

CD 25,38 22,84 24,51 24,09

- 31,79 34,15 35,26 36,02

YIQ CD 29,39 30,40 31,58 32,75

CD 26,22 24,84 25,99 27,16

BitRate Рис.3, а Рис.3, б Рис.3, в Рис. 3, 2

Для SPIHT-алгоритма ситуация с ярко выраженной информационной неравномерностью предпочтительней, как в YIQ-системе: Y -канал содержит много информации об изображении в целом; I-канал содержит много цветовой информации; Q-канал — менее информативный. Таким образом, при распределении битрейта наименьшая часть битрейта будет выделена Q-каналу, для I-канала - в несколько раз больше, максимальная часть будет выделена яркостному каналу Y, что и наблюдается при расчете динамического формата кодирования.

Тестирование распределения бит по каналам изображения. Основной задачей при сжатии каналов является оптимальное распределение битрейта по каналам изображения, поэтому главная цель тестирования

— найти значение коэффициентов оптимального формата. Для этого каждому изображению с помощью перебора коэффициентов формата кодирования был найден оптимальный формат кодирования — такое распределение битрейта по каналам изображения, при котором достигается максимальное качество сжатия (по критерию PSNR). После этого проводился сравнительный анализ значений PSNR для оптимального и динамического форматов кодирования.

В табл. 2 приведены: формат 1 — динамический формат кодирования; формат 2 — оптимальный формат кодирования; PSNR1, PSNR2

— значения величины PSNR для форматов 1 и 2 соответственно. Из табл. 2 видно, что значения PSNR для динамического и оптимального форматов кодирования различаются незначительно — около 0,1... 0,3 дБ. Такое различие не воспринимается зрительной системой человека, что дает огромное преимущество по скорости в нахождении распределения битрейта.

Однако скорость вычисления динамического формата кодирования все же слишком мала, так как необходимо подсчитать значение энергии для каждого изображения и для каждого канала отдельно, что резко снижает производительность алгоритма сжатия в целом. Особенно данный фактор сказывается при сжатии последовательности изображений (видео, анимация). В целях увеличения быстродействия вычисления распределения битрейта было введено понятие статического формата кодирования. Это жестко заданный формат кодирования для данной цветовой системы, т.е. для всех изображений его коэффициенты будут одинаковыми.

Для нахождения этих коэффициентов было найдено среднее процентное соотношение между коэффициентами динамического формата для большого числа изображений. В результате найдено, что в среднем на долю яркостного канала YIQ-системы приходится 80 % всего битрейта, для I-канала — 14% и для Q-канала — 6%. Таким образом,

Таблица 2

Сравнение качества сжатия при различном распределении битрейта

(для YIQ-системы)

BitRate Рис.3, а Рис. 3, г

Формат 1 PSNR 1, дБ Формат 2 PSNR 2, дБ Формат 1 PSNR 1, дБ Формат 2 PSNR 2, дБ

0,1 15:2:1 26,03 3:1:1 26,22 12:4:1 25,01 13:3:1 25,17

0,2 15:2:1 27,08 2:1:1 27,34 12:4:1 26,89 4:1:1 26,07

0,3 15:2:1 27,74 2:1:1 27,95 12:4:1 28,22 18:3:1 28,56

0,4 15:2:1 28,8 6:1:1 28,87 12:4:1 29,36 6:1:1 29,37

0,5 15:2:1 29,39 4:1:1 29,51 12:4:1 30,19 5:1:1 30,31

0,6 15:2:1 29,79 5:1:1 29,91 12:4:1 31,04 5:1:1 31,1

0,7 15:2:1 30,23 5:1:1 30,4 12:4:1 31,66 6:1:1 31,73

0,8 15:2:1 30,86 4:1:1 30,9 12:4:1 32,23 22:3:1 32,72

0,9 15:2:1 31,23 4:1:1 31,39 12:4:1 32,83 13:2:1 33,13

1 15:2:1 31,4 4:1:1 31,79 12:4:1 33,37 8:1:1 33,57

коэффициенты статического формата равны 40 : 7 : 3. Аналогично, для УЦУ-системы статический формат равен 14 : 3 : 2 [10].

Из табл. 3 видно, что значения РБКК статического формата близки к значениям РБКК динамического формата, а иногда и превышают их.

Итак, с помощью объективного тестирования удалось найти оптимальное распределение битрейта вне зависимости от поступающего на вход изображения, что позволило существенно сократить время предобработки изображения перед его кодированием. Необходимо также рассмотреть, насколько предложенные упрощения подсчета коэффициентов формата кодирования заметны для человеческого глаза.

Таблица 3

Сравнение качества сжатия динамического и статического форматов кодирования (по критерию PSNR, для битрейта 0,5)

Изображение Динамический формат (PSNR в дБ) Статический формат (PSNR в дБ)

Рис. 3, а 29,39 29,45

Рис. 3, б 30,42 30,32

Рис.3, в 31,58 31,64

Рис. 3, 2 32,75 32,97

Субъективное тестирование. Недостатком объективного тестирования является то, что, например, редкие, но большие (хорошо заметные глазу) ошибки "размазываются" при расчете PSNR и дают хорошее объективное качество. Не располагая взаимосвязью критериев оптимального тестирования и субъективной оценки качества изображения трудно сказать, например, одинаково ли различима зрительной системой человека разница в 1 дБ (по критерию PSNR) между значениями 26 и 25 дБ или 15 и 14 дБ, а также — для всех ли изображений (изображения с преобладанием высоких частот, с преобладанием низких частот и т.д.) значение 30 дБ является показателем отличного качества?

Чтобы ответить на эти вопросы, было проведено субъективное тестирование. При этом полученные результаты были проанализированы и сопоставлены с результатами объективного тестирования.

На сегодняшний день существуют достаточно разнообразные процедуры и стандарты субъективного тестирования. Их структура и последовательность операций строго зависят от области применения. Однако преимущественно все они подразумевают привлечение некоторого числа людей, которые не занимаются профессионально обработкой конкретного типа сигнала (аудиосигнала, фото- и видеоизображения и т.д.). Им раздается тестируемый материал, оговариваются правила оценки качества или иных параметров материала. После чего каждый выставляет свою субъективную оценку в рамках оговоренных правил.

В настоящей работе использовался стандарт ITU-R BT.500-11, созданный Международным Телекоммуникационным Объединением (МТО, или ITU — International Telecommunication Union). МТО размещается в Женеве (Швейцария) и является международной организацией, специализирующейся на телекоммуникационных технологиях и стандартах. За основу субъективного тестирования была взята "методология оценивания качества телевизионных изображений" стандарта ITU-R BT.500-11 (подробнее см. работу [10]).

Основные задачи, которые необходимо было решить с помощью субъективного тестирования, — определение соотношения субъективного и объективного качеств; оценка качества пользователем изображений, сжатых с использованием статического формата кодирования; сравнение этих показателей с показателями качества сжатия изображений с использованием динамического формата кодирования.

На рис. 5 показана зависимость субъективного качества от значений PSNR. Как видно, данный график является непосредственным ответом на поставленные ранее вопросы. Разница в 1 дБ для всех изображений практически не различима в области от 10 до 20 дБ. Эта же разница хорошо заметна глазу на отрезке 20. ..30 дБ (по критерию

tu

S s / Л 1 N

з/ г\у/ Л /

( 9 1/J Г/ У/Ч1 /п у /А // 10

/ А f *ж* 1 •

10 10 30 40 PSNR 50

Рис. 5. Зависимость субъективного качества изображений от значений PSNR:

1 — Bunny, 2 — Cat, 3 — Colorful, 4 — Dragon, 5 — Flower, 6 — Foggy, 7 — Hait, 8 — Zena, 9 — Pearls, 10 — Screws, 11 — Snoppy

PSNR). Но для разницы 0,3.. .0,5 дБ такого сказать нельзя, поэтому пренебрежение ею, сделанное при выборе динамического, а далее и статического форматов, было вполне оправданным. Отчетливо видно, что значение PSNR 30 дБ далеко не для всех изображений является признаком отличного качества.

При сравнении результатов тестирования для динамического и статического форматов были получены вполне ожидаемые результаты. Для 80 % всех изображений статический и динамический форматы получили одинаковую субъективную оценку. И лишь в остальных 20 % динамический формат "вырвался" вперед всего на 1 балл. Это является хорошим показателем, так как необходимо учитывать различные факторы (состояние зрительной системы наблюдателя, его настроение, качество и настройку мониторов и т.д.; подробнее это описано в методологии стандарта ITU-R BT.500-11).

В настоящей статье рассмотрены методы предобработки цветных изображений перед их кодированием иерархическим алгоритмом. После анализа требований алгоритма сжатия к свойствам и характеристикам данных методов, были классифицированы и предложены методы предобработки изображений. Рассмотрена процедура распределения битрейта по каналам изображения, и предложены статические коэффициенты формата кодирования для YIQ-системы и для YUV-системы в целях получения более качественного сжатия изображений и быстродействия процедуры распределения битрейта по каналам изображения.

Была проведена очень большая работа, о чем можно судить, скажем, на примере исследования YUV-формата. Всего было обследовано 1683 несовпадающих формата для 11 изображений, для двух размеров каждого изображения, для трех фильтров, четырех значений битрейта.

Были обработаны 264 списка, из которых по особым критериям выбраны наилучшие представители. Из полученных новых 66 списков были отобраны лучшие форматы и т.д. Аналогичная работа проведена и при исследовании YIQ-системы.

После получения и анализа результатов объективного и субъективного тестирования были подтверждены все априорные предпосылки, сделанные в начале работы на основе анализа характеристик методов предобработки цветных изображений.

Получены статические форматы для YIQ- и YUV-систем. В дальнейшем планируется рассмотреть стандарт HDTV (телевидение высокой четкости) для представления цветного изображения, а также исследовать методы фильтрации с учетом требований SPIHT-алгоритма.

СПИСОК ЛИТЕРАТУРЫ

1. Said H.,Pearlman W. A new fast and efficient image codec based on set partitioning in hierarchical trees // IEEE Trans. on Circuits and Systems for Video Technology. - 1996. - Vol. 6. - P. 243-250.

2. Черников А. В., Ч о б а н у М. К. Сжатие изображений на базе вейвлет-преобразования и иерархического алгоритма кодирования // Цифровая обработка сигналов. - 2005. - № 2. - С. 40-49.

3. Ч о б а н у М. К. Многомерные многоскоростные системы и многомерные вейвлет-функции: Ч. 1. Теория // Вестник МЭИ. - 2003. - № 2. - С. 75-82.

4. Ч о б а н у М. К. Многомерные многоскоростные системы и многомерные вейвлет-функции: Ч. 2. Синтез // Вестник МЭИ. - 2003. - № 3. - С. 69-78.

5. Сержантов А. В. Выбор оптимальной цветовой модели для представления цветного изображения с целью его кодирования // Цифровая обработка сигналов и ее применение: Тр. 7-й Межд. конф. - М., 2005. - Т. 2. - С. 134-136.

6. Hoffman G. Color order systems RGB/HLS/HSB. http://www.fho-emden.de/~hoffmann/hlscone03052001.pdf

7. Зубарев Ю.Б.,Дворкович В. П. Цифровая обработка телевизионных и компьютерных изображений. - М., 1997. - 167 c.

8. С т е п н о в а Е. В., Р ы ч к о в А. Н. Оптимальный алгоритм сжатия цветных изображений методом SPIHT // Цифровая обработка сигналов и ее применение : Тр. 5-й Межд. конф. - 2003. - Т. 1. - С. 302-304.

9. Илюшкина Н. С., Ч о б а н у М. К. Применение новых критериев качества изображений после их сжатия с потерями // Современная электроника. - 2007. - № 3. - С. 58-61.

10. S a n d e r K. Analysis of the YUV color system concerning optimal compression of color images using the SPIHT coding algorithm // Information Resources and Technologies: Proc. 13th Internat. conf. - M., 2005. - P. 1-9.

Статья поступила в редакцию 26.03.2007

Михаил Константинович Чобану родился в 1960 г., окончил Московский энергетический институт в 1983 г. Канд. техн. наук, доцент. Автор около 130 научных работ в области цифровой обработки многомерных сигналов, синтеза многомерных цифровых фильтров и методов стнтеза многомерных многоскоростных систем.

M.K. Chobanu (b. 1960) graduated from the Moscow Institute for Power Engineering in 1983. Ph. D. (Eng.), assoc. professor. Author of about 130 publications in the field of digital processing of multi-dimensional signals, synthesis of multi-dimensional digital filters and methods of synthesis of multi-dimensional multi-velocity systems.

Антон Викторович Сержантов родился в 1983 г., окончил Московский энергетический институт в 2006 г., магистр. Автор трех научных работ в области цифровой обработки и кодирования многомерных сигналов.

A.V. Serzhantov (b. 1983) graduated from the Moscow Institute for Power Engineering in 2006. Has master's degree. Author of 3 publications in the field of digital processing and coding of multidimensional signals.

Зандер А.Катрин родилась в 1979г., окончила Технический университет Ильменау (Германия) в 2006 г. Автор одной научной работы. Специализируется в области методов синтеза цифровых систем для обработки изображений.

Zander A. Kathryn (b. 1979) graduated from the Technical University Ilmenau (Germany) in 2006. Author of one publication. Specializes in the field of methods of synthesis of digital systems for image processing.

УДК 532.52

А. Д. Мухин, А. Н. Т е м н о в

АВТОМАТИЗАЦИЯ РАСЧЕТА И АНАЛИЗА ДИНАМИЧЕСКИХ ХАРАКТЕРИСТИК КОНСТРУКЦИЙ РАКЕТ-НОСИТЕЛЕЙ

Описаны проблемы автоматизации подготовки исходных данных для разработки системы стабилизации при расчетах динамики конструкций с учетом адаптации ракет космического назначения к запуску различных космических аппаратов. Дано описание программно-математического комплекса, позволяющего эффективно решать эти проблемы. Приведена типовая схема расчета и анализа динамических характеристик ракет космического назначения при использовании данного комплекса, рассмотрены его возможности в сфере анализа замкнутой системы "объект-регулятор" и послеполетного анализа телеметрической информации.

Необходимость максимально автоматизировать все работы по подготовке исходных данных для разработки системы стабилизации стала актуальной в связи с существенным увеличением числа коммерческих пусков космических аппаратов (КА), имеющих значительные конструктивные отличия. При этом одна ракета космического назначения (РКН) тяжелого класса должна обеспечивать выведение легких КА на геостационарную орбиту, а тяжелых КА — на геопереходную орбиту. Кроме того, РКН могут комплектоваться различными разгонными блоками, что обусловливает широкий диапазон массово-

i Надоели баннеры? Вы всегда можете отключить рекламу.