Научная статья на тему 'Контурная информация при сжатии полутоновых изображений'

Контурная информация при сжатии полутоновых изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
235
83
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛУТОНОВОЕ ИЗОБРАЖЕНИЕ / СЖАТИЕ ИЗОБРАЖЕНИЙ / КОНТУР / GRAYSCALE IMAGE / IMAGE COMPRESSION / CONTOUR

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Самохвалов А. В.

В статье рассмотрена общая модель системы сжатия изображений, проанализированы ее недостатки. Установлено, что представленная общая система сжатия изображений будет недостаточно эффективна для многих классов изображений, так как не учитывает их структурные характеристики. Отмечено, что контурная информация играет важнейшую роль в зрительном восприятии человека. Следовательно, «неконтурная» информация (области одного цвета или плавно меняющегося цвета) является визуально избыточной и может быть частично или полностью исключена из изображения. Показано, что современные стандарты сжатия изображений с потерями JPEG и JPEG 2000 при больших степенях компрессии имеют серьезные недостатки: у JPEG – эффект «муара», у JPEG 2000 – сильное размытие контуров. Таким образом, оба стандарта допускают сильное искажение контурной информации, что неприемлемо, учитывая важность этой информации для восприятия человеческим зрением.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Самохвалов А. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CONTOUR INFORMATION IN COMPRESSION OF HALFTONE IMAGES

The article deals with the general model of the image compression, analyzes its drawbacks. Established that provided the overall image compression system is not effective for many classes of images, so it does not allow their structural characteristics. It is noted that the contour information plays a critical role in the visual perception of humans. Consequently, the «noncontour» information (of one color or a smoothly varying colors) is a visually redundant and can be partially or completely removed from the image. It is shown that the highest standards for lossy image compression JPEG and JPEG 2000 compression at high degrees have serious drawbacks: JPEG – the effect of «moiré»in JPEG 2000 – a strong blurring contours. Thus, both standards allow for a strong distortion of the contour information, which is unacceptable, given the importance of this information for the perception of the human eye.

Текст научной работы на тему «Контурная информация при сжатии полутоновых изображений»

УДК 004.627 + 004.932.2 + 621.397

А.В. Самохвалов

канд. техн. наук,

главный редактор научно-практического журнала «Приволжский научный вестник» КОНТУРНАЯ ИНФОРМАЦИЯ ПРИ СЖАТИИ ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЙ

Аннотация. В статье рассмотрена общая модель системы сжатия изображений, проанализированы ее недостатки. Установлено, что представленная общая система сжатия изображений будет недостаточно эффективна для многих классов изображений, так как не учитывает их структурные характеристики. Отмечено, что контурная информация играет важнейшую роль в зрительном восприятии человека. Следовательно, «неконтурная» информация (области одного цвета или плавно меняющегося цвета) является визуально избыточной и может быть частично или полностью исключена из изображения. Показано, что современные стандарты сжатия изображений с потерями JPEG и JPEG 2000 при больших степенях компрессии имеют серьезные недостатки: у JPEG - эффект «муара», у JPEG 2000 - сильное размытие контуров. Таким образом, оба стандарта допускают сильное искажение контурной информации, что неприемлемо, учитывая важность этой информации для восприятия человеческим зрением.

Ключевые слова: полутоновое изображение, сжатие изображений, контур.

A.V. Samokhvalov, Publishing Center of Science Education

CONTOUR INFORMATION IN COMPRESSION OF HALFTONE IMAGES

Abstract. The article deals with the general model of the image compression, analyzes its drawbacks. Established that provided the overall image compression system is not effective for many classes of images, so it does not allow their structural characteristics. It is noted that the contour information plays a critical role in the visual perception of humans. Consequently, the «noncontour» information (of one color or a smoothly varying colors) is a visually redundant and can be partially or completely removed from the image. It is shown that the highest standards for lossy image compression JPEG and JPEG 2000 compression at high degrees have serious drawbacks: JPEG - the effect of «moire»in JPEG 2000 - a strong blurring contours. Thus, both standards allow for a strong distortion of the contour information, which is unacceptable, given the importance of this information for the perception of the human eye.

Keywords: grayscale image, image compression, contour.

Массовая компьютеризация и информатизация всех отраслей знаний стимулировали разработку новых математических моделей исследуемых объектов в различных предметных областях. К числу таких объектов относятся изображения, предоставляющие большое количество информации об изображенных объектах в наглядной и образной форме. В то же время возможности извлечения полезной информации из изображений определяются их пространственной структурой. Поэтому задачи моделирования и анализа структуры изображений возникают в различных прикладных областях при решении самых разнообразных задач [6].

Общая модель системы сжатия изображений (рис. 1) содержит два функционально разных структурных блока: кодер и декодер. Исходное изображение f (х, y) подается на кодер, в котором преобразуется в набор символов. После передачи по каналу кодированные данные поступают на декодер, где создается восстановленное изображение f( х, y). Вообще, изображение f( х, y) может быть точной копией изображения f(х, y), а может таковой и не быть. В первом случае мы имеем систему кодирова-

ния без потерь, а во втором - систему кодирования с потерями, и при этом на восстановленном изображении будут наблюдаться некоторые искажения.

Рисунок 1 - Общая модель системы сжатия

Кодер источника отвечает за сокращение или устранение возможных видов избыточности на входном изображении: кодовой, межэлементной и визуальной. Конкретные приложения и связанные с ними критерии верности заставляют выбирать тот или иной способ кодирования, являющийся наилучшим в данном случае. Обычно, процедура кодирования представляется в виде последовательности из трех независимых операций (стадий). Как видно на рис. 2, каждая из операций предназначена для сокращения одного из типов избыточности, рассмотренных ранее. На рис. 3 показан соответствующий декодер источника.

Трансформационное преобразование

Г (X, У)

л

Разбиение на блоки

ПУА

— IIIV)1 —

ДВП

Квантование

и1

Глобальное квантование

Матрицы квантования

Пороги обнуления -1

Компрессия

Статистические методы

Словарные _ ^

методы ~|

Методы контекстного моделирования

Канал связи

Методы ПБУ

^Г- Синхронная единообразная коммутация переключателей; ДКП - дискретное косинусное преобразование; ПУА - преобразование Уолша-Адамара; ПКЛ - преобразование Кархунена-Лоэвэ; ДВП - дискретное вейвлет-преобразование

Рисунок 2 - Подробная модель кодера источника

Канал -

Декодер символов (декомпресия) Обратный преобразователь Д X, У)

Рисунок 3 - Общая модель декодера источника

На первой стадии «трансформационное кодирование» входные данные (изображение) преобразуется в такой формат данных, который подходит для уменьшения межэлементной избыточности изображения. Вторая стадия («блок квантователя» на рис. 2) предназначена для сокращения визуальной избыточности входных данных. Данная операция необратима, ее следует пропускать в случае компрессии без потерь. На последней стадии осуществляется компрессия квантованных данных, полученных на выходе предыдущей стадии.

Хотя на рис. 2 процесс кодирования источника показан в виде трех последовательных стадий, тем не менее, не в каждой системе сжатия требуется использование их всех. Например, в случае сжатия без потерь должен быть исключен блок квантователя. Кроме того, некоторые методы сжатия строятся так, что в них объединяются блоки, показанные на рис. 2 как самостоятельные (например, в системах сжатия с предсказанием преобразователь и квантователь часто представляются в виде единого бло-

ка, выполняющего обе операции одновременно).

Схема декодера источника, представленная на рис. 3, включает лишь два блока: блок декодера символов и блок обратного преобразователя. Эти блоки осуществляют операции, обратные тем операциям, которые выполнялись в кодере источника блоками кодера символов и преобразователя, причем в обратном порядке.

Таким образом, можно констатировать, что классическая система сжатия изображений воспринимает входную единицу информации (изображение) как целостный объект и все операции над изображением, предусмотренные в данной системе, выполняются именно как с целостным объектом. Общая система сжатия учитывает все виды избыточности данных изображения, которые являются свойством присущим абсолютно всем изображениям, т.е. данная система сжатия воспринимает изображение как некий класс данных и не рассматривает свойства и характеристики каждого конкретного изображения. Таким образом, представленная общая система сжатия изображений будет недостаточно эффективна для многих классов изображений, так как не учитывает их структурные характеристики, и, следовательно, существует необходимость внесения изменений в указанную систему: добавление новых процедур сжатия графической информации с учетом всех характеристик и схем взаимного согласования со стандартными процедурами.

Остановимся на вопросе важности отдельных структурных элементов в графическом изображении с точки зрения человеческого восприятия. Зрительное ощущение у человека возникает, когда под действием светового потока, упавшего на сетчатку, проявляется процесс возбуждения в виде обратимого фотораспада веществ, находящихся в рецепторах [5]. Важную роль в зрительном процессе играют непроизвольные движения глаз: при рассматривании предмета глаз движется, и оптические изображения деталей объекта, привлекающие внимание, поочередно проецируются на центральный участок ямки глазного яблока [4, 5].

Экспериментально выявлено [5], что человек осматривает объект не по случайной траектории, а последовательно проходит взглядом наиболее значимые элементы рассматриваемого объекта. При единообразной стимуляции зрительного восприятия эффективное функционирование зрительной системы невозможно. Необходимо, чтобы воздействующий на объект свет был прерывистым и контрастным, т.е. для восприятия формы предметов важны края его разных участков и границы между ними.

Контуры (внешние очертания объектов) играют чрезвычайно важную роль в нашем восприятии. Они имеют решающее значение для определения формы, краев и границ объекта и делают возможным восприятие последнего. Как правило, мы видим контуры тогда, когда примыкающие друг к другу поверхности освещены по-разному. Контраст, воздействуя на зрительные рецепторы и вызывая их взаимодействие, создает условия для восприятия контуров зрительной системой. И внутри глаза, и на более высоких уровнях зрительной системы находится огромное количество связанных между собой рецепторных клеток и некоторые из них непосредственно участвуют в восприятии четких зрительных контуров. Выделение контура или линии, вообще разделение даже незначительных перепадов яркости, должно быть присуще глазу на самом раннем этапе анализа. Естественно, если свет имеет границу, да еще перемещающуюся в поле зрения, - это первый признак опасности. А линия - это чаще всего

граница между двумя объектами, край, тень [1].

Вблизи границ соседних областей с разными, но монотонными уровнями яркости человеческое зрение склонно дополнительно выделять яркостные перепады, как бы добавляя несуществующие выбросы яркости, что демонстрирует пример на рис. 4 [2].

Рисунок 4 - Полосы Маха

Хотя яркость каждой из полос постоянна, мы, кроме действительно ступенчатого изменения яркости, видим характерные выбросы вблизи краев полос. Эти полосы с кажущимися изменениями яркости на краях называются полосами Маха в честь Эрнста Маха, впервые описавшего этот феномен в 1865 году. Таким образом, можно констатировать, что человеческое зрение усиливает контурные перепады на изображении [2].

Вообще, глядя на изображение, наблюдатель отыскивает на нем особенности и отличия, такие как контуры или текстурные области, и подсознательно объединяет их в узнаваемые группы. Затем мозг соотносит эти группы с имеющимися априорными знаниями, завершая тем самым процесс интерпретации изображения.

Итак, следует особо отметить, что контурная информация играет важнейшую роль в зрительном восприятии человека. При компрессии графической информации необходимо учитывать такую важную структурную контурную составляющую изображения.

Рассмотрим работу современных стандартов сжатия изображений. Одним из наиболее полных и популярных стандартов сжатия полутоновых неподвижных изображений является стандарт JPEG. Процесс сжатия состоит из трех последовательных шагов: вычисление дискретного косинусного преобразования (ДКП), квантование и кодирование неравномерным кодом.

Стандарт JPEG 2000, расширяет исходный стандарт JPEG, предоставляя большую гибкость, как при сжатии полутоновых неподвижных изображений, так и при доступе к самим сжатым данным [3]. Сжатие по стандарту JPEG 2000 основано на методах вейвлет-кодирования.

На рис. 5 представлены фрагменты сжатых изображений: исходные изображения, сжатие JPEG2000, сжатие JPEG.

а)

б)

л

àJ \

в)

Рисунок 5 - Увеличенные фрагменты сжатых изображений: а) исходные изображения, б) сжатие JPEG2000, в) сжатие JPEG

Проанализировав процедурные схемы работы стандартов JPEG и JPEG 2000, можно констатировать, что они представляют собой частные реализации общей модели системы сжатия изображений, представленной на рис. 1-3. А значит, описанным выше

стандартам присущи все недостатки рассматриваемой классической системы сжатия, которые заключаются в том, что она воспринимает изображение как целостный объект, не учитывая при этом структурные характеристики каждого конкретного изображения. Данный аспект приводит к тому, что самые популярные на сегодня стандарты сжатия изображений JPEG и JPEG 2000 недостаточно эффективны для многих классов изображений, так как не учитывает их структурные характеристики, в чем можно убедиться, рассмотрев результаты проведенного экспериментального исследования.

Для экспериментального исследования были выбраны полутоновые изображения, имеющие четкие контурные линии (рис. 5, а). Была произведена компрессия представленных изображений обоими стандартами при сильных степенях сжатия. У изображений, сжатых стандартом JPEG 2000 настолько размыты контурные линии (рис. 5, б), что визуально теряется контурная структурная составляющая исходного изображения. Изображения, сжатые стандартом JPEG, имеют сильный эффект «муара» («ореол» около контуров) и проявление эффекта «блочности» на изображении (что связано со спецификой разбиения изображения на блоки для проведения ДКП), который приводит к появлению «лишних» контурных блоковых линий на изображении.

Кажущееся впечатление превосходства результатов JPEG над JPEG2000 по визуальному качеству изображений (рис. 5) обманчиво и объясняется тем, что максимальное сжатие в реализациях стандарта JPEG всегда ограничивается некоторым уровнем, что просто искусственно ограничивает пользователя в увеличении степени сжатия изображения и доведения результата до негативно воспринимаемой человеческим зрительным ощущением графической информации (максимальный коэффициент сжатия JPEG-изображений значительно меньше максимально коэффициента сжатия для JPEG2000).

Выводы:

1. Классическая модель системы сжатия изображений, по которой строится подавляющее большинство современных стандартов компрессии, имеет существенный недостаток: она воспринимает входную единицу информации (изображение) как целостный объект и не учитывает структурные свойства и характеристики конкретного изображения. Следовательно, общая система сжатия изображений будет недостаточно эффективна для многих классов изображений, и существует необходимость внесения изменений в указанную систему: добавление новых процедур сжатия графической информации с учетом всех характеристик и схем взаимного согласования со стандартными процедурами.

2. Контурная информация играет важнейшую роль в зрительном восприятии человека. Следовательно, «неконтурная» информация (области одного цвета или плавно меняющегося цвета) является визуально избыточной и может быть частично или полностью исключена из изображения.

3. Современные стандарты сжатия изображений с потерями JPEG и JPEG 2000 при больших степенях компрессии имеют серьезные недостатки: у JPEG - эффект «муара» («ореол» около контуров), у JPEG 2000 - сильное размытие контуров, а также эффект «муара». Таким образом, оба стандарта допускают сильное искажение контурной информации, что неприемлемо, учитывая важность этой информации для восприятия человеческим зрением. Поэтому актуальной является задача поиска эффектив-

ных методов и алгоритмов сжатия изображений, позволяющих сохранять без изменений или с малыми искажениями в первую очередь именно контурную информацию изображения.

Список литературы:

1. Блинов Н.Н. Феноменология изображения [Электронный ресурс] // Блинов Н.Н. Глаз и изображение. - URL: http://www.sfe.ru/v_articl_fenomenblin.php (дата обращения 16.06.2013).

2. Гонсалес Р. Цифровая обработка изображений / Гонсалес Р., Вудс Р. - Москва: Техносфера, 2012. - 1104 с.

3. JPEG 2000 Committee. JPEG 2000 IMAGE CODING SYSTEM. JPEG 2000 FINAL COMMITTEE DRAFT VERSION 1.0, 16 MARCH 2000.

4. Марр Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов. - М.: Радио и связь, 1987.

5. Прокопенко В.Т. Психология зрительного восприятия: учебное пособие / В.Т. Прокопенко, В.А. Трофимов, Л.П. Шарок. - СПб: СПбГУИТМО, 2006. - 73 с.

6. Самохвалов А.В. Разработка метода интерполяции полутоновых изображений с большими пустыми областями // Вестник Ижевского государственного технического университета. - 2009. - № 2 (42). - С. 138-141.

7. Уфимкин А.Я., Самохвалов А.В. Адаптивное цветотоновое преобразование при кодировании графической информации // Надежность и качество: труды международного симпозиума: в 2 т. / под ред. Н.К. Юркова. - Пенза: Изд-во Пенз. гос. ун-та, 2008. - Т. 1. - С. 250-253.

List of references:

1. Blinov N.N. The phenomenology of the image [Electronic resource] // Blinov N.N. The eye and the image. - URL: http://www.sfe.ru/v_articl_fenomenblin.php (date accessed 16.06.2013).

2. Gonzalez R. Digital Image Processing / Gonzalez R., Woods R. - Moscow: Technosphere, 2012. - 1104 p.

3. JPEG 2000 Committee. JPEG 2000 IMAGE CODING SYSTEM. JPEG 2000 FINAL COMMITTEE DRAFT VERSION 1.0, 16 MARCH 2000.

4. Marr D. Vision. Information approach to the study of representation and processing of visual images. - M.: Radio and communication, 1987.

5. Prokopenko V.T. Psychology of visual perception: tutorial / V.T. Prokopenko, V.A. Trofimov, L.P. Sharok. - St. Petersburg: SPbGUITMO, 2006. - 73 p.

6. Samokhvalov A.V. Development of the interpolation method of halftone images with large areas of empty // Bulletin of Izhevsk State Technical University. - 2009. - № 2 (42). - P. 138-141.

7. Ufimkin A.Ya., Samokhvalov A.V. Adaptive tsvetotonovoe transform encoding graphics // The reliability and quality. Proceedings of the International Symposium: in 2 volumes / ed. NK Jurkova. - Penza: Publishing House Penz. State. University Press, 2008. - Vol. 1. - P. 250-253.

i Надоели баннеры? Вы всегда можете отключить рекламу.