Сравнительный анализ современных стандартов сжатия
видеоданных
В.А.Багдасарян Северо-Кавказский Федеральный Университет, Ставрополь
Аннотация: В данной статье проводится сравнительный анализ стандартов сжатия Н.264 и Н.265, по таким характеристикам как максимальный коэффициент сжатия, качество изображения и время кодирования. Выявлены основные недостатки стандартов и предложено направление разработки нового стандарта кодирования видеоданных. Ключевые слова: видеосигнал, кодирование, видео, стандарт сжатия, преобразование, алгоритм, к264, avc, hevc, к265, оценка движений
Введение
Распространение технологий цифрового вещания и цифрового видео привело к необходимости разработки эффективных методов сжатия видеопоследовательностей. Типичный метод сжатия заключается в кодировании первого кадра с помощью некоторого алгоритма сжатия изображений и последующем кодировании разности первого кадра и последующих [1].
Основополагающими принципами в процессе сжатия видео являются пространственная и временная избыточности, это, в свою очередь, определяет типичный алгоритм сжатия изображений, основанный на кодировании первого кадра видеопоследовательности и его разности с последующими кадрами, если же разность превышает допустимые значения, т.е. следующий кадр сильно отличается от первого, то на его основе создается новая последовательность, в которой он занимает место первого и т.д.
Состояние вопроса
Многочисленные исследования и разработки в области алгоритмов сжатия изображений и видеоданных позволили прийти к наиболее эффективному стандарту Н.265/НЕУС [1], работа которого построена на внутрикадровом предсказании, сжатие которым позволяет достичь
коэффициента сжатия 1:115 и выше для видео высокого разрешения, но техническая сложность в реализации данной технологии препятствует ее массовому внедрению.
Так же, для передачи видеоизображений в прямом эфире, доля которого увеличивается в общем трафике, необходим отдельный стандарт, позволяющий избегать задержек, что очень важно для данного типа видеоданных.
Таким образом, основные практические задачи в области сжатия видеоданных не решены в полной мере.
Постановка задачи
Задачей данной статьи является сравнительный анализ современных методов сжатия видеоизображений: Ы.264/ЛУС и Н.265/НЕУС, на основе введенных показателей:
• Максимальный коэффициент сжатия;
• Скорость кодирования;
• Качество сжатого изображения.
Целями данного исследования являются:
• выявление на базе проведенного анализа критериев влияния на
формирование методов сжатия.
• выявление недостатков существующих методов.
• выявление направлений развития, относительно формирования
новых критериев.
• определение критериев для разработки нового универсального
алгоритма сжатия видеоданных, который будет применяться к любому типу видео и стабильно давать максимальный коэффициент сжатия при заданном качестве декодированного изображения и временном ресурсе.
Решение задачи
Текущим индустриальным стандартом сжатия видеоданных является Н.264/ЛУС [11], в котором применяется схема внутреннего предсказания, используемая для кодирования 1-кадров [11], позволяющая снизить количество битов для хранения 1-кадра при том же уровне качества изображения. В процессе кодирования используются моноблоки меньшего размера, а совпадающие пиксели ищутся среди ранее закодированных, образовавшихся по краям нового моноблока. Затем, полученные значения пикселов используются вновь, что снижает занимаемый объем изображения.
В предыдущих стандартах сжатия установлена строгая зависимость в отношениях между порядком следования изображений при компенсации движения и порядком следования изображения при воспроизведении.
В Н.264/ЛУС подобное ограничение снято и лимитировано только объемом памяти, отведенной под декодирование, что позволило получить возможность самостоятельно выбирать порядок изображений для компенсации движения и воспроизведения [9]. Отсутствие ограничения позволило так же избежать дополнительных задержек и получить высокую точность описания движущихся областей.
В таблице 1 указаны профили Н.264/ЛУС и их применения.
Таблица №1
Профили H.264/AVC
Профиль Применение
базовый Мобильные устройства
основной Широковещание
расширенный Мобильные коммуникации
high 10 High definition video
high 4:2:2 Формат YUV 4:2:2
high 4:4:4 Видео студийного качества
На рисунке 1 показан процесс кодирования H.264, обработка каждого кадра ведется в пространстве YUV по блокам размером 16x16 для яркостной компоненты - luma, и по 8x8 для цветоразностных компонент - chroma.
Рис.1. - Схема стандарта H.264/AVC
Всего возможны три вида кадров: I (Intra), P (Predicted) и B (Bidirectional). Для I-кадра возможны только интрапредсказания, для P и B как интра, так и интер, различие между P- и B-кадрами состоит в том, что P-кадры могут быть предсказаны только от хронологически предшествующих им кадров, а B-кадры как от предшествующих, так и от следующих за ними [3], [4]. Для обеспечения такой возможности входящие кадры внутри кодера переупорядочиваются.
На рисунке 2 представлена структура алгоритма H.265. Вместо макроблоков, которые применялись в H.264, в HEVC используются блоки с древовидной структурой кодирования. Выигрыш кодера HEVC — в применении блоков большего размера.
J
I I I I.....I I m
Entropy Decoding
Residual Component
Intra Mode
Intra Pred.
Motion Comp.
SAO Parameters
Reference Picture Si Buffer
5АО
Fi Iter Central
Inv. Quant & Inv. OCT
Reconstruction
Deblocking filter
Picture
Рис. 2. - Схема стандарта Н.265/НЕУС Сравнительный анализ стандартов
Эксперименты, проводимые в лабораторных условиях, показали следующие данные по коэффициентам сжатия и времени кодирования.
Н.264/АУС Н.265/НЕУС
I Коэффициент сжатия ■ Время кодирования
Рис.3. - Характеристики стандартов сжатия Как можно увидеть из диаграммы, Н.265 превосходит текущий индустриальный стандарт в степени сжатия, но из-за технической сложности, а именно уменьшения полосы пропускания, время кодирования
увеличивается, так же предъявляются повышенные требования к процессорным мощностям оборудования.
На рисунке 4 приведено изображение, сжатое стандартом Ы.264/ЛУС.
Рис.4. - Сжатое изображение стандартом Н.264/ЛУС На рисунке 5 приведено изображение, сжатое стандартом Н.265/НБУС.
Рис.5. - Сжатое изображение стандартом Н.265/НБУС
Выводы
Результаты экспериментов показывают, что новый стандарт позволяет достичь лучшего качества и большего коэффициента сжатия, но высокие технические требования к оборудованию и времени кодированию, не позволяют сделать его новым индустриальным стандартом. К тому же, многие разработчики применяют оптимизированные кодеки Н.264/ЛУС, которые позволяют улучшить получаемые результаты. В рассматриваемых в данной статье стандартах применяется кадровое предсказание, но до сих пор не удалось решить практические проблемы, такие как высокие требования к
оборудованию, длительное время кодирование и декодирования, а также, универсальность применяемого кодера.
На основе проведенных экспериментов, можно предположить, что оптимизация имеющегося индустриального стандарта позволит еще долгое время пользоваться им, но, чтобы прийти к значимым успехам, необходимо разработать технологию, по которой любой тип видеоданных преобразовывался в эталонный, с регулируемыми параметрами качества и времени.
Литература
1. Альбекова З. М., Квашурин В. О., Тутик Н. А. Анализ эволюции технологии беспроводных сетей и прогнозы развития инфокоммуникационных сетей в России // Инженерный вестник Дона, 2016, №4. URL: ivdon.ru/ru/magazine/archive/n4y2016/3933.
2. Тропченко А.Ю., Тропченко А.А. Методы сжатия изображений, аудиосигналов и видео: Учебное пособие - СПб: СПбГУ ИТМО, 2009. -108 с.
3. ITU-T Recommendation T.800. Information Technology JPEG2000 Image Coding System: Core Coding System, Geneva: ITU-T Series T: Terminal for Telematic Services. 2003. 212 p.
4. ITU-T Recommendation T.810. Information Technology JPEG2000 Image Coding System: Wireless. Geneva: ITU, 2007. 60 p.
5. Скороход С. В., Хусаинов Н. Ш. Исследование средств JPWL в условиях коррекции пакетных ошибок при передаче видео в формате JPEG 2000 // Известия ЮФУ. Технические науки. 2016, №8 (181). C. 14-26.
6. Дроздов С. Н., Жиглатый А. Н., Кравченко П. П., Лутай В. Н., Скороход С. В., Хусаинов Н. Ш. Стандарт JPEG2000: базовые алгоритмы, примеры реализации и перспективы применения. Ростов-на-Дону, Изд-во ЮФУ. 2014. 255с.
7. Network Working Group RFC 5371. RTP Payload Format for JPEG 2000 Video Streams. The Internet Security (IETF), 2006. 31 p.
8. Игнатьев В.К., Никитин А.В., Перченко С.В., Станкевич Д.А. Динамическая компенсация дополнительной погрешности прецизионного АЦП. // Инженерный вестник Дона, 2012, №2. URL: ivdon.ru/magazine/archive/n2y2012/771
9. Giakoumis I., Nikos Nikolaidis N. and Pitas I. Digital image processing techniques for the detection and removal of cracks in digitized paintings. IEEE Trans Image Process, Jan; 15(1), pp. 175 - 188, 2006.
10. Сизякин Р.А., Воронин В.В., Марчук В.И., Гапон Н.В. Обработка изображений с целью обнаружения дефектов на основе преобразования Габора // Успехи современной радиоэлектроники. Радиотехника. М.: 2013, №6. С. 59-63.
11. G. J. Sullivan and J.-R. Ohm, "Recent Developments in Standardization of High Efficiency Video Coding (HEVC)," SPIE Applications of Digital Image Processing XXXIII, San Diego, USA, Proc. SPIE, vol. 7798, paper 7798-30, Aug. 2010.
References
1. Al'bekova Z. M., Kvashurin V. O., Tutik N. A. Inzenernyj vestnik Dona (Rus), 2016, №4. URL: ivdon.ru/ru/magazine/archive/n4y2016/3933.
2. Tropchenko A.Ju., Tropchenko A.A. Metody szhatija izobrazhenij, audiosignalov i video: Uchebnoe posobie [Methods for compressing images, audio and video: Textbook]. SPb: SPbGU ITMO, 2009. 108 p.
3. ITU-T Recommendation T.800. Information Technology JPEG2000 Image Coding System: Core Coding System, Geneva: ITU-T Series T: Terminal for Telematic Services. 2003. 212 p.
4. ITU-T Recommendation T.810. Information Technology JPEG2000 Image Coding System: Wireless. Geneva: ITU, 2007. 60 p.
5. Skorokhod S. V., Khusainov N. Sh. Izvestiya YuFU. Tekhnicheskie nauki. 2016, №8 (181). 14 p.
6. Drozdov S. N., Zhiglatyy A. N., Kravchenko P. P., Lutay V. N., Skorokhod S. V., Khusainov N. Sh. Standart JPEG2000: bazovye algoritmy, primery realizatsii i perspektivy primeneniya [JPEG2000 standard: basic algorithms, implementation examples and application perspectives]. Rostov on Don, Izdvo YuFU. 2014. 255p.
7. Network Working Group RFC 5371. RTP Payload Format for JPEG 2000 Video Streams. The Internet Security (IETF), 2006. 31 p.
8. V.K. Ignat'ev, A.V. Nikitin, S.V. Perchenko, D.A. Stankevich. Inzenernyj vestnik Dona (Rus), 2012, №2. URL: ivdon.ru/magazine/archive/n2y2012/771
9. Giakoumis I., Nikos Nikolaidis N. and Pitas I. Digital image processing techniques for the detection and removal of cracks in digitized paintings. IEEE Trans Image Process, Jan; 15(1), 175 - 188 p., 2006.
10. Sizjakin R.A., Voronin V.V., Marchuk V.I., Gapon N.V. Uspehi sovremennoj radiojelektroniki. Radiotehnika. M.: 2013, №6. 59-63 p.
11. G. J. Sullivan and J.R. Ohm, "Recent Developments in Standardization of High Efficiency Video Coding (HEVC)," SPIE Applications of Digital Image Processing XXXIII, San Diego, USA, Proc. SPIE, vol. 7798, paper 7798-30, Aug. 2010.