УДК 62-519:681.5
В.В. БАРАННИК, О.Ю. ОТМАН ШАДИ, А. В. ХАХАНОВА
МЕТОД СНИЖЕНИЯ ИНТЕНСИВНОСТИ ВИДЕОПОТОКА В ИНФОКОММУНИКАЦИОННЫХ СИСТЕМАХ
Показывается актуальность вопросов, связанных с повышением качества предоставления видеоинформационных услуг с использованием беспроводных телекоммуникационных технологий. Обосновывается важность уменьшения нагрузки на сеть на основе снижения интенсивности сжатого видеопотока. Выявляются уязвимые стороны функционирования стандартизированных технологий обработки базовых кадров. Рассматриваются отличительные этапы технологии кодирования базовых кадров для снижения интенсивности их кодового представления. Излагаются основные этапы оценки интенсивности потока, приходящегося на базовый кадр, с учетом формирования кодовых конструкций сжатого представления трансформант на основе диагонально-неравномерного позиционного кодирования. Разрабатывается метод для оценки интенсивности на группу кадров и всего видеопотока с учетом: дифференцированного вклада типов кадров в интенсивность и качество визуального восприятия реконструированного видеопотока; компрессии базовых кадров на основе их трансформирования и последующего диагонально-неравномерного позиционного кодирования.
1. Введение
Совершенствование сектора предоставления видеоинформационных услуг с использованием беспроводных телекоммуникационных технологий связан с необходимостью снижения нагрузки на сеть [1, 2]. Это неизбежно повысит качество получаемой видеоинформации. Поэтому уменьшение интенсивности потока кадров в процессе их компрессии является актуальным направлением научно-прикладных исследований [3-5]. Здесь ключевая составляющая интенсивности потока определяется интенсивностью кодового представления базового кадра. Это обусловлено тем, что базовый кадр в группе формирует кадры Р-типа и В-типа [4-6]. Для обработки базового кадра используется принципиально новый метод снижения интенсивности его кодового описания. Он базируется на диагональнонеравномерном позиционном кодировании трансформант в неравновесном базисе оснований. В то же время для такого метода отсутствует соответствующий метод оценки интенсивности. Отсюда цель исследования состоит в разработке метода для оценки интенсивности видеопотока с учетом использования нового кодека для кодирования базовых кадров.
2. Обоснование необходимости обработки базового кадра
Базовой структурной единицей MPEG-потока является групповой кадр (ГК, Group of Pictures - GOP). Он состоит из нескольких кадров разного типа. Каждый тип кадров обрабатывается с использованием методов на JPEG совместимой платформе. При этом учитывается иерархия относительно зависимости порядка реконструкции кадров в группе. В результате устанавливается неравнозначное влияние кадров различных типов на качество реконструкции всех кадров в GOP. Для JPEG технологий такая неравнозначность учитывается путем выбора соответствующей стратегии квантизации. Здесь вклад интенсивности кодового представления базового кадра в суммарную интенсивность видеопотока в зависимости от качества визуальной реконструкции кадров изменяется от 50 до 75 % и возрастает с увеличением качества реконструкции видеопотока. Это указывает на значимое влияние интенсивности базового кадра на суммарную интенсивность видеопотока.
3. Оценка уязвимостей существующих технологий обработки базового кадра
Стандартизированные технологии обработки базовых кадров MPEG-технологий характеризуются наличием уязвимостей, а именно:
1) степень сжатия достигает наибольших значений для низких величин ПОСШ;
23
2) в случае необходимости обеспечить ПОСШ на уровне 45 дБ интенсивность кодового представления необходимо дополнительно снизить в 1,5 раза;
3) для базовых кадров с высоким пространственным разрешением, чтобы обеспечить своевременную доставку с использованием инфокоммуникационных систем с пропускной
способностью Uп > 100 Мбит/с, при наличии искажений на уровне ПОСШ 25 - 30 дБ интенсивность сжатого видеопотока необходимо уменьшить как минимум в 1,3 раза;
4) для протокола TCP при увеличении числа узлов от 1 до 20 задержка увеличится в 8 раз, а при появлении потерь пакетов до 20% от их общего числа - в 18 раз;
5) в случае использования протокола UDP потерянные или поврежденные пакеты в ходе передачи не передаются вновь передающей стороной и при этом считается, что все сообщение является доставленным до конечного оборудования. Анализ результатов обработки базовых кадров в зависимости от количества потерянных пакетов позволяет заключить, что для насыщенных базовых кадров значение ПОСШ снижается в среднем на 86% при 1% потерь пакетов и на 92% соответственно при 3% потерь пакетов.
Поэтому необходимо создавать новые кодеки базовых кадров.
4. Разработка технологии кодирования базового кадра
Принципиально новый кодек базового кадра основан на том, что компрессия трансформанты обеспечивается в результате диагонально-неравномерного позиционного кодирования. Особенность метода заключается в том, что:
1) позиционные числа строятся на базе неравномерных диагоналей трансформанты;
2) основания элементов диагоналей определяются как значения динамических диапазонов на основе неравномерно-диагонального метода выявления;
3) первая и последняя диагонали исключаются из базиса оснований НДП чисел и обрабатываются отдельно. Это обусловлено тем, что: первая диагональ содержит низкочастотную компоненту трансформанты, которая имеет резко отличительные характеристики относительно других компонент трансформант; последняя диагональ для достаточно широкого класса изображений будет содержать компоненту с нулевым значением.
5.Оценка интенсивности кодового представления базового кадра
Проведем сначала оценку интенсивности II для компактно-представленного кадра I-типа с использованием разработанного метода.
Здесь длина Q^nxn) кодовой конструкции сжатого представления фрагмента определяется по формуле
_ ОТ = Qn + Qz + Qr. (')
где Qn - количество разрядов на представление кодограммы компрессионного описания
трансформанты; Qz - компактное представление двоичной матрицы знаков; QR - количество бит на представление шага R квантизации.
Соответственно величина Qn определяется как суммарное количество разрядов, задаваемое следующей формулой:
Qn = QDC + Q(nxn)-2 + Qv д (бит), (2)
здесь Qdc - длина статистического кода низкочастотной DC-компоненты; Q(nxn)_2 -количество разрядов на представление трансформанты путем диагонально-неравномерного позиционного кодирования без учета первой и последней диагоналей; Qvд - количество разрядов на представление последней диагонали трансформанты.
_f
Соответственно суммарное количество Q (nxn)-2 разрядов на представление всех кодовых значений диагональных неравномерных позиционных чисел будет определяться на основе соотношения
24
__ 2n2n-2
Q(nxn)-2 _ ZQ§,ne _ Z([n§^og2d§ ] + !) (бит) (3)
§=2 §=2
Свернув выражения (1)-(3) в одно, получим соотношение для величины iI" xn), а именно:
l(nxn = qdc + £ ([n^ fog2d^ ] + 1) + QУд + Qz + Qr (4)
%=2
На основе данного выражения интенсивность Ij потока, приходящегося на один базовый кадр, будет формироваться как сумма интенсивностей его фрагментов, т.е.
MN/nn
II = S IS"iX") . (5)
i =1
Здесь Ijnixn) - интенсивность i-го фрагмента базового кадра; MN/nn - количество
фрагментов размером (n х n) в базовом кадре; MN - размер базового кадра.
6. Оценка интенсивности видеопотока
Рассмотрим теперь оценку интенсивности I(GOP)k компрессированного видеопотока, приходящуюся на группу кадров, с использованием разработанной технологии диагонально-неравномерного позиционного кодирования. Здесь принимается в расчет, что группа состоит из 8 кадров и включает в себя одни кадр I-типа, два кадра Р-типа и пять кадров В-типа. Обработка кадров проводится в соответствии с режимом реального времени. В этом случае не учитывается компенсация движения между кадрами в потоке и допускается, что степень сжатия для кадров конкретного типа будет отличаться не менее, чем на 5%. Тогда с учетом выражения для интенсивности базового кадра получим следующее соотношение для оценки интенсивности I(GOP)k:
I(GOP)k = II + 2IP + 5IB =
MN/nn
z
i—1
I(nxn)
II,i
+ 2Ip + 5Ib —
MN/nn _
= Z (Qdc
i=1
2n-2 _ _ _
Z ( [ n§ ^og2 d§ ] + 1) + Qуд + QZ + QR )i + 2 IP + 5 IB, (6)
^~2
где II , IP , IB - значения интенсивностей для компактно-представленных кадров соответственно I-типа, Р-типа и В типа.
Здесь величина I(GOP)k оценивается как количество бит, передаваемое за время tGOp,
равное tGOP = 8/v t (с), где v t - количество кадров, которое передается за 1 с.
Каждый тип кадров обрабатывается с использованием методов на JPEG совместимой платформе. При этом учитывается иерархия относительно зависимости порядка реконструкции кадров в группе. В результате устанавливается неравнозначное влияние кадров различных типов на качество реконструкции всех кадров в GOP.
Оценка интенсивностей I(GOP)k и Ik24), приходящихся соответственно на группу кадров за время tGOP и на v t кадров за 1 с, рассматривается в таблице и на диаграммах рисунка. Здесь v t = 24 кадрам. Расчеты проводятся по формуле (6). В последней строке
таблицы приводятся расчеты величины AI(GOP)k , оцениваемой в процентах как уровень снижения интенсивности потока группы кадров за счет уменьшения интенсивности базового кадра. Получение диаграмм на рисунке осуществлялось для трех режимов обработки кадров с учетом обеспечения следующих уровней ПОСШ:
- режим 1, высокое качество базового кадра: I-кадр - 42 дБ, Р-кадр - 28 дБ, В-кадр -22 дБ;
25
- режим 2, хорошее качество базового кадра: 1-кадр - 40 дБ, Р-кадр - 28 дБ, В-кадр -22 дБ;
- режим 2, достаточное качество базового кадра: 1-кадр - 38 дБ, Р-кадр - 28 дБ, В-кадр - 22 дБ.
По результатам исследований данных в таблице и диаграмм на рисунке можно сделать такие заключения:
1. Интенсивность потока кадров с учетом использования для сжатия базового кадра созданной технологии изменяется в пределах от 3,7 Мбит/с для режима достаточного визуального качества до 6,3 Мбит/с для режима хорошего качества.
2. За счет обработки базовых кадров на основе диагонально-неравномерного позиционного кодирования трансформант достигается снижение суммарной интенсивности видеопотока от 10 до 13 %. Наибольшее снижение интенсивности происходит в случае наиболее весомого вклада интенсивности базовых кадров в суммарную интенсивность. Такое наблюдается для режима высокого визуального качества реконструкции видеопотока.
Зависимость интенсивностей I(GOP)k и Ij,(24) от ПОСШ, М бит/с
Т ип кадра h дБ
I-кадр 42 40 40 40 38 38
Р-кадр 28 28 30 32 28 30
В-кадр 22 22 24 24 22 24
I(GOP)k 2,13 1,76 2,01 2,17 1,24 1,49
г (24) Ik 6,3 5,2 6 6,4 3,7 4,3
AI(GOP)k, % -11,25 -12 -10,7 -9,6 -11,43 -9,7
Значения интенсивностей I(GOP)k и I[,(24) для стандартизированной (СТТ) и разработанной (РТ) технологии обработки базовых кадров в зависимости от режимов ПОСШ видеопотока
3. Снижение интенсивности видеопотока обеспечивает:
- с одной стороны, использование для его передачи беспроводных технологий с более низкой пропускной способностью, а именно на уровне 4 - 10 Мбит/с;
- с другой стороны, повышение качества визуальной оценки видеопотока за счет использования соответствующих матриц коррекции компонент трансформант. В первую очередь появляется возможность снизить искажения без повышения интенсивности видео-
26
потока одновременно для Р-кадров с уровня 28 до уровня 32 дБ (таблица, второй и четвертый столбцы) и для кадров В-типа с 22 дБ до 24 дБ.
По материалам исследований можно сделать следующие выводы:
1) разработан метод оценки интенсивности на группу кадров и всего видеопотока с учетом:
- дифференцированного вклада типов кадров в интенсивность и качество визуального восприятия реконструированного видеопотока;
- компрессии базовых кадров на основе их трансформирования и последующего диагонально-неравномерного позиционного кодирования;
2) достигнуто снижение дисбаланса между интенсивностью Ik и скоростью передачи
по сети U п в среднем на 12 %. Это позволяет:
- использовать для передачи видеопотока ИКС технологий с более низкой пропускной способностью, а именно на уровне 4 - 10 Мбит/с;
- повысить качество визуальной оценки видеопотока за счет снижения искажений без повышения интенсивности видеопотока одновременно для Р-кадров с уровня 28 до уровня 32 дБ (таблица, второй и четвертый столбцы) и для кадров В-типа с 22 до 24 дБ.
Список литературы: 1. Олифер В.Г. Компьютерные сети. Принципы, технологии, протоколы: Учебник для вузов. 3-е изд. / В.Г. Олифер, Н.А. Олифер. СПб.: Питер, 2006. 958 с. 2. GonzalesR.C. Digital image processing / R.C. Gonzales, R.E. Woods. - Prentice Inc. Upper Saddle River, New Jersey 2002. 779 p. 3. Lee
S.Y. Temporally coherentvideo matting / S.Y. Lee, J.C. Yoon, I.K. Lee// Graphical Models 72. 2010. P. 25 - 33.
4. Красильников Н.Н. Цифровая обработка изображений. М.: Вузовская книга, 2011.320 с. 5. Баранник В.В. Кодирование трансформированных изображений в инфокоммуникационных системах / В.В. Баранник, В.П. Поляков. Х.: ХУПС, 2010. 234 с. 6. Barannik V. Method Of Encoding Transformant Uolsha Is In Systems Air Monitoring Of Earth / V. Barannik, A. Yakovenko, А. Krasnorutkiy // Lviv-Slavsko, Ukraine, Lviv Polytechnic National University, International Conference TCSET’2009, Modern problems of radio engineering, telecommunications and computer science, February 19 - 23, 2009. P. 381-383.
Поступила в редколлегию 23.05.2014 Баранник Владимир Викторович, д-р техн. наук, профессор, начальник кафедры боевого применения и эксплуатации АСУ Харьковского университета Воздушных Сил. Научные интересы: обработка и передача информации. Адрес: Украина, 61023, Харьков, ул. Сумская, 77/79.
Отман Шади О.Ю., аспирант ХНУРЭ. Научные интересы: обработка и передача информации. Адрес: Украина, 61166, Харьков, ул. Ленина, 14.
Хаханова Анна Владимировна, канд. техн. наук, доцент кафедры АПВТ ХНУРЭ. Научные интересы: обработка и передача информации. Адрес: Украина, 61166, Харьков, ул. Ленина, 14.
27