Оптимизированные дельта-преобразования второго порядка и компрессия аудиосигналов

Кравченко Павел Павлович; Каграманянц Виктор Александрович

УДК 681.3.069

П.П. Кравченко, В.А. Каграманянц ОПТИМИЗИРОВАННЫЕ ДЕЛЬТА-ПРЕОБРАЗОВАНИЯ ВТОРОГО ПОРЯДКА И КОМПРЕССИЯ АУДИОСИГНАЛОВ

Рассматривается метод компрессии аудиосигналов, основанный на оптимизированных дельта-преобразованиях второго порядка со сглаживанием и предлагается метод повышения компрессии, не приводящий к существенному снижению качества декодированного сигнала и повышению вычислительной трудоемкости алгоритма.

Компрессия; аудио; дельта-преобразование.

P.P. Kravchenko, V.A. Kagramanyants OPTIMIZED SECOND-ORDER DELTA-TRANSFORMATIONS AND AUDIO COMPRESSION

This paper discusses a method of audio compression, based on optimized second-order del-ta-transformations and proposes an approach of increasing compression ratio without significant decrease of decoded audio quality or increase of computational complexity.

Compression; audio; delta-modulation.

С развитием телекоммуникационных технологий все большее внимание уделяется разработке методов эффективной компрессии аудио- и видеоданных в реальном времени. Особую актуальность эта задача представляет для многоканальных систем. Известно множество методов кодирования аудиосигналов, отличающихся качественными характеристиками, вычислительной трудоемкостью, уровнем компрессии и т.д. Среди методов, отличающихся малой вычислительной трудоемкостью, особый интерес представляет основанный на дельта-преобразованиях второго порядка. Суть данного метода состоит в следующем [1].

Входной оцифрованный поток аудиоданных поступает в кодер в виде набора отсчетов импульсно-кодовой модуляции, разделенных во временной области на фрагменты (окна). В кодере производится расчет веса кванта преобразования и выбирается промежуточная частота дискретизации. Условия стыковки и начальные условия соседних аудио-фрагментов пересчитываются в зависимости от соотношения весов квантов цифрового преобразования и значений промежуточных частот дискретизации. Затем к отсчетам применяется алгоритм оптимизированного дельта-преобразования второго порядка со сглаживанием, который может быть представлен в следующем виде:

z = у, - yt;

VY = Y - Y •

i i i-1 *

Vy*,-! = ; n > 1;

n }>

Vz* =VYt -Vy*^;

Ai+1 = -sign(zi + 1.5Vzi*+(0.5Vzi*2/c - 0.125c)si'gn(Vzi*));

c > c; c > 0;

где yi = y(tj), i = 0,1,2... - значения амплитуды входного сигнала, Yi - значения аппроксимирующей функции, zi - ошибка преобразования, c* - постоянная величина, определяющая вес модуля кванта преобразования.

Известия ЮФУ. Технические науки

Тематический выпуск

Выбор веса кванта преобразования производится для каждого окна отдельно. Для определения веса модуля кванта преобразования с* можно воспользоваться следующими соотношениями [1]:

Е ^2 у ;

п, ср п, ср

Е

* п, ср

с =—; п к

к = 0,2 + 0,3,

где V2у - среднее значение V2 у на фрагменте п, а е - среднее значение мак-

n, ср п, ср

симального уровня наихудших воздействий на этом фрагменте.

Выбранное значение веса кванта оказывает влияние на проявление шума квантования и на характер перегрузок по крутизне. Ошибка, связанная с перегрузкой по крутизне, коррелирована с исходным сигналом и имеет составляющие, идентичные по частоте и близкие по фазе основным компонентам входного сигнала [2,3], что ослабляет влияние перегрузки по крутизне на качество кодирования. Шум квантования практически не коррелирован с исходным сигналом и, следовательно, намного более заметен для слушателя, чем шум перегрузки по крутизне при эквивалентном уровне мощности [3,4].

На принимающей стороне полученные компрессированные данные, представляющие собой дельта-последовательность - последовательность знаков квантов цифрового преобразования (дельта-бит), передаются в декодер, который выполняет восстановление значений отсчетов аудио-фрагмента следующим образом:

V 2у+ = с*Л т;

VI',+ 1 ^ + V %+{;

У =У+VY ■

1 ,+1 1 , “ У 1 ,+1 ’

где У. и VI. - значения аппроксимирующей функции и ее приращения на предыдущем шаге, V 2У - вторая разность на текущем шаге, у и VI те-

, +1 , +1 , +1

кущие значения аппроксимирующей функции и ее приращения.

Описанный выше метод обладает низкой вычислительной трудоемкостью в сравнении с другими методами компрессии аудио, что особенно характерно для декодирования (2 базовых операции сложения). В то же время, к недостаткам можно отнести сравнительно более низкую степень компрессии, уступающую многим известным методам. Поэтому актуальной является задача исследования возможности повышения результирующей степени компрессии метода на основе дельта-преобразований второго порядка.

В данной работе предлагается метод повышения степени компрессии без существенного снижения качества декодированного сигнала и повышения вычислительной трудоемкости алгоритма.

Исходная дельта-последовательность рассматривается как последовательность отрезков длиной 4 бита. Экспериментальные исследования показывают, что распределение вероятностей появления этих отрезков примерно одинаково для подавляющего большинства различных дельта-последовательностей. Тем не менее, разброс значений вероятности появления различных 4-битных отрезков невелик, что не позволяет эффективно воспользоваться энтропийными методами кодирования данных.

С целью повышения степени компрессии предлагается следующий метод модификации исходной последовательности, не приводящий к заметному снижению качества выходного аудиосигнала.

Поскольку длина отрезка равна 4 битам, то существует 16 возможных типов таких отрезков. Среди этих 16 отрезков встречаются такие пары отрезков, которые дают при декодировании идентичные значения первой производной сигнала и значения амплитуды сигнала, отличающиеся не более чем на вес модуля кванта преобразования с* при условии совпадения начальных условий. В этом случае появляется возможность кодировать такие отрезки одним символом, что приводит к сокращению общего числа отрезков-символов с 16 до 11. При этом исходный алгоритм оптимизированного дельта-преобразования второго порядка со сглаживанием без каких-либо модификаций автоматически обрабатывает указанное выше отклонение амплитуды сигнала. Благодаря этому, рассматриваемый метод модификации дельта-последовательности приводит к незначительному ухудшению качества декодированного аудиосигнала.

Полученный сокращенный алфавит из 11 символов с учетом распределения их вероятностей затем кодируется с применением специального метода статистического кодирования. Вводимое усложнение алгоритма позволяет сохранить вычислительную трудоемкость на достаточно низком уровне.

Проведенные эксперименты показывают, что предложенный метод модификации дельта-последовательности позволяет обеспечить дополнительное повышение степени компрессии на 20-25% при снижении отношения сигнал/шум около 1 дБ.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Кравченко П.П. Основы теории оптимизированных дельта-преобразований второго порядка. Цифровое управление, сжатие и параллельная обработка информации: Монография. - Таганрог: Изд-во ТТИ ЮФУ, 2008. - 194 с.

2. Венедиктов М.Д., Женевский Ю.П., Марков В.В., Эйдус Г.С. Дельта-модуляция. Теория и применение. - М.: Связь, 1976. - 224 с.

3. Стил Р. Принципы дельта-модуляции / Под ред. В.В. Маркова. - М.: Связь, 1979. - 368 с.

4. Феер К. Беспроводная цифровая связь. - М.: Радио и связь, 2000 - 520 с.

Кравченко Павел Павлович

Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.

E-mail: [email protected].

347928, .Таганрог, пер. Некрасовский, 44.

Тел.: 88634314945.

Каграманянц Виктор Александрович

E-mail: [email protected].

Тел.: 88634371746.

Kravchenko Pavel Pavlovich

Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education “Southern Federal University”.

E-mail: [email protected].

44, Nekrasovski, Taganrog, 347928, Russia.

Phone: +78634314945.

Victor Alexandrovich Kagramanyants

E-mail: [email protected].

Phone: +78634371746.

OPTIMIZED SECOND-ORDER DELTA-TRANSFORMATIONS AND AUDIO COMPRESSION

Текст научной работы на тему «Оптимизированные дельта-преобразования второго порядка и компрессия аудиосигналов»