УДК 621.391
СОВМЕСТНЫЙ СПИСОЧНЫЙ ДЕКОДЕР ТУРБОКОДА И ВОКОДЕРА AMR-NB ДЛЯ СЕТЕЙ ЧЕТВЕРТОГО ПОКОЛЕНИЯ
А. И. Акмалходжаевa,1, программист
аСанкт-Петербургский государственный университет аэрокосмического приборостроения,
Санкт-Петербург, РФ
Постановка проблемы: на практике декодирование кодера канала и источника в системах связи производится независимо, что ограничивает возможность использования избыточности источника для улучшений производительности приемника в целом. Целью работы является разработка алгоритма совместного декодирования турбокода и кодера источника с избыточностью для сетей четвертого поколения. Результаты: предложен совместный списочный декодер турбокода и кодера источника. При построении декодера учитывается тот факт, что в сетях четвертого поколения данные источника, т. е. коррелированные данные, составляют лишь часть информационного слова. Поэтому в первую очередь целью алгоритма является корректное декодирование коррелированных бит за счет избыточности и списочного декодирования. После этого влияние правильно декодированных бит распространяется на все информационное слово благодаря перемежителю в схеме турбокода. Критерием выбора правильного слова при списочном декодировании является корректность проверки CRC. Результаты работы нового декодера представлены для турбокода стандарта 3GPP LTE и вокодера AMR-NB. Выигрыш, достигаемый при использовании нового алгоритма по сравнению с обычным итеративным декодером, составляет 0,15 дБ по вероятности ошибки на декодированное слово. В свою очередь, это соответствует улучшению качества принимаемой речи в 0,4—0,15 MOS. Практическая значимость: предложенный алгоритм позволяет уменьшить вероятность ошибки на декодированное слово и значительно улучшить качество принимаемой речи, что является важной и актуальной задачей в современных беспроводных сетях.
Ключевые слова — турбокод, совместное декодирование, кодирование речи, сети четвертого поколения.
Введение
С точки зрения теории кодирования и теории информации задачу сжатия источника и передачи информации по каналу связи можно решать независимо без потери качества для системы передачи в целом [1]. Однако теоремы кодирования, исследующие потенциальные возможности систем связи, доказываются в условиях отсутствия ограничений на длину кодового слова, т. е. в отсутствие ограничений на сложность кодирующих и декодирующих устройств.
На практике такие ограничения часто являются принципиальными. Поэтому задачи совместного кодирования и декодирования источника и канала связи вызывают значительный теоретический и практический интерес. Особенно это касается передачи голосовых и видеоданных, при сжатии которых не от всей избыточности удается избавиться.
В настоящей статье предложен алгоритм совместного декодирования канала и источника (СДКИ), основанный на применении турбоде-кодирования. Рассматривается использование предложенного алгоритма в сетях четвертого поколения на примере передачи речи в стандарте 3GPP КГЕ [2].
1 Научный руководитель — профессор, доктор технических наук, директор института информационных систем и защиты информации, заведующий кафедрой безопасности информационных систем Санкт-Петербургского государственного университета аэрокосмического приборостроения Е. А. Крук.
Избыточность источника и ее декодирование
Рассмотрим кодер источника с фиксированной длиной, выходом которого являются пакеты данных, которые в дальнейшем поступают на кодер канала. Обозначим такой пакет как I = (Z^ ..., Im), где Ii — это i-й символ пакета длиной q бит. Избыточность, связанная с различной вероятностью появления символов на выходе кодера источника, может быть использована как априорная информация на входе декодера канала. Поэтому наибольший интерес вызывает избыточность, которая обусловлена межсимвольной корреляцией и определяется вероятностями P(Ii\li_1, ..., Ij). Если P(I£\I£-1, ..., Ij) = 1/2q, то зависимости нет. В противном случае говорят о наличии последней. Чаще всего корреляция между символами рассматривается как марковский процесс первого порядка, который характеризуется лишь связями между соседними символами
P(Ii |Ii_!,..., I1) = P(Ii |Ii_! ). (1)
Во многих случаях это предположение верно, в частности, для речевых кодеков.
Марковский процесс, описывающий источник, можно представить как полносвязную решетку, которая состоит из m секций и где каждый переход соответствует выходу символа кодера источника. Пример такой решетки представлен на рис. 1, где через обозначено состояние решетки в i-й момент времени и Q = 1/2q. По аналогии
■ Рис. 1. Полносвязная решетка для марковского процесса первого порядка
со сверточными кодами для оценки значении символов при известных переходных вероятностях может быть использован алгоритм В^И [3].
Для совместного декодирования кодеров источника и канала существует два способа. Первый связан с построением единой решетки, по которой производится декодирование. Однако данный подход является трудоемким и не реализуемым в практических системах. Второй подход основан на использовании турбопринципа [4], в ходе которого декодеры канала и источника итеративно обмениваются информацией, за счет чего достигается лучшее качество приема. В данной статье рассматривается второй метод совместного декодирования. Далее показано, как происходит декодирование источника, и представлена схема совместного итеративного декодера.
Рассмотрим модель системы, где выход источника описывается марковским процессом первого порядка с Q состояниями. Битовое представление последовательности символов I обозначим как и = {и1, ..., ит}, где и; = {и0,..., и?-1} — битовое представление ¿-го символа. Пусть канал связи является каналом с аддитивным белым гауссовым шумом (АБГШ) [5], тогда если для передачи используется двоичная фазовая манипуляция, то принятая последовательность будет выглядеть как г = {г1, /.., гт}, где г; = {г/0,..., г?"1}. Соответственно г' = в' + п;, где в' = 2и' - 1, а и£ — независимая гауссова величина с нулевым математическим ожиданием и дисперсией ст2. Плотность условной вероятности значения г- гауссова канала описывается как
¿1 ("в')
>(( 1 и )=ж
,2ст2
(2)
Поскольку канал без памяти, то для символа I£ можно написать следующее выражение:
Р()11) = ПР(г( I иI). (3)
1=0
Используя алгоритм В^И на декодере источника, можно оценить апостериорные вероятности Р(1.|г) для всех возможных символов в каждой секции решетки. Символ, для которого значение Р(1£|г) является наибольшим, считается правильным. Рассчитаем вероятность того, что £-й символ последовательности I при условии г равен некоторому значению Р2. В соответствии с алгоритмом В^И эта вероятность может быть рассчитана как
<Э-1
Р(1; = Р2 I г) = £ Р(Т; = Р1 ,г<; )Р(г>; | Т;+1 = Р2 ) X
Р1 = 0
хР(Т;+1 = Р2 ,) I Т; = Р1)/ Р(г), (4)
где г<-, г-, г>- — значения, обозначающие символы, принятые до момента времени £, в £-й момент и после него соответственно. Обычно вероятности Р(Т£ = Р1, г<-), Р(Т£+1=Р2, г£|Т£ = Р1), Р(г>£|Т£+1 = Р2) обозначают как а-(Р^, у-(Р1, Р2), Р-+1^) [3]. Для расчета а-+1^) и РДР1) существуют рекуррентные выражения
е-1
а
;+1
(Р2) = ^ а; (Р1 )У; ^ Р2);
Р1 = о
(5)
<Э-1
Р; (Р1) =ХР;+1 (Р2 )У - (Р1, Р2 ). (6)
Р2 = 0
Начальные значения а0(Р1) и Р^^) обычно устанавливают равными \/Q.
Значение у-(Р1, Р2) называется метрикой перехода и вычисляется как
У; (Р1, Р2) = Р(Т;+1 = Р2,г;1Т; = Р1) = = Р(г |Т; = Р1,Т ; +1 = Р2)Р(Т ;+1 = Р2 |Т; = Л) (7)
где Р(г-|Т- = Р1, Т-+1 = Р2) легко находится с помощью выражения (3). Вероятность Р(Т-+1 = = Р2Т = Р1) есть не что иное, как переходная вероятность рассматриваемого марковского процесса, которая считается известной. Таким образом, можно рассчитать вероятности символов в каждой секции решетки. В дальнейшем из вычисленных значений можно получить вероятности бит каждого символа следующим образом:
Р (и I = Х\ Г )= ^ Р(1; |Г),
все I;, где иI = х
где х е {0, 1} — значение бита.
Необходимо, чтобы при совместном декодировании кодера канала и источника декодер канала мог обрабатывать мягкие значения и учитывать априорные значения бит. Примером такого кода может быть сверточный код или турбокод,
■ Рис. 2. Итеративная схема декодирования источника и турбокода
где для декодирования используется алгоритм Log-MAP или Scaled Max-Log-MAP [6]. При совместном декодировании сверточного кода и источника с избыточностью можно использовать итеративную схему, которая описана в работе [7]. В данном случае выходные значения декодера сверточного кода можно представить как произведение априорной и канальной составляющих вероятности р(uj | г J = PchPap• Для декодера источника выходные значения также можно записать в виде Р(uj | г) = PchPext, где Р^ = pbch, а PPext — составляющая, которая известна благодаря избыточности источника. Таким образом, при итерировании совместного алгоритма два декодера обмениваются канальными и внешними составляющими, т. е. Pch = Pch и Pap = Pext • Однако данная техника может быть улучшена для турбокода.
Основными элементами турбокода являются два рекурсивных систематических сверточных кода (компонентные коды), связанных между собой перемежителем [4]. В качестве декодера используется итеративная схема, ядром которой является декодер компонентного кода с мягким входом и выходом. Для улучшения параметров совместного декодирования декодер источника необходимо внедрить непосредственно в итеративный процесс турбодекодирования. Итоговая схема будет выглядеть, как показано на рис. 2.
Совместный списочный декодер турбокода и источника с избыточностью для систем с коммутацией пакетов
Большое распространение турбокоды получили за счет использования в связи четвертого поколения 3GPP LTE [8]. Сеть LTE организована как сеть с коммутацией пакетов, и все данные, в том числе и голосовые, используют IP-протокол для передачи. Таким образом, при организации совместного декодирования необходимо учитывать специфику формирования пакета данных на входе кодера канала. В системах с коммутацией пакетов данные с выхода кодера источника обрабатываются на сетевом (IP), транспортном (TCP\ UDP) и нижестоящих уровнях, после чего посту-
пают на физический уровень. Прежде чем закодировать данные, к ним прибавляют проверку CRC для обнаружения ошибок декодирования на приемнике. В результате этих операций совместное декодирование может быть использовано лишь для части информационного слова, что сильно снижает эффективность декодирования (рис. 3). При совместном декодировании такого информационного слова биты источника декодируются лучше за счет имеющейся избыточности, при этом они влияют на рядом стоящие биты. В случае турбодекодирования за счет использования перемежителя можно говорить о том, что биты источника оказывают свое влияние на все слово.
Для улучшения параметров декодирования в такой системе предлагается следующий алгоритм. Допустим, что благодаря избыточности удалось успешно декодировать символы источника. Тогда, чтобы увеличить влияние этих бит на все остальные, можно установить их надежности равными ±ю, в зависимости от значения бита. В дальнейшем такие биты будем называть пилотными, по аналогии с пилотными сигналами. Однако не всегда за счет избыточности данные источника удается успешно декодировать. Но, учитывая то, что символы источника декодируются с меньшей вероятностью ошибки на бит, чем остальные, оставшиеся ошибки в битах источника можно исправить за счет использования списочного декодера Витерби [9] на решетке первого компонентного кода турбокода. Но списочный декодер Витерби нужно использовать не на всей решетке, а лишь в окне, где расположены данные с выхода кодера источника. В результате будет получен список последовательностей, из которых необходимо выбрать правильную. После этого, приняв ее как пилотную, выполнить несколько итераций обычного турбодеко-дера, чтобы увеличить влияние пилотных бит на остальное информационное слово. Если нет возможности определить корректность декодированных бит источника, можно использовать параллельный списочный подход [10], т. е. предположить, что каждая последовательность является корректной, принять эти значения как пилотные и независимо для каждого элемента списка выполнить итерации обычного турбоде-кодера. Декодирование считается успешным, если проверка контрольной суммы CRC, добавленной на физическом уровне, является корректной. С учетом всех замечаний для обоих случаев
Заголовки Данные Данные CRC
с избыточностью без избыточности
■ Рис. 3. Структура информационного слова на входе кодера канала
а)
Итерации совместного турбо-декодера Оконный алгоритм Витерби для коррелированных символов
Есть правильный
■ Рис. 4. Схема совместного списочного турбодекодера с возможностью (а) и без возможности (б) проверки корректности символов источника
представим схему результирующего декодера (рис. 4, а, б).
Для оценки производительности предложенного декодера рассмотрим систему 3GPP LTE. Поскольку передача речи является одним из основных пунктов дохода современных операторов, то качество принимаемой речи играет важную роль. Поэтому в качестве источника принят вокодер AMR-NB, который используется для сжатия голоса в сетях LTE.
Передача речи в стандарте 3GPP LTE
Для передачи голоса в 3GPP LTE кодеком по умолчанию является AMR-NB. Он работает на основе алгоритма ACELP [11] и поддерживает скорости кодирования от 4,75 до 12,2 Кбит/с, но основным является режим 12,2 Кбит/с, который будет обсуждаться далее. В рамках вокодера AMR определен алгоритм VAD обнаружения фреймов, которые не содержат речевого сигнала и для передачи которых используются короткие пакеты. Такие пакеты не рассматривались в ходе анализа.
Для кодирования речи алгоритм AMR-NB делит входной речевой сигнал на фреймы по 20 мс и для каждого извлекает параметры (коэффициенты) артикуляторного фильтра. После этого фрейм делится на 4 сабфрейма, для которых вычисляются индексы и коэффициенты усиления фиксированной и адаптивной кодовых книг. Поскольку
коэффициент адаптивной кодовой книги характеризует период основного тона человека, который мало изменяется во времени, то во втором и четвертом сабфреймах каждого фрейма передается лишь значение приращения относительно предыдущего сабфрейма. Декодер вокодера АМИ^В показан на рис. 5 [12].
Все вычисленные параметры обладают большой избыточностью, поэтому перед передачей они предобрабатываются и квантуются, что приводит к заметному уменьшению размера передаваемой информации и к тому, что в параметрах, относящихся к артикуляторному фильтру, от имеющейся избыточности удается практически полностью избавиться. Однако оставшуюся корреляцию остальных параметров, для которых ниже представлены результаты измерения символьной корреляции, можно использовать для улучшения параметров приема.
Битовый поток с выхода вокодера делится и группируется в три класса — А, В и С. В классе А находятся наиболее важные для восстанов-
■ Рис. 5. Схема декодера ACELP
ления речи биты, которые соответствуют наиболее коррелированным данным. В класс B и C входят биты менее важные и чувствительные к ошибкам и относящиеся к некоррелированным данным. После этого к сформированному AMR-пакету добавляется заголовок RTP-пакета и RTP-заголовок. Стандартом [12] предусмотрено два возможных формата заголовка RTP-пакета, один из которых включает 8-битовую проверку CRC для бит класса A. Так как голосовые пакеты чувствительны к заголовкам, на транспортном уровне для передачи используются протоколы UDP и IP. Перед поступлением на физический уровень голосовой пакет с добавленными заголовками обрабатывается на PDCP-, RLC- и MAC-уровнях, которые добавляют свои собственные 1-2-байтовые заголовки. Поскольку общая длина RTP/ UDP/IP заголовков достаточно велика, а сами эти заголовки обладают большой избыточностью, на PDCP-уровне они подвергаются компрессии с помощью алгоритма ROHC, после чего их длина с 40-60 Б уменьшается до 2-3 Б. На физическом уровне к сформатированному пакету добавляется CRC длиной 24 бита («CRC24B») [8], после чего пакет кодируется. С учетом всех уровней обработки длина AMR-пакета увеличивается с 244 бит до минимальных 320 бит на входе кодера канала.
Учитывая тот факт, что все коррелированные данные находятся в битах класса A, на входе первого компонентного кода информационное слово будет выглядеть, как показано на рис. 6. Также на рисунке изображено окно, для которого будет выполняться оконный списочный алгоритм Витерби предложенного алгоритма с учетом использования CRC в заголовке RTP-пакета, в противном случае окном являются лишь биты класса A.
Избыточность на выходе вокодера AMR-NB
Для оценки избыточности на выходе речевых кодеков исследованы мужская и женская русская речь длительностью от 1,5 до 2 ч. Оба сигнала были сжаты с помощью алгоритма AMR-NB, и была собрана статистика по различным параметрам, которые в дальнейшем рассматривались отдельно. Зависимость параметров рассматривалась в рамках одного фрейма и между ними.
Для оценки корреляции в рамках одного фрейма с помощью собранной статистики оценены вероятности Р(-1), Р((-1,Т|) и Р(т\ 1Т-1), где Т• е {1,..., Я -1} — возможное значение £-го параметра в ^м фрейме. Также рассчитаны вероятности Р(тН,Т и Р( |Т[-1), описывающие корреляцию между фреймами.
С помощью полученных вероятностей для различных параметров рассчитаны энтропия
Я-1
Н(Т) = Р(Т = к)1оя2Р(Т = к)
к=0
и условная энтропия для коррелированных параметров
Н (( 1Т-1 ) =
Я-1Я-1
= -Х^Р ( = к, Т •-! = I )1оЯ2 Р (( = к| Т-1 = /);
к=0 '=0
Н (Т I |Т ?-1 ) =
= -Х^Р(т; = к, Т" = I)Р(т; = к IТн = I).
к=0 '=0
Избыточность была измерена как разность между количеством бит, которые используются по стандарту для передачи, и измеренным значением энтропии:
ДЩН(Т)) = ? - Н(Т);
ДЩ(Н(( IТ-1)) = ? - Н(т; IТ--1);
ДЩ(Н(( | Т?-1)) = ? - Н(т11Т"1).
В результате анализа получено, что наибольшей корреляцией обладает индекс адаптивной кодовой книги, поскольку период основного тона, который он характеризует, мало меняется во времени. Также большой межфреймовой зависимостью обладают первый и второй индексы, отвечающие за передачу информации о коэффициентах артикуляторного фильтра. Меньшей избыточностью обладают коэффициенты усиления обеих кодовых книг. Во всех остальных параметрах
Заголовки Заголовок AMR AMR-фрейм «CRC24B»
CRC 8 Биты класса A Биты класса B Биты класса C
«-*
Окно списочного декодера Витерби с учетом CRC ■ Рис. 6. Схема AMR-пакета
■ Результаты анализа избыточности мужской русской речи (AMR-NB)
Параметр [2] АД ( H ( Y)) АД (H ( 1 1 f)) q
Корреляция параметров внутри фрейма
Коэффициент усиления адаптивной кодовой книги 0,1 0,46 4
Индекс адаптивной кодовой книги 0,17 2,82 9
Индекс адаптивной кодовой книги (величина приращения) 0,57 0,75 6
Коэффициент усиления фиксированной кодовой книги 0,77 1,22 5
Корреляция параметров между фреймами
LSF-коэффициент артикуляторного фильтра:
первый 1,43 2,16 7
второй 0,88 1,86 8
Индекс адаптивной кодовой книги:
первый 0,17 2,46 9
второй 0,17 2,47 9
Коэффициент усиления фиксированной кодовой книги:
первый 0,74 1,21 5
второй 0,79 1,28 5
третий 0,79 1,26 5
четвертый 0,76 1,24 5
избыточность практически отсутствует, в то время как кодовые последовательности фиксированной кодовой книги имеют случайный характер. Также из полученных результатов сделан вывод, что биты, которые соответствуют наиболее коррелированным параметрам, относятся к классу A AMR-пакета. Поскольку для женского и мужского исследуемых голосов получены практически одинаковые результаты, то приведены замеры лишь для мужской речи. Примеры измерений для наиболее коррелированных параметров для межфреймовой и внутрифреймовой корреляции приведены в таблице, где q — число бит, используемых для передачи того или иного параметра по стандарту.
Результаты моделирования
Для сравнения обычного совместного турбо-декодера и предложенного алгоритма была использована модель, представленная на рис. 7. При моделировании предполагалось, что передаются лишь голосовые пакеты, в то время как для коротких VAD-пакетов передача всегда считалась успешной. Заголовки считались случайными. В качестве компонентного декодера турбокода рассмотрен алгоритм Scaled Max-Log-MAP с взвешивающим коэффициентом, равным 0,75. Итерирование турбодекодера заканчивалось после восьми итераций, поскольку дальнейшее итерирование декодера практически не дает прироста производительности. Пакет считался при-
нятым успешно, если корректной была контрольная сумма «CRC24B». Для предложенного списочного совместного алгоритма после построения списка выполнялось еще 8 итераций обычного турбодекодера в соответствии со схемами рис. 4, б и 5. Размерность списка обозначена как L и при моделировании была установлена L = 16.
В качестве критерия сравнения алгоритмов использована вероятность ошибки на пакет (FER), однако данный критерий не отображает улучшения качества декодированной речи. Поэтому было проведено сравнение с использованием критерия MOS (Mean Option Score) [13], результаты которого принимают следующие значения: 1 — плохое; 2 — низкое; 3 — удовлетворительное; 4 — хорошее; 5 — прекрасное. Для расчета значения MOS может быть использован алгоритм PESQ [14], результат которого обозначают как MOS-LQO.
Результаты моделирования для случая с использованием CRC в заголовке и без последнего были близки, поэтому графики (рис. 8, а, б) приведены для случая с использованием CRC для класса A бит. Как видно из графиков, предложенный алгоритм позволяет получить выигрыш в 0,15 дБ по сравнению с обычным декодером, что эквивалентно выигрышу по MOS от 0,4 до 0,15 пункта. В частности видно, что за счет использования предложенного алгоритма качество принимаемой речи переходит из разряда «удовлетворительное» в разряд «хорошее».
■ Рис. 7. Схема модели для тестирования совместного декодера турбокода и вокодера АМИ^В
■ Рис. 8. Результат моделирования FER (а) и MOS-LQO (б) для вокодера AMR-NB и турбокода
Заключение
В данной работе представлен алгоритм совместного декодирования кодера канала и источника для сетей четвертого поколения. По результатам моделирования видно, что предложенный совместный списочный декодер турбокода показывает лучшую производительность, чем независимый и обычный совместный декодеры, что проиллюстрировано на примере вокодера АМИ^В.
1. Shannon C. E. A Mathematical Theory of Communication // The Bell System Technical J. 1948. N 27. P. 379-423.
2. 3GPP TS 26.090: Mandatory Speech Codec Speech Processing Functions; Adaptive Multi-Rate (AMR) Speech Codec; Transcoding Functions. — 3GPP Specification, 2011. — 55 p. htpp://www.3gpp (дата обращения: 01.12.2013).
3. Bahl L., Cocke J., Jelinek F., Raviv J. Optimal Decoding of Linear Codes for Minimizing Symbol Error Rate // IEEE Transactions on Information Theory. Mar. 1974. N 2. P. 284-287.
Данный алгоритм может быть использован и для других источников, необходимым является лишь оценка избыточности таких источников для выполнения совместного декодирования.
Работа выполнена по плану работ, представленному в заявке № 14-11-00644 на конкурс грантов Российского научного фонда «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».
4. Berrou C., Glavieux A., Thitimajshima P. Near Shannon Limit Error-Correcting Coding: Turbo Codes // Proc. of the IEEE Intern. Conf. on Communications (ICC-93). May 1993. P. 1064-1070.
5. Krouk E., Ovchinnikov A., Poikonen J. Channel Models and Reliable Communication // Modulation and Coding Techniques in Wireless Communications. — John Wiley and Sons, 2011. P. 1-20.
6. Robertson P., Villebrun E., Hoeher P. A Comparison of Optimal and Sub-Optimal MAP Decoding Algorithms Operating in the Log Domain // Proc. of the IEEE Intern. Conf. on Communications (ICC-95). 1995. P. 1009-1013.
7. Акмалходжаев А. И. Совместное декодирование канала и источника // Научная сессия ГУАП: сб.
докл.: в 3 ч. Ч. I. Технические науки. — СПб.: ГУАП, 2013. С. 71-75.
8. 3GPP TS 36.212: Evolved Universal Terrestrial Radio Access (E-UTRA); Multiplexing and Channel Coding. — 3GPP Specification, 2011. 61 p. htpp:// www.3gpp (дата обращения: 01.12.2013).
9. Seshadri N., Sundberg C.-E. W. List Viterbi Decoding Algorithms with Applications // IEEE Transactions on Communications. 1994. Vol. 42. N 2-4. P. 313-323.
10. Акмалходжаев А. И., Козлов А. В. Новый алгоритм списочного декодирования турбокодов // Изв. вузов. Приборостроение. 2013. Т. 56. № 8. С. 20-24.
11. 3GPP TS 26.101: Mandatory Speech Codec Speech Processing Functions; Adaptive Multi-Rate (AMR) Speech Codec Frame Structure. — 3GPP Specification, 2009. — 20 p. htpp://www.3gpp (дата обращения: 01.12.2013).
12. Sjoberg J., Westerlund M., Lakaniemi A., Xie Q.
RTP Payload Format and File Storage Format for the Adaptive Multi-Rate (AMR) and Adaptive Multi-Rate Wideband (AMR-WB) Audio Codecs. — RFC 4867, Apr. 2007. — 59 p.
13. ITU-T Recommendation P.800.1. Mean Option Score (MOS) Terminology. — ITU-T, 2006. — 12 p. http:// www.itu.int/rec/T-REC-P.862-200102-I/en (дата обращения: 01.12.2013).
14. ITU-T Recommendation P.862. Perceptual Evaluation of Speech Quality (PESQ): An Objective Method for End-to-End Speech Quality Assessment of Narrow-Band Telephone Networks and Speech Codecs. — ITU-T, 2001. — 30 p. http://www.itu.int/rec/T-REC-P.862-200102-I/en (дата обращения: 01.12.2013).
UDC 621.391
A Joint List Decoder of a Turbo Coder and AMR-NB Vocoder for Cellular Networks of the Fourth Generation
Akmalkhodzhaev A. I.a, Programmer, [email protected]
aSaint-Petersburg State University of Aerospace Instrumentations, 67, B. Morskaia St., 190000, Saint-Petersburg, Russian Federation
Purpose: In practical systems decoding of the channel and source codes is performed independently that limits the possibility of using the source redundancy for improvement of overall receiver performance. The goal of the paper is to develop a joint turbo code and a source decoder for wireless systems of the fourth generation. Results: There has been proposed a new joint list decoder of a turbo code and the source coder. The decoder considers specifics of data generation in the forth generation wireless systems, i.e. the fact that correlated data constitute only a part of the information word. Therefore, first and foremost, the goal of the algorithm is correct decoding of redundant bits through joint and list decoding. Then the influence of correctly decoded bits is applied to a whole information sequence due to an interleaver in the turbo code. CRC is used as a criterion of decoded sequence correctness in the list decoding. The new decoder performance is considered for 3GPP LTE turbo code and AMR-NB speech coder. Simulations show that the new algorithm gives 0.15 frame error rate gain and decoded speech quality improvement by 0,4-0,15 MOS comparing to the conventional iterative algorithm. Practical relevance: The proposed algorithm allows to reduce frame error probability and to increase decoded speech quality that is an important and relevant task for modern cellular networks.
Keywords — Turbo Code, Joint Source Channel Decoding, Speech Coding, Fourth Generation Cellular Networks.
Reference
1. Shannon C. E. A Mathematical Theory of Communication. The Bell System Technical Journal, 1948, vol. 27, pp. 379423.
2. 3GPP TS 26.090: Mandatory Speech Codec Speech Processing Functions; Adaptive Multi-Rate (AMR) Speech Codec; Transcoding Functions. 3GPP Specification, 2011. 55 p. Available at: htpp://www.3gpp (accessed 01 December 2013).
3. Bahl L., Cocke J., Jelinek F., Raviv J. Optimal Decoding of Linear Codes for Minimizing Symbol Error Rate. IEEE Transactions on Information Theory, Mar. 1974, vol. 20, no. 2, pp. 284-287.
4. Berrou C., Glavieux A., Thitimajshima P. Near Shannon Limit Error-Correcting Coding: Turbo Codes. Proc. of the IEEE Int. Conf. on Communications (ICC-93), May 1993, vol. 2, pp. 1064-1070.
5. Krouk E., Ovchinnikov A., Poikonen J. Channel Models and Reliable Communication. Modulation and Coding Techniques in Wireless Communications. John Wiley and Sons, 2011, pp. 1-20.
6. Robertson P., Villebrun E., Hoeher P. Comparison of Optimal and Sub-Optimal MAP Decoding Algorithms Operating in the Log Domain. Proc. of the IEEE Int. Conf. on Communications (ICC-95), 1995, vol. 2, pp. 1009-1013.
7. Akmalkhodzhaev A. I. Joint Source and Channel Decoding. Nauchnaia sessiia GUAP, sbornik dokladov, ch. I, Tekhnicheskie nauki. Saint-Petersburg, GUAP Publ., 2013, pp. 71-75 (In Russian).
8. 3GPP TS 36.212: Evolved Universal Terrestrial Radio Access (E-UTRA); Multiplexing and Channel Coding. 3GPP Specification, 2011. 61 p. Available at: htpp://www.3gpp (accessed 01 December 2013).
9. Seshadri N., Sundberg C.-E. W. List Viterbi Decoding Algorithms with Applications. IEEE Transactions on Communications, 1994, vol. 42, no. 2-4, pp. 313-323.
10. Akmalkhodzhaev A. I., Kozlov A. V. A New Algorithm for List Decoding of Turbo Codes. Izvestiia vuzov. Priborostroenie, 2013, vol. 56, no. 8, pp. 20-24 (In Russian).
11. 3GPP TS 26.101: Mandatory Speech Codec Speech Processing Functions; Adaptive Multi-Rate (AMR) Speech Codec Frame Structure. 3GPP Specification, 2009. 20 p. Available at: htpp://www.3gpp (accessed 01 December 2013).
12. Sjoberg J., Westerlund M., Lakaniemi A., Xie Q. RTP Payload Format and File Storage Format for the Adaptive Multi-Rate (AMR) and Adaptive Multi-Rate Wideband (AMR-WB) Audio Codecs. RFC 4867, Apr. 2007. 59 p.
13. ITU-T Recommendation P.800.1. Mean Option Score (MOS) Terminology. ITU-T, 2006. 12 p. Available at: http://www. itu.int/rec/T-REC-P.862-200102-I/en (accessed 01 December 2013).
14. ITU-T Recommendation P.862. Perceptual Evaluation of Speech Quality (PESQ): An Objective Method for End-to-End Speech Quality Assessment of Narrow-Band Telephone Networks and Speech Codecs. ITU-T, 2001. 30 p. Available at: http://www.itu.int/rec/T-REC-P.862-200102-I/en (accessed 01 December 2013).