Научная статья на тему 'Кодирование спектра высококачественных звуковых сигналов'

Кодирование спектра высококачественных звуковых сигналов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
230
43
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Стефанов М. А.

Работа посвящена повышению эффективности использования психоакустических свойств слухового анализатора человека в современных высококачественных системах сжатия цифровых аудиоданных. Предложен алгоритм кодирования с использованием прореживания спектральных компонент.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Кодирование спектра высококачественных звуковых сигналов»

16 декабря 2011 г. 18:12

T-Comm #10-2010

(Технологии информационного общества)

Кодирование спектра высококачественных звуковых сигналов

Сгефанов М.Л., ПГАТИ

Работа посиищаш повышению эффективности использования психоакустических свойств слухового аназилатора человеки в современных высококачественных системах сжатии цифровых аудиоданных. Предложен алгоритм кодирования с использованием прореживания спсктрачьных компонент.

Постановка задачи._Современный этап развития систем обработки и передачи цифровых аудиоданных характеризуется как увеличением потока передаваемой информации. так и повышением требовании к се качеству. Поэтому в последнее время в нашей стране и за рубежом уделяется большое внимание вопросам развития новых методов сжатия цифровой аудиоинформации, основанных на использовании психоакустичсскнх свойств слуха человека. При этом сжатие звуковых сигналов (ЗС) производится не во временной, а в частотной области, для чего используются дискретные ортогональные преобразования (ДОН). Разработанные с использованием указанных свойств современные системы компрессии звуковых сигналов стандартов MPEG (Moving Pictures Expert Group) [1-4] используются в таких форматах цифрового радиовещания как DRM (Digital Radio Mondiale), звукового вещания DAB (Digital Audio Broadcasting) и спутникового радиовещания ADR (Astra Digital Radio). Эти системы обеспечивают цифровые скорости от 64 кбит/с для мультимедиа приложений до 384 кбнт/с для цифрового стереофонического вещания. При этом, судя по результатам экспертных оценок [5], несущественная разница в субъективном восприятии исходного и сжатого звука сохраняется только при сжатии цифрового потока с 768 до 128 кбит/с.

Вместе с тем известно [6], что при пропускной способности слухового аппарата в 100... 120 кбит/с человек способен осознанно воспринимать лишь порядка 100 бит/с. И хотя это относится к восприятию речи, такой большой разрыв даст повод к выводу о существовании возможности дальнейшего повышения эффективности высококачественной компрессии цифровых аудиоданных с использованием психоакустичсскнх свойств слуха человека.

/дч

/ \ * /V 4

100 дБ

\

.SO \

|ч] /III \go

II

_ Г4 Дю\ X /

V

20

0.02 0.05 0.1 0.2 0.5 I

Рнгунок 1. Кртыс порога сышгаостн іона іфн

10 /кГц

Ограничение разря;шости._Ирежде всего следует сказать несколько слов о виде ДОП. используемого при сжатии ЗС. В современных кодеках цифровых аудиоданных используются различные ДОП. Например, в кодеках MPEG психоакустический анализ производится с использованием дискретного преобразования Фурье. В случае 3 уровня сжатия кодированию подвергаются коэффициенты модифицированного дискретного косинусного преобразования (ДКП). В работе [7] показана перспективность применения ДКП при сжатии высококачественных цифровых аудиоданных с учетом психоакустичсскнх свойств слухового анализатора. Поэтому в дальнейшем будем ориентироваться на это преобразование.

Одним из основных ресурсов устранения психоакустической избыточности цифровых аудиоданных является ограничение разрядности двоичного представления коэффициентов ДОН (передача только старших значащих бит). С целью опенки допустимой степени этого ограничения (округления) был проведен ряд исследований. Однако ни одно из них не учитывало такие важные факторы, как частотные свойства преобразования и связь [8] указанного свойства слуха с другим его свойством - маскировкой (подавлением) спектральных компонент относительно малой интенсивности (кривые маскировки для полосного шума со средней частотой 1 кГц и различных уровней изображены на рис. 1). В связи с этим отсутствует возможность эффективного ограничения разрядности цифрового представления коэффициентов ДКП. Как следствие, эмпирический подход к решению этого вопроса (например, в кодеках MPEG) по-прежнему актуален, хотя и обусловливает зависимость соответствующей оценки как от характера ЗС в целом (речь или музыка), так и от характера отдельных его фрагментов.

Естественным критерием ограничения разрядности модуля к-то коэффициента А',(А) ортогонального преобразования является коэффициент и<1 минимально ощущаемой на слух прямоугольной амплитудной модуляции полосного шума концентрируемого на частоте /4 [9]. В свою очередь /и* представляется функцией двух параметров [8] - частоты модуляции /1|ол и ширины полосы шума \Fmi.

Первый параметр »i» определяется отношением: /мод - 1 Г„, где 7„ - длительность интервала дискретного ортогонального преобразования. Условие оценки Г„ получено [10] на основе статистической модели A.B. Римского-Корсакова. В этой модели ЗС подобен сложному случайному процессу ;(/) а;(0Ч(/). в котором случай-

ный стационарный сигнал с нормальным распределением II,(х) модулируется по амплитуде случайным иизко-

117

частотным сигналом с распределением 1Г„(дг) и стационарным для I < 50 мс, причем а,</) некоррелирован с г|(0- Это позволяет считать Т„ ответственной за точность восстановления низкочастотной составляющей динамики изменения уровня спектральных компонент на последовательности интервалов преобразования (спектральных выборок), обусловленной Но тогда 7„ следует выбирать в соответствии с теоремой отсчетов В.А. Котельникова: Т„ < I (2■/ „), где Ft - верхняя частота спектра о;{/). Согласно результатам ряда работ частота составляет для музыкальных сигналов за исключением синтезированной музыки до 25 Гц. для голосового пения

- 65 Гц. а для речи - до 50 Гц. Отсюда - 130 Гц для музыкальных сигналов (с учетом голосового сопровождения) и 100 Гц для речевых сигналов.

Известно, что коэффициенты гармонических ДОГ1 можно интерпретировать как фильтры с определенной АЧХ. На этом основании можно предположить, что степень влияния спектральных компонент на величину к-го коэффициента ДКП различна. Следовательно, должно существовать пороговое значение (рис. 2). разделяющее значимые в этом смысле компоненты спектра исходного сигнала (,v„ € от незначимых .«„ ( v„ г S/■„, ,). где &l mj - часть полосного шума, обусловленная /-м лепестком АЧХ. для которого: |/Л(/со„)|я<п < |//((/<а)|„Л. Тогда и поскольку фрагментарный характер шума для тк значения не имеет [11]:

Л/\,„ = I

Критерий величины \Fm± естественно определить на основе эффекта маскировки слухового анализатора. Действительно, слишком большое ограничение приведет к увеличению допустимой степени ограничения разрядности коэффициентов и, как следствие, к заметному на слух изменению взаимодействия компонент нового (сжатого) спектра при маскировке.

МЛюМ.

1ВД<о)к.

Рисунок 2. Составляющие паюсного шума шириной

Пусть для К,(к) известна вероятность маскировки 6',, В плоскости слышимости ей можно сопоставить область безусловной маскировки, ограниченной сверху средним порогом слышимости при маскировке (/„л. Тогда вероятность С’I можно переопределить как Р\Чк<11^\ -=<Аxi (.'т.. 20) </сч(0(/20), где - уровень КАК) в плоскости слышимости, ограниченной сверху динамическим диапазоном изменения сигнала, а ¡1сфг) = 10*. Отсюда скг{С,^ 20) = Р\ик<ит11 •</«•( А/20). В наихудшем случае л„ обусловливает приращение щ = </«■( С] /20), не превышающее по абсолютной величине Ц//<(/(А,У-(ЛхЧД, 20). При этом л„ будет незначащей для А'Д), если

Я,<(СИ,)!„! </«■(О,, 20) < </«■( 1/оцл /20), поскольку в этом случае не изменится взаимодействие компонент при маскировке. Таким образом, условие оценки ширины полое 8 составляющих ДГшд. зашппетея в виде:

ІЯіІЛиі« 2 6,-</<■. ( Д ,20) / </<•< (Д„ 20) = |Л/д(/Сй)|„.п.

Для оценки сформулируем достаточное условие отсутствия маскировки: К,(к) не маскируется, если его уровень не меньше уровня кривой маскировки (КМ) любого другого КАІ) на частоте В соответствии с этим и в предположении независимости /С,(к) получаем выражение для оценки искомой вероятности:

Gt=l-Ppt 2A(/t)}

і*м i L *

где /’{{Д 2 /)(Л)! - вероятность отсутствия маскировки А',(А) абсолютным порогом слышимости .!(/<): п, и /ь -соответственно, наименьший и наибольший номера А',(/). удовлетворяющие условию ¿/¡¿'(( (ок ,,Д)> Л(/,): ё[\'-условная вероятность маскировки А,(к) участком .V КМ,, определяемая в соответствии с известным выражением [12].

Помимо модуля, коэффициенты ДКП характеризуются фазовым сдвигом. В этом легко убедиться, подав на вход ДКП гармонический сигнал т(н) ■ .УсоЯл/к Лг* ф;). При этом САк) ~ 0.5 ХА/Л'еоя(лА/2А/ + <р») (к > 0). Следовательно, округление С,(А) приводит к округлению и амплитуды. и фазы соответствующей компоненты \. сжатого спектра. Ограничение разрядности модуля фазы ф< (А > 0) на величину 4ф; приводит к изменению частоты Д соответствующей компоненты \ нового спектра на величину А* Причем эти изменения происходят на стыках спек-трагыгых выборок. Такой характер изменения можно ншер-претировать как частотную модуляшно А,(А) с частотой модуляции /у,,, = I Т„ и девиацией частоты Дд, Это позволяет сопоставить относительное изменение фазы Дер, % с индексом частотной модуляции Дд /ч*и. Но тогда естественным критерием ограничения разрядности модуля фазы является минимально ощущаемая на слух девиаши частоты 6/ которая, в свою очередь, яагяется функцией [8] параметров

./к И /иод*

Пусть теперь |ф<| некоторого немаскируемого коэффшш-еггга текугцей спектральной выборки представлен </^ значащими двоичными разрядами. В результате округления </2^ младших разрядов обнуляются, вследствие чего достаточно передать только ¡/1^ * - </2^ старших разрядов. При

этом по правилам округления |ф.I увеличится или уменьшится не более чем на величину Д = < - </!»/) /2, где

/>//;(л) = 2'. Согласно принятой шгтерггретации округления оттюшение Д'Лш(^) = 1Чт -</1^ - 1) определяет индекс частотной модуляции. Тог да искажения, вызванные округлением ф,1. не будут ощущаться на слух, если эго отношение не превышает &/. Отсюда допустимая степень ограничения разрядности модуля фазы:

</!**” |о!?:1/ч<и '5ДЛ- /»>.,)) - 1 • где .г - наименьшее целое, не меньшее .V. й/(Д. /„„„) аналитическое описание соответствующих известных экспериментальных зависимостей [7].

Заметим, чло округление ггулевого коэффициент ДОИ приводит к дополнгггельному фазовому сдвигу компонент но-

IIX

вою спеетра на стыках выборок на величину, по модулю не более Дф|/2. Однако если это не больше наименьшей допустимой степени округления модуля фазы, подобные искажения на слух ощущаться не будут. Следовательно, с/10 = тах|^1гХ Д="\ где г - номер первого коэффициента рабочей полосы. Наконец, поскольку ДКП чувствительно к фазовым сдвигам, для всех к >0 </1* = 1оц_>( 1 ///¿)

- I , если ///* < Ь( (/*, ./*од),7'п и </1* = у\ к в противном случае.

П|о8.<1/ш, )-1Г. сслн/и, (1)

|П 1оц,{| [<?(/,,/м)-7„]}- |Г впротивноислучае Результаты проведенною исследования позволяют оценить допустимую степень офанинения разрядности коэффициентов ДКП. На рис. 3 приведена соответствующая оценка без учета знака дтя высококачественных музыкальных сигналов.

5

</>» =

£

ет рассматривать как тональную компоненту ЗС. пока он находится вне различимой ступени частоты, соответствующей следующему коэффициенту. В противном случае интерпретация 6/ как фадации раздражения теряет смысл, что характерно для шума. Кроме того, коэффициенты ДКП в некоторой степени коррелированны (рис.

1), поскольку интенсивность А-й спектральной компоненты включает интенсивности компонент с номерами к ± I. к ± 3 и тл. Но эта неприятность легко устраняется [7] путем разделения коэффициентов по признаку четности и последующего независимого анализа двух полученных таким образом потоков коэффициентов. На основании вышесказанного, сформулируем условие выбора интерпретации коэффициентов ДКП:

ттональная компонента.если # ( /и,. /11М) < 2 Д/, компонента шума в противном случае.

0 5 10 15 / кГЦ

Рисунок 3. Допустимое ограничение разрядности коэффициентов ДКП

Прореживание спектральных компонент. Уже упо-мянугый эффект маскировки слухового анализатора является и самостоятельным ресурсом сжатия цифровой аудиоинформации в частотной области. Кто использование позволяет сократить количество передаваемых коэффициентов ДОП. офаничившись только немаскируемыми из них. В кодеках \1PHG эффект маскировки слухового анализатора используется для оценки допустимой степени усечения модуля коэффициентов ДОП. В результате пережегся значительное количество маскируемых коэффициентов.

В работе [13] предложен алгоритм прореживания, однако он не учитывает ни частотные характеристики свойства ДОП. ни особенности восприятия слухом различных их коэффициентов. Кроме того, в нем используется лишь незначительная часть КМ спектральных компонент, поскольку рассмафиваегся не весь рабочий диапазон частот. а только ею субнолосы шириной в частотную фуппу. Таким образом, для эффективного практического применения прореживания необходимо решить ряд вопросов.

Известно [8]. что связующим звеном между частотой как параметром раздражения и частотой как нарамефом субъективною ощущения является высота тона. Однако если частоту гона изменять в пределах характерной для нею минимально ощущаемой девиации ±6/, то, как отмечается в той же работе, даже музыканты с изощренным слухом признают высоту гона неизменной. Следовательно. величина 2 6/ является фадацией раздражения и определяет ширину еще различимой ступени частоты (высоты тона на основной мембране внутреннего уха). Таким образом, к-й коэффициент преобразования следу-

Казалось бы. последнее выражение можно рассматривать и как условие разделения коэффициентов ДКП на два потока. Действительно, разделять на два потока компоненты шума не имеет смысла и уже при бД/х.ц/мод) = 2 А/ коэффициенты ДКП можно вновь объединить в один ноток. Однако, к-й коэффициент сохраняет статус тональной компоненты по отношению к К£к+3). равно как и Кх(к+1) по отношению к К£к+4). Следовательно, условие разделения коэффициентов ДКП на два потока запишется как 5/(/*, ,,/^д) < 3-Д/!

Далее необходимо сформулировать условия маскировки коэффициентов ДКП, поскольку они различны для тональных и шумовых спекфальных компонент Характер поведения КМ при маскировке тоном [8] такой же, как и в случае узкополосного шума (рис. 1). Но в первом случае имеет место ряд особенностей.

Во-первых, при маскировке тоном ветви КМ дополнительно смещены вниз на величину составляющей 10...12 дБ.

Во-вторых, если частота измерительного тона близка к основной, удвоенной или утроенной частоте мешающего гона, то в широком диапазоне уровней слышимыми оказываются биения. Причиной биений, по мнению авторов экспериментальных исследований [8], является нестабильность фазы испытательною тона. В связи с этим заметим, что как следует из выражения (1) абсолютная величина округления коэффициентов ДКП зависит от его величины. В свою очередь, величина этих параметров меняется от одной спекфалыюй выборке к другой. Следовательно, степень округления фазы одного и тою же коэффициента ДКП различна в разных спекфальных выборках. В результате после обратного преобразования характерной особенностью гармоник с частотами. А будет нестабильная фаза. Если в этих условиях в спектре исходного сигнала неоправданно вырезан обертон, соответствующий удвоенной или утроенной частоте основного тона, появятся заметные на слух искажения.

Следует отметить, что при уровне мешающего тона до примерно 60 дБ биения отсутствуют [8]. Заметим, что до этого уровня еще отсутствует второй участок КМ. Кроме тою, если обертон, соответствующий второй или третьей гармонике маскирующего тона, по уровню

119

(".С

Рисунок 4. Алгоритм грорежнвания

меньше КМ этого тона на величину \м > (8 ... 10) дБ, биений не возникает.

Таким образом, биения на частоте /*. обусловленные округлением параметров коэффициентов ДКП. возможны только при одновременном выполнении следующих условий:

1) АГ,(Л) отображает тональную компоненту;

2) к= 2т и/или к = Уп\

3) уровень U„, и/ил и U„ превышает бОдБ;

4) К Ат) пили Кх{п) не маскируются.

Остается решить вопрос формирования nopoia слышимости в пределах всей спектральной выборки. Поскольку экспериментальные исследования психоакустических свойств слуха проводились для одного измерительного тона, поэтому известен [8, 11] лишь общий его характер как совокупности тех или иных участков КМ немаскируемых спектральных компонент. Однако в данном случае необходимы сведения о характере как взаимодействия КМ, некоторого маскирующего А'Д /) с абсолютным порогом слышимости, гак и ее прерывания другим коэффициентом А.\(Л).

Взаимодействие КМ, с абсолютны порогом слышимости характерно для области низких частот, где уровень абсолютного порога слышимости довольно значительный. Известно, что абсолютный порог слышимости обусловлен Броуновским движением молекул крови. То есть он не коррелирован с КМ„ обусловленной звуковым давлением. Следовательно, порог слышимости при маскировке может включать участки КМ, и абсолютного порога слышимости.

В случае воздействия отдельною юна частотой/, возбужденные им волосковые клетки колеблются с той же частотой. Колебания этих клеток являются пассивными, то есть частотные группы ими не создаются. При появлении второго тона частотой !\ и достаточно малой интенсивности характер КМ, не меняется. Однако с дальнейшим повышением интенсивности второго тона частота колебания пассивных волосковых клеток в небольшой его окрестности изменяется, все больше приближаясь к частоте этого топа. При этом интенсивность их колебания уменьшается. Исключение составляет лишь активная вол основа я клетка, «настроенная» на частоту /*, Наконец, при Uk = (/,.£/,) (где ишх {fbU) ~ уровень кривой мас-

кировки /-й компоненты на частоте /*, вычисляемый с помощью соответствующего аналитического описания [7]) второй тон становится слышимым, но и деформация КМ в его окрестности должна быть такой, что КМ, сливается с КМ*.

Таким образом, условием непрерывности КМ, можно считать отношение < U~. i {/„U,).

На основе сформулированных условий, разработаем алгоритм прореживания. При этом при прореживании коэффициентов ДКП достаточно ограничится правой ветвью КМ. поскольку при стандартных параметрах звуковою сигнала (Нд”44,1кГц. Э~96дБ) использование левой ветви не целесообразно [13]. Соответствующая алгоритмическая схема приведена на рис. 4.

Входом алгоритма (блок 1) является вектор из V коэффициентов ДКП. а выходом (блок 7) - вектор той же мерности, в котором маскируемые коэффициенты представлены нулевой величиной.

Процесс обработки данных носит циклический характер (блок 2). Сначала (блок 3) в соответствии с (2) при учете (3) определяется интерпретация очередною возможно маскируемого к-го коэффициента ДКП.

Для удобства дальнейшего изложения материала введем понятие локально маскирующею коэффициента (ЛМК). Назовем локально маскирующим коэффициент ДОП. КМ которою не прерывается в некоторой области частот. То есть ЛМК определяет очередной участок формируемого порога слышимости в пределах данной спектральной выборки.

Так как правая ветвь КМ, /-го ЛМК состоит из трех участков, далее (блок 4) устанавливается тот из них. который возможно является текущим участком общего порога слышимости на частоте /-, то есть, быть может, маскирующим К,(к).

После определения текущею участка порога слышимости проверяется (блок 5) условие (5). Нели к-й коэффициент интерпретируется как компонента шума и не прерывает КМ,, он считается маскируемым и в выходном векторе его величина приравнивается нулю (блок 6). В случае же интерпретации как тональной компоненты условие маскировки проверяется с учетом возможных биений (4). Если же данный коэффициент является ЛМК, то информация о нем передается в выходной вектор без изменения.

Алгоритм кодировании. Целью модификации алгоритма с поблочно плавающей запятой (используемою кодеками МРЕв) является исследование его возможностей по повышению эффективности кодирования сжатого спектра. Для этого необходимо найти способ совмещения ограничения разрядности с прореживанием коэффициентов ДКП.

Одно из возможных решений поставленной задачи заключается в следующем. Коэффициенты спектральной выборки объединяются в блоки но признаку одинаковой допустимой степени округления. Блоки, где прореживание не имеет смысла, кодируются как обычно с помощью порядка (количество нулевых старших разрядов для наибольшею коэффициента блока) и мантисс (ограниченное число старших разрядов коэффициентов блока). В остальных блоках помимо порядков и мантисс, но только немаскируемых коэффициентов кодируются расстояния между ними.

Соответствующая алгоритмическая схема приведена на рисунке 6. Входом алгоритма (блок 1) являются длина

120

выборки Л. массив и прореженных в соответствии с рис.

4 коэффициентов ДКП, распределение их допустимой степени округления </1*. вектор п 1раниц каждого из /. блоков спектральной выборки и номер / блока, начиная с которого кодируется расстояние между прореженными коэффициентами.

Процесс кодирования носит циклический харакгер (блок 2). Для /-го блока определяются нижняя р\ и верхняя р2 частотные 1раницы (блок 3). а также порядок II (блок 4), который фиксируется в векторе У выходных данных (блок 5). После этого начинается последовательное кодирование его коэффициентов (блок 6). Если / < / (блок 7), то есть прореживание отсутствует, текущий коэффициент окру!ляется (блок 10) и это значение сохраняется в векторе У. В противном случае и при ненулевом значении С\ в выходной вектор записывается и текущее расстояние А к - i между двумя смежными немаскируемыми коэффициентами (блок 9).

В таблице 1 приведены результаты компьютерного моделирования кодирования прореженного спектра в соответствии с алгоритмами рис. 4 и 5 и в сравнении с наиболее перспективным алгоритмом сжатия МРЕО-2 ААС.

Таблица 1

Результаты компьютерного моделирования процесса кодирования прореженного спектра в системе лазерной звукозаписи

Начало )

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Показатель »ффектнвностн Кодирование с прореживанием Алгоритм МРЕО-2 ААС

Музыкальный ситная Речевой сигнал

Скорость цифрового потока, кбит/с 111 104 128

Средний балл качества •0.15 •0.12 -0.17

Относительный ко>ффицнеит сжатия 1,15 из 1

Субъективно-статистическая оценка ухудшения качества сжатого звука проводилась в соответствии с рекомендациями сектора радиосвязи (МСЭ-Р) по пятибалльной шкале (0 - незаметное; -1 - заметное, но не раздражающее; -2 - слег ка раздражающее; -3 - раздражающее; -4 - очень раздражающее.). Каждый звуковой фрагмент прослушивался по схеме А - В - А - В. где А - исходный звуковой фрагмент, а В - синтезированный в результате моделирования. Для оценки результатов моделирования были приглашены 26 студентов III’УТИ в возрасте 18-20 лет. имеющих музыкальное образование и желающих принять участие в экспертизе. В качестве тестовых фрагментов использовались монофоническая запись голоса диктора одной из радиостанций Франции и стереофоническая запись музыкальной фразы, исполненной на юбое. Оба звуковых фрагмента взяты с диска, рекомендованного техническим центром союза европейской трансляции EBU (European Broadcasting Union) (Cat № 422 204-2) компакт-диск SQAM {Sound Quality Assessment Materia/). На данном диске содержатся наиболее сложные для сжатия звуковые фрагменты.

Как видно, при тех же качественных показателях и параметрах цифровых аудиоданных за счет прореживания эффективность кодирования повысилась в 1,15 (1.23) раза.

Рисунок 5. Модифицированный алгоритм кодирования

Таким образом, практическое применение прореживания можно признать целесообразным. Тем не менее, увеличение эффективности кодирования всею на 15% показывает целесообразность изыскания более эффективных алгоритмов кодирования, основанных на использовании аналитического описания кривых маскировки, более полно учитывающих нсихоакустические свойства слуховою анализатора человека.

Литература

1. International Standard ISO ILS 11172-3. Information technology Coding of mov mg pictures and associated audio for digital storage media at up to about 1.5 Mbit s. Part 3: Audio.

1993-08-01.

2. International Standard ISO ILS 13818-3. Information tcch-nology-Generic Coding of moving pictures and associated audio information. Part 3: Audio. 1995-05-15.

3 International Standard ISO/IBS 13818-7. Information technology-! icncric Coding of pictures and associated audio information. Part 7: Advanced Audio Coding (AAC). 1997(H).

4. ISO ILiS FCD 14496-3 Subpart I. Information Technology-Very Love Bit rate Audio-Visual Coding. Part 3: Audio. 199805-10 (ISO JTC 1 SC 29. N2203).

5. Кова.н пн Ю.А. Цифровое кодирование звуковых сигналов / Ю.А. Ковалгнн. Э.И. Вологдин. - СПб.: КОРОНА-принт, 2004. - 240 с.

6. Артюшенко В.М. Цифровое сжатие видеоинформации и звука: учеб. пособие / В.М. Артюшенко, О.И. Шелухии. М.Ю. Афонин; под ред. В.М. Артюшенко. - М.: Дашков и К. 2003. -426 с.

7. Стефанов М.А. Повышение эффективности сжатия цифровой аудиоинформации с учетом свойств слухового анализатора человека: автореферат диссертации на соискание ученой степени к.т.н.: 05.12.13: защищена 28.12.09 / М.А. Стефанов; ПГУТИ. - Самара, 2009. - 16 с.

8. Цвикер, 3. Фсльдкеллер Р. Ухо как приемник информации / Э. Цвикер. Р. Фельдкеллер; нер. с нем. под ред. Б.Г. Белкина. - М.: Связь. 1971. - 256 с.

9. (Лсфашж А.М. Применение порогового восприятия

121

i Надоели баннеры? Вы всегда можете отключить рекламу.