Научная статья на тему 'Цифровые банки фильтров для современных задач обработки звуковых сигналов'

Цифровые банки фильтров для современных задач обработки звуковых сигналов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
646
90
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАНК ФИЛЬТРОВ / СУБПОЛОСНАЯ ОБРАБОТКА СИГНАЛОВ / FILTER BANK / SUBBAND SIGNAL PROCESSING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Вашкевич М. И., Азаров И. С., Петровский А. А.

В работе выполнен обзор способов синтеза цифровых банков фильтров, которые могут применяться для решения современных прикладных задач обработки звуковых сигналов. Описывается практический опыт использования цифровых банков фильтров в оригинальных системах обработки звука: музыкальном плеере с функцией повышения разборчивости звучания при прослушивании в шумной акустической обстановке, а также слуховом аппарате на базе смартфона.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Вашкевич М. И., Азаров И. С., Петровский А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Digital filter banks for modern audiosignal processing tasks

The paper reviews techniques of digital filter bank synthesis that can be applied for contemporary speech processing challenges. The paper describes practical experience of using digital filter banks in original systems of sound processing, namely, musical player with noise-aware audio enhancement and hearing aid application for a smartphone.

Текст научной работы на тему «Цифровые банки фильтров для современных задач обработки звуковых сигналов»

Доклады БГУИР

Doklady BGUIR

2019, № 2 (120) 2019, No. 2 (120)

УДК 004.934.2+534.784

ЦИФРОВЫЕ БАНКИ ФИЛЬТРОВ ДЛЯ СОВРЕМЕННЫХ ЗАДАЧ ОБРАБОТКИ ЗВУКОВЫХ СИГНАЛОВ

М.И. ВАШКЕВИЧ, И.С. АЗАРОВ, АА. ПЕТРОВСКИЙ

Белорусский государственный университет информатики и радиоэлектроники, Республика Беларусь

Поступила в редакцию 11 февраля 2019

Аннотация. В работе выполнен обзор способов синтеза цифровых банков фильтров, которые могут применяться для решения современных прикладных задач обработки звуковых сигналов. Описывается практический опыт использования цифровых банков фильтров в оригинальных системах обработки звука: музыкальном плеере с функцией повышения разборчивости звучания при прослушивании в шумной акустической обстановке, а также слуховом аппарате на базе смартфона.

Ключевые слова: банк фильтров, субполосная обработка сигналов.

Abstract. The paper reviews techniques of digital filter bank synthesis that can be applied for contemporary speech processing challenges. The paper describes practical experience of using digital filter banks in original systems of sound processing, namely, musical player with noise-aware audio enhancement and hearing aid application for a smartphone.

Keywords: filter bank, subband signal processing.

Doklady BGUIR. 2019, Vol. 120, ]Чо. 2, pp. 100-111 Digital filter banks for modern audiosignal processing tasks M.I. Vashkevich, I.S. Azarov, A.A. Petrovsky

Введение

Свой первый старт и заметное развитие прикладная цифровая фильтрация получила в середине XX века. Первоначально она использовалась как средство моделирования аналоговых схем обработки сигналов с помощью вычислительных машин. Однако примерно в середине 70-х гг. цифровая фильтрация превратилась в самостоятельную область исследований и получила широкое распространение во многих смежных технических областях.

Теория и различные применения цифровой обработки сигналов на протяжении всей своей истории были неразрывно связаны с понятием цифрового фильтра. Это понятие сформировалось как чисто математическое - оператор, который выполняет преобразование цифрового сигнала, для которого справедливы принципы инвариантности к сдвигу и суперпозиции.

К концу 70-х - началу 80-х годов появилась практическая потребность в создании систем, выполняющих декомпозицию сигнала на отдельные частотные составляющие. Система выполняющая разложение сигнала на частотные полосы, получила название банк фильтров [1].

Характерной особенностью банка фильтров является многоскоростная обработка. Это значит, что в разных точках системы частота дискретизации не является одинаковой. Изменение частоты дискретизации выполняется за счет децимации и интерполяции сигнала. Это ключевое отличие банка фильтров от гребенки фильтров, где частота дискретизации сигнала не изменяется.

В настоящее время цифровые банки фильтров получили широкое практическое применение. В частности, стандарты кодирования звука MP3 и AAC используют косинусно-

модулированные банки фильтров. Цифровые банки фильтров также используются в различных системах повышения качества звука, эхо- и шумоподавления, в системах автоматического распознавания речи и модификации голоса [2, 3]. Сфера применения продолжает неуклонно расширяться.

В работе описывается практический опыт авторов в создании оригинальных систем обработки звука на основе цифровых банков фильтров: музыкального плеера с функцией повышения разборчивости звучания при прослушивании в шумной обстановке, а также слухового аппарата на базе смартфона.

Теоретические основы

Рассмотрим общий алгоритм функционирования М -канального банка фильтров. На первом этапе поступивший входной сигнал х(п) раскладывается при помощи банка фильтров анализа на М субполосных составляющих, которые в идеальном случае не перекрываются. Поскольку полученные субполосные сигналы имеют ограниченную полосу частот, для эффективности последующей обработки их децимируют (прореживают). Степень прореживания зависит от цели практического применения.

На втором этапе производят обработку субполосных сигналов. На третьем этапе выполняют восстановление сигнала из субполосных составляющих при помощи банка фильтров синтеза. Операции, выполняемые в секции синтеза, являются обратными по отношению к секции анализа (рис. 1).

Субполосные Банк фильтров анализа сигналы

х(п) I .. _ I I , „ I Хо(я)

Банк фильтров синтеза

\ Яо(2) N [Бо

11 / ? ?

"—> ВД -) —>

—> Нм \(г) —) —>

Х\{п)

\

—>

Хм \(п) ...

тз

М-1

Рис. 1. Общая схема банка фильтров

Большое распространение в инженерной практике получили банки фильтров, основанные на эффекте модуляции. Идея построения банка фильтров заключается в использовании низкочастотного фильтра в качестве прототипа с последующим получением его сдвинутых по частоте версий при помощи модуляции таким образом, чтобы получающийся набор фильтров перекрывал весь частотный диапазон.

В случае использования косинусной модуляции выражения для импульсных характеристик фильтров анализа hk (п) и синтеза /к (п) принимают следующий вид [4]:

Ь (п) = ^п)с08

/к (п) = h(n)coS

п(к +12) М

п(к +12) М

п --

N -1 2

N -1

+(-1)к 4

п-

2

- (-1)к 4

(1) (2)

где N - порядок фильтра-прототипа, к = 0...М-1 номер канала, п = 0..^-1, ^п) -коэффициенты фильтра-прототипа.

Банк фильтров, синтезированный при помощи выражений (1), (2), называется косинусно-модулированным банком фильтров (КМБФ). Схематично амплитудно-частотная характеристика (АЧХ) фильтра-прототипа и результирующего косинусно-модулированного банка фильтров показаны на рис. 2.

|Н(>)|

/

-л 2M л 2M

|Ц,(>)| ' |Hi(eJ»)| |HM,(ejro)l

1. I \ - Г7

-л M . 2л M M (M-1)M л

Рис. 2. АЧХ фильтра-прототипа и косинусно-модулированного банка фильтров

Альтернативным образом банк фильтров можно получить, если в качестве модулирующей функции использовать комплексные экспоненты:

hk (n) = h(n)WM"k, fk (n) = h(n)WMk, WM = exp( j2л/М).

(3)

Банк фильтров, синтезированный при помощи выражений (3), называется ДПФ-модулированным банком фильтров, поскольку комплексные экспоненты являются базисными функциями дискретного преобразования Фурье (ДПФ).

Как известно, процесс децимации и интерполяции сигнала (рис. 1) является нелинейной операцией и может вносить искажения в сигнал (за счет эффекта наложения спектров) [1]. Анализ искажений, возникающих в структуре банка фильтров, проще выполнять в максимально децимированном банке фильтров, когда все Sk = М. В этом случае для реконструированного сигнала на выходе банка фильтров можно записать выражение

1V1 —1 1V1 — 1

MX( z) = X (z)T0 (z) + X X (zWM )T (z), T (z) = X Fk (z) H (zWM).

(4)

где X(z)и X(z) - z-образ входного и выходного сигнала соответственно. В выражении (4) T0(z) характеризует прохождение полезного сигнала через систему анализ/синтез, в то время как оставшиеся компоненты T (z) являются передаточными функциями компонент наложения спектров, которые образуются в результате операций децимации/интерполяции в структуре банка фильтров. Для того чтобы система анализ/синтез обладала свойством полного восстановления (англ. perfect reconstruction), необходимо выполнение условий T0(z) = z-D, T (z) = 0. Однако для банков фильтров, полученных путем модуляции, данные условия практически невыполнимы, поэтому к ним применяют ослабленные требования, а саму систему анализ/синтез на их основе относят к классу систем с почти полным восстановлением (англ. near-perfect reconstruction) [4].

» ш

l=1

k=0

Полифазная реализация банка фильтров

Широкое распространение банков фильтров объясняется наличием вычислительно эффективных алгоритмов их реализации. В качестве примера рассмотрим процесс получения эффективной схемы реализации КМБФ на основе полифазного представления фильтра-прототипа и факторизации матрицы, отвечающей за модуляцию. Для наглядности перепишем в матричном виде выражение для банка фильтров анализа (1) в г-области:

" H0(z) ■ " c(0,0) c(0,1) • c(0, N -1) " h(0)

Hi( z) = c(1,0) c(1,1) • c(1, N -1) • diag(1, z-1,... z"N) • h(1) , (5)

_ Hm-i( z)_ c(M -1,0) c(M - 1,1)) • • c(M -1, N - 1) h(N -1)

где c(k, n) - модулирующая функция.

м

с(к, п) = cos

(

*(к+12) Г п - N-1V(_,).;

М I 2 Г 4

Л

(6)

Анализируя (6), можно заметить, что данная функция является симметричной, и для нее справедливо тождество

с(к, I + 2 рМ) = (-1) рс(к, I). (7)

Далее, используя (7), можно показать, что матрица косинусной модуляции Мс обладает регулярной структурой:

Мс =[С -С С -С ...] = С-[I -I I -I ...] = С • А, (8)

т повторений

т повторений

где С = [с(к,п)]0 к<М0<п 2М, I - единичная матрица размера 2М х 2М . Факторизация (8)

представляет собою запись быстрого алгоритма умножения на матрицу Мс, в котором число требуемых операций умножения уменьшается в т раз, поскольку для умножения на разреженную матрицу А требуется только 0(тМ) операций сложения. Учитывая факторизацию (8), выражение (5) можно переписать в следующем виде:

" Н,(2) " к(0) - 2Мк(2М) + -

Н,( г) = С • г~'к(1) - г-(2М+1)к(2М +1) + - =С

_ Нм-1( 2 )_ _ г42 М-1) к(2М -1) - г -(4 М+1) к(4М -1) +

Е ёо( р):

р

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Е ё1( р) 2

.-2 Мр

-2Мр

(9)

Е ^2М -1(Р) 2

р

где (р) = (-1) рк(д + 2рМ), 0 < д < 2М , 0 < р < т . В полученном выражении Е ^к (р)г"2Мр

р

являются модифицированными полифазными компонентами фильтра-прототипа, поэтому реализация банка фильтров, основанная на (9), называется полифазной. Дополнительное уменьшение вычислительной сложности КМБФ достигается за счет эффективного способа умножения на матрицу С, которое может быть выполнено с использованием дискретного косинусного преобразования [5]. Структура полифазной реализации КМБФ показана на рис. 3.

40]

¿/[2А/-1]

с!\ \'-2\/| -Цх) |-►(х)

Рис. 3. Полифазная реализация косинусно-модулированного банка фильтров анализа

Привлекательным свойством описанной выше структуры КМБФ является возможность получения на ее основе неравнополосного банка фильтров. Для этого необходимо все

элементы задержки в структуре на рис. 3 заменить на фазовые звенья [4]: А(г) =

а + г

1 + аг-1'

р

|а| < 1, А(е-**) = еЖш), где ф(ш) =-ш + 2arctg(asinш/ (а^ю -1)).

Замена А(г) вызывает нелинейное отображение частотной оси ш ^ ф(ш),

благодаря которому банк фильтров становится неравнополосным. На рис. 4 иллюстрируется эффект нелинейного отображения частотной оси для 5-канального банка.

5000 10000 15000 20000

Частота, Гц

Рис. 4. Формирование неравнополосного банка фильтров (частота дискретизации 44,1 кГц)

Полученная таким образом конструкция банка фильтров имеет значение в области обработки звука, где неравнополосность отражает свойства слуховой системы человека, имеющей различные частотные разрешения в зависимости от высоты воспринимаемого звука. В приведенном примере банк фильтров аппроксимирует психоакустическую шкалу барков. Для банка фильтров также определены коэффициенты децимации/интерполяции Sk = {21,7,3,1,1} . Подробности процедуры расчета неравнополосного КМБФ можно найти в [4].

НКМБФ может служить основой для субполосной обработки звука в различных мультимедиа приложениях. Так, в [6, 7] неравнополосный КМБФ используется в системе подавления акустической обратной связи слухового аппарата.

В работе [8] предложена схема обработки сигнала, обеспечивающая повышение разборчивости и натуральности звучания речи и музыки при прослушивании в шумной акустической обстановке. Эффект достигается путем устранения маскирования полезного звукового сигнала нестационарными акустическими шумами при помощи частотно-зависимого адаптивного усиления. Особенностью схемы является то, что для уменьшения нагрузки на слух используется минимальное усиление, достаточное для устранения эффекта маскирования.

Предложенная схема обработки используется неравнополосным КМБФ для декомпозиции сигнала. Далее, с помощью адаптивного компрессора динамического диапазона (АКДД) выполняется усиление каждой частотной полосы сигнала в зависимости от интенсивности шума в этой полосе. На рис. 5 показана предлагаемая схема обработки сигнала.

В схеме имеются два входа: для полезного и шумового сигналов. Оба входных сигнала раскладываются на субполосные составляющие при помощи анализирующего банка фильтров анализа. Для снижения вычислительных затрат отсчеты субполосных сигналов децимируются (прореживаются). Данная операция не приводит к потере полезной информации, поскольку каждый субполосный сигнал имеет узкий частотный диапазон. Для восстановления полезного сигнала применяется банк фильтров синтеза.

Рис. 5. Схема обработки сигнала для повышения качества его воспроизведения в шумовой обстановке

Для объективной оценки данного способа повышения качества восприятия звукового сигнала предлагается использовать индекс разборчивости речи (ИРР). ИРР является объективной величиной, которая коррелирует с разборчивостью речи в различных неблагоприятных условиях прослушивания. Показатель ИРР варьируется от 0 до 1. Считается, что если ИРР выше 0,75, то разборчивость можно считать хорошей, в то время как значение меньше 0,45 является неудовлетворительным.

Речевой материал для проведения экспериментов заимствован из свободно распространяемой речевой базы CMU ARCTIC. В качестве шумового сигнала выступала запись шума метро, записанная с использованием смартфона. Работа способа проверялась для различных уровней отношений сигнал/шум (ОСШ), во всех случаях измерялась разборчивость речевого сигнала на фоне шума до обработки и после обработки. Результаты проведенных экспериментов отражены на рис. 6.

т Он

ОСШ до обработки, дБ

Рис. 6. Сравнение среднего значения ИРР для речевых сигналов до и после обработки предложенным способом

При неблагоприятной шумовой обстановке (ОСШ< -20 дБ) способ позволяет получить удовлетворительную разборчивость, а при снижении интенсивности шума (ОСШ > 0 дБ) -хорошую. Необработанный сигнал имеет заметно меньшую разборчивость для ОСШ < 0 дБ и становится неразборчивым уже при ОСШ< -10 дБ. Описанный метод вошел в 100 лучших изобретений России в 2016 году [9].

Реализация банка фильтров методом перекрытия с суммированием

Простым и эффективным методом реализации банка фильтров является метод перекрытия с суммированием, общая идея которого иллюстрируется на рис. 7.

Рис. 7. Принцип работы банка фильтров на основе метода перекрытия с суммированием

Рассмотрим схему реализации М -канального ДПФ-модулированного банка фильтров на основе метода перекрытия с суммированием, при этом буем полагать, что в каналах банка фильтров выполняется децимация/интерполяция с коэффициентом L. В таком случае выражение для выходного сигнала k -го канала банка фильтров анализа будет иметь вид

Х(к,т) = £ h(mL - п)х(п)ЖМкп, к = 0,1,...М -1,

(10)

где демпированный временной отсчет т обозначает номер фрейма, а выходной сигнал X(к, т) называют кратковременным спектром сигнала в момент времени п = mL . Такое значение X(к, т) связано с тем, что выражение (10) можно интерпретировать, как ДПФ модифицированной последовательности у(п) = h(mL - п)х(п) :

Х(к,т) = £ у(п)ЖМкп, к = 0,1,...М -1.

(11) (12)

Выражение для банка фильтров синтеза можно записать в следующем виде:

да 1 М-1

х(п) = £ /(mL - п) — £ X(к, т)ШМп,

т М к=0

где / (п) - синтезирующее окно. Упрощенно последовательность операций метода перекрытия с суммированием для анализирующего и синтезирующего банка фильтров показана на рис. 8.

<>Х(к,т)

Рис. 8. ДПФ-модулированный банк фильтров на основе метода перекрытия с суммированием

п=-да

п=-<х>

Метод сложения с перекрытием хорошо подходит для систем блочной обработки данных, в том числе мультимедиа систем обработки звука. В частности, этот метод используется в слуховом аппарате на базе смартфона [10, 11], в оценщиках основного тона IRAPT [12] и Halcyon [13].

В слуховом аппарате предполагается, что входной сигнал можно представить в частотной области как сумму чистой речи X(ш), акустической обратной связи А(ш) и фонового шума N(ш):

X (ш) = X (ш) + А(ш) + N (ш) = X (ш) + N (ш), (13)

где X(ш) = X(ш) + А(ш) речевой сигнал с акустической обратной связью. Пусть R^ (ш), R^ (ш), Rn (ш) спектральные плотности мощности (СПМ) сигналов X (ш), А(ш) и N (ш) соответственно, тогда X (ш) можно оценить из X (ш) при помощи подавляющего множителя

gnr (ш) =

1 -

R (ш)

(14)

gaf (ш) = , 1 -

Подавляющий множитель для обратной связи можно получить аналогичным образом:

(15)

Ra (ш)

Щ (®)

В процессе сигнал разделяется на частотные полосы, которые умножаются на подавляющие множители. Схема обработки включает три этапа: 1) подавление шума; 2) подавление обратной акустической связи; 3) компенсация потери слуха, как представлено на рис. 9.

Рис 9. Схема обработки сигнала в слуховом аппарате на базе смартфона

Входной сигнал х(п) разделяется на узкополосные комплексные сигналы X(к, т) при помощи банка фильтров анализа (БФА), где k и т - частотный и временной индекс соответственно, а обработанный выходной сигнал восстанавливается при помощи банка фильтров синтеза (БФС). Вычисление коэффициентов для подавления шума GNR (к, т) требует оценки СПМ шума, которая вычисляется путем усреднения амплитудных значений сигнала в каждой полосе. Для того чтобы сделать оценку СПМ более стабильной, соседние полосы объединяются. Коэффициенты для подавления акустической обратной связи GAF (к, т) вычисляются на основании оценки СПМ сигнала обратной связи. На последнем этапе обработки субполосные сигналы умножаются на коэффициенты GHL (к, т), компенсирующие потерю слуха.

Система обработки сигнала реализована на смартфоне iPhone и персональном компьютере. В обоих реализациях используется частота дискретизации 44,1 кГц и размер кадра N = 511 с 50 % перекрытием. Сигнал захватывается аудиосистемой блоками размером L = 255, что соответствует общей задержке обработки 5,8 мс.

Результаты подавления шума имеют хорошие показатели в терминах сегментного отношения сигнал-шум (СОСШ). Для тестов использовались шумы трех различных типов

с исходным СОСШ в пределах [-5, 10] дБ. В эксперименте использовано пять мужских и женских голосов длительностью более 40 с. В табл. 1 приведены полученные оценки повышения СОСШ в результате обработки для каждого из трех шумов.

Таблица 1. Повышение СОСШ для шумов различного типа

Входной СОСШ, дБ Белый шум Шум кафетерия Шум дорожного движения

-5 9,81 6,04 6,64

0 7,87 4,03 4,43

5 6,13 2,36 2,68

10 4,59 0,91 1,31

На рис. 10 показана реакция алгоритма к резким изменениям интенсивности шума. Рис. 10 (б) - речевой сигнал, смешанный с шумом уличного движения, который появляется со 2-й секунды. Алгоритм реагирует на шум менее чем за 2 с после возникновения шума.

б

а

Рис. 10 Подавление шума в слуховом аппарате на базе смартфона: а - чистая речь, б - зашумленная речь (шум появляется на 2-й секунде); в - зашумленная речь после обработки

Эффективность подавления акустической обратной связи также проверена путем практических и модельных экспериментов. В одном из экспериментов использовалась цифровая модель пути распространения обратной связи на базе фильтра с конечной импульсной характеристикой из 279 коэффициентов. Частотная характеристика фильтра показана на рис. 11. Использовался общий коэффициент компенсации потери GHL (k, т) слуха для всех субполос.

Сначала определялось максимальное усиление, достижимое без возникновения эффекта обратной связи без ее подавления. Затем определялось дополнительное усиление, которое можно достичь за счет подавления эффекта обратной связи. В табл. 2 приведены полученные результаты для двух алгоритмов подавления - алгоритма наименьших квадратов (LMS) и предложенного алгоритма ('НС' означает нестабильность системы).

Предложенный алгоритм подавления обеспечивает намного более высокое СОСШ по сравнению с алгоритмом LMS во всех испытанных условиях и сохраняет стабильность системы вплоть до добавочного усиления 24 дБ.

в

Рис. 11. Частотная характеристика модели пути распространения акустической обратной связи

Таблица 2. СОСШ, полученное при подавлении акустической обратной связи различными алгоритмами

AG, дБ Без подавления, дБ LMS, дБ Предложенный алгоритм, дБ

0 8,12 17,66 12,27

4 НС 5,57 11,94

8 НС 5,35 11,10

12 НС 3,18 10,22

16 НС 1,72 9,25

20 НС НС 7,59

24 НС НС 4,56

Одновременное использование предложенных алгоритмов подавления фонового шума и акустической обратной связи дополнительно увеличивает СОСШ за счет ослабления остатков обратной связи.

Выводы

Цифровые банки фильтров являются мощным, эффективным и гибким инструментом обработки звука, позволяющим создавать оригинальные мультимедиа системы. На основе имеющейся методологии вычислительный процесс многоканальной фильтрации может быть организован эффективным образом практически на любой вычислительной платформе. Эффективность реализации позволяет использовать портативные мультимедиа устройства с низким энергопотреблением наряду с производительными вычислительными системами. Опыт практического применения доказывает возможность создания сложных систем с субполосной обработкой звука, работающих в реальном масштабе времени на современных портативных устройствах.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Список литературы

1. Анализаторы речевых и звуковых сигналов: методы, алгоритмы и практика (с MATLAB примерами) / под ред. А.А. Петровского. Минск: Бестпринт, 2009. 456 с.

2. Изменение частоты основного тона речевого сигнала на основе гармонической модели с нестационарными параметрами / И.С. Азаров [и др.] // Труды СПИИРАН. 2014. Вып. 32. С. 5-26.

3. Azarov E., Vashkevich M., Petrovsky A. GUSLAR: A framework for automated singing voice correction // Proc. IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP). Florence, Italy, 4-9 May 2014. P. 7969-7973.

4. Вашкевич М.И., Азаров И.С., Петровский А.А. Косинусно-модулированные банки фильтров с фазовым преобразованием: реализация и применение в слуховых аппаратах. М. : Горячая линия-Телеком, 2014. 210 с.

5. Вашкевич М.И., Петровский А.А. Алгебраический метод синтеза быстрых алгоритмов дискретного косинусного преобразования произвольного размера // Автоматика и вычислительная техника. 2012. № 5. С. 48-57.

6. Vashkevich M., Azarov E., Petrovsky A. Low-delay hearing aid based on cochlear model with nonuniform subband acoustic feedback cancellation // Proc. EUSIPCO'12. Bucharest, Romania, 27-31 August 2012. P. 514-518.

7. Вашкевич М.И., Азаров И.С., Петровский А.А. Подавление эффекта акустической обратной связи в слуховых аппаратах с использованием неравнополосного банка фильтров // Информатика. 2012. № 2 (34). С. 50-60.

8. General-purpose listening enhancement based on subband non-linear amplification with psychoacoustic criterion / E. Azarov [et al.] // 138-th Audio Engineering Society Convention (AES'138), Warsaw, Poland 7-10 May, 2015. (Convention paper 9265).

9. Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке: пат. № 2589298 Росс. Федер. / М.И. Вашкевич, И.С. Азаров, А.Ю. Бредихин, А.А. Петровский; опубл. 10.07.2016.

10. Vashkevich M., Azarov E., Petrovsky A. Real-time implementation of hearing aid with combined noise and acoustic feedback reduction based on smartphone // Proc. IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP). New Orleans, USA, 5-9 March 2017. P. 6570-6571.

11. Petralex: A smartphone-based real-time digital hearing aid with combined noise reduction and acoustic feedback suppression / M. Vashkevich [et al.] // Proc. of International Conference Signal Processing Algorithms, Architectures, Arrangements, and Applications (SPA'2017). Poznan, Poland 20-22 September 2017. P. 249-254.

12. Azarov E., Vashkevich M., Petrovsky A. Instantaneous pitch estimation based on RAPT framework // Proc. EUSIPCO'12. Bucharest, Romania, 27-31 August 2012. P. 2787-2791.

13. Azarov E., Vashkevich M., Petrovsky A. Instantaneous pitch estimation algorithm based on multirate sampling // Proc. IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP). Shanghai, China, May 20-25 2016. P. 4970-4974.

References

1. Analizatory rechevyh i zvukovyh signalov: metody, algoritmy i praktika (s MATLAB primerami) / pod red. A.A. Petrovskogo. Minsk: Bestprint, 2009. 456 s. (in Russ.)

2. Izmenenie chastoty osnovnogo tona rechevogo signala na osnove garmonicheskoj modeli s nestacionarnymi parametrami / I.S. Azarov [i dr.] // Trudy SPIIRAN. 2014. Vyp. 32. S. 5-26. (in Russ.)

3. Azarov E., Vashkevich M., Petrovsky A. GUSLAR: A framework for automated singing voice correction // Proc. IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP). Florence, Italy, 4-9 May 2014. P. 7969-7973.

4. Vashkevich M.I., Azarov I.S., Petrovskij A.A. Kosinusno-modulirovannye banki fil'trov s fazovym preobrazovaniem: realizacija i primenenie v sluhovyh apparatah. M. : Gorjachaja linija-Telekom, 2014. 210 s. (in Russ.)

5. Vashkevich M.I., Petrovskij A.A. Algebraicheskij metod sinteza bystryh algoritmov diskretnogo kosinusnogo preobrazovanija proizvol'nogo razmera // Avtomatika i vychislitel'naja tehnika. 2012. № 5. S. 48-57. (in Russ.)

6. Vashkevich M., Azarov E., Petrovsky A. Low-delay hearing aid based on cochlear model with nonuniform subband acoustic feedback cancellation // Proc. EUSIPCO'12. Bucharest, Romania, 27-31 August 2012. P. 514-518.

7. Vashkevich M.I., Azarov I.S., Petrovskij A.A. Podavlenie jeffekta akusticheskoj obratnoj svjazi v sluhovyh apparatah s ispol'zovaniem neravnopolosnogo banka fil'trov // Informatika. 2012. № 2 (34). S. 50-60.

8. General-purpose listening enhancement based on subband non-linear amplification with psychoacoustic criterion / E. Azarov [et al.] // 138-th Audio Engineering Society Convention (AES'138), Warsaw, Poland 7-10 May, 2015. (Convention paper 9265).

9. Sposob povyshenija razborchivosti i informativnosti zvukovyh signalov v shumovoj obstanovke: pat. № 2589298 Ross. Feder. / M.I. Vashkevich, I.S. Azarov, A.Ju. Bredihin, A.A. Petrovskij; opubl. 10.07.2016. (in Russ.)

10. Vashkevich M., Azarov E., Petrovsky A. Real-time implementation of hearing aid with combined noise and acoustic feedback reduction based on smartphone // Proc. IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP). New Orleans, USA, 5-9 March 2017. P. 6570-6571.

11. Petralex: A smartphone-based real-time digital hearing aid with combined noise reduction and acoustic feedback suppression / M. Vashkevich [et al.] // Proc. of International Conference Signal Processing Algorithms, Architectures, Arrangements, and Applications (SPA'2017). Poznan, Poland 20-22 September 2017. P. 249-254.

12. Azarov E., Vashkevich M., Petrovsky A. Instantaneous pitch estimation based on RAPT framework // Proc. EUSIPCO'12. Bucharest, Romania, 27-31 August 2012. P. 2787-2791.

13. Azarov E., Vashkevich M., Petrovsky A. Instantaneous pitch estimation algorithm based on multirate sampling // Proc. IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP). Shanghai, China, May 20-25 2016. P. 4970-4974.

Сведения об авторах

Вашкевич М.И., к.т.н., доцент кафедры электронных вычислительных средств Белорусского государственного университета информатики и радиоэлектроники.

Азаров И.С., д.т.н., доцент, заведующий кафежрой электронных вычислительных средств Белорусского государственного университета информатики и радиоэлектроники.

Петровский А.А., д.т.н., профессор кафедры электронных вычислительных средств Белорусского государственного университета информатики и радиоэлектроники.

Адрес для корреспонденции

220013, Республика Беларусь,

г. Минск, ул. П. Бровки, 6

Белорусский государственный университет

информатики и радиоэлектроники

тел. +375-17-293-88-05;

e-mail: [email protected]

Вашкевич Максим Иосифович

Information about the authors

Vashkevich M.I., PhD, associate professor of computer engineering department of Belarusian state university of informatics and radioelectronics.

Azarov I.S., D.Sci, head of the computer engineering department of Belarusian state university of informatics and radioelectronics.

Petrovsky A.A. D.Sci, professor of the computer engineering department of Belarusian state university of informatics and radioelectronics.

Address for correspondence

220013, Republic of Belarus, Minsk, P. Brovky st., 6 Belarussian state university of informatics and radioelectronics tel. +375-17-293-88-05; e-mail: [email protected] Vashkevich Maksim Iosifovich

i Надоели баннеры? Вы всегда можете отключить рекламу.