Научная статья на тему 'Помехоустойчивая обработка речевых сигналов на основе комплементарной множественной декомпозиции на эмпирические моды'

Помехоустойчивая обработка речевых сигналов на основе комплементарной множественной декомпозиции на эмпирические моды Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
118
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОМЕХОУСТОЙЧИВАЯ ОБРАБОТКА / ФИЛЬТРАЦИЯ РЕЧЕВЫХ СИГНАЛОВ / РАСПОЗНАВАНИЕ РЕЧИ / КОМПЛЕМЕНТАРНАЯ МНОЖЕСТВЕННАЯ ДЕКОМПОЗИЦИЯ НА ЭМПИРИЧЕСКИЕ МОДЫ / НЕЗАВИСИМЫЙ КОМПОНЕНТНЫЙ АНАЛИЗ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Алимурадов А. К., Квитка Ю. С., Зарецкий А. П., Кулешов А. П.

Помехоустойчивая обработка речевых сигналов является одной из основных проблем практической реализации систем распознавания речи (СРР). Предлагаемый алгоритм помехоустойчивой обработки представляет собой фильтрацию речевых сигналов с использованием методов комплементарной множественной декомпозиции на эмпирические моды (КМДЭМ) и независимого компонентного анализа (НКА). Зашумленный речевой сигнал адаптивно раскладывается на частотные составляющие эмпирические моды (ЭМ) с помощью метода КМДЭМ. Применение метода КМДЭМ для разложения сигналов позволяет исключить явление смешивания ЭМ, возникающее при обработке сигналов, содержащих кратковременные и несоизмеримые по масштабу участки. Из полученного набора ЭМ определяется мода, содержащая основной шум, посредством оценки весовых энергетических и шумовых коэффициентов мод. Далее исходный зашумленный речевой сигнал и ЭМ с основным шумом подвергаются обработке с помощью метода НКА. В результате выделяется отфильтрованный речевой сигнал. Применение предложенного алгоритма фильтрации способствует повышению устойчивости к шумам СРР и точности распознавания соответственно. Результаты исследований предложенного алгоритма демонстрируют эффективное подавление шума, в том числе и для малых значений отношения сигнал/шум.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Алимурадов А. К., Квитка Ю. С., Зарецкий А. П., Кулешов А. П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Помехоустойчивая обработка речевых сигналов на основе комплементарной множественной декомпозиции на эмпирические моды»

УДК 612.789.4

А. К. Алимурадов1, Ю. С. Квитка1, А. П. Зарецкий2, А. П. Кулешов3

ХФГБОУ ВО «Пензенский государственный университет» 2 Московский физико-технический институт (государственный университет) 3ФГБУ «ФНЦТИО им. акад. В. И. Шумакова» Минздрава России

Помехоустойчивая обработка речевых сигналов на основе комплементарной множественной декомпозиции на эмпирические моды

Помехоустойчивая обработка речевых сигналов является одной из основных проблем практической реализации систем распознавания речи (СРР). Предлагаемый алгоритм помехоустойчивой обработки представляет собой фильтрацию речевых сигналов с использованием методов комплементарной множественной декомпозиции на эмпирические моды (КМДЭМ) и независимого компонентного анализа (НКА). Зашумленный речевой сигнал адаптивно раскладывается на частотные составляющие - эмпирические моды (ЭМ) - с помощью метода КМДЭМ. Применение метода КМДЭМ для разложения сигналов позволяет исключить явление смешивания ЭМ, возникающее при обработке сигналов, содержащих кратковременные и несоизмеримые по масштабу участки. Из полученного набора ЭМ определяется мода, содержащая основной шум, посредством оценки весовых энергетических и шумовых коэффициентов мод. Далее исходный зашумленный речевой сигнал и ЭМ с основным шумом подвергаются обработке с помощью метода НКА. В результате выделяется отфильтрованный речевой сигнал. Применение предложенного алгоритма фильтрации способствует повышению устойчивости к шумам СРР и точности распознавания соответственно. Результаты исследований предложенного алгоритма демонстрируют эффективное подавление шума, в том числе и для малых значений отношения сигнал/шум.

Ключевые слова: помехоустойчивая обработка, фильтрация речевых сигналов, распознавание речи, комплементарная множественная декомпозиция на эмпирические моды, независимый компонентный анализ.

A.K. Alimuradov1, Y.S. Kvitka1, A. P. Zaretskiy2 A. P. Kuleshov3

1 Penza State University, Research Department 440026, Penza 2 Moscow Institute of Physics and Technology (State University) 3Federal State Budgetary Institute «Academician V. I. Shumakov Federal Research Center of

Transplantology and Artificial Organs», Ministry of Health of the Russian Federation

Noiseproof processing of speech signals based on the complementary ensemble emperical mode decomposition

The noiseproof processing of speech signals is one of the main problems of practical implementation of speech recognition systems (SRS). The proposed algorithm of errorcorrecting processing is a filtering of speech signals using complementary ensemble empirical mode decomposition (CEEMD) and independent component analysis (ICA). A noisy speech signal is decomposed into frequency adaptive components - empirical modes (EM) using the CEEMD method. The CMDM method's application to the signals decomposition allows us to eliminate the phenomenon of EM's mixing that occurs during the signals processing containing short and disproportionate for scale plots. The mode (which contains general noise) is determined from the resulting set by estimating the weight of energy and noise coefficients mode. Next, the original noisy speech signal and EM with the main noise is parsing using the ICA method. The filtered speech signal is the result of this process. The application of the proposed filtering algorithm contributes to the stability to noise of the SRS and recognition accuracy, respectively. The research results of the proposed algorithm demonstrate the effective suppression of noise even for small values of the signal-noise ratio.

Key words: noise-proof processing, filtering of speech signals, speech recognition, complementary ensemble empirical mode decomposition, independent component analysis.

1. Введение

В настоящее время использование речевых сигналов в качестве интерфейса взаимодействия человек-машина получило широкую популярность в управляющих системах. На практике все речевые сигналы в той или иной степени являются зашумленными. В условиях современной «агрессивной» шумовой обстановки и в зависимости от интенсивности шум может существенно исказить результаты обработки и анализа речевых сигналов. По этой причине исследование и разработка новых высокоэффективных методов помехоустойчивой обработки речевых сигналов, адаптивных к современным условиям зашумленности, являются весьма актуальными.

Работа в направлении помехоустойчивой обработки речевых сигналов ведется достаточно активно. На сегодняшний день разработано большое количество различных методов обработки зашумленных речевых сигналов:

- методы адаптивной компенсации помех;

- методы, основанные на использовании математических моделей речевых сигналов во временной области;

- методы, основанные на использовании математических моделей речевых сигналов в частотной области;

- методы, основанные на использовании спектральных характеристик шума;

- методы, основанные на использовании моделей искусственных нейронных сетей;

- методы, основанные на моделях восприятия речи человеком.

В области обработки зашумленных речевых сигналов для СРР наиболее популярными являются методы, основанные на использовании спектральных характеристик [1, 2], обработки в частотной [3] и временной [4] областях. Подробный анализ представленных методов выявил, что проблема остаточного шума после фильтрации решена не полностью. Причиной этого является невозможность методов корректно анализировать нелинейные и нестационарные сигналы сложной формы (полезные и шумовые) различных уровней интенсивности.

Проведенный обзор известных алгоритмов фильтрации зашумленных речевых сигналов, использующих инструменты анализа нестационарных данных [5, 6], выявил следующие особенности. Как правило, в представленных работах используются методы классической и множественной декомпозиции на эмпирические моды (ДЭМ, МДЭМ) [7, 8].

На основе анализа известных алгоритмов и собственных исследований [9, 10, 11] предложен алгоритм фильтрации речевых сигналов для помехоустойчивых СРР, основанный на методе КМДЭМ [12]. В отличие от методов ДЭМ и МДЭМ использование для разложения КМДЭМ позволяет практически полностью исключить явление смешивания ЭМ (возникающее при обработке сигналов, содержащих кратковременные и несоизмеримые по масштабу участки). Это достигается за счет комплементарности добавляемого белого шума на этапах разложения. Зашумленный речевой сигнал адаптивно раскладывается на ЭМ, из которых посредством специальной методики оценки весовых энергетических и шумовых коэффициентов определяется мода, содержащая основной шум. Далее используется метод НКА для исходного зашумленного речевого сигнала и ЭМ с основным шумом, результатом которого выделяется отфильтрованный речевой сигнал с минимальным уровнем остаточного шума.

2. Комплементарная множественная декомпозиция на эмпирические моды

Базисом КМДЭМ является классический метод ДЭМ. Математический аппарат ДЭМ представляет собой итерационную вычислительную процедуру отсеивания [7]. Особенность ДЭМ заключается в том, что базисные функции, используемые для разложения в процедуре отсеивания, извлекаются непосредственно из исходного сигнала. Разложение на ЭМ позволяет анализировать кратковременные локальные изменения в сигнале, поэтому дан-

ный метод может быть использован для обработки нелинейных и нестационарных речевых сигналов. Полученные ЭМ должны удовлетворять следующим двум условиям:

1) на протяжении длительности всего сигнала число экстремумов (минимальных и максимальных) и нулевых пересечений через ось времени должны быть одинаковыми или отличаться не более чем на единицу;

2) в любой момент среднее значение верхней и нижней огибающих должно быть равно нулю.

Результат процесса отсеивания [7] можно представить следующим выражением:

I

в(1) = £ а + п, (1)

г=1

где в(Ь) - исходный речевой сигнал; - эмпирическая мода; г - номер ЭМ; I - количество ЭМ, г г - остаток.

Недостатками ДЭМ являются:

- смешивание нескольких ЭМ которые интерпретируются как одна мода;

- получение ЭМ, состоящих из участков сигнала несоизмеримых масштабов, находящихся в различных частях сигнала.

Для устранения этих недостатков используется метод КМДЭМ, основанный на многократном добавлении к сигналу белого шума (с прямыми и инверсными значениями) и вычислении среднего значения ЭМ как конечного истинного результата. Добавление белого шума позволяет выделить несоизмеримые по амплитудному и временному масштабам участки сигнала, находящиеся в различных частях ЭМ для получения всех возможных вариаций мод в процессе отсеивания. Таким образом, анализируемый сигнал представляет собой объединение сигнала и белого шума (с прямыми и инверсными значениями) [12]:

" К®

где в^) - исходный речевой сигнал; п(Ь) - добавленный белый шум; в1(Ь) - сумма первоначальных данных с белым шумом; в2(Ь) - сумма первоначальных данных с инверсным белым шумом.

Данный подход в полной мере использует преимущество статистических характеристик белого шума, для обнаружения слабых периодических (квазипериодических) сигналов с минимальным значением остаточного шума. Таким образом, метод КМДЭМ является более точным способом анализа речевых сигналов, чем ДЭМ и МДЭМ, посредством добавления малого по амплитуде белого шума с прямыми и инверсными значениями.

1 1 1 -1

п(1)

(2)

*

3. Алгоритм фильтрации речевых сигналов

На рис. 1 представлен алгоритм фильтрации речевых сигналов с использованием методов КМДЭМ и НКА. Рассмотрим подробнее основные этапы работы предложенного алгоритма.

Исходные данные: ( ) - зашумленный речевой сигнал, п - дискретный отсчет времени 0 < п ^ N, N - количество дискретных отсчетов в сигнале, уровень среднеквадратической амплитуды шума, номер цикла ] = 1, 2,..., .], количество циклов декомпозиции .] = 50.

Блок 1. В соответствии с [12] метод КМДЭМ предназначен для получения набора усредненных значений ЭМ и остатка:

Е^-1 ЭМ^п)

ЭМг(п) = ^3-13 У ), (3)

, , Е/-1 п(п) т

П(п) = ' 1-. (4)

Блок 2. После завершения декомпозиции зашумленный речевой сигнал представляет собой набор ЭМг(п), где г - номер ЭМ, I - количество ЭМ. Далее работа алгоритма осуществляется с каждой ЭМ в отдельности. Для этого выставляем номер ЭМ, равный единице (г = 1).

Блок 3. На первых этапах работы алгоритма необходимо установить начальные пороги весовых коэффициентов ЭМ (энергетического и шумового), которые необходимы для определения моды с основным шумом на последующих этапах. Значения коэффициентов устанавливаются равными единице (аэ = 1,аш = 1).

Блок 4. Разбиение ЭМ на фрагменты осуществляется по следующим формулам:

8 = ЭМаМ , (5)

где ЭМа(п) - сигнал первой ЭМ1, 5 - количество фрагментов ЭМ1, Ь - количество дискретных отсчетов в одном фрагменте.

ЭМм+1(п) = ЭМ1((в * Ь) + 1; (в + 1) * Ь), (6)

где ЭМ1)8+1(п) - фрагмент ЭМ1, § = (0,1,2, ...Б — 1) - номер фрагмента.

Блок. 5. В соответствии с особенностями речевого аппарата, человек перед произношением слова делает кратковременную паузу - обычно 200 мс или более (1600 отсчетов - 20 фрагментов по 80 отсчетов, при частоте дискретизации 8000 Гц). Этот участок паузы не содержит речи и соответствует тишине с фоновым шумом.

Вычисление энергии ЭМ и ее фрагментов осуществляется по формулам

N

Е1 = £ [ЭМ1(п)2], (7)

П=1

N

ем+1 = ^2 [ЭМм+1(п)2]. (8

|_ЭММ+1С'0 21

П=1

Блок 6. Опираясь на условие, что первые 200 мс речевой сигнал содержит лишь только фоновые шумы, можно вычислить статические характеристики шума: у - математическое отклонение и а - стандартное отклонение первых 1600 отсчетов (20 фрагментов) по формулам:

1 1600

ч = 1600 Е^Л (9)

П=1

а =

\

1600

1600

п=1

£[ЭМ1(п) — ^ 2. (10)

Блок 7. Определение ЭМ с основным шумом осуществляется с использованием весового энергетического коэффициента, который определяется по следующей формуле:

Е1 — е1 (ЛЛ\

Оэ1 = Е , (11)

где е\ = =120М+1 - среднее значение энергии первых 20-ти фрагментов сигнала ЭМ1, - значение энергии ЭМ1, аэ1 - весовой энергетический коэффициент определения статуса ЭМ1.

Если коэффициент аэ1 приближается к абсолютному минимальному значению, то соответствующая ЭМ1 считается модой с основным шумом. И наоборот, если коэффициент аэ1 приближается к единице, то соответствующая ЭМ1 считается модой, содержащей полезный сигнал.

1

Сегментация ЭМ, на фрагменты

Рис. 1. Алгоритм фильтрации речевых сигналов с использованием методов КМДЭМ и НКА

Блок 8. Определение ЭМ с основным шумом осуществляется с использованием весового шумового коэффициента. Для каждого отсчета ЭМ1 вычисляется одномерное расстояние Махаланобиса:

г1п

|ЭМ1 (п) -И

а

(12)

Значение пп позволяет определить, является ли отсчет шумовым по условию пп > 3. Значение, равное 3, получено эмпирически. После того как определен статус каждого отсчета, необходимо определить статус каждого фрагмента. Для этого используется простое правило: если во фрагменте 60% отсчетом имеют статус шума, то такой фрагмент является шумовым. Это правило используется по причине того, что речевой аппарат не может быстро перестраиваться и в течение времени половины фрагмента (10 мс) чередовать речь и паузу.

После определения статуса фрагментов определяется весовой шумовой коэффициент ЭМ1:

Ош1 = —д—, (13)

где 5 - общее количество фрагментов ЭМ1, 5Ш - количество шумовых фрагментов ЭМ1.

Если коэффициент приближается к абсолютному минимальному значению, то соответствующая ЭМ1 считается модой с основным шумом. И наоборот, если коэффициент приближается к единице, то соответствующая ЭМ1 считается модой, содержащей полезный сигнал.

Блоки 9, 10, 11. После определения весовых коэффициентов ЭМ1 осуществляется сравнение с пороговыми значениями аш1 < аш ,аэ1 < аэ (блок 9). В случае если условие выполняется, то устанавливаются новые значения пороговых коэффициентов, равные текущим значениям аш1 = аш ,аэ1 = аэ (блок 10), и анализируемая ЭМ определяется как мода с основным шумом ЭМг < ЭМш (блок 11).

Блоки 12, 13. После завершения анализа ЭМ1 осуществляется сравнение номера моды с их конечным количеством (г = I) (блок 12). В случае если условие не выполняется, то устанавливается следующий по счету номер ЭМ г = г + 1 и осуществляется переход к блоку 4 для анализа следующей ЭМ (блок 13).

Блок 14. После анализа всех ЭМ и определения моды с основным шумом осуществляется непосредственная фильтрация с помощью метода НКА, в результате чего выделяются составляющие отфильтрованного речевого сигнала и шума.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Независимый компонентный анализ - это метод обработки статистических данных, позволяющий выделить независимые компоненты, обладающие статистической независимостью и негауссовым распределением. Независимый компонентный анализ описывается следующим математическим аппаратом: набор наблюдаемых векторов - матрица X, вектор зашумленного речевого сигнала и ЭМ с основным шумом, которые являются линейными комбинациями независимых компонент - матрица У (в нашем случае это чистый речевой сигнал и шум). Модель независимых компонент может быть записана следующим образом:

X = w * У, (14)

где Ш - матрица весов для перехода из пространства У в пространство X. Цель метода независимых компонент состоит в определении матрицы Ш-1, с помощью которой можно будет определить матрицу независимых компонент У по формуле

У = w-1 * X. (15)

4. Экспериментальное исследование алгоритма фильтрации речевых сигналов

Исследование проводилось в пакете прикладных программ для решения технических и математических задач «МАТЬАВ». Исходные данные для исследования: зашумленный речевой сигнал, представляющий собой словосочетание «На костюм капнула хна» длительностью 1800 мс, зарегистрированный без фоновых шумов, частота дискретизации 8000 Гц, разрядность квантования 16 бит. Настройки аппарата КМДЭМ: уровень среднеквадратиче-ского отклонения добавляемого белого шума - 0,01, количество реализаций декомпозиции

- 50, количество итераций - 50. Словосочетание «На костюм капнула хна» представляет собой нелинейный и нестационарный речевой сигнал, состоящий из несоизмеримых по масштабу (амплитудному и временному) звуков [13] (см. рис. 2).

0 5000 10000 15000

Дискретные отсчеты времени

Рис. 2. Алгоритм фильтрации речевых сигналов с использованием методов КМДЭМ и НКА

Критерием оценки эффективности предлагаемого алгоритма фильтрации является выходное значение отношения сигнал/шум, по которому можно оценить наличие остаточного шума:

^Евых(дБ) = 20 log( A™x.s^1), (16)

АВЫХ.погве

где Авы\к.з1дпа1, Авыx.noise - среднеквадратичное значение амплитуды (А = ^^(а2 + а2 + ... + а2)) сигнала и шума соответственно.

Результаты исследования будут оцениваться в сравнении с известными методами фильтрации, программная реализация которых имеется в открытом доступе:

- метод на основе дискретного косинусного преобразования (Discrete Cosine Transform, DCT) с мягкой пороговой обработкой (SDCT);

- метод на основе двухэтапного повышения разборчивости речи (Two-Stage Speech Enhancement, TSSE);

- метод на основе жесткой и мягкой пороговой обработки (Hard and Soft Thresholding, HST);

- метод на основе взвешенного вычитания шума и слепого разделения сигнала (Weighted Noise Subtraction and Blind Signal Separation, WNS+BSS).

Наиболее характерными шумами, оказывающими негативное воздействие на работоспособность СРР, являются нестационарные фоновые шумы. Они ухудшают разборчивость речевых сигналов и могут привести к большой разнице между поступающими в СРР за-шумленными речевыми сигналами и эталонами, полученными в ходе обучения системы чистыми речевыми сигналами. Большая разница является основной причиной некорректного распознавания. Для экспериментального исследования алгоритма использовался белый шум с различными среднеквадратичными значениями амплитуды. Генерируемый белый шум программно накладывался на чистый речевой сигнал, формируя зашумленные речевые сигналы с различными отношениями сигнал/шум: от -5 до 15 дБ.

Сравнение результатов фильтрации с помощью известных методов и предложенного алгоритма представлены в таблице 1. На рис. 3 также представлены результаты работы алгоритма в виде осциллограмм чистого, зашумленных и отфильтрованных речевых сигналов.

Результаты работы алгоритма фильтрации показаны на рис. 3-7: зеленый цвет - исходный чистый речевой сигнал, синий цвет - зашумленный речевой сигнал, красный цвет -отфильтрованный речевой сигнал.

В соответствии с результатами, представленными в таблице 1 и на рис. 3, следует, что предложенный алгоритм фильтрации эффективнее известных методов для всего диапазона значений входного отношения сигнал/шум. Наглядно это представлено на рис. 4.

Таблица1

Результаты фильтрации с помощью известных методов и предложенного

алгоритма

Входное отноше- Выходное отношение сигнал/шум, дБ

ние

сигнал/шум, дБ ББСТ ТББЕ НБТ WNS+BSS Предложенный алгоритм

-5 8,14 7,58 8,25 8,37 9,23

0 10,56 10,34 11,23 11,08 12,9

5 14,27 13,41 14,94 14,23 16,24

10 15,8 16,1 17,7 16,5 18,12

15 23,4 26,56 26,24 21,45 28,76

Дискретные отсчеты времени

Рис. 3. Результат фильтрации зашумленного речевого сигнала, выходное значение отношения сигнал/шум 9,93 дБ при входном значении - 5 дБ

О 5000 10000 15000

Дискретные отсчеты времени

Рис. 4. Результат фильтрации зашумленного речевого сигнала, выходное значение отношения сигнал/шум 12,9 дБ при входном значении 0 дБ

О 5000 10000 15000

Дискретные отсчеты времени

Рис. 5. Результат фильтрации зашумленного речевого сигнала, выходное значение отношения сигнал/шум 16,24 дБ при входном значении 5 дБ

Дискретные отсчеты времени

Рис. 6. Результат фильтрации зашумленного речевого сигнала, выходное значение отношения сигнал/шум 18,14 дБ при входном значении 10 дБ

О 5000 10000 15000

Дискретные отсчеты времени

Рис. 7. Результат фильтрации зашумленного речевого сигнала, выходное значение отношения сигнал/шум 28,76 дБ при входном значении 15 дБ

-5 0 5 10 15

Входное значение отношения сигнал/шум, дБ

Рис. 8. Результаты фильтрации с помощью известных методов и предложенного алгоритма

Предложенный алгоритм был исследован на зашумленных речевых сигналах белым шумом. В дальнейшем актуальным является исследование предложенного алгоритма на зашумленных речевых сигналах коричневым и розовым шумами.

5. Вывод

В данной статье представлен алгоритм фильтрации помехоустойчивой обработки речевых сигналов для СРР на основе методов КМДЭМ и НКА. Зашумленный речевой сигнал адаптивно раскладывается на конечное число ЭМ. Далее определяется ЭМ с основным шумом. Для выделения речевого сигнала из смеси сигнал/шум используется метод НКА. Результаты экспериментального исследования показывают, что предложенный алгоритм фильтрации обеспечивает минимальный остаточный шум даже при малых входных значениях отношения сигнал/шум (- 5 дБ и 0 дБ).

Литература

1. Boll S. Suppression of acoustic noise in speech using spectral subtraction // IEEE Trans Acoust Speech Signal Process. 1979. V. 27(2). P. 113-120.

2. Berstein A., Shallom I. A hypothesized Wiener filtering approach to noisy speech recognition // International Conference on Acoustics, Speech, and Signal Processing (ICASSP'91). 1991. V. 2. P. 913-916.

3. Furui S. Cepstral analysis technique for automatic speaker verification // IEEE Trans Acoust Speech Signal Process. 1991. V. 29(2). P. 254-272.

4. Hermansky H., Morgan N. RASTA processing of speech // IEEE Trans. Speech and Audio Proc. 1994. V. 2(4). P. 578-589.

5. Kuo-Hau Wu, Chia-Ping Chen, Bing-Feng Yeh. Noise-robust speech feature processing with empirical mode decomposition // EURASIP Journal on Audio, Speech, and Music Processing, 2011. 9 p.

6. Jingjiao Li, Dong An, Jiao Wang, Chaoqun Rong. Speech Endpoint Detection in Noisy Environment Based on the Ensemble Empirical Mode Decomposition // Advanced Engineering Forum. 2012. V. 2-3. P. 135-139.

7. Huang N.E., Zheng Shen, Steven R.L. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis // Proceedings of the Royal Society of London A. 1998. V. 454. P. 903-995.

8. Zhaohua Wu, Huang N.E. Ensemble empirical mode decomposition: A noise-assisted data analysis method // Advances in Adaptive Data Analysis. 2009. V. 1(1). P. 1-41.

9. Алимурадов А.К., Муртазов Ф.Ш. Методы повышения эффективности распознавания речевых сигналов в системах голосового управления // Измерительная техника. 2015. № 10. С. 20-24.

10. Алимурадов А.К. Адаптивная компенсация помех речевых сигналов с использованием комплементарной множественной декомпозиция на эмпирические моды / А.К. Алимурадов // «Молодежь и XXI век - 2015»: материалы V Международной молодежной научной конференции (26-27 февраля 2015 года), в 3-х томах, Том 2, Юго-Зап. гос. ун-т., ЗАО «Университетская книга», Курск, 2015, С. 96-99.

11. Алимурадов А.К. Применение преобразования Гильберта-Хуанга в задаче выделения информативных признаков речевых сигналов / А.К. Алимурадов, А.Ю. Тычков // Международный научно-исследовательский журнал. 2013. № 5-1(12). С. 57-58.

12. Yeh, J.-R., Shieh, J.-S., Huang N.E. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method // Advances in Adaptive Data Analysis. 2010. V. 2(2). P. 135-156.

13. Алимурадов А.К. Применение методов декомпозиции на эмпирические моды в задаче фильтрации речевых сигналов в условиях интенсивных помех / А.К. Алимурадов, П.П. Чураков // Измерение. Мониторинг. Управление. Контроль. 2016. № 1(15). С. 4-14.

References

1. Boll S. Suppression of acoustic noise in speech using spectral subtraction. IEEE Trans Acoust Speech Signal Process. 1979. V. 27(2). P. 113-120.

2. Berstein A, Shallom I. A hypothesized Wiener filtering approach to noisy speech recognition. International Conference on Acoustics, Speech, and Signal Processing (ICASSP'91). 1991. V. 2. P. 913-916.

3. Furui S. Cepstral analysis technique for automatic speaker verification. IEEE Trans Acoust Speech Signal Process. 1991. V. 29(2). P. 254-272.

4. Hermansky H., Morgan N. RASTA processing of speech. IEEE Trans. Speech and Audio Proc. 1994. V. 2(4). P. 578-589.

5. Kuo-Hau Wu, Chia-Ping Chen, Bing-Feng Yeh. Noise-robust speech feature processing with empirical mode decomposition. EURASIP Journal on Audio, Speech, and Music Processing, 2011. 9 p.

6. Jingjiao Li, Dong An, Jiao Wang, Chaoqun Rong. Speech Endpoint Detection in Noisy Environment Based on the Ensemble Empirical Mode Decomposition. Advanced Engineering Forum. 2012. V. 2-3. P. 135-139.

7. Huang N.E., Zheng Shen, Steven R.L. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis. Proceedings of the Royal Society of London A. 1998. V. 454. P. 903-995.

8. Zhaohua Wu, Huang N.E., Ensemble empirical mode decomposition: A noise-assisted data analysis method. Advances in Adaptive Data Analysis. 2009. V. 1(1). P. 1-41.

9. Alimuradov Á.K., Murtazov F.Sh. Methods to improve the efficiency of recognition of speech signals in voice control systems. Measur. Tech. 2015. V. 10. P. 20-24.

10. Alimuradov Á.K. Adaptive interference cancellation in speech signals using complementary ensemble empirical mode decomposition. The Youth and the XXIth century 2015: proceeding sof the Vth Internationaly oung scientists' conference. February 26-27. 2015. V. 3. P. 96-99.

11. Alimuradov Á.K., Tychkov A.Yu. Applying of Hilbert-Huang transform to the problem of selection of speech signals informative features. International research journal. 2013. V. 5-1(12). P. 57-58.

12. Yeh J.-R., Shieh J.-S., Huang N.E. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method. Advances in Adaptive Data Analysis. 2010. V. 2(2). P. 135-156.

13. Alimuradov Á.K., Churakov P.P. The application of empirical mode decomposition methods for speech signals filtering in conditions of intense interference. Measurement. Monitoring. Management. Control. 2016. V. 1(15). P. 4-14.

Поступила в редакцию 11.07.2016

i Надоели баннеры? Вы всегда можете отключить рекламу.