Научная статья на тему 'Применение методов декомпозиции на эмпирические моды в задаче фильтрации речевых сигналов в условиях интенсивных помех'

Применение методов декомпозиции на эмпирические моды в задаче фильтрации речевых сигналов в условиях интенсивных помех Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
632
100
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФИЛЬТРАЦИЯ РЕЧЕВЫХ СИГНАЛОВ / ДЕКОМПОЗИЦИЯ НА ЭМПИРИЧЕСКИЕ МОДЫ / ОТНОШЕНИЕ СИГНАЛ/ШУМ / ИНТЕНСИВНЫЕ ПОМЕХИ / НЕЗАВИСИМЫЙ КОМПОНЕНТНЫЙ АНАЛИЗ / SPEECH SIGNALS FILTERING / EMPIRICAL MODE DECOMPOSITION / SIGNAL-TO-NOISE RATIO / INTENSE INTERFERENCE / INDEPENDENT COMPONENT ANALYSIS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Алимурадов Алан Казанферович, Чураков Петр Павлович

Актуальность и цели. Существующие алгоритмы и узлы фильтрации речевых сигналов при наличии интенсивных помех не удовлетворяют предъявляемым требованиям, поэтому разработка методов повышения помехоустойчивости при фильтрации речевых сигналов является актуальной задачей. Материалы и методы. Для повышения эффективности фильтрации интенсивных помех предложена модификация преобразования Гильберта Хуанга, состоящего из декомпозиции на эмпирические моды (ДЭМ). Результаты. Представлен обзор существующих алгоритмов фильтрации речевых сигналов. На основе модификаций ДЭМ разработан алгоритм фильтрации, существенно расширяющий диапазон изменения отношения сигнал/шум управляющего зашумленного речевого сигнала. Проведен сравнительный анализ характеристик разработанного алгоритма для трех модификаций ДЭМ. Выводы. Наиболее адаптивным методом декомпозиции речевых сигналов является метод комплементарной множественной декомпозиции на эмпирические моды, который рекомендуется для практического использования в системах голосового управления, функционирующих в условиях интенсивных помех.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Алимурадов Алан Казанферович, Чураков Петр Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF EMPIRICALMODE DECOMPOSITION METHODS FOR SPEECH SIGNALS FILTERING UNDER INTENSIVE INTERFERENCE ENVIRONMENT

Background. The existing algorithms and filter nodes of speech signals in the presence of intense noise do not meet the requirements, so the development of methods for improving noise-robust filtering of speech signals is an urgent task. Materials and methods. To increase the effectiveness of intense noise filtering modification of the Hilbert-Huang transform is proposed, comprising the Empirical Mode Decomposition (EMD). Results. A review of the existing filtering algorithms of speech signals is given. Filtering algorithms are developed on the basis of the EMD modifications, significantly extending the range of signal-to-noise ratio of the control noisy speech signal. A comparative analysis of the developed algorithms characteristics is conducted. Conclusions. The Complementary Ensemble Empirical Mode Decomposition (CEEMD) method is the most adaptive method for speech signals decomposition, which is recommended for practical use in voice control systems (VCS), operating under intense interference environment.

Текст научной работы на тему «Применение методов декомпозиции на эмпирические моды в задаче фильтрации речевых сигналов в условиях интенсивных помех»

ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНЫЕ И УПРАВЛЯЮЩИЕ СИСТЕМЫ

УДК 004.934

А. К. Алимурадов, П. П. Чураков

ПРИМЕНЕНИЕ МЕТОДОВ ДЕКОМПОЗИЦИИ НА ЭМПИРИЧЕСКИЕ МОДЫ В ЗАДАЧЕ ФИЛЬТРАЦИИ РЕЧЕВЫХ СИГНАЛОВ В УСЛОВИЯХ ИНТЕНСИВНЫХ ПОМЕХ

A. K. Alimuradov, P. P. Churakov

APPLICATION OF EMPIRICALMODE DECOMPOSITION METHODS FOR SPEECH SIGNALS FILTERING UNDER INTENSIVE INTERFERENCE ENVIRONMENT

Аннотация. Актуальность и цели. Существующие алгоритмы и узлы фильтрации речевых сигналов при наличии интенсивных помех не удовлетворяют предъявляемым требованиям, поэтому разработка методов повышения помехоустойчивости при фильтрации речевых сигналов является актуальной задачей. Материалы и методы. Для повышения эффективности фильтрации интенсивных помех предложена модификация преобразования Гильберта - Хуанга, состоящего из декомпозиции на эмпирические моды (ДЭМ). Результаты. Представлен обзор существующих алгоритмов фильтрации речевых сигналов. На основе модификаций ДЭМ разработан алгоритм фильтрации, существенно расширяющий диапазон изменения отношения сигнал/шум управляющего зашумленного речевого сигнала. Проведен сравнительный анализ характеристик разработанного алгоритма для трех модификаций ДЭМ. Выводы. Наиболее адаптивным методом декомпозиции речевых сигналов является метод комплементарной множественной декомпозиции на эмпирические моды, который рекомендуется для практического использования в системах голосового управления, функционирующих в условиях интенсивных помех.

Abstract. Background. The existing algorithms and filter nodes of speech signals in the presence of intense noise do not meet the requirements, so the development of methods for improving noise-robust filtering of speech signals is an urgent task. Materials and methods. To increase the effectiveness of intense noise filtering modification of the Hilbert-Huang transform is proposed, comprising the Empirical Mode Decomposition (EMD). Results. A review of the existing filtering algorithms of speech signals is given. Filtering algorithms are developed on the basis of the EMD modifications, significantly extending the range of signal-to-noise ratio of the control noisy speech signal. A comparative analysis of the developed algorithms characteristics is conducted. Conclusions. The Complementary Ensemble Empirical Mode Decomposition (CEEMD) method is the most adaptive method for speech signals decomposition, which is recommended for practical use in voice control systems (VCS), operating under intense interference environment.

Ключевые слова: фильтрация речевых сигналов, декомпозиция на эмпирические

моды, отношение сигнал/шум, интенсивные помехи, независимый компонентный анализ.

Key words: speech signals filtering, Empirical Mode Decomposition, signal-to-noise ratio, intense interference, independent component analysis.

Введение

В настоящее время быстро расширяется область применения систем голосового управления (СГУ). Однако существующие системы мало приспособлены к работе в условиях интенсивных помех. Наиболее характерными помехами, оказывающими негативное воздействие на работоспособность СГУ, являются фоновые шумы. Фоновые шумы ухудшают разборчивость речевых команд и могут привести к большой погрешности между поступающими в систему зашумленными речевыми сигналами и шаблонами, полученными в ходе обучения СГУ. Большие погрешности являются основной причиной некорректного распознавания, поэтому все существующие алгоритмы фильтрации направлены на уменьшение этой погрешности.

Проведенный обзорный анализ литературы и собственные исследования [1] показали, что существует много различных подходов к фильтрации зашумленных речевых сигналов. Их разнообразие обусловлено как важностью проблемы, так и отсутствием достаточно эффективных методов ее решения. Важно отметить, что для определенных задач эффективность фильтрации оценивается по-разному. Для СГУ критерием эффективности фильтрации является уровень остаточного шума. В настоящее время наиболее популярными алгоритмами фильтрации, обеспечивающими минимальное значение остаточного шума, являются:

- алгоритмы на основе адаптивной компенсации помех;

- алгоритмы на основе математических моделей речевых сигналов во временной области;

- алгоритмы на основе математических моделей речевых сигналов в частотной области;

- алгоритмы на основе спектральных характеристик шума;

- алгоритмы на основе моделей искусственных нейронных сетей;

- алгоритмы на основе модели восприятия речи человеком.

Широкое практическое применение получили алгоритмы, программная реализация которых имеется в открытом доступе: алгоритм на основе дискретного косинусного преобразования (Discrete Cosine Transform, DCT) с мягкой пороговой обработкой (SDCT) [2]; алгоритм на основе двухэтапного повышения разборчивости речи (Two-Stage Speech Enhancement, TSSE) [3]; алгоритм на основе взвешенного вычитания шума и слепого разделения сигнала (Weighted Noise Subtraction and Blind Signal Separation, WNS + BSS) [4].

Представленные алгоритмы фильтрации все же не решают полностью проблему удовлетворительного подавления шума. Следствием этого является неспособность СГУ корректно анализировать нестационарные речевые сигналы сложной формы. Более глубокие поисковые исследования методов [5] выявили перспективность использования в обработке речевых сигналов адаптивных методов декомпозиции на эмпирические моды (ДЭМ) [6-8].

В данной статье рассматривается вопрос применения методов ДЭМ в алгоритме фильтрации речевых сигналов, позволяющем существенно повысить порог работоспособности СГУ, функционирующих в условиях интенсивных помех (при отношении сигнал/шум от 5 до -5 дБ). Статья является развитием ранее опубликованных трудов [9, 10].

Краткое описание методов декомпозиции на эмпирические моды

ДЭМ представляет собой адаптивную технологию разложения сигнала на внутренние функции, называемые эмпирическими модами (ЭМ). Особенность заключается в том, что базисные функции, используемые для разложения, извлекаются непосредственно из исходного сигнала. При разложении модель сигнала не задается заранее, ЭМ вычисляются с учетом внутренней структуры и локальных особенностей (таких как экстремумы и нули сигнала) каждого конкретного сигнала. Сигналы ЭМ не имеют строгого аналитического описания, но должны удовлетворять двум условиям, гарантирующим определенную симметрию и узкопо-лосность базисных функций [6]:

- общее число экстремумов равняется общему числу нулей с точностью до единицы;

- среднее значение двух огибающих - верхней, интерполирующей локальные максимумы, и нижней, интерполирующей локальные минимумы, - должно быть приближенно равно нулю.

Кроме адаптивности, метод ДЭМ обладает и другими важными свойствами:

- локальность - возможность учета локальных особенностей сигнала;

- ортогональность - обеспечение восстановления сигнала с определенной точностью;

- полнота - гарантия конечного числа базисных функций при конечной длительности сигнала.

Аналитическое выражение ДЭМ имеет следующий вид:

х (t) = jriMF, (t) + rj (t), i=1

где x(t) - исходный сигнал; IMFi (t) - конечное число извлекаемых ЭМ; rj (t) - результирующий остаток; i - номер ЭМ; i - количество ЭМ.

Недостатком классической ДЭМ, ограничивающим его практическое применение, является смешивание ЭМ - наличие в моде участков сигнала, несоизмеримых по амплитудному и частотному масштабам.

Для решения данной проблемы предложен метод множественной ДЭМ (МДЭМ) [7], основанный на многократном добавлении к исходному сигналу белого шума малой амплитуды и вычислении среднего значения полученных мод как конечного истинного результата. Анализируемый сигнал представляет собой сумму сигнала и шума:

y} (t) = x(t) + Wj (t),

Z IMFji (t)

IMF, (t) =

J

Zj (t)

ri (t) = =1

3

где wу (V) - белый шум; IMFji (V), у (V) - отдельные ЭМ и результирующие остатки, полученные в процессе декомпозиции; у = 1,2,..., 3 - количество циклов декомпозиций (добавлений к сигналу белого шума).

Данный подход в полной мере реализует преимущество использования статистических характеристик белого шума при обнаружении слабых периодических или квазипериодических составляющих сигналов. Однако использование белого шума в МДЭМ порождает появление в сигнале нового шумового остатка, влияющего на реконструкцию исходного сигнала [8]. Для устранения этого недостатка был разработан метод комплементарной МДЭМ (КМДЭМ) с добавлением белого шума с прямыми и инверсными значениями амплитуды [8]:

"yj (t)" = "1 1 " X "x(t) "

_ yj (t )* _ 1 -1 _ W(t)_

где у у (V) - зашумленный белым шумом речевой сигнал; у у (V) - зашумленный инверсным по

знаку белым шумом речевой сигнал.

В результате разложения сигнала методом КМДЭМ формируется множество ЭМ, свободных от отмеченных ранее недостатков. Вычисление среднего значения полученных мод как конечного истинного результата обеспечит полное удаление остаточного белого шума за счет пары прямых и инверсных значений, независимо от того, сколько сигналов шума использовалось.

Важными для реализации математических аппаратов МДЭМ и КМДЭМ являются амплитуда добавляемого белого шума и количество циклов декомпозиции

Алгоритм фильтрации речевых сигналов на основе методов декомпозиции

В настоящее время технология обработки сигналов на основе методов ДЭМ широко используется в различных научных приложениях [11, 12], в том числе и при решении задач обработки речевых сигналов [13, 14].

На основе анализа известных алгоритмов и собственных исследований предложен алгоритм фильтрации речевых сигналов, обеспечивающий работоспособность СГУ в условиях интенсивных помех и основанный на декомпозиции (рис. 1). Суть алгоритма заключается в адаптивном разложении зашумленного речевого сигнала на ЭМ (блок 3), из которых посредством специальной методики оценки весовых энергетических и шумовых коэффициентов определяется мода, содержащая основной шум (блоки 4-10). Далее используется метод независимого компонентного анализа (НКА) для исходного зашумленного речевого сигнала и ЭМ с основным шумом, в результате которого выделяется отфильтрованный речевой сигнал с минимальным уровнем остаточного шума (блок 11). Рассмотрим подробнее основные этапы работы предложенного алгоритма.

Рис. 1. Блок-схема алгоритма фильтрации на основе декомпозиции

Регистрация зашумленного речевого сигнала (блок 2). При анализе алгоритма задавался входной зашумленный речевой сигнал х(п) со следующими параметрами: длительность записи не более 5000 мс, частота дискретизации 8000 Гц, разрядность квантования 16 бит, где п - дискретный отсчет времени, 0 < п < N, N - количество дискретных отсчетов в сигнале.

Декомпозиция (блок 3). Особенностью предложенного алгоритма является возможность использования различных методов декомпозиции для разложения (ДЭМ, МДЭМ и КМДЭМ). Результатом декомпозиции зашумленного речевого сигнала будет конечное число ЭМ IMFj (n) и результирующий остаток ti (n) , где i - номер ЭМ, I - количество ЭМ.

Сегментация на фрагменты (блок 5). Сегментация в обработке речевых сигналов - это деление на составляющие отрезки, называемые фрагментами. Речевые сигналы являются нестационарными сигналами сложной формы, параметры и характеристики которых быстро меняются в течение времени. В предложенном алгоритме предполагается, что свойства речевого сигнала с течением времени изменяются медленно. Это предположение приводит к анализу, в котором фрагменты ЭМ выделяются и обрабатываются как короткие участки речевых сигналов с отличающимися свойствами. Сегментация ЭМ на фрагменты осуществляется по следующим формулам:

S _ IMF, (n)

S г~,

где S - количество фрагментов в ЭМ; L - количество дискретных отсчетов в одном фрагменте;

IMF,,s+1(n) _IMF, ((s xL) + 1; (s + 1) xL),

где IMFis+1(n) - фрагмент i-й ЭМ; s _ (0,1,2,...,S-1) - номер фрагмента.

Определение весового энергетического коэффициента (блок 6). Изменение амплитуды хорошо описывается с помощью функции энергии сигнала. В соответствии с физиологическим аспектом формирования речи человек перед произношением голосовой команды и ее регистрацией делает кратковременную паузу - обычно 200 мс или более (1600 отсчетов -20 фрагментов по 80 отсчетов при частоте дискретизации 8000 Гц). Этот участок паузы не содержит речи и соответствует тишине с фоновым шумом.

Вычисление энергии ЭМ Ei и энергии ее фрагментов et s+1 осуществляется по следующим формулам:

N N 2

E, _ ZiIMF,(n)]2 , e, s+1 _ ДIMFhS+Дп)] .

n_1 n_1

Определение ЭМ с основным шумом осуществляется с использованием весового энергетического коэффициента, который определяется по следующей формуле:

E; - e;

ae, _ -

в,1 г-.

Е,

20

^ е,+1

где е, = .=120--среднее значение энергии первых 20-ти фрагментов сигнала ЭМ; ае, - весовой энергетический коэффициент.

Если коэффициент ае, равен минимальному значению, то соответствующая ЭМ считается модой с основным шумом. Если коэффициент ае, приближается к единице, то соответствующая ЭМ считается модой, содержащей полезный сигнал.

Определение весового шумового коэффициента (блок 7). Учитывая, что первые 200 мс речевой сигнал содержит только лишь фоновые шумы, можно вычислить статические характеристики фонового шума: математическое ожидание - Ц и стандартное отклонение -а первых 1600 отсчетов (20-ти фрагментов) по формулам:

1 1600

-Д [IMF (n)], G =

1600 n_r ^

1 1600

— Д [IMF, (n)]2.

1600 n_1

Определение ЭМ с основным шумом осуществляется с использованием весового шумового коэффициента. Для каждого отсчета ЭМ вычисляется одномерное расстояние Махала-нобиса [15]:

М^ (п) = М(п)-Н.

а

По полученному эмпирически условию (п) > 3 определяем, является ли отсчет шумовым [15]. После определения статуса каждого отсчета необходимо определить статус каждого фрагмента. Для этого используется простое правило: если во фрагменте 70 % отсчетов имеют статус шума, то такой фрагмент является шумовым [15]. Это правило основано на физиологическом аспекте формирования речи - речевой аппарат не может быстро перестраиваться и чередовать речь и паузу в течение времени половины фрагмента (10 мс).

После определения статуса фрагментов определяется весовой шумовой коэффициент ЭМ:

8 — 8п.

S '

где S - общее количество фрагментов ЭМ; Sns - количество шумовых фрагментов ЭМ.

Если коэффициент ans i приближается к минимальному значению, то соответствующая ЭМ считается модой с основным шумом, если коэффициент ans i приближается к единице, то

соответствующая ЭМ содержит полезный сигнал.

Пороговая обработка (блоки 8-10). По умолчанию в предложенном алгоритме начальные пороговые значения весовых энергетического и шумового коэффициентов устанавливаются равными единице: ae = 1, ans = 1.

После нахождения значений весовых коэффициентов ЭМ осуществляется сравнение со значениями порогов ans i < ans, aei < ae (блок 8). В случае если условие выполняется, то устанавливаются новые значения пороговых коэффициентов, равные текущим значениям ans = ans i, ae = ae i (блок 9), и анализируемая ЭМ определяется как мода с основным шумом

IMFi (n) = IMFns(n) (блок 10).

После завершения анализа текущей ЭМ осуществляется переход к блоку 4 для анализа следующей моды. Если все ЭМ проанализированы, то осуществляется переход к блоку 11.

Независимый компонентный анализ (блок 11). После анализа всех ЭМ и определения моды с основным шумом осуществляется непосредственная фильтрация с помощью известного метода НКА [16], в результате чего выделяются составляющие отфильтрованного речевого сигнала и фонового шума.

НКА - это метод обработки статистических данных, позволяющий выделить независимые компоненты, обладающие статистической независимостью и негауссовым распределением. По завершении НКА осуществляется вывод отфильтрованного сигнала с минимальным уровнем остаточного шума.

Исследование алгоритма фильтрации речевых сигналов на основе декомпозиции

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Проведено исследование алгоритма фильтрации, реализованного на основе трех методов декомпозиции: ДЭМ, МДЭМ и КМДЭМ. Исследования проводились в программном экспериментально-исследовательском комплексе в пакете прикладных программ для решения технических и математических задач MATLAB 7.0.1.

На рис. 2 представлена схема исследования алгоритма фильтрации. Методика исследования предполагает выполнение трех этапов: формирование входного зашумленного речевого сигнала, непосредственная фильтрация с помощью предложенного алгоритма и сравнение результата с исходным речевым сигналом. В схеме предусмотрена возможность регулировки амплитуды фонового шума при формировании входного зашумленного речевого сигнала и параметров математических аппаратов декомпозиции (для трех методов ДЭЛЛ, МДЭМ и КМДЭМ: амплитуда добавляемого белого шума и количество циклов декомпозиции).

Рис. 2. Схема исследования алгоритма фильтрации

Исследование проводилось с использованием разработанной базы данных речевых сигналов [17]. Входными данными являются зашумленные речевые сигналы с отношениями сигнал/шум от 5 до -5 дБ. В качестве интенсивных помех использовался белый шум.

Для оценки эффективности алгоритма фильтрации использовалось выходное значение отношения сигнал/шум (Signal-to-Noise Ratio, SNR), по которому можно оценить наличие остаточного шума:

(

SNROUT _ 20log

AOUT.

signal

\

V AOUT.noise J

где Asignal, Anojse - среднеквадратичное значение амплитуды сигнала и шума соответственно,

Л = £ К

2 + a22 +... + an2

На рис. 3-5 представлены осциллограммы, иллюстрирующие результаты работы алгоритма фильтрации для трех методов декомпозиции: ДЭМ, МДЭМ и КМДЭМ. На рисунках зеленым цветом обозначен исходный чистый речевой сигнал, синим - зашумленный речевой сигнал, красным - отфильтрованный речевой сигнал.

а)

б)

в)

Рис. 3. Осциллограммы, иллюстрирующие работу алгоритма фильтрации при = -5 дБ: а - результат фильтрации с использованием метода ДЭМ; б - результат фильтрации с использованием метода МДЭМ; в - результат фильтрации с использованием метода КМДЭМ

■asi-1-1-

О 50«] 10000 15000

ДнСкрРТчые nfí 'ihTh времени

Рис. 4. Осциллограммы, иллюстрирующие работу алгоритма фильтрации при SNRin = 0 дБ: а - результат фильтрации с использованием метода ДЭМ; б - результат фильтрации с использованием метода МДЭМ; в - результат фильтрации с использованием метода КМДЭМ

Дискретные отсчеты времени

Дискретные отсчеты времени

Рис. 5. Осциллограммы, иллюстрирующие работу алгоритма фильтрации при = -5 дБ: а - результат фильтрации с использованием метода ДЭМ; б - результат фильтрации с использованием метода МДЭМ; в - результат фильтрации с использованием метода КМДЭМ

В табл. 1 и на рис. 6 представлен анализ результатов фильтрации разработанного алгоритма и представленных ранее аналогов: ББСТ, ТББЕ и ШЫБ + БSS.

Таблица 1

Результаты фильтрации разработанного алгоритма и SDCT, ТББЕ, ШЫБ + БББ

SNRoUт, дБ

SNRIN, дБ Разработанный алгоритм SDCT TS.SE WNS + БSS

ДЭМ МДЭМ КМДЭМ

-5 8,1 8,5 10,1 7,5 9,1 8,2

0 10,5 12,3 13,3 11,4 12,0 11,7

5 15,8 17,4 20,1 16,4 18,9 18,

22

6

-5 0 5

5МВ1М, дБ

Рис. 6. Результаты фильтрации разработанного алгоритма и БВСТ, TSSE, WNS + БББ

Сравнительный анализ позволяет сделать вывод, что разработанный алгоримт на основе метода КМДЭМ обеспечивает наилучший результат фильтрации по сравнению с реализациями алгоритма на основе методов ДЭМ, МДЭМ и алгоритмами SDCT, TSSE, WNS + БSS. Это достигается за счет отсутствия явления смешивания ЭМ и взаимного подавления остаточного шума. Из полученных результатов следует, что наиболее адаптивным методом разложения речевых сигналов является метод КМДЭМ, который рекомендуется для применения в СГУ, функционирующих в условиях интенсивных помех.

Заключение

В статье рассмотрена проблема эффективной фильтрации интенсивных помех, оказывающих негативное воздействие на работоспособность СГУ. Проведен обзор алгоритмов фильтрации речевых сигналов, получивших широкое распространение. На основе технологии адаптивного разложения - декомпозиции на эмпирические моды - разработан алгоритм, позволяющий существенно повысить порог работоспособности СГУ, функционирующий в условиях интенсивных помех. Проведено исследование алгоритма, результаты которого выявили, что наиболее адаптивным методом разложения является КМДЭМ, который может найти практическое применение в задачах фильтрации речевых сигналов в условиях интенсивных помех.

Список литературы

1. Алимурадов, А. К. Адаптивная компенсация помех речевых сигналов с использованием комплементарной множественной декомпозиция на эмпирические моды / А. К. Алимурадов // Молодежь и XXI век - 2015 : материалы V Междунар. молодежной науч. конф. (26-27 февраля 2015 г.) : в 3-х т. / Юго-Зап. гос. ун-т. ; ЗАО «Университетская книга», Курск, 2015. - Т. 2. - С. 96-99.

2. Warped Discrete Cosine Transform-Based Noisy Speech Enhancement / Joon-Hyuk Chang // IEEE Transactions on circuits and systems - II: express briefs. - 2005. - Vol. 52, № 9. -

3. Spectral subtraction based on two-stage spectral estimation and modified cepstrum thresholding / Jie Wang, Hao Liu, Chengshi Zheng, Xiaodong Lib // Applied Acoustics. - 2013. -№ 74. - P. 450-453.

4. Hamid, M. E. Improved single-channel noise reduction method of speech by blind source separation / Mohammad Ekramul Hamid, Keita Ogawa, Takeshi Fukabayashi // Acoustical Science and Technology. - 2007. - Vol. 28, № 3, Special Issue on «Applied Systems». -P. 153 - 164.

5. Алимурадов, А. К. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи / А. К. Алимурадов, П. П. Чураков // Измерение. Мониторинг. Управление. Контроль. - 2015. - № 2 (12). - С. 27-35.

6. Huang, N. E. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis / N. E. Huang, Shen Zheng, R. L. Steven // Proceedings of the Royal Society of London A. - 1998. - Vol. 454. - P. 903-995.

7. Zhaohua, Wu. Ensemble empirical mode decomposition: A noise - assisted data analysis method / Wu Zhaohua, N. E. Huang // Advances in Adaptive Data Analysis. - 2009. - Vol. 1 (1). - P. 1-41.

8. Yeh, J.-R. Complementary ensemble empirical mode decomposition: A novel noise enhanced data analysis method / J.-R. Yeh, J.-S. Shieh, N. E. Huang // Advances in Adaptive Data Analysis. - 2010. - Vol. 2 (2). - P. 135-156.

9. Алимурадов, А. К. Интеллектуальная обработка речевых сигналов в системах автоматического управления / А. К. Алимурадов, А. Ю. Тычков // Известия кабардино-балкарского государственного университета. - 2012. - Т. II, № 4. - С. 66-67.

10. Алимурадов А. К. Обработка речевых команд в системах голосового управления / А. К. Алимурадов // Измерение. Мониторинг. Управление. Контроль. - 2014. - № 1 (7). -

11. Huang, N. E. The Hilbert-Huang transform and its applications / N. E. Huang. - Singapore : World Scientific Publishing Co. Pte. Ltd. 5, 2005. - 526 p.

12. Huang, N. E. An Introduction to Hilbert-Huang Transform: A Plea for Adaptive Data Analysis / N. E. Huang // Research Center for Adaptive Data Analysis. - Singapore : National Central University, 2007. - 257 p.

13. Speech Endpoint Detection in Noisy Environment Based on the Ensemble Empirical Mode Decomposition / Jingjiao Li, Dong An, Jiao Wang, Chaoqun Rong // Advanced Engineering Forum. - 2012. - Vol. 2-3. - P. 135-139.

14. Noise-robust speech feature processing with empirical mode decomposition / Kuo-Hau Wu, Chia-Ping Chen, Bing-Feng Yeh // EURASIP Journal on Audio, Speech, and Music Processing. - 2011. - 9 p.

15. Saha, G. A New Silence Removal and Endpoint Detection Algorithm for Speech and Speaker Recognition Applications / G. Saha, Chakroborty Sandipan, Senapat Suman // Proceedings of the NCC. - 2005, Jan. - Р. 5.

16. Hyvarinen, A. Independent component analysis: algorithms and applications / A. Hyvarinen, E. Oja // J. Neural Networks. - 2000. - № 13. - P. 411-430.

17. Разработка верифицированной базы данных речевых сигналов для диагностики состояния органов дыхания / А. К. Алимурадов, А. Ю. Тычков, П. П. Чураков, Ю. С. Квитка, Д. А. Ярославцева // Перспективные информационные технологии (ПИТ 2013) : тр. Междунар. науч.-техн. конф. - Самара : Изд-во Самар. науч. центра РАН,

P. 535-539.

С. 50-57.

2013. - С. 147-150.

Алимурадов Алан Казанферович

соискатель,

кафедра информационно-измерительной техники и метрологии, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]

Alimuradov Alan Kazanferovich

applicant,

sub-department of information

and measuring equipment and metrology,

Penza State University

(40 Krasnaya street, Penza, Russia)

Чураков Петр Павлович

доктор технических наук, профессор, кафедра информационно-измерительной техники и метрологии, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]

Churakov Petr Pavlovich

doctor oftechnical sciences, professor,

sub-department of information

and measuring equipment and metrology,

Penza State University

(40 Krasnaya street, Penza, Russia)

УДК 004.934 Алимурадов, А. К.

Применение методов декомпозиции на эмпирические моды в задаче фильтрации речевых сигналов в условиях интенсивных помех / А. К. Алимурадов, П. П. Чураков // Измерение. Мониторинг. Управление. Контроль. - 2016. - № 1 (15). - С. 4-14.

i Надоели баннеры? Вы всегда можете отключить рекламу.