Научная статья на тему 'Классификация звуков при фильтрации речевых сигналов'

Классификация звуков при фильтрации речевых сигналов Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
87
10
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Калинов Дмитрий Вячеславович

Предложен способ повышения качества фильтрации звуковых сигналов путём разделения звуков по ходу фильтрации на два класса: вокализованные и невокализованные, с последующим «переключением» фильтра на фильтрацию звуков соответствующего класса. Показан общий алгоритм данного подхода. Представлены результаты работы данного алгоритма на конкретных словах

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Классификация звуков при фильтрации речевых сигналов»

УДК 621.391

Д.В. КАЛИНОВ

КЛАССИФИКАЦИЯ ЗВУКОВ ПРИ ФИЛЬТРАЦИИ РЕЧЕВЫХ СИГНАЛОВ

Предложен способ повышения качества фильтрации звуковых сигналов путём разделения звуков по ходу фильтрации на два класса: вокализованные и невокализованные, с последующим «переключением» фильтра на фильтрацию звуков соответствующего класса. Показан общий алгоритм данного подхода. Представлены результаты работы данного алгоритма на конкретных словах.

9

В пределах отдельных фонем речевой сигнал имеет близкий к периодическому вид. Сигнал состоит из отрезков, мало отличающихся по форме, продолжительности и амплитуде, т.е. его можно отнести к классу квазипериодических сигналов.

' Для фильтрации таких сигналов в работе [1] предлагается разбиение сигнала на отрезки, соответствующие квази периодам. Эти отрезки представляются в виде строк изображения. В итоге получается изображение, в котором, помимо внутристрочной корреляции, имеется и межстрочная, т.к. соседние элементы столбца изображения представляют собой элементы речевого сигнала, отстоящие на период. Это свойство позволяет применить методы фильтрации изображений для более эффективной фильтрации сигналов. Для . фильтрации полученного изображения применяется адаптивный аппроксимированный фильтр Калмана. В [2] для повышения качества фильтрации применены более сложные развертки изображения.

«ВЫ» «С»

.......

«С» «о»

у

«о» «т»

«т» «а»

Рис. 1. График записи слова «высота»

52

Вестник УлГТУ 4/2001

l'm » MOipiiM график записи слова «высота» (рис. 1). | lu цигуикс ярко выделяются два класса звуков - вокализованные («вы», «ни, . ни) и меиокализованные («с», «т»). Вокализованные звуки имеют ut♦ m Jii.iin больший период и более коррелированное представление в виде м 1м(||> I мч(ии* чем цевокализованные. Эти различия влекут за собой разные чин-1 мм.ш.к* шачения параметров фильтра. Если эти различия не учитывать 1 » и но слитно в 11, 2]), то при переходе к звуку другого класса адаптивный ijut h,i|i некоторое время перестраивает свои параметры, а фильтрация в это ИМ МИ неэффективна.

И шиной работе для повышения качества фильтрации предлагается по • и \\ иОриГкп'ки определять мохменты начала звука другого класса и вводить в .m моменты в фильтр начальные значения параметров, характерные для »• им соответствующего класса. Признаком смены класса звука является |Ф м I и * il мсиение величины очередного квазипериода. Блок-схема алгоритма |||1НН1<Л0ИЛ на рис. 2.

Ги» ! Клок-схема алгоритма: ИКП - измеритель квазипериода, ФИ - формирователь изображения, ДР - дискриминатор, АФК - адаптивный фильтр Калмана

Речевой сигнал поступает на измеритель квазипериода (ИКП) и на

9 -

формирователь изображения (ФИ). В ИКП оценивается длина очередного ммншериода и передается в ФИ и в дискриминатор (Д). В ДР по длине ич шнериода формирует сигнал 5. Если 5 = 0, то фильтр (АФК) про/должает г »котить без изменения начальных параметров. Если 5 = 1, то это ♦ »и пплизирует об изменении звуков на вокализованные, и в АФК передаются миильиые параметры, характерные для вокализованных звуков. Если же V ) % го это сигнализирует об изменении звуков на невокализованные, и в УФК передаются начальные параметры, характерные для невокализованных

туков.

11иже приведен график зависимости отношения шум/сигнал на выходе от I и ношения шум/сигнал на входе. Как видно из графика, при шумах, лежащих н пределах от 0.5 до 2?выигрыш фильтрации с классификацией составляет от

| до 12%.

Нсстник УлГТУ 4/2001

53

0.8

0.6

0.4

0.2--

2 / 2

Рис. 3. Зависимости ' шум/сигнал после фильтрации от отношения

шум/сигнал до фильтрации для слова «высота»: сплошная линия -фильтрация без классификации, точечная линия - фильтрация с классификацией

СПИСОК ЛИТЕРАТУРЫ

1. Крашенинников И.В. Периодическое комплексирование речевых сигналов в изображение// Труды Международной конференции «Методы и средства преобразования и обработки аналоговой информации». Ульяновск: УлГТУ, 1999. Т.З. С.56-58.

2. Калинов Д.В., Крашенинников В.Р., Панкратов Ю.Г. Фильтрация речевых сигналов//Труды Ульян, науч. центра «Ноосферные знания и технологии». Ульяновск, 2001. Т.З, выл. 1. С. 76-78.

Калинов Дмитрий Вячеславович, закончил естественнонаучный факультет Ульяновского государственного технического университета. Аспирант кафедры САПР УлГТУ. Имеет работы в области обработки изображений и звука.

I Л1< 021.391

• •

МЛ ПИИТОВ

• ШП ДЕЛЕНИЕ ВЕРОЯТНОСТНЫХ ХАРАКТЕРИСТИК ||| ЦМНЕЙНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ

« ДИСКРЕТНЫМ ВРЕМЕНЕМ

1'пи м^т/пчк! методика определения вероятностных характеристик нелинейных ■и .», тичсских систем с дискретным временем.

11 ми к;»'!пая стохастическая система с дискретным временем может быть м «пни разностным уравнением, связывающем значения выходного НИ мили с А с его значениями на предыдущем шаге Хи~\ и с очередным Н'ИОНИОМ входного сигнала

V,

«ид некоррелированная случайная последовательность с нулевым

й1М1*м»ничсским ожиданием и единичной дисперсией. Одной из *|чн I'-ристик, описывающих амплитудные свойства случайной 1мм ф опиате л ьности X к > является плотность распределения вероятностей.

Ни »..мних приложениях необходимо при заданных функциях ф{хк) и (р{хк) ииИ• и одномерную плотность распределения вероятностей со(хк) выходного 1И1М1Н1.1. И общем виде решение этой задачи приведено в [1], где получено дифференциальное уравнение бесконечного порядка относительно со(х). Мигрирование этого уравнения является сложной задачей. Точное решение I быть получено лишь для линейной функции ф{х) и не зависящей от | функции <р{х)- Однако для сильно коррелированных случайных

•...... чоиательностей х{к) может быть найдено приближённое решение [1].

Предлагается способ нахождения &{х)> основанный на разложении НММ»»мгрпой плотности распределения вероятностей в ряд Эджворта [2]. При

...... коэффициентами ряда будут кумулянты. Ограничивая максимальный

Иринок кумулянтов, получим конечную систему разностных уравнений для мч\ шитов. В дальнейшем можно ограничиться эксцессньш приближением,

• • которого все кумулянты, начиная с пятого, равны нулю. В этом случае *<|м стационарного режима получим систему четырёх алгебраических цмииюиий, решив которую найдем установившиеся значения первых »■ - фгх кумулянтов. Далее, подставляя найденные значения в ряд Эджворта,

• • г чмм приближённое выражение для стационарной одномерной плотности |ММ нроделения вероятностей случайной марковской последовательности,

54

Вестник УлГТУ 4/2001

|»И шик УлГТУ 4/2001

55

i Надоели баннеры? Вы всегда можете отключить рекламу.