Научная статья на тему 'Анализ параметров автокорреляционной функции фрагментов фонем в задачах идентификации абонента'

Анализ параметров автокорреляционной функции фрагментов фонем в задачах идентификации абонента Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
112
24
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — В Н. Журавлев, В С. Кабак, В О. Рыбин

В статье рассмотрен алгоритм цифровой обработки идентификационного фрагмента фонемы, позволяющий на основе анализа интервала корреляции автокорреляционной функции фонемы повысить информационную эффективность матрицы идентификации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The algorithm of phoneme identification fragment digital processing, which allows to increase the informational effectiveness of identification matrix on the base of phoneme autocorrelation function correlation window analysis is under review.

Текст научной работы на тему «Анализ параметров автокорреляционной функции фрагментов фонем в задачах идентификации абонента»

На рис. 5 приведены осциллограммы изменения объемных расходов пара и холодной воды при подаче на вход смесителя исходных теплоносителей. После окончания переходных процессов за 42 секунды устанавливаются заданные значения объемных расходов пара и холодной воды: Уг3 = 0,106; Ух3 = 0,404. Исследование системы методом математического моделирования показывает, что применение нечетких регуляторов позволяет спроектировать систему регулирования температуры теплоносителя весьма высокого качества: система обладает достаточным быстродействием (время установления заданной температуры на выходе смесителя с учетом чистого запаздывания составляет 22 с, перерегулирование не превышает 2,5%) и нулевой ошибкой в установившемся режиме. Поэтому применение нечетких регуляторов для таких систем целесообразно и перспективно.

ПЕРЕЧЕНЬ ССЫЛОК

1. Интеллектуальные системы автоматического управления / Под ред. И.М. Макарова, В.М. Лохина. - М.: ФИЗ-МАТЛИТ, 2001. - 576 с.

2. Гостев В.И. Синтез нечетких регуляторов систем автоматического управления. - К.: Издательство "Радюама-тор", 2003. - 512 с.

Надшшла 22.11.2004

Досл1джена система регулювання температуры тепло-носгя на вихоЫ змгшувача з нечгткими регуляторами, якг KpiM температуры регулюють також об'емш витрати по-чаткових теплоноспв. Отримат показники якостi системы в перехiдному та сталому режимах.

The regulating system of temperature of the heat-carrier on an output of the mixer with the fuzzy controllers, which regulate not only temperature but also volume flow rate of the initial heat-carriers, is probed. The indexes of quality of a system in transient state and steady regime are obtained.

УДК 681.391

В.Н. Журавлев, B.C. Кабак, В.О. Рыбин

АНАЛИЗ ПАРАМЕТРОВ АВТОКОРРЕЛЯЦИОННОЙ ФУНКЦИИ ФРАГМЕНТОВ ФОНЕМ В ЗАДАЧАХ ИДЕНТИФИКАЦИИ АБОНЕНТА

В статье рассмотрен алгоритм цифровой обработки идентификационного фрагмента фонемы, позволяющий на основе анализа интервала корреляции автокорреляционной функции фонемы повысить информационную эффективность матрицы идентификации.

ВВЕДЕНИЕ

Основой обеспечения безопасности и живучести телекоммуникационных систем и сетей передачи данных является проблема идентификации абонентов, имеющих доступ к конфиденциальной информации. Отождествление абонента точки доступа - комплекс задач, решение которых позволяет организовать весь процесс управления правами доступа, а также реализовать ряд других вспомогательных решений, имеющих самостоятельное прикладное значение.

Рассматриваемая в статье проблема биометрической идентификации статических и динамических параметров и характеристик речеобразующего тракта абонента находила свое отражение в трудах лингвистов [1] и психоакустиков [2]. Однако ввиду различных подходов к определению параметров модели речеобразующего аппарата, большим разнообразием параметров речевых сигналов, которые, в большинстве, носят квазистационарный и субъективный характер, данная проблема является предметом исследований многих научно-технических коллективов, как в нашей стране, так и за границей [3-5].

Обычно в качестве фрагмента речевого сигнала принимают фонему, как наименьшую часть устной осмыс-

ленной речи, которая не может быть разложена на меньшие речевые элементы [6]. Объективные предпосылки идентификации абонента по индивидуальным особенностям в фонемах русского языка исследованы в [7].

Для расчета параметров и характеристик, идентифицирующих физиологические особенности речеобразу-ющего тракта, наиболее часто применяются классические методы спектрально-временного анализа [8]. Такие методы анализа речевого сигнала адекватны природному механизму восприятия речи [9], что позволяет отождествлять индивидуальные особенности при анализе интегральных спектральных распределений отдельных фонем и анализе распределений текущего спектра фрагмента речевого сигнала.

Функциональная схема системы преобразования, обработки речевого сигнала, а также синтеза матрицы динамических спектральных состояний его параметров и временного образа сигнала идентификации [10] представлена на рисунке 1.

Рисунок 1 - Функциональная схема алгоритма обработки речевого сигнала

В блоке 1 производится сегментация, взвешивание и нормализация фрагмента речевого сигнала ^(О во временном окне выборки-наблюдения Ш(Т) с постоянной

времени слуха Т [1]. Результатом данного преобразования является сигнал si(t)

s1(t) = W [s(t), t e T].

(1)

В блоке 2 осуществляется ортогональное преобразование F(rn) сигнала si (t) с переносом его в частотную область. Результатом данного преобразования является сигнал S2(ra)

s2(rn) = F [s1(t)].

(2)

s(t) = SNT[F_1(SC), Pr].

(3)

- суммы формант Тз^), г е 1, п, где п - количество частотных полос, в которых идентифицируются форманты исследуемой фонемы;

- стохастических шумов которые некоррелиро-ваны с сигналами 5от(£) и Х^СО

s^^s.M+TsX^+s^t), teT, iel, n.

(4)

Результатом работы блока 3, который, анализируя сигнал ^(ю), выделяет индивидуальные особенности спектральных составляющих динамики работы речеоб-разующего тракта абонента, является матрица динамических спектральных составляющих ЗС^Сю)] размерности N.

Блок 4 синтезирует (8ЫГ) значения образа идентифицирующего сигнала производя обратные ортогональные преобразования F~Í(SC) над определенными значениями матрицы 8С[52(ю)] и их постобработку по специальному алгоритму Рг

Рассмотренный выше алгоритм позволяет анализировать фрагменты речевых сигналов на временном отрезке Т, определяемым, с одной стороны, частотным разрешением алгоритмов спектральных преобразований F(ю), и, с другой стороны, постоянной времени квази-детерминированного состояния речевого сигнала Т.

Вышеуказанные ограничения не позволяют учитывать девиацию спектральных составляющих фонемы внутри интервала времени Т, которые зависят не только от физиологических параметров речеобразующего тракта, но и от темпа речи, а также эмоционального состояния абонента.

По нашему мнению, повышение эффективности существующего алгоритма идентификации можно достигнуть, введя в матрицу динамических спектральных составляющих дополнительный параметр, в качестве которого можно предложить интервал корреляции автокорреляционной функции (АКФ) фрагмента фонемы.

В данной статье предлагается метод повышения эффективности матрицы динамических спектральных составляющих сегмента речевого сигнала на основе дополнения идентификационной базы данных значением интервала корреляции фрагмента фонемы, текущее значение которого позволит учитывать изменение параметров спектральных составляющих фонемы внутри интервала идентификации.

ПОСТАНОВКА ЗАДАЧИ

Будем считать, что фрагмент фонемы речевого сигнала телекоммуникационной системы связи, идентифицируемый на промежутке времени Т, соответствует стыку тональных частот (ТЧ) и представляет сумму следующих сигналов:

- импульсов сигнала основного тона 5от(£);

При произношении слитной речи артикуляционные органы речеобразующего аппарата человека находятся в постоянном движении, параметры которого определяется информационным составом сообщения.

Как известно, фонетические признаки речи можно охарактеризовать функцией, описывающей изменение спектров во времени [6], которая определена как логарифм отношения спектральных интенсивностей и Sю(t - т) на частоте ю, при этом спектры рассчитываются для сигналов, отстоящих на интервал времени те 0, Т. Однако, в [6] не приведены критерии выбора и определения параметра т.

Сигнал на промежутке времени идентификации Т является сигналом с конечной энергией, не содержит дельта-функций и разрывов. Исходя из этого, можно предположить, что исследование АКФ И88(т) фрагмента фонемы на промежутке времени идентификации Т позволит уточнить параметры изменения сигнала

Rss(t) = Js (t)s(t - T)dt.

(5)

При некотором значении т = То интеграл (5) будет иметь первый локальный минимум

d[ Rss (т0)] ------------dt----------

= 0,

(6)

а значение т0 определяется в [11] как интервал корреляции. Для данной задачи предлагается рассматривать То как идентификационный параметр, характеризующий фонетические признаки речи.

Представим (4) как:

s(T) = sd(T) + sm(T),

(7)

где з^Т) - детерминированная составляющая сигнала на интервале времени Т и равная, в соответствии с (4),

sd(T) = sOT(T) + Tsi(T, iel, n).

(8)

Так как стохастическая составляющая сигнала 5Ш(Т) некоррелирована с сигналом з^Т), то она не содержится в АКФ К^т).

Введем функцию Fи(s), которая определяет алгоритм расчета значений строк г и столбцов / матрицы идентификационных параметров Ми сигнала

Ми[г, /; ге 1, п; /е1, т] = Fи ^(0], (9)

где п - номер частотной полосы, т - номер временного интервала То в частотной полосе.

30

ISSN 1607-3274 "Радюелектрошка. 1нформатика. Управл1ння" № 2, 2004

Как известно [11], АКФ Изз(0 сигнала э(£) обладает следующими свойствами:

- несет идентификационную информацию о минимальной постоянной времени (интервал корреляции То) сигнала э({);

- содержит детерминированные (на интервале идентификации Т) спектральные составляющие речевого сигнала

Таким образом, исходя из вышеизложенного, эффективность идентификации сигнала фонемы внутри интервала идентификации Т можно повысить, проведя анализ спектральных составляющих на интервале корреляции То АКФ Изз(0 фрагмента речевого сигнала

нала зтч (ДО на основании нижней частоты /нтч канала ТЧ и частотного разрешения Д/рбт алгоритмов спектральных преобразований

й = / (/нтч, Д/ррт), (12)

к - определяет количество сегментов идентификации и является функцией от параметра й, длительности фонемы Тф, а также коэффициента перекрытия сегментов идентификации Кпер, который может изменяться от нуля до о,5 [6]

к = /(й, Тф, Кперео, о,5). (13)

ПРЕДЛАГАЕМЫЕ АЛГОРИТМЫ И РЕШЕНИЯ

Сигнал преобразовывается в блоке 1 (рис. 2) в цифровую форму ^(ДО аналого-цифровым преобразователем АЦП на основании обобщенной теоремы отсчетов [11] с частотой дискретизации которая должна быть не менее удвоенной верхней частоты /в канала ТЧ [12]

/ = /вТЧ. (1о)

Идентификацию изменения формантных частот [13] по г полосам (со срединными частотами /¿) осуществляют блоки фильтров 4...6, с передаточными характеристиками Нг (/¿), на выходах которых образуются сигналы

Б/)= ЗтЧШ,Т)Нг/). (14)

Огибающая амплитуды (/о) сигналов (/¿) рассчитывается в блоках 7.9, имеющих передаточную характеристику Н ^ (/¿)

Для нормирования частотного диапазона сигнал з (Дt) обрабатывается в блоке 2 фильтром с передаточной характеристикой Нтч (/тч), соответствующей каналу ТЧ

5тч(Д0 = s(Дt) Нтч(/тч). (11)

Блок 3 осуществляет оконное Ш(й, к) сегментирование сигнала 5тч(Д0 с параметрами:

й - определяет длительность сегмента идентификации Т, исходя из количества анализируемых отсчетов сиг-

5г(/о)= 5г(/г)На(/г). (15)

В блоке 13 рассчитывается (5) корреляционная функция Rзз(Дt). В соответствии с (6) рассчитываются параметры интервала корреляции То. Сигналы ^(/о) статистически обрабатываются в блоках Ю...12 с учетом интервала корреляции То идентифицируемого сигнала 5тч(Д0. Математическое ожидание Мг и дисперсия о2 сигнала 5тч(Д0 на интервале То записываются блоком 14 в матрицу идентификации Ми(г,/).

STЧ(At,T) 4 НЛ) в/) , 7 НЮ) 10 И1(т0)

14

1 АЦП 2 НТЧ(/ТЧ) 3 жук) 5 Нг(/2) ^(/2) ( 8 НС/2) в2(/о). 11 М2(То)

л

6 н/ вЛи) ( 9 НЮ в/о), 12 Мя(То)

ми

(и л

13 ^0

Рисунок 2 — Функциональная схема алгоритма идентификации параметров фрагментов речевого сигнала

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ

По предлагаемому алгоритму был произведен расчет параметров фонемы «О» слова «ЛЕТО» в программной среде Ма1ЬаЬ 6.5 и получены следующие графики (рис. 3-7).

Речевой сигнал записывался на жесткий диск ПЭВМ с частотой дискретизации 44,1 кГц и 16-разрядным квантованием по уровню, затем сегментировался на фонемы длительностью Тф (рис. 3).

(по уровню 0,05) в полосе частот 300-1000 Гц и содержит спектральные составляющие на частотах: 300, 400, 490, 600 и 740 Гц.

В соответствии с выражением (5) рассчитана АКФ сегмента фонемы (рис. 5) и определен интервал корреляции, который равен Т0 = 0,920 мс.

Рисунок 5 - График АКФ К^Ст) = ДО сегмента фонемы «О» на половине времени идентификации

Рисунок 3 - График фонемы «О» на интервале Тф = 0,092 >

Сигнал фонемы ^(Тф) дискретно сканировался временным окном, определяемым постоянной времени слуха Т, с коэффициентом перекрытия (14) Кпер = 0,5. В качестве параметра стабильности характеристик сигнала ^(Т) на интервале времени Тф была принята минимальная разница между коэффициентами ковариации, которые рассчитывались для окон, примыкающих к идентифицируемому сегменту. На сегменте времени Т = 0,046...0,069 с сигнал фонемы ^(Тф) удовлетворяет выбранному параметру стабильности. На нем была рассчитана спектральная плотность .(га) в полосе частот ТЧ (рис. 4).

Как видно из рисунка 4, спектральная плотность фонемы на взятом интервале идентификации сосредоточена

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Затем была проведена фильтрация выбранного сигнала сегмента идентификации блоком из п полосовых фильтров с граничными частотами, которые соответствуют равноартикуляционным полосам [13]: 300-400; 400-510; 510-630; 630-700; 770-915; 915-1250; 12501475; 1475-1710; 1710-1990; 1990-2310; 2310-2690; 2690-3125 Гц.

Исследованы сигналы сегмента идентификации во 2-й (п = 2, 400-510 Гц) и 4-й (п = 4, 630-700 Гц) частотных полосах (рисунки 6, 7), в которых сосредоточены основные спектральные составляющие фонемы.

При расчете огибающей сигнала фонемы после полосового фильтра данные разбивались на участки длительностью Т0 = 0,920 мс, в которых рассчитывались математическое ожидание Мп[.п(£)] сигнала и его дисперсия.

Как видно из рисунков 5-7, интервал корреляции Т0 является информационным параметром сигнала фонемы,

Рисунок 4 - Графики сегмента фонемы «О» на интервале идентификации Т = 23 мс (а) и спектра сегмента фонемы «О» в полосе частот 300-3400 Гц (б)

Рисунок 6 - Графики сигнала .^(О (п = 2, 400-510 Гц)

фонемы «О» на интервале идентификации 23 мс (а) и математического ожидания его огибающей Мп[^2(^)] во второй полосе частот (б)

32

1607-3274 "Радюелектрошка. 1нформатика. Управл1ння" № 2, 2004

М.М. Касьян, K.M. Касьян: СИНТЕЗ В1ДБРАКУВАЛБНИХ ПОТОЧНИХ ДОПУСК1В НА ПАРАМЕТРИ ЕЛЕМЕНТ1В У ЗАЛЕЖНОСТ1 В1Д ЧАСУ ТА УМОВ ЕКСПЛУАТАЦ11

рат множественного корреляционного анализа на интервале корреляции То.

ПЕРЕЧЕНЬ ССЫЛОК

1.

2.

3.

4.

Рисунок 7 - Графики сигнала S^it) (n=4, 630-700 Гц) фонемы «О» на интервале идентификации 23 мс (а) и математического ожидания его огибающей Mn [S4(t)] в четвертой полосе частот (б)

позволяющим проводить статистическую обработку результатов идентификации сегмента речевого сигнала. Включение данного параметра в матрицу идентификации позволит повысить ее информативность.

ВЫВОДЫ

Полученные результаты позволяют сделать вывод о целесообразности применения предложенного алгоритма при идентификации абонента по фрагментам речевого сигнала.

Повышение эффективности известных алгоритмов идентификации достигается дополнением матрицы динамических спектральных составляющих параметрами статистического анализа спектрального состава формант речевого сигнала на отрезках времени, равных интервалу корреляции Т0 его АКФ.

При расчете линии регрессии реализаций сигнала можно, в дальнейшем, применять математический аппа-

Михайлов В.Г., Златоустова Л.В. Измерение параметров речи / Под ред. М.А. Сапожкова. - М.: Радио и связь, 1987. - 168 с.

Алдошина И.А. Основы психоакустики // Звукорежиссер. - 2000. - №6. - С. 36-40.

Кобиелус Джеймс. Информационная безопасность: идентификация и аутентификация. - М.: Связь, 1997. - 252 с. Бел!нський В. та ¡н. Апаратно-програмний комплекс ви-значення розб1рливост1 украшського мовлення та апара-турш засоби контролю службових примщень в1д витоку мовно!' ¡нформаци в електроакустичних та в1броакус-тичних каналах передавання ¡нформаци // Матер1али 3-!' науково-техшчноТ конференци «Правове, нормативне та метрологичне забезпечення систем захисту ¡нформаци в УкраТж». - К.: - 2001. - С. 109-110. Аграновский А.В., Леднов Д.А., Репалов С.А. Исследование проблемы верификации дикторов, с использованием формантных характеристик // Материалы III Всероссийской конференции «Теория и практика речевых исследований» (АРС0-2003). - М.: - 2003. - С. 3-7. Вокодерная телефония. Методы и проблемы. Под ред. А.А. Пирогова - М.: Связь, 1974. - 536 с. Рамишвили Г.С. Автоматическое опознавание говорящего по голосу.- М.: Радио и связь, 1981. - 224 с. Рабинер Л., Шафер Р. Цифровая обработка речевых сигналов. - М.: Радио и связь, 1981. - 496 с. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации. Пер. с нем. под ред. Б.Г. Белкина. - М.: Связь, 1971. - 225 с.

10. Петраков А.В., Лагутин В.С. Защита абонентского телетрафика. - М.: Радио и связь, 2001. - 504 с.

11. Гоноровский И.С. Радиотехнические цепи и сигналы: Учебник для вузов. - М.: Радио и связь, 1986. - 512 с.

12. ГОСТ 21655-87. Каналы и тракты магистральной первичной сети единой автоматизированной системы связи. Электрические параметры и методы измерений. -М.: Издательство стандартов, 1989.

13. Вемян Г.В. Передача речи по сетям электросвязи. - М.: Радио и связь, 1985. - 272 с.

Надшшла 12.01.2004 Шсля доробки 07.10.2004

В сmammi розглянутий алгоритм цифровой. обробки iден-mифiкaцiйного фрагменту фонеми, що дозволяе на основi aнaлiзу iнmервaлу кореляцп автокорелящйноЧ функцИ фонеми тдвищити iнформaцiйну ефекmивнiсmь матриц iден-mифiкaцi'i.

The algorithm of phoneme identification fragment digital processing, which allows to increase the informational effectiveness of identification matrix on the base of phoneme autocorrelation function correlation window analysis is under

5.

6.

7.

8.

9.

review.

УДК 621.396.6.004

М.М. Касьян, K.M. Касьян

СИНТЕЗ В1ДБРАКУВАЛЬНИХ ПОТОЧНИХ ДОПУСК1В НА ПАРАМЕТРИ ЕЛЕМЕНТ1В У ЗАЛЕЖНОСТ1 В1Д ЧАСУ ТА УМОВ ЕКСПЛУАТАЦ11

Пропонуеться метод синтезу поточних в1дбракувальних допусав на параметри елемент1в, необх1дних для проведен-ня дгагностування пристро'(в перетворення сигналгв в процес1 експлуатацп. Математична база методу забез-печуе компакттсть програмноЧ реал1зацп при здтснент автоматизацп досл1джень за допомогою ЕОМ.

ВСТУП

При розробщ принципово! електрично! схеми пристрой перетворення сигнал1в (ППС), за заданими у тех-шчному завданш (ТЗ) допусками на вихщш харак-

i Надоели баннеры? Вы всегда можете отключить рекламу.