постоянно изменяется, но эти изменения не столь существенны, как на первых этапах. Кроме того, при анализе спектра такой реализации мы видим закон, который может быть хорошо аппроксимирован следующей зависимостью:
S(f) = pe-af , (5)
т.е. фликкерной зависимостью, что предполагает вложенность разных по масштабам динамик.
На протяжении первых этапов эволюции процессов в нейронной сети преобладают быстрые динамики, которые, как правило, имеют равномерный спектр. Через некоторое время в результате самоорганизации отдельных случайных образований намечается процесс формирования локальных неоднородностей, которые формируют медленно меняющуюся компоненту. Далее можно наблюдать процесс объединения теперь уже локальных неоднородностей в глобальные структурные образования. При этом интегрирующие процессы сопровождаются незначительными, но все-таки не нулевыми случайными флуктуациями. Таким образом, даже в таком несложном самоорганизационном процессе можно наблюдать своеобразную иерархию динамик.
4. Заключение
В численном эксперименте были выявлены оптимальные параметры, при которых в однородной нейронной сети формируется группа локальных и глобальных неоднородностей. Этот феномен самоор -ганизации качественно отличается от ставшего классическим примером самоорганизационного процесса — реакции Белоусова-Жаботинского. Несмотря на некое сходство моделей, в рамках которых можно наблюдать самоорганизационные процессы (в нашем случае используется стохастическая нейронная сеть; в случае реакции Белоусова-Жаботинского — детерминированная), природа их существенно отличается. В проведенном эксперименте можно наблюдать, как шум выступает в роли конструктивного фактора. Заслуживает внимания тот факт, что синергетический процесс, протекающий в средах, подобных рассмотренным, чувствителен к слабым воздействиям на первых этапах, и что он может быть инициирован случайными шумоподобными факторами.
В качестве примера практического применения рассмотренной модели может служить описание процессов, протекающих в жидкокристаллических средах, как живой, так и неживой природы.
Литература: 1. McNamara B, Wiesenfeld K. Theory of stochastic resonance // Phys. Rev. A. 1989. Vol. 39, № 9. P. 4854-4869. 2. Анищенко В. С., Нейман А.Б. Стохастический резонанс при многочастотном воздействии // Радиотехника и электроника. 1994. № 8-9. С. 1380-1392. 3.
Анищенко В. С., Постное Д.Э. Использование стохастического резонанса для повышения отношения сигнал/ шум в радиотехнических системах // Радиотехника и электроника. 1994. № 12. С. 2004-2014. 4. BenziR., Sutera A., Vulpiani A. // J. Phys. 1981. Vol. 14A. P. 453. 5. Douglass J.K., Wilken L.A., Pantazelou E. and Moss F. Noise enhancement of information transfer in crayfish mechanoreceptors by stochastic resonance // Letters to Nature. 1993. Vol. 365 . P. 337-340. 6. Braun H.A., WissingH, Schafer K, Hirsch M.C. Oscillation and noise determine signal transduction in shark multimodal sensory cells // Letters to Nature. 1994. Vol. 367. P. 270-273. 7 Bezrukov S.M. and Kasianowicz J.J. Curent noise reveals protonation kinetics and number of ionizable sites in an open protein ion channel // Phys. Rev. Lett. 1993. Vol. 70, № 15. P. 2352-2356. 8. Anderson C.M., Holroyd T, Bressler S.L., Selz K.A., Mandel A.J., Nakamura R. 1/F-like spectra in cortical and subcortical brain structures: a possible marker of behavioral state dependent selforganization // American Institute of Physics. 1993. P. 737-740. 9. ЛагутинМ.Ф. БасецкийВ.Л. К вопросу о КВЧ биоэлектронике и терапии // 3-я международная конференция “Теория и техника передачи, приема и обработки информации”. 1997. 310 с. 10. Винер Н, Розенблют А. // Кибернетический сб. Вып. 3. М.: ИЛ. 1961. 344 c.
Поступила в редколлегию 06.10.98
Рецензент: доктор технических наук Стрелков А.И.
Лагутин Михаил Федорович, д-р техн. наук, профессор, зав. кафедрой генерирования и формирования сигналов ХТУРЭ. Научные интересы: исследование динамики околоземной воздушной среды радио и лазерными дистанционными методами зондирования примесей атмосферы. Адрес: Украина, 310726, Харьков, пр. Ленина, 14, тел. 40-94-44.
Огиенко Александр Александрович, аспирант кафедры генерирования и формирования сигналов ХТУРЭ. Ад-рес:Украина, 310726, Харьков, пр. Ленина, 14, тел. 40-9444, 11-43-59.
УДК 519.246:616.22
МОДЕЛЬ ГОЛОСНОГО ЗВУКУ як ПЕРІОДИЧНО КОРЕЛЬОВАНОГО ВИПАДКОВОГО ПРОЦЕСУ В ЗАДАЧІ РОЗПІЗНАВАННЯ СТАНУ
ЧОРНА Л.Б.____________________________
Розглядається математична модель голосних звуків як періодично корельований процес при розпізнаванні функціонального стану серцевої системи за акустичними сигналами. Обгрунтовується вибір такої моделі. Доводиться, що зі зміною серцевого ритму змінюється й період основного тону сигналу голосних звуків.
1. Вступ
В ситуаціях, коли прямими методами з різних причин неможливо поміряти параметри системи, носієм інформації про таку систему є вихідний сигнал. В теорії інформаційно-вимірювальних систем сформувався важливий напрямок навколо поняття сигналу як носія даних. Сигнали вивчають для широкого кола задач: виявлення, виділення й оцінювання характеристик, розпізнавання стану, класифікації, прийняття рішень, урахування при цьому дії на системи флуктуацій, шумів і завад, а також процеси і явища в різних за природою об’єктах, системах і середовищах, у тому числі й у біооб’єктах.
Сигнал трактують як виниклий у вигляді спонтанного або ж стимульованого випромінювання, що поширюється від досліджуваного об’єкту, фізичний процес, який є засобом перенесення у просторі або часі (окремо чи в одному і другому водночас) відомостей про цей об’єкт чи явище в ньому. Ці
154
РИ, 1998, № 3
відомості можна отримати тільки шляхом належного опрацювання сигналу, яке має на меті формування опису (вибір сукупності фізичних параметрів) на базі деякої математичної моделі з подальшим перетворен -ням отриманого представлення в потрібну форму. Останнім кроком у процесі опрацювання є виділення і використання інформативного вмісту сигналу.
Можливості та глибина досліджень визначаються вибором адекватної моделі сигналу: його математичного зображення, ефективних методів перетворень і оцінювання інформативних характеристик. Модель повинна втілюватись у конструктивній формі, яка б дозволяла пристосувати відповідний математичний апарат аналізу так, щоб він враховував суттєві (з точки зору розв’язуваної задачі) риси досліджувано -го об’єкту. Під вибором моделі розуміється пристосування до своїх потреб і задач уже відомого у близькій області.
Розглянемо результати розв’язку задачі виявлення інформативних характеристик сигналів голосних звуків для проблеми розпізнавання функіонального стану серцевої системи за акустичними сигналами. Для сигналів голосних звуків характерне поєднання в їх структурі періодичності та випадковості. Суттєву роль тут відіграють властивості, що припускають ефективне втілення вже розробленої в енергетичній теорії моделі сигналів із класу скінченної середньої потужності — періодично корельованих випадкових процесів (ПКВП).
Випадкові процеси названого класу є моделями сигналів у розвинутій концепції ритміки як стохас-тичного коливання [1,7,9,16], що істотно узагальнює відомий підхід Вінера-Колмогорова [19], який базується на стаціонарній моделі [20]. Крім одержуваного з колмогорівської концепції спектрального розподілу потужності, нова концепція дає засоби врахування типу нестаціонарності коливань: для них характерна статистична повторюваність властивостей, що знаходять вираз у типі корельованості гармонічних складових коливання.
2.Модель коливного явища як ПКВП в енергетичній теорії стохастичних сигналів
Для того щоб розвинути засоби ритміки на вивчення коливних сигналів — голосних звуків, наведемо зібрані з опублікованих праць [7, 8, 11] результати обгрунтування моделі коливного явища (коливних змін його фізичних характеристик) у вигляді ПКВП, яка поєднує конструктивно в одному математичному об’ єкті такі суттєві та суперечливі, на перший погляд, властивості коливних сигналів як повторюваність і випадковість.
На єдиній методологічній основі розвинуто теорію нестаціонарних сигналів, яка дозволяє перенести на такі сигнали відомі факти із кореляційної теорії стаціонарних сигналів, належним чином розширивши їхні аспекти. У цьому розумінні кореляційна теорія стаціонарних сигналів охоплюється розвинутою енергетичною теорією і є її частинним випадком. Енергетична теорія зародилась, як показано у [6], в результаті осмислення потреб та багатьох результатів досліджень нестаціонарних сигналів і формування узагальненої точки зору на них, яка дає змогу встановити нові факти, знайти їх справжнє значення і взаємозв’язок з відомими в рамках розвиненої систематичної і вичерпної теоретичної схеми. Це
поєднує питання зображення сигналів через елементарні складові, лінійних перетворень, обгрунтування алгоритмів опрацювання й аналізу стосовно до широкого кола задач теорії і практики використання стохастичних сигналів.
В основу цієї теорії покладено енергетичний принцип — виділення класів сигналів (загалом нестаціонарних) за скінченністю енергетичних характеристик: енергії сигналу; тоді одержимо клас є :
E ^=J E| It) dt <ю
D
або ж його середньої потужності клас п :
P| = Mt {e| s(t)|2 }<».
Тут |(t), t є D — випадковий процес (ВП), який є моделлю сигналу; М — усереднення на всій часовій осі R. (Сигнали припускаємо центрованими E|t) = 0, бо матсподівання процесу, якщо воно не нуль, аналізується методами звичайної теорії функцій).
Оскільки енергія (мова йде про енергію коливань, тобто кінетичну) є квадратичною функцією, то постулат скінченності енергетичних характеристик сигналів найприродніше може бути виражений формальними засобами при трактуванні цих характеристик як норм у відповідних векторних (чи гільбер-тових, як їх узагальненні) просторах, бо метрика таких просторів як узагальнення теореми Піфагора є квадратичною. Тоді виразом скінченності енергетичних характеристик буде умова обмеженості норм. Але у нестаціонарного сигналу—миттєва потужність,
його дисперсія d ^ (t) = Е |(t) , t є D ° зміною, тому
його природний опис дає функцію часу зі значеннями у відповідному гільбертовому просторі, яким у даному разі є колмогорівський гільбертів простір К, утворений випадковими величинами скінченної дисперсії, трактованими як абстрактні вектори, тобто елементами (векторами) простору є значення ВП як моделі сигналу.
Норма цих елементів в утвореному ними лінійному просторі буде загалом змінною (стала вона тільки для стаціонарного процесу):
Itllx =л/М*У = Лм),
де t є D , r| (t, s) = E|(t)|(s) - кореляційна функція процесу.
Щоб одержати (незалежну від часу) характеристику всього нестаціонарного сигналу, треба “виключити час”, що можна зробити згідно з фізичною інтерпретацією двома способами: обчисливши інтеграл (для сигналу типу сплеску, імпульсу це буде його енергія) або середнє у часі (для незникаючих коливань це буде середня потужність). Вимога скінченності цих інтегральних енергетичних характеристик має природний вираз як обмеженість норм у гільбер -тових просторах над колмогорівським гільбертовим простором. Такі гільбертові простори уже введені у сучасному функційному аналізі.
Як вцдно зі сказаного, такі простори є природним засобом вивчення функції зі значеннями у гільбер-
тових просторах, у тому числі функцій |, D ^ K.
РИ, 1998, № 3
155
Таким чином, апарат теорії абстрактних функцій зі значеннями у гільбертовому просторі є адекватним засобом вивчення стохастичних сигналів у термінах їхніх інтегральних енергетичних характеристик — їхньої енергії чи відповідно середньої потужності. Зрозуміло, що такі інтегральні характеристики властиві сигналам, які є свого роду усталеному режимі, а перехідний режим звичайно описують за Л. Заде у термінах змінної стану.
Енергетичні характеристики таких сигналів, як сказано вище, доцільно розглядати як формальні норми у певних просторах, елементами яких є ці сигнали. Такі простори називають просторами сигналів [14].
Застосуання теореми Чебишова до ВП з енергетичних класів (до енергії сигналу чи до його потужності як випадкової величини) установлює факт, що реалізації таких процесів з імовірністю одиниця є функціями часу — елементами відповідно просторів L2(D) чи B2 (останній збігається з простором повільно зростаючих або, інакше, темперованих узагальнених функцій) [ 12]. Для стаціонарних процесів такий факт (належність їх реалізацій з імовірністю 1 до B2) установив К.1то [18].
Таким чином, енергетична концепція дає достатню підставу для формалізації та розробки повної і вичерпної теорії нестаціонарних сигналів: у термінах їх зображень як випадкових процесів, у кореляційних термінах, через властивості їхніх реалізацій та їх транслянт як теорії виділених двох енергетичних класів стохастичних сигналів, яка охоплює теорію стаціонарних. Подальша деталізація досягається означенням і вивченням сигналів, які творять підкласи в енергетичних класах.
Важливими є параметроваріантні підкласи сигналів [10], які доцільно визначати за характером зміни у часі їх параметричних коваріацій
b ^(t,u) = r^( t + u,t), коли вони періодичні, майже періодичні у сенсі Безиковича та полілеріодичні (квазіперіодичні) у часі, тобто по змінній t. Останній з класів означується як складений з таких майже періодичних функцій, показники Фур’є яких мають скінченний теоретико-числовий базис, тобто зображуються сумами
X k = ^ n k Л k
k =1,N ,
де nk eZ — цілі, Xk єR — дійсні несумірні числа.
Зручну характеристику таких коливань дають множини кореляційних і спектральних компонент— відповідних “коефіцієнтів” Фур’є. Такі моделі описують сигнали, породжувані системами з поворотами, обертаннями, часовий хід природних процесів, біоритми, коливну кінетику. ПКВП, коли
N = 1, Л = 2п/T , де т — період функції b(-, u), тоді є моделями простої ритміки; біперіодично корельо-вані, коли N = 2 — подвійної типу сезонно-добового ходу природних явищ і т.д.
Якщо клас п трактувати як параметроваріантний, тобто залежність характеристик процесу покладати не тільки просто такою, що існують при всяких зсувах сукупностей їхніх значень відповідні середні по часі як параметрові, але й брати до уваги характер чи тип цієї часової залежності, то явне задания її вигляду
виділить такі підкласи класу п , що відповідають цим типам залежності. Коли ця залежність періодична, майже періодична чи полілеріодична (квазіперіодич-на), то виділяються відповідно класи періодично, майже і полілеріодично корельованих ВП.
До сучасного етапу провадились різнобічні дослідження ПКВП (означені ще у 1947 р. О.Коронкеви-чем). Деякі властивості їх були встановлені у різний час рядом авторів, причому ці результати розрізнені, з’являлись епізодично у зв’язку з різними проблемами. Елементи теорії ПКВП під різним кутом зору були зібрані у працях [11, 15-17].
Означимо ПКВП — моделі стохастичних коливань з періодичною зміною імовірнісних характеристик як підклас класу п .
Покладаючи, як це вимагається у застосуваннях даного класу процесів, що їхні матсподівання, загалом кажучи, відрізняються від нуля, наведемо незалежне від сказаного вище його означення.
Періодично корельовані — це такі ВП, математичні сподівання та коваріації яких задовільняють умовам
m(t + T) = m(t), r(t + T, s + T) = r(t, s), Vt,s є R (1) при певному Т>0, яке називається періодом корельо-ваності(у даному означенні цю величину покладають заданою, точно відомою апріорі), або якщо використовувати параметричну коваріацію (функцію кореляції b( t, u) = r( t + u, t)), то з цих умов виходить, що матсподівання і параметрична коваріація є періодичними з періодом Т:
m( t + T) = m( t),
b(t + T,u)= b(t,u) Vu є R.
Умова (1) при обчисленні середніх характеристик призводить до того, що усереднення по всій осі переходить в усереднення по відрізку довжини Т, що можна для простоти (внаслідок інваріантності усереднення щодо зсувів) вважати як усереднення на
відрізку [0; T), тобто покладати, що середні величини
характеристик процесу
m=
і = Mt {m(t)}= T j m(t)dt,
T 0
B(u) = Mt {{ + Уt)} = T j rt + У t)dt = 71 b j b(t u)dt, T 0 T 0
де Mt — усереднення по всій часовій осі R; Т — період корельованості ПКВП. Тому ці характеристики мають розклади у ряди Фур’є:
m(t)=£mkeik^ b(t,u)=£Bkeik^ Д
keZ , keZ , Л = 2n/T,
які слід розуміти у сенсі теорії узагальнених функцій Шварца [3, 38], коли розглядати ПКВП скінченної середньої потужності.
Енергетичний підхід дає можливість дослідити властивості таких ВП, а у припущенні їх й — ергодичності розробити методи статистичного оцінювання характеристик часової зміни властивостей сигналів. Установлені факти [15,16] суттєво доповнюють результати Л.І.Гудзенка [4,5], Л.Френкса [34], У.Гарднера [31-33], Г.Гарда [35] і стали базою розвитку концепції та розробки методів аналізу ритміки стосовно до розв’язання конкретних задач [6, 15,16].
156
РИ, 1998, № 3
Модель ПКВП є розвитком стаціонарної і виражається через неї - через стаціонарні і стаціонарно-пов’язані послідовності. Тому для її аналізу можна застосувати відповідні алгоритмічні засоби статистичного опрацювання реалізацій сигналів, які обгрунтовуються на основі тих самих припущень, що і методи статистичного аналізу стаціонарних послідовностей.
З.Застосування моделі ПКВП та статистичних методів оцінювання її характеристик для аналізу голосних звуків у задачі розпізнавання стану
Вибір моделі голосного звуку визначався як проблемою, яка вирішується, так і фізичною природою самого сигналу.
Проблема встановлення емоційного і функціонального стану організму за звуковим сигналом відома [2,21-23]. Ефективність розпізнавання стану грунтується на правильному чи вдалому виборі ознак мовного сигналу, тобто сукупності таких його параметрів, які безпосередньо використовуються при аналізі і прийнятті рішень.
Інформативні параметри, що широко використовуються різними авторами для аналізу зміни функціонального стану людини за мовними сигналами при їх гомоморфному обробленні [22,23,26] — це період основного тону (ПОТ), його середнє значення, дисперсія, інтервал зміни. ПОТ є інваріантною характеристикою щодо особи при вимові протяжних голосних звуків (кожна людина має притаманну їй частоту основного тону голосу). Для встановлення стану особи, яка говорить, визначальним є те, що ПОТ сильно корелює з факторами типу напруженості голосу і емоційного стану людини [2,21].
Для задачі розпізнавання функціонального стану серця (як одного з основних показників функціонального стану організму людини [25]) також розумно припустити, що зі зміною серцевого ритму буде змінюватися й ПОТ сигналу голосного при різних функціональних станах серця.
Отже, беручи до уваги специфіку задачі та вже відомі підходи до її вирішення, необхідно вибрати таку модель, яка б містила інформативну характеристику — ПОТ. Математична модель голосних звуків у вигляді ПКВП якраз і містить її, а саме — період корельованості. Експериментально виявлено, що він рівний ПОТ.
Один із способів дискретного представлення сигналу голосної, як показано у [26], — це представлення мовного коливання, тобто збереження форми сигналу в процесі дискретизації і квантування. В часових записах голосних звуків спостерігається періодичність. З рис.1 видно, що сигнал складається з коливних циклів. І не дивлячись на те, що послідовні цикли точно майже не повторюються, склалося досить визначене поняття ПОТ [24]. Імпульси потоку повітря, що створюються голосовими зв’язками, з достатньою точністю можуть вважатися періодичними. Відповідний період повторення імпульсів називають ПОТ.
При наявності величезного різноманіття як у різних людей, так і в одного і того ж диктора, існують загальні закономірності та властивості мовотворення, які в результаті і дозволяють в процесі слухового сприйняття правильно ідентифікувати окремі фоне-
ми. Ці загальні правила лежать в основі побудови моделей мовотворення та мовних сигналів. Основними процесами при формуванні звуків мови [27] є утворення сигналу збудження у вигляді потоку повітря та проходження цього потоку через певної форми голосовий тракт. У відповідності з цим основними складовими прийнятих цифрових моделей мовотворення є модель джерела збудження та модель голосового тракту.
Рис.1. Запис реалізації голосного звуку Загальновизнаною в наукових та інженерних дослідженнях є цифрова модель утворення мови, запропонована Л.Рабінером та Р.Шафером у [26] (рис.2).
Сигнал збудження у випадку вокалізованих звуків є квазіперіодичною послідовністю імпульсів, що формуються генератором імпульсів з ПОТ, які проходять через фільтр з передаточною характеристикою G(z) — модель голосової щілини. Для протяжних звуків — таких як голосні, параметри
Період
основного тону
Параметри
голосового
тракту
4^
Модель
голосо-
вого
тракту
V(z)
Рис.2. Загальна дискретна модель мовотворення
мовного тракту змінюються досить повільно і модель адекватно відображає процеси утворення вокалізованих звуків. Для спрощення доцільно об’єднати моделі голосової щілини, голосового тракту та випромінювання в одну.
В цьому випадку цифрова модель мовотворення дещо спрощується і, власне, в такому вигляді використовується для розв’язування більшості задач аналізу, перетворення та синтезу мовних сигналів.
Оскільки зміна параметрів голосового тракту є достатньо повільною в порівнянні з часом затухання імпульсної характеристики, дана система моделюється як стаціонарна по відношенню до тривалості її пам’яті.
РИ, 1998, № 3
157
Представлена модель мовотворення є основою цілого ряду поширених моделей мовних сигналів. Останнім часом появляється все більше робіт, в яких використовується представлення мовного сигналу у вигляді суми періодичної та аперіодичної складових [37]. При цьому аперіодична складова присутня навіть у яскраво виражених вокалізованих звуках. Природа сигналу голосного звуку така, що його не можна задати з допомогою навіть складного аналітичного виразу—розглядати детерміновану модель. Можна говорити лише про ймовірнісні характеристики всього ансамблю реалізацій, тобто розглядати випадковий процес, реалізаціями якого він є. Тому математичну модель сигналу голосного звуку доцільно розглядати у вигляді ВП.
Величина ПОТ незначно змінюється від циклу до циклу по реалізаціях, отриманих навіть для однієї і тієї ж людини, проте його середнє значення має більшу стійкість. Слід зазначити, що періодично повторюється і форма, і амплітуда звуків, але ці характеристики є менш стійкими до збурень, не інваріантними. Ось чому (стосовно звуків) мова повинна йти про повторюваність в “середньому”, в статистичному розумінні. Звідси й висновок, що для опису такої повторюваності голосних звуків необхідно вибрати їх модель у вигляді випадкового процесу з періодично змінними характеристиками [68, 10, 16, 17, 31-33, 35]. У ЕТСС моделями стоха-стичних коливних явищ є періодично нестаціонарні (точніше періодично корельовані), а також їхні узагальнення— споріднені, майже періодично корельовані ВП.
Отже, виходячи з фізики явища, також доцільно вибрати математичну модель у вигляді ПКВП.
При розгляді цифрових методів представлення сигналу як ВП часто досить припустити, що мовний сигнал є ергодичним випадковим процесом. Таке припущення для ПКВП обгрунтовано в [6,11]. Воно дає можливість розробити методи статистичного оцінювання характеристик часової зміни властивостей сигналів. Оскільки дисперсія ПКВП є періодичною функцією, то її усереднення по всій осі зводиться до усереднення на відрізку довжини T . Середня потужність таких процесів виразиться формулою
1 т
рт = TІd Ф) ,
T 0
і коли вона скінченна, то ця умова визначає клас п т [10,29]. Для аналізу ПКВП можна застосувати методи (синфазний, компонентний чи фільтровий), які обгрунтовуються на основі тих самих припущень, що і методи статистичного аналізу стаціонарних послідовностей [6,9,11,12].
ПКВП можна трактувати як континуальну сукупність залежних від початкової фази t0 стаціонарних (в широкому сенсі) випадкових послідовно -стей [11]:
Iс(to) = {|(to + kT),k єZ},t0 є[0,Т).
Дійсно, її середнє і функція кореляції задовіль-няють (при фіксованій початковій фазі t0) умовам, справедливим для характеристик стаціонарної випадкової послідовності: середнє значення є констан-
тою, а функція кореляції залежить лише від різниці індексів k -1:
mk(t0) = E|(t0 + kT) = m^(Щ + kT) = m^(Щ),
bki (t0 ) = ES(t0 + kT)!°(t0 + 1T) =
= b ^(t0 + kT,t0 + kT-[ + 1T]) = b ^(t0,[k - 1]T). Аналогічно відліки значень ПКВП при різних початкових фазах, наприклад {§(t0 + kT)} і
{|(ti + 1T)} , творять стаціонарно пов,язані послідовності, оскільки функції їх взаємної кореляції при фіксованих t0 і ti залежать лише від різниці індексів
(k -1). Метод аналізу емпіричного матеріалу, якщо він будується на рівності фаз усіх відліків при заданім періоді корельованості, називається синфаз-ним і обгрунтовується на основі тих самих припущень, що і алгоритми статистичного аналізу стаціонарних послідовностей.
Формули
1 N-i
4(t) = Ni m- Е|(0 + kT) ,
N^-ro N k=0
л 1 N-10 0
b|(t,u) = 1i m.— Е I(t + u + kT)|(t + kT)
N^Nk=0
дають слушні незміщені оцінки характеристик ПКВП синфазним методом [6]. Якщо припустити, що сигнал голосного звуку є неперервним ВП, то періодичну послідовність відліків цього сигналу можна розглядати як випадковий процес з дискретним часом (t). Оскільки практично бувають відомі спостереження на відрізку k = 0; N -1 довжиною N множини цілих чисел Z, тоді формули оцінок приймають вигляд:
1 N-1
4(t) = N ЕФ+kT), (2)
N k=0
л , . 1 N-1г П
1)|(t,u) = — Е Ф + kT)- гїцф + kT)l:
N k=0 J
x [|(t + u + kT) - m^(t + u + kT)]
де © — загальна довжина реалізації © = NT; N — кількість періодів корельованості на усій реалізації.
Припущення ергодичності ПКВП як моделі голосних звуків дає можливість пристосувати відповідний математичий апарат опрацювання експериментальних даних — знаходження по реалізації процесу статистичних характеристик синфазним методом.
Блок-схема виявлення змін функціонального стану серця за змінами статистичних характеристик (математичного сподівання, коваріації) моделі сигналу голосного звуку представлена на рис.3.
У наведені розрахункові формули для оцінок характеристик ПКВП синфазним методом (2) входить величина T — період корельованості, яку покладають відомою, тому важливо вміти її знаходити ще до обчислення статистичних характеристик синфазним методом.
Не існує прямих способів визначення періоду корельованості за реалізацією, його можна було б
158
РИ, 1998, № 3
Рис.З.Блок-схема виявлення змін функціонального стану серця за змінами статистичних характеристик (математичного сподівання, ко-варіації) моделі сигналу голосного звуку
визначити з періодичності оцінок матсподівання та коваріаційної функції ПКВП, подібно до того, як визначають емпірично період періодичної функції (наприклад, відомим способом Б’ю-Балло). З іншого боку, такі оцінки можна обчислювати тільки тоді, коли відомий період корельованості т чи базова частота 2п / T ПКВП.
Вихід з такої ситуації дає формулювання цієї задачі як поєднання задач оптимізації та перевірки в рамках статистики ПКВП складної гіпотези про пробний період (пробну частоту). Для цього слід верифікувати складну гіпотезу, що період корельованості т є якимось із значень у певному інтервалі
[ Ti;T2 ] за статистиками, обчисленими при різних фіксованих значеннях пробного періоду Tp із множини усіх можливих на інтервалі {Tp }c[Ti;T2 ]. Частотою дискретизації визначатиметься крок, з яким ми проходимо інтервал [ T1;T2 ], а отже й точність селекції періоду. Цей метод пробного періоду починається з якогось нульового наближення, а далі йде уточнення.
В процесі аналізу емпіричних даних було встановлено, що ПОТ сигналу голосної можна брати як нульове наближення — пробний період.
Оцінювання ПОТ є однією з найважливіших задач при опрацюванні мови. Пристрої для виділення основного тону використовуються у вокодерах, в системах розпізнавання і верифікації дикторів [26]. Оскільки задача є дуже важливою, запропоновано ряд способів для її вирішення, детально описаних у
[26]. Оцінювання ПОТ було проведено різними способами:
1. За реалізацією процесу у часовій області, усередненням інтервалів часу між його максимальними значеннями. Такий метод простий і тому зручний. Однак оскільки сигнал голосної не є вузькосмуговим, можна легко помилитись, враховуючи малі піки (резонанси у вокальному тракті), які є між високими (рис.1), коли потрібно враховувати тільки останні.
2. За автокореляційною функцією. Оскільки автокореляційна функція досягає максимального значення в точках 0;± т ;± 2T ..., при будь-якому часовому розташуванні сигналу його період можна оцінити шляхом визначення місцязнаходження першого максимуму автокореляційної функції, яка для мовного сигналу визначається формулою [26]:
ф(к) = lim
1
N
2N + 1 m=_n
£ x(m)x(m + к),
x( m) — дискретні відліки сигналу голосного звуку.
3. За мінімумом функції середнього значення абсолютної різниці (ФСЗАР), означеної як ЛМБЕу [ 14]. Обчислення автокореляційної функції вимагає виконання великої кількості арифметичних операцій. Метод, який виключає необхідність множень, грунтується на тому, що для строго періодичної функції з періодом т послідовність
d( n) = x(n) _ x( n _ k)
буде рівна нулю при k=0;± т ;± 2T .... Для сегментів вокалізованого мовного сигналу природно очікувати, що послідовність d( n) буде близькою до нуля (але не рівна йому) при k, кратному періоду основного тону. Середнє значення d( n) як функції k буде малим, якщо k близьке до періоду основного тону. Функція середнього значення різниці визначається як
1 N_1
Yn(k) = N £ lx(n)_ x(n_ k)l.
N n=0
Очевидно, що якщо x( n) є близькою до періодичної функції у випадку вокалізованого голосного, то Yn(k) буде мати глибокі провали при k=0; ± т ;±2т ....
4. За амплітудним спектром сигналу у частотній області. При вузькосмуговому перетворенні Фур’є збудження вокалізованої мови проявляється вузькими піками на частотах, кратних основній частоті [28]. Максимум спектральних ліній, який рівний найменшій частоті в спектрі вокалізованого сигналу, є частотою основного тону. Відповідно обернена до цієї частоти величина ПОТ. Цей факт покладено в основу ряду схем виділення основного тону [26].
5. Кепстральним методом визначення частоти основного тону (Noll, 1964). Кепстр (cepstrum) - це квадрат перетворення Фур’є від логарифма амплітудного спектру сигналу. Максимум функції кепстру відповідає частоті основного тону [26].
Серед усіх перерахованих способів оцінювання ПОТ було вибрано автокореляційний метод та метод за мінімумом ФСЗАР як задовільні по швидкодії та по точності обчислень. ПОТ знаходи-
РИ, 1998, № 3
159
ли автокореляційним методом, хоча для обчислення автокореляційної функції необхідно виконати операції додавання і множення, тоді як для отримання ФСЗАР необхідно виконати лише операції додавання, віднімання і обчислення модуля. Але при використанні системи счисления з плаваючою комою, де на операцію додавання і множення необхідно приблизно один і той самий час, обидва методи дають майже ту саму швидкодію.
Істинне значення періоду корельованості було верифіковано за максимумом функції варіації статистичних оцінок при значенні ПОТ як нульового наближення чи пробного періоду [13].
Іншим важливим моментом, відображеним на блок-схемі (рис.3), є знаходження однакових фаз (відліків) для сигналів голосних звуків: 1 — в нормальному стані; 2 — після проведеної функціональної проби (ФП) з аритмією. Адже й сам аналіз— син фазний означає в однаковій фазі і має на увазі, що при аналізі ритміки відбираються синфазні значення — одна фаза відліків з різних відрізків завдовжки в період, який знайдено апріорі. Коли відбір не синфазовано, то виникають шуми, подібно до описаних у [8]. За початкові фази t01 та t02 вибрано значення перших максимумів часових записів сигналів.
Наступний крок — знаходження статистичних оцінок за формулами (2) для голосних звуків, вимовлених однією людиною при різних функціональних станах (ФС) її серцевої системи, на предмет виявлення наявності змін у оцінках статистичних характеристик сигналів 1,2. Важливим є те, що обидва рази статистики (2) були обраховані з однаковими значеннями параметрів: періодом ТН та початковою фазою t0 . Тн (рис.3) визначено один раз для нормального ФС. За
початкову фазу t0 є[0,Т) вибрано обидва рази перше максимальне значення сигналу. Статистичні оцінки знаходили: перший раз для здорової людини у спокійному стані, другий — після проведення ФП з фізичним навантаженням (стандартна методика, затверджена Міністерством охорони здоров’я [25]), чим змоделювали зміну ФС серця (аритмію).
Порівнюючи графіки статистичних оцінок пі| (t)
та b|(t,u = 1) (рис.4,5), бачимо суттєві відмінності у амплітудах оцінок. Оскільки відліки відбирались обидва рази синфазно з періоду Тн , то лише зміна останнього могла привести до відмінностей у графі-ках.
4. Висновки та інтерпретація результатів
На статистичних характеристиках ПКВП, якщо обраховувати їх синфазно із значенням періоду, який був у нормальному стані, кількісно проявляється суттєве відхилення періоду корельованості після проведеної ФП від значення у нормі. Отже, припущення про зміни ПОТ зі зміною частоти серцевих скорочень — вірне.
Зміну розмаху статистичних оцінок легко пояснити з точки зору синфазного аналізу [1]. Оскільки ми трактуємо ПКВП як континуальну сукупність залежних від початкової фази стаціонарних випадко-
т|(t / Тн)
t, с
Рис.4. Графіки оцінки математичного сподівання, обчислені для різних ФС:
1— при нормальному серцевому ритмі;
2— при частому ритмі (після ФП з фізичним навантаженням)
k(t/T„ ,u = 1)
t, с
Рис.5. Графіки оцінки параметричної коваріації, обчислені для різних ФС:
1— при нормальному серцевому ритмі;
2— при частому ритмі (після ФП з фізичним навантаженням)
вих послідовностей |ск (tk),k = 0,ТН -1, то при істинному періодові корельованості (Тн) у статистичних оцінках, обрахованих до ФП, для усереднення будуть братися значення із цих стаціонарних послідовностей
І Ск . Якщо ж період корельованості після ФП зміниться Т2 ф Т1 = Тн, то tk ,k = 0,ТН -1 вже не буде спільною фазою для всіх відліків і при усередненні будуть змішуватися значення різних стаціонарних послідовностей |ck (tk). Внаслідок такого перемішування буде згладжуватися розмаїтість значень оцінок математич-
160
РИ, 1998, № 3
ного сподівання m ^( t/TH) та коваріаційної функції 1) ^(t/TH ,u = і). Лише при умові TH = const криві
m|(to/Тн), to є[0;ТН) та b^(t/TH ,u = і) у обох випадках співпадатимуть з 1, яка буде найрельєфнішою (буде мати найбільший розмах, амплітуду (рис.4,5)). Кількісно відхилення статистичних оцінок можна
оцінити, ввівши міру рельєфності кривих m|( t/T), 1)|(t/T,u). За таку міру було взято варіацію функції V(f;[a;b]) [13]:
v(f;[a;b])= sup Z_ |f (tk+і)-f (tk )|
VDn([a;b)) k=0;n-1 .
Вона є точною верхньою межею сум приростів
значень функції f(tk+1)- f(tk), коли tk є точками
розбиття a=t0<t1<...<tk=b відрізка [a;b], верхня межа береться по всіх можливих таких розбиттях. Ця величина, очевидно, є невід’ємною і адитивною, тобто вона справді є мірою.
Отже, модель голосного звуку як ПКВП для проблеми розпізнавання ФС серця є адекватною. Вона узгоджується з фізикою явища, а у статистичних характеристиках, обчислених на основі моделі голосного звуку як ПКВП, виявлено інформацію про зміни ФС серця.
Література: 1. Войчишин К. С, Драган Я.П., Куксенко-
B. И., Михайловский В.Н. Информационные связи биогелиогеофизических явлений и элементы их прогноза. К.: Наук.думка, 1974. 208 с. 2.Галунов В.И., Манеров В.Х. Связь между психофизиологическим состоянием и характеристиками речевого сигнала. Львов: АРСО, 1974. С.46—49. 3. ГельфандИ.М., Шилов Г.Е. Пространства основных и обобщенных функций. М.: Физматиз, 1958. 307 с. 4. Гудзенко Л.И. О периодически нестационарных процессах // Радиотехника и электроника. 1959. Вып.6. С.1026-1064. 5. Гудзенко Л.И. Обобщение эргодической теоремы на нестационарные случайные процессы // Изв.вузов.-Радиофизика. 1961. N2. С.267-274. 6. ДраганЯ.П. Енергетична теорія лінійних моделей стохастичних сигналів. Львів: Центр стратегічних досліджень еко-біотехнічних систем. 1997. 361+XV с. 7. Драган Я.П. К обоснованию стохастической модели ритмических явлений // Отбор и передача информации. 1972. Вып.34. С. 21-27. 8. Драган Я.П. Общие свойства стохастической модели ритмики / / Отбор и передача информации. 1975. Вып.44. С. 3-14. 9. Драган Я.П. О представлении периодически коррелированного случайного процесса через стационарные компоненты / / Отбор и передача информации. 1975. Вып.45. С.7-20. 10. Драган Я.П. Параметровариантный класс случайных процессов и линейных операторов и его приложения к анализу полиритмических естественных явлений / / Статистические методы в теории передачи и преобразования информационных сигналов: Тез. докл. К.: Знание УРСР, 1977. С.11. 11. Драган Я.П. Структура и представления моделей стохастических сигналов // К.: Наук.думка, 1980. 384с. 12. Драган Я.П. Свойства реализаций случайных процессов и их статистическая репрезентативность // Отбор и прередача информации. 1987. Вып. 76. С. 12-21. 13. Драган Я., Крива Н, Яворський Б. Проблема апостеріорного визначення темпу ритміки // Вісник ТПІ. 1996. №2.
C. 115 — 125. 14. Драган Я.П, Омельченко В.А. Принцип адитивности и ортогональные представления стохастических сигналов с конечной энергией / / Отбор и обработка информации. 1988. Вып.2 (78). С.1-10. 15.
Драган Я.П., Приймак Н.В. Линейные периодически коррелированные случайные процессы. Львов; 1986. 30 с. (Препр.АНУССР.Физ.-мех.ин-т им.Г.В.Карпен-ко; №120). 16. Драган Я.П, Рожков В.А, Яворский И.Н. Методы вероятностного анализа ритмики океанологических явлений. Л.: Гидрометеоиздат, 1987. 319 с. 17. Драган Я.П, Яворский И.Н. Ритмика морского волнения и подводные акустические сигналы. К.: Наук.думка, 1982. 248 с. 18. Ито К. Вероятностные процессы. М.:Изд-во иностр. лит., 1960. 4.1. 133 с. 19. Колмогоров А.Н. Статистическая теория колебаний с непрерывным спектром // Юбилейный сб. АН СССР. 4.1. М.: Изд-во АН СССР, 1947. С. 242-249. 20. Налимов В.В. Теория эксперимента. М.: Наука, 1971. 207 с. 21. Никонов А.В., Попов В.А. Особенности структуры речи человека-оператора в стрессовых ситуациях // Речь и эмоции. Л.: Наука, 1975. С. 11—16. 22. Рамиш-вили Г. С. Речевой сигнал и индивидуальность голоса. Тбилиси: Мецниереба, 1976. 142 с. 23. Распознавание слуховых образов / Под общ. ред. Н.Г. Загоруйко и С.Я.Волошина. Новосибирск: Наука, 1970. 338 с. 24. Сапожников М.А. Акустика: Справочник. M.: Связь, 1989. 349 с. 25. Спортивная медицина. Общая патаоло-гия, врачебный контроль с основами частной патологии / Под ред. А.Г.Дембо.М.: Физкультура и спорт, 1975. 345 с. 26. Цифровая обработка речевых сигналов / Л. Р. Рабинер, Р. В. Шафер. М.: Радио и связь, 1981. 496 с. 27. Фланаган Дж. Л. Анализ, синтез и восприятие речи. М.: Связь, 1968. 392 с. 28. Яворский Б.М., Детлаф А.А. Справочник по физике. М.: Наука, 1979. 944 с. 29. Dragan Ya, Yavors ’kyi B., Chorna L, Sikora L. Energy theory of stochastic signals, separation of classees and specification of statistical processing algorithms // Proc. ofECSAP-97, ICT Press. P.129-132. 30. Electronics engineering handbook. 4th Ed. by Donal Christiansen. New York: McGrown Hill. 1997. 840 p. 31. Gardner W. Introduction to random processes with application to signals and systems. New York: Macmillan publ. comp., 1986. 430 p. 32. Gardner W. The spectral correlation theory of cyclostationary time series // Signal processing. 1986. Vol.11, № 1. Р.13-36. 33. Gardner W, FrenksL.E. Characterization of cyclostationary random signal processes // IEEE Trans. On inf. th. 1975. 11-21, № 1. P.13-36. 34. Gazanhes C. Etude de modulation d’amplitude concecutive a la diffusion d’une onde acoustique par une surface agitee. Marseille: L’univ.provence, 1972. 168 p. 35. Hurd H Stationarizing properties of random shifts / / SIAM J. Appl. Math. 1974. № 1. P.203-312. 36. Koopmans L.N. The spectral analysis of time series. New York etc.: Acad. Press, 1974. 378 p. 37. Richard G, Alessandro C. Analysis / synthesis and modification of the speech aperiodic components. Speech Communication. 1996, № 19. Р. 224-244. 38. Silverman R.L. Locally stationary random process// IEEE Trans. on inf. Th. 1957. IT-3, № 9. P.182-187.
Надійшла до редколегії 10.07.98 Рецензент: д-р фіз.-мат. наук Драган Я.П.
Чорна Леся Богданівна, аспірантка кафедри “Біоме-дичні системи і апарати” Тернопільського державного технічного університету ім. Івана Пулюя. Наукові інтереси: алгоритми обробки акустичних (мовних) сигналів. Захоплення: спорт, комп’ютери та прикладні графічні програми. Адреса: Україна, 282023, Тернопіль, вул. 15 Квітня, 21/90, тел. (0352) 26-61-06.
РИ, 1998, № 3
161