Научная статья на тему 'Синтез информативных признаков на вейвлет-плоскости фонемы и для диагностики голосовых расстройств'

Синтез информативных признаков на вейвлет-плоскости фонемы и для диагностики голосовых расстройств Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
108
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Синтез информативных признаков на вейвлет-плоскости фонемы и для диагностики голосовых расстройств»

Статья

чувствительности - Хр. 3) Заменяем соответствующий этому

0* **

показателю чувствительности вес Wp на Wp и исключаем его из процедуры обучения.4) Предъявляем сети все примеры обучающего множества. Если сеть не допустила ни ошибки, то переходим ко 2-му шагу процедуры. 5) Пытаемся обучить отконтрасти-рованную сеть. Если сеть обучилась безошибочному решению задачи, то переходим к 1-му шагу процедуры, иначе - переходим к шестому шагу. 6) Восстанавливаем сеть в состояние до последнего выполнения 3-го шага. Если в ходе выполнения шагов со 2^5 был отконтрастирован хотя бы один вес (число подстраиваемых весов изменилось), то переходим к 1-му шагу. Если ни один вес не отконтрастирован, то получена минимальная сеть.

Подсистема прогнозирования осуществляет тесную взаимосвязь с информационной подсистемой и функционирует по следующей схеме: 1. Задать исходные данные о пациенте;

2. Вычислить значения функции активации узлов нейросети 1

У

(п)

”"1) *W(n)

1 + е 1=0

3. Рассчитать выходное значение вектора сети у^ и достоверность прогноза. По окончании работы подсистема прогнозирования фиксирует полученные значения в таблице базы данных и дает возможность переноса данных в обучающий массив. Диалоговое окно позволяет настроить параметры системы: информационную базу; файл конфигурации сети. Программный комплекс обеспечивает ведение карт больных, регистрирует итоги обследования и отслеживает ход заболевания. Имеется выбор параметров конфигурации нейросети: скорость сходимости итерационного процесса; диапазон нормализации; выбор входных/выходных узлов сети; число нейронов в скрытом слое; смещение порога нейрона в функции активации; величина ошибки сети и т. д. Проверочная таблица уточняет форматы диагностических признаков для корректного ввода в базу.

Апробация программного комплекса для прогнозирования развития острого ИМ на тестовой и контрольной выборках показала, что сеть безошибочно распознавала все примеры обучающего множества (60 примеров), то есть точность прогноза для контрольной выборки составила 99%. При проверке эффективности модели на медицинской информации, которая не использовалась для настройки параметров нейросети, (60 случаев) прогноз составил более 90% совпадений. Реализация предложенных методов и алгоритмов на практике позволяет повысить точность и эффективность диагностики и прогнозирования течения острого ИМ, сократить время выбора лечебных мероприятий.

Построенная нейросетевая модель для прогнозирования развития острого ИМ показала высокий процент соответствия диагнозам больных, полученным по экспертной информации, что позволяет использовать эту модель в клинической практике.

Литература

1. Усков В.М. // Регион. научно-практ. конф. Доказательная медицина (клиническое наблюдение, статистическое обобщение, модели процесса).- Воронеж, 2000.- С. 29-31.

2. Стрыгина С.О. и др. // Известия РАЕН. Серия МММИУ.- 1997.- Т.1, № 1.- С.138-150.

3. Стрыгина С. О. и др. // Известия РАЕН. Серия МММИУ.- 1998.- Т.2, № 3.- С. 136-144.

4. Пасмурнов С.М. и др. Нейронные модели в кардиологии.- Воронеж, 2002.- 193 с.

УДК 615.84

СИНТЕЗ ИНФОРМАТИВНЫХ ПРИЗНАКОВ НА ВЕЙВЛЕТ-ПЛОСКОСТИ ФОНЕМЫ И ДЛЯ ДИАГНОСТИКИ ГОЛОСОВЫХ РАССТРОЙСТВ

Для диагностики голосовых расстройств врач-фониатр может использовать частотно-временные преобразования голосового сигнала, наиболее адаптированным из которых является вейвлет-преобразование [4]. Могут быть подобраны тестовые

слова и тестовые фонемы, анализ вейвлет-преобразований которых позволяет определить характер и степень нарушения голоса. Вейвлет-плоскость фонемы «И» представлена двумя формантами, их дислокация определяется полом и возрастом пациента. Степень патологии голоса определяется энергетическими соотношениями: по мере развития заболевания идет «перекачка» энергии из более высокочастотной форманты в низкочастотную. При обострении заболевания высокочастотная форманта может «рассыпаться», и от нее вместо четкой горизонтальной полосы на вейвлет-плоскости остаются хаотические пятна. Абсолютные величины вейвлет-коэффициентов кодируются цветом: от красного - максимум, до синего - минимум (рис. 1, стр. 3 обл.).

Для диагностики нарушений голоса количественно оценим соотношение энергий в 2-х формантах, что реализуется простыми алгоритмами обработки изображений (рис. 1 стр. 3 обл.). Информативные признаки определим по выделенным сегментам (рис. 2 стр. 3 обл.). Сегмент А - это зона обертонов, сегмент В - зона 2-й форманты, С - межформантная зона, сегмент Э - зона 1-й форманты, сегмент Е - низкочастотная область вейвлет-плоскости. На рис. 2 стр. 3 обл. сегмент Е пустой. Но им не надо пренебрегать. На рис. 3 стр. 3 обл. показаны вейвлет-плоскости дифтонгов ИА, на которых из сегмента Е можно найти нужный объем информации (правая часть рис. 3 стр. 3 обл.).

Возможна сегментация вейлет-плоскости вдоль оси времени: выделим три сегмента в этом направлении: сегмент, соответствующий фонеме И, сегмент - переходному периоду, и сегмент - фонеме А (рис. 3 стр. 3 обл.). Итого для дифтонгов можем получить пятнадцать сегментов. Анализ сегментов А показывает, что при патологии голоса снижается энергия обертонов, смещаясь в высокочастотную область. Эти параметры не могут быть достаточны для постановки достоверного диагноза, т.к. в период заболевания они практически совпадают с такими же параметрами здорового. Поэтому критерием патологии считаем показатель регулярности сегмента А, который определяем по максимуму автокорреляционной функции в сегменте, причем последняя может быть определена в одной из строк сегмента, но для снижения погрешностей, связанных с сегментацией, эта строка должна быть дальше от нижней границы сегмента, а для снижения погрешностей сегментации, связанных с частотой дискретизации, -должна быть дальше от верхнего края вейвлет-плоскости.

Автокорреляционная функция строки вейвлет-плоскости:

Ят (а, т) = Т £ w(a, Ь,) • w(a, Ь, +т),

(1)

где Т - число отсчетов в фрагменте сигнала голоса. Вид функции (1) см. на рис. 4, и точки её локальных максимумов соответствуют квазипериодам процесса (регулярность).

лет-плоскости

Среди множества значений функционала (1) необходимо найти максимальные. Для синтеза информативного параметра используем 10 самых больших значений (1). Максимальное значение функционал (1) примет при т=0, но это число не является критерием регулярности процесса и может быть использовано в качестве нормирующего коэффициента. Исходя из вышесказанного, можем сформировать первый информативный признак

“ Я(а е А)

Х1(а е А) = У----------------- ---,

7=110 • Я(а е А,0) _

где Я(а е А) 1X1 > Я (а е А) 1*2 > Я(а е А)1Х3 > ••• > Я(а е А) 1X0 ,

* *305006, г. Курск, ул. Димитрова, 61, МУЗ «Горбольница №1»

305040, г. Курск, ул. 50 лет Октября, 94, ГОУ ВПО «КГТУ»; тел./факс: (4712) 50-48-20; Е-шаП: [email protected]

Я(а є А)3 = шах{я(а є А,т)}, т = 1, Т /2;

Я(а є А)ШаХ2 = шах{ {Я(а є А,т)} \ }а є А)ЩЛХ! }, т = 1, Т /2 ; Я(а є А)ШЛХ = шах{ {Я(а є А,т)}\ {я(а є А)Ш-Л1 иЯ(а є А)Ш-ЛХ}}, т = 1, Т/2;

Я(а є А)ШШЛХо = шах{ {Я(а є А,т)} \ {Я(а є А)ШШЛХ и ■■■ и Я(а є А)Ш т = 1, Т/2.

, = 0

Н.В. КРАСНОВА*. С.А. ФИЛИСТ**. О.В. ШАТАЛОВА**

Н.В. Краснова, С.А. Филист, О.В. Шаталова

К информативным признакам отнесем амплитудный джиттер в сегментах В и Э. Под джиттером будем понимать степень вариации (дрожания) интенсивности вейвлет-коэффициентов вдоль оси времени вейвлет-плоскости. Так как фонема И имеет одну или две форманты, то показатель джиттера надо рассчитывать в двух формантах. При наличии только одной форманты, возникает вопрос, каков джиттер отсутствующей форманты? Если примем равным нулю показатель джиттера отсутствующей форманты, то это может ошибочно улучшить интегральный показатель состояния голосового аппарата. Поэтому в качестве второго информативного признака принимаем величину

Х2=тах{Лв, Ло}, (3)

где Лв и Ло - показатели амплитудного джиттера в сегментах В и О вейвлет-плоскости. Для определения амплитудного джиттера в формантах надо разбить сегменты В и О на одинаковые подсегменты в направлении оси времени, что можно выполнить с применением двумерного окна Q(h, п-т), и определить дисперсию их кратковременной энергии. Чтобы этот показатель не зависел от энергии сигнала, его надо пронормировать по энергии форманты. Кратковременную энергию в окне определим:

= і і w2{ak, Ът )(2п (А, 5п - т)

(4)

где Ьн и Ьв - номера строк нижней и верхней границ сегмента; п - номер подсегмента в сегменте; 5 - длина подсегмента;

[1 при А є [А ] и (п -1)5< т < п5 [0 в противном случае Джиттер в сегменте В:

Qn (А, 5п - т) —

N-1 £(* іК- ^

Т + т

і і №‘(а, Ът )

(5)

где К=т^Т/5) - число подсегментов в сегменте; т - левая граница сегмента, Т - длина сегмента. Формулу, аналогичную (5), можно записать и для джиттера в сегменте Э. Третьим информативным признаком является соотношение энергий в сегментах В и Э, которые определяются как знаменатель (5):

і і №2 (а, Ът )

' Т +т

і і №2 (а, Ът )

(6)

Четвертый и пятый информативные признаки характеризуют степень локализации формант. Эти признаки определяются высотами сегментов В и Э. Так как они должны быть выражены в относительных единицах, то высоту сегментов будем нормировать на частотный диапазон вейвлет-плоскости, то есть на величину /в -/н. Численные расчеты этих информативных признаков: X 4 — И, /(/в - /н), X5 — И /(/в - /н). (7)

Чтобы проиллюстрировать связь этих информативных признаков с голосовой патологией рассмотрим рис. 5, на котором показаны вейвлет-плоскости подростков-юношей с «женским голосом» (женским голосом мы называем мужской голос, формантный состав фонемы И которого соответствует формантному составу женского голоса) при патологии и после курса лечения.

Масштабы по обеим осям обеих вейвлет-плоскостей совпадают, поэтому будем использовать безразмерные единицы: /в-/н=10; Н1в=0,5; Н1э=2; Н2в=3; Н2э=4. Следовательно, для класса «здоров» Х4=0,05; Х5=0,2. Для класса «болен» Х4=0,3; Х5=0,4.

Голосовой аппарат каждого пациента может быть охарактеризован 5-компонентным вектором, компоненты которого определяются по вейвлет-плоскости фонемы И. Для экспериментальной проверки эффективности диагностики в выбранном признаковом пространстве воспользуемся дискриминантным анализом в пакете 8ТЛТ18Т1СЛ 6 [1]. Для этого используются функции классификации, предназначенные для определения того, к какому классу наиболее вероятно может быть отнесен каждый объект. Число функций классификации равно числу классов. Каждая функция классификации вычисляется по следующей формуле

Si=Ci+WilX1+Wi2X2+WiзXЗ+Wi4X4+Wi5X5, (8)

где индекс і обозначает класс, а индексы 1, 2,...5 - номер информативного признака; с - константа і-го класса; Wij - веса для j-го информативного признака. Для вычисления функций классификации надо иметь обучающую выборку, обеспечивающую точность классификации. Объем обучающей выборки п

оценивался по методике, принятой в медицинских приложениях [3]. Объект считается принадлежащим к тому классу, для которого получено наибольшее значение функции классификации. Для определения вероятности того, что исследуемый объект принадлежит к данному классу, использовалось расстояние Махалано-биса. По итогам работы диагностического правила проведена проверка достоверности принятого решения (табл.).

Таблица

Результаты диагностики 35 пациентов для каждого класса

Клинический диагноз Результат диагностики Чувствительность Специфичность

Без патологии Функциональная дисфония Органическая дисфония Острое заболевание

Без патологии 32 З - - 91,4 97,1

Функциональная дисфо-ния З 27 5 - 77,1 9З,З

Органическая дисфония - 4 28 З 80 91,4

Острое заболевание - 1 4 30 85,7 97,1

Чувствительность решающего правила определяем как % выражение частоты положительных результатов теста для объектов данного класса (в классе 35 объектов) [2]. Специфичность решающего правила определяем, как % выражение частоты истинно отрицательных результатов у объектов, не принадлежащих к этому классу (в данном случае не принадлежит к данному классу 105 объектов выборки). Общее число ошибок для всех классов составило 23. Общий объем выборки 140 (по 35 из каждого класса). Процент правильного принятия диагностического решения для предложенного метода диагностики составил 84%.

Литература

1. Боровиков В. 8ТАТ18Т1СА. искусство анализа данных на компьютере.- СПб.: Питер, 2003.- 688 с.

2. Омельченко В.П., Демидова А.Л. Практикум по медицинской информатике.- Ростов-на-Дону: Феникс, 2001.- 304 с.

3. Справочник по функциональной диагностике в педиатрии. / Под ред. Ю.Е. Вельтищева, Н.С. Кисляк.- М.: Медицина, 1979.- 624 с.

4. Яковлев А.Н. Основы вейвлет-преобразования сигналов: Уч. пособ.- М.: САЙНС-ПРЕСС, 2003.- 80 с.

Й Филист Сергей Алексеевич окончил Севастопольский приборостроительный институт. В 2003 г. защитил докторскую диссертацию. Профессор кафедры «Биомедицинская инженерия» КГТУ. Автор более 130 научных работ.

Шаталова Ольга Владимировна окончила в магистратуру КГТУ. Аспирант кафедры «Биомедицинская инженерия» КГТУ. Автор более 14 научных работ.

Краснова Надежда Валерьевна окончила КГМУ. С 2001 г. - врач-оториноларинголог в МУЗ «Горбольница №1». Автор 5 научных работ.

УДК 615.84

МЕТОДИКА ВЕЙВЛЕТ-ДИАГНОСТИКИ ДИСФОНИИ ПО ФОНЕМЕ И Н.В. КРАСНОВА*, С.А. ФИЛИСТ**, О.В. ШАТАЛОВА**

Для оценки патологии голоса врачу-фониатру следует использовать частотно-временное картирование сигнала голоса, а в качестве тестового сигнала - фонацию звука И, т.к. он имеет наиболее простую Фурье-структуру из всех гласных русского языка. В качестве частотно-временного преобразования лучше применить вейвлет-преобразование, как имеющее преимущество перед сонограммой при анализе нестационарных сигналов [1].

Цель предлагаемой методики - качественное описание выделенных информативных признаков и их экспертная количест-

* *305006, г. Курск, ул. Димитрова, 61, МУЗ «Горбольница №1»

305040, г. Курск, ул. 50 лет Октября, 94, ГОУ ВПО «КГТУ»; тел./факс: (4712) 50-48-20; Е-таП: [email protected]

Е

2

А=Ан т — (п-1) о

i Надоели баннеры? Вы всегда можете отключить рекламу.