Козаченко Александр Викторович
E-mail: [email protected].
Полонский Юрий Зусьевич
Институт мозга человека им. Н. П. Бехтеревой РАН.
E-mail: [email protected].
19737б, г. Санкт-Петербург, ул. акад. Павлова, 12а.
Тел.: 88122349257.
Suvorov Nikolay Borisovich
Research Institute for Experimental Medicine RAMS.
E-mail: [email protected].
12, Pavlov street, Saint-Petersburg, 197376, Russia.
Phone: +78122340925.
Abramov Valentin Anatolievich
State University of Information Technology, Mechanics and Optics. E-mail: [email protected].
49, Kronverkskiy Av., Saint-Petersburg, 197101, Russia.
Phone: +78122335952.
Kozachenko Alexander Victorovich
E-mail: [email protected].
Polonsky Yuriy Zusievich
Institute of Human Brain named after N.P. Bekhtereva RAS.
E-mail: [email protected].
12a, acad. Pavlov street, Saint-Petersburg, 197376, Russia.
Phone: +78122349257.
УДК 616.74-009.54
И.Б. Старченко, Ю.С. Перервенко, О.С. Борисова, Т.В. Момот
МЕТОДЫ НЕЛИНЕЙНОЙ ДИНАМИКИ ДЛЯ БИОМЕДИЦИНСКИХ
ПРИЛОЖЕНИЙ
Рассмотрены примеры анализа биомедицинских сигналов с использованием методов нелинейной динамики. Рассмотрены два вида сигналов: речевой и электроэнцефалографи-ческий. Показана возможность использования инвариантов нелинейной динамики в качестве информативных показателей.
Нелинейная динамика; биомедицинский сигнал; инвариант.
I.B. Starchenko, J.S. Perervenko, O.S. Borisova, T.V. Momot NONLINEAR DYNAMICS METHODS FOR BIOMEDICAL APPLICATIONS
The examples of analysis of biomedical signals by nonlinear dynamics methods were considered in the article. Two kinds of signals were investigatedл speech signal and EEG. The possibility of applicationof nonlinear dynamics invariant as informative features was shown.
Nonlinear dynamics; biomedical signal; invariant.
Методы обработки сигналов методами нелинейной динамики нашли свое применение во многих сферах науки и техники. Во многих научных статьях и трудах они используются для анализа временных рядов. В данной работе будет рассмотрено две области приложений нелинейно-динамического анализа в биомедицине: применительно к речевым сигналам и электроэнцефалографическим данным.
Многие исследователи предполагали, что достижения в нелинейной динамике, особенно в разработках инструментов анализа хаотичности, могут быть применены в анализе речевых сигналов в области моделирования, кодирования или компрессии [1]. Неоднократно сообщалось об анализе сложных речевых сигналов на размерность [1,2]. Были применены методы анализа динамики нелинейных систем, чтобы исследовать некоторые характеристики речеобразования. Рассмотрены физиологические обоснования фонетической системы речеобразования как меняющейся во времени нелинейной системы.
Были проанализированы физиологические ососбенности речеобразования [3] и выявлены следующие предположения о возникновении нелинейных процессов, происходящих в речевом тракте:
1. Наличие турбулентных потоков в голосовом тракте при произношении гласных или согласных.
2. Нелинейность нервно-мышечных процессов на уровне голосовых связок и гортани.
3. Нелинейные связи могут возникать между различными частями голосового тракта во время воспроизведения речи.
4. Отклик нервно-мышечной системы на раздражители является сильно нелинейным, что подтверждается физиологической реакцией на электрические импульсы; т.е. речеобразование может быть рассмотрено как нелинейный процесс.
5. По физиологическим данным известно, что существует обратная связь в соединениях между нелинейными элементами фонетической системы, что подтверждает ожидание хаотического поведения во время речеобразования.
Нелинейные процессы играют важную роль в речеобразовании, таким образом, можно считать процесс речеобразования нелинейным и, следовательно, анализировать его методами нелинейной динамики. Речевой сигнал рассматривается как скалярная величина, наблюдаемая в системе голосового тракта человека. Можно связать динамические характеристики, оцененные из наблюдаемого временного ряда основной динамической системы во время устойчивого пространственного развития, через теоремы Такенса. Оценки характеристик сигнала из восстановленных речевых траекторий используются в построении нелинейных детерминированных фазово-пространственных моделей наблюдаемого временного ряда. Речевой сигнал был исследован с точки зрения двух динамических инвариантов, а именно, максимального характеристического показателя Ляпунова, корреляционной размерности, в структуре детерминированной динамики [4].
Проблема фазово-пространственной реконструкции из скалярных наблюдений эволюционирующей динамической системы является центральной для задачи оценки ее динамических инвариантов. Восстановленная траектория дает ценную информацию, наглядно отображая особенности динамической системы. Речевая база данных, используемая для анализа, состоит из 3 кардинальных гласных при полярных эмоциональных состояниях (гнев, радость, отвращение, спокойствие). Все фонемы были предварительно отфильтрованы с граничной частотой 4 кГц, используя фильтр нижних частот Баттерворта восьмого порядка, выполнена дискретизация с частотой 44,1 кГц, используя 16-битовую квантизацию. Современные звуковые платы поддерживают частоты дискретизации 8,0; 11,025; 22,05 и 44,1 кГц. Частота дискретизации (оцифровки) сигнала должна быть как минимум в два раза больше максимальной частоты входного сигнала (теорема Котельникова-Найквиста), поэтому частота 44,1 кГц является достаточной для корректной дискретизации и последующего восстановления сигнала. Таким образом, для различных вариантов анализа в общей сложности использовалось 12 фонем.
Чтобы сформировать X матрицы для анализа по методу сингулярного разложения, выбираем ширину окна Т№ = 0,5 мс, которая позволит использовать априорную внедренную размерность I = 9 с целочисленной временной задержкой к = 1. Так как самое высокое значение несущей частоты речи может быть больше, чем I / ТК = 2 кГц, то возможно, что реконструкция не удастся. Выбор ТК согласно критерию, описанному ранее, не позволит сохранить достаточно большой величину I. Если взять граничную частоту пропускания / речи 4 кГц, то получим только 13 отсчетов в окне с дискретизацией 44,1 кГц. В этом случае наибольшая допустимая величина I будет равна 13, что не всегда достаточно, чтобы достигнуть конвергенции набора сингулярных величин. Внедренная размерность т, которая была выбрана как число нормализованных сингулярных величин, находящихся выше уровня шума, находится между 4 и 6 для проанализированного временного ряда фонем.
На рис. 1-3,а-г представлены графики для трех фонем: соответствующий временной ряд, спектр Фурье и фазопространственные реконструкции траекторий, с использованием метода сингулярного разложения и критерия взаимной информации. Три фонемы на рис. 1-3 представляют собой гласные «и», «о» и «у». На рис. 1-3,а представлены 2500-3500 отсчетов временного ряда речевого сигнала, оцифровано с частотой дискретизации 44,1 кГц, что эквивалентно длительности 60-80 мс. На графиках рис. 1-3,б представлены соответствующие спектры Фурье. Двумерные проекции фазопространственных реконструкций траекторий на плоскость 1-2, представлены на рис. 1-3,в.
в г
Рис. 1. Кардинальный гласный звук «и»
, 25 Ось - 1
НИод-—.дБ
-10
-20
-30
-40
1 1 М 1 1 |\ в Сс; 'О 1 1 Г 1 г
м 1 \ к ■ + 25 * - ^
/1 1 \ 1 \ 0 - -
1 \ / 1 \ / 1 -25 - у
~ \( 1 |/ 1 1 1 -1 -50 1 . 1 1
500
/. Гц
1000
-50 -25 0 25 50
х,*дБ
Рис. 2. Кардинальный гласный звук «о»
в г
Рис. 3. Кардинальный гласный звук «у»
б
а
в
г
б
а
Для кардинального гласного «и» (рис. 1) период между максимумами составляет 100 отсчетов. Таким образом, спроецированная траектория рис. 1,в содержит около 36 петель. На рис. 1,б видны две значимые частоты в спектре. Они составляют приблизительно круглую форму основного витка восстановленной траектории (рис. 1,в). Заметим, что траектория никогда точно не повторяет себя. Отслеживание этой незначительной изменчивости даже в «периодическом» произнесении важно для репродуцирования естественности речи.
Для кардинального гласного «о» (рис. 2) период между максимумами составляет 80 отсчетов. В спектре имеется три максимума, которые образуют 30 петель в каждом цикле траектории (рис. 2,в).
Для кардинального гласного «у» (рис. 3) в спектре имеется две значимые частоты и одна гораздо меньшая. Период между максимумами составляет 150 отсчетов. Имеется гармоника с частотой приблизительно в 2 раза выше основной. Таким образом, в пределах основной петли спроецированной траектории (рис. 2.8,в), появляется еще одна небольшая петля, составляющая приблизительно одну пятую главной петли.
Отображение Пуанкаре представляет собой удобный метод анализа сложной геометрии колебательных режимов. Применяется для визуального анализа хаотической динамики в фазовом пространстве размерности т > 3. Для фазового пространства размерности т говорят о сечении т-мерного фазового пространства гиперповерхностью размерности т-1. В последнее время процедура построения отображения Пуанкаре перестала быть уделом теоретиков и часто применяется как один из инструментов при экспериментальном исследовании динамики нелинейных систем. При использовании метода секущей Пуанкаре размерность векторов состояния, уменьшается на единицу. Поэтому метод может применяться для понижения размерности фазового пространства, чтобы облегчить определение динамики хаоса. Для построения отображения Пуанкаре используются значения максимумов из выборки данных зарегистрированного сигнала, которые формируются из последовательных периодов Ati временного ряда [5]. Периоды определяются как временные интервалы между положительными максимумами исследуемой выборки.
По характеру распределения точек на отображении Пуанкаре можно предложить следующий классификатор для определения эмоционального состояния (рис. 4, колонка 4). Опишем характер распределения точек на отображениях Пуанкаре.
1. Состояние спокойствия - распределение точек равномерно, точки находятся на приблизительно одинаковом расстоянии друг от друга (рис. 4,а).
2. Состояние радости - наблюдается скопление точек, которые образуют ветви, расходящиеся от центра скопления в третью четверть (рис. 4,б).
3. Состояние гнева - наблюдается скопление точек в центре и расходящиеся ветви подковообразной формы, создающие очертание пятиугольника (рис. 4,в).
4. Состояние отвращения - скопление точек в горизонтальной плоскости (рис. 4,г).
Эмоциональное состояние спокойствия - скопление точек представляет собой восходящий эллипс, «гнев» - круг, «радость» - скрещенный нисходящий и восходящий эллипсы, «отвращение» - широкий горизонтальный эллипс.
Вывод: для разных гласных выявлено схожее поведение точек на отображении Пуанкаре для определенной эмоции, что может служить классификационным признаком эмоции.
Рис. 4. Отображение Пуанкаре для ударных гласных: 1 - «у»; 2 - «о»; 3 - «и»; 4 - классификатор для эмоциональных состояний: а - «спокойствие»; б - «радость»; в - «гнев»; г - «отвращение»
Ведущим методом оценки электроэнцефалограмм в функциональной диагностике является визуальный метод, но это не исключает необходимости разработки и применения статистических методов анализа, позволяющих снабдить нейрофизиолога информацией, дополняющей визуальную оценку. С этим тесно связана и задача автоматизации обсчета отдельных аспектов ЭЭГ, что ускоряет и уточняет постановку врачом диагноза. К настоящему времени разработано большое количество методов анализа электроэнцефалографических данных. Спектральный и корреляционный анализы являются основными методами обработки ЭЭГ. На практике оказывается, что эти методы врачами в полной мере не используются. В основном врач оценивает ЭЭГ визуально, сравнивая сигнал по каждому из симметричных отведений. С вышесказанным связана актуальность поиска альтернативных методов анализа ЭЭГ, которые позволили бы более дифференцированно описывать органические изменения в работе мозга с учетом сильной индивидуальной вариабельности сигнала ЭЭГ. Регистрируемые типы электрической активности мозга указывают на то, что ЭЭГ содержит периодические, квазипериодические и хаотические колебания.
Понимание природы детерминированных хаотических процессов необходимо прежде всего для того, чтобы ими управлять или предсказывать (с какой-то вероятностью) их эволюцию. В последнее время выяснилось, что наложение слабой обратной связи на систему может привести к трансформации хаотического сигнала в регулярный во времени. Оказалось, что управлять хаотическими системами в этом смысле даже проще, чем детерминированными. Это очень важно в прикладной биологии, потому что в режиме управляемого хаоса работает наш мозг [5].
С учетом вышесказанного для анализа ЭЭГ-сигналов представляется актуальным использование методов нелинейной динамики. Применение нелинейнодинамического подхода позволит оценить, как функционирует исследуемая система: регулярно или нет, если нерегулярно, то в какой степени; а, кроме того - насколько сложна ее динамика. Используя одномерные временные ряды участков
нативного ЭЭГ сигнала, были построены аттракторы для симметричных отведений С3, С4-А2, которые представлены на рис. 5-7.
По осям графиков отложен зарегистрированный экспериментально в виде уровня напряжения нативной ЭЭГ мембранный потенциал сомы возбудительных клеток кортекса кг с задержкой во времени т, определенной как первый ноль авто-корреляционой функции сигнала.
Ье^+'О-Ье^-т), мкВ Ье(И-Т1)-Ье(1-Т1),
Рис. 5. Аттракторы нативных ЭЭГ сигналов на фазовой плоскости для диагноза «невралгия»: а - левое полушарие; б - правое полушарие
Ье(1:+т)-Ье(1-т)5 мкВ Ье^+хО-Ье^-Т]),
Рис. 6. Аттракторы нативных ЭЭГ сигналов на фазовой плоскости для условно здорового пациента: а - левое полушарие; б - правое полушарие
1іе(1+т)-1іе(1-т), мкВ 1іе(1+Ті)-1іе(1;-Ті),
Рис. 7. Аттракторы нативных ЭЭГ сигналов на фазовой плоскости для диагноза «рассеянный склероз»: а - левое полушарие; б - правое полушарие
Анализируя рис. 5-7, можно сделать следующие выводы. На рис. 5 четко прослеживаются межполушарные отличия: для правого полушария ось аттрактора наклонена вправо, для левого - влево. Можно предположить, что чем «здоровее» пациент, тем запутанней буду выглядеть траектории аттрактора (рис. 6).
Для пациентов с различными патологиями, например, рассеянный склероз, (рис. 7) оба аттрактора имеют сложный вид, однако, правый аттрактор более упорядочен, что может свидетельствовать о локализации очага заболевания.
Одной из важнейших количественных характеристик хаотических процессов является характеристический показатель Ляпунова (Я). Как уже говорилось, в пределах аттрактора небольшие изменения начальных условий могут приводить к сильным изменениям в эволюции системы. Характеристический показатель Ляпунова может являться мерой того, насколько сильны могут быть эти изменения. Чем чувствительнее система к начальным условиям, тем он больше. Поскольку в п-мерном фазовом пространстве есть п независимых направлений, то систему характеризуют п характеристических показателей Ляпунова.
Характеристический показатель Ляпунова может быть как положительным, так и отрицательным. Все характеристические показатели Ляпунова детерминированного процесса отрицательны или равны нулю; у хаотических процессов хотя бы один (старший) положителен. Результаты расчетов набора характеристических показателей Ляпунова показаны на рис. 8.
Аа, С-1 0.3
0.2
0.1
0
-0.1
-0.2
-0.3
-0.4
-0.5
-0.6
-0.7
-0.8
-0.9
2
3
Рис. 8. Набор характеристических показателей Ляпунова, г - номер показателя.
Применены следующие условные обозначения:
♦ Невралгия до операции
■ Рассеянный склероз
• Условно здоровые
# Игроки
Следует оговориться, что на рис. 8 приведены три показателя, хотя расчет проводился для разного количества, в соответствии с определенной заранее внедренной размерностью методом ближайших «ложных соседей» [7]. Диапазон значений г составил от 3 до 9, поэтому для единообразия представления оставлены три первых значения. Диагностическое значение имеет только первый (старший, максимальный) показатель Ляпунова, и не столько его абсолютная величина, а знак - положительный или отрицательный.
Основной вывод, который может быть сделан из данных исследований: так как первая экспонента характеристического показателя Ляпунова положительная, то в системе присутствует хаос. Что касается абсолютных значений максимального характеристического показателя Ляпунова, то можно сказать, что он не показывает значительной вариабельности для набора исследуемых случаев. Для условно здоровых пациентов величина А1 немного выше, чем для пациентов с различными заболеваниями, в среднем на 0,1 с-1. Это говорит о большей степени хаотичности сигнала для мозга в условно здоровом состоянии.
Таким образом на примере двух видов сигналов - речевого и электроэнцефа-лографического - показано, что методы нелинейной динамики могут выступать в качестве дополнительного инструмента в медико-биологических исследованиях.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Kumar A. Role of Deterministic Chaos in Signal Modelling // Dept. of Electrical Engineering, I.I.T., Kanpur, India, M. Tech. thesis. - No. 90/216 MT (March 1990).
2. Kumar A., Mullick S.K. Nonlinear dynamical analysis of speech // J. Acoust. Soc. Am., Vol. 100, No. 1, July - 1996. - P. 615-629.
3. Перервенко Ю.С., Старченко И.Б. Акустические и физиологические нелинейности речевого тракта и метод их регистрации // Акустика речи. Сборник трудов XIX сессии Российского акустического общества. - М.: ГЕОС, 2007. - Т. III. - С. 36-39.
4. Перервенко Ю.С., Старченко И.Б. Эмоциональная речь: детерминированный хаос или нелинейный случайный процесс? // Известия ЮФУ. Технические науки. - 2007. - № 1 (78). - С. 100-101.
5. Hegger R., Kantz H., Schreiber T. Practical implementation of nonlinear time series methods: The TISEAN package, CHAOS 9, 413 (1999).
6. Глебов Р.Н. Мозг, синапсы и передача информации. - М.: Знание (серия "Биология", № 4), 1984.
7. Борисова О.С., Душенин Д.Ю. Показатели нелинейной динамики компьютерной ЭЭГ как диагностические признаки // IV Всероссийская научная конференция молодых ученых, аспирантов и студентов «Информационные технологии, системный анализ и управление». - Таганрог: Изд-во ТТИ ЮФУ, 2008. - С. 64-66.
Старченко Ирина Борисовна
Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.
E-mail: [email protected].
347928, г. Таганрог, пер. Некрасовский, 44.
Тел.: 88634371795.
Перервенко Юлия Сергеевна
E-mail: [email protected].
Борисова Ольга Сергеевна
E-mail: [email protected].
Момот Татьяна Валерьевна
E-mail: [email protected].
Starchenko Irina Borisovna
Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education “Southern Federal University”.
E-mail: [email protected].
44, Nekrasovskiy, Taganrog, 347928, Russia.
Phone: +78634371795.
Perervenko Julia Sergeevna E-mail: [email protected].
Borisova Olga Sergeevna
E-mail: [email protected].
Momot T atyana Valerievna
E-mail: [email protected].
УДК 004.415.2
А.М. Унакафов, О.А. Лушняк
ИССЛЕДОВАНИЕ МОДЕЛИ ДИНАМИКИ КОЖНО-ГАЛЬВАНИЧЕСКИХ РЕАКЦИЙ НА БОЛЕВЫЕ РАЗДРАЖИТЕЛИ
В настоящей работе проводится экспериментальное исследование предложенной модели кожно-гальванических реакций на раздражители.
Кожная проводимость; электрические стимулы; габитуация.
A.M. Unakafov, O.A. Lushnyak RESEARCH OF THE GALVANIC SKIN RESPONSES TO DISCOMFORT ELETROSTIMULI DYNAMIC MODEL
This article is a continuation of the paper «Mathematical model of galvanic skin responses to painful stimuli». The paper is devoted to practical research of the offered model of the galvanic skin responses to electric shock dynamic.
Skin conductance response; electric shock; habituation.
Настоящая работа посвящена исследованию модели, предложенной в статье «Математическая модель кожно-гальванической реакции на болевые раздражители», публикуемой в текущем номере журнала.
Для оценки кожно-гальванических реакций (КГР) на серию из n болевых раздражителей, подаваемых в моменты времени tt, предлагается использовать функцию SR (t), вычисляемую по следующей формуле:
Sr (t) =
0, t £ и(?; + Т0 + /Дт + 1)..(?г- + т0 + /Дт + Т)
1=1
А)е-V(/—1)Нр^ _ t. — Т0 -/Дт), t е и(ti + т0 + /Дт +1)..(^ + т0 + /Дт + Т)
1=1
где т0 + /Дт - оценка задержки (т.е. длительности латентного периода) реакции на /-й раздражитель, Т - оценка длительности реакции на /-й раздражитель, \e~-l (/—1)Н - оценка амплитуды реакции на /-й раздражитель; вектор
Рг = ( ^ (1),..., ^ (Т))т задает форму КГР; т0 - оценка задержки, а А0 - амплитуды
начальной (первой) реакции на раздражитель; Н - характеристика скорости изменения амплитуды, а Дт - задержки реакций в связи с привыканием к действию раздражителя.
В ходе проведения исследований для измерения КГР использовался программно-аппаратный комплекс «ИНТЭНС» [3]. Он обеспечивает измерение кож-