Ч УПРАВЛЕНИЕ В МЕДИЦИНЕ И БИОЛОГИИ
УДК 004.383.8.032.26; 004.93.1 М:10.15217/1Б8П1684-8853.2015.1.85
ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ ИМПУЛЬСНЫХ РЕКУРРЕНТНЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ АНАЛИЗА ЭЛЕКТРОКАРДИОГРАММ
Е. Н. Бендерскаяа, канд. техн. наук, доцент К. В. Никитина, канд. техн. наук, ассистент
аСанкт-Петербургский политехнический университет, Санкт-Петербург, РФ
Цель: разработка системы распознавания динамических образов с использованием нового подхода на основе ре-зервуарных вычислений. Результаты: распознавание динамических образов определяется как выявление патологических состояний сердца пациента — аритмий по изменяющемуся сигналу его электрокардиограммы. В качестве примера рассматриваются два типа аритмий — суправентрикулярная и вентрикулярная. Предложен новый эффективный метод решения поставленной задачи на основе модели машины неустойчивых состояний, состоящей из импульсной рекуррентной нейронной сети и считывателей. Представлен процесс решения задачи распознавания электрокардиограмм. Демонстрируется на понятном примере специфика используемого подхода: представление данных в импульсной форме, работа импульсной нейронной сети, считывание данных и принятие решения — классификация. В качестве исходных данных используется база данных ЭУйБ по аритмиям из свободного ресурса РЬуэ1опеЬ Рассчитываются показатели качества распознавания и сравниваются с показателями, полученными при использовании наиболее известных альтернативных методов. Практическая значимость: предложенный метод на основе машины неустойчивых состояний позволяет повысить качество решения задач распознавания динамических образов разнообразной природы по сравнению с классическими методами.
Ключевые слова — импульсные нейроны, рекуррентные нейронные сети, распознавание динамических образов, электрокардиограмма.
Введение
Несмотря на то что теория распознавания образов развивается с 70-х годов прошлого века, все еще существует много нерешенных задач, относящихся к этому направлению. Особенно это касается случая динамических образов, которые в отличие от статических образов зависят от времени и, таким образом, имеют одно дополнительное измерение. Для устранения возникающей сложности в большинстве подходов предлагается перейти от динамического образа к статическому путем формирования некоторого набора признаков. Новым статистическим подходом к извлечению признаков динамического сигнала является использование рекуррентных нейронных сетей (РНС) в составе системы, реализующей парадигму резервуарных вычислений [1, 2]. Использование данного подхода, как будет показано дальше, позволяет повысить качество распознавания по сравнению с классическими решениями.
Одним из приложений теории распознавания динамических образов являются задачи диагностики динамических систем. Их состояние представляет собой набор изменяющихся во времени непрерывных сигналов или последовательностей. Примером такой задачи выступает медицинская диагностика заболеваний и патологий сердечно-сосудистой системы человека по
записям его электрокардиограммы (ЭКГ). В настоящее время распознавание ЭКГ с помощью компьютерных алгоритмов используется только для первичной диагностики пациента, а окончательная расшифровка ЭКГ выполняется врачом. Одной из главных причин этого является как раз недостаточное качество распознавания. Поэтому усовершенствование системы распознавания динамических образов на примере ЭКГ позволит автоматизировать и тем самым ускорить процесс медицинской диагностики.
Постановка задачи распознавания ЭКГ
Рассмотрим особенности, связанные с задачей распознавания ЭКГ — графического представления разности потенциалов, формирующейся в результате работы сердца. В ходе анализа ЭКГ выявляются различные нарушения ритма, определяется их тип и предполагаются различные причины, с которыми эти нарушения могут быть связаны. Наиболее распространенным нарушением ритма является аритмия. При аритмии происходит нарушение частоты, ритмичности и последовательности возбуждения и сокращения сердца. В зависимости от нарушенной функции сердца выделяют три группы аритмий, в каждой из которых выделяют несколько типов и подтипов. Каждый тип аритмии характеризуется своим уникальным внутренним рисунком. Однако
несмотря на это, ряд обстоятельств затрудняет постановку точного диагноза:
— у каждого человека рисунок аритмии может немного отличаться;
— различные патологии могут накладываться друг на друга и изменять общий рисунок;
— при суточном мониторинге сигнал ЭКГ может быть сильно зашумлен;
— очевидные патологии могут быть видны сразу, однако предпатологические состояния могут оставаться незаметными.
Для настройки, обучения и оценки качества разрабатываемых систем автоматического распознавания ЭКГ используются специальные медицинские базы данных ЭКГ [3]. Процесс подготовки такой базы включает в себя запись сигнала ЭКГ с некоторой частотой дискретизации, разбиение всей ЭКГ на секции. Каждая секция характеризует одно биение сердца и анализируется врачом-специалистом для маркировки своим классом («здоров», «аритмия типа 1», «аритмия типа 2» и т. д.). На рис. 1 показан пример фрагмента ЭКГ, снятой с двухканального регистрирующего прибора с частотой дискретизации 128 Гц и разбитой на секции, каждая новая секция на графиках отмечена ромбом. Между графиками отображается тип биения для каждой секции. В примере показаны три типа биения: нормальное (К), суправентрикулярное преждевременное (Я) и вентрикулярное преждевременное (V). Задачей распознающей системы является определение типа биения по двухканальному сигналу ЭКГ. Несмотря на кажущуюся различимость указанных типов биений, на всем множестве имеющихся экспериментальных данных сигналы ЭКГ, соответствующие биениям, имеют множество вариаций по форме, и отличить их друг от друга довольно сложно. При формировании обучающей и тестовой выборок вначале составляются пары «вход-желаемый выход» вида П1 = (X1, У1), где X1 — значения сигнала ЭКГ с ¿-й секции;
1170 1171 1172 1173 1174 1175 1176 1177 1178 1179 1180 SNSNSNVNNN
10 0
-20 г
-301______]_______[_______[______]_______]_______[______]_______]_______[______] г, с
1170 1171 1172 1173 1174 1175 1176 1177 1178 1179 1180
■ Рис. 1. Разбиение участка ЭКГ на секции и их маркировка
Y — тип или класс биения для l-й секции. Поскольку секция представлена множеством значений сигналов ЭКГ во времени, то xl является также набором векторов значений сигналов ЭКГ в различные моменты времени: X1 = {xl(T), х1(2Т), ..., xl(NlT)}, где Т — период квантования, а N — число значений моментов времени для l-й секции. Nl может варьироваться в зависимости от частоты пульса пациента, а также от других факторов, например от пропуска биения. Класс биения i-й секции Y принимает дискретные значения от 1 до P, где P — число классов. Все пары объединяются в общее множество П = {П1, П2, ..., ПаН}. Затем это множество П может быть разбито различными способами на два непересекающихся подмножества: обучающее П1га1п и тестовое П4ев4.
Задача распознавания формально может быть определена следующим образом. По обучающему множеству Пгга1п необходимо синтезировать такую систему распознавания, которая на тестовом множестве ПШ1 обеспечит минимальную ошибку классификации. Процедура синтеза распознающей системы сводится к поиску наилучшей конфигурации алгоритмов выделения признаков, классификаторов-аппроксиматоров, а также их параметров в смысле обеспечения минимального значения ошибки на сформированных тестовых выборках.
Описание модели
Для выделения динамических признаков из изменяющегося сигнала ЭКГ предлагается использовать подход на основе резервуарных вычислений (РВ) [1]. Резервуар представляет собой динамическую систему, интегрирующую в своем состоянии предысторию — информацию о предыдущих входных сигналах [4]. Поэтому из текущего состояния резервуара можно извлечь полезную информацию о динамическом образе — ЭКГ и решить задачу распознавания — диагностики аритмии. По сравнению с другими известными решениями задачи на базе нейросетевых подходов [5, 6] при использовании РВ в одной системе решаются сразу две задачи: выделение информационных признаков (в том числе и за счет внутренней реконструкции ЭКГ внутри резервуара) и последующая их обработка с формированием решения (за счет работы считывателей, в качестве которых могут быть использованы известные классификаторы). Упрощение системы РВ до считывателей приводит к системам классических вычислений.
Одной из моделей РВ является модель МНС, предложенная Маассом [4], название которой дословно переводится как машина неустойчивых состояний (Liquid State Machine — LSM). В ней резервуар представлен импульсной [7] РНС.
Динамика импульсной РНС в ответ на входной сигнал похожа на динамику воды в стакане после некоторого возмущения — затухающие распространяющиеся волны. Автором модели математически строго доказано, что модель МНС при идеализированных условиях обладает универсальными вычислительными возможностями. МНС структурно представляет собой резервуар в форме импульсной РНС, последовательно соединенный со специальными устройствами — считывателями (рис. 2).
Входные сигналы на входе резервуара представлены векторной непрерывной функцией В ответ на эти сигналы резервуар с некоторой задержкой по времени переходит в новое состояние XM(t). Затем это состояние подается на вход считывателей, выходы которых являются выходами всей системы и представлены векторной непрерывной функцией Y(t). Так как считывающее отображение не имеет памяти, вся информация о входах ui(s), s < t, должна содержаться во внутреннем состоянии XM(t). Подробное описание и анализ всех составляющих МНС приведен в работе [8], поэтому коснемся лишь некоторых основных моментов.
Преобразование из и@) в XM(t), осуществляемое в резервуаре, можно определить через некоторый оператор (фильтр) LM: Хм(^ = ^-^Щ^)) или систему нелинейных нестационарных дифференциальных уравнений: йХм/^ = FL(U(t), Хм(0, {). МНС состоит из считывателей и РНС, которая структурно организована в форме трехмерной решетки из ппгп импульсных нейронов со случайными связями. В качестве импульсных моделей используются модели типа «интегрирование и возбуждение» и нейрон Ижикевича [9]. Связи представлены «электрическими» и «химическими» синапсами. Определенное число нейронов, составляющее рык от их общего числа, произвольно назначаются подавляющими, остальные нейроны выбираются возбуждающими. Связи между нейронами формируются на основе их взаимного расположения на решетке. Вероятность связей между двумя нейронами определяется по формуле Р(а, Ь) = шт[1, С(а, Ь) • ехр(-(Б(а, Ь)/Х)2)], где
Входной сигнал Выходной сигнал
Щ) = [и^), ..., пМи(П] Y(t) = [^(0, ..., уМу(г)]
■ Рис. 2. Схема машины неустойчивых состояний
буквами а и Ь обозначаются два нейрона; С(а, Ь) — постоянная, зависящая от типов взаимодействующих нейронов (возбуждающий или подавляющий), С(а, Ь) < 1; Б(а, Ь) — евклидово расстояние между нейронами. Параметр X управляет числом связей и средней длиной связи между нейронами. Каждый из входов РНС случайно соединен с определенным числом ее нейронов риП.
Основная специфика МНС заключается в том, что внутри нее — в РНС — информация передается и обрабатывается в импульсной форме. В связи с этим необходимо выполнять прямое и обратное преобразование между импульсной и аналоговой формой.
Считыватели — устройства, предназначенные для анализа динамики резервуара (РНС) и решения конкретных прикладных задач — классификации, аппроксимации и др. Считыватели могут реализовывать:
— предобработку выходного сигнала РНС (преобразование информации из импульсной формы в аналоговую; сокращение размерности выходного сигнала);
— анализ выходного сигнала РНС (определение типа динамики, вычисление различных показателей — статистических, информационных, динамических, частотных);
— решение конечной задачи классификации, аппроксимации и др.
При решении конечной задачи для контроля используется набор показателей качества: вероятности правильной/неправильной классификации, ошибки аппроксимации, различные индексы кластеризации. Можно выделить следующие основные особенности, связанные с использованием считывателей:
— сигнал с выхода импульсной РНС является многомерным и импульсным, поэтому вначале осуществляются преобразования этого сигнала в аналоговую форму;
— анализаторы динамики сигнала могут быть использованы при выборе надлежащего алгоритма преобразования импульсного сигнала. Они позволяют определить временной масштаб, скорость изменения сигнала и потом с наименьшими потерями перейти от импульсного сигнала к аналоговому;
— к набору признаков может быть применена процедура сокращения размерности, что позволяет исключить из рассмотрения слабо влияющие признаки и избежать проблемы «проклятия размерности»;
— выбор наилучшей комбинации считывателей осуществляется на основании анализа показателей качества решения конечной задачи.
Остановимся подробней на одной из подзадач считывателей, упомянутой выше и связанной с нормализацией входных образов во временном
диапазоне. Это важно из-за специфики обрабатываемых образов ЭКГ. Длительность секций может различаться в зависимости от частоты сердцебиения. Ввиду затухающей памяти, которой обладает импульсная РНС, нет смысла подавать на ее вход образы, которые длятся дольше, чем глубина ее памяти, поскольку к моменту считывания она забудет начальную часть образа.
Для реализации процедуры нормализации определяется средняя глубина памяти РНС и задается время образа гпогт. Если время представления входного образа больше (меньше) этих значений, следует сжать (растянуть) входной образ во времени до гпогт. С математической точки зрения процедура сжатия (растяжения) во времени является очевидной — при интервальной форме задания все границы всех временных интервалов следует умножить на константу, определяющую коэффициент сжатия (растяжения).
Методика решения задачи
Для успешного решения задачи распознавания динамических образов с помощью МНС использовалась методика синтеза импульсных РНС в составе МНС [10]. Она предусматривала выполнение ряда шагов.
1. Анализ задачи (входных данных). На данном шаге в зависимости от типа, размерности, сложности входных данных определяется форма их подачи на вход РНС (импульсная или непрерывная), а при необходимости — алгоритм преобразования данных в импульсную форму, выполняется нормализация данных во временном диапазоне и формируется набор обучающих и тестовых примеров.
2. Синтез резервуара. На данном этапе приводятся рекомендации по выбору типа и задания значений всех параметров импульсной РНС. Эти рекомендации составлены на основе экспериментального исследования. Среди основных определяемых параметров — число входов РНС, число нейронов ппгп резервуара, вероятность связи между входами и нейронами резервуарарик, процент подавляющих нейронов ры}1, средняя длина связей X, плотность связей (матрица С). По этим параметрам случайным образом генерируется структура РНС. Затем в соответствии с рекомендациями задается тип нейронов, синапсов, сила связей между входами (матрица Wvh), а также сила связей между нейронами (матрица Wint), задержки и параметры нейронов и синапсов. В конечном итоге в соответствии с рекомендуемыми значениями параметров формируется резервуар — импульсная РНС, на вход которого будут подаваться входные сигналы.
3. Выбор считывающих модулей. Последовательность выбора считывателей можно предста-
вить следующим образом. Вначале определяется время считывания и выбирается алгоритм преобразования из импульсной формы в непрерывную. Затем выбирается алгоритм сокращения размерности числа признаков и алгоритм решения конечной задачи (классификации, аппроксимации и др.).
4. Оценка качества распознавания. После решения задачи распознавания качество оценивается с помощью процедуры кросс-валидации. В случае, если полученное качество распознавания не устраивает, можно вернуться на один из предыдущих этапов и выполнить одно из следующих действий: увеличить число обучающих примеров, повысить их репрезентативность; изменить способ подачи, представления, предобработки входных данных; сгенерировать новый резервуар с теми же параметрами или немного изменить параметры резервуара; изменить параметры считывателей.
С применением этой методики осуществлялось решение задачи распознавания ЭКГ.
Результаты синтеза РНС и распознавания электрокардиограмм
В качестве исходных данных использовался набор баз данных аритмий MIT-BIH [11], свободно распространяемый в рамках проекта PhysioNet [3]. Одна из задач, представленная в базе данных SVDB (Supraventricular Arrhythmia Database), — выявление суправентрикулярной и вентрикуляр-ной аритмий. Эта база данных содержит 94 30-минутных записей ЭКГ (с двух датчиков) с аннотациями биений и их свойств (норма, аритмия). Пример фрагмента таких записей показан на рис. 1.
Для решения тестовой задачи в рамках предлагаемой методики выбирался способ подачи данных на вход резервуара, синтезировался резервуар, определялись параметры считывателей.
Поскольку данные ЭКГ снимаются с двух каналов, то исходная размерность входного сигнала равна двум: nln = 2. Для подготовки набора обучающих и тестовых примеров из разных ЭКГ были взяты секции с биениями, соответствующими разным классам — нормальным биениям и биениям с аритмией по 100 примеров каждого типа (всего Nall = 200 примеров). Средняя длительность одного биения — 1 с. Глубина памяти импульсной РНС меньше, поэтому производилась нормализация входного сигнала во временном диапазоне. В результате все примеры были приведены к такой форме, что каждый из них длился tnorm = 0,3 с. Один из вариантов такой нормализации показан на рис. 3. Для подачи примеров на вход импульсной РНС они были преобразованы из непрерывной формы в импульсную. В качестве алгоритма преобразования использовался пространственно-временной алгоритм на основе рецептивных полей:
я
<й §
^ 3 н Й ч й
м ^ § и
% о
10
5 0 -5 -10
ь г-'-Ч
г
1
10
5 0 -5 10
Р
0 0,2 0,4 0,6 г, с 0 0,1 0,2 0,3 г, с
я
10
5 0
-5
4 2-10
оз
г
V
10
5 0 -5 10
0 0,2 0,4 0,6 г, с 0 0,1 0,2 0,3 г, с
■ Рис. 3. Пример нормализации во временном диапазоне исходного входного сигнала (слева — исходные сигналы, справа — после нормализации во времени)
а2
д
о 4
х я 6
а 8
мер10
3 12
14
16
0,3 г, с
■ Рис. 4. Иллюстрация процесса преобразования исходного фрагмента ЭКГ из рис. 3 в импульсную форму для подачи на вход импульсной РНС
каждый аналоговый сигнал преобразуется в множество кх импульсных сигналов (в примере кх = 8).
В результате пп = 2-мерный непрерывный сигнал был преобразован в п= 16-мерный импульсный сигнал (рис. 4). Минимальный период импульсов Тш1п = 0,1 с.
Поскольку выявление аритмии является сложной задачей, то в соответствии с методикой было предложено использовать резервуар из нейронов Ижикевича. В целях сравнения качества распознавания были также проделаны эксперименты с резервуаром из нейронов 1аЕ [7, 9]. Параметры резервуара из нейронов Ижикевича включали: возбуждающие нейроны — типа ИЯ; подавляющие нейроны — типа ЕЯ; число нейронов ппгп = 125 (решетка 5x5x5); X = 2; рыц = 20 % нейронов пода-
вляющие; С =
каждый из п
0,4 0,4 0,2 0,4 = 16
Щт =
0,001 0,01 0,01 0,015
входов случайно связан
с р= 10 % нейронов; силы химических синапсов от входов к подавляющим и возбуждающим = Кц^вт) = 0,01 постоянная
нейронам и
vh(chem)
времени т8уп = 3 мс для всех химических синапсов, кроме синапсов от подавляющих нейронов — для
них т = 6 мс; задержка во всех химических синапсах одинакова — х4е1ау = 1 мс. Параметры резервуара из нейронов 1аЕ отличаются матрица-
ми: С =
0,1 0,4 0,2 0,3
^¿пг =
0,02 0,01
0,01 0,05
В результате анализа реакции РНС были определены следующие параметры считывателей. Время считывания равно моменту времени, соответствующему окончанию подачи двух третей образа, т. е. ггеааоиг = 100 мс. Алгоритм преобразования из импульсной формы в непрерывную выбран на основе преобразования каждого импульса в затухающую экспоненту с постоянной времени ъшМои) = 10 мс. Были рассмотрены два варианта сочетания алгоритма сокращения размерности и классификатора:
— алгоритм РСА, псотр = 2(3) компоненты и байесовский классификатор;
— классификатор к-ММ без сокращения размерности.
В ходе проверки работы МНС образы подавались по очереди (нормальный и с аритмией) в два цикла. Вначале решалась простая задача с 12 вариантами ЭКГ. к-ММ-классификатор, используя в качестве обучающих первые два образа, успешно распознал все следующие 10 образов. Также без ошибок справился с задачей и обычный байесовский линейный классификатор при использовании двух главных компонент (125 сигналов с нейронов использовать нельзя в силу невозможности получить удовлетворительную ковариационную матрицу). После этого решалась задача со всеми 200 образами: 70 % образов были случайно выбраны обучающими, а остальные 30 % — тестовыми. Качество распознавания оценивалось с помощью вероятностей правильного распознавания для случая нормального биения рП2огт и аритмии В таблице приведены ре-
зультаты качества распознавания исследуемой
Алгоритм распознавания погт Рг2 рТЬт,%
Структурный 85,9±3,6 74,5±6,5
Статистический, признаки — сам сигнал 78,2±0,0 76,1±0,0
Статистический, признаки — быстрое преобразование Фурье 84,4±2,4 74,5±5,0
Статистический, признаки — вейвлеты 87,1±2,6 72,3±3,3
Статистический, с помощью резервуара — импульсной РНС из 1аЕ нейронов 85,4±2,2 75,8±1,2
Статистический, с помощью резервуара — импульсной РНС из нейронов Ижикевича 88,0±1,1 81,4±1,7
системы с помощью МНС и применением классических подходов при одних и тех же условиях и входных данных [12].
Вероятности правильного распознавания приведены в форме «математическое ожидание ± среднеквадратичное отклонение». Из таблицы следует, что лучше всего с поставленной задачей справилась система распознавания на основе МНС с резервуаром в форме импульсной РНС из нейронов Ижикевича. Качество распознавания нормальных биений выше наилучшего (наихудшего) из классических методов на 1 % (10 %), а биений с аритмией — на 5 % (9 %).
Заключение
Как следует из приведенных результатов, теоретически обоснованные возможности РНС в рамках парадигмы РВ достаточно хорошо согласуются с результатами их применения при решении реальных практических задач — распознавания аритмий по ЭКГ. Использование нового подхода позволяет повысить качество распознавания даже по сравнению с проблемно-ориенти-
Литература
1. Schrauwen B., Verstraeten D., Campenhout J. V. An
Overview of Reservoir Computing Theory, Applications and Implementations // Proc. of the 15th European Symp. on Artificial Neural Networks. 2007. P. 471-482.
2. Бендерская Е. Н., Никитин К. В. Рекуррентная нейронная сеть как динамическая система и подходы к ее обучению // Научно-технические ведомости СПбГПУ. Информатика. Телекоммуникации. Управление. СПб.: Изд-во Политехн. ун-та, 2013. № 4(176). C. 29-40.
3. PhysioNet: The Research Resource for Complex Physiological Signals. http://www.physionet.org (дата обращения: 01.04.2014).
4. Maass W., Natschiager T., Markram H. Real-Time Computing without Stable States: A New Framework for Neural Computations Based on Perturbations // Neural Computation. 2002. Vol. 11. P. 2531-2560. doi:10.1162/089976602760407955
5. Пат. US20130345580 A1, US. Reconstruction of a Surface Electrocardiogram from an Endocardial Electrogram Using Non-linear Filtering/ Fabienne Porée (FR). — N 14/015,770; заявл. 30.08.2013; опубл. 26.12.2013.
6. Пат. CN102129509 A, CN. Coronary Heart Disease Self-diagnosis System Based on Electrocardiographic
рованными методами. Действительно, качество распознавания системы распознавания на основе МНС выше наилучших вариантов использования классических структурных и статистических подходов на 5 %. Отсюда явно вытекает перспективность использования предлагаемого подхода при решении новых задач распознавания динамических образов, для которых сама природа и свойства образов являются мало или совсем не изученными.
Несмотря на полученные положительные результаты, еще есть много задач, требующих решения: выбор оптимального алгоритма кодирования входных и декодирования выходных импульсных образов; аппаратная реализация модели, позволяющая значительно повысить быстродействие системы распознавания; усовершенствование внутренней структуры резервуара в зависимости от входных образов; построение самоорганизующихся резервуаров и др. Вполне вероятно, что решение этих задач будет способствовать повсеместному использованию различных моделей РВ в новых перспективных информационных и управляющих системах.
Monitoring and Back-Propagation Neural Network/ Wan Hung (CN). — N CN 201110042458; заявл. 22.02.2011; опубл. 20.07.2011.
7. Gerstner W., Kistler W. M. Spiking Neuron Models. Single Neurons, Populations, Plasticity. — Cambridge: Cambridge University Press, 2002. — 480 p.
8. Бендерская Е. Н., Никитин К. В. Анализ модели импульсной рекуррентной нейронной сети в составе машины неустойчивых состояний // Нейрокомпьютеры: разработка, применение. 2014. № 1. С. 17-22.
9. Izhikevich E. M. Which Model to Use for Cortical Spiking Neurons? // IEEE Transactions on Neural Networks. 2004. Vol. 15. N 5. P. 1063-1070. doi:10.1109/TNN.2004.832719
10. Никитин К. В. Методика синтеза рекуррентных нейронных сетей для распознавания динамических образов // Список-2013: Материалы Всерос. науч. конф. по проблемам информатики, Санкт-Петербург, 25-27 апреля 2012 г. СПб.: ВВМ, 2013. С. 489-495.
11. Moody G. B., Mark R. G. The MITBIH Arrhythmia Database on CDROM and Software for Use with it // Computers in Cardiology. 1990. Vol. 17. P. 185-188.
12. Olszewski R. T. Generalized Feature Extraction for Structural Pattern Recognition in Time-Series Data: PhD Thesis. — Pittsburgh, 2001. — 125 p.
UDC 004.383.8.032.26; 004.93.1 doi:10.15217/issn1684-8853.2015.1.85
Using Spiking Recurrent Neural Networks for ECG Analysis
Benderskaya E. N.a, PhD, Associate Professor, helen.bend@gmail.com Nikitin K. V.a, PhD, Assistant Professor, execiter@mail.ru
aSaint-Petersburg State Polytechnical University, 21, Politechnicheskaia St., 194021, Saint-Petersburg, Russian Federation
Purpose: The paper describes dynamic pattern recognition system engineering using a new approach on the base of reservoir computing. Dynamic pattern recognition is defined as detecting failures in the patient's heart known as arrhythmias, by the changeable signal of his or her electrocardiogram (ECG). Two types of arrhythmia, supraventricular and ventricular, are discussed as examples. Results: A new efficient method is proposed, based on Liquid State Machine (LSM) model which consists of biologically realistic spiking recurrent neural network and several special devices called readouts. Using a popular example, the paper demonstrates the specifics of the new approach: representing the data in the impulse form, functioning of a spiking neural network, reading the data and making a classification decision. SVDB arrhythmia database from Physionet free internet resource is used as input data. Finally, the calculated parameters of the system performance are compared with those of the most popular alternative methods. The conclusion is that the proposed recognition system allows you to increase the recognition quality compared to the classical approaches. Practical relevance: The proposed LSM-based recognition system can improve the quality of recognizing dynamic patterns of various types. Keywords — Spiking Neurons, Recurrent Neural Networks, Dynamic Pattern Recognition, ECG.
References
1. Schrauwen B., Verstraeten D., Campenhout J. V. An Overview of Reservoir Computing Theory, Applications and Implementations. Proc. of the 15th European Symposium on Artificial Neural Networks, Bruges, 2007, pp. 471-482.
2. Benderskaya E. N., Nikitin K. V. Recurrent Neural Network as Dynamical System and Approaches to its Training. Nauchno-tekhnicheskie vedomosti SPbGPU. Informatika. Telekommunikatsii. Upravlenie, Saint-Petersburg, Poli-tekhnicheskii universitet Publ., 2013, no. 4(176), pp. 29-40 (In Russian).
3. PhysioNet: the Research Resource for Complex Physiological Signals. Available at: http://www.physionet.org (accessed 1 April 2014).
4. Maass W., Natschläger T., Markram H. Real-time Computing Without Stable States: a New Framework for Neural Computations Based on Perturbations. Neural Computation, 2002, vol. 11, pp. 2531-2560. doi:10.1162/089976602760407955
5. Fabienne Poree, et al. Reconstruction of a Surface Electrocardiogram from an Endocardial Electrogram Using Non-linear Filtering. Patent US, no. US20130345580 A1, 2013.
6. Wan Hung, et al. Coronary Heart Disease Self-diagnosis System Based on Electrocardiographic Monitor-
ing and Back-propagation Neural Network. Patent CN, no. CN102129509 A, 2011.
7. Gerstner W., Kistler W. M. Spiking Neuron Models. Single Neurons, Populations, Plasticity. Cambridge University Press, 2002. 480 p.
8. Benderskaya E. N., Nikitin K. V. Analysis of a Spiking Recurrent Neural Network as a Part of the Liquid State Machine. Nejrokomp'jutery: razrabotka, primenenie, 2014, no. 1, pp. 17-22 (In Russian).
9. Izhikevich E. M. Which Model to Use for Cortical Spiking Neurons? IEEE Transactions on Neural Networks, 2004, vol. 15, no. 5, pp. 1063-1070. doi:10.1109/TNN.2004.832719
10. Nikitin K. V. Method of Recurrent Neural Networks Synthesis for Dynamic Pattern Recognition. Materialy Vse-rossiiskoi nauchnoi konferentsii po problemam informatiki "Spisok-2013" [Proc. All-Rus. Conf. "Spisok-2013"]. Saint-Petersburg, VVM Publ., 2013, pp. 489-495 (In Russian).
11. Moody G. B., Mark R. G. The MITBIH Arrhythmia Database on CDROM and Software for Use with it. Computers in Cardiology, 1990, vol. 17, pp. 185-188.
12. Olszewski R. T. Generalized Feature Extraction for Structural Pattern Recognition in Time-Series Data. PhD Thesis. Pittsburgh, 2001. 125 p.