МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ МЕТОДЫ В ЗАДАЧЕ ПАРАМЕТРИЗАЦИИ ОПИСАНИЯ КЛАССОВ ЭЭГ-СИГНАЛА
И.О. Жаринов
Использование для анализа сигналов электроэнцефалограммы (ЭЭГ) человека параметрических моделей авторегрессии-скользящего среднего (АРСС), являющихся косвенным описанием признаков классов ЭЭГ-сигналов, находится сейчас в стадии интенсивного развития: совершенствуются вычислительные методы, уточняются статистические аспекты, выясняются границы применимости АРСС анализа.
Основной задачей в проблемах анализа и классификации ЭЭГ является задача выбора признаков классов, которая может быть решена с использованием прямого и косвенного описаний [7].
Прямое описание основано на вероятностных мерах — характеристиках многомерных распределений случайных процессов, моментных характеристиках, оценках корреляционных функций и может быть использовано [2] для анализа и классификации стационарных и нестационарных сигналов.
Косвенное описание использует [6,9] информацию о признаках классов сигналов опосредованно заложенную в коэффициенты их динамических моделей, представленных в виде алгебраических, дифференциальных и интегральных уравнений, а также их дискретными эталонами.
Основной недостаток прямого описания признаков ЭЭГ-сигналов и их классов заключается в необходимости проведения сравнительно длительного статистического эксперимента для его формирования на заключительном этапе — этапе распознавания.
Косвенное описание может быть использовано для коротких выборок стационарных процессов, так как соответствующая статистическая информация заложена в параметры их математических (динамических) моделей на предварительном этапе — этапе обучения.
АРСС анализ базируется на предположении [1,6,8], что текущие значения ЭЭГ имеют существенную статистическую связь с ее предысторией. АРСС модель 1-ого
квазистационарного участка ЭЭГ представляет значения отсчетов ЭЭГ-сигнала у(1)[п] посредством линейного соотношения вида
р(') 9«
У(1)[«] + Е ^ • У(г)[п - к] = ¿0° • х[п] + X • Х[п - к] ,1=1,2,.. ,,М , к=1 к=1 где {х[п]} - последовательность независимых, нормально распределенных случайных величин с нулевым математическим ожиданием и единичной дисперсией. Эта последовательность называется порождающим процессом. Коэффициенты модели (г) а(2),..., а(г(),) } и {Ьо(г),Ъ(г),. ., Ь(г()) }, а также величины р(1) и ц(1) являются параметрами
1 >"2 "р(0 ^0
модели АРСС. Параметры р(г) и ц(г) определяют порядок модели авторегрессии и скользящего среднего соответственно, а величина (р(г) + ц()) определяет порядок АРСС модели. Часто адекватную параметрическую авторегрессионную модель ЭЭГ удается получить, даже полагая коэффициенты ¿1(г),..., Ъ^ равными нулю
р(')
У(г)[п] + Е аТ • У(г)[п - к] = Ъ0р • х[п], 1=1,2,.,М .
к=1
Индекс (1) означает описание моделью 1-ого класса из М возможных взаимоальтернативных классов ЭЭС. В последующем, через параметры АРСС модели могут быть выражены оценки частотных и корреляционных функций, определены отрезки стационарности ЭЭГ, решены задачи сегментации и классификации ЭЭГ
[3,6,10]. В частности, при известных параметрах АРСС модели можно получить [10] оценку спектральной плотности 1-ого класса ЭЭС.
Оценивание параметров линейного уравнения регрессии по имеющимся данным {У[п*]}"п-N представляет собой одну из основных процедур прикладного
статистического анализа. Для этой цели широко применяется метод наименьших квадратов [5], всесторонне изученный и имеющий несколько теоретических обоснований. Он достаточно просто реализуется в виде специализированных программ расчетов оценок параметров и других характеристик линейной регрессионной связи между объясняющими и объясняемыми переменными. Такие программы для небольшого числа оцениваемых параметров и не очень большого числа используемых наблюдений имеются сегодня в прикладном программном обеспечении любого компьютера.
Удачным примером подхода, сочетающего систематическое изложение теории, математических методов и алгоритмов является подход, основанный на применении традиционных методов анализа стационарных процессов к формированию новых по постановке задачи синтеза признаков классов ЭЭГ-сигналов.
Задача формирования косвенного описания признаков классов ЭЭГ может рассматриваться как известная задача подбора модели определенного класса, адаптированная к стационарным или квазистационарным случайным процессам. Такую задачу принято [7] решать в четыре этапа: концептуальный выбор класса моделей (выбор подходящего описания в пространстве параметрических моделей (использование АР или АРСС моделей)); идентификация порядка модели (определение порядка АР или АРСС модели); оценивание параметров модели (получение оценок параметров и остаточной дисперсии при известном порядке модели); подтверждение качества модели (проверка пригодности (адекватности) полученного описания).
Формирование параметрических описаний признаков классов ЭЭГ базируется на использовании [9,10] метода Юла-Уолкера, метода факторизации спектральной плотности, метода уравнивания 2-преобразований текущих АКФ, метода Берга, ковариационных методов и т. д.
Для оценки качественных показателей математических методов косвенного описания реализаций классов ЭЭГ-сигнала была проведена серия статистических экспериментов по обработке реальных данных ЭЭГ {у[п*]}П^. Обработка производилась не в реальном масштабе времени на ШМ-совместимом ПК при помощи специализированного авторского программного обеспечения, реализующего несколько наиболее распространенных алгоритмических методов получения оценок авторегрессионных компонентов параметрических АР и АРСС моделей по дискретным данным.
Исследования проводились на базе цифровых методов обработки, относящихся к блокам данных, т. е. алгоритмами, предназначенными для обработки целых блоков (последовательностей) накопленных дискретных отсчетов {у[п*]}П^ данных
некоторого фиксированного объема N. Рассматриваемые методы блочной обработки данных можно кратко описать как алгоритмы с фиксированным временем, рекурсивные относительно порядка формируемых моделей в том смысле, что они применяются к блокам временных дискретных отсчетов {у[п*]}П^ фиксированного
объема и позволяют рекуррентным образом получать оценки параметров АР моделей более высокого порядка по оценкам параметров АР модели более низкого порядка. Такие алгоритмы целесообразно применять в тех случаях, когда порядок требуемой АР модели заранее не известен, поэтому для выбора АР модели надлежащего порядка необходимо испытывать много таких моделей различных порядков и сравнивать получаемые результаты.
Для численного определения точностных характеристик различных методов формирования косвенного описания классов ЭЭС на базе эталонной АР модели а-ритма методом математического моделирования на ЭВМ [4] была синтезирована последовательность дискретных отсчетов, по которой, впоследующем, определялись оценки весовых коэффициентов АР моделей разными методами для одной и той же последовательности х[п] - нормального порождающего БШ.
Серии статистических экспериментов показали, что параметрические модели, полученные рассматриваемыми методами формирования косвенного описания, обладают приемлемым качеством аппроксимации при сравнительно высоких объемах N анализируемых данных ЭЭГ {у[п ]}пп_N . Начиная с N>100, значение ошибки
определения коэффициента оказывается инвариантно к методу формирования модели и сходится к оптимальному, нижняя граница дисперсии оценки которого определена в соответствии с неравенством Рао-Крамера [8]. Экспериментально подтверждается, что в случае аппроксимации реализаций {у[п*]}пп_N классов ЭЭС параметрическими
моделями авторегрессии обратная функциональная зависимость величины а (а-рца«) от
а1
величины -^/N, справедливая для классического авторегрессионного анализа, сохраняется при обработке дискретных данных ЭЭГ {у[п*]}п_N .
Литература.
1. Айвазян С.А. и др. Прикладная статистика: Исследование зависимостей: Справ. изд. / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин; / Под ред. С.А. Айвазяна. М.: Финансы и статистика, 1985. 487с., ил.
2. Бендат Дж., Пирсол А. Применение корреляционного и спектрального анализа: /Пер. с англ. М.: Мир, 1983. 312с., ил.
3. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление: / Пер. с англ. М.: Мир, 1974. 408с.
4. Быков В.В. Цифровое моделирование в статистической радиотехнике. М.: Советское радио, 1971. 328с.
5. Губанов В.С. Обобщенный метод наименьших квадратов. Теория и применение в астронометрии. СПб.: Наука, 1997. 318с., ил.
6. Дженкинс Г., Ваттс Д. Спектральный анализ и его приложения. Вып.2М.: Мир, 1972. 287с.
7. Елисеев А.А., Зиатдинов С.И., Изранцев В.В. и др. Управление движущимися объектами: Учеб. пособие / Под ред. А. А. Елисеева и А. А. Оводенко. М.: Изд-во МГАП "Мир книги", 1994. 427с.: ил.
8. Кашьяп Р.Л., Рао А.Р. Построение динамических стохастических моделей по экспериментальным данным: Пер. с англ. М.: Наука, 1983. 384с.
9. Кей С.М., Марпл С.Л. Современные методы спектрального анализа: Обзор. // ТИИЭР. 1981. № 11. Т.69. С.5-51.
10. Марпл.-мл. С.Л. Цифровой спектральный анализ и его приложения: / Пер. с англ. М.: Мир, 1990. 584с., ил.