Известия Тульского государственного университета Естественные науки. 2009. Вып. 2. С. 159-166 = Информатика
УДК 669.187
Анализ геодинамических экспериментальных сигналов
О.А. Афанасьев
Аннотация. Рассмотрена задача выявление нестандартных участков исследуемого сигнала для улучшения качества предсказаний сейсмособытий, сегментации сигнала, задача описания однородных фрагментов.
Ключевые снова: структурный анализ, временной ряд, вейвлет-анализ.
Введение
Для практики сейсмических исследований в системах управления и регистрации данных часто возникает необходимость обработки экспериментальных сигналов. При анализе таких данных обычно полагают, что наблюдаемый сигнал является наблюдаемой реализацией некоторого случайного процесса. Существуют два разных подхода к их обработке. Первый использует методы обработки сигнала в целом. И второй подход — структурный. Он состоит, в общем случае, в реализации следующих задач:
1) задачи сегментации, т.е. выделения однородных фрагментов на реализации сигнала;
2) задачи описания однородных фрагментов;
3) задачи анализа порядка чередования разных типов фрагментов. Исходными данными для исследований являются данные измерений
геодинамических поляризационных потенциалов в лаборатории кафедры ОТ-СиЛП ТулГУ на широкополосном градиентометре. В данной статье рассмотрены первые две задачи.
1. Выявление нестандартных участков исследуемого сигнала для улучшения качества предсказаний сейсмособытий
Наша планета — очень сложная система. Дискретный сигнал в работе рассматривается как отражение совокупного проявления различных процессов, проходящих внутри нашей планеты. В целях уменьшения объема обрабатываемой информации, увеличения скорости ее обработки, повышения качества анализа будем подробно рассматривать не всю реализацию сигнала, а только
интересующие нас «нестандартные» участки. Это можно сделать следующим образом. С помощью скользящего окна 5, захватывающего фиксированный интервал времени шириной N, и процедуры экстраполяции (предсказания) по N значениям, получаем расчетную N + 1 точку. Это будет точка расчетного сигнала. Эта расчетная величина показывает, как будет вести себя анализируемый сигнал в N + 1 точке отсчета, если на N + 1 этапе не произойдет никаких отличных процессов от тех процессов, которые происходили на интервале 8. Итак, двигаясь вдоль всего анализируемого сигнала с шагом одно значение и фиксированным интервалом, мы получим новый расчетный сигнал, новую кривую. Понятно, что в каких-то точках эти кривые будут совпадать, а где-то и сильно различаться. Участки с такими различиями и представляют интерес. Построение разницы этих двух кривых даст третью (вид преобразованного сигнала), которая будет наглядно показывать «нестандартные» участки исследуемого сигнала — предвестников различных природных катаклизм, в т.ч. и землетрясений. Применение процедур обработки сигнала к «преобразованному» сигналу может привести к улучшению качества анализа исследуемого сигнала, а, следовательно, и предсказания сейсмособытий. В качестве метода экстраполяции можно применять модель Бокса-Дженкинса (АРИСС), как одну из наиболее популярных моделей для построения краткосрочных прогнозов. Важными специальными классами моделей АРИСС являются: модель авторегрессии, скользящего среднего АРСС.
2. Сегментация сигнала
Показания прибора представляют собой непрерывный ряд отсчетов датчика в виде целых положительных чисел в диапазоне от 0 до 255. Показания снимаются непрерывно с интервалом 0.5 минуты. Экспериментальный сигнал (рис. 1) по предположению является отображением реализации очень сложных процессов, происходящих внутри планеты, приводящих в некоторых случаях к землетрясениям. Поэтому не представляется возможным построение математической модели случайного процесса, реализацией которого является исследуемый структурный сигнал, на участках однородности. Так же не представляется возможным, на сегодняшний день, построить модель механизма чередования элементарных событий (обычно в виде некоторого потока случайных событий) и длительностей этих событий.
К сожалению, большинство методов, как правило, имеют более или менее ограниченную область применения. Обычно такие методы разрабатываются для определенных прикладных задач.
Известен ряд методов исследования, относящихся к исследованию методов структурного анализа сигналов, таких как: сегментация сигналов с эталонами фиксированной длины и повторением средней формы фрагментов, сегментация сигналов с многоэталонным заданием формы фрагментов, детерминированные методы сегментации, смешанные методы сегментации, ускоренные методы для модели с базисным заданием формы, и их разновидности [1].
1 1
*4. . /
'
и АЛ А н.
и 111 \ Л 1 \1
Рис. 1. Участок исходного сигнала
Однако, ввиду ряда существенных особенностей этих методов, не позволяющих использовать их алгоритм для решения рассматриваемой задачи, предлагается новый подход к сегментации сигнала, относящийся больше к эвристическим алгоритмам. Этот подход предполагает математическое описание информативных фрагментов сигнала. Он включает в себя следующие этапы:
1) дифференцирование (разделение всплесков на исходном сигнале на участки с увеличением и уменьшением наблюдаемой величины);
2) Фильтрация (удаление участков, где наблюдаемая величина уменьшается, а также удаление неинформативных участков или шума);
3) построение модели оставшихся участков сигнала.
Рассмотрим более подробно каждый из вышеуказанных этапов. Временной ряд представляет собой некую кривую, отображающую колебания наблюдаемой величины, т.е.ее увеличение и уменьшение, которые образуют так называемые «всплески» [2-4]. Предполагается, из практических наблюдений, что стабильное увеличение наблюдаемой величины, а за тем и ее стабильное уменьшение — две составляющие одного процесса (например, — изменение электромагнитного поля земли, движение тектонических плит, и т.д.), происходящего внутри нашей планеты (одного участка, подчас очень короткого, исследуемого сигнала). Такой участок (вид его кривой) может быть как вогнутым, так и выпуклым. Поэтому предлагается рассматривать «всплеск» на исходном сигнале не полностью, а только ту его часть, в которой измеряемая величина увеличивается. Условно назовем такую часть «всплеска» — «набор энергии». Таким образом, происходит дифференцирование исходного сигнала. Все участки исходного сигнала, где наблюдаемая величина уменьшается, удаляются. Это позволяет провести процедуру сегментации исходного сигнала быстро и однозначным образом, уменьшить объем анализируемой
информации. Нужно заметить, что при такой процедуре оставшиеся участки сигнала будут разной ширины.
1
1 1 1 '■ 1
1 1 1 .1 У У' / } 1
Рис. 2. Участок исходного сигнала после удаления участков, где наблюдаемая величина уменьшается
Из рис.1 видно, что экспериментальный сигнал содержит множество участков с незначительными колебаниями наблюдаемой величины, т.е. шум, который всегда присутствует в экспериментальных сигналах. Под шумом в экспериментальном сигнале мы понимаем все постоянные «мелкие, естественные, нормальные процессы», происходящие внутри земли ежеминутно, и по предположению, не влияющие на сейсмоактивность, а, следовательно, не представляющие для нас интереса. После удаления участков, на которых измеряемая величина уменьшается (рис. 2), останется много мелких «скачков». Их в исходном сигнале подавляющее большинство. Статистически можно показать, что они не связаны с последующим появлением сейсмособытий, и как следствие, не должны оказывать влияния на анализ исходного сигнала. Для их удаления из сигнала необходимо ввести фильтр, который бы игнорировал тс из них, в которых изменение отклонения сигнала (например, высота «всплеска») не превышает определенного значения — порога значимости, или ввести высокочастотный фильтр, который позволял бы исключать незначительные по амплитуде отклонения в сигнале.
3. Описание однородных фрагментов сигнала
Существует много способов описания однородных фрагментов сигнала, многие из них похожи друг на друга. Это методы, где в качестве классифицирующего признака обычно используется математическое ожидание формы сигнала на участках данного типа. Используется сглаживание обрабатываемых данных кубическими сплайнами [5]. Проводится сегментация на участки по форме и по длительности. При этом признаки формы в основном частотные (например, число пересечений нулевого либо иного уровня на
данном участке) [6]. Часто оценивается форма не самого участка сигнала, а его спектра. Данные подходы с точки зрения их использования для обработки экспериментальных сигналов имеют общий недостаток — каждый из них применим только для достаточно узкого класса сигналов. Задачу описания однородных фрагментов предлагается решать следующим образом.
Каждый класс представляет собой набор однородных участков сигнала, удовлетворяющих определенным параметрам. Сначала просматривается первый участок отфильтрованного «улучшенного» сигнала. Совокупность данных с рассматриваемого участка сигнала аппроксимируется с помощью тригонометрической функции, например в простейшем случае:
f(t) = а соз(к1.) + Ьзт(к1.),
где I — время.
На практике более предпочтительно использовать уравнение регрессии. Совокупность данных можно представить некоторой функцией у(1). Задача регрессии заключается в получении параметров этой функции такими, чтобы функция приближала «облако» исходных точек с наименьшей среднеквадратичной погрешностью. При использовании линейной регрессия общего вида заданная совокупность точек приближается функцией:
f{t, кг, к2...кп) = к\/\{1) + А^/г^) + • • • + кп/п{1).
Таким образом, функция регрессии является линейной комбинацией функций /1(^)1 /2(^)1 ••• •> /га(^)) причем сами эти функции могут быть нелинейными, что резко расширяет возможности такой аппроксимации и распространяет ее на нелинейные функции. К линейной регрессии можно свести многие виды нелинейной регрессии при зависимостях вида у(х). Большое распространение на практике получила одномерная и многомерная полиномиальная регрессии.
Итак, указанный участок экспериментального сигнала заменяется так называемым вектором с параметрами аппроксимирующей функции, или вектором с параметрами из коэффициентов многочлена «-ой степени при проведении регрессии.
Такое представление фрагментов сигнала имеет много общего с динамическим анализом Фурье. Простейшая его разновидность состоит в следующем: весь интервал наблюдаемой величины разбивается на N равных частей длины Тдг = Т/N, и затем по каждому из подинтервалов строится спектр Фурье 92.4(0;). Получается как бы двумерное спектрально-временное представление наблюдаемого процесса [7], [8].
Нужно отмстить, что наблюдаемый сигнал часто является комбинацией ряда других сигналов, вызываемых множеством земных процессов, в т.ч. и предвестниками землетрясений. Другими словами, каждый из таких предвестников землетрясения, очевидно, вносит свою составляющую в наблюдаемый сигнал, т.с., возможно, является на каждом участке реализации наблюдаемого сигнала одним из его спектров. Поэтому более рационально вместо представления информативных участков наблюдаемого сигнала
(«всплесков») в виде векторов с параметрами из коэффициентов регрессии по отдельным участкам применить к таким участкам более детальный анализ — вейвлет-анализ [9].
Теория вейвлетов является мощной альтернативой анализу Фурье, и даст более гибкую технику обработки сигналов. Одно из основных преимуществ вейвлет-анализа заключается в том, что он позволяет заметить хорошо локализованные изменения сигнала, тогда как анализ Фурье этого не даст — в коэффициентах Фурье отражается поведение сигнала за все время его существования. На сегодняшний день разработана глубокая и красивая математическая теория вейвлетов. В частности, будем использовать быстрое всйвлст-прсобразованис (ВВП) [4].
При исследовании сигналов полезно их представление в виде совокупности последовательных приближений грубой (аппроксимирующей) Am(t) и уточненной (детализирующей) Dm(t) составляющих
ГП
S(t) = Am(t) + '£Dj(t)
i=i
с последующим их уточнением итерационным методом.
Каждый шаг уточнения соответствует определенному масштабу ат (т.с. уровню т) анализа (декомпозиции) и синтеза (реконструкции) сигнала. Такое представление каждой составляющей сигнала вейвлетами можно рассматривать как во временной, так и в частотной областях. В этом и есть суть кратномасштабного анализа (КМА) [3].
Пусть имеется непрерывный сигнал S(t) £ Vq. Дискретный сигнал вд интерпретируем как последовательность коэффициентов а&, полученную в ходе КМА сигнала S(t) при масштабирующих функциях <рок(£)
S(t) = A0{t) = ^a0k<Pok(t)
к
ГДС a ok = cik = (S(t), <pok{t)) — коэффициенты аппроксимации на уровне т = 0.
По концепции КМА сигнал S(t) декомпозируется па дне составляющие (принадлежащие подпространствам V'i и VKi):
S(t) = Ai(t) + Di(t) = 'Y^aikVik{t) + ^2 diki'ik{t).
к к
Следовательно, получены две новые последовательности a\k и d\k■ Отмстим, что последовательности а\^ и d\k имеют половинную длину по сравнению с oofc. Далее процесс декомпозиции может быть продолжен по A\(t) (подпространства \\ и W2] подпространства V-i, V-2,... не имеют значения при принятой интерпретации). Сигнал S(t) на уровне декомпозиции т будет представлен совокупностью коэффициентов amk и dmk■
Отмстим, что вычисления атк и йтк по-прежнему зависят от непрерывных базисных функций (р(1) и ф(1). Как показано в [9] эти функции однозначно определяются коэффициентами /г./:
¥>(*) = 2- /), (1) I
ф(1) = 2^ (-1)%_^(2* - I) = 2 £^(2* - I), (2)
I I
Ун = (¥>(*), ¥?(2* - /), (3)
ё1 = ( —1)^2тг-1-Ь (4)
где / = 0,1,..., /о = 2« — 1, п — порядок вейвлета. Вейвлеты «-го порядка существуют только на интервале длиной 2п — 1 и имеют 2« отличных от нуля коэффициентов
Из (1) и (2) можно получить следующие соотношения:
О'тк фтк^У) ^ ^ фт—1,/(^)) ^ ^ ^1—2к^1,т—I •>
I I
<1тк = {3{Ь),фтк{1)) = ^2gl-2k{І’{t),І'm-l,l{t)) = У! ё1-2к^,1,т-1 •
I I
Интерполяционная процедура быстрого вейвлет-анализа получила название анализа от «тонкого» к «грубому» масштабу.
На практике наименьший возможный масштаб (наибольший возможный уровень разрешения по) определяется числом N дискретных значений сигнала (N = 2П°). На самом «тонком» значении масштаба (т = 0, а = 2пг = 1) в качестве аппроксимирующих коэффициентов оой принимаются сами отсчеты 5* сигнала 5(2), т.с. ао& = 5*, к = г, г = ОД,...,]'/ — 1. При переходе от текущего масштаба т к следующему т + 1 число вейвлет-коэффициентов уменьшается в два раза и они определяются по рекуррентным соотношениям:
,к = ^ ^ §1—2кО'т1 •
I I
Процесс останавливается после конечного числа уровней т, которое зависит от протяженности сигнала N и порядка I фильтра
В итоге информативные участки экспериментального сигнала заменяются на векторы с компонентами, состоящими из определенного набора детализирующих вейвлет-коэффициентов декомпозиции йтк-
Таким образом, в статье рассмотрены задача сегментации дискретного сигнала, задача описания его информативных фрагментов. Предложен новый метод сегментации, основанный на разделении «всплесков» на исходном сигнале на участки с увеличением и уменьшением наблюдаемой величины сигнала, с последующей фильтрации, удалением неинформативных участков.
® 771 + 1, & ---------------
Также, построена математическая модель информативных участков дискретного сигнала, использующая быстрое всйвлст-прсобразованис.
Список литературы
1. Воробьев С.А. Моделирование и структурный анализ сигналов с повторяющимися признаками формы в медико-биологическом эксперименте: дис. ... д-ра тех. наук. Тула, 2000. 323 с.
2. Чуй Ч. Введение в вейвлеты. М.: Мир, 2001. 12 с.
3. Яковлев А.Н. Основы вейвлет преобразования сигналов. Подольск, 2003. 79 с.
4. Петухов А.П. Введение в теорию базисов всплесков. СПб.: СПбГТУ, 1999. 132 с.
5. Воскобойников Ю.Е. Методы, алгоритмы и программное обеспечение обработки данных физического эксперимента: дис. ... д-ра. тех. наук. Новосибирск, 1989. 307 с.
6. Колесников Н.Д. Распознавание сейсмособытий на рудниках на основе лингвистического подхода: автореф. дис. ... к.т.н. СПб: СПбГТУ, 1994. 16 с.
7. Lighthill M.J. An introduction to Fourier analysis and generalized functions // The Quarterly Journal of the Royal Meteorological Society. 1958. V. 84. Issue 362. P.480.
8. Bloomfield P. Fourier Analysis of Time Series: An Introduction. N.Y.:
Wiley-Interscience. 2000. V. 158. P. 288.
9. Яковлев А.Н. Введение в вейвлет-нреобразования. Учеб. пособие. Новосибирск: НГТУ, 2003. 104 с.
Поступило 10.06.2009
Афанасьев Олег Александрович ([email protected]), аспирант, кафедра прикладной математики и информатики, Тульский государственный университет.
Analysis of geodynamic experimental of signals
O.A. Afanasiev
Abstract. We consider the problem of identifying of non-standard sites investigated signal to improve the quality of the earthquakes predictions, segmentation of the signal, the task of describing homogeneous fragments.
Keywords: structural analysis, time scries, wavelet analysis.
Afanasiev Oleg ([email protected]), postgraduate student, department of applied mathematics and computer sciences, Tula State University.