Научная статья на тему 'Способ построения модели временного ряда на основе совместного применения методов нейронных сетей и конструкции вейвлет-преобразования'

Способ построения модели временного ряда на основе совместного применения методов нейронных сетей и конструкции вейвлет-преобразования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
101
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
математическое моделирование / нейронные сети / вейвлеты / цифровая обработка сигналов

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мандрикова Оксана Викторовна, Портнягин Николай Николаевич, Полозов Юрий Александрович

При решении многих прикладных задач моделированию подлежат природные сигналы, имеющие сложную структуру, включающую в себя различные по длительности и по форме локальные особенности, которые в свою очередь содержат полезную информацию и не могут быть отфильтрованы как шум. Эти особенности делают невозможным непосредственное применение к ним традиционных методов моделирования временных рядов, таких как методы скользящего среднего, модели авторегрессии проинтегрированного скользящего среднего и др. С целью расширения возможностей применения математического аппарата к обработке реальных статистических данных со сложной структурой введена в рассмотрение новая математическая конструкция, позволяющая на основе современных методов обработки и анализа сигналов, таких как вейвлет-преобразование и методы нейронных сетей, идентифицировать компоненты сложного природного процесса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Мандрикова Оксана Викторовна, Портнягин Николай Николаевич, Полозов Юрий Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

When solving different applied problems modeling deals with natural signals, which have complicated structure including different length and form local peculiarities which in their tern contain useful information and cannot be filtered as noise. These peculiarities make it impossible to apply conventional methods of time series modeling; these methods are: methods of moving mean, models of auto-regression integrated moving mean and so on. In order to extend the application of mathematical apparatus to the processing of real statistical data with complicated structure a new mathematical construction was suggested. This construction allows to identify the components of complicated natural process on the basis of up-to-day methods of signal processing and analysis, such as wavelet-transform and neuron net methods.

Текст научной работы на тему «Способ построения модели временного ряда на основе совместного применения методов нейронных сетей и конструкции вейвлет-преобразования»

УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА

УДК 519.6

СПОСОБ ПОСТРОЕНИЯ МОДЕЛИ ВРЕМЕННОГО РЯДА НА ОСНОВЕ СОВМЕСТНОГО ПРИМЕНЕНИЯ МЕТОДОВ НЕЙРОННЫХ СЕТЕЙ И КОНСТРУКЦИИ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ

© 2008 г. О.В. Мандрикова, Н.Н. Портнягин, Ю.А. Полозов

При решении многих прикладных задач моделированию подлежат природные сигналы, имеющие сложную структуру, включающую в себя различные по длительности и по форме локальные особенности, которые в свою очередь содержат полезную информацию и не могут быть отфильтрованы как шум. Эти особенности делают невозможным непосредственное применение к ним традиционных методов моделирования временных рядов, таких как методы скользящего среднего, модели авторегрессии - проинтегрированного скользящего среднего и др. С целью расширения возможностей применения математического аппарата к обработке реальных статистических данных со сложной структурой введена в рассмотрение новая математическая конструкция, позволяющая на основе современных методов обработки и анализа сигналов, таких как вейвлет-преобразование и методы нейронных сетей, идентифицировать компоненты сложного природного процесса.

When solving different applied problems modeling deals with natural signals, which have complicated structure including different length and form local peculiarities which in their tern contain useful information and cannot be filtered as noise. These peculiarities make it impossible to apply conventional methods of time series modeling; these methods are: methods of moving mean, models of auto-regression - integrated moving mean and so on. In order to extend the application of mathematical apparatus to the processing of real statistical data with complicated structure a new mathematical construction was suggested. This construction allows to identify the components of complicated natural process on the basis of up-to-day methods of signal processing and analysis, such as wavelet-transform and neuron net methods.

Ключевые слова: математическое моделирование, нейронные сети, вейвлеты, цифровая обработка сигналов.

Постановка задачи

Научные исследования в различных областях деятельности часто базируются на обработке реальных статистических данных. В настоящее время область приложений методов математической статистики непрерывно расширяется. Это связано со стремительным ростом возможностей компьютерной обработки данных и развитием направлений теоретической и прикладной математики, таких как цифровая обработка сигналов, теория фильтрации, дискретных и быстрых преобразований и др. Истинное значение измеряемой величины h, как правило, представляет собой набор функций от некоторой случайной величины хк : Нк = f (хк). В зависимости от свойств функции f рассматривают различные модели временных

рядов и соответствующие методы их анализа. В случае, когда отсутствует информация о виде функциональной зависимости между h и t в анализе временных рядов применяют методы скользящего среднего [1, 2], позволяющие отфильтровать шум и увидеть регулярную составляющую более отчетливо. Переменная h должна при этом полиномиально зависеть от t. Точность и достоверность аппроксимации экспериментальных данных на основе этого метода во многом зависит от выбранной длины усредняющих

интервалов и порядка полинома. Это накладывает ограничения на возможность выявления отдельных особенностей экспериментальных данных. Во многих случаях на практике, когда требуется не только выделить регулярные компоненты, но также построить прогноз, удобным является метод идентификации модели временного ряда на основе класса моделей авторегрессии - проинтегрированного скользящего среднего (АРПСС) [2, 3]. Данный метод чрезвычайно популярен во многих приложениях, и практика подтвердила его мощность и гибкость, но он также имеет ограничения как на возможность его использования для отдельных временных рядов, так и на выявляемые при этом закономерности. При экстраполяции временных рядов, имеющих сложную нелинейную структуру, следует соблюдать особую осторожность и учитывать возможность выявления частных закономерностей в их поведении. При решении многих прикладных задач моделированию подлежат природные сигналы, включающие в себя различные по длительности и по форме локальные особенности, которые содержат полезную информацию и не могут быть отфильтрованы как шум. Эти особенности делают невозможным непосредственное применение к ним указанных традиционных методов анализа временных рядов. В работе предлагается новый подход к обра-

ботке сигналов со сложной структурой, который базируется на разложении функции по базису. В качестве базисных функций предлагается использовать класс ортогональных вейвлетов. Данные базисные функции включают в себя широкий спектр функций различной формы и могут быть использованы для сигналов с различной структурой.

Описание метода

Введем в рассмотрение следующую математическую конструкцию: измеряемую величину h определим как

Щ) = (0 + X 2 f2 ^) + ... + xnfn (0, (1)

/г (О = Е с кф к ^), / е L2(R). (2)

к

Поскольку произвольный сигнал с конечной энергией может быть представлен ортогональной системой функций, в качестве функций ф гк определим базисные функции пространства L2(R). С целью применения данной конструкции для сигналов с различной структурой сделаем предположение о том, что функции /г могут быть различными, в частности иметь разную форму и, возможно, разную разрешающую способность по времени, каждая из них нацелена на выявление отдельных свойств временного ряда. В качестве одного из методов идентификации такой конструкции можно использовать многомасштабный анализ (МА) [4, 5] ввиду следующих его свойств.

1. Базисные вейвлет-функции МА имеют два параметра - параметр растяжения 1 и параметр сдвига

по времени к : Т ^ к (х) := 21 2 Т(21 х - к). Своими сдвигами и растяжениями они порождают подпространства пространства L2(R):

(3)

L2(R)=... +W-1 + W0 +W1 + ..., W1 := ^(Я)^ 1,к;к е ^).

С учетом этих свойств МА определим функции fi в формуле (2) следующим образом:

/, ^) = 1 с1ьк Т Лк (t), / е L2 (Я), (2')

1,к

т.е. введем в рассмотрение параметр растяжения 1.

2. КМА обеспечивает точную реконструкцию сигнала после его прямого и обратного преобразований. Сигнал при разложении единственным образом представляется в виде суммы компонент:

V/ е L2(Я)3 ! /(х) =... + Vх) + Vо(х) + х) +

+..., V, еW1, 1 е г ,

1 1 -1

где V1 - компонента /, что исключает возможность

потери и искажения информации (в отличие, например, от процедуры сглаживания).

3. Если Т ортогональный вейвлет, то прямая сумма (3) становится ортогональной, это обеспечивает выполнение условия ортогональности для функций ф г.

4. Определенная свобода выбора базисных функций МА, которые в свою очередь имеют разную форму и масштабируются по времени, обеспечит выполнение условия, что функции /г могут быть различными по форме.

Предложенная математическая конструкция с учетом перечисленных свойств 1 - 4 имеет ряд преимуществ по сравнению с описанными выше традиционными методами анализа временных рядов. Во-первых, наличие большого спектра базисных вейвле-тов, имеющих различную форму, величину носителя и порядок гладкости, а также их масштабирование позволяют выделить в сигнале различные по форме и по длительности локальные особенности.

На основе МА сигнал имеет представление в виде (1), (2). Компоненты сигнала /г имеют более простую структуру, чем исходный сигнал. Это упростит процедуру оценки параметров модели. Например, если компонента вейвлет-разложения имеет линейную структуру, это в большинстве случаев позволяет использовать для оценки параметров компоненты /г описанные выше традиционные методы моделирования временных рядов. В случае, когда структура компонент вейвлет-преобразования не является линейной и однородной, для их идентификации можно использовать методы нейронных сетей (НС) [6].

При решении задач прогнозирования на основе НС строится отображение F : X ^ X / , где X -

множество предшествующих моменту прогнозирования состояний исследуемой динамической системы , X / - множество прогнозируемых состояний .

Показатели качества построенного отображения во многом определяются характеристиками обучающего множества X с X . Здесь играет роль представительность имеющейся выборки данных, их зашумленность, а также способ получения обучающих векторов из общего массива имеющихся данных. Упрощение структуры сигнала и подавление шума на основе применения метода вейвлет-преобразования оптимизирует процедуру формирования обучающего множества НС, что в свою очередь оптимизирует процедуру ее обучения и повышает качество ее работы [7]. Совмещение метода вейвлет-преобразования с методами НС позволяет идентифицировать модель для сигналов со сложной структурой. Модель сигнала в этом случае имеет вид

( \

f (t) = Ф

i Е ci,k i l,k

vhk (t)

+ Е dj

T(t), (5)

Т ,к (t) = 21 /2 Т(2 Ч - к) - базисный вейвлет, Т1,к -

« I к

соответствующий ему двойственный вейвлет, V ' -масштабирующая функция, с1к - аппроксимирующие коэффициенты вейвлет-преобразования, djs - детализирующие коэффициенты вейвлет-преобразования, ф - функция активации НС, ю г - весовые коэффициенты НС.

Подобное представление аппроксимируемой функции может быть усложнено увеличением числа слоев, изменением числа нейронов в каждом слое НС, а также введением перекрестных и обратных связей в структуре НС.

Идентификация модели ионосферного сигнала

Рассмотрим применение предложенного способа аппроксимации экспериментальных данных на примере построения модели сигнала критической частоты f0F2 ионосферного слоя ¥2, полученных автоматической ионосферной станцией, расположенной в п. Па-ратунка (ф = 52,97ос.ш., Х = 158,25ов.д., п-ов Камчатка). Сложная структура сигналов /¥2 затрудняет процесс идентификации модели с целью исследования его динамических свойств и выделения особенностей. В сейсмоактивных регионах может наблюдаться аномальное поведение распределения параметров ионосферы, носящее локальный характер накануне сильных землетрясений [7]. Идентификация модели сигнала критической частоты f0F2 на основе совмещения конструкции вейвлет-преобразования и методов НС улучшила качество обработки подобных сигналов и позволила выделить данные эффекты. В соответствии с описанной выше методикой процесс идентификации модели временного ряда выполняется в два этапа: 1) производилось разложение сигнала на компоненты с использованием семейства ортогональных вейвлетов Добеши 3-го порядка, выполнялся их анализ и формировалось обучающее множество НС; 2) определялась архитектура НС и производилось ее обучение. Целью построения модели сигнала критической частоты является выявление возможных аномальных эффектов в сигнале накануне периодов повышения сейсмической активности. Поскольку вариации критической частоты имеют сложную структуру для анализа сигнала использовалась конструкция непрерывного вейвлет-преобразования (НВП). НВП дает возможность детально проанализировать и изучить порой даже скрытые различными шумовыми факторами закономерности нестационарных временных рядов и используется для представления сигналов различной природы [4, 5]. Анализ результатов НВП построен на основе сопоставления выявляемых локальных особенностей сигнала с данными каталога сейсмический явлений. На рис. 1, 2, в качестве примера, представлены результаты обработки данных критической частоты за 1972 и 1986 гг. соответственно. Стрелками показаны моменты возникновения наиболее сильных сейсмических событий (рассматривались сейсмические события энергетического класса с к > 12,5).

В верхней части рисунков показан исходный сигнал, ниже результат его вейвлет-преобразования: на горизонтальной оси отмечены отсчеты сигнала; на вертикальной оси - масштабные уровни; оттенками серого цвета показаны значения вейвлет-коэффициентов. Из рисунков видно, что накануне сейсмических событий в сигнале можно отметить наличие ярко выраженных разномас-

штабных локальных особенностей, проявляющихся резким возрастанием значений вейвлет-коэффициентов определенных масштабных уровней (выделены на рисунках пунктиром белого цвета).

Рис. 1. Результат НВП данных критической частоты за 1972 г.

Рис. 2. Результат НВП данных критической частоты за 1986 г.

Анализ данных за весь период времени (1968 -1986 гг.) показал наличие подобных локальных аномальных эффектов накануне большого числа периодов повышенной сейсмической активности Камчатского региона и указал на их проявление на масштабных уровнях с 50-го по 500-й. Факт проявления данных аномальных особенностей на более низких частотах позволяет применить предложенную методику идентификации модели временного ряда к исследуемым ионосферным сигналам, в соответствии с которой из сигнала далее были выделены аппроксимирующие компоненты 4-го масштабного уровня дискретного вейвлет-разложения. Далее было произведено вейвлет-восстановление этих компонент без учета деталей разложения (они предполагались нулевыми), это позволило восстановить исходную размерность сигнала. С учетом сезонных особенностей ионосферных данных, было решено произвести обучение сети отдельно для каждого сезона. Была построена двухслойная сеть прямой передачи сигнала с сигмоидаль-ным и линейным слоями. Была получена следующая модель сигнала:

( ( \\

У (t ) = ф

где ф(z) =

Дю iФi\Z®j Z xj, *

j i,k

bn; l ,k

* bk (t)

1

1 + exp(-z))

Ф i (z) = kz + b, ю i - весовые

коэффициенты первого слоя нейронной сети, ю ^ -весовые коэффициенты второго слоя нейронной сети,

х1 - исходные данные, Т ;,к (0 = 21 /2 Т(2 Ч - к)-

базисный вейвлет, Т1,к - соответствующий ему

двойственный вейвлет.

Проверка на тестовом множестве показала хорошие результаты работы этой сети. На рис. 3 показан пример результата работы сети, в качестве тестовой выборки использовались данные критической частоты зимнего периода 1983 г., ошибка сети составила е = 0,0026.

Рис. 3. Результат работы сети при подаче на ее вход восстановленных данных регистрации критической частоты зимнего периода 1983 г.: 1 - восстановленный сигнал регистрации критической частоты зимнего периода 1983 г.;

2 - модельный сигнал

Далее через обученную сеть были пропущены исходные сигналы. В этом случае сеть также показала хорошие результаты. В отдельные моменты времени наблюдалось резкое увеличение ошибки сети, которое свидетельствовало о наличии в сигнале локальных аномальных особенностей (на рис. 4 показана ошибка работы сети, в качестве входного вектора использовались данные критической частоты зимнего периода 1972 г.). Сопоставление выявленных аномальных моментов в сигнале с данными сейсмического каталога показало, что в большинстве случаев они наблюдаются накануне сейсмических событий энергетического класса с к > 12,5 в радиусе Я~200 км от Петро-павловска-Камчатского.

0 500 1000 1500 2000 2500 3000 Рис. 4. Ошибка сети при подаче на ее вход сигнала критической частоты зимнего периода 1972 г.

Выводы

На основе предложенного подхода к построению моделей временного ряда была идентифицирована модель сигнала критической частоты. В сейсмически активный период времени сигнал критической частоты имеет сложную нелинейную структуру и может быть аппроксимирован на основе совместного использования методов НС и вейвлет-преобразования. На основе анализа полученной модели сигнала критической частоты были выявлены локальные аномальные эффекты в его структуре, в большинстве случаев возникающие накануне сильных сейсмических событий п-ова Камчатка.

Литература

1. Siegmund Brandt. Data Analysis. Statistical and Computational Methods for Scientists and Engineers: Пер. с англ. М., 2003.

2. Никифоров И.В. Последовательное обнаружение изменения свойств временных рядов. М. , 1983.

3. Бокс Дж., Дженкинс Г. Анализ временных рядов: прогноз и управление: Пер. с англ. М., 1974.

4. Ingrid Daubechies. Ten Lectures on Wavelets: Пер. с англ. Ижевск, 2001.

5. Charles KChui. An Introduction to Wavelets: Пер. с англ. М. 2001.

6. Нейроматематика. Кн. 6: Учеб. пособие для вузов / А.Д. Агеев, А.Н. Балухто, А.В. Бычков и др.; Общая ред А.И. Галушкина. М., 2002.

7. Богданов В.В., Геппенер В.В., Мандрикова О.В. Моделирование нестационарных временных рядов геофизических параметров со сложной структурой. СПб., 2006.

25 января 2007 г.

Мандрикова Оксана Викторовна - канд. техн. наук, ведущий научный сотрудник института космофизических исследований и распространения радиоволн ДВО РАН. E-mail: [email protected].

Портнягин Н.Н. - д-р техн. наук, профессор кафедры электротехники и электрооборудования судов Камчатского государственного технического университета. Тел. (4152) 427076.

Полозов Юрий Алексеевич - аспирант Камчатского государственного технического университета. Тел. (4152) 122052.

i Надоели баннеры? Вы всегда можете отключить рекламу.