УДК 519.65
МОДЕЛИРОВАНИЕ И АНАЛИЗ ИОНОСФЕРНЫХ ДАННЫХ НА ОСНОВЕ СОВМЕЩЕНИЯ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ И МОДЕЛЕЙ АВТОРЕГРЕССИИ
О.В. Мандрикова1, Н.В. Глушкова2
12Камчатский государственный технический университет, г. Петропавловск-Камчатский, 683003;
1 Институт космофизических исследований и распространения радиоволн ДВО РАН, с. Паратунка,
Камчатский край, 684034 1e-mail: oksanam 1@mail. kamchatka. ru 2e-mail: nv. glushkova@yandex. ru
В статье предложен метод моделирования и анализа данных критической частоты ионосферы, основанный на совместном применении методов вейвлет-преобразования и моделей авторегрессии -проинтегрированного скользящего среднего. Метод позволяет проанализировать характерные особенности ионосферных данных и автоматически обнаружить аномальные изменения, возникающие в периоды повышенной солнечной или сейсмической активности. Апробация метода выполнена на данных критической частоты ионосферы fF2, полученных в обсерватории «Паратунка» (с. Паратунка, Камчатский край).
Ключевые слова: вейвлет-преобразование, модель авторегрессии - проинтегрированного скользящего среднего, параметры ионосферы, аномалии.
Simulation and analysis of ionospheric data based on combination of the wavelet transform and autoregressive models. O.V. Mandricova1, N.V. Glushkova2 (u 2Kamchatka State Technical University, Petropavlovsk-Kamchatski, 683003; institute of Cosmophysical Researches and Radio Wave Propagation, Paratunka, Kamchatka)
This article proposes a method of modeling and analysis data of the critical frequency of the ionosphere, based on the joint application of the wavelet transform and autoregressive models - integrated over a moving average. The method allows to analyze the characteristics of ionospheric data and automatically detect abnormal changes that occur during periods of increased solar and seismic activity. Testing of the method is executed on the data of the ionosphere critical frequency foF2, obtained at the Observatory "Paratunka" (p. Paratunka, Kamchatka).
Key words: wavelet transform, autoregressive model, parameters of the ionosphere, anomalies.
Введение
На фоне регулярных изменений, обусловленных суточным и сезонным ходом, в периоды повышенной солнечной активности в ионосферных данных возникают аномальные особенности длительностью от несколько десятков минут до нескольких часов [1-3]. Проводимые в последнее время исследования в области солнечно-земной физики показывают, что в сейсмоактивных районах аномальные особенности также могут возникать накануне сильных землетрясений [2-4]. Эти аномалии возникают на фоне мощных ионосферных возмущений. Сложная структура данных делает неэффективным для выделения этих особенностей традиционные методы моделирования и анализа временных рядов [5]. В настоящее время для анализа природных данных используются методы адаптивной фильтрации, основанные на применении экстраполирующих вейвлет-фильтров [2-6], которые дают возможность рассмотреть многие явления на общем уровне и создать эффективный теоретический и технический аппарат в области обработки и анализа данных сложной внутренней структуры. Ввиду большого разнообразия базисных функций вейвлет-методы могут быть использованы для широкого спектра регистрируемых данных [6]. В данной статье на их основе совместно с моделями авторегрессии - проинтегрированного скользящего среднего (АРПСС) предлагается метод моделирования и анализа данных критической частоты ионосферы, позволяющий выделить и проанализировать характерные особенности данных и аномалии, возникающие в периоды повышенной солнечной или сейсмической активности. На основе конструкции кратномасштабного анализа [6] данные отображаются в пространство вейвлет-образов и представляются в виде комбинации аппроксимирующей и
детализирующих компонент. Аппроксимирующая компонента аппроксимируется моделью АРПСС. Описан процесс идентификации модели для данных разных временных сезонов и выявлены аномальные эффекты, которые обусловлены процессами в литосфере, формирующимися в периоды повышенной сейсмической активности (анализировались события энергетического класса с k > 12,5 в радиусе R ~ 300 км от Петропавловска-Камчатского).
Многокомпонентное моделирование временного ряда
Рассмотрим в качестве базового пространства регистрируемых дискретных данных f (t) замкнутое пространство с разрешением j = 0 : V0 - clos 2 (2° ф(2° t - к)) :keZ), порожденное
L (R)
функцией ф е L2 (R), где ф - скэйлинг-функция [6]. На основе кратномасштабных разложений до уровня m получим следующее представление ионосферных данных в пространстве вейвлет-образов [3]:
fo(t) = '£glJt2flmt\ где (1)
j=-1
компоненты g J 't - вейвлет, являются детализирующими
п
компонентами, характеризуют локальные свойства данных; компонента / | ^с_„лФ_„л(0 ,
k
с_тк —{/Л-тк) ~ аппроксимирующая составляющая.
Для идентификации модели будем использовать итеративный подход, состоящий из следующих операций:
1) отображение данных в пространство вейвлет-образов на основе операции (1);
2) выделение характерных структур (компоненту вейвлет-разложения будем считать характерной структурой в случае выполнения для нее условия строгой стационарности [5]);
3) выбор моделей из класса моделей АРПСС для аппроксимации характерных структур и идентификация параметров моделей;
4) выполнение диагностических проверок полученных параметрических моделей, если погрешности удовлетворяют требованиям, модели готовы к использованию и переход на шаг 5, в противном случае изменение уровня m вейвлет-разложения и возврат на шаг 1;
5) объединение полученных представлений в общую многокомпонентную конструкцию вида:
до - т+т=5>'(офм О 2> ( (2)
j,k j
где fx (t) = ^ sk (t'faj k С - параметрическая составляющая многокомпонентной модели,
Pj hj
SÎ (0 = Q~ 'y',®Jnak-n(t) > У/ - параметры авторегрессии компоненты разложения уровня j,
1=1 п=1
со¡: 4 = V',c; ,(/). Pj - порядок авторегрессионной модели компоненты разложения уровня j, V’’ -оператор взятия разности порядка d, - параметры скользящего среднего компоненты уровня
j, hj - порядок модели скользящего среднего компоненты уровня / , а'к - ошибки модели
компоненты уровня 7, /2(0 = 2>|^ ~~ непараметрическая составляющая модели,
j
представленная комбинацией вейвлет-коэффициентов.
Если данные содержат аномалию, то предполагаем, что произойдет изменение их структуры, которое может быть обнаружено путем анализа остаточных ошибок модели при выполнении операции прогнозирования: если стандартное отклонение ошибки прогноза существенно возрастает, то это говорит об изменении структуры входных данных вследствие наличия в них аномалии.
Прогнозирование значения sJk+q, q > 1 определяет прогноз sJk в момент l = к с упреждением q. Значение sk на основе полученной модели (2) определяется следующим образом:
Рі
І
1=1
№-*-1 с
(0.
Остаточная ошибка модели на уровне разложения ] определяется как разность между прогнозным и фактическим значениями данных в момент времени ? = к + q :
к+д
к+д, прогноз
(0- ^ к+д, факгич (г).
Факт обнаружения аномалии определим на основе соотношения^, =
1 М
N
1У д=1
где N - длина окна наблюдения. В случае выполнения условия АЫ>Р, где Р - порог, определяющий наличие аномалии в данных, в пределах анализируемого временного окна имеем аномалию.
Результаты экспериментов с ионосферными данными
В процессе исследований были обработаны данные критической частоты ионосферного слоя Б2 за период 1969-2006 гг., регистрацию данных ведет Институт космофизических исследований и распространения радиоволн ДВО РАН (Камчатский край, с. Паратунка). В качестве базисных функций использовался класс ортогональных вейвлетов Добеши: ^2, ^3, ^4. Вариации критической частоты содержат пропуски, что существенно затрудняет процесс построения моделей.
С целью уменьшения погрешности получаемых результатов были выбраны временные периоды с наименьшим количеством пропусков. Учитывая сезонный характер ионосферного процесса, данные предварительно были разделены на сезоны. В работе [3] представлены результаты моделирования данных зимнего периода времени, в представленной работе эти результаты дополнены данными летнего периода времени. Кратномасштабное разложение данных на компоненты выполнялось до 3-го уровня включительно. Попытка идентификации моделей АРПСС была выполнена для исходных данных и аппроксимирующих компонент 1-го, 2-го и 3-го уровней. Диагностические проверки полученных моделей показали, что структура исходных временных рядов и компонент 1 -го, для некоторых лет 2-го уровня разложения является сложной, и они не могут быть аппроксимированы моделью АРПСС (наблюдалась существенная автокорреляция остатков [3]). Наилучшие результаты при диагностике моделей АРПСС были получены для аппроксимирующих компонент 3-го уровня разложения. Анализ остаточных ошибок моделей показал, что наилучшую аппроксимацию данных позволяет получить базисная функция ^3. Результаты моделирования данных зимнего периода времени показали, что все АРПСС модели компонент 3-го уровня разложения имеют второй порядок и близкие значения параметров, что позволило определить общую модель, имеющую вид [3]:
ДО = !>*(')Фэ,*<>1Ж’ ^3(О = (1 + 0,95)2(1-5К(О + аЛО, (3)
где = со, ,(/). «,(/) - остаточные ошибки модели.
В процессе анализа моделей данных зимнего периода времени были выделены аномалии [3], возникающие в периоды повышенной солнечной и сейсмической активности.
Результаты моделирования данных летнего периода времени показали, что все АРПСС модели компонент 3-го уровня разложения имеют третий порядок. В приведенной ниже таблице представлены параметры моделей этих компонент.
Таблица 1
Параметры моделей данных2 летнего периода времени
Временной интервал Значение первого параметра АР модели Значение второго параметра АР модели Значение третьего параметра АР модели
06.05.1969-25.05.1969 -0,4095 -0,4951 0,2449
08.08.1970-31.08.1970 -0,3975 -0,3852 0,5787
26.06.1972-22.07.1972 -0,2267 -0,3485 0,2228
04.05.1979-23.05.1979 -0,652 -0,692 0,1547
01.05.1982-30.05.1982 -0,3909 -0,3449 0,4816
Особо следует отметить момент яркого проявления в результатах моделирования солнечного одиннадцатилетнего цикла (1970, 1982 гг., отмечены в таблице серым цветом). Модели этих лет имеют наиболее близкие значения параметров. Анализ данных сейсмического
п=1
3,к
каталога и их сопоставление с результатами моделирования также показали, что в летние периоды времени, имеющие повышенную сейсмическую активность (1970, 1972, 1982 гг.), параметры моделей отличаются от параметров сейсмически спокойных периодов времени (1969, 1979 гг.). На рис. 1, 2 показаны исходные временные ряды и полученные аппроксимирующие компоненты 3-го уровня разложения, стрелками отмечены моменты возникновения землетрясений, произошедших за анализируемый период (22 августа и 30 августа 1970 г).
Рис. 1. Исходный временной ряд, период регистрации 08.08.1970-31.08.1970 (а); аппроксимирующая компонента 3-го уровня разложения (б); стрелками отмечены моменты возникновения землетрясений
Рис. 2. Исходный временной ряд, период регистрации 04.05.1979-23.05.1979 (а); аппроксимирующая компонента 3-го уровня разложения (б)
Выводы
В работе предложен метод моделирования данных критической частоты ионосферы, в основе которого лежит совмещение методов авторегрессии - проинтегрированного скользящего среднего и вейвлет-преобразования. Построены модели данных^2 зимнего и летнего периодов времени. В
62
процессе моделирования данных обнаружены аномалии, возникающие в периоды повышенной солнечной и сейсмической активности.
Работа поддержана грантом Президента Российской Федерации МД-2199.2011.9, грантом РФФИ - ДВО РАН №11-07-98514-р_восток_а, грантом «У.М.Н.И.К.» - 2011 г. (протокол заседания Экспертного совета от 19 мая 2011 г.).