УДК 519.246.8+519.254
Вестник СПбГУ. Сер. 1. Т. 3(61). 2016. Вып. 1
УЛУЧШЕНИЕ РАЗДЕЛИМОСТИ ВРЕМЕННЫХ РЯДОВ В АНАЛИЗЕ СИНГУЛЯРНОГО СПЕКТРА С ПОМОЩЬЮ ОДНОГО МЕТОДА АНАЛИЗА НЕЗАВИСИМЫХ КОМПОНЕНТ*
Н. Э. Голяндина, М. А. Ломтев
Санкт-Петербургский государственный университет,
Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7-9
Разделение компонент сигнала является важной задачей в анализе временных рядов, решение которой позволяет, в частности, выделить тренд и разделить гармонические сигналы разных частот. В работе рассматривается модификация метода анализа сингулярного спектра (singular spectrum analysis, SSA) для улучшения разделимости компонент временного ряда. Новый метод называется SSA-AMUSE. Такое название связано с использованием метода AMUSE при анализе независимых компонент для разделения сигналов. Предлагаемая модификация ослабляет условия так называемой сильной разделимости, приводя к улучшению точности разделения компонент по сравнению с аналогичным методом. В работе приведено обоснование алгоритма SSA-AMUSE, а также получены условия разделимости для нового метода. Кроме точной разделимости также рассмотрена асимптотическая разделимость при длине ряда, стремящейся к бесконечности. Применение условий разделимости продемонстрировано для случая двух гармоник. Было показано, что условия разделимости с помощью SSA-AMUSE не зависят от соотношения амплитуд гармоник, в то время как базовый метод SSA требует разных амплитуд для разделимости. На численном примере показано преимущество разработанного метода SSA-AMUSE по сравнению с существующим аналогом. Библиогр. 9 назв. Ил. 1.
Ключевые слова: анализ сингулярного спектра, анализ независимых компонент, временные ряды, разделимость.
Введение. В анализе временных рядов есть важная задача представления наблюдаемого ряда в виде суммы интерпретируемых компонент, таких как тренд, периодики, шум. Одним из методов, решающих эту задачу без задания параметрической модели компонент, является метод анализа сингулярного спектра (singular spectrum analysis, SSA, см. монографии [1, 2] и ссылки в них). Идея метода состоит в построении так называемой траекторной матрицы временного ряда, ее сингулярном разложении с последующей группировкой матричных компонент сингулярного разложения и в переходе обратно от сгруппированного матричного разложения к разложению временного ряда.
Понятие разделимости компонент временного ряда связано со способностью метода с помощью правильной группировки выделить эти компоненты из наблюдаемой суммы. Слабая разделимость рядов и x(2) означает, что существует такое сингулярное разложение траекторной матрицы ряда x = x(1) + x(2), которое можно разделить на две группы, одна из которых соответствует
х(1), а вторая — x(2). Сильная разделимость означает, что для любого сингулярного разложения это так.
В ряде случаев, например в случае слабой разделимости двух синусов с разными частотами и одинаковыми амплитудами, сильная разделимость отсутствует [3].
Возникает задача построения другого оптимизационного критерия, который мог бы сильно разделить компоненты, не разделённые с помощью SSA, использующего оптимальные свойства сингулярного разложения. Метод решения этой задачи, на-
* Работа выполнена при финансовой поддержке РФФИ (грант №15-04-06480). (¡5 Санкт-Петербургский государственный университет, 2016
зываемый DerivSSA, был предложен в работе [4]. Метод DerivSSA меняет вклады компонент, рассматривая не только сам ряд, но и его производную.
Метод, предлагаемый в этой работе, использует идею метода анализа независимых компонент (independent component analysis, ICA [5]). В [2] упоминается использование FastICA для разделения компонент в рамках SSA, но там применяется метод ICA, который исходно был разработан для анализа многомерных данных [5, 6]. Здесь мы будем использовать метод AMUSE, предложенный для разделения случайных сигналов [5, 7, 8] и более подходящий для анализа временных рядов.
Опишем структуру работы. В разделе 1 кратко рассматриваются метод Basic SSA и понятия разделимости, связанные с ним. В разделе 2 описан предлагаемый метод SSA-AMUSE и проведено его обоснование. В разделе 3 доказываются утверждения относительно условий разделимости с помощью предлагаемого метода и приводятся примеры. В частности, результаты показывают, что метод SSA-AMUSE, в отличие от Basic SSA, разделяет гармонические компоненты независимо от значений амплитуды. В разделе 4 представлено численное сравнение методов SSA-AMUSE и DerivSSA на примере и показано преимущество первого.
1. Метод Basic SSA. Рассмотрим вещественнозначный ненулевой временной ряд = (xi,... ,xN). Пусть L (1 < L < N) — целое число, называемое длиной окна, и K = N - L + 1.
( H)
Обозначим Ml,k линейное пространство матриц размера L х K, ML K —линейное пространство ганкелевых матриц размера L х K, Xi = (xi,...,xi+L-i)'T, i = 1,...,K, и X = [Xi : ... : XK] — L-траекторную .матрицу ряда . Введём оператор вложения T : RN ^ ML,K как T(XN) = X и ортогональный проектор H (по норме Фробениуса) из ML,K в mS^K.
Согласно [1, гл. 1] коротко опишем алгоритм Basic SSA. Метод состоит из четырёх шагов.
Шаг 1. Вложение. Выберем длину окна L, 1 < L < N. На этом шаге исходный ряд переводится в траекторную матрицу X = T(XN).
Шаг 2. Сингулярное разложение. В результате шага получаем сингулярное разложение траекторной матрицы X: X = y/\[UiV^ + ... + л/XdUaVj = Xi + ... + Xd. Здесь d = rank X, элементарные матрицы Xi имеют ранг 1 и упорядочены по убыванию сингулярных чисел т/Л7- Набор (\/Аi,Ui,Vi) называется i-й собственной тройкой.
Шаг 3. Группировка. На основе полученного на втором шаге разложения делим множество индексов {1 ,...,d} на m непересекающихся подмножеств Ii,...,Im.
Результирующей матрицей X/, соответствующей некоторой группе индексов I, называется матрица X/ = Xi. Вычисляя результирующие матрицы по каждому
iei
подмножеству Ii ,...,Im, получаем X = X/l + ... + X/m. Процедура выбора подмножеств Ii, ...,Im называется группировкой собственных троек.
Шаг 4. Диагональное усреднение. Получим ряды, применив к результирующим матрицам диагональное усреднение: XX(k) = HX/k, = T-iX(k).
m ~(k)
Таким образом, исходный ряд раскладывается в сумму рядов: = Y1 XrN'. К
k=i
примеру, при правильной группировке подобным образом можно получить разложение ряда на тренд, сумму гармоник и шум.
1.1. Разделимость. Дадим общие определения сильной и слабой разделимости. Пусть наблюдаемый ряд имеет вид Xn = xN + XN2). Пусть X, X(1) и X(2) — соответствующие L-траекторные матрицы. Обозначим X(L,1) и линейные пространства, порождённые столбцами матриц X(1) и X(2), а X(K,1) и X(K,2) — линейные пространства, порождённые их строками. Пусть есть метод A, который представляет траекторную матрицу X в виде суммы элементарных матриц, причём, возможно, не единственным способом.
Определение 1. Ряды Xff и Xff назовём слабо L-разделимыми методом A, если существует такое разложение траекторной матрицы X на элементарные, полученное методом A, которое можно разбить на две группы элементарных матриц так, что каждая даёт в сумме X(1) и
x(2) соответственно.
Определение 2. Ряды Xff и Xff назовём сильно L-разделимыми методом A, если любое разложение траекторной матрицы X на элементарные, полученное методом A, можно разбить на две группы элементарных матриц так, что каждая даёт в сумме X(1) и X(2) соответственно.
В [1, разд. 1.5 и 6.1] содержатся следующие факты о разделимости.
Утверждение 1. Ряды Xff и Xff слабо L-разделимы методом Basic SSA тогда и только тогда, когда линейные пространства X(L,1) и X(L'2), X(K,1) и
X(K'2) ортогональны.
Утверждение 2. Ряды X^ и Xff сильно L-разделимы методом Basic SSA тогда и только тогда, когда ряды X^ и Xff слабо L-разделимы и множества сингулярных чисел траекторных матриц X(1) и X(2) не пересекаются.
Заметим, что определения 1 и 2 не противоречат определениям, данным в [1, разд. 1.5 и 6.1] для разделимости методом Basic SSA, так как утверждения 1 и 2 дают возможность для двух эквивалентных определений слабой и сильной разделимости. Класс разделимых методом Basic SSA рядов описан в [9].
1.2. Ряды конечного ранга. ЛРФ. Дадим определение ряда конечного ранга и ряда, управляемого линейной рекуррентной формулой (ЛРФ) [1, гл. 5].
Определение 3. Ряд XN называется рядом конечного ранга d < N/2, если его L-траекторная матрица имеет ранг d при любом L > d таком, что d < min (L, K).
Определение 4. Ряд XN называется рядом, управляемым линейной рекуррентной формулой (ЛРФ) порядка t, 1 < t < N — 1, если существуют a1,..., at, at = 0, такие, что
t
xi+t = ^2 akxi+t-k, 1 < i < N — t. (1)
k=1
Если порядок t минимально возможный, ЛРФ (1) называется минимальной. Минимальная ЛРФ единственна.
Если ряд управляется минимальной ЛРФ порядка d < N/2, он является рядом конечного ранга d.
2. Алгоритм SSA-AMUSE. Пусть наблюдаем ряд x = xn = (xi,... ,xN) длины N и xn = xN + xN2).
Приведём алгоритм, который позволяет решать проблему отсутствия сильной разделимости слабо разделимых рядов. При этом слабо разделимые ряды остаются по-прежнему слабо разделимыми при немного изменённых условиях на длину ряда и длину окна.
В методе Basic SSA базис строится на основе собственных векторов матрицы XXT. В настоящей статье сингулярное разложение заменяется разложением, используемым в методе AMUSE для разделения независимых компонент сигнала. Поэтому будем называть предлагаемый нами метод SSA-AMUSE.
Метод AMUSE [5] не обладает аппроксимационными свойствами, в частности не предназначен для отделения сигнала от шума. Поэтому метод SSA-AMUSE применяется как вложенный метод, уточняющий разложение, полученное с помощью Basic SSA: вначале с помощью Basic SSA получаем оценку траекторной матрицы интересующего нас сигнала, потом полученную матрицу раскладываем с помощью SSA-AMUSE.
Таким образом, на первом этапе мы строим обычное сингулярное разложение L-траекторной матрицы X. Выделяем группу неразделившихся компонент с индексами I, \I\ = r. Обозначаем Y = X/ сгруппированную матрицу этих компонент размерности LxK ранга r. С помощью метода SSA-AMUSE строим разложение матрицы
i
Y = Y(1) + ... + Y(r). После группировки согласно разбиению I = У Jk и после-
k=i
дующего диагонального усреднения так же, как в Basic SSA, получаем разложение Yn = yN + ... + YNN), где YN = T-1HYjk.
В алгоритме SSA-AMUSE кроме параметра длины окна L присутствует сдвиговый параметр т > 1. Мы будем описывать алгоритм с произвольным т. Однако для получения сильной разделимости достаточно значения т = 1.
В разделе 2.1 приведём вспомогательные утверждения, необходимые для обоснования алгоритма, сформулированного в разделе 2.2. Введём обозначение, которое является ключевым для алгоритма и связывает его с методом AMUSE анализа независимых компонент.
Пусть B — произвольная матрица из Ma,b и т — некоторое положительное целое
_(т\
число, г < min (А, В). Обозначим В матрицу В без первых г строк, В(т) — матрицу B без последних т строк, (т)\B — матрицу B без первых т столбцов, В\(т) —матрицу В без последних т столбцов.
Положим
Ст (B) =0.5
в{т))тв(т) + (в(т))тв(т)
еМв,в. (2)
2.1. Вспомогательные утверждения
Лемма 1. Пусть Y G ML,K, rankY = r, т < K/2. Рассмотрим некоторое сингулярное разложение матрицы [(т)|Y : Y|(T)] = UAi/2TT, где Ai/2 G Mr,r — диагональная матрица с сингулярными числами на диагонали, U G ML,r — матрица левых сингулярных векторов и T G M2K-2T,r — матрица правых сингулярных век-
торов, тогда Т = Q^ : Q , где Q = YTUA ll2.
■О) J
Доказательство. Матрица [(т)|У:У|(т) имеет ранг г, так как по условию включает все столбцы матрицы V. Сингулярное разложение матрицы (т)|У:У|(т)] можно записать в виде [(т)|У : У|(т)] = [ил1/2 (Т(1))т : ИА1/2 (Т(2))т] , где Т(1) = ((т)|У)Т ИА-1/2 и Т(2) = (У|(т))т ИА-1/2. Теперь возьмём д = УтИА~1/2. Равенства С^ = Т1-1) и ^^ = Т1-2-1 следуют из правил перемножения матриц. ■
Замечание 1. Так как несложно показать, что столбцы матрицы И образуют ортонормированный базис пространства столбцов матрицы У, получаем У = ИИТУ.
Следствие 1. У = ИА1/2дТ.
Доказательство. Следует из Ц = УтИА~1/2 и замечания 1. ■
Заметим, что столбцы матрицы Ц не являются ортогональными и нормированными.
Лемма 2. Пусть матрица Ц € Мк,Г и Ст(Ц) = WDWT —некоторое спектральное разложение Ст(Ц). Тогда D = Ст(Я), где Я = QW, и, следовательно, Ст(Я) — диагональная матрица.
Доказательство. Выводится подстановкой Я = QW в Ст(Я) и перемножением матриц. ■
Следующая теорема обосновывает разложение, которое является результатом работы метода SSA-AMUSE.
Теорема 1. Пусть У, д, А, И и г определены в лемме 1 и сдвиг т < К/2, а W и Я =
г л
[£1 : ... : ЯГ] определены в лемме 2. Тогда имеет место разложение У = ^ ,
г=1
где 111 — столбцы матрицы И = ИА1/2 W.
^ Г ^
Доказательство. По следствию 1 и лемме 2 У = ИА1/2WST = и= £ ЩБТ,
где Ui — столбцы матрицы U = UA^W.
i=i
2.2. Алгоритм. Как уже говорилось, алгоритм SSA-AMUSE строит разложение некоторой сгруппированной матрицы Y = X/, которая была получена на третьем шаге метода Basic SSA и является приближением ранга r траекторной матрицы ряда Yn = T-1HY. Алгоритм устроен следующим образом.
Алгоритм SSA-AMUSE
Вход: матрица Y размера L х K ранга r, сдвиг т < K/2.
1. Строим сингулярное разложение матрицы [(т)|Y : Y имеет вид [(т)|У : У|(т)] = UA1/2 [(q(t))T : (Q(t))T
(т)], которое по лемме 1 , где Q = YTUA-1/2.
2. Получаем W = [Ш1 : ... : ШГ], где Ш^, г = 1,...,г, — собственные векторы матрицы Ст (д).
3. Вычисляем S = [Si : ... : Sr] = QW.
4. Строим u
Ui :
ua1/2w.
5. По теореме 1 имеем У = иЯт. Поэтому получаем разложение на элементарные матрицы
г
У = Yi, где Yi = и БТ. (3)
¿=1
i
6. Проводим группировку: разбиваем {1,...,т} = У Jm, считаем результирую-
m=i
щие матрицы YJm = Yk, получаем разложение Y = Yj1 + ... + Yj.
kG Jm
7. Восстанавливаем компоненты ряда: = ^^ + ... + , где Y^ = T-1HYJk. Результат: разложение ряда YN на сумму компонент: YN = If^1 + ... + YД-1.
3. Разделимость. Далее будем считать, что матрица Y = X/ в алгоритме SSA-AMUSE является траекторной матрицей X исходного ряда Хд, соответственно т = d, I = {1,...,т}. В общем случае группа I может соответствовать компоненте ряда, сильно отделимой от остатка.
3.1. Вспомогательные утверждения. Будем рассматривать ряды XN, X^
(2)
и Хд/ конечного ранга, управляемые ЛРФ порядка d, di и d2 соответственно, и пространства строк X(K), X(K,1) и X(K'2) их траекторных матриц X, X(1) и X(2). Предположим, что Хд = хД1 + и d = di + d2. Докажем несколько утверждений о свойствах траекторных пространств.
Обозначим X(K) |(т), X(K,1) |(т) и X(K'2) |(т) —пространства строк матриц X|(т), X(1)|(r) и X(2)|(T) и также (т) |X(K), (т^X^1 и (т)|X(K'2) — пространства строк матриц (т)|X, (т)|X(1) и (т)|X(2).
Лемма 3. Если ряд XN управляется минимальной ЛРФ порядка d < N/2, т < min(K — d, (L — d) /2), то X(K) |(т) = (т) | X(K). При этом dim (X(K) |(т^ = dim ((т) |X(K)) =dim (X(K)) = d.
Доказательство. Так как в матрице X|^) строки с т+1 по L совпадают со строками с первой по L — т матрицы (т) |X, то для доказательства равенства подпространств остаётся показать, что строки с первой по т матрицы X^) принадлежат пространству (т)|X(K) и строки с L — т +1 по L матрицы (т)|X принадлежат X^1^). Действительно, это верно, так как ряд управляется ЛРФ порядка d < L — 2т, и указанные строки являются линейными комбинациями совпадающих строк.
Докажем те(перь рав)енство р(азмерно)стей неп(олного и) полног(о прос)транств. Очевидно, что dim (X(K-|(т)) = dim ((т)|X(K^ и dim (X(K)|(T)) < dim (X(K^. Рассмотрим базис Vi,.. .,Vd в X(K составленный из d линейно независимых столбцов матрицы X. Соответствующие ему векторы V\..., Vd^ & линейно независимы, так
как иначе их можно было бы достроить по ЛРФ порядка d < K — т до зависимых векторов, совпадающих по однозначности с V1,...,Vd. Лемма доказана. ■
Ur
Приведём ещё одну лемму, которая будет использована в выводе условий сильной SSA-AMUSE разделимости.
Лемма 4. Пусть S — -некоторая матрица ранга d такая, что для фиксированного т > 0 выполняется CT(S) = diag (ji,..., jd), где j1 > j2 > ... > , и W — некоторая ортогональная матрица. Обозначим Q = SWT. Если для некоторых подмножеств I1 С {1,...,d} и I2 = {1,...,d} \Ii множества [ji, i G Ii} и [jj,j G I2} не пересекаются, то для любого спектрального разложения матрицы CT (Q) = HDHT с собственными числами, упорядоченными по убыванию, выполнено
1. D = CT(S),
2. span (Hk : k G Ii) = span [Wi : l G I^ и span (Hk : k G I2) = span (Wi : l G I^j,
где Hi, i = 1,. ..,d, — столбцы матрицы H, Wj, j = 1,...,d, — столбцы матрицы W.
Доказательство. По лемме 2 матрицы CT(Q) и CT(S) подобны, поэтому совпадают их собственные числа, что доказывает первый пункт леммы. Также из подобия матриц следует, что столбцы матрицы W являются ортонормированными собственными векторами матрицы CT (Q). Так как подмножества собственных чисел не пересекаются, то подпространства собственных векторов, соответствующие этим подмножествам, определены однозначно. При этом векторы Wi, i G Ii, и Wj, j G I2, являются ортогональными базисами этих подпространств, а векторы Hi, i G Ii, и Hj, j G I2, образуют другие ортогональные базисы этих же подпространств. ■
3.2. Условия разделимости. Пусть XN = + XrN , Y(1) и Y(2) — траек-торные матрицы рядов XN и X^. В дальнейшем будем считать, что неравенство т < min (K/2, K — d, (L — d)/2) выполнено.
Несложно увидеть, что если пространства строк (т) | X(K'1) и (т) I X(K2) матриц
(т) |Y(1) и (т) |Y(2) ортогональны, то ряды XN и X(N слабо SSA-AMUSE -разделимы. Получим необходимые и достаточные условия SSA-AMUSE-разделимости.
Теорема 2. Ряды X^ и XN слабо SSA-AMUSE-разделимы тогда и только тогда, когда
Y(1) |(.
Т )
Y |(2) Y |(Т)
+(Т) |Y(1)L) |Y(2)
(4)
T
T
г it г
Y(1)|(Т) (T)|Y(2) +(Т) |Y(1) Y(2)|(.
(T )
0.
(5)
Доказательство. Приведём схему доказательства.
Необходимость. В обозначениях теоремы 1 существует W такая, что для Я = QW = [й^,...,^] матрица СТ(Я) диагональна, и базис {81,...,8,1} пространства Х(к) можно разбить на подмножества |5(1),..., и ..., й^} так, что пер-
вое составляет базис Х(к1), а второе —базис Х(к'2). Переупорядочим столбцы Я и W
так, что
S(') =
S
(i) .
S
(i)
QW(i), г = 1, 2, S = [S(1) : S(2)], W = [W(1) : W(2)].
T
Обозначим Е(г) =
столбцам
т(2)
: Б(')
(т )
. Столбцы матрицы
при этом столбцы матрицы Е(г) образуют ортогональный базис строк
7(1)
ортогональны
матрицы [(т)|У(г) : У(г) |(т). Отсюда следует равенство (4). Используя определение 1 разделимости , можно показать , что матрица р(о=ил 1/2у(4) (У00) ТЛ-1/2ИТ задает ортогональный проектор на пространство столбцов матрицы У(г). Воспользовавшись этим, выведем второе условие из диагональности матрицы Ст(Я). Матрица может быть записана в виде
Ст (Я)
Ст (Я(1)) С(1'2) (С(1'2))т Ст (Я(2))
где
С(1'2) = (у(1))ТЛ-1/2ИТ [у(1)|(т) ((т)|У(2^Т +(т) |У(1) (у(2)|(т))
ИЛ-1/2У(2)/2
и равно нулю по условию диагональности. Домножим выражение для справа
на (У(г))Т Л-1/2ИТ и слева на ИЛ1/2У(г), воспользуемся свойствами проекторов Р(г) и получим условие (5).
Достаточность. По условию (4) и теореме 1 существуют матрицы Я(1) и чьи столбцы образуют базисы Х(к,1) и Х(к'2), причем столбцы матрицы Е(1) ортогональны друг другу и столбцам Е(2) (матрицы Е(г) определяются так же, как при доказательстве необходимости). Отсюда можно вывести, что столбцы матрицы Я = образуют базис Х(к). Из условия (5) следует, что матрица Ст(Я) диаго-нальна. Далее рассмотрим выражения (т)|У(г) : У(г) |(т) = (т)|У : У|(т) Е(г) (Е(г))Т.
Заменим (т)|У : У|(т) на ее сингулярное разложение ИЛ1/2 (д(т)) : (Дт))
при этом Ц = для некоторой ортогональной матрицы У = [У(1) : У(2)
Я(г) = ЦУ(г). После несложных преобразований получим [(т)|У(г) : У(г) |(т) = ИЛ1/2У« (Е^))1
. Но У(г) = Л«(8(г)) для некоторой матрицы Л(г) (так как столбцы Я(г) составляют базис строк У(г)) и (т)|У(г) : У(г)|(т)] = Л(г) (Е(г))Т. Поэтому
Л(0 = ИЛ1/2У« и У(4) = ИЛ1/2У(4) (Я(4))Т. ■
Следствие 2. Если Х(к,1) |(т) ортогонально
Х(к'2) |(т)г
то ряды слабо ББЛ-ЛМПБЕ-
разделимы.
Замечание 2. По лемме 3 Х(кг) |(т) =(т) |Х(кг),
поэтому вместо Х(к'г) |(т) в следствии 2 можно использовать (т) |Х(к'г).
Рассмотрим сингулярные разложения
(т )|
|У(<) : У(4)|(т)] = И(4) (л(<))
1/2
(т)
«
(т)
г = 1, 2,
(6)
т
т
г
т
т
т
как в лемме 1.
Теорема 3. Пусть ряды X^ и X^ слабо SSA-AMUSE-разделимы, Y(1) и Y(2) — их траекторные .матрицы, а матрицы Q(i), г = 1, 2, определены равенством (6). Тогда сильная SSA-AMUSE-разделимость равносильна тому, что множества собственных чисел матриц CT(Q(1)) и CT(Q(2)) не пересекаются.
Доказательство. Доказательство теоремы основывается на лемме 4, в силу которой компоненты разложения, соответствующие разделяемым компонентам ряда, не могут перемешаться. ■
Заметим, что условия сильной разделимости не зависят от выбора базисов Q(i), г = 1, 2, удовлетворяющих условиям теоремы.
Следующее утверждение показывает, как связаны условия слабой разделимости при применении Basic SSA и SSA-AMUSE. Его доказательство непосредственно следует из формулировки условий разделимости.
Утверждение 3. Пусть Х^+Т и Х^+Т — ряды длины N + т, управляемые ЛРФ порядка d < N/2, при этом ряды XN из первых N элементов Х^+Т слабо разделимы методом Basic SSA при длине окна L. Пусть также т, L, K = N — L +1 и d такие, что т < min (K/2,K — d, (L — d)/2). Тогда
1. xN]+t и Х^+Т слабо SSA-AMUSE-разделимы при том же L и сдвиге т;
2. если т < (L — d) /3, то X^ и X^ слабо SSA-AMUSE-разделимы при длине окна L — т и сдвиге т.
Замечание 3. Заметим, что для SSA-AMUSE-разделимости достаточно только ортогональности отрезков ряда длины K—т и не нужна ортогональность отрезков ряда длины L, в то время как для Basic SSA условия разделимости зависят как от K, так и от L.
3.3. Примеры слабой и сильной разделимости. Приведём примеры, в которых проявляются особенности и плюсы SSA-AMUSE разделимости. Ниже будем рассматривать только случай т = 1, так как при нём проявляются все преимущества метода SSA-AMUSE.
1. Приведём пример того, что условие (т) \X(K¡1) ± (т)|X(K'2) является лишь достаточным условием слабой разделимости. Рассмотрим x(1) = (cos nn, n = 1,..., N) и x(2) = (const, n = 1,..., N). Если K чётно, то при т =1 пространства (т) \X(K'1) и (т)\X(K'2) не ортогональны, однако условия (4) и (5) выполнены. Таким образом, данные ряды слабо SSA-AMUSE-разделимы.
2. Получим условия сильной разделимости двух гармоник. Рассмотрим ряды x(1) и
X(2)
длины N с общими членами в виде xП = Ai sin (2nnw¿ + Yi), n = 1,..., N, 0 < < 0.5, Ш1 = W2. Докажем, что если (K — 1)w1 и (K — 1)w2 целые, то ряды сильно SSA-AMUSE-разделимы. Слабая разделимость следует из (т)\X(K,1) ±(т) \X(K,2). Сильную разделимость можно доказать следующим образом. Пусть для определённости < 0.5. В этом случае найденный на шаге 3
алгоритма SSA-AMUSE базис из столбцов матрицы S можно разбить на базисы пространств и вида
S(i) = (A sin + Zi) ,...,Asrn(2nu>iK + Zi ))T , S22i) = (A cos (2n^i + Zi) ,...,A cos (2nuK + Zi))T , где A = 1 /л/К - 1.
К тому же для таких базисов каждая из матриц CT(S(i)), i = 1, 2, диагональна, при этом на диагоналях стоят числа cos (2nwi)/2, они же являются собственными числами этих матриц. Поэтому условия сильной разделимости в теореме 3 выполнены.
Заметим, что в случае применения алгоритма SSA-AMUSE полученные на шаге 3 столбцы матрицы S будут упорядочены по значениям cos(2nwi), в то время как в Basic SSA они упорядочены по амплитудам Ai. Упорядоченность по Ai приводит к смешиванию в случае совпадающих амплитуд.
3.4. Асимптотическая разделимость методом SSA-AMUSE. Конечно, в реальных задачах условия точной разделимости редко выполнены и имеет место приближённая разделимость, которая является следствием асимптотической разделимости.
Пусть x(i) = ,x<2),...j, i = 1, 2, — бесконечные ряды, управляемые ЛРФ. Обозначим x = X,..., x ^ .
Понятие асимптотической слабой разделимости методом SSA-AMUSE рядов и x(2) определяется аналогично асимптотической разделимости в случае Basic SSA с помощью замены условия точной ортогональности на асимптотическую при длине ряда N, стремящейся к бесконечности. При этом в случае SSA-AMUSE не требуется, чтобы L также стремилось к бесконечности, и достаточно, чтобы только K = N — L + 1 ^ж при N ^ж (см. замечание 3).
Таким образом, те ряды, которые были слабо асимптотически разделимыми методом Basic SSA, остаются слабо асимптотически разделимыми с помощью SSA-AMUSE, при этом L может не стремиться к бесконечности.
Отдельно остановимся на понятии асимптотической сильной разделимости. Условием сильной разделимости в SSA-AMUSE является дизъюнктность множеств собственных чисел матриц CT(S(K,i)), где S(K,i) —матрицы, чьи столбцы содержат базисы, найденные на шаге 3 алгоритма SSA-AMUSE, применённого к траекторным матрицам рядов x^). Условием асимптотической сильной разделимости асимптотически слабо разделимых рядов назовём дизъюнктность множеств предельных собственных чисел матриц CT(S(K,i)) при K ^ ж, если такие пределы существуют.
Метод SSA-AMUSE ослабляет условия метода Basic SSA и для асимптотической сильной разделимости. А именно, гармоники
X(1)
и
X(2)
с общими членами в виде
хП = Ai sin(2nnwi + Yi), п = 1, 2,..., являются асимптотически сильно разделимыми даже при совпадающих амплитудах при K ^ ж. Это доказывается непосредственным вычислением собственных чисел матриц
CT (S(Kii)).
4. Сравнение. Так как оба метода — предлагаемый в статье SSA-AMUSE и введённый в [4] DerivSSA — используются для ослабления условий сильной разделимо-
сти, возникает задача их сравнения. У методов много общего. В частности, оба они являются вложенными, т. е. используются уже после выделения сигнала из шума.
0.4
Л/,
rv\
DeivSSA
---SSA-AMUSE
0.0 -L
J
i—i—i—i—i—i—i—i—i—i—Г 0.01 0.03 0.05 0.07 0.09 0.11
"1-1-1-1-1-1-1-1-1-1-1-1-1-1
0.13 0.15 0.17 0.19 0.21 0.23 0.25
RMSE-оценки xiV в зависимости от Ш2
Из преимуществ SSA-AMUSE перед DerivSSA можно отметить возможность точной разделимости компонент, которая отсутствует в DerivSSA. Также, для случая приближённого или асимптотического разделения гармоник в DerivSSA накладываются некоторые дополнительные условия на амплитуды, в то время как в SSA-AMUSE такие условия отсутствуют. Некоторым недостатком SSA-AMUSE можно считать то, что получаемое разложение не является разложением на ортогональные по Фробениусу матрицы.
Тем не менее перечисленные преимущества SSA-AMUSE приводят к повышению точности разделения компонент временного ряда. Продемонстрируем это на численном эксперименте. Пусть XN = Х^ + Х^, где общий член хП^ = 8т(2пп^), п = 1,...,М. Параметр Ш1 = 1/7, ш2 меняется от 0.01 до 0.25 с шагом 0.001, длина ряда N = 150, длина окна Ь = 75, сдвиг т = 1 ив DerivSSA параметр 7 = 10. На рисунке изображены кривые, характеризующие ошибки RMSE-оценки одной гармонической компоненты по наблюдаемой сумме двух синусов. Естественно, что при Ш2 ~ = 1/7 разделимости нет. Однако видно, что область с большой ошибкой вокруг Ш2 = 1/7 ~ 0.14 более узкая для SSA-AMUSE. При добавлении шума к сигналу результат сравнения аналогичен.
Литература
1. Golyandina N., Nekrutkin V., Zhigljavsky A. Analysis of Time Series Structure: SSA and Related Techniques. Chapman & Hall/CRC, 2001.
2. Golyandina N., Zhigljavsky A. Singular Spectrum Analysis for Time Series. Springer Briefs in Statistics. Springer, 2013.
3. Голяндина Н., Некруткин В., Степанов Д. Варианты метода «Гусеница^-SSA для анализа многомерных временных рядов // Труды II Международной конференции «Идентификация систем и задачи управления» SICPRO'03. Москва, 2003. C. 2139-2168.
4. Golyandina N., Shlemov A. Variations of singular spectrum analysis for separability improvement: non-orthogonal decompositions of time series // Statistics and Its Interface. 2015. Vol. 8, N 3. P. 277-294.
5. Hyvarinen A., Karhunen J., Erkki O. Independent Component Analysis. John Wiley & Sons, Inc., 2001.
6. Hyvarinen A. Fast and robust fixed-point algorithms for independent component analysis // Neural Networks, IEEE Transactions. 1999. Vol. 10, N 3. P. 626-634.
7. Tong L., Liu R. et al. Indeterminacy and identifiability of blind identification // IEEE Transactions on Circuits and Systems. 1991. Vol. 38, N 5. P. 499-509.
8. Belouchrani A., Abed-Meraim K. et al. A blind source separation technique using second order statistics // IEEE Transactions on Signal Processing. 1997. Vol. 45, N 2. P. 434-444.
9. Usevich K. On signal and extraneous roots in Singular Spectrum Analysis // Stat. Interface. 2010. Vol. 3, N 3. P. 281-295.
Статья поступила в редакцию 22 октября 2015 г.
Сведения об авторах
Голяндина Нина Эдуардовна — кандидат физико-математических наук, доцент; [email protected] Ломтев Максим Александрович — аспирант; [email protected]
IMPROVEMENT OF SEPARABILITY OF TIME SERIES IN SINGULAR SPECTRUM ANALYSIS BY MEANS OF A METHOD OF INDEPENDENT COMPONENT ANALYSIS
Nina E. Golyandina, Maksim A. Lomtev
St. Petersburg State University, Universitetskaya nab., 7-9, St. Petersburg, 199034, Russian Federation; [email protected], [email protected]
Separation of signal components is an important problem of time series analysis. For example, the solution of this problem allows one to extract a trend and to separate harmonic signals with different frequencies. In the paper, a modification of the singular spectrum analysis (SSA) methods is considered for improvement of separability of time series components. The new method is named SSA-AMUSE, since it is based on the method AMUSE used for application of independent component analysis to signal separation. The suggested modification weakens the conditions of the so-called strong separability and thereby improves the quality of separation of time series components with comparison with similar methods. The paper contains the proof of the algorithm and also the conditions of separability for the considered modification. Besides the exact separability, the asymptotic separability is also considered. The separability conditions are applied to the case of two harmonic time series. It appears that the separability by SSA-AMUSE does not depend on amplitudes of the separated harmonics, while the Basic SSA method needs different amplitudes. A numerical example demonstrates an advantage of the SSA-AMUSE method in comparison with a similar modification. Refs 9. Figs 1.
Keywords: singular spectrum analysis, independent component analysis, time series, separability.
References
1. Golyandina N., Nekrutkin V., Zhigljavsky A., Analysis of Time Series Structure: SSA and Related, Techniques (Chapman & Hall/CRC, 2001).
2. Golyandina N., Zhigljavsky A., Singular Spectrum Analysis for Time Series. Springer Briefs in Statistics (Springer, 2013).
3. Golyandina N., Nekrutkin V., Stepanov D., "Variants of the "Caterpillar"-SSA method for analysis of multivariate time series", Proceedings of II international conference "Identification of systems and control problems" SICPROO03 (Moscow, 2003, 2139-2168) [in Russian].
4. Golyandina N., Shlemov A., "Variations of singular spectrum analysis for separability improvement: non-orthogonal decompositions of time series", Statistics and Its Interface 8(3), 277-294 (2015).
5. Hyvarinen A., Karhunen J., Erkki O., Independent Component Analysis (John Wiley & Sons, Inc., 2001).
6. Hyvarinen A., "Fast and robust fixed-point algorithms for independent component analysis", Neural Networks, IEEE Transactions 10(3), 626-634 (1999).
7. Tong L., Liu R. et al., "Indeterminacy and identifiability of blind identification", IEEE Transactions on Circuits and Systems 38(5), 499-509 (1991).
8. Belouchrani A., Abed-Meraim K. et al., "A blind source separation technique using second order statistics", IEEE Transactions on Signal Processing 45(2), 434-444 (1997).
9. Usevich K., "On signal and extraneous roots in Singular Spectrum Analysis", Stat. Interface 3(3), 281-295 (2010).