Ъ-^~ Тубанов
ВЫДЕЛЕНИЕ ТРЕНДА ИЗ ВРЕМЕННЫХ РЯДОВ МАКРОЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ
Одно из наиболее часто употребляемых понятий, которое используется при анализе данных, включая временные ряды, - это понятие тренда. Часто тренд связывают с некоторыми тенденциями в изменении показателя [1] или с процедурами выделения более «гладкой» зависимости чем исходные данные. Причем в качестве таких процедур используют самые разные алгоритмы: регрессию по времени, взвешенную регрессию [2], скользящие средние [3] и другие процедуры. Даже такой прозорливый исследователь, как М. Кендалл, не дает определения тренда, а связывает его с конечным набором процедур, например, со сглаживанием скользящими полиномами [3].
В результате, понятие тренда приобретает некоторый мистический характер, поскольку по одному и тому же набору данных можно построить бесконечное множество трендов, и каждый из них будет в каком-то смысле разумен. Мистика развеивается в том случае, если посмотреть на тренд как на один из элементов некоторого функционального пространства, которое отвечает определенным требованиям. Тогда, сформулировав круг вопросов, ответы на которые можно было бы получить из анализа выделенных зависимостей (элементов пространства), можно определить само пространство.
Рассмотрим требования, которые предъявляются к зависимости х(/), если она претендует на роль тренда исходных данных - у(/). При сглаживании или построении модели авторегрессии для непрерывных функций переход от исходных данных к тренду осуществляется с помощью некоторого дифференциального (локального) оператора Ех(/)=Еу(/). Суммируя все требования, предъявляемые к трендам, можно выделить три условия, которыми определяются зависимости типа х(/).
1. Видом аппроксимации (оператор Е), которая используется для «сглаживания» исходных данных. Это могут быть скользящие средние [3], аппроксимация полиномиальными сплайнами [4] или какие-то другие методы (например, экспоненциальное сглаживание [1]).
2. Разбиением интервала (сетка аппроксимации - Д, временной масштаб - Д), на котором происходит аппроксимация исходной зависимости. Даже в простом случае равномерного разбиения интервала анализа [/0, А], от значения масштаба аппроксимации Д/ зависит конкретный вид тренда. Например, если исходная зависимость синусоидальная, типа яп(2л//Т), то отношение масштаба аппроксимации к периоду колебания - /УТ определяет результат аппроксимации1.
3. Необходимой степенью гладкости результирующей кривой - т, где т - порядок сглаживающего полинома или наибольшая степень дифференциального оператора Е.
Функции, удовлетворяющие трем вышеперечисленным условиям (определяющим свойствам тренда), принадлежат к аппроксимационно-му пространству Sp(L, Д, т) [5]. В свою очередь, можно показать [5], что имеет место точное включение:
Sp(L, Д, т)с^2т[/о, /1], где ^2т[/0, /1]сЕ2[/0, /1] - соответствующее пространство Соболева - пространство абсолютно непрерывных функций, включая их производные по т-1 порядок включительно; Е2[/0, /1] - гильбертово пространство с суммируемым квадратом («физическое пространство» для экономических показателей). При заданном дифференциальном операторе Е, разбиении Д и степени «гладкость» т, тренд определяется однозначно [5].
Таким образом, все локальные процедуры выделения тренда укладываются в схему аппроксимации исходной зависимости у(/) элементами пространства Sp(L, Д, т). Подобные алгоритмы производят усреднение данных на конечном временном интервале. Необходимо отметить, что при численной реализации процедуры аппроксимации временного ряда часть точек, равная порядку оператора Е, теряется. Поэтому, чем выше порядок Е, тем больше точек ряда должно быть на интервале наблюдения.
Любое усреднение порождает новые корреляционные связи между значениями ряда, которые отсутствовали в исходных данных. Это хорошо известный эффект Слуцкого-Юла [3, 7]2. Экспоненциальное сглаживание, как и взвешенная регрессия, определены с точностью до параметра, который порождает произвол в выборе степени сглаживания. Кроме того, экспоненциальное сглаживание сдвигает «переломы» тренда (точки смены знака у производной или первых разностей) вправо, что приводит к запаздыванию при определении момента смены тенденций. Это те недостатки, которые в разной степени присущи большинству методов локальной аппроксимации и, следовательно, сглаживающим алгоритмам выделения тренда.
1 В действительности, введена система масштабов: интервал дискретизации — Д и период колебания — Т.
Аналогичный эффект имеет место и при аппроксимации данных полиномиальными сплайнами нечетной степени [6].
Существует другой подход, который условно будем называть нелокальными методами выделения тренда. Качественно его суть можно пояснить следующим образом. Предположим, что исходный ряд можно представить в виде суперпозиции некоторого полинома степени т и набора колебаний с заданной системой периодов3. Тогда, исключая (вычитая) последовательно колебания с разными периодами из исходного ряда, приходим к зависимости, которая по определению должна быть более гладкой, чем исходный ряд. Поскольку каждое колебание определяется всеми точками исходного ряда, то становится понятно, почему эти методы называются нелокальными.
Классический пример такого подхода представляет собой разложение исходного ряда в ряд Фурье [8]. Если временная зависимость допускает периодическое продолжение на всю действительную ось, то ее можно (с некоторыми, не существенными для приложений, ограничениями) представить в виде бесконечного набора гармоник и некоторой постоянной. Именно постоянная и будет играть роль тренда в таком разложении. Коэффициенты при гармониках определяют спектральный состав исходного колебания и поэтому такой подход называют спектральным анализом.
Несмотря на широкое распространение спектрального анализа в физике, он имеет жесткие ограничения на вид зависимости, которая допускает разложение в ряд Фурье. Поскольку периодических функций в природе не существует, то пользоваться спектральными методами можно в следующих случаях:
• интервал наблюдений содержит большое число колебаний (в теории сигналов, |/1-/0|>30Т) с наибольшим периодом Т -«длинные» ряды, когда краевыми эффектами можно пренебречь;
• форма колебаний на каждом периоде неизменна на всем интервале наблюдения;
• наибольший период Т и периоды гармоник постоянны на интервале наблюдения.
Для временных рядов макроэкономических показателей первые два условия не выполняются, поэтому попытки использования спектральных методов в этой области [9] приводят к неадекватным экономическим выводам.
Основной вопрос при таком подходе (нелокальном выделении тренда) заключаются в том, какие колебания следует выделять из исходного ряда, когда временной интервал наблюдений может быть очень малым - до двух наибольших периодов, а форма колебаний может меняться от периода к периоду. При такой постановке проблемы выделение тренда как задача ис-
3 Степень полинома даже для достаточно гладкой зависимости на интервале наблюдения может быть высокой. Так, при аппроксимации синусоидальной зависимости на одном периоде с точностью до долей процента, необходимо использовать порядка двадцати членов ряда Тейлора.
ключения колебаний с заданным периодом совпадает с задачей выделения сезонной составляющей макроэкономических зависимостей [10].
Колебание, у которого форма может меняться от периода периоду, естественно рассматривать как множество циклов или циклическую составляющую ряда, подразумевая под циклом колебание на одном периоде (формальное определение цикла будет дано ниже). За основу методики выделения тренда примем нелокальные методы сезонной корректировки временных рядов, предложенные в работах [11-13]. Естественно, что качество выделенного тренда в значительной степени зависит от качества выделения отдельной циклической составляющей, поэтому рассмотрим подробнее те принципы, на которых это выделение основано.
Выделение динамических циклов с заданным периодом. Определение динамических циклов. При анализе временных рядов макроэкономических показателей выделение динамических циклов с заданным периодом Т называется сезонной корректировкой. Для месячных рядов макроэкономических показателей период Т=12 (для квартальных рядов Т=4). Поэтому исходный временной ряд можно представить в виде простейшей аддитивной модели4:
У1 = х/ + ^, (1)
~ Т
где х( определим как циклически скорректированный ряд, а 5 ( как
циклическую составляющую с периодом равным Т (верхний индекс без скобок). Далее, предполагаем, что период задан и не меняется при анализе выделения одного колебания - 5/.
Циклическая компонента - при /е [0; п], состоит из последовательности циклов 5(к), каждый из которых определяется на своем, к-ом периоде. 5(к) - это вектор, составляющие которого ■5(к), где /е[((к-1)Т+1); кТ], определяют форму циклов (график 5® на к-ом периоде). Поскольку колебание динамическое, форма циклов может меняться от периода к периоду.
Для того чтобы выделить циклическую компоненту, нужно определить само понятие динамического цикла в виде ограничений на данную составляющую ряда. Динамическим циклом будем называть компоненту разложения исходного ряда - 5(к) на к-ом периоде, которая удовлетворяет двум условиям:
51(к) =51(к+1), (2)
и
кТ
Ё5,(к ) = 0. (3)
/=(к-1)Т+1
4 При анализе рядов относительных величин типа цепных индексов используется мульти-
пликативная модель временного ряда, от которой легко перейти к аддитивной модели простым логарифмированием.
Условие (2) означает, что значения цикла в начале и конце периода совпадают, а условие (3), что цикл - это функция с нулевым средним на периоде.
Частным, но важным случаем циклов будут статические или периодические циклы, для которых условия (2) и (3) выполняются на периоде при любом сдвиге на целое число точек относительно начала координат. Это означает, что форма периодических циклов не меняется от периода к периоду. В этом смысле они похожи на обычные периодические функции за тем исключением, что периодические функции (ряды) определены на всей действительной оси (на всем множестве целых чисел 2), а циклы - на конечном временном интервале или на конечном числе точек.
В статическом случае объединение условий (2) и (3) означает, что сумма составляющих статического цикла на периоде равна нулю, с какой бы точки мы не начинали отсчет периода. В динамическом случае это не так. Условие (2) привязывает динамический цикл к определенному периоду, поскольку только для него сумма составляющих равна нулю. Если мы просуммируем составляющие динамического цикла за период, начиная с произвольной точки ряда, то в общем случае сумма будет отлична от нуля. Это ограничение связано с тем, что на последнем, не полном периоде нам не известна частичная сумма составляющих цикла по части периода и невозможно сформулировать условие (3) или его аналог для последней, неполной части периода. В статическом случае частичные суммы составляющих цикла одинаковы для всех периодов и можно выделять периодические циклы при произвольной длине исходного ряда.
Если все циклы определены, то известна и циклическая составляющая ряда:
*5(к-1)Т+1=5'/ ). (4)
Индексы изменяются следующим образом: / изменяется от 1 до Т, а к изменяется от 1 до К, где К - число полных периодов. Получилось, что интервал определения циклической составляющей в произвольном случае должен состоять из целого числа периодов п=КТ. Это условие представляет собой принципиальное ограничение на процедуру выделения динамических циклов, и для того, чтобы его обойти, необходимо вводить некоторые ограничения (например, что циклы периодические) или допущения (например, что условие (3) выполняется не точно).
Критерии выделения динамических циклов с заданным периодом. В основе выделения циклической составляющей временных рядов с динамическими циклами лежат две гипотезы:
• исключение циклической компоненты из исходного ряда приводит к более гладкому корректированному ряду (корректированный ряд обладает меньшей суммарной кривизной по сравнению с исходным);
• форма цикла для данного периода в наибольшей степени определяется исходными данными за тот же период и в меньшей степени - исходными данными за другие периоды (статические циклы определяются исходными данными за все периоды в равной степени).
Первое предположение то же самое, что и в задаче о выделении статической циклической компоненты (статического колебания) [11]. Это естественно, так как в обоих случаях мы как бы разделяем поступательное и колебательное движения показателя. Убрав «колебание», ряд сразу должен быть более гладким, поскольку остается только «поступательное» движение показателя (тренд) и нерегулярные остатки, вклад которых в изрезанность ряда, как правило, меньше вклада колебаний с наибольшим периодом.
Первую гипотезу в аналитическом виде можно представить следующим образом:
п п
ф(7) = X (х/ - х/-1)2 = X (у> - У/-1 - 5 + 5/-1)2 —7^ т1П ’ (5)
/=1 /=1
причем 71 = 7Т+1. Это задача о минимуме квадратичного функционала или, для непрерывных функций, простейшая вариационная задача, решение которой известно [11, 12]. Соотношение (5) означает, что мы ищем скорректированный ряд, сумма квадратов изменений которого минимальная. Из решения такой задачи можно определить статическую циклическую составляющую, как это сделано в [11] при выделении статических сезонных колебаний.
Для формализации второй гипотезы о том, что значения циклов в отдельные месяцы могут меняться от периода к периоду, необходимо использовать весовую обработку исходных данных. Весовая обработка данных выступает одновременно в двух ипостасях. С одной стороны, вводится значимость данных по определенному критерию - наиболее значимы те уровни показателя, где определяется цикл (вторая гипотеза). С другой стороны, это некоторое окно, которое позволяет выявить отличия в форме циклов на разных периодах [12]. В спектральной теории, для того, чтобы как-то учесть возможность изменения циклических составляющих, вводится частотно-временное окно, например, окно Габора [8] (весовая функция задается гауссовской кривой). В нашем случае такой подход не эффективен, поскольку ряды макроэкономических показателей слишком короткие по сравнению с рядами в радиофизике, акустике и оптике. Более того, сама форма окна должна меняться для того, чтобы оптимальным образом учесть краевые эффекты. При выделении статических циклов такой проблемы не возникает, поскольку все циклы одинаковы и их форма в равной степени определялась всеми точками исходного ряда.
Если форма циклов меняется от периода к периоду, то возникает вопрос: как разделить изменения в циклах и изменения в скорректированном ряде. Такое разделение можно осуществить без введения каких-либо параметров - по критерию минимальной суммарной кривизны выделенных циклов и тренда.
Обобщенная кривизна - это мера уклонения геометрического объекта (кривой) от однородного ему объекта, считающегося простейшим. Для скорректированного ряда простейшим объектом будет прямая, а для динамических циклов - статическая циклическая составляющая. Поэтому для тренда мерой отклонения от прямой будет сумма квадратов вторых разностей, а для циклов - сумма квадратов первых разностей через период. У статических циклов, по определению, первые разности через период равны нулю. Кривизна простейших объектов в том и другом случае равна нулю.
Вторая гипотеза о динамической сезонной волне утверждает, что не все данные одинаково важны при определении сезонного цикла на заданном к-ом периоде. Это предположение можно ввести в критерий минимума суммарной кривизны с помощью последовательности весов а}ы1, где ає[0; 1]; к - номер периода, на котором определяется динамический цикл 5(к); I - номер периода, влияние которого на 5(к) оценивается. По первой гипотезе, вы-
(к)
читание сезонного цикла 5 ’ из исходного ряда на том же периоде должно в наибольшей степени «сглаживать» его, поэтому а'к-к'=а°=1. Остальные периоды влияют на выделение к-го цикла в меньшей степени - пропорционально удаленности от анализируемого периода.
Исходный ряд для целого числа лет на к-ом периоде (годе), у(к), можно представить в виде
уі(к)=У(к-і)т+ь (6)
где /е [1; Т], ке [1; К+1] и К=[(п+1)/Т (в выражении для К, скобки [] означают целую часть числа). Такой выбор пределов изменения индексов связан с тем, что анализируемый ряд содержит целое число лет плюс последний год, месячные данные за который могут быть известны лишь частично. Аналогично определяем х/к) - сезонно корректированный ряд и 5® - динамический сезонный цикл на том же периоде. Верхний индекс нам потребовался для того, чтобы фиксировать период (год), на котором мы определяем сезонное колебание.
Определить 5/к) из (5) можно в соответствии с первой гипотезой - из критерия наибольшей «гладкости» сезонно корректированного ряда х/к) на к-ом периоде:
ф(к)((к)) = ХХІаІН (Ут(И+(+1 - Ут(Н)+( - ^ + 5(к))] ——ип (7)
/=1 1=1
Функционал (7) точно такой же, как и (5), только появился дополнительный множитель а'ы', который осуществляет весовую обработку исходного ряда. Поскольку все компоненты 7№)(а) зависят от параметра а, то эту зависимость фиксировать в явном виде не будем. Минимизируя функционал (7), можно получить однопараметрическое (по а) семейство динамических циклов.
Теперь из всего семейства циклических составляющих нужно выбрать одну, которая обеспечивает наименьшую суммарную кривизну скорректированному ряду и циклам5:
^а)=Х2 С-2 .х“' + .хШ +Х X (•-7,<‘ >)' т1п, (8)
к=1 »=1 »=1 к=1
при этом выбирается оптимальное значение а.
Рассмотрим выражение для комбинированного критерия более подробно. Первая двойная сумма в соотношении (8) - это суммарная кривизна скорректированного ряда. Вторая сумма в (8) характеризует изменчивость циклов от периода к периоду (кривизна циклической составляющей), поскольку определяется квадратами разностей январских, февральских и остальных кампонент циклов между соседними периодами. Если циклы не меняются от периода к периоду (случай статического колебания), то второе слагаемое в (8) становится равным нулю.
Таким образом, из критерия минимума квадрата первых разностей скорректированного ряда (7) можно определить К векторов (циклов), составляющих динамическое колебание с точностью до неизвестного параметра а. В свою очередь, параметр а определяется из обобщенного критерия минимума суммарной кривизны (8).
Решение задачи о выделении динамических циклов. Условия минимума дисперсии корректированного ряда - это условия минимума функционала (7) по переменной 7®. Таких функционалов будет столько же, сколько целых периодов в исходном ряде - К. Каждому функционалу соответствует свой, соответствующим образом взвешенный с весовым коэффициентом а, ряд. Следовательно, и сам функционал Ф® (7®), и динамическое сезонное колебание 7® зависят от параметра а. Для того, чтобы найти минимум (7), продифференцируем каждый функционал по 7® и приравняем производные к нулю. Теперь необходимые условия экстремума функционала представляют собой К систем по Т линейных уравнений:
Сф) Т м
С7(к]
:Х X [а1 (С"-Л")] = 0, (9)
г=\ 1=1
5 В работах [12, 13] использовался другой критерий для определения а, аналогичный кри-
терию (7).
причем цикл St K) не зависит от I и условие минимума изменений скорректированного ряда на к-ом периоде может быть преобразовано к более привычному виду. Отдельная для к-го периода система уравнений, определяющая динамический сезонный цикл, принимает следующий вид:
ы,
л(2Ч(к у «л(2 У (і ч)+,, (ю)
I=1
где ук/ - нормированные весовые коэффициенты в процедуре взвешивания исходного ряда при выделении циклической составляющей на к-ом периоде:
У и = (а)'а' Н . (11)
Нормирующий множитель м>к(а) легко выразить аналитически [12]:
»,(а) = [|а'*_<] = і + а_'а--,1 _а, •
Таким образом, задача определения динамического сезонного колебания на к-ом периоде сводится к задаче определения статического сезонного колебания по взвешенному ряду исходных данных. Из системы уравнений (10) видно, что сезонный цикл на к-ом периоде определяется средневзвешенными значениями вторых разностей исходного ряда.
Дальнейший ход решения задачи до определения а полностью повторяет случай выделения статического колебания [11]. Систему (10) можно записать в виде линейного матричного уравнения аналогичного уравнению для статического колебания, но с другой правой частью:
А ?(к) = /(к).
Поскольку матрица сезонности А (Б=А_1) одна и та же в обеих задачах, то можно сразу записать выражение для динамического цикла на любом целом периоде к:
?(к ) = Б/(к), (12)
где элементы вектора /(к) зависят от ук1 = wk (а)-а^к ^ :
/,(к) =1 У *і л(2)Уг (/-1),,.
Таким образом, выражение (12) определяет однопараметрическое (по а) семейство динамических сезонных колебаний.
Конкретное значение а определяется из минимума функционала (8) с помощью решения (12). Минимальное значение Е’(а) определяется стандартной численной процедурой определения минимального значения функции одного переменного. Начальным значением будет а=1, при котором выделяется статическое колебание [11].
/=1
Таким образом, задача о выделении динамических циклов решена полностью: семейство циклов определяется соотношением (12), а неизвестный весовой коэффициент а определяется численно.
В наиболее общей постановке задачи о выделении динамических циклов, следует определять К - параметрическое семейство циклов (12), и полученное представление оптимизируется по К параметрам ак. Тогда окончательное решение определяется из минимума функционала (8), найденного любым надежным методом оптимизации по К переменным, например методом Пауэлла [14]. В большинстве практически важных случаев, выделение циклов однопараметрической процедурой и многопараметрической процедурой дает сходные результаты, поэтому ниже мы рассмотрим процедуру выделения тренда на основе однопараметрического (квазиоптимального) алгоритма формирования циклической составляющей рядов.
Многомасштабный анализ рядов и выделение тренда. По определению, цикл - это такое изменение показателя, которое не меняет суммарное значение ряда с исключенным на периоде циклом. Если проводится сезонная корректировка месячных рядов показателей с периодом 7=12, то суммарные значения исходного и скорректированного ряда должны быть равны. Но «сезонная» корректировка с периодами 6, 4, 3, 2 также не должна вносить изменений в суммарное значение показателя за год (за 12 месяцев), поскольку 12 делится на меньшие периоды без остатка, т.е. меньшие периоды будут кратными для года6. Идея выделения тренда методом исключения колебаний с периодами, кратными наибольшему периоду, предложена в работе [15].
Поскольку циклические составляющие с меньшими периодами можно рассматривать как некоторые спорадические колебания показателя, удовлетворяющие условиям (2) и (3), то исключение этих колебаний должно приводить к более «гладкому» скорректированному ряду. Поэтому, последовательно исключая из исходного ряда колебания с меньшими периодами, можно получить наиболее гладкий скорректированный ряд, который в дальнейшем будем называть трендом.
Нужно сказать, что циклы с меньшими периодами чем у сезонной компоненты также несут в себе полезную информацию о динамике показателя на масштабах меньше чем год. Так циклы st6 (период 7=6) демонстрируют полугодовую динамику, циклы st3 соответствуют квартальной динамике и т.д. Поэтому многомасштабный анализ временных рядов преследует в данном случае две цели: выделение «гладкой» зависимости или тренда и получение дополнительной информации о динамике показателя на более мелких временных масштабах.
6 Часто в теории вейвлетов такой подход называют кратномасштабным анализом [8].
Многомасштабная схема анализа временных рядов в случае макроэкономических показателей соответствует декомпозиции ряда на следующие составляющие:
yt=xt+st2+st6+st4+s|i+sj2'+£t. (13)
Здесь х, - тренд; s 1 - динамические сезонные циклы с периодами, соответствующими годовому циклу (сезонная волна 7=12) и - циклические составляющие с меньшими периодами т (т=6, 4, 3, 2), соответствующие «высшим гармоникам» годового сезонного цикла. Теперь нерегулярная составляющая е, должна быть значительно меньше по абсолютной величине, чем в популярном трехкомпонентном представлении временного ряда [2]:
У, = X + ^‘2 +е,.
Этот эффект связан с тем, что в нерегулярную составляющую включаются циклические составляющие с периодами меньшими, чем основной (7=12).
Можно определить последовательность пространств скорректированных рядов Ут и последовательность пространств циклов с периодами т-^т. Тогда пространство исходных рядов У0 будет объединением Ко=К12и^12. Аналогично можно представить и пространство сезонно скорректированных рядов: V12=V6[uW6. Такое представление справедливо для пространств всех оставшихся составляющих. Пространство трендов - это V2.
С математической точки зрения, выделение циклической составляющей - это проектирование исходного ряда на некоторое подпространство циклов с периодом т-^т. Если обозначить оператор проектирования исходного ряда на Шт как Рт, то схему многомасштабного анализа можно представить себе так, как это изображено на рис. 1.
V) ^У12- -►V.— -»^4—
рц Р. \ Р \ Р4 Рз \ Р2
\ \ \ \ \
Wl2 W6 ^^4 Wз ^^2
Рис. 1. Графическое представление процедуры выделения тренда методом многомасштабного анализа
Процедура выделения тренда (рис. 1) представляет собой исключение пяти колебаний из исходного ряда. Сначала исключаем циклы с максимальным периодом 7=12, причем так, что суммарные значения
скорректированного ряда и исходного по этим периодам остаются неизменными (по условию (3)). Далее, из полученного ряда исключаем циклы с периодом т=6, которые также удовлетворяют условию (3) и, следовательно, суммарные значения нового ряда и предыдущего будут также совпадать и на этих периодах. Продолжая процесс, приходим к скорректированному ряду, у которого каждая сумма пары соседних значений совпадает с соответствующими суммами ряда после предыдущей коррекции. Таким образом, полученный тренд представляет собой некоторую «линию балансов» по частичным суммам исходного и скорректированных рядов.
Необходимо отметить, что в основных чертах процедура выделения тренда у временных рядов макроэкономических показателей совпадает с многомасштабным анализом вейвлет разложений в теории сигналов (см. например, [8, 16]). Между отдельными циклами и вейвлетами возникают смысловые параллели, также как между весовой функцией в нашем случае и масштабирующей функцией в теории вейвлетов [16]. Эти параллели позволяют выявить аналогии и отличия методов вейвлет анализа и изложенного здесь подхода к выделению циклических составляющих.
Принципиальные отличия заключаются в следующем. Во-первых, в макроэкономических временных рядах изменение масштабов жестко задано и не совпадает со степенью некоторого числа (например, степенью двойки, как в большинстве работ по теории вейвлетов). Во-вторых, вейвлет анализ не работает на очень коротких временных интервалах (три, пять периодов), поскольку материнский вейвлет захватывает несколько колебаний. И, наконец, он не определяет внутрипериодные изменения формы циклов, так как для каждого разложения тип вейвлета и масштабирующей функции остаются постоянными. Говоря не строго, в описанном выше методе выделения циклической составляющей, как «вейвлет», так и масштабирующая функция меняются на каждом периоде в зависимости от его удаленности от начала или конца ряда.
Оценка качества выделения тренда. Критерии качества выделения тренда и критерий сравнения разных рядов должны быть инвариантными к единицам измерения уровней показателя. В качестве естественной меры кривизны выделенного тренда можно использовать ту же функцию от суммарного квадрата вторых разностей, что и в критерии выделения циклов (8). Поэтому в качестве критерия гладкости ряда Q примем следующее выражение:
В числителе выражения (14) корень квадратный из среднего квадрата вторых разностей - усредненная кривизна ряда, а в знаменателе -нормировка по среднему значению ряда. Мы не рассматриваем ряды с нулевым средним значением, когда амплитудный масштаб «изрезанности» ряда определяется только его вторыми разностями. Согласно критерию (14), можно классифицировать ряды на более или менее гладкие и сравнивать разные алгоритмы обработки временных рядов по исходному и полученному ряду. Собственно, гладкость тренда не самоцель - она необходима для надежной экстраполяции тренда на краткосрочную перспективу.
Как пример, на рис. 2 показаны результаты выделения трендов четырех характерных макроэкономических показателей. Полученные зависимости могут использоваться как для мониторинга экономической динамики, так и для прогноза на краткосрочный период времени. Если оценивать отношение суммарной кривизны исходного ряда к суммарной кривизне выделенного тренда по критерию (14), то для примеров приведенных на рис. 2 эти отношения будут следующими: 52, 34, 31 и 38 соответственно. Таким образом, для большинства макроэкономических зависимостей кривизна выделенного тренда в десятки раз меньше кривизны исходного ряда.
Объем промышленной продукции
-----Исходный ряд Тренд
а)
Объем подрядных работ
-----Исходный ряд Тренд
в)
Объем производства продукции сельского хозяйства
----Исходный ряд Тренд
б)
Коммерческий грузооборот транспорта
-----Исходный ряд Тренд
г)
Рис. 2. Примеры выделения трендов из рядов макроэкономических показателей
Циклическая компонента также как и скорректированный ряд определяются всеми значениями исходного ряда. Если значения меняются или добавляются новые точки, то составляющие также меняются. При мониторинге экономических показателей и их прогнозе наиболее важными точками будут те, которые расположены у правого края ряда -последние по времени наблюдения уровней показателя. Именно они и определяют основные тенденции динамики показателя в будущем.
Имеет место эффект, который также существенно влияет на надежность прогнозов будущей динамики показателя. Его суть в том, что добавление новых точек может изменять знаки последних значений первых разностей тренда. Такое поведение ряда при добавлении новых точек часто называют эффектом «виляния хвостом» («wagging tale» problem) [17]. В этом случае надежная экстраполяция тренда затруднена и приходится строить некоторую, например, полиномиальную модель ряда. На рис. 3 показано проявление этого эффекта для двух рядов пищевой промышленности. В первом случае (рис. 3а) величина эффекта такова, что для надежного прогноза объемов производства необходим экономический анализ динамики. Во втором случае (рис. 3б) полиномиальная модель ряда позволяет достаточно надежно прогнозировать динамику показателя. Здесь эффект «виляния хвоста» связан с зависимостью размаха сезонных колебаний от динамики тренда.
Сельдь всех видов обработки
--------Исходный ряд Тренд
Тренд (-1) -----Тренд (-2)
а)
Объем производства пива
-------Исходный ряд Тренд
Тренд (-1) ---------Тренд (-2)
б)
Рис. 3. Эффект «виляния хвостом» для двух видов промышленных рядов
К счастью, количество рядов, у которых наблюдается такой эффект, так мало (доли процента от общего числа важнейших макроэкономических и промышленных показателей), что сам эффект носит спорадический характер. Чаще всего он проявляется при мониторинге показателей во время структурной перестройки экономических секторов. Количественно структурные сдвиги в экономике и отраслях промышленности приводят к значительному изменению сезонной составляющей рядов и соответствующих кратных колебаний.
Кроме того, эффект в значительной степени зависит от типа процедуры разделения исходного ряда на компоненты. Следовательно, проявление и величина этого эффекта также может служить критерием качества используемых алгоритмов.
Выводы. Сравнение различных процедур выделения тренда как элемента аппроксимационного пространства показало, что метод многомасштабного анализа обладает рядом существенных преимуществ по сравнению с локальными методами. При таком подходе не возникает ложных конъюнктурных циклов с некратными периодами. Особенности динамики тренда не сдвигаются во времени - алгоритм не запаздывает с фиксацией смены тенденций. Сами кратные колебания могут служить опережающими индикаторами возникновения кризисных явлений в экономических секторах и промышленности.
Литература и информационные источники
1. ЧетыркинЕМ. Статистические методы прогнозирования. М.: Статистика, 1977.
2. Дж. Себер. Линейный регрессионный анализ. М.: Мир, 1980.
3. Кендэл М. Временные ряды. М.: Финансы и статистика, 1981.
4. Иванилов Ю.П., Лебедев В.В. Применение сплайнов для сглаживания динамических рядов. М.: Вычислительный центр АН СССР (Сообщения по прикладной математике), 1990.
5. Варга Р. Функциональный анализ и теория аппроксимации в численном анализе. М.: Мир, 1974.
6. Стечкин С.Б., Субботин ЮН. Сплайны в вычислительной математике. М.: Наука, 1976.
7. Слуцкий Е.Е. Избранные труды. М.: Издательство АН СССР, 1960.
8. Чуи К. Введение в вейвлеты. М.: Мир, 2001.
9. Granger C. W. J, Watson M. W. Time series and spectral methods in econometrics. In Handbook of Econometrics, Vol. II. North Holland: Elsevier Science B.V., 1997.
10. Butter FA.G. den, Fase M.M.G. Seasonal adjustment as a practical problem. N.-Y.: Elsevier, 1991.
11. Губанов В.А., Ковальджи А.К. Выделение сезонных колебаний на основе вариационных принципов //Эконом. и мат. методы, 2001, Т. 37, №1.
12. Губанов В.А. Выделение нестационарной циклической составляющей из временных рядов // Эконом. и мат. методы, 2003, Т. 39, № 1.
13. Губанов В.А. Анализ воздействия выбросов на результат сезонной корректировки временных рядов. Научные труды ИНП РАН / Гл. ред. А.Г. Коровкин. М.: МАКС Пресс, 2004.
14. Ильина В.А., Силаев П.К. Численные методы для физиков-теоретиков. I. Москва-Ижевск: Институт компьютерных исследований, 2003.
15. Губанов В.А. Циклическая и сезонная динамика экономических показателей в условиях переходной экономики // Эконом. и мат. методы; Сб. Количественные методы в теории переходной экономики; Материалы круглого стола 23 ноября 2001 г. М., 2002.
16. Дремин И.М., Иванов О.В., Нечитайло ВА. Вейвлеты и их применение // Успехи физических наук, 2001, Т. 171, №5.
17. Бессонов В.А. Введение в анализ российской макроэкономической динамики переходного периода. М.: Институт экономики переходного периода, 2003.