Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. НЮ. Лобачевского, 2011, № 3 (2), с. 20-24
УДК 330.4
ВЛИЯНИЕ ФУРЬЕ-ФИЛЬТРАЦИИ НА ПОСТРОЕНИЕ ПРОГНОЗА ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ С ИСПОЛЬЗОВАНИЕМ АДДИТИВНОЙ И МУЛЬТИПЛИКАТИВНОЙ МОДЕЛЕЙ
© 2011 г. Н.Н. Буреева, Ю.С. Ершова
Нижегородский госуниверситет им. Н.И. Лобачевского
Поступила в редакцию 16.05.2011
Используется алгоритм быстрого преобразования Фурье и пороговая фильтрация данных для удаления шумовой компоненты и последующего построения прогноза с помощью аддитивной и мультипликативной моделей. Данная методика апробирована для прогнозирования объема потребления безалкогольной продукции.
Ключевые слова: быстрое преобразование Фурье, пороговая фильтрация, индекс сезонности, коэффициент детерминации.
Временные ряды являются важнейшими источниками информации о закономерностях развития экономических процессов. Существуют различные подходы к моделированию временных рядов. Один из них - определение набора факторов: трендовых (долговременных), сезонных, циклических и случайных. Такие модели, как правило, требуют знания априорной информации о характере исследуемого временного ряда [1].
К сожалению, практически во всех экспериментальных данных, в том числе и в экономических временных рядах, присутствуют различного рода шумы. Под шумами можно понимать добавку, связанную со случайными факторами, а не с закономерностями развития экономической системы. В процессе предсказания она негативно влияет на результат [2]. На практике наиболее распространенным способом удаления шумовой компоненты является сглаживание ряда путем укрупнения интервала. При таком подходе спрогнозированные данные также будут сглаженными, что не позволит получить точный прогноз на небольших интервалах (неделя, день). Один из подходов к решению этой проблемы - удаление шумовой компоненты путем Фурье-фильтрации данных [3].
Преобразование Фурье является математической основой, которая связывает временной или пространственный сигнал (или же некоторую модель этого сигнала) с его представлением в частотной области.
Быстрое преобразование Фурье (БПФ) - это не еще одна разновидность преобразования Фурье, а название целого ряда эффективных ал-
горитмов, предназначенных для быстрого вычисления дискретно-временного ряда Фурье (ДВРФ). Основная идея БПФ - деление Ы-точечного ДВРФ на два и более меньшей длины, каждый из которых можно вычислить отдельно, а затем линейно просуммировать с остальными, чтобы получить ДВРФ исходной Ы-точечной последовательности. Рассмотрим дискретное преобразование Фурье в виде [4]
1 N-1
Х[к] = - £ , (1)
^ п=о
где величина = ехр(-/ 2 п /Ы) носит название
поворачивающего множителя, х[п] - исследуемая временная последовательность
Если из последовательности х[п] выделить элементы с четными и нечетными номерами
1 N/2-1 1 N/2-1
Х[к] = - £ х[2т]^2тк + - ^ £ х[2т + 1]^2тк
^ т=0 ^ т=0
(2)
или
Х[к ] = хн/2[к ,0] + хн/2[к ,1], (3)
где каждое из слагаемых является преобразованием длины Ы/2
1 N /2-1
ХN/2 [к, Р.I = — X Х[2П + Р\]¥*2 , Р = °Л- (4)
Можно оценить число комплексных операций умножения и сложения, необходимых для вычисления преобразования Фурье в соответствии с алгоритмом (3), (4). Для вычисления преобразования Фурье для всех N значений к необходи-
мо произвести по Ы+Ы /2 умножений и сложений. Так как вычисление Ы-точечного преобразования Фурье через два Ы/2-точечных приводит к экономии вычислительных операций, то каждое из Ы/2-точечных дискретных преобразований Фурье следует вычислять путем сведения их к Ы/4-точечным преобразованиям:
ХN/2[к> Р] =ХN/4[к> Р] + /2ХN/4[к> Р + 2],
Р = 0,1,
X
1
N/4-1
N/4[к, Я] = Т7 X Х[4П + ^
п=0
пк
N/4 ’
Я = 0,1, 2,3.
(5)
(6)
Расчет последовательности Х[к] по формулам (3), (5) и (6) требует уже по 2Ы+Ы2/4 операций умножения и сложения.
Следуя таким путем, объем вычислений Х[к] можно все более и более уменьшать. В итоге можно записать алгоритм БПФ, получивший по понятным причинам название алгоритма с прореживанием по времени:
Х2[к,р] = (х[р] + 2х[р+Ы/2]) / Ы, где к = 0, 1,
р = 0, 1, ..., N/2 - 1;
Х2ж/м[к, р] = Хдам[к, р + ^2лшХмм[к, _р + М/2], где к = 0, 1, ..., 2Ы/М - 1, ^ = 0, 1, ..., М/2 - 1;
Х[к] = Ху[к] = Х^/2[к, 0] + ^N^N/2[к, 1],
где к = 0, 1, ..., N - 1. (7)
Полное число операций умножения-сложения в алгоритме БПФ равно N\og2N [5].
Предлагается следующая методика построения модели прогнозирования экономических показателей на основе БПФ:
1. Посредством БПФ проводится спектральный анализ временного ряда с целью выделения высокочастотной компоненты.
2. С помощью пороговой фильтрации данных удаляется составляющая, соответствующая шуму.
3. Посредством обратного преобразования Фурье восстанавливается исследуемый ряд для последующего построения прогноза.
4. Вычисляется относительная ошибка восстановления исходного ряда при разных порогах фильтрации.
Данная методика была апробирована на месячных и недельных данных объема потребления безалкогольной продукции. Были построены аддитивная и мультипликативная модели до и после фильтрации, вычислены ошибки прогноза, проведен сравнительный анализ полученных моделей.
Исследуемые временные ряды являются нестационарными, характеризуются наличием возрастающего тренда и сезонной компоненты. Максимум потребления приходится на летние месяцы (середина июля, конец июня, начало августа). Это связано с особенностью сезона, в летние месяцы возрастает потребность населения в прохладительных напитках, именно в указанные периоды температура воздуха максимальна. Кроме того, пик потребления приходится на декабрь (последние недели), это объясняется новогодними праздниками. Спад потребления происходит в зимние месяцы, а также в начале осени. Это обусловлено тем, что снижаются потребности населения в потреблении прохладительных напитков в указанные периоды, в основном из-за погодных условий.
Для определения сезонности исследуемого ряда потребления были вычислены индексы сезонности (таблица 1, в которой за 100% принято среднее за год), проведен статистический анализ еженедельных (рис. 1) и ежемесячных (рис. 2) данных.
Таблица 1
Значение индекса сезонности
месяцы инд. сезонности месяцы инд. сезонности
Янв. 63.02% Июль 140.20%
Фев. 54.58% Авг. 120.76%
Март 108.98% Сент. 84.66%
Апр. 78.37% Окт. 61.51%
Май 99.13% Нояб. 69.48%
Июнь 148.80% Дек. 159.57%
Сумма уровней ряда
Минимум
Максимум
Среднее
Медиана
Стандартное отклонение Дисперсия
Коэффициент вариации Размах вариации Асимметрия Эксцесс
6616.538
0
87.9684 25.5464787645 23.01
12.8403577583
164.23820517
50.1656042999%
87.9684 1.5772326585 3.53019027839
Рис. 1. Фрагмент исходного ряда объема потребления напитка, недельные данные за 6 лет
Сумма уровней ряда 5362.7708
Минимум 38.4192
Максимум 1 ЕЕ.55Е4-
Среднее 89.3795133333
Медиана 80.499
Стандартное отклонение 36.2711466473
Дисперсия 1293.66947779
Коэффициент вариации 40.2414554857%
Размах вариации 150.1392
Асимметрия 0.77856153849
Эксцесс -0.142784173442
Рис. 2. Фрагмент исходного ряда объема потребления напитка, месячные данные за 6 лет
volume
Eli
U у |U
“1------------1---------1----------г
□ Коэффициент Верхняя грани! —доверительно! интервала Нижняя границ ^доверительно! интервала
Номер лага
Рис. 3. Автокорреляционная функция объема потребления напитков
volume
О1
U1—|1_Г
и
иг
1--I--1-г
П Коэффициент Верхняя граница — до в ерительно го интервала Нижняя граница —до в ерительно го интервала
Номер лага
Рис. 4. Частная автокорреляционная функция объема потребления напитков
Анализ автокорреляционной функции (рис. 3) и частной автокорреляционной функции (рис. 4) показывает, что ряд имеет тенденцию, кроме того, ряд содержит сезонную компоненту (наиболее значимыми являются коэффициенты автокорреляции 4 и 13-го порядков).
Для месячных данных значение коэффициента вариации [5] (менее 30%) говорит о значительной изменчивости вариационного ряда. Значение коэффициента вариации для недельных данных (50%) говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений. Также это свидетельствует о том, что в исследуемом ряде присутствует высокочастотная составляющая (шум), которая может негативно повлиять на результат прогноза.
Положительное значение показателя асимметрии (в случае месячных и недельных данных) говорит о преобладании данных с меньшими значениями, чем среднее арифметическое. Отрицательное значение показателя эксцесса в месячных данных показывает на более
равномерное распределение данных по всей области значений. Положительное значение эксцесса в недельных данных говорит о концентрации данных около среднеарифметического значения [5].
Для сравнения результатов были построены аддитивная и мультипликативная модели исследуемого временного ряда до и после фильтрации данных на основе преобразования Фурье. Моделирование реализовано с помощью программного пакета Forecasting.
Построена аддитивная модель на недельных и месячных данных до фильтрации. В качестве аппроксимирующей для недельных данных выбрана функция с наибольшим коэффициентом детерминации. В данном случае это полином третьей степени. Среднеквадратичная ошибка прогноза составила 12%. Полученные границы доверительного интервала указывают на низкую точность прогноза.
Для месячных данных в аддитивной модели в качестве аппроксимирующей функции был выбран полином третьей степени. Среднеквад-
ратичная ошибка прогноза составила 1.4%, границы доверительного интервала на месячных данных говорят о более высокой точности прогноза.
Построена мультипликативная модель объема потребления напитков на недельных и месячных данных до фильтрации. В качестве аппроксимирующей функции для недельных данных был выбран полином третьей степени. Ошибка прогноза составила 12%, как и для аддитивной модели.
Для построения мультипликативной модели на месячных данных также выбран полином третьей степени. Среднеквадратичная ошибка прогноза составила 0.81%.
На рис. 5 представлена зависимость относительной ошибки аппроксимации от порога фильтрации. Из графика видно, что начиная с порогового значения 0.03 кривая выходит на насыщение. При значении более 0.05 ошибка аппроксимации начинает расти. Это говорит о том, что наиболее подходящий порог фильтрации равен 0.05.
Рис. 5. Зависимость относительной ошибки аппроксимации от порога Фурье-фильтрации
Коэффициент вариации для мультипликативной модели (недельные данные) после Фурье-фильтрации равен 20%, это говорит о том, что данные являются однородными [6]. В качестве аппроксимирующей выбрана логарифмическая функция. Относительная ошибка прогноза составила 2%.
В качестве аппроксимирующей функции для аддитивной модели (недельные данные) после Фурье-фильтрации также выбрана логарифмическая функция. Относительная ошибка прогноза составила 3.5%. В таблице 2 представлены значения коэффициента детерминации и относительной ошибки прогноза (до и после Фурье-фильтрации) для месячных и недельных данных на примере аддитивной и мультипликативной модели.
Выводы
В работе было рассмотрено влияние Фурье-фильтрации на построение прогноза объема потребления безалкогольной продукции с помощью аддитивной и мультипликативной моделей. Полученный результат подтверждает наличие шума в экспериментальных данных и указывает на необходимость фильтрации исследуемого ряда для получения наиболее точного и качественного прогноза.
Анализ исходного ряда и полученные результаты показали, что наилучший прогноз получается на недельных данных после Фурье-фильтрации с использованием мультипликативной модели. Данная модель хорошо аппроксимирует фактические данные, т.е. она вполне отражает экономические тенденции, определяющие объем потребления безалкогольной продукции, и является предпосылкой для построения прогнозов высокого качества.
Таблица2
Значения коэффициента детерминации и относительной ошибки прогноза для месячных и недельных данных на примере аддитивной и мультипликативной модели
Название Аддитивная модель Мультипликативная модель
модели До После До После До После До После
фильтрации фильтрации фильтрации фильтрации фильтрации фильтрации фильтрации фильтрации
Показатель Я2 Е Я2 Е
Месячные данные 0.427 0.7 1.4% 3.5% 0.407 0.8 0.81% 2%
Недельные данные 0.061 - 12% - 0.063 - 12% -
Список литературы
1. Тихомиров Н.П., Дорохина Е.Ю. Эконометрика. М.: Экзамен, 2003.
2. Эконометрия. Учебное пособие Шр://отМо'^ edu.rU/window_catalog/p df2txt?p_id= 11363&р_р а§е=6 7
3. Цыплаков А. Учебное пособие по эконометрике: http://www.hometask.boom.ru/economics/index.html
4. Марпл-мл. С.Л. Цифровой спектральный анализ и его приложения. М.: Мир, 1990.
5. Дуброва Т. А. Статистические методы прогнозирования. М.: Юнити, 2003.
6. Финансовый анализ. Информационный он-лайн справочник: http://www.financial-analysis.ru/methodses/ metFKStat.html.
THE EFFECT OF FOURIER FILTERING IN PREDICTING ECONOMIC INDICATORS USING ADDITIVE AND MULTIPLICATIVE MODELS
N.N. Bureeva, Yu.S. Ershova
A FFT algorithm and threshold filtering of data are used to remove the noise component with subsequent forecasting using additive and multiplicative models. The developed technique has been tested to predict the consumption of soft drinks.
Keywords: fast Fourier transform, threshold filtering, seasonality index, coefficient of determination.