Научная статья на тему 'Статистический анализ персистентных временных рядов (на примере потребления электроэнергии)'

Статистический анализ персистентных временных рядов (на примере потребления электроэнергии) Текст научной статьи по специальности «Математика»

CC BY
485
68
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
π-Economy
ВАК
Область наук
Ключевые слова
ВРЕМЕННОЙ РЯД / СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ / СТАЦИОНАРНЫЕ ПРОЦЕССЫ / ДОЛГОВРЕМЕННАЯ ПАМЯТЬ

Аннотация научной статьи по математике, автор научной работы — Кабиняков Михаил Юрьевич, Тебуева Фариза Биляловна

Проведен статистический анализ временного ряда потребления электроэнергии. Вычисленные статистические характеристики позволили сделать вывод о нестационарности временного ряда и неподчинении его распределения нормальному закону. Размерность временного ряда является фрактальной. Указанные свойства позволили однозначно определить класс принадлежности временного ряда потребления электроэнергии: персистентные временные ряды.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The statistical analysis of a time series of current consumption is carried out. The calculated static characteristics have allowed to draw a conclusion about no stationary a time series and not submission of his distribution to the normal law. Dimension of a time series is fractal. The specified properties have allowed to define unequivocally a class of an accessory of a time series of current consumption persistence time series.

Текст научной работы на тему «Статистический анализ персистентных временных рядов (на примере потребления электроэнергии)»

операции на множестве Б образуют алгебраическую систему: моноид относительно операции сложения, абелеву группу относительно умножения и полукольцо относительно операций сложения и умножения. Это дает возможность

использовать коэффициенты трудности с введенными операциями для построения функций качества и создает надежную операционную основу для построения адекватных экономико-математических моделей.

СПИСОК ЛИТЕРАТУРЫ

1. Азгальдов, Г.Г. О квалиметрии [Текст] / Г.Г. Азгальдов, Э.П. Райхман. - М.: Изд-во стандартов, 1972. - 172 с.

2. Каплинский, А.И. Моделирование и алгоритмизация слабоформализованных задач выбора наилучших вариантов системы [Текст] / А.И. Каплинский, И.Б. Руссман, В.М. Умывакин. - Воронеж: Изд-во ВГУ, 1990. - 168 с.

3. Леденева, Т.М. О формировании интегральных оценок «трудность достижения цели» [Текст] /

Т.М. Леденева // Вестник факультета ПММ. - 2010. -Вып. 8. - С. 122-140.

4. Баева, Н.Б. Обобщение методов построения интегральных оценок качества на основе теории трудности достижения цели [Текст] / Н.Б. Баева, Е.В. Куркин // Вестник ВГУ. Серия «Системный анализ и информационные технологии». - 2011. - № 1.

5. Общая алгебра [Текст]. Т. 1 / О.В. Мельников, В.Н. Ремесленников, В.А. Романьков и др.; под общ. ред. Л.А. Скорнякова. - М.: Наука, 1990. - 592 с.

УДК 519.86

М.Ю. Кабиняков, Ф.Б. Тебуева

СТАТИСТИЧЕСКИЙ АНАЛИЗ ПЕРСИСТЕНТНЫХ ВРЕМЕННЫХ РЯДОВ (НА ПРИМЕРЕ ПОТРЕБЛЕНИЯ ЭЛЕКТРОЭНЕРГИИ)

Для моделирования динамики поведения различных экономических показателей в настоящее время используется широкий спектр математических методов и моделей [1, 2]. В основном это традиционные статистические подходы к прогнозированию, которые базируются на трендах и регрессии и предполагают выполнение условия независимости уровней (наблюдений). Однако условие независимости чаще всего не выполняется в силу того, что, как правило, в поведении экономических показателей наблюдается долговременная память [3]. В качестве эффективного инструментария для моделирования процессов с долговременной памятью зарекомендовали себя современные методы нелинейной динамики [3, 4].

Данная статья посвящена вопросам анализа статистических свойств временного ряда

потребления электроэнергии и определения класса его принадлежности в классификации «хаотические - персистентные - антипер-систентные» [3] временные ряды. Определение класса принадлежности исследуемого временного ряда позволит выбрать адекватный математический аппарат для его моделирования.

Агрегирование временного ряда

Электроэнергия является одним из наиболее значимых продуктов промежуточного потребления страны и составляет весомую долю в затратах практически всех отраслей экономики. Дефицит электроэнергии в отдельных регионах и тем более в стране в целом неизбежно приводит к ограничению экономического роста [5]. Поэтому моделирование динамики электропо-

требления в регионах РФ служит важнейшим элементом планов по долгосрочному развитию секторов экономики.

Предметом исследования является временной ряд объемов ежедневного потребления электроэнергии в Краснодарском крае за период с 1 января 2006 г. по 31 декабря 2010 г. Обозначим его через

Y = (У/), i = 1,1826.

(1)

V = 0.; M

(3)

- коэффициент асимметрии А, т. е. мера «скошенности» значений временного ряда или мера симметричности относительно математического ожидания,

A =

1 п 3 - Z to - M )3

ni = 1_

а3

(4)

Для снижения трудоемкости вычислений предлагается выполнить агрегирование временного ряда Y (1). Агрегирование (aggregation, aggregation problem) - объединение, укрупнение показателей по какому-либо признаку [6]. Указанная процедура применяется для больших массивов данных показателей рассматриваемых процессов.

С математической точки зрения агрегирование рассматривается как преобразование исходной модели в модель с меньшим числом переменных и ограничений, дающую приближенное (по сравнению с исходным) описание изучаемого процесса или объекта. Его сущность -в замене подмножеств однородных элементов более крупными «элементами-агрегатами». Существуют различные способы агрегирования: сложение показателей, представление группы агрегируемых показателей через их среднюю, использование различных взвешивающих коэффициентов, баллов и т. д.

В настоящей работе предлагается ежедневные показатели потребления электроэнергии агрегировать в ежемесячные, используя метод взятия суммарного значения показателя за период агрегирования. В результате проведенного агрегирования из временного ряда Y получим временной ряд объемов ежемесячного потребления:

Y = (yt), i = 160. (2)

В табл. 1 приведены основные статистические показатели временных рядов Y и Y :

- коэффициент вариации V, т. е. мера сглаженности распределения,

- коэффициент эксцесса Е, т. е. мера островершинности или плосковершинности распределения,

E =

1n

1Z (*i - M )4

ni = 1

(5)

Таблица 1

Статистические показатели исходного и агрегированного временных рядов

Статистические показатели Временной ряд

Y Y

V 0,13 0,12

A -0,03 -0,01

E 4,59 4,25

Из данных табл. 1 следует, что применение ежемесячного агрегирования к временным рядам У и У фактически не приводит к заметному изменению основных статистических показателей - значений коэффициентов вариации, асимметрии, эксцесса. Таким образом, можно обоснованно перейти от временного ряда У ежедневных объемов потребления электроэнергии к временному ряду У объемов ежемесячного потребления.

Теоретическое описание методики проведения статистического анализа с целью определения класса принадлежности временного ряда

В анализе временных рядов важен выбор адекватного математического аппарата, который главным образом зависит от общих тенденций во временном ряде и класса его принадлежности. Существуют различные подходы к классификации временных рядов, зависящие от рассматриваемого признака.

4

СТ

В зависимости от характера отображения времени ряды делятся на моментные и интервальные. Моментным временным рядом является такой, уровни которого характеризуют состояние явления на определенные даты (моменты времени). Интервальный (периодический) временной ряд - последовательность, в которой уровень явления относят к результату, накопленному или вновь произведенному за определенный интервал времени.

По числу показателей разделяют одномерные и многомерные временные ряды.

В зависимости от степени определенности значений выделяют детерминированные, случайные, стохастические временные ряды. Если значения членов временного ряда определены какой-либо математической функцией, то временной ряд является детерминированным. Если эти значения могут быть описаны только с помощью распределения вероятностей, то временной ряд называют случайным. Временной ряд процесса, развивающегося во времени согласно законам теории вероятностей, является стохастическим временным рядом.

В зависимости от изменения вероятностных характеристик описываемого процесса временные ряды подразделяются на стационарные и нестационарные. В стационарных временных рядах начальный и центральные моменты не изменяются с течением времени. В нестационарных временных рядах наблюдается заметное изменение начального и центральных моментов.

Здесь мы рассматриваем классификацию временных рядов по признаку наличия долговременной памяти, предложенную Э. Петерсом в работе [3].

В зависимости от наличия долговременной памяти временные ряды делятся на персистент-ные, хаотические, антиперсистентные. В перси-стентных временных рядах наблюдается долговременная память, в хаотических - неопределенность, в антиперсистентных - отсутствие долговременной памяти. Временные ряды с долговременной памятью в научной литературе называются также «временные ряды с долговременными корреляциями» [3, 7].

Идентификационными свойствами для данной классификации временных рядов являются:

10) подчинение (неподчинение) распределения нормальному закону;

20) стационарность (нестационарность);

30) размерность временного ряда.

Для обнаружения первого свойства достаточно вычислить следующие характеристики распределения временного ряда:

- коэффициент вариации по формуле (3);

- коэффициент асимметрии по формуле (4);

- коэффициент эксцесса по формуле (5).

Второе свойство подразумевает вычисление

основных статистических характеристик:

- математического ожидания или среднего значения, центра распределения случайной величины х на числовой оси:

1 п

м = - £ х;

Пг = 1

(6)

- дисперсии или степени рассеивания распределения х относительно математического ожидания м:

О = - £ (х - - 1 . (7)

Пг = 1 ^ т = 1 )

Для обнаружения третьего свойства следует определить размерность временного ряда по формуле

О = 2 - И, (2)

И И( ) 1се(Д(т)/5(т)) где И = И (т) =—————- показатель 1°ё(т /2)

Херста, вычисляемый посредством алгоритма Л/£-анализа [3].

Для определения класса принадлежности временных рядов необходимо поставить числовые соответствия указанным ранее идентификационным свойствам 10-30.

В нормальном законе распределения (свойство 10) вычисленные идентификационные характеристики имеют следующие соответствия:

V = 3, А = 0, Е = 3.

(9)

Допустимый предел изменения этих характеристик 5 %.

В стационарных (нестационарных) процессах (свойство 20) изменение математического ожидания и дисперсии вычисляется по формулам

М(/) - М(/ -1)

АМ (/) = ^---^ 100 %,

М (г -1)

|Д/) - Д/ -1)1 АД/) = ■!——--—100 %,

^ Д/ -1) '

(10)

где г - порядковый номер интервала разбиения временного ряда. Условия стационарности при этом следующие:

АМ(/) < 5 %, АД/) < 5 %.

(11)

Размерность (свойство 30) временного ряда принимает значения в интервале

П {X )е (1,2).

(12)

В табл. 2 приведены наименования классов и соответствующие им условия.

Таблица 2 Идентификационные свойства временных рядов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Название классов временных рядов Идентификационные свойства

Персистентные (наличие долговременной памяти) 1. Неподчинение нормальному закону распределения. 2. Нестационарность. 3. ДХ е(1; 1,4)

Хаотические (отсутствие памяти) 1. Подчинение нормальному закону распределения. 2. Стационарность. 3. ДХ е[1,4; 1,6)

Антиперсистентные (наличие кратковременной памяти) 1. Неподчинение нормальному закону распределения. 2. Нестационарность. 3. ДХ е[1,6;2)

Приведенные в табл. 1 данные представляют собой основу для алгоритмического подхода к классификации временных рядов и выбора модели для их прогнозирования.

Расчеты статистических показателей и интерпретация результатов

Рассчитаем идентификационные показатели для агрегированного временного ряда У по указанным выше трем свойствам: подчинение (неподчинение) распределения нормальному закону, стационарность (нестационарность), размерность временного ряда.

Свойство 1. В табл. 1 приведены вычисленные для временного ряда У коэффициенты: вариации V = 0,12, асимметрии А = -0,01, эксцесса Е = 4,25. Отклонения этих показателей от показателей нормального закона распределения составляют величины

АV = 12 %, АА = 1 %, АЕ = 42 %. (13)

Таким образом, распределение временного ряда У не подчиняется нормальному закону.

Свойство 2. Для исследования стационарности (нестационарности) временной ряд У разобьем на пять годичных интервалов:

[ У» У12 ] , [ У13 , У24 ] , [ У25 , У36 ] , [ У37 , У48 ] , [ У49 , У60 ] . (14)

В табл. 3 приведены значения математического ожидания и дисперсии для указанных в (14) интервалов разбиения. Кроме того, в последних двух графах даны изменения этих показателей в процентах.

Как видно из табл. 3, условие стационарности не выполняется: изменение дисперсии значительно превышает допустимый порог 5 %.

Свойство 3. Размерность временного ряда определяется по формуле (8), где показатель Херста Н следует вычислять по алгоритму Л/5-анализа. Подробное описание этого алгоритма приведено в [3, 8]. Для временного ряда У показатель Херста в отрезке т = 60 составляет величину Н(60) = 0,77. Тогда размерность временного ряда составляет величину

ДУ) = 2-0,77 = 1,23. (15)

Таким образом, согласно идентификационным условиям, приведенным в табл. 2, временной ряд У относится к классу персистентных временных рядов, т. е. временных рядов с наличием долговременной памяти.

Таблица 3

Динамика основных вероятностных свойств временного ряда Y

Номер Значения Математическое Дисперсия D Процент изменения

интервала t ожидание M AM AD

1 1-12 1 474 004,6 30 042 755 379,0 - -

2 13-24 1 545 362,7 22 746 738 473,4 5 24

3 25-36 1 592 148,3 34 600 475 671,9 3 52

4 37-48 1 638 137,4 25 391 390 133,2 3 27

5 49-60 1 726 262,5 29 197 071 394,8 5 15

Статистический анализ временного ряда У потребления электроэнергии позволил сделать выводы: 1) о неподчинении его распределения нормальному закону; 2) нестационарности; 3) фрактальной размерности. Эти выводы однозначно определяют рассматриваемый временной ряд У как персистентный. Персистент-ность состоит в зависимости настоящих значе-

ний временного ряда от его предыдущих значений. Успешным инструментарием для моделирования персистентных временных рядов являются такие методы нелинейной динамики, как фрактальный анализ [3, 7], фазовый анализ [4, 7], искусственные нейронные сети [8], нечеткие системы [9, 10], генетические алгоритмы [10, 11].

СПИСОК ЛИТЕРАТУРЫ

1. Айвазян, С. А. Прикладная статистика. Основы эконометрики [Текст] / С.А. Айвазян. - М.: Юнити-Дана, 2001. - 432 с.

2. Бережная, Е.В. Математические методы моделирования экономических систем [Текст] : учеб. пособие / Е.В. Бережная, В.И. Бережной. - М.: Финансы и статистика, 2001. - 368 с.

3. Петерс, Э. Хаос и порядок на рынках капитала. Новый аналитический взгляд на циклы, цены и изменчивость рынка [Текст] / Э. Петерс. - М.: Мир, 2000. - 333 с.

4. Малинецкий, Г.Г. Нелинейность. Новые проблемы, новые возможности [Текст] / Г.Г. Малинецкий, А.Б. Потапов // Новое в синергетике. Загадки неравновесных структур. - М.: Наука, 1996. -С. 165-190.

5. Малахов, В.А. Подходы к прогнозированию спроса на электроэнергию в России [Текст] / В.А. Малахов // Проблемы прогнозирования. - 2009. - № 2. -С. 57-62.

6. Лопатников, Л.И. Экономико-математический словарь [Текст] / Л.И. Лопатников. - М.: Наука, 1987. - 510 с.

7. Перепелица, В.А. Структурирование данных методами нелинейной динамики для двухуровневого моделирования [Текст] / В.А. Перепелица, Ф.Б. Тебу-ева, Л.Г. Темирова. - Ставрополь: Ставропольское книжное издательство, 2006. - 286 с.

8. Лысенко, Ю.Г. Нейронные сети и генетические алгоритмы [Текст] : учеб. пособие / Ю.Г. Лысенко, Н.Н. Иванов, А.Ю. Минц. - Донецк: ООО «Юго-Восток, Лтд», 2003. - 265 с.

9. Zadeh, L.A. Fuzzy Sets [Text] / L.A. Zadeh // Information and Control. - 1965. - Vol. 8. - P. 338-353.

10. Ярушкина, Н.Г. Основы теории нечетких и гибридных систем [Текст] / Н.Г. Ярушкина. - М.: Финансы и статистика, 2004. - 320 с.

11. Курейчик, В.М. Генетические алгоритмы [Текст] / В.М. Курейчик. - Таганрог: Изд-во ТРТУ, 1998. - 314 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.