УДК 621.336 Раевский Николай Владимирович,
кафедра «Электроснабжение», Забайкальский институт железнодорожного транспорта -филиал Иркутского государственного университета путей сообщения в г. Чите
тел.: 8-924-473-67-76, e-mail: [email protected] Яковлев Дмитрий Александрович, кафедра «Электроснабжение», Забайкальский институт железнодорожного транспорта -филиал Иркутского государственного университета путей сообщения в г. Чите
тел.: 8-924-473-67-76, e-mail: [email protected] Дурнов Виталий Геннадьевич, кафедра «Электроснабжение», Забайкальский институт железнодорожного транспорта -филиал Иркутского государственного университета путей сообщения в г. Чите
тел.: 8-924-473-67-76, е-mail: [email protected]
ВЫБОР ОПТИМАЛЬНОЙ МЕТОДИКИ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ ЭЛЕКТРОПОТРЕБЛЕНИЯ
N. V. Raevsky, D.A. Yakovlev, V. G. Durnov
TIME SERIES FORECASTING OF ELECTRICITY CONSUMPTION BY CHOOSING THE OPTIMAL METHOD
Аннотация. На основе системного анализа решена задача по увеличению точности прогнозирования тягового электропотребления. Разработаны алгоритмы выбора оптимальной методики прогнозирования в зависимости от исходной информации. Предложен один из способов классификации методов прогнозирования временных рядов электропотребления. Рассмотренный подход к задачам прогноза тягового электропотребления в ОАО «РЖД» позволяет сократить издержки при покупке электрической энергии.
Ключевые слова: временной ряд электропотребления, метод прогнозирования, алгоритм.
Abstract. The problem of increasing the accuracy of train traction electricity consumption forecasting on the basis of systems analysis is considered. Algorithms for choosing the optimal forecasting techniques, based on initial information, were developed. A way of classifying the methods of time series forecasting of electricity consumption was suggested. The considered approach to the train traction electricity consumption forecasting in RZD allow reducing expenses on buying electricity.
Keywords: time series of power energy consumption, a method of forecasting, algorithm.
Введение
Железнодорожный транспорт находится в числе основных потребителей электрической энергии (ЭЭ). Свыше 4,5 % потребляемой в стране электроэнергии идет на тягу поездов. Это составляет около 70 млрд кВтчас в год.
Организация планирования электропотреб-
ления (ЭП) железнодорожным транспортом производится с участием администратора торговой системы НП «АТС». При составлении заявок на рынке электроэнергии к потребителям повышаются требования к надежности и достоверности результатов планирования ЭП. Это требует решения сложной задачи выбора оптимальной методики прогнозирования в зависимости от исходных данных. Величина нормативного уровня отклонений прогнозного значения для покупателя устанавливается в размере 2 %, но приемлемым диапазоном для предприятия, не несущего существенных издержек, можно считать ± 5 % [1]. В этих условиях появляется возможность заключать договоры на приобретение энергоресурсов у поставщиков ЭЭ по льготным тарифам.
Классификация методов прогнозирования электропотребления
Бурное развитие прогностики как науки за последние десятки лет привело к созданию множества методов, процедур и приемов прогнозирования.
Первые работы, имеющие отношение к рассматриваемой теме, опубликованы в конце 70-х годов прошлого века. В истории развития и применения информационных технологий прослеживаются три периода. До 1990 г. в основном используются традиционные линейные методы прогноза временных рядов, основанные на регрессионном анализе. В 90-е годы широкое развитие получило использование нелинейных подходов при решении задач прогнозирования. Это позволило повысить точность получаемых результатов. Тре-
Системный анализ. Моделирование. Транспорт. Энергетика. Строительство
Рис. 1. Классификация методов прогнозирования
тий этап начался несколько лет назад, когда желание повысить точность и надежность прогнозов привело к появлению многочисленных комбинированных методов и схем. Корректность предсказаний в этом случае, зависит от взаимного дополнения двух или более методик разного уровня и класса.
Точность прогноза меняется в зависимости от того, на какой период упреждения выполняется прогноз. Временная иерархия ЭП разделяется на основные интервалы: долгосрочный (год), среднесрочный (месяц), краткосрочный (сутки) и оперативный (час). Расчет прогнозов потребления производится на всех временных интервалах с последовательным уточнением результатов по мере уменьшения времени упреждения. Для каждого вида прогноза необходимо использование различных методик. При этом наиболее высокие требования предъявляются к краткосрочным и оперативным прогнозам, поскольку именно они определяют управление текущим режимом работы энергосистемы [2].
Авторами статьи предлагается один из способов классификации методов прогнозирования временных рядов (ВР) тягового электропотребления, представленного на рис. 1. Особое внимание в данной классификации уделено факторам, влияющим на выбор методики прогнозирования электропотребления.
Практика показывает, что на основе лишь общих представлений о составлении прогноза сложно наладить квалифицированное прогнозирование электропотребления. Будущее потребление ЭЭ можно определять не только на базе статистических данных и некоторого учета факторов влияния, а рассчитать по правильным алгоритмам. Данный подход основывается на том обстоятельстве, что влияющие факторы и их весомость заранее известны. Кроме того, он предполагает созда-
ние математической модели объекта с использованием вычислительных ресурсов, специально созданных для этой цели.
Рациональным путем является разработка алгоритма выбора оптимальной методики прогнозирования ЭП в зависимости от имеющейся исходной информации.
Алгоритм выбора оптимальной методики прогнозирования электропотребления
Несмотря на безграничное число ситуаций и влияющих факторов, вносящих в процесс прогнозирования определенный вклад, можно выделить основные этапы прогнозирования временных рядов электропотребления (рис. 2).
Процесс прогнозирования начинается с рассмотрения имеющихся исходных данных для заданного периода упреждения. После определения переменных влияющих на ВР ЭП и проверки ряда условий производится расчет уравнения, описывающего форму кривой временного ряда ЭП. Процесс обычно является итерационным - сопровождается неоднократными повторениями, возвратами в исходную или промежуточную точки алгоритма-схемы, последовательными приближениями к «хорошей» модели.
В результате получаем методику, позволяющую осуществлять прогнозирование временных рядов с минимальным отклонением от фактического потребления ЭЭ.
Блок формирования исходных данных Телом алгоритма является процесс выбора метода прогнозирования в соответствии с характером объекта, требований, предъявляемых к исходной информации с количественной и качественной оценкой (наличие или отсутствие тенденции, сезонности, цикличности, инертности, аномальных и пропущенных значений; длина ВР; сопоставимость данных и т. д.).
ИРКУТСКИМ государственный университет путей сообщения
Блок формирования исходных данных представлен на рис. 3.
При выборе оптимальной методики прогнозирования важным показателем является величина, обратная величине глубины упреждения, показывающая необходимую длину эволюционного цикла.
По мнению отечественных и зарубежных ученых, она должна быть в три раза больше абсолютного времени упреждения:
1 = ^ ^ 3, (1)
т Аг
где Аt - абсолютное время упреждения;
- величина эволюционного цикла объекта.
Блок выбора информационной базы
Немаловажным условием принятия решений является сама глубина упреждения прогноза (рис. 4), при этом его необходимо отнести к длине
эволюционного цикла развития объекта прогнозирования.
Для этого можно воспользоваться предложенным В. Белоконем безразмерным показателем глубины [3]:
А/
т = —. (2)
1х
Если величина глубины упреждения укладывается в эволюционный цикл т << 1, то действительными в выборе являются фактографические методы. Если же в прогнозном периоде укладываются несколько эволюционных циклов развития т >> 1, то большее значение имеют методы экспертных оценок.
Наиболее распространенным методом оценки параметров зависимостей являются метод наименьших квадратов (МНК) и его модификации.
®
а
О и
ч в И
о
в
£ « со а
% о.
о о ^ ■&
И В
-----------т
Постановка задачи Проверка предпосылок регрессионного анализа
4 1
Анализ исходных данных Расчет уравнения, описывающее форму кривой ВР ЭП
1 1
Формирование необходимой и Выбор метода прогнозирования,
обязательной длины ВР ЭП удовлетворяющего условиям
* > 1
Выбор структуры метода Нет Расчет эффективности выбранной
прогнозирования модели прогонозирования
4 ¿Да
Определение переменных, Использование выбранной
влияющих на ВР ЭП методики прогнозирования
___________1__________
О
Рис. 2. Процесс выбора оптимальной методики прогнозирования
©
- Постановка задачи: точечная или интервальная оценка
- Описание тенденций (наличие сезонности и цикличности)
- Ожидаемые изменения
- Длина временного ряда
- Отсутствие аномальных значений
- Сопоставимость данных
- Отсутствие пропущенных значений
^ к рис. 4
Рис. 3. Блок формирования исходных данных
к рис. 3
Методы экспертных _оценок_
Фактографические методы
Модели имитационного и спектрального характера
Определение зависимых переменных Р1,Р2, • • •, Рп
\ переменных р1,р2, •, рп /
£ „ '''т 4 т '
1
— Ё (Щ т, - Щ т ) г ■!», = ■ _ ,
Проверка отсутствия автокорреляции ошибок
рис. 6
Рис. 4. Блок выбора информационной базы
Расчет параметров модели тренда, минимизирующей ее отклонения от точек исходного временного ряда, определяется как:
2 , П
г = 1--
Ё (ИТ,. - ИТ)
(5)
V2
5 = Ё (И - И) ^ т1п,
(3)
где Щ - прогнозное значение ЭП; Щ - фактическое значение ЭП;
п - число наблюдений. Теснота связи между отдельными влияющими факторами и тяговым электропотреблением И определяется как:
ГхЩ =
Т^2 ' V£4т
(4)
где ^ = х 'Ит - х'Wт •
Проведя тщательный корреляционный анализ, необходимо отметить оптимальное число влияющих на ЭП факторов и составить прогностическое уравнение множественной регрессии.
Ё (х - х)2 52 = _-
Ё (Ит, - Ит )2
_. о2 _ ,_
п т п
где х и Жп - выборка влияющего фактора и ЭП;
х и Щг - выборочная средняя влияющего фактора и электропотребления;
- выборочная дисперсия фактора;
£2 - выборочная дисперсия электропотребления.
Оценка адекватности модели и характеристика ее прогностической силы определяется как:
В соответствии с разработанным алгоритмом выбора оптимальной методики были определены основные критерии выбора, влияющие на результат поставленной цели. Это длина эволюционного цикла (ДЦ), глубина периода упреждения (ГУ), многофакторная природа (МП), коэффициент корреляции (КК) между ЭП и влияющими факторами, коэффициент детерминации (КД), наличие автокорреляции (А), наличие сезонности (С), наличие инертности (И) и выполнение предпосылок регрессии (ВП). В свою очередь каждый критерий влияет на методы прогнозирования (альтернативы). В качестве базовых альтернатив используются наиболее удачные методы с минимальной погрешностью прогнозирования. Это адаптивный метод (АМ), нейронные сети (НС), регрессионная модель (РМ), авторегрессионная модель (АМ), имитационная моделирование (ИМ), спектральный анализ (СА) и экспоненциальное сглаживание (ЭС).
Иерархическая структура с несколькими уровнями: цель - альтернативы - критерии представлена на рис. 5.
Матричная форма влияния друг на друга критериев имеет следующий вид [4]:
1
2
-=1
/
т
ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ
ДЦ ГУ
МП
КК
кд
А С И ВП
ДЦ 1
X 13 15 17
17
19
%
18
ГУ
3 1
X
X %
х
X X X
МП
3 3 1
X X X X X X
КК
5 3 5 1
X X X X X
КД
7
4
5 3 1
X X
А 9
5 3 3 3 1 1/
С 9
5 5 3 3 3 1 1/
И 8 7
4
3 3 3 3 1 1/
ВП 8 7
9
3 3 3 3 3 1
(6)
вия автокорреляции представлен на рис. 6.
М(е1е]) = 0, (г Ф ]). (7)
Наиболее простым и достаточно обоснованным из ряда приемов обнаружения автокорреляции является метод, предложенный Дарбином и Уотсоном:
Блок расчета критериальности
Использование процедуры оценки, основанной на МНК, предполагает обязательное удовлетворение целого ряда предпосылок, невыполнение которых может привести к значительным ошибкам.
1. Отсутствие автокорреляции ошибок, т. е. значения ошибок различных наблюдений независимы друг от друга. Алгоритм проверки отсутст-
X(^- -1)
й = —-
п
Хе2
(8)
Коэффициент автокорреляции первого порядка находится как:
Я =
е ■ е
X е
(9)
Оптимальная методика прогнозирования ВР электропотребления
Общая цель
Альтернативы
Критерии
Рис. 5. Иерархическая структура достижения цели
I к рис. 4
Автокорреляционные преобразования
Автокорреляция отсутствует
Автокорреляция присутствует Авторегрессионные модели
к рис. 7
Рис. 6. Алгоритм проверки отсутствия автокорреляции
2
3
3
3
3
3
3
3
г=1
п
2
г=1
где - ошибка при прогнозировании.
При обнаружении существенной автокорреляции отклонений от регрессии логично признать наличие ошибки в спецификации уравнения. Необходимо вернуться к этой проблеме, пересмотреть набор переменных и уточнить форму уравнения. В ряде случаев существенное уменьшение автокорреляции остатков дает включение в уравнение такой переменной, как время.
2. Случайные ошибки имеют нулевую среднюю, конечные дисперсии и ковариации.
3. Каждое измерение случайной ошибки характеризуется нулевым средним, не зависящим от значений наблюдаемых переменных.
4. Дисперсии каждой случайной ошибки одинаковы, их величины независимы от значений
наблюдаемых переменных.
) = ^2
5. Случайные ошибки распределение.
М(Х) = а , Б(Х) = <?2. (11)
6. Значения эндогенной переменой свободны от ошибок измерения и имеют конечные средние значения и дисперсии.
Алгоритм проверки предпосылок можно проследить по рис. 7.
(10)
имеют нормальное
Одна из основных проблем в выборе оптимальной методики есть проблема выбора формы кривой, решение которой определяют результаты экстраполяции тренда. Алгоритм выбора уравнения кривой описывающего ВР ЭП представлен на рис. 8. На сегодняшний день существует несколько практических подходов [5]. Для выбора вида функциональной зависимости используется прием, основанный на определении соотношений между изменениями входной и выходной величины, предполагающий ту или иную функциональную зависимость.
Вводятся понятия о приращении зависимой и независимой переменной Ау и Ах, т. е. Ау = у( - уг-1; Ах = х{ - хг-1. Зависимость приращений переменных и формы кривой можно проследить в табл. 1.
Блок реализации
Чтобы оценить возможные преимущества выбранного метода прогнозирования временных рядов тягового электропотребления, необходимо выявить его эффективность (алгоритм изображен на рис. 9). Под эффективностью следует понимать меру оценки достоверности прогноза, являющуюся основанием для принятия оптимального решения.
к рис. 6
Проверка предпосылок
Иные адаптивные модели
Пр.: 1, 5 1
м о,) = о
0(е,) = о
]
В (е,) = ^ 2 I
^ = N(ш,о- )
К (ее.) <®
Рис. 7. Алгоритм проверки предпосылок регрессионного анализа
I к рис. 7
к рис. 9
Рис. 8. Алгоритм выбора уравнения кривой временного ряда
Рис. 9. Алгоритм проверки эффективности метода прогнозирования
Таблица 1 Зависимость вида кривой от показателей
Характер изменения показателей во времени Вид кривой
Ay —1— = const Ax y = a0 + a • x
A ln y -= const Ax У = a0 • xa
A ln y -= const A ln x У = a0 • a1
Ay 2 —- = const Ax 2 2 y = a0 + a1 • x + a2 • x
A(X) y —— = const Ax x y = a0 + a • x
Для любого фиксированного значения математического ожидания процесса т распределение при реализованном среднем значении выборки будет выражаться в виде:
f 1 = N
m
а
m, — n
2Л
(13)
/
Для принятия решения по рассматриваемому процессу необходимо знать апостериорное распределение, которое будет определяться по формуле Байса:
m
f (m) = m
m
f (m) • P(m)
m
I" f (m) • P(m) • dm
m
Величину дисперсий а
и а„
(14)
можно рас-
О точности и надежности метода прогнозирования можно судить по тому, насколько результаты, полученные с его помощью, соответствуют реальным значениям.
Наиболее удачной и в ряде случаев позволяющей однозначно отвечать на вопрос о точности и надежности получаемого прогноза является используемая на практике процедура ретроспективного анализа.
Пусть исследуемый (прогнозный процесс) имеет нормальное распределение:
/ (X) = N(m,v2), (12)
где т - математическое ожидание;
72 - дисперсия процесса.
Пусть некоторые дополнительные наблюдения на ретроспективном участке дают значение исследуемого процесса т.. Данное значение является средней величиной некоторой выборки хь ..., хп. Среднее значение этой выборки есть нормально распределенная случайная величина.
сматривать как меру априорной достоверности гипотезы относительно величины математического ожидания рассматриваемого процесса. В то же время несовершенный прогноз дает большое значение дисперсии 7^ и делает это отношение маленьким.
Таким образом, чем больше дисперсии прогноза, тем меньше эффективность используемого метода прогноза. Непосредственно эффективность прогноза получается как:
eff = 2,501 • а -aV2 =
2,501
4
а2 -а2
пр 1
(15)
Полученное выражение позволяет численно определить, какой из конкурирующих методов дает лучшие результат.
Данная методика позволяет получить оперативный прогноз ВР ЭП, а также определить весовые коэффициенты каждого критерия (наличие или отсутствие тенденции, корреляции, автокорреляции, многофакторной природы; длина ВР;
АМ 1,01 1,00 1,05 1,44 1,44 1,00 0,97 0,97 1,05 11,08
НС 1,01 1,00 1,05 1,01 1,01 1,00 1,00 1,00 1,05 10,02
РМ 1,01 1,00 0,97 1,02 1,02 1,00 1,00 1,00 1,05 9,95
АМ 1,01 0,91 1,07 1,22 1,22 1,00 1,06 1,06 1,15 10,69
ИМ 1,02 1,12 1,09 1,01 1,01 1,00 1,00 1,00 1,18 10,33
СА 0,98 1,14 1,02 1,01 1,01 1,00 1,00 1,00 1,18 10,21
ЭС 0,98 1,14 1,18 0,99 0,99 1,00 1,00 1,00 1,05 10,29
глубина периода упреждения; выполнение предпосылок регрессионного анализа) относительно рассматриваемых методов прогнозирования. Итоговая матрица весовых коэффициентов для каждого критерия имеет следующий вид:
" ДЦ ГУ МП КК КД А С И ВП Ь
(16)
Наилучшей методикой оперативного прогнозирования электропотребления железнодорожного транспорта при наличии сведений о суточном грузообороте и температуры окружающей среды является модифицированный адаптивный метод множественной регрессии с величиной полезности, равной 11,08.
Графическое представление фактического электропотребления и результатов прогнозирования тягового электропотребления адаптивным методом множественной регрессии изображено на рис. 10. Максимальная погрешность лежит в пределах интервала ±5 %. Заключение
1. Предложена классификация методов прогнозирования временных рядов электропотребления.
2. Разработана система критериев и алгоритм выбора оптимальной методики прогнозиро-
вания временных рядов электропотребления в зависимости от имеющейся исходной информации.
3. Оптимальной методикой оперативного прогнозирования ЭП является модифицированный адаптивный метод множественной регрессии.
4. Погрешность прогнозирования тягового электропотребления адаптивным методом множественной регрессии удовлетворяет требованиям работы на рынках ЭЭ.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Дурнов В. Г., Раевский Н. В., Яковлев Д. А. Прогнозирование электропотребления : сб. тр. XV Междунар. научно-практ. конф. «Современные техника и технологии».- Томск : Изд. Томск. политехн. ун-та, 2009. — Т. 1. - 613 с.
2. Большов Л. А. Прогнозирование энергопотребления: современные подходы и пример исследования. // Известия наук Энергетика. - 2004. -№ 6.
3. Бестужев-Лада И. В. Рабочая книга по прогнозированию. - М. : Мысль, 1982. - 430 с.
4. Саати Т. Принятие решений. Метод анализа иерархий. - М. : Радио и связь, 1993.
5. Четыркин Е. М. Статистические методы прогнозирования. - 2-е изд., пераб. и доп. - М. : Статистика, 1977. - 200 с. : ил.
-♦— Фактическое ЭП -■— Прогнозное ЭП Рис. 10. Соотношение фактического и прогнозного электропотребления