УДК 004.032.26
DOI: 10.24412/2071-6168-2024-10-249-250
ПРОГНОЗИРОВАНИЕ ЭЛЕКТРОПОТРЕБЛЕНИЯ С ИСПОЛЬЗОВАНИЕМ ДОВЕРИТЕЛЬНЫХ
ИНТЕРВАЛОВ
А.Ю. Горшенин, А.С. Грицай, В.Ю. Кобенко, Е.Г. Андреева
В статье рассмотрены вопросы формирования доверительного интервала при краткосрочном прогнозировании электропотребления. В исследовании применяется метод бутстрэп-итераций для построения доверительных интервалов, что способствует учету случайных вариаций в данных и улучшает оценку степени уверенности прогнозов. Приведены результаты построения графика с доверительным интервалом.
Ключевые слова: электропотребление, доверительный интервал, бутстрэп-итерация, прогнозирования, машинное обучение, управление ресурсами.
Введение. Прогнозирование электропотребления является важным элементом обеспечения стабильности и надежности работы энергосистем [1-5]. Неопределенность прогнозов представляет существенные трудности для эффективного управления и распределения ресурсов. Оценка этой неопределенности важна при краткосрочном прогнозировании, поскольку отклонения могут привести к избыточному или недостаточному распределению ресурсов, что влияет на экономическую эффективность участников Оптового рынка электрической энергии и мощности [6,7].
Одним из методов для оценки неопределенности является формирование доверительного интервала (ДИ), который позволяет количественно определить диапазон значений, в котором с заданной вероятностью находится истинное значение прогноза. В исследовании применяется метод бутстрэп-итераций, который создает несколько выборок данных для обучения моделей прогнозирования. Этот подход учитывает случайные колебания и определяет уровень уверенности в прогнозах.
Также исследуется возможность применения гибридной модели прогнозирования для краткосрочного прогноза с учетом неопределенности (разработка моделей и ход исследования подробно описаны в работах [8-12]). Используемые методы бутстрэп-анализа и статистической обработки данных позволяют сформировать доверительные интервалы для каждого часа прогнозирования. Оценка доверительных интервалов способствует повышению точности прогнозов и учету разнообразия возможных исходов.
Представленные результаты показывают, что применение бутстрэп-подхода для формирования доверительных интервалов минимизирует систематические и случайные ошибки в прогнозировании, что делает этот метод перспективным для краткосрочных прогнозов в условиях высокой неопределенности.
Целью исследования является разработка алгоритма оценки неопределенности краткосрочных прогнозов электропотребления с использованием доверительных интервалов. Это включает построение доверительных интервалов для каждого часа прогнозирования на основе бутстрэп-итераций, что позволит учесть случайные вариации в данных и определить степень уверенности прогнозов. Исследование направлено на повышение точности прогнозов электропотребления, обеспечивая более эффективное управление энергетическими ресурсами.
Формирование доверительного интервала. Идея формирования доверительного интервала заключается в использовании информации из аналогичных временных периодов ретроспективных данных для оценки неопределенности прогнозов. Для этого применяется метод бутстрэп-итераций [13], позволяющий создать несколько выборок данных, на которых обучаются модели прогнозирования. Далее эти модели используются для оценки прогнозов на тестовых данных, что позволяет учесть разнообразие возможных исходов. Результатом является оценка ДИ для каждого часа прогноза, который учитывает неопределенность прогнозов и позволяет принять во внимание возможные изменения во временных рядах данных.
В работе [14] подробно рассматриваются методы оценки и анализа погрешностей в измерениях, включая расчет доверительных интервалов. Согласно [14], доверительный интервал служит для оценки диапазона значений, в котором с заданной вероятностью находится истинное значение измеряемой величины. Важной частью такой оценки является учет случайных погрешностей и использование нормального распределения, что позволяет формировать доверительный интервал для различных уровней доверия.
Применение бутстрэп-методов также связано с повторным ресемплированием данных для оценки статистической точности. В работе [14] рассмотрены методы статистической обработки данных, которые можно сопоставить с бутстрэп-подходом, и приводятся рекомендации по выбору уровня доверия, например, 95%, исходя из допустимой погрешности и требований к точности результатов измерений.
Таким образом, в трактовке авторов использование уровня доверия 95% обусловлено необходимостью минимизации как систематических, так и случайных ошибок в рамках допустимого компромисса между шириной интервала и точностью измерений.
Для выявления границ ДИ применялся метод бутстрэп-анализа [13] в основе которого лежит ресемплиро-вание (процесс отбора единиц наблюдений из исходного набора данных с целью формирования подвыборки). Данный метод используется для оценки распределения статистических оценок, основываясь на многократном повторении выборки с возвращением (каждый элемент исходной выборки может быть выбран несколько раз при формировании новой выборки или быть не выбранным вообще) из имеющегося набора данных. На рисунке 1 представлен алгоритм процесса построения ДИ.
На каждой сгенерированной бутстрэп-выборке обучается модель прогнозирования (гибридная модель). Вычисление стандартного отклонения прогнозов происходит для каждого часа, что позволяет оценить степень неопределенности в прогнозах модели для конкретного часа. На основе стандартного отклонения прогнозов вычисляются верхние и нижние границы доверительного интервала для каждого часа. Доверительный интервал представляет собой диапазон значений, в котором с вероятностью 95% будет находиться истинное значение прогноза.
Полученные значения ДИ позволяют оценить неопределенность в прогнозах модели каждого часа, что позволяет учитывать возможные изменения в электропотреблении и оценить уровень уверенности в прогнозах.
Проведено формирование бутстрэп-выборок где Б1, Бг, ..., Бп - выборка. Опираясь на нее, можно смоделировать распределение £, и получить необходимые выборки из смоделированного распределения.
Рис. 1. Алгоритм формирования доверительного интервала
Бп приближается эмпириче-(1)
Как известно из статистики, истинное распределение £, по выборке Б1, Бг ски с функцией распределения:
= < X),
где 1(А) - индикатор события А задается как:
1,А произошло (-)
' ( (0, А не произошло'
Индикатор события используется для определения, было ли определенное наблюдение включено в бут-стрэп-выборку или нет.
Имея функцию распределения можно моделировать бутстрэп-выборки необходимого объема. Это эквивалентно формированию выборок путем случайного выбора из п объектов с возвращением из исходной выборки. То есть бутстрэп-выборка объема п из выборки Б1,Бг, ...,Бп будет набор д17),Х)^,...,где £ 02,..., Таким образом, после генерации бутстрэп-выборок можно вычислить оценки математического ожидания (ц) дисперсии ( <г2) и среднего отклонения (<г):
Дв = (3)
2
<?2 = ^Е^-Дв)2, (4)
Далее можно рассчитать границы нижнюю (Ьб) и верхнюю (ПБ) границы ДИ для каждого часа прогноза
Щ:
= , = + г ,
(5)
где Б - количество бутстрэп-итераций; -среднее значение по бутстрэп-выборкам; - средняя стандартная ошибка; г * - половина ширины доверительного интервала; п - размер выборки; г - критическое значение для уровня доверия 95% (для нормального распределения г = 1.96 [14]).
На рисунке 2 представлен график прогноза с доверительным интервалом.
Результаты, представленные на рисунке, показывают, что модель прогнозирования электропотребления демонстрирует высокую точность прогнозирования в течении суточного цикла. Суточная динамика электропотребления четко отражает характерные пиковые периоды и спады, связанные с изменением активности потребителей, с минимальным потреблением в ночное время и максимальными значениями ближе к полудню и вечером.
Важным результатов является узкий доверительный интервал, что свидетельствует о высокой степени уверенности модели в своих прогнозах. Верхняя и нижняя границы доверительного интервала демонстрируют небольшую разбежку, особенно в пиковые моменты потребления, что указывает на низкую неопределенность прогноза в ключевых временных точках. Это позволяет сделать вывод о том, что гибридная модель прогнозирования способна эффективно учитывать, как сезонные, так и суточные колебания электропотребления, предоставляя точные предсказания с минимальной погрешностью.
340 t Прогноз гибридной модели Час прогноза / Л- ---- > ivi vi
зго — " Нижняя граница ДИ /А ✓
— - Верхняя граница ДИ
* m 300
-
280 V' 2SL-
\ у/
260 .J
240
00 00 03 00 06:00 09 00 12. 00 15:00 18:00 21:00 00 00
t, час
Рис. 2. Прогнозный график с доверительным интервалом
Заключение. Результаты исследования показывают, что алгоритм на основе бутстрэп-итераций эффективно оценивает неопределенность краткосрочных прогнозов электропотребления. Разработанный алгоритм позволил минимизировать систематические и случайные ошибки в прогнозах, что обеспечило более высокую точность предсказаний. Использование доверительных интервалов дает экспертам предприятий энергетического комплекса страны возможность принимать более обоснованные решения по управлению ресурсами, что в конечном итоге способствует улучшению общей стабильности системы.
Список источников
1. Горшенин А.Ю. Модель краткосрочного прогнозирования электропотребления для АО «атомэнерго-сбыт» с использованием ансамбля градиентного бустинга / А. Ю. Горшенин, А. С. Грицай, А. В. Николаев // Международный форум KAZAN DIGITAL WEEK - 2023: Сборник материалов / Сост. Р.Ш. Ахмадиева, Р.Н. Минниханов. Под общей редакцией Р.Н. Минниханова. Казань: Научный центр безопасности жизнедеятельности, 2023. С. 529537. EDN AGWZBH.
2. Надтока И.И. Нейросетевая модель прогнозирования электропотребления с учетом освещенности на территориях операционных зон региональных диспетчерских управлений // И. И. Надтока, С. О. Губский, И. Е. Шепелев // Изв. вузов. Электромеханика. 2012. № 2. С. 18-21.
3. Макоклюев Б.И. Анализ и планирование электропотребления. Москва: Энергоатомиздат, 2008. 296 с.
4. Гнатюк В.И. Теоретические основы управления электропотреблением на базе квантовой ранговой динамики / В.И. Гнатюк, О.Р. Кивчун // Промышленная энергетика. 2024. № 1. С. 2-7. DOI 10.34831/EP.2024.44.59.001. EDN QYTGAO.
5. Гнатюк В.И. Обоснование качества управления электропотреблением регионального электротехнического комплекса / В.И. Гнатюк, О.Р. Кивчун // Промышленная энергетика. 2024. № 5. С. 13-18. DOI 10.34831/EP.2024.75.23.002. EDN GOQPXL.
6. Хамитов Р.Н. Программа построения доверительных интервалов для краткосрочного прогнозирования объемов электропотребления / Р.Н. Хамитов, А.С. Грицай, Д.К. Габбасов // Хроники объединенного фонда электронных ресурсов Наука и образование. 2017. № 1(92). С. 13. EDN XKOXWR.
7. Костин Н.С. О построении доверительных интервалов в задачах краткосрочного прогнозирования электропотребления / Н. С. Костин, А. С. Грицай // Новые информационные технологии в исследовании сложных структур : материалы 11-й международной конференции. Екатеринбург: Национальный исследовательский Томский государственный университет, 2016. С. 32. EDN XSHCIV.
8. Горшенин А.Ю. Применение деревьев решений для краткосрочного прогнозирования электропотребления // Известия Тульского государственного университета. Технические науки. 2024. № 7. С. 246-253. DOI 10.24412/2071-6168-2024-7-246-247. EDN ZCJJNA.
9. Горшенин А.Ю. Разработка и верификация программного обеспечения системы краткосрочного прогнозирования электропотребления // Известия Тульского государственного университета. Технические науки. 2024.-№ 7. С. 253-259. DOI 10.24412/2071-6168-2024-7-253-254. EDN JSSRYK
10. Горшенин А.Ю. Формирование выборки исходных данных для машинного обучения модели краткосрочного прогнозирования электропотребления // Автоматизация в промышленности. 2023. № 10. С. 37-41. DOI 10.25728/avtprom.2023.10.08. EDN DKNORJ.
11. Горшенин А.Ю. Применение машинного обучения деревьев решений для краткосрочного прогнозирования электропотребления / А. Ю. Горшенин, А. С. Грицай, Л. А. Денисова // Известия Тульского государственного университета. Технические науки. 2023. № 11. С. 226-231. DOI 10.24412/2071-6168-2023-11-226-227. EDN GJOPDO.
12. Горшенин А.Ю. Сравнение методов на основе деревьев решений в задаче краткосрочного прогнозирования электропотребления // Математические структуры и моделирование. 2023. № 4(68). С. 12-21. DOI 10.24147/2222-8772.2023.4.12-21. EDN COYBGY.
13. Bradley Efron. Bootstrap Methods: Another Look at the Jackknife (англ.) // Annals of Statistics. 1979. Vol. 7, no. 1. P. 1-26. DOI: 10.1214/aos/1176344552.
14. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. 2-е изд., перераб. и доп. Л.: Энергоатомиздат. Ленингр. отд-ние, 1991. 304 с.
Горшенин Алексей Юрьевич, аспирант, [email protected], Россия, Омск, Омский государственный технический университет,
Грицай Александр Сергеевич, канд. техн. наук, доцент, Россия, Омск, Омский государственный технический университет
Кобенко Вадим Юрьевич, д-р техн. наук, профессор, Россия, Омск, Омский государственный технический университет,
Андреева Елена Григорьевна, д-р техн. наук, профессор, Россия, Омск, Омский государственный технический университет
FORECASTING ELECTRICITY CONSUMPTION USING CONFIDENCE INTERVALS
A.Y. Gorshenin, A.S. Gritsai, V.Y. Kobenko, E.G. Andreeva
The article considers the issues offorming a confidence interval in short-term forecasting of electricity consumption. The study uses the bootstrap iteration method to construct confidence intervals, which helps to take into account random variations in the data and improves the assessment of the degree of confidence offorecasts. The results of constructing a graph with a confidence interval are presented.
Key words: electricity consumption, confidence interval, bootstrap iteration, forecasting, machine learning, resource management.
Gorshenin Aleksey Yurievich, postgraduate, augomgtu@gmail. com, Russia, Omsk, Omsk State Technical University,
Gritsay Alexander Sergeevich, candidate of technical science, docent, Russia, Omsk, Omsk State Technical
University,
Kobenko Vadim Yurievich, doctor of technical science, professor, Russia, Omsk, Omsk State Technical University,
Andreeva Elena Grigorievna, doctor of technical science, professor, Russia, Omsk, Omsk State Technical
University
УДК 004.62
DOI: 10.24412/2071-6168-2024-10-252-253
АЛГОРИТМ И МЕТОД ОБРАБОТКИ СЛАБОСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ О ТЕХНОЛОГИЧЕСКИХ НАРУШЕНИЯХ В ЭЛЕКТРИЧЕСКИХ СЕТЯХ НАПРЯЖЕНИЕМ 0,4... 10 КВ С ПРИМЕНЕНИЕМ РЕГУЛЯРНЫХ ВЫРАЖЕНИЙ
А.С. Сабельников, Н.А. Серебряков, С.О. Хомутов, Е.Г. Андреева, А.М. Парамонов, В.Ю. Кобенко, А.П. Науменко
Представлены результаты исследования по разработке алгоритма извлечения полезной информации из слабоструктурированных данных, содержащихся в электронных таблицах с непоследовательным форматированием. Предложен алгоритм извлечения слабоструктурированных данных, сущность которого заключается в предварительном анализе данных для установления позиционирования полезных данных и выявления закономерностей в их расположении. Составлены регулярные выражения для извлечения полезных данных. Реализован алгоритм и метод извлечения информации о технологических нарушениях в объектах электросетевого хозяйства с помочью инструментов генеративного искусственного интеллекта, а также его программная реализация. Полученные данные имеют практическое значение при планировании технического обслуживания и капительного ремонта.
Ключевые слова: технологические нарушения, извлечение данных, слабоструктурированные данные, регулярные выражения, передача электрической энергии.
Электроэнергетика — ключевая отрасль топливо-энергетического комплекса (ТЭК), составляющего основу экономики и жизнеобеспечения. В 2023 году доля ТЭК в ВВП России составила 20%, из которых 2,3% (8,6 трлн рублей) приходится на электроэнергетику, обеспечивающую 1,6 млн рабочих мест. Продукция отрасли занимает первое место в цепочке создания добавленной стоимости, что усиливает её мультипликативный эффект на экономику. Цифровизация и повышение эффективности электроэнергетики оказывают прямое и косвенное влияние на рост конкурентоспособности других отраслей [1].
Цифровизация и автоматизация энергетических систем обладает рядом значительных преимуществ. Среди них - снижение текущих и капитальных затрат на реконструкцию и развитие систем, уменьшение расходов на техническое обслуживание и ремонт, продление срока службы оборудования, повышение производительности труда персонала, а также множество других положительных эффектов [1].
Объективная необходимость цифровизации энергетических систем усиливается по мере их усложнения, снижения способности к самоадаптации и устойчивости перед внутренними и внешними дестабилизирующими факторами. Это особенно характерно для электроэнергетических систем, которые в большей степени подвержены таким воздействиям [1].
Одним из направлений электроэнергетики является передача электрической энергии (ЭЭ). В промышленности вопросы автоматизации зачастую касаются организации и управлением технологическим процессом. В передаче электрической энергии производственные процессы представляют собой, в частности, организацию технического обслуживания и ремонта объектов электросетевого хозяйства, другими словами, эксплуатацию. Для эффек-
252