Научная статья на тему 'ПРИМЕНЕНИЕ ДЕРЕВЬЕВ РЕШЕНИЙ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ'

ПРИМЕНЕНИЕ ДЕРЕВЬЕВ РЕШЕНИЙ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
23
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
power consumption forecasting / machine learning / decision trees / gradient boosting / Aleksey Yurievich / postgraduate / [email protected]. Russia / Omsk / Omsk State Technical University

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горшенин Алексей Юрьевич

В статье рассматриваются вопросы краткосрочного прогнозирования электропотребления с использованием методов машинного обучения. Проведен анализ эффективности применения деревьев решений и ансамблей деревьев решений XGBoost. Исследовано влияние количества деревьев в ансамбле и объема обучающей выборки на точность прогноза.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Горшенин Алексей Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF DECISION TREES FOR SHORT-TERM FORECASTING OF POWER CONSUMPTION

The article discusses the issues of short-term forecasting of power consumption using machine learning methods. An analysis of the effectiveness of using decision trees and ensembles of XGBoost decision trees was carried out. The influence of the number of trees in the ensemble and the size of the training sample on the accuracy of the forecast was studied.

Текст научной работы на тему «ПРИМЕНЕНИЕ ДЕРЕВЬЕВ РЕШЕНИЙ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ»

УДК 004.896

DOI: 10.24412/2071-6168-2024-7-246-247

ПРИМЕНЕНИЕ ДЕРЕВЬЕВ РЕШЕНИЙ ДЛЯ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ

ЭЛЕКТРОПОТРЕБЛЕНИЯ

А.Ю. Горшенин

В статье рассматриваются вопросы краткосрочного прогнозирования электропотребления с использованием методов машинного обучения. Проведен анализ эффективности применения деревьев решений и ансамблей деревьев решений XGBoost. Исследовано влияние количества деревьев в ансамбле и объема обучающей выборки на точность прогноза.

Ключевые слова: прогнозирование электропотребления, машинное обучение, деревья решений, градиентный бустинг.

Прогнозирование электропотребления является важной задачей для обеспечения стабильной и эффективной работы энергосистем [1-4]. Для энергосбытовых компаний точность прогноза напрямую влияет на финансовые показатели, позволяя оптимизировать закупки электроэнергии и минимизировать риски [5]. Более точное прогнозирование позволяет энергосбытовым компаниям оптимизировать объемы закупаемой электроэнергии на Оптовом рынке электрической энергии и мощности (ОРЭМ), избегая как дефицита, так и излишков [6].

Краткосрочное прогнозирование помогает энергосбытовым компаниям учувствовать в балансировании энергосистемы, предоставляя оператору информацию о планируемом потреблении электрической энергии [7-9]. Это способствует обеспечению стабильности и надежности энергоснабжения. Неточности в прогнозировании могут привести к финансовым потерям, связанным с необходимостью закупки электроэнергии по более высоким ценам на балансирующем рынке или оплатой штрафов за небаланс [10]. Точный прогноз позволяет минимизировать эти риски [11]. Также краткосрочное прогнозирование позволяет разрабатывать гибкие тарифные планы и оптимизировать ценообразование для потребителей, учитывая динамику спроса и предложения на рынке электроэнергии [12].

В последние годы методы машинного обучения, в частности, деревья решений, приобрели широкую популярность в задачах прогнозирования электропотребления [3,9,13-16]. Деревья решений позволяют легко проследить логику принятия решений моделью, что делает их понятными и прозрачными для анализа. Деревья решений эффективно улавливают сложные нелинейные зависимости между переменными, что особенно важно для прогнозирования электропотребления, которое зависит от множества факторов.

Современные методы, такие как XGBoost [17] (eXtreme Gradient Boosting - экстремальный градиентный бустинг), основанные на ансамблях деревьев решений, демонстрируют высокую точность прогнозирования. XGBoost использует градиентный бустинг, постепенно улучшая прогноз за счет добавления новых деревьев, которые корректируют ошибки предыдущих [11,18-22].

В статье рассматриваются вопросы краткосрочного прогнозирования электропотребления с использованием деревьев решений.

Цель и задачи исследования. Исходные данные.

Целью исследования является оценить возможность применения деревьев решений и необходимость применения ансамблей деревьев решений при прогнозировании электропотребления.

Для того чтобы достичь цели, в работе решение следующие задачи:

- исследовать влияние количества деревьев решений на точность прогноза;

- проанализировать зависимость точности прогноза от объема обучающей выборки;

- продемонстрировать наглядно процесс обучения модели и механизм формирования прогноза.

В исследовании использованы данные, полученные от энергосбытовой компании АО «АтомЭнергоСбыт» и представленные массивом, состоящих из почасовых наблюдений технологических параметров, за период от 01.01.2015 г. до 30.06.2023 г. Фрагмент исходных данных представлен в табл. 1, в которую включены ретроспективные данные по электропотреблению (W, МВт*ч) в каждый момент сбора данных (Timestamp), Ta - температура окружающей среды, также учитывалась доля длительности светового дня: Ld = ((т/60 + К)/24), где m(h) - мину-ты(часы) продолжительности светового дня (выбраны с информационных сервисов погоды [23]).

Таблица 1

Исходные данные для прогнозирования электропотребления (фрагмент)_

Момент времени (Timestamp) Технологические параметры

Электропотребление W, МВт• ч Температура окружающей среды Ta, к Доля длительности светового дня La

01.01.2015 0:00 529,0 -0,8 0,0

01.01.2015 1:00 518,8 -0,8 0,0

01.01.2015 2:00 506,9 -0,9 0,0

01.01.2015 3:00 492,0 -0,9 0,0

01.01.2015 4:00 479,6 -1,3 0,0

30.06.2023 23:00 286,8 7,7 1,0

На основании имеющихся исходных данных (за 8 лет: с января 2015 г. по июнь 2023г.) требуется построить прогноз на январь 2023 года при помощи деревьев решений, используя ретроспективные данные.

Прогнозирование на основе одного дерева решений. Из массива данных приведенных в табл. 1 взяты 10 и 50 строк (соответствуют десятичасовому и пятидесятичасовому периоду соответственно). Объем обучающих выборок п*г для краткосрочного прогнозирования равен количеству строк и столбцов исходных данных для отдельно взятого количества строк. На рисунках 1, а (для 10 строк, п*г = 20) и 1, б (для 50 строк, п*г = 100) представлены

деревья решений сформированные в процессе обучения модели краткосрочного прогнозирования. Исходные данные построены на рисунке 1, в и 1, г для значений электропотребления Ш, на рисунке 1, д и 1, е для значений температуры окружающей среды Та и доли длительности светового дня Ьа. Значения Ьа в представленный промежуток времени равны нулю и не учитываются при построении деревьев решений, т.к. имеют низкое влияние на зависимую переменную Ш.

п*г = 20 (слева) и п*г = 100 (справа): на основе ретроспективных данных по W (в, г) и Та, Ьл (д, е)

Точки Т1, Тг, Тз на графиках соответствуют узлам деревьев решений (см. рис. 1 д, е). При объеме обучающей выборки п*г = 20, прогнозное значение электропотребления на первый час прогнозируемых суток \У110 = 436.4 МВт*ч, соответствует Т1 на графике 1, в, эта точка находится при низкой температуре (см. рис. 1, д). Таким образом можно предположить, что в процессе обучения дерева решений использовалась информация о зависимости электропотребления Ш от температуры Та.

При объеме обучающей выборки п= 100, прогнозное значение электропотребления = 467.0

МВт*ч, что соответствует колебаниям между верхними и нижними точками на графике 1, г. Это связано с добавлением в обучающую выборку большего количества значений, что дает модели возможность улавливать более сложные зависимости в данных. Гистограммы ошибок краткосрочного прогнозирования на сутки вперед представлены на рисунке 2.

Время,час

Рис. 2. Гистограммы ошибок прогнозирования при разных объемах выборки п£г = 20 (а); = 100 (б)

247

Оценивание модели проводилось по метрике МАРЕ, которая отображает ошибку в процентах, по форму-

МАРЕ = -£Г=1

100%, (1)

где Wij (\Vij-) - фактическое (прогнозируемое) значение электропотребления в г'-й час ]-х суток; п - количество наблюдений.

При объеме выборки п*г = 20 средняя процентная ошибка прогнозирования МАРЕ = 19.6%, при п*г = 100 средняя ошибка МАРЕ = 14.0% Получено, что при увеличении объема обучающей выборки ошибка прогнозирования уменьшается, из этого следует, что деревья решений находят большее количество зависимостей целевой переменной от исходных данных. Но такое значение ошибки недопустимо при торговле электроэнергией на ОРЭМ. Из этого следует, что требуется увеличить объем обучающей выборки для снижения ошибки прогнозирования. На рисунках 3, а (п£г = 400) и 3, б (п£г = 2000) представлены деревья решений сформированные в процессе обучения модели краткосрочного прогнозирования. На рисунке 3, в и 3, г отображены графики распределения для значений электропотребления Ш, на рисунке 3, д и 3, е для значений температуры окружающей среды Та и доли длительности светового дня Ьа.

ле:

600'-т 550

£ 450

400

гф>' год>' го1>' гог' га1> го

Время, час (Лше^атр)

(IV г«1У

уй^- 0уО1 ог.оЬ гл1 уД» оуО=>

г:-''' -г:-'1'

Время, час <Т1те5Сатр)

г)

ремя, час (Пте51агт1р}

^ ^ **> яР

Время, час (Ите5йтр)

Рис. 3. Построение деревьев решений (а, б) для прогнозирования электропотребления для объемов выборки п*г = 400 (слева) и п*г = 2000 (справа): на основе ретроспективных данных по W (в, г) и Та, Ьа (д, е)

При объеме обучающей выборки п*г = 400, прогнозное значение электропотребления на первый час прогнозируемых суток \У110 = 496.9 МВт*ч (значение ошибки МАРЕ = 3% на этот прогнозируемый час), что соответствует моментам изменения поведения переменных на графике на графике 1, в, которые соответствуют значениями в узлах дерева решений (см. рис. 1, а), отмеченным на графике распределения температуры окружающей среды (см. рис. 1, д). Таким образом это подтверждает, что в процессе обучения дерева решений использовалась информация о зависимости электропотребления Ш от температуры Та.

При объеме обучающей выборки = 2000, прогнозное значение электропотребления = 533.3, увеличение прогнозного значения объясняется добавлением в обучающую выборку более низких значений температуры окружающей среды (см. рис. 3, е), что повлияло на формирование дерева решений (см. рис. 3, а). Таким образом, отмеченные значения электропотребления также соответствуют более высоким значениям (см. рис. 3, г). На рисунке 4 представлены гистограммы ошибок краткосрочного прогнозирования на сутки вперед.

20 Г .1 : . ||11|..|Н1

Ф <?' # <? о ■> 5? # ч;5> л? * V

25 - 20 ■ .llllllli .il иШи.

Л? л? Г? ?Р £ ^ Время, час

Рис. 4. Гистограммы ошибок прогнозирования при разных объемах выборки п*г = 400 (а); п*г = 2000 (б)

248

Выявлено, что при объеме выборки п*г = 400 средняя ошибка прогнозирования МАРЕ = 11.0%, при увеличении объема выборки до п*г = 2000 средняя ошибка снижается до МАРЕ = 9.6%. Это указывает на то, что при использовании одного дерева решений для прогнозирования не приводит к значительному снижению ошибки. Также стоит отметить, что применение одного дерева решений дало неудовлетворительные результаты прогнозирования. Таким образом, требуется рассмотреть использование ансамбля деревьев решений.

Прогнозирование на основе ансамбля деревьев решений. Проведено исследование с использованием метода градиентного бустинга ХОЕооз1 для построения ансамбля деревьев решений. Добавив второе дерево в ансамбль, можно проанализировать результаты при тех же объемах выборки. На рисунках 5, а (п*г = 20) и 5, б (п*г = 100) представлены вторые деревья решений ансамблей, сформированные в процессе обучения модели краткосрочного прогнозирования. Графики распределения для значений электропотребления Ш представлены на рисунках 5, в и 5, г, для значений температуры окружающей среды Та и доли длительности светового дня Ьа - на рисунках 5, д и 5, е.

выборки п*г = 20 (слева) и п*г = 100 (справа): на основе ретроспективных данных по W (в, г) и Та, Ьл (д, е)

При размере обучающей выборки п*г = 20 произошло добавление дополнительного решающего правила во второе дерево ансамбля (см. рис. 5, а). Однако в связи с ограниченным разнообразием значений температуры окружающей среды (см. рис. 5, д) в обучающем наборе данных было выбрано значение электропотребления Ш, соответствующее уровню, предсказанному первым решающем правилом (см. рис. 5, в). Прогнозируемое значение электропотребления на первый час прогнозируемых суток составило \У110 = 436.9 МВт*ч. Незначительное изменение данного значения указывает на необходимость увеличения размера обучающей выборки ввиду недостаточной способности модели к обобщению.

При объеме обучающей выборки п*г = 100, прогнозное значение электропотребления \У110 = 466.9 МВт*ч. Незначительное изменение данного прогнозного значения может быть объяснено теми же причинами, связанными с недостаточной обобщающей способностью модели. Несмотря на схожесть деревьев решений, представленных на рисунках 1, б и 5, б, имеются различия, которые проявляются в значениях весов а в листьях деревьев решений.

Рис. 6. Гистограммы ошибок прогнозирования вторых деревьев решений при разных объемах выборки п*г = 20

(а); п* = 100 (б)

При объеме выборки п*г = 20 средняя ошибка прогнозирования МАРЕ = 19.5%, при п*г = 100 МАРЕ = 13.9%, что показывает несущественное снижение ошибки прогнозирования. На рисунках 7, а (п*г = 400) и 7, б (п£г = 2000) представлены вторые деревья решений ансамблей сформированные в процессе обучения модели краткосрочного прогнозирования. На рисунке 7, в и 7, г отображены графики распределения для значений электропотребления Ш, на рисунке 7, д и 7, е для значений температуры окружающей среды Та и доли длительности светового дня Ьа.

Время, нас <Т1те51атр] Время, час Ште^атр]

Рис. 7. Построение вторых деревьев решений (а, б) для прогнозирования электропотребления для объемов выборки п*г = 400 (слева) и п*г = 2000 (справа): на основе ретроспективных данных по № (в, г) и Та, Ьа (д, е)

При объеме обучающей выборки п%г = 400 прогнозное значение электропотребления на первый час прогнозируемых суток И^ю = 496.3 МВт*ч, что также показывает малое изменение в прогнозном значении и говорит том, что второе дерево вносит коррективы на основе прогноза первого дерева решений при помощи вычисления остатков от прогноза предыдущего дерева. На первом этапе производится вычисление остатков от известного значения целевой переменной:

П = Щ -% = 512.5 - 496.4 = 16.1. (2)

На втором этапе остатки от первого прогноза п между фактическим и прогнозным значением поступают на вход для второго дерева для определения остатка Г2. На следующих этапах процесс повторяется до тех пор, пока не будут обучены все деревья в ансамбле. В такой технике используется коэффициент скорости обучения г/, который управляет величиной обновления прогнозных значений в каждой итерации (новом дереве решений в ансамбле) обучения. В методе градиентного бустинга ХОЕооз1, каждое новое дерево в ансамбле обучается прогнозировать остатки предыдущих деревьев. После обучения нового дерева его прогнозы умножаются на коэффициент скорости обучения, прежде чем добавляются к общему прогнозу ансамбля, используя формулу обновления прогнозных значений:

Р(х1) = ) + ), (3)

где ) - предыдущий прогноз, ^н(х;) - новый прогноз, На основании этой формулы можно выразить прогнозные значения нового дерева на текущей итерации:

^(Х;) = (4)

По полученным данным известно, что ^Хх^) = 496.3, ^п(х;) = 494.4, г/ = 0.02 (задается при создании модели прогнозирования), то:

„ , ч 496.3-496.4

^Н(Х;)= ——-= -5 МВт • ч. (5)

Прогноз последующего дерева выполняется для коррекции прогноза предыдущего дерева с учетом информации п, добавленной новым деревом. Каждое новое дерево в ансамбле учитывает остатки от предыдущих деревьев, что позволяет модели постепенно корректировать прогнозные значения.

На рисунке 7, е наблюдается дополнительное включение второго параметра Ьа, что свидетельствует о его влиянии на прогнозные значения. Также на рисунке 7, б отмечается появление решающих правил для параметра Ьа на втором уровне узлов дерева решений. При объеме обучающей выборки п*г = 2000 прогнозное значение электропотребления составило И^до = 534.0. Увеличение объема обучающей выборки привело к появлению новых условий в решающих правилах, связанные с параметров, который ранее не учитывался при построении деревьев решений. Это подтверждает, что увеличение размера обучающей выборки способствует улучшению обобщающей способности модели. На рисунке 8 представлены гистограммы ошибок краткосрочного прогнозирования на сутки вперед.

При объеме выборки п*г = 400 средняя ошибка прогнозирования МАРЕ = 10.9%, при п*г = 2000 она снижается до МАРЕ = 9.5%. Выявлено, что добавление второго дерева в ансамбль не приводит к существенному снижению ошибки. Для снижения ошибки прогнозирования требуется добавить больше деревьев в ансамбль. В таблице 2 представлены значения ошибок прогнозирования МАРЕ (1) при разном количестве деревьев в ансамбле и объеме обучающей выборки п*г.

Можно видеть из таблицы, что с увеличением количества деревьев решений в ансамбле, средняя ошибка МАРЕ снижается. Это связано с тем, что большее количество деревьев приводит к усреднению прогнозов и уменьшению влияния отдельных, возможно ошибочных, деревьев. Также после определенного количества деревьев (120200), дальнейшее увеличение их числа приводит к незначительному уменьшению МАРЕ. Это связано с тем, что деревья начинают становиться слишком коррелированными и не добавляют новую информацию. Для решения этой проблемы требуется добавления новых параметров в обучающую выборку.

Также видно, что с увеличением объема обучающей выборки, средняя ошибка МАРЕ снижается. Это связано с тем, что модель имеет больше данных для обучения и может лучше обобщать на новые данные. Эффект увеличения объема выборки наиболее заметен при небольшом количестве деревьев. С ростом количества деревьев решений разница в средней ошибке МАРЕ между разными объемами обучающей выборки становится менее значительной.

■ _ ■ И И ИI

ж

я

Время, час

Рис. 8. Гистограммы ошибок прогнозирования вторых деревьев решений при разных объемах выборки п*г = 400

(а); п* = 2000 (б)

Таблица 2

Ошибка прогнозирования электропотребления на сутки вперед при использовании ансамбля деревьев решений

Количество деревьев в ансамбле Объем обучающей выборки п*г

20 | 100 | 400 | 2000 | 1,5*105

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Средняя ошибка МАРЕ, %

1 19,6 14,0 11,0 9,6 21,7

2 19,5 13,9 10,9 9,5 21,4

120 18,0 12,1 12,8 8,7 4,9

200 17,5 11,6 8,1 5,9 4,6

500 16,9 10,8 6,5 5,4 3,1

1000 16,9 10,6 5,6 5,2 2,1

Обсуждение результатов. Получено, что увеличение количества деревьев в ансамбле приводит к снижению ошибки прогнозирования. Выявлено, что увеличение объема обучающей выборки также способствует снижению ошибки прогнозирования. Одиночные деревья решений обладают высокой интерпретируемостью, что позволяет анализировать факторы, влияющие на прогноз. Однако, для достижения высокой точности прогнозирования, необходимо использовать ансамбли деревьев, жертвуя при этом интерпретируемостью модели.

На начальных этапах исследования, при использовании небольшого количества деревьев решений и ограниченного объема обучающей выборки, параметр доли длительности светового дня Ьа не учитывался моделью. Это связано с тем, что в данном случае влияние температуры окружающей среды Та было более значимым для прогнозирования электропотребления.

С увеличением объема обучающей выборки и количества деревьев в ансамбле, модель начала учитывать параметр Ьа, что позволило повысить точность прогноза. Для учета менее значимых факторов необходимо использовать более сложные модели и большие объемы данных.

Заключение. Проведенные исследования позволили подтвердить эффективность применения деревьев решений и, в особенности, ансамблей деревьев решений ХОЕооз1, для краткосрочного прогнозирования электропотребления. Ансамбли деревьев решений обеспечивают более высокую точность прогноза по сравнению с одиночными деревьями решений. Одиночные деревья решений обладают преимуществом в интерпретируемости. Их структура и логика принятия решений легко объясняются, что позволяет анализировать факторы, влияющие на прогноз. Следует отметить, что выбор между одиночными деревьями и ансамблями деревьев решений зависит от приоритетов задачи. Если требуется высокая точность прогноза, то предпочтительнее использовать ансамбли. Если важна интерпретируемость модели, то одиночные деревья решений могут быть более подходящим выбором.

Список литературы

1. Грицай А.С. Особенности построения биллинговой системы для энергосбытовой компании с целью обеспечения максимальной точности прогнозирования // Динамика систем, механизмов и машин: тез. докл. Между-нар. научн.-техн. конф. Омск: ОмГТУ, 2009. С. 250-254.

2. Потапов В.И., Грицай А.С., Тюньков Д.А. Спектральный анализ ретроспективных данных ООО "Омская энергосбытовая компания" об электропотреблении // Омский научный вестник. 2016. № 5(149). С. 74-76.

3. Горшенин А. Ю., Грицай А. С., Денисова Л. А. Применение машинного обучения деревьев решений для краткосрочного прогнозирования электропотребления // Известия Тульского государственного университета. Технические науки. 2023. № 11. С. 226-231. DOI 10.24412/2071-6168-2023-11-226-227.

4. Горшенин, А. Ю. Модель краткосрочного прогнозирования электропотребления для АО «атомэнерго-сбыт» с использованием ансамбля градиентного бустинга / А. Ю. Горшенин, А. С. Грицай, А. В. Николаев // Международный форум KAZAN DIGITAL WEEK - 2023 : Сборник материалов, Казань, 20-22 сентября 2023 года / Сост. Р.Ш. Ахмадиева, Р.Н. Минниханов. Под общей редакцией Р.Н. Минниханова. Казань: Научный центр безопасности жизнедеятельности, 2023. С. 529-537. EDN AGWZBH.

5. Хомутов С.О., Хамитов Р.Н., Грицай А.С., Серебряков Н.А. Методика формирования обучающей выборки в задачах краткосрочного прогнозирования электропотребления гарантирующего поставщика // Известия Тульского государственного университета. Технические науки. 2021. № 2. С. 227-233.

6. О механизмах функционирования оптового рынка электроэнергии / Д. Д. Дугин, В. А. Самусь, Д. К. Габбасов [и др.] // Актуальные вопросы энергетики : материалы Международной научно-практической конференции, Омск, 17 мая 2017 года. - Омск: Омский государственный технический университет, 2017. - С. 239-243.

7. Бахтеева Н.З., Галимзянов Л.А., Шацких З.В. Конкурентный оптовый рынок электроэнергии и мощности: состояние и новые вызовы // Известия высших учебных заведений. Проблемы энергетики. 2016. № 5-6. С. 7078.

8. Gorshenin A.Y. Analysis of the parameters of wind farms as a control object / A. Y. Gorshenin // Прикладная математика и фундаментальная информатика. 2022. Vol. 9, No. 4. P. 17-23. DOI 10.25206/2311-49082022-9-4-17-23. - EDN UVRQBY.

9. A. Gorshenin, L. Denisova, "Preliminary Analysis of Machine Learning Model Input Data For Short-Term Electricity Consumption Forecasting," 2023 Dynamics of Systems, Mechanisms and Machines (Dynamics), Omsk, Russian Federation, 2023, pp. 1-5, doi: 10.1109/Dynamics60586.2023.10349558.

10. Федоров Я.П., Бурковский В.Л., Руцков А.Л. Повышение точности прогнозирования электропотребления субъектов ОРЭМ с использованием нечётких нейронных сетей // Энергетические системы. 2019. № 1. С. 176182.

11. Васильев В.А. Обзор подходов по прогнозированию цен на электроэнергию с использованием технологий вычислительного интеллекта // Теоретическая экономика. 2020. № 5(65). С. 87-94.

12. Ященко А.В., Казымов И.М., Компанеец Б.С. Разработка путей повышения эффективности гарантирующего поставщика на оптовом рынке электроэнергии в условиях региона с преобладанием предприятий АПК // Вестник НГИЭИ. 2022. № 2(129). С. 101-117. DOI 10.24412/2227-9407-2022-2-101-117.

13. Горшенин А.Ю. Сравнение методов на основе деревьев решений в задаче краткосрочного прогнозирования электропотребления // Математические структуры и моделирование. 2023. № 4(68). С. 12-21. DOI 10.24147/2222-8772.2023.4.12-21.

14. Воевода А.Е., Харитонова Д.Д., Валь П.В. Краткосрочное прогнозирование электропотребления на основе метода случайного леса // Электроэнергетика глазами молодежи - 2016: Материалы VII Международной молодёжной научно-технической конференции. В 3 т., Казань, 19-23 сентября 2016 года. Том 2. - Казань: Казанский государственный энергетический университет, 2016. С. 124-127.

15. D. Vasina and A. Gorshenin, "Application of the Catboost Gradient Boosting Method in Forecasting Solar Electricity," 2023 Dynamics of Systems, Mechanisms and Machines (Dynamics), Omsk, Russian Federation, 2023, P. 1-5, doi: 10.1109/Dynamics60586.2023.10349541.

16. Горшенин А.Ю., Денисова Л.А. Прогнозирование выработки электроэнергии ветроэлектростанцией с применением рекуррентной нейронной сети // Известия Тульского государственного университета. Технические науки. 2023. № 4. С. 39-45. DOI 10.24412/2071-6168-2023-4-39-45.

17. Chen, T. and Guestrin, C. (2016) XGBoost: A scalable tree boosting system, arXiv.org. Available at: https://doi.org/10.48550/arXiv.1603.02754.

18. Li P., Zhang J.S. A new hybrid method for china's energy supply security forecasting based on ARIMA and xgboost // Energies. 2018. Vol. 11, No. 7. P. 1687. DOI 10.3390/en11071687.

19. Short-and Very Short-Term Firm-Level Load Forecasting for Warehouses: A Comparison of Machine Learning and Deep Learning Models / A. M. N. C. Ribeiro, P. R. X. Do Carmo, P. T. Endo [et al.] // Energies. 2022. Vol. 15, No. 3. DOI 10.3390/en15030750.

20. Мигранов М.М., Устинов А.А., Мельников А.В. Прогнозирование потребления электроэнергии. Практика применения // Электроэнергия. Передача и распределение. 2018. № 2(47). С. 44-53.

21. Моргоева А.Д., Моргоев И.Д., Клюев Р.В., Гаврина О.А. Прогнозирование потребления электрической энергии промышленным предприятием с помощью методов машинного обучения // Известия Томского политехнического университета. Инжиниринг георесурсов. 2022. Т. 333, № 7. С. 115-125. DOI 10.18799/24131830/2022/7/3527.

22. Денисова Л.А. Многокритериальная оптимизация на основе генетических алгоритмов при синтезе систем управления. Омск: Омский государственный технический университет, 2014. - 172 с. - EDN TGNAMT.

23. Восход и заход солнца // Datetime [Электронный ресурс] URL: https://dateandtime.info/ru (дата обращения: 10.04.2024).

Горшенин Алексей Юрьевич, аспирант, augomgtu@gmail. com, Россия, Омск, Омский государственный технический университет

APPLICATION OF DECISION TREES FOR SHORT-TERM FORECASTING OF POWER CONSUMPTION

A.Y. Gorshenin

The article discusses the issues of short-term forecasting ofpower consumption using machine learning methods. An analysis of the effectiveness of using decision trees and ensembles of XGBoost decision trees was carried out. The influence of the number of trees in the ensemble and the size of the training sample on the accuracy of the forecast was studied. Key words: power consumption forecasting, machine learning, decision trees, gradient boosting.

Gorshenin Aleksey Yurievich, postgraduate, [email protected], Russia, Omsk, Omsk State Technical University

УДК 004.032.26

DOI: 10.24412/2071-6168-2024-7-253-254

РАЗРАБОТКА И ВЕРИФИКАЦИЯ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ СИСТЕМЫ КРАТКОСРОЧНОГО

ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ

А.Ю. Горшенин

В статье рассмотрены вопросы создания и верификации программного обеспечения, предназначенного для системы прогнозирования электропотребления потребителей энергосбытовых компаний. Показана возможность прогнозирования электропотребления на основе ансамблевых методах машинного обучения. Испытания системы проведены по разработанной методике, предназначенной для оценки качества и точности работы представленных средств прогнозирования. Приведены результаты проверки автоматизируемых функций построения прогнозного графика.

Ключевые слова: верификация программного обеспечения, прогнозирование, электропотребление, методика испытаний, анализ данных.

Одной из важных задач проектирования систем прогнозирования выработки [1-3] или потребления [4-7] электрической энергии является обеспечение стабильности ее распределения и эффективности работы энергосистем. Высокие требования к программному обеспечению (ПО) систем прогнозирования обусловлены существующими правилами Оптового рынка электрической энергии и мощности (ОРЭМ), связанными с необходимостью обеспечения высокой точности прогнозов для распределения электроэнергии между потребителями [8-13].

Основной подход к обеспечению качества ПО для систем прогнозирования электропотребления включает в себя процесс верификации. Верификация ПО представляет собой систематическую проверку того, что ПО соответствует заданным требованиям и спецификациям [14-17]. Это включает в себя не только верификацию кода, но и проверку корректности проведения вычислений и соответствие прогнозов реальным данным [18-20].

Верификация кода гарантирует, что программный код написан корректно, минимизируя возможность ошибок в его выполнении [14]. Верификация вычислений проверяет, что алгоритмы и методы прогнозирования электропотребления работают правильно и дают достоверные результаты [16].

Верификация ПО является важным этапов разработки программного обеспечения, который позволяет гарантировать качество и надежность системы. Для системы прогнозирования электропотребления верификация позволяет убедиться в точности прогнозов, удобстве использования системы и ее соответствии требованиям пользователей.

Системы прогнозирования обрабатывают большие объемы данных «Big Data», которые включают в себя ретроспективные данные об электропотреблении, метеоданных и данных инфраструктуры регионов [7]. Обработка Big Data в системах прогнозирования требует большое количество вычислительных мощностей, поскольку необходимо обеспечить высокую скорость обработки данных, т.к. задачи прогнозирования требуют оперативной аналитики и принятия решений в реальном времени [8].

Для обеспечения бесперебойной работы систем прогнозирования необходимо учитывать вопросы безопасности и конфиденциальности данных. Поскольку данные могут содержать коммерческую тайну компаний и информацию об электропотреблении потребителей, требуется обеспечить их защиту от несанкционированного доступа.

В статье рассмотрены вопросы разработки и верификации алгоритмических и программных решений для систем краткосрочного прогнозирования.

Постановка задачи.

Для обеспечения правильной работы системы прогнозирования необходимо провести процесс верификации, подтверждающий соответствие системы установленным требованиям. При верификационной проверке системы необходимо выполнить анализ причин возможных ошибок, планирование процессов их выявления и оценку полученных результатов.

На начальном этапе верификации ПО определяются требования к разрабатываемому ПО, составляются варианты тестирования функций системы, разрабатывается методика проведения испытаний с указанием ожидаемых результатов. Для корректной работы системы прогнозирования необходимо, чтобы она выполняла следующие функции:

i Надоели баннеры? Вы всегда можете отключить рекламу.