Key words: fourier transform, FFTW, Math.NET.
Dyshlevskiy Vyacheslav Aleksandrovich, postgraduate, dva 08 [email protected], Russia, Omsk, Omsk State Technical University,
Kobenko Vadim Yurievich, doctor of technical sciences, professor, kobra_vad@rambler. ru, Russia, Omsk, Omsk State Technical University,
Kudryavtseva Irina Sergeevna, candidate of technical sciences, docent, [email protected], Russia, Omsk, Omsk State Technical University,
Naumenko Aleksandr Petrovich, doctor of technical sciences, professor, apnaumenko@omgtu. ru, Russia, Omsk, Omsk State Technical University
УДК 004.896
DOI: 10.24412/2071-6168-2024-10-243-244
ОБНАРУЖЕНИЕ И ПРОГНОЗИРОВАНИЕ НЕШТАТНЫХ СОСТОЯНИЙ ОБОРУДОВАНИЯ НА ПРЕДПРИЯТИИ НА ОСНОВЕ РЕТРОСПЕКТИВНЫХ ДАННЫХ ОБ ЭЛЕКТРОПОТРЕБЛЕНИИ
А.В. Блохин
В данной статье рассмотрены вопросы обнаружения и прогнозирования нештатных состояний оборудования на городском ресурсоснабжающем предприятии. Предложено использовать модель машинного обучения на основе ансамбля деревьев решений для обнаружения и прогнозирования нештатных состояний оборудования на основе анализа ретроспективных данных об электропотреблении предприятия. Проведен сравнительный анализ эффективности применения предложенного метода, основанного на ансамбле деревьев решений по сравнению с экспертным методом.
Ключевые слова: электропотребление, ретроспективные данные, обнаружение состояний оборудования, машинное обучение, градиентный бустинг.
Введение. Современные промышленные предприятия и энергосбытовые компании постоянно сталкиваются с необходимостью прогнозирования энергопотребления для обеспечения стабильной работы производственных процессов и оптимизации затрат [1-5] Одной из ключевых задач в этом процессе является своевременное выявление аномальных состояний оборудования, таких как отключения и включения, которые могут негативно сказываться на общей производительности предприятий и создавать угрозу для бесперебойного энергоснабжения [6-9].
Энергосбытовые компании, работающие на Оптовом рынке электроэнергии и мощности (ОРЭМ), сталкиваются с серьезными вызовами в обеспечении точного краткосрочного прогнозирования. ОРЭМ - это платформа, где осуществляется торговля электроэнергией и мощностью между производителями и потребителями электрической энергии [10-11]. Для энергосбытовых компаний точность прогнозирования энергопотребления напрямую влияет на их финансовые показатели, поскольку позволяет оптимизировать закупки электроэнергии на рынке «на сутки вперед», минимизировать риск переплат за излишки и штрафов за дефицит купленной электроэнергии [12].
Краткосрочные прогнозы также важны для крупных промышленных потребителей, таких как городские ресурсоснабжающие предприятия [13-15]. Эти прогнозы позволяют эффективно планировать работу оборудования, избегать внеплановых отключений и оптимизировать затраты на электроэнергию. Отклонения от прогнозируемого потребления могут свидетельствовать о сбоях в работе оборудования, таких как внезапное отключение или включение дополнительных производственных линий, что требует оперативного реагирования и корректировки процессов [16-19].
Для успешного управления и планирования электроэнергии предприятиям необходимо прогнозировать как среднесрочные, так и краткосрочные изменения в энергопотреблении. Краткосрочные прогнозы (на срок от нескольких часов до нескольких дней) позволяют минимизировать риски для обеих сторон:
- для энергосбытовых компаний точность планирования покупки электроэнергии позволяет избежать необходимости закупки электроэнергии по более высоким ценам на балансирующем рынке и предотвратить финансовые потери от небаланса между предложением и спросом [20];
- для крупных потребителей точность планирования дает возможность оптимизировать операционные процессы, избегать перегрузок и возможных сбоев оборудования, что особенно важно для предприятий с непрерывным циклом производства, а также финансовые потери [21].
Машинное обучение, и в частности алгоритм XGBoost, стал мощным инструментом для решения задач краткосрочного прогнозирования электропотребления. XGBoost использует ансамбли деревьев решений и показывает высокую точность в задачах прогнозирования временных рядов, что делает его оптимальным выбором для анализа данных о потреблении электроэнергии. Применение этого метода позволяет как энергосбытовым компаниям, так и крупным предприятиям улучшить прогнозирование энергопотребления, снижая вероятность неожиданных сбоев и минимизируя финансовые потери [9].
Цель и задачи исследования. Целью данного исследования является разработка модели для обнаружения нештатных состояний оборудования (включение дополнительного оборудования/аварийные выключения) на основе данных об электропотреблении и прогнозирование возможных таких аномалий в краткосрочной перспективе.
Задачи исследования:
- сбор и предварительная обработка ретроспективных данных о потреблении электроэнергии;
- разработка алгоритма на основе XGBoost для обнаружения нештатных состояний оборудования;
- прогнозирование возможных нештатных состояний оборудования в краткосрочной перспективе;
- визуализация результатов, проверка точности и достоверности модели.
Исходные данные. Для анализа и прогнозирования нештатных состояний оборудования на предприятии использовались ретроспективные данные по электропотреблению, предоставленные АО «ОмскВодоканал». Это предприятие отвечает за обеспечение города Омска водоснабжением и водоотведением, и его деятельность требует надежного и стабильного электроснабжения для поддержания работы насосных станций, очистных сооружений и другого важного оборудования.
Данные охватывают период с 1 января 2020 года по настоящее время и содержат почасовые данные потребления электроэнергии на предприятии. Это позволяет не только анализировать текущие и прошлые тенденции потребления, но и выявлять нештатные ситуации, такие как внезапные отключения оборудования или включение дополнительных мощностей.
Основные параметры данных:
- Момент времени (час): временной штамп, указывающий момент измерения с точностью до часа;
- Мощность (кВт*ч): количество прямой, потребляемой предприятием и обратной, потребляемой субабонентами предприятия, электроэнергии, за каждый час.).
Таблица 1
Исходные данные об электропотреблении на предприятии (фрагмент)_
Интервал времени, час Мощность, кВт*ч
Активная прямая Активная обратная
14.10.2024 01:00 14 853,72 -2 003,59
14.10.2024 02:00 14 415,12 -2 032,09
14.10.2024 03:00 14 320,56 -2 018,82
14.10.2024 04:00 15 287,64 -2 095,70
14.10.2024 05:00 16 653,60 -2 106,65
15.10.2024 00:00 15 376,68 -2 020,10
Алгоритм работы метода. В данной работе для анализа и прогнозирования использовалась модель XGBoost, примененная к временным рядам данных электропотребления на предприятии. Процесс построения модели можно разделить на несколько этапов: предварительная обработка данных, настройка модели, оценка её производительности и визуализация результатов.
Шаг 1. Предварительная обработка данных. Исходные данные по электропотреблению предприятия АО «ОмскВодоканал» включают почасовые наблюдения с 1 января 2020 года по настоящее время.
Основные этапы предобработки данных: . Удаление выбросов и пропусков:
Для удаления выбросов использовались статистические методы (метод 3-х сигм), позволяющие определить аномально высокие или низкие значения.
Пропуски в данных, возникавшие из-за сбоев в записи показаний, заполнялись методом линейной интерполяции:
Х(0= хЦ- 1) + (1)
где х(1) - потребление электроэнергии в момент времени 1
2. Создание дополнительных признаков: Для повышения точности прогнозирования были созданы дополнительные признаки:
- скользящее среднее ^МА) за предыдущие три часа, которое позволяет сглаживать краткосрочные колебания и выявлять тренды:
5МА(1) = (2)
где п - окно сглаживания;
- изменение потребления (Ах) по сравнению с предыдущими часами:
А(^= хЮ -х(1- 1) (3)
Эти признаки позволяют модели лучше учитывать временные зависимости в данных.
Шаг 2. Разработка модели XGBoost
хобоо81 - это ансамблевый метод градиентного бустинга, который строит деревья решений последовательно, где каждое новое дерево минимизирует ошибки предыдущих, как показано графиком дерева решений на рисунке 1.
Целевая переменная: потребление электроэнергии на следующий час.
Признаки: наряду с фактическими значениями потребления энергии в каждый момент времени, модель использует созданные дополнительные признаки, такие как скользящее среднее и разница в потреблении.
Основная функция потерь Ду;, 9), минимизируемая моделью:
1(У1,9) = 2(У1- 9)2, (4)
где у; - фактическое потребление электроэнергии, 9 - прогнозируемое значение.
Шаг 3. Настройка гиперпараметров модели
Для настройки модели XGBoost проводилась кросс-валидация с целью оптимизации гиперпараметров:
- число деревьев (n_estimators): Определяет количество деревьев решений, включенных в ансамбль. Для текущего исследования оптимальным было количество около 100 деревьев;
- максимальная глубина деревьев (max_dep1:h): Чем больше глубина дерева, тем более сложные зависимости модель может находить, но также возрастает риск переобучения. В работе использовалось значение ma.x_d.epth
= 6;
- темп обучения (leaming_rate): Контролирует шаг обновления модели в процессе градиентного спуска. Чем меньше темп обучения, тем больше шагов необходимо для достижения оптимума, но меньше риск переподгонки данных. В исследовании был выбран темп learning _rate = 0.1.
оборудования на предприятии на основе ретроспективных данных электропотребления
Формула обновления весов на каждом fc-м шаге градиентного спуска:
мk+i = шк-г]-Ч1(шк), (5)
где г/ - темп обучения, Ч1(шк) - градиент функции потерь.
Шаг 4. Оценка производительности модели. Для оценки качества модели использовались следующие
метрики:
- средняя абсолютная ошибка (MAE):
МАЕ = I (6)
- корень из среднеквадратичной ошибки (RMSE):
RMSE = J^=i(yi-yl)2 (7)
Оценка модели проводилась на тестовой выборке, которая составляла 20% от общего объема данных. Для повышения надежности результатов использовалась кросс-валидация с разбиением на 5 фолдов.
Шаг 5. Прогнозирование и обнаружение нештатных состояний оборудования. На заключительном этапе модель использовалась для прогнозирования краткосрочных изменений в потреблении электроэнергии на следующие 24 часа. Программа анализировала данные по следующим правилам:
- если снижение потребления превышало 100±10 кВт/ч в течение нескольких часов, это рассматривалось как сигнал о возможном отключении оборудования;
- если наблюдалось увеличение потребления на аналогичную величину, это указывало на включение дополнительного оборудования.
Для прогнозирования использовалась следующая формула:
x(t + h) = Z«=ifk(x(t), x(t - 1.....x(t - n)), (8)
где h - шаг прогноза (в часах), fk - предсказания fc-го дерева в ансамбле, а К - количество деревьев.
Визуализация результатов: на графике отмечались моменты включения/отключения оборудования с использованием маркеров, что позволило визуально оценить работу модели представлены на рисунке 2.
Сравнение результатов работы модели XGBoost и текущего экспертного метода.
В настоящий момент на предприятии АО «ОмскВодоканал» для мониторинга и диагностики состояний оборудования применяется традиционный экспертный метод. Этот метод основан на ручном анализе показателей потребления электроэнергии и опыта специалистов предприятия, которые на основании своих наблюдений принимают решения о наличии сбоев в работе оборудования. Несмотря на свою надежность в определенных случаях, экспертный метод обладает рядом недостатков, таких как субъективность оценок, человеческие ошибки, а также невозможность оперативной обработки больших объемов данных.
Для оценки эффективности предлагаемого алгоритма XGBoost было проведено сравнение результатов его работы с результатами, полученными экспертами предприятия и оперативным журналом нештатных состояний оборудования, который ежедневно ведётся на предприятии.
Экспертный метод основывается на визуальном анализе графиков энергопотребления и выявлении резких отклонений, что делает его зависимым от человеческого фактора. Специалисты определяют отклонения в потреблении электроэнергии на основе собственного опыта и знаний об особенностях работы оборудования, что может приводить к пропуску менее очевидных аномалий.
Модель XGBoost, в свою очередь, автоматически анализирует временные ряды и точно выявляет изменения в потреблении электроэнергии, которые могут свидетельствовать о включении или отключении оборудования. Применение алгоритма машинного обучения позволяет фиксировать даже незначительные изменения, которые могут быть пропущены экспертами. Модель анализирует данные не только в реальном времени, но и ретроспективно, что дает возможность оценивать поведение оборудования на основе многолетних данных.
Модель XGBoost продемонстрировала точность обнаружения аномальных состояний на уровне 92,4 %, тогда как экспертный метод - 81,1 %.
Модель фиксировала изменения потребления с задержкой менее чем в один час, в то время как эксперты могли замечать отклонения только через несколько часов после их начала.
S0i4-QS-01 ЗОЛ ~Г "'> "ЛМ -Г " Л М " ■ | J Т Л М " ■ '.7 20i4-0fl-31 'Г 7% "Л? Л 'Г Г. ~ I 7 7 7,1
Дата
Рис. 2. Результаты работы модели по обнаружению и прогнозирования нештатных состояний
оборудования на предприятии
Таблица 2
Ошибка обнаружения нештатных ситуаций в работе оборудования на предприятии _при использовании ансамбля деревьев решений и экспертного метода_
Количество наблюдений в ретроспективных данных Метод обнаружения
Экспертный | XGBoost
Средняя абсолютная ошибка MAE, %
10 23,7 14,1
30 22,2 12,3
50 21,5 10,6
70 19,4 9,8
100 18,9 7,6
Как видно из таблицы и гистограмм на рисунке 3 при увеличении количества наблюдений (размера обучающей выборки для модели XGBoost) средняя абсолютная ошибка MAE снижается, как и для экспертного метода, так и для модели ансамблей решающих деревьев. В отношении экспертного метода - это снижение можно связать с тем, что эксперт визуально наблюдает больший период ретроспективных данных и может сопоставить верные зависимости в потреблении электроэнергии и возможных отключениях/включениях оборудования на предприятии. Что касается модели XGBoost - это можно объяснить тем, что при кратном увеличении обучающей выборки, также увеличивается количество деревьев в модели, что влечёт к большему усреднению результатов работы каждого дерева и уменьшению влияния результатов тех деревьев, которые возможно имеют ошибочные результаты работы.
Обсуждение результатов. Результаты проведенного исследования показали явные преимущества использования модели XGBoost для обнаружения и прогнозирования аномальных состояний оборудования на предприятии. В процессе сравнения работы модели с текущим экспертным методом были выявлены следующие ключевые аспекты, заслуживающие внимания.
Модель XGBoost продемонстрировала высокую точность в задаче обнаружения отключений и включений оборудования. Точность обнаружения аномальных состояний составила 92,4 %, что значительно выше по сравнению с точностью экспертного метода, который показал результат 81,1 %.
Этот результат объясняется способностью модели XGBoost учитывать более сложные закономерности в данных, что позволяет ей фиксировать даже незначительные изменения в потреблении электроэнергии, которые могли бы остаться незамеченными при ручном анализе. Важно отметить, что экспертный метод опирается на субъективный опыт специалистов и ручной анализ, что снижает его точность и приводит к более частым ошибкам в обнаружении малозаметных изменений.
Анализ ошибок показывает, что модель XGBoost допускает меньше ошибок как при обнаружении состояний оборудования (отключения/включения), так и при прогнозировании. Гистограмма ошибок модели по сравнению с экспертным методом продемонстрировала, что модель ошибается реже, а величина ошибок (по абсолютной разнице) также ниже.
Ошибки модели, как правило, связаны с редкими случаями, когда изменения потребления были минимальными и попадали в пограничные значения, не превышающие заданных порогов. Экспертный метод, в свою очередь, показал больше ошибок, особенно при малозаметных изменениях, что подчеркивает его ограниченность в сложных сценариях анализа данных.
Гистограмма обнаружения состояний оборудования Гистограмма ошибок в обнаружении состояний оборудования
Нет изменений Отключение Включение Нет изменений Отключение Включение
Состояния Ошибки
Рис. 3. Гистограммы распределения ошибок в обнаружении состояний оборудования
Заключение. Проведенные исследования подтвердили эффективность применения модели машинного обучения, основанной на ансамбле деревьев решений для обнаружения и прогнозирования нештатных состояний оборудования на предприятии на основе данных электропотребления. Предложенная модель, показала значительно более высокую точность и скорость в обнаружении и прогнозировании нештатных ситуаций в работе оборудования по сравнению с традиционным экспертным методом, что подтверждается оперативным журналом нештатных состояний оборудования на предприятии.
Следует отметить, что экспертный метод обладает преимуществом в интерпретируемости, полагаясь на опыт и знания специалистов, но его недостатки - медленная обработка данных и склонность к ошибкам из-за человеческого фактора - делают его менее эффективным в условиях современной автоматизации. Модель машинного обучения, основанная на ансамбле решающих деревьев, напротив, обеспечивает не только высокую точность прогнозов, но и исключает влияние субъективных факторов, что значительно снижает риск пропуска нештатных ситуаций в работе оборудования на предприятии.
Таким образом, предложенная модель машинного обучения является более предпочтительным и эффективным решением для задачи обнаружения и прогнозирования нештатных состояний оборудования. Она позволяет предприятию оперативно реагировать на изменения в состоянии оборудования, снижая экономические потери при планировании электропотребления предприятия.
Список литературы
1. Модели прогнозирования электрических нагрузок / В.В. Смирнов, Е.Ю. Чернова, М.А. Старченко, Т.С. Максименко // Энергетические установки и технологии. 2018. Т. 4, № 4. С. 103-109.
2. Серебряков Н.А. Применение адаптивного ансамблевого нейросетевого метода для краткосрочного прогнозирования электропотребления электротехнического комплекса районных электрических сетей // Омский научный вестник. 2021. № 1 (175). С. 39-45.
3. Using system analysis methods to search for coolant leaks in order to develop an automated information system for dispatch control of a heat generating enterprise / E.V. Chebanenko, A.S. Gritsay, R.N. Khamitov [et al.] // Journal of Physics. 2020. Vol. 1546, no. 1. P. 012046-1-012046-7. DOI: 10.1088/1742-6596/1546/1/012046.
4. Блохин А.В. Исследование факторов, влияющих на потребление электроэнергии коммерческим предприятием / А.В. Блохин, А.С. Грицай, А.Ю. Горшенин // Математические структуры и моделирование. 2022. № 3 (63). С. 39-47. DOI: 10.24147/2222-8772.2022.3.39-47.
5. Горшенин А.Ю. Предварительная обработка данных в задаче краткосрочного прогнозирования электропотребления / А. Ю. Горшенин, А. С. Грицай, Л. А. Денисова // Фёдоровские чтения 2023 : материалы Всерос. науч.-практ. конф. с междунар. участием (с элементами науч. шк. для молодежи). Нац. исслед. ун-т «МЭИ». Москва: Изд-во МЭИ, 2023. С. 96-104.
6. Король А.В. Сравнение адаптивных методов краткосрочного прогнозирования выработки электрической энергии солнечными электростанциями / А. В. Король, А. С. Грицай, А. В. Гаак // Актуальные вопросы энергетики : материалы VII Всерос. науч.-практ. конф. с междунар. участием. Омск: Изд-во ОмГТУ, 2024. С. 190-195.
7. Грицай А.С. Особенности построения биллинговой системы для энергосбытовой компании с целью обеспечения максимальной точности прогнозирования // Динамика систем, механизмов и машин: тез. докл. Между-нар. научн.-техн. конф. Омск: ОмГТУ, 2009. С. 250-254.
8. Потапов В.И., Грицай А.С., Тюньков Д.А. Спектральный анализ ретроспективных данных ООО "Омская энергосбытовая компания" об электропотреблении // Омский научный вестник. 2016. № 5(149). С. 74-76.
9. Горшенин А.Ю., Грицай А.С., Денисова Л.А. Применение машинного обучения деревьев решений для краткосрочного прогнозирования электропотребления // Известия Тульского государственного университета. Технические науки. 2023. № 11. С. 226-231. DOI 10.24412/2071-6168-2023-11-226-227.
10. Хомутов С.О., Хамитов Р.Н., Грицай А.С., Серебряков Н.А. Методика формирования обучающей выборки в задачах краткосрочного прогнозирования электропотребления гарантирующего поставщика // Известия Тульского государственного университета. Технические науки. 2021. № 2. С. 227-233.
11. О механизмах функционирования оптового рынка электроэнергии / Д. Д. Дугин, В. А. Самусь, Д. К. Габбасов [и др.] // Актуальные вопросы энергетики: материалы Международной научно-практической конференции. Омск: Омский государственный технический университет, 2017. С. 239-243.
12. Бахтеева Н.З., Галимзянов Л.А., Шацких З.В. Конкурентный оптовый рынок электроэнергии и мощности: состояние и новые вызовы // Известия высших учебных заведений. Проблемы энергетики. 2016. № 5-6. С. 70-78.
13. Федоров Я.П., Бурковский В.Л., Руцков А.Л. Повышение точности прогнозирования электропотребления субъектов ОРЭМ с использованием нечётких нейронных сетей // Энергетические системы. 2019. № 1. С. 176182.
14. Васильев В.А. Обзор подходов по прогнозированию цен на электроэнергию с использованием технологий вычислительного интеллекта // Теоретическая экономика. 2020. № 5(65). С. 87-94.
15. Горшенин А.Ю. Сравнение методов на основе деревьев решений в задаче краткосрочного прогнозирования электропотребления // Математические структуры и моделирование. 2023. № 4(68). С. 12-21. DOI 10.24147/2222-8772.2023.4.12-21.
16. Воевода А.Е., Харитонова Д.Д., Валь П.В. Краткосрочное прогнозирование электропотребления на основе метода случайного леса // Электроэнергетика глазами молодежи - 2016 : Материалы VII Международной молодёжной научно-технической конференции. В 3 т. Том 2. Казань: Казанский государственный энергетический университет, 2016. С. 124-127.
17. Vasina D., Gorshenin A. Application of the Catboost Gradient Boosting Method in Forecasting Solar Electricity, 2023 Dynamics of Systems, Mechanisms and Machines (Dynamics). Omsk, Russian Federation, 2023. P. 1-5. DOI: 10.1109/Dynamics60586.2023.10349541.
18. Chen T., Guestrin C. XGBoost: A scalable tree boosting system, 2016. arXiv.org. Available at: DOI: 10.48550/arXiv.1603.02754.
19. Li P., Zhang J.S. A new hybrid method for china's energy supply security forecasting based on ARIMA and xgboost // Energies. 2018. Vol. 11, No. 7. P. 1687. DOI 10.3390/en11071687.
20. Мигранов М.М., Устинов А.А., Мельников А.В. Прогнозирование потребления электроэнергии. Практика применения // Электроэнергия. Передача и распределение. 2018. № 2(47). С. 44-53.
21. Моргоева А.Д., Моргоев И.Д., Клюев Р.В., Гаврина О.А. Прогнозирование потребления электрической энергии промышленным предприятием с помощью методов машинного обучения // Известия Томского политехнического университета. Инжиниринг георесурсов. 2022. Т. 333, № 7. С. 115-125. DOI 10.18799/24131830/2022/7/3527.
Блохин Александр Владимирович, аспирант, [email protected], Россия, Омск, Омский государственный технический университет
DETECTION AND PREDICTION OF ABNORMAL EQUIPMENT CONDITIONS AT AN ENTERPRISE BASED ON HISTORICAL DATA ABOUT POWER CONSUMPTION
A.V. Blokhin
This article discusses the issues of detecting and predicting abnormal conditions of equipment at a municipal utility company. It is proposed to use a machine learning model based on an ensemble of decision trees to detect and predict abnormal conditions of equipment based on the analysis of retrospective data on the enterprise's electricity consumption. A comparative analysis of the efficiency of using the proposed method based on an ensemble of decision trees compared to the expert method is carried out.
Key words: power consumption, historical data, hardware state detection, machine learning, gradient boosting.
Blokhin Alexandr Vladimirovich, postgraduate, sasha [email protected], Russia, Omsk, Omsk State Technical University