Научная статья на тему 'Исследование эффективности применения моделей на базе интервальных временных рядов с сезонностью для прогнозирования состояния сложных технических объектов'

Исследование эффективности применения моделей на базе интервальных временных рядов с сезонностью для прогнозирования состояния сложных технических объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
137
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
INTERVAL-VALUED TIME SERIES / EXPONENTIAL SMOOTHING MODEL / NEURAL MODEL / LONG SHORT-TERM MEMORY / HYBRID MODEL / ИНТЕРВАЛЬНЫЙ ВРЕМЕННОЙ РЯД / МОДЕЛЬ НА БАЗЕ ЭКСПОНЕНЦИАЛЬНОГО СГЛАЖИВАНИЯ / НЕЙРОСЕТЕВАЯ МОДЕЛЬ / ДОЛГОСРОЧНАЯ КРАТКОСРОЧНАЯ ПАМЯТЬ / ГИБРИДНАЯ МОДЕЛЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Имильбаев Р. Р.

В статье приводятся результаты исследования эффективности применения различных моделей, ориентированных на интервальные временные ряды (ИВР), для прогнозирования поведения параметров газораспределительных сетей с учетом реальных данных, получаемых в процессе их непрерывного контроля. Обосновывается необходимость учета в ИВР фактора сезонности, вызванного периодическими колебаниями уровня соответствующей величины. Выполняется сравнительный анализ свойств специальной интервальной модификации модели на базе экспоненциального сглаживания, нейросетевых и гибридных моделей прогнозирования применительно к ИВР с сезонностью, отмечаются их достоинства и недостатки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Имильбаев Р. Р.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Investigation of effectiveness of application of the models based on interval time series with seasonality to forecasting the state of complex technical objects

The paper contains the results of investigation of effectiveness of application of various models oriented towards interval time series (ITS) to forecasting behavior of gas distribution networks (GDS) parameters involving the real data obtained during the process of their continuous control. The necessity of taking into account the factor of seasonality caused by periodic fluctuations in the level of the corresponding variable is justified. A comparative analysis of the properties of the special interval modification of the model based on exponential smoothing, neural network and hybrid prediction models in relation to the ITS with seasonality is performed, their merits and demerits are noted.

Текст научной работы на тему «Исследование эффективности применения моделей на базе интервальных временных рядов с сезонностью для прогнозирования состояния сложных технических объектов»

Исследование эффективности применения моделей на базе интервальных временных рядов с сезонностью для прогнозирования состояния сложных технических объектов

Р.Р. Имильбаев УфаСистемаГаз, Уфа

Аннотация: В статье приводятся результаты исследования эффективности применения различных моделей, ориентированных на интервальные временные ряды (ИВР), для прогнозирования поведения параметров газораспределительных сетей с учетом реальных данных, получаемых в процессе их непрерывного контроля. Обосновывается необходимость учета в ИВР фактора сезонности, вызванного периодическими колебаниями уровня соответствующей величины. Выполняется сравнительный анализ свойств специальной интервальной модификации модели на базе экспоненциального сглаживания, нейросетевых и гибридных моделей прогнозирования применительно к ИВР с сезонностью, отмечаются их достоинства и недостатки.

Ключевые слова: интервальный временной ряд, модель на базе экспоненциального сглаживания, нейросетевая модель, долгосрочная краткосрочная память, гибридная модель.

Введение

Временной ряд, составленный из интервальнозначных величин (для упрощения далее именуется «интервальный временной ряд», или ИВР), - это последовательность интервальных данных, соотнесенных с определенными моментами времени. В свою очередь, операции над интервальными данными в последние годы принято рассматривать как действия, принадлежащие области анализа символьных данных (SDA - Symbolic Data Analysis) [1]. Эта область предполагает использование переменных, значения которых заданы с точностью до множеств (интервалов, гистограмм и др.). К построению ИВР можно прийти по результатам формализации задач в самых разных сферах деятельности. Например, применительно к финансовым рынкам известны так называемые «японские свечи» - интервалы, ограниченные максимальными и минимальными ценами на бирже в течение заданного периода времени [2]. В технике показана целесообразность использования ИВР при формировании прогнозов неблагоприятных воздействий на ветроэнергетические установки

[3]. Модели на базе ИВР могут быть применены даже для такой специфической цели, как описание надежности программного обеспечения

[4]. Наличие инструментов для работы с интервальными данными позволяет учесть неопределенность значений тех или иных параметров и принимать управленческие решения, справедливые для всего множества этих значений. Сказанное относится и к методам прогнозирования поведения переменных, информация о которых представлена в виде ИВР.

Хотя на сегодняшний день предложен ряд моделей прогнозирования на базе ИВР [5-8], они, тем не менее, пока не охватывают случай интервальных рядов с «сезонностью», вызванной периодическими колебаниями уровня соответствующей величины. Между тем, сезонность характерна для параметров многих систем и объектов. В частности, ее нетрудно заметить, наблюдая за изменением контролируемых параметров (входных и выходных давлений) компонентов газораспределительных сетей (ГС), так как потребление газа колеблется в зависимости от месяца и времени суток.

Автором данной публикации были разработаны специальные, рассчитанные на учет фактора сезонности модификации методов прогнозирования, нашедших ранее применение при анализе временных рядов с «точечными» (т.е. обычными, неинтервальными) величинами, а также некоторых алгоритмов, ориентированных на ИВР, но не принимавших сезонность во внимание. Полученные при этом модели относятся к различным классам: модель на базе экспоненциального сглаживания, две разновидности нейросетевых моделей, а также гибридные модели, предусматривающие комбинированную реализацию нейросетевых и иных алгоритмов. В настоящей статье приводятся результаты исследования эффективности предложенных подходов применительно к прогнозированию поведения параметров ГС с учетом реальных данных, собираемых в процессе их непрерывного контроля.

Подходы к представлению интервальных данных

Первоначально охарактеризуем наиболее часто применяемые подходы к представлению данных, которые сгруппированы в виде ИВР для последующего построения моделей прогнозирования.

Анализ по отдельно (независимо) рассматриваемым границам интервалов. В этом случае ИВР символически записывается как I = [Г (О, У (')], где i = 1,2,..., п, У (/), _У (0 - нижняя и верхняя границы интервала значений параметра У применительно к временной отметке с номером i. Далее все этапы анализа выполняются для двух независимых временных рядов (ВР), составленных соответственно из значений верхней и нижней границы интервала [5]:

¡и=у (о, $=У (о.

При этом используются классические модели прогнозирования, предназначенные для «точечных» данных.

Использование среднего значения интервала и отклонения от среднего. Здесь также предлагается рассматривать ИВР с точки зрения двух независимых множеств [6], которые в данном случае формируются несколько иным способом. Интервалы I представляются с помощью

средних значений ¡С и расстояний от середин интервалов («радиусов») ¡Г:

= У (о+у (о = У (о - у (р

г 2 ' г 2 "

На базе полученных ВР ¡С, ¡Г с помощью классических моделей для «точечных» данных формируются прогнозы ¡С и ¡Г. С использованием результатов этих прогнозов строится ИВР Ii = [¡^,¡и], i = 1,2,...,п, в котором верхние ц и нижние ¡^ границы прогнозируемых интервалов определяются с помощью соотношений:

¡и = ¡С+ц, % = ¡С - ц.

1КЛ Инженерный вестник Дона. №4 (2017) Н| ivdon.ru/ru/magazine/arcliive/n4y2017/43 88

Применение векторного представления интервалов. В ряде работ, посвященных моделям прогнозирования на базе экспоненциального сглаживания применительно к ИВР [5, 6, 8], предлагается представлять

Y(i), Y(i)

, i = 1,2,...,n, где

интервальнозначные величины в виде векторов I

T - символ транспонирования. Дальнейшие вычисления выполняются c матрицами и векторами по соответствующим математическим правилам.

Исследование моделей прогнозирования на базе ИВР

С целью определения модели, формирующей наиболее точные прогнозы на базе ИВР с сезонной составляющей, было проведено сравнительное экспериментальное исследование. Оценивалась эффективность предложенных автором «интервальных» модификаций нейросетевых моделей на основе классического многослойного персептрона (MLP1) [6] и сети долгосрочной краткосрочной памяти (LSTM) [9], а также модели экспоненциального сглаживания с сезонной составляющей (HoltWinters1) [10]. Опыт использования нейросетевых моделей для решения задач прогнозирования в системах мониторинга в целом известен [11], однако наличие интервальной неопределенности в задании исходных данных порождает немало особенностей в их реализации. Кроме того, рассматривались гибридные модели, в рамках которых варьировалось представление интервалов с помощью средних значений и отклонения от них («точечный» подход - Hybrid) либо в виде векторов («векторный» подход -Hybrid1). Точность формирования прогнозов характеризовалась перечисленными ниже показателями.

MSE1 (mean square error) - среднеквадратичная мера ошибки, используемая для выявления больших неточностей в работе модели:

1 m

MSE1 =—w -)2 +(/■ - iL )2],

2m i=i

T

J

где m - количество сравниваемых значений.

MAPE1 (interval mean absolute percentage error) - «интервальная» версия средней абсолютной ошибки в процентах. Позволяет оценить ошибку прогноза в процентах относительно реальных значений:

MAPEи -f

m

j-1

IU -IU j j

iU

MAPE- -f

m ^-t

j-1

IL -IL jj

iL

MAPE1 - MAPEU + MAPEL

где MAPEU и MAPEl - значения средней ошибки для верхних и нижних границ интервалов соответственно.

ARV1 (interval average relative variance) - средняя относительная дисперсия интервалов, которая позволяет оценить результаты прогнозирования модели исходя из предположения, что значения в будущем будут соответствовать медиане значений ряда на предыдущих шагах:

m m m

f (Ij -Ij)T (Ij -1j) f (^ -IU)2+f (IL -fL)2

ARV1 - ^-- ^-i-1-,

f (I j - I)T (I j -1) f (^ -1 )2+f (IL -1 )2

j-1 j-1 j-1

где IU и IL - медианы (средние значения) временных рядов, составленных применительно к верхней и нижней границам интервала

- —L —U

соответственно, I - [I ,I ].

На основе перечисленных показателей предлагается формировать комплексный нормированный показатель. Для этого значения каждого показателя сначала приводятся к диапазону от 0 до 1:

XJ (XJ ) - ! -fj., j - 1,2,3,

НОрМ\ j j j 5 j 5 5 5

x — X

max mm

где xJ - текущее значение j-го показателя точности моделей (при этом x1 соответствует

MAPE1, x2 - ARV1 и x - MSE1), xJmin и xmax- его наименьшее и наибольшее значения.

Далее комплексный показатель находится в виде линейной свертки:

2

1 3

Я = 3 Е (*'). (!)

3 1=1

Методика исследования эффективности построения прогнозов

С целью построения ИВР использовались эксплуатационные данные относительно величин выходного низкого давления газа для газораспределительных пунктов в составе контролируемой ГС (максимальные и минимальные значения этого давления с 50-ти объектов мониторинга за каждый час наблюдений в течение недели). Каждый отдельно взятый набор данных из исходной выборки был предварительно разделен на две части. Первая часть (85% данных) включала показания за 6 суток; соответствующие данные применялись в качестве обучающих с целью поиска оптимальных весовых коэффициентов в алгоритмах моделей. Оставшиеся 15% данных (показания за последние сутки) использовались в качестве контрольных для определения итоговых показателей точности. Прогноз осуществлялся на 3 часа (краткосрочный, или оперативный) и 24 часа вперед (долгосрочный, или стратегический).

Результаты исследования эффективности построения прогнозов

Средние значения показателей эффективности применения моделей для краткосрочного (оперативного) прогноза приведены в таблице 1.

Таблица № 1

Средние показатели точности для краткосрочных прогнозов

Показатель MLPI LSTMI HoltWintersI Hybrid HybridI

МАРЕ1 1,1703 1,1268 1,0052 0,9829 1,2513

АЯУ1 1,3107 1,0819 0,9550 0,9143 1,5687

М8Е1 18,998 18,276 13,767 12,081 18,909

Как следует из результатов, наилучшие средние показатели относительно других моделей прогнозирования имеет гибридная модель на основе «точечного» подхода. Тем не менее, если вычислить комплексный показатель точности (1), то можно установить, что модель HoltWintersI имеет

1К1 Инженерный вестник Дона. №4 (2017) Н| ivdon.ru/ru/magazine/arcliive/n4y2017/43 88

незначительное «отставание» от гибридной модели, имеющей максимально возможное значение. Рис. 1 (левая диаграмма) показывает, что только интервальная версия «экспоненциальной» модели и гибридная модель на основе «точечного» подхода имеют значения показателя ЛЯУ меньше единицы, Это свидетельствует о более точных прогнозах по сравнению с наивной моделью прогнозирования на основе средних значений.

Рис. 1. - Сравнение средних значений показателя ЛЯУ Средние значения показателей эффективности для долгосрочного (стратегического) прогноза приведены в таблице 2.

Таблица № 2

Средние показатели точности для долгосрочных прогнозов

Показатель MLPI LSTMI HoltWintersI Hybrid HybridI

МАРЕ1 1,3571 1,2904 1,1938 1,2115 1,3381

АЯУ1 0,9063 0,8997 0,8364 0,8140 1,0163

М8Е1 24,166 21,884 19,189 19,419 23,168

Из представленных результатов видно, что интервальная версия «экспоненциальной» модели HoltWintersI при построении долгосрочных прогнозов имеет незначительное превосходство в точности относительно гибридной модели на основе «точечного» подхода. Как показывает правая диаграмма на рис. 1, все модели прогнозирования, за исключением гибридной модели на основе «векторного» подхода, имеют значения показателя ЛЯУ ниже единицы. Таким образом, можно утверждать, что гибридная модель прогнозирования на основе «векторного» подхода строит

менее точные прогнозы относительно наивной модели прогнозирования на основе средних значений при формировании прогнозов любой глубины.

Значения комплексного показателя точности (1) для краткосрочных и долгосрочных прогнозов, полученных с помощью исследуемых моделей, а также итоги ранжирования этих моделей по данному показателю представлены в сводной таблице 3.

Таблица № 3

Итоги ранжирования моделей прогнозирования по комплексному показателю

Прогноз 1 2 3 4 5

Краткосрочный НуЬпё (1,000) НоШ^еге1 (0,870) LSTMI (0,437) МСР1 (0,231) НуЬпё1 (0,004)

Долгосрочный (0,963) НуЬпё (0,948) LSTMI (0,481) МСР1 (0,181) НуЬпё1 (0,105)

Из этой таблицы видно, что гибридная модель на основе «точечного» подхода точнее других моделей формирует краткосрочные прогнозы. В то же время, интервальная модификация «экспоненциальной» модели (HoltWintersI) точнее остальных моделей строит долгосрочные прогнозы. При этом можно отметить существенное превосходство в точности двух вышеназванных моделей прогнозирования по отношению к другим моделям, что отражено на диаграммах их сравнения по комплексному показателю (Рис. 2).

Рис. 2. - Сравнение моделей по комплексному показателю точности Полученные выводы дают возможность подойти с обоснованных позиций к формированию модулей прогнозирования в составе систем

IH Инженерный вестник Дона. №4 (2017) Н| ivdon.ru/ru/magazine/arcliive/n4y2017/43 88

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

телеметрического контроля ГС [12]. В то же время, они могут быть применены и при построении систем мониторинга более широкого назначения [13].

Литература

1. Billard L., Diday E. Symbolic Data Analysis: Conceptual Statistics and Data Mining. Chichester: Wiley, 2006. 330 p.

2. Kamo T. Hybrid Approach to the Japanese Candlestick Method for Financial Forecasting // Expert Systems and Applications. 2009. Vol.36. No.3. pp. 50235030.

3. Ak R., Vitelli V., Zio E. An Interval-Valued Neural Network Approach for Uncertainty Quantification in Short-Term Wind Speed Prediction // IEEE Transactions on Neural Networks and Learning Systems. 2015. Vol.26. No.11. pp. 2787-2800.

4. Krymsky V.G., Ivanov I.V. Application of Interval-Valued Probabilities and Unified Scheme of Non-Homogeneous Poisson Process Models to Software Failure Prognostics // Safety and Reliability of Complex Engineered Systems. -Podofilini et al. (Eds.).- London: Taylor & Francis Group, 2015. pp. 2403 - 2411.

5. Maia A.L.S, De Carvalho F.A.T., Ludermir T.B. Forecasting Models for Interval-Valued Time Series // Neurocomputing, 2008. Vol.71. No. 16-18. pp. 3344-3352.

6. Maia A.L.S., De Carvalho F.A.T. Holt's Exponential Smoothing and Neural Network Models for Forecasting Interval-Valued Time Series // International Journal of Forecasting, 2011. Vol.27. No.3. pp. 740-759.

7. Arroyo, J., San Roque A.M., Mate C., Sarabia A. Exponential Smoothing Methods for Interval Time Series // Proceedings of the 1st European Symposium on Time Series Prediction. - Espoo: Multiprint Oy / Otamedia. 2007. pp.231-240.

8. Xiong, T., Li C., Bao Y. Interval-valued Time Series Forecasting Using a Novel Hybrid HoltI and MSVR Model // Economic Modelling, 2017. Vol. 60. Issue C. pp. 11-23.

9. Hochreiter, S., Schmidhuber J. Long Short-Term Memory // Neural Computation, 1997. Vol. 9. pp. 1735-1780.

10. Имильбаев Р.Р., Крымский В.Г., Юнусов А.Р. Использование интервальных временных рядов для прогнозирования состояния газораспределительной сети // Электротехнические и информационные комплексы и системы, 2016. Т.12. №4. C. 62-72.

11. Плуготаренко Н.К.. Варнавский А.Н. Применение нейронных сетей для построения модели прогнозирования состояния городской воздушной среды // Инженерный вестник Дона. 2012. №4 (часть 2). URL: ivdon.ru/ru/magazine/archive/n4p2y2012/1351.

12. Крымский В.Г., Жалбеков И.М., Имильбаев Р.Р., Юнусов А.Р. Автоматизация управления технологическими процессами в газораспределительных сетях: проблемы, тенденции и перспективы // Электротехнические и информационные комплексы и системы. 2013. Т.9. №2. С.70-79.

13. Стуженко Н.И., Илиев А.Г., Стуженко И.А., Костромина Е.И., Шеметов А.И. Теоретические основы построения региональных систем мониторинга // Инженерный вестник Дона, 2015. №4. URL: ivdon.ru/ru/magazine/archive/n4y2015/3282.

References

1. Billard L., Diday E. Symbolic Data Analysis: Conceptual Statistics and Data Mining. Chichester: Wiley, 2006. 330 p.

2. Kamo T. Hybrid Approach to the Japanese Candlestick Method for Financial Forecasting. Expert Systems and Applications. 2009. Vol.36. No.3. pp. 5023-5030.

3. Ak R., Vitelli V., Zio E. An Interval-Valued Neural Network Approach for Uncertainty Quantification in Short-Term Wind Speed Prediction. IEEE Transactions on Neural Networks and Learning Systems. 2015. Vol.26. No.11. pp. 2787-2800.

4. Krymsky V.G., Ivanov I.V. Application of Interval-Valued Probabilities and Unified Scheme of Non-Homogeneous Poisson Process Models to Software Failure Prognostics // Safety and Reliability of Complex Engineered Systems. -Podofilini et al. (Eds.). London: Taylor & Francis Group, 2015. pp. 2403 - 2411.

5. Maia A.L.S, De Carvalho F.A.T., Ludermir T.B. Forecasting Models for Interval-Valued Time Series. Neurocomputing, 2008. Vol.71. No. 16-18. P. 33443352.

6. Maia, A.L.S., De Carvalho F.A.T. Holt's Exponential Smoothing and Neural Network Models for Forecasting Interval-valued Time Series. International Journal of Forecasting, 2011. Vol. 27. No.3. pp. 740-759.

7. Arroyo, J., San Roque A.M., Mate C., Sarabia A., Exponential Smoothing Methods for Interval Time Series. Proceedings of the 1st European Symposium on Time Series Prediction, 2007. pp.231-240.

8. Xiong, T., Li C., Bao Y. Interval-valued Time Series Forecasting Using a Novel Hybrid HoltI and MSVR Model. Economic Modelling, 2017. Vol.60. Issue C. pp.11-23.

9. Hochreiter, S., Schmidhuber J. Long Short-term Memory. Neural Computation, 1997. Vol.9. pp. 1735-1780.

10. Imilbaev R.R., Krymsky V. G., Yunusov A.R. Electrical and Data Processing Facilities and Systems (Rus), 2016, No. 4. pp. 62-72.

11. Plugotarenko N.K. Varnavskiy A.N. Inzenernyj vestnik Dona (Rus), 2012, №4 (part 2). URL: ivdon.ru/ru/magazine/archive/n4p2y2012/1351.

12. Krymsky V. G., Zhalbekov I.M., Imilbaev R.R., Yunusov A.R. Electrical and Data Processing Facilities and Systems (Rus), 2013, No. 2, pp. 7079.

13. Stuzhenko N.I., Iliev A.G., Stuzhenko I.A., Kostromina E.I., Chemetov A.I. Inzenernyj vestnik Dona (Rus), 2015, №4. URL: ivdon.ru/en/magazine/archive/n4y2015/3282.

i Надоели баннеры? Вы всегда можете отключить рекламу.