Математические методы и модели
УДК 338.27
МЕТОДЫ СТАТИСТИЧЕСКОГО ПРОГНОЗИРОВАНИЯ ЭКОНОМИЧЕСКОГО ПОКАЗАТЕЛЯ РАСХОДА ЭЛЕКТРОЭНЕРГИИ НА ПРЕДПРИЯТИИ
Д.Р. ГРИГОРЬЕВА,
кандидат педагогических наук, доцент кафедры математических методов в экономике E-mail: [email protected] Набережночелнинский институт (филиал) Казанского (Приволжского) федерального университета, Набережные Челны, Российская Федерация
А.Г. ФАЙЗУЛЛИНА,
старший преподаватель кафедры математических методов в экономике E-mail: [email protected] Набережночелнинский институт (филиал) Казанского (Приволжского) федерального университета, Набережные Челны, Российская Федерация
Предмет/тема. Рассматриваются проблемы применения системы STATISTICA для прогнозирования расхода электроэнергии на предприятии. Построенный прогноз позволяет более взвешенно подходить к формированию расходных статей.
Цели/задачи. Гглавная цель работы - анализ статистических методов и прогнозирование объема расхода электроэнергии на предприятии методом исследования временных рядов с помощью пакета STATISTICA с использованием нейронных сетей. Рассматривается модель АНША, которая представляет собой класс стохастических процессов, используемых для анализа временных рядов, а также применяются возможности нейронных сетей в задаче прогнозирования. Были поставлены следующие
задачи: составить прогноз электропотребления на основе метода АМША; составить прогноз электропотребления с использованием нейронных сетей; проверить качество модели за последний год; построить прогноз на более длительный срок.
Методология. Рассмотрены теоретические основы анализа и прогнозирования, основные понятия временных рядов и их виды, теория нейронных сетей, использованы модель АНША, показатели анализа ряда динамики, проведен сравнительный анализ динамики объема расхода электроэнергии за 2009-2013 гг.
Результаты. Составлен прогноз временного ряда методом АНША при помощи нейронных сетей.
Обсуждение/применение. У нейронных сетей много важных свойств, но ключевое из них - это способность к обучению. Обучение нейронной сети в первую очередь заключается в изменении «силы» синаптических связей между нейронами. Классификация нейронных сетей по характеру обучения делит их на сети, использующие обучение с учителем и без него. Обучение с учителем предполагает, что для каждого входного вектора существует целевой вектор, представляющий собой требуемый выход. Вместе они называются обучающей парой. Обычно сеть обучается на некотором числе таких обучающих пар. Предъявляется выходной вектор, вычисляется выход сети и сравнивается с соответствующим целевым вектором. Далее веса изменяются в соответствии с алгоритмом, стремящимся минимизировать ошибку. Векторы обучающего множества предъявляются последовательно, вычисляются ошибки, и веса подстраиваются для каждого вектора до тех пор, пока ошибка по всему обучающему массиву не достигнет приемлемого уровня. Обучение без учителя является намного более правдоподобной моделью обучения с точки зрения биологических корней искусственных нейронных сетей. Развитая Кохоненом и многими другими она не нуждается в целевом векторе для выходов и, следовательно, не требует сравнения с предопределенными идеальными ответами. Обучающее множество состоит лишь из входных векторов. Обучающий алгоритм подстраивает веса сети так, чтобы получались согласованные выходные векторы, т.е. чтобы предъявление достаточно близких входных векторов давало одинаковые выходы. Процесс обучения, следовательно, выделяет статистические свойства обучающего множества и группирует сходные векторы в классы.
Выводы/значимость. Сделан вывод о том, что при прогнозировании расхода электроэнергии в условиях ограниченных ресурсов и постоянном росте цен наиболее эффективными оказываются методы, основанные на применении нейронных сетей. Этот метод позволяет обнаружить закономерности явлений, скрытые рычаги, толкающие исследуемые параметры в том или ином направлении. При внешней простоте такой анализ имеет ряд нюансов, игнорирование которых приводит к серьезным ошибкам при интерпретации результатов.
Ключевые слова: нейронные сети, прогнозирование, модель А^МА, эконометрический метод, экономический анализ показателей
В настоящее время в связи с ограниченностью ресурсов и постоянным ростом цен на электроэнергию появилась необходимость прогнозирования расхода электроэнергии. Для этого используются статистические методы.
Статистические модели построены на том, что вначале делается предположение о характере связей между анализируемыми переменными, затем проверяется соответствие данных модели, и в зависимости от степени этого соответствия делаются определенные выводы. Типичный пример такого рода моделей представляют временные ряды, имеющие тренд-циклическую компоненту и случайную составляющую.
Фундамент прогноза обычно составляет анализ динамики процессов исследуемого явления в прошедшие годы, детальное изучение взаимосвязей между показателями, сопровождающими эти процессы, описание их количественных и качественных характеристик и выявление устойчивых закономерностей.
В качестве основных инструментов для изучения процессов изменения различных показателей обычно используются модели и статистические методы анализа временных рядов, развитые в рамках традиционной методологии случайных процессов.
При анализе временных рядов основное внимание уделяется исследованию, описанию и моделированию их структуры. Цель таких исследований состоит в том, что построенную модель можно использовать для экстраполяции или прогнозирования временного ряда. Построение моделей ряда необходимо для корректировки сезонных эффектов и сглаживания.
Важным дополнением к выявлению сложных закономерностей, характеризующих механизмы развития процессов на рынке, является анализ связей между различными процессами, взаимодействующими друг с другом. Этот анализ позволяет обнаружить закономерности явлений, скрытые рычаги, толкающие исследуемые параметры в том или ином направлении. В этом случае используется методология изучения многомерных временных рядов, прежде всего регрессионный анализ. При внешней простоте такой анализ имеет ряд нюансов, игнорирование которых приводит к серьезным ошибкам при интерпретации результатов.
Модель ARIMA (autoregressive integrated moving average) - интегрированная модель авторегрессии и методология анализа временных рядов, иногда называемая моделью (или методологией) Бокса -Дженкинса.
Процесс авторегрессии порядка р функционально связан с автокорреляционной функцией
Гр = аггр_г + й2Гр_2 +... + ар, где р = 1, 2,..., т - лаг автокорреляции: сдвигание у(0 на р значений назад; г0 =1.
Согласно этому соотношению единственный коэффициент авторегрессии первого порядка Л = а у-1 + е1 равен коэффициенту автокорреляции первого порядка, т.е. а1 = г1. Для авторегрессии второго порядка у = а ¡у(1 + а2у-2 + в( имеем систему уравнений:
r1 = a1 + a2 r1; r2 = alrl + a2.
Отсюда
ri(l - Г2) .
1 - r2
а2 =--Г.
1 - r
Следовательно, коэффициент авторегрессии, как и коэффициент автокорреляции, изменяется в интервале [-1;1].
Сезонные данные обычно имеют четкую структуру, которая повторяется каждый год. Поэтому в месячных данных с годовой сезонной структурой значения для одних и тех же месяцев в разные годы должны коррелировать между собой, т.е. коррелировать между собой должны не только отдельные наблюдения в течение одного и того же года, но и наблюдения с периодом, кратным целому году. Коэффициенты автокорреляции и частичной автокорреляции подобных данных будут ненулевыми при небольших интервалах опоздания.
Если модели содержат одинаковое количество параметров, то преимущество следует отдать модели с наименьшей среднеквадратичной ошибкой s2. Значение ошибки вычисляется следующим образом:
s2 = ± (у. - y* )2,
j-1
где y. - реальные данные:
j *
y j - данные, полученные в результате прогнозирования с помощью i-й модели.
После вычисления всех значений st находится минимальное из них min (Sf), и именно модель с i-м набором параметров согласно данному критерию признается лучшей.
Методология прогнозирования Бокса - Джен-кинса отличается от большинства методов, так как в ней не допускается какой-либо особенной структуры данных часовых рядов, для которых выполняется прогноз. Здесь используется итеративный подход к определению допустимой модели среди общего
класса моделей. Затем выбранная модель сопоставляется с историческими данными, чтобы проверить, точно ли она описывает ряды. Модель будет считаться приемлемой, если остатки, в основном малые, распределенные случайно, в целом не содержат полезной информации. Если заданная модель неудовлетворительна, процесс повторяется, но уже с использованием новой улучшенной модели. Такая итерационная процедура повторяется до тех пор, пока не будет найдено удовлетворительной модели.
Прогнозирование при помощи искусственных нейронных сетей. Нейронные сети - это очень мощный и гибкий механизм прогнозирования. При определении того, что нужно прогнозировать, необходимо указывать переменные, которые анализируются и предсказываются. Здесь очень важен требуемый уровень детализации. На используемый уровень детализации влияет множество факторов: доступность и точность данных, стоимость анализа и предпочтения пользователей результатов прогнозирования. В ситуациях, когда наилучший набор переменных неясен, можно попробовать разные альтернативы и выбрать один из вариантов, дающий наилучшие результаты. Обычно так осуществляется выбор при разработке прогнозирующих систем, основанных на анализе исторических данных.
Второй важный этап при построении нейросе-тевой прогнозирующей системы - это определение следующих трех параметров: периода прогнозирования, горизонта прогнозирования и интервала прогнозирования. Период прогнозирования - это основная единица времени, на которую делается прогноз. Горизонт прогнозирования - это число периодов в будущем, которые покрывает прогноз. То есть может понадобиться прогноз на 10 дней вперед с данными на каждый день. В этом случае период -сутки, а горизонт - 10 суток. Наконец, интервал прогнозирования - это частота, с которой делается новый прогноз. Часто интервал прогнозирования совпадает с периодом прогнозирования. Выбор периода и горизонта прогнозирования обычно диктуется условиями принятия решений в области, для которой производится прогноз. Выбор этих двух параметров - едва ли не самое трудное в нейросетевом прогнозировании. Чтобы прогнозирование имело смысл, горизонт прогнозирования должен быть не меньше, чем время, необходимое для реализации решения, принятого на основе прогноза. Таким образом, прогнозирование очень сильно зависит от природы принимаемого решения. В некоторых
ai =
2
случаях время, требуемое на реализацию решения, не определено, например, как в случае поставки запасных частей для пополнения запасов ремонтных предприятий. Существуют методы работы в условиях подобной неопределенности, но они повышают вариацию ошибки прогнозирования. Поскольку с увеличением горизонта прогнозирования точность прогноза обычно снижается, часто можно улучшить процесс принятия решения, уменьшив время, необходимое на реализацию решения и, следовательно, уменьшив горизонт и ошибку прогнозирования.
В некоторых случаях не так важно предсказание конкретных значений прогнозируемой переменной, как предсказание значительных изменений в ее поведении. Такая задача возникает, например, при предсказании момента, когда текущее направление движения рынка (тренд) изменит свое направление на противоположное.
Точность прогноза, требуемая для конкретной проблемы, оказывает огромное влияние на прогнозирующую систему. Такое же влияние на прогноз оказывает обучающая выборка.
Первое, с чем сталкивается пользователь любого нейропакета - это необходимость подготовки данных для нейросети. На практике именно предобработка данных может стать наиболее трудоемким элементом нейросетевого анализа. Причем знание основных принципов и приемов предобработки данных не менее, а может быть, даже более важно, чем знание собственно нейросетевых алгоритмов. Последние, как правило, уже «зашиты» в различных нейроэму-ляторах, доступных на рынке. Сам же процесс решения прикладных задач, в том числе и подготовка данных, целиком ложится на плечи пользователя.
Алгоритм состоит из следующих пунктов:
- получение временного ряда с интервалом в выбранную временную итерацию;
- заполнение «пробелов» в истории;
сглаживание ряда методом скользящих средних (или другим);
получение ряда относительного изменения прогнозируемой величины; формирование таблицы «окон» с глубиной погружения к временных интервалов; добавление к таблице дополнительных данных (например, изменение величины за предыдущие годы); шкалирование;
определение обучающей и валидационной выборок;
подбор параметров нейросети; обучение нейросети;
проверка работоспособности нейросети в реальных условиях.
Разработка прогноза объема расходуемой электроэнергии на основе ARIMA-модели в среде БТАИБИСА 10. На основе общего ежемесячного объема расхода электроэнергии по предприятию имеем график ряда об объеме расходуемой электроэнергии за период с 01.03.2014 00:30 по 01.04.2014 00:00. (рис. 1).
Результаты процедуры оценивания на основе ARIMA-модели имеют вид, представленный на рис. 2.
В верхней части окна дана информация о модели и оценках ее параметров (рис. 3).
Рис. 1. График исходного ряда (компьютерное отображение)
Рис. 2. Окно результатов оценивания на основе АШМА-модели (компьютерное отображение)
Рис. 3. Таблица оценок параметров АШМА (компьютерное отображение)
В колонках отражаются следующие параметры: оценки параметров; асимптотическая стандартная ошибка; значения ¿-критерия; уровни значимости;
верхние границы 95%-ных доверительных интервалов для соответствующих неизвестных параметров модели;
нижние границы 95%-ных доверительных интервалов для соответствующих неизвестных параметров модели.
Доверительный интервал (-0,141223, -0,039816) с вероятностью 0,95 накрывает истинное значение
1) 2)
3)
4)
5)
6)
параметра p(1). Число -0,090519, приведенное в первой колонке, есть точечная оценка сезонного параметра p(1). Точечная оценка - это число, вычисляемое на основе наблюдений, предположительно близкое к оцениваемому параметру.
Построены точечные и интервальные оценки параметров.
В строке number of cases (число наблюдений) зададим число наблюдений, на которые хотим спрогнозировать ряд. В опции Confidense level (уровень доверия) зададим уровень доверия или коэффициент доверия, измеряющие надежность прогнозируемых значений ряда. В опции Start at case (начать с наблюдения) укажем номер наблюдения, с которого следует начать прогноз. Выбираем опцию Append forecast to original series on Exit (добавьте прогнозируемые величины к концу наблюдаемого ряда).
Кнопка Forecast cases (прогнозируемые наблюдения) позволяет посмотреть прогноз в электронной таблице на несколько наблюдений вперед (рис. 4).
Разработка прогноза объема расходуемой электроэнергии на предприятии с использованием нейронных сетей в среде STATISTICA 10. После сглаживания исходного временного ряда и выделения основных тенденций строятся нейросетевые модели.
Проанализируем модели по полученным значениям производительности. Наилучшей считается модель, имеющая производительность, близкую к единице. Расположим в рейтинге модели по
ШЕЛЛ
— Home
ôf
Edit
View
Insert
Format
Statisti
Ш
kk
Basic Multiple AN OVA N on para metrics Distribution More Statistics Regression Fitting Distributor
Base
Workboold. fi Time Se B-Lj Tims
С L
£) F
£ i £) ;
l=l-J?p Tims F
F
B -l-Э Time Se B-L^ Tims
■ El ® f
h
с
£) JE
С F
F
Forecasts; Model:[1,1,0) Seasonal lag:
Input: Объем электропотребления. кВт
Start of origin: 1 End of origin: 1488
Forecast Lower Upper
CaseNo. 90.0000% 90 0000%
1489 14197,90 13802,90 14604.19
1490 14196,33 13665,10 14748.22
14Э1 14196.47 13556,91 14866.21
1492 14196,46 13465,52 14967,08
1493 14196,46 13385,07 15057,04
1494 14196,46 13312,51 15139,11
1495 14196,46 13245,97 15215,16
1496 14196,46 13184,22 15286,42
1497 14196,46 13126,42 15353,74
1498 14196,46 13071,92 15417,75
1499 14196,46 13020,25 15478,93
1500 14196,46 12971,03 15537,66
1501 14196.46 12923,98 15594.24
1502 14196.46 12378,84 15648,90
1503 14196,46 12835,41 15701,84
1504 14196,46 12793,53 15753,24
1505 14196,46 12753,06 15803,23
1506 14196,46 12713,88 15851,93
1507 14196,46 12675,87 15899,46
Рис. 4. Прогноз наблюдений (компьютерное отображение)
уменьшению значения производительности (табл. 1). Лучшей по данному показателю является модель 3.
Проанализируем модели по полученным значениям ошибок. Наилучшей считается модель, имеющая самый низкий процент ошибки. Расположим в рейтинге модели по увеличению значения ошибок (табл. 2). Лучшей по данному показателю является модель 4.
Для определения наилучшей модели по двум показателям качества сложим значения мест в рейтинге каждой модели. Лучшей будет считаться модель, имеющая меньшее значение суммы мест в рейтинге. В данном случае оптимальной является модель 4 (табл. 3).
Таким образом, проанализировано 5 моделей. Самой оптимальной является модель 4 с производительностью 0,959 и ошибкой прогноза 5%.
Оценка прогноза объема расхода электроэнергии. Построим прогноз на 2014 г. на основе выбранной модели. Архитектура многослойного персептрона данной модели состоит из 12 входов, 7 скрытых слоев и 1 выхода. Производительность равна 0,959. Средняя ошибка прогноза равна 5%. В целом за 2014 г. объем расхода электроэнергии по прогнозным данным составит 185 906 кВт' ч (табл. 4).
Таблица 1
Место в рейтинге моделей по значению производительности
Показатель Модель
1 (MLP 12-3-1) 2 (MLP 12-8-1) 3 (MLP 12-8-1) 4 (MLP 12-7-1) 5 (MLP 12-3-1)
Производительность 0,952 0,962 0,976 0,959 0,942
Место в рейтинге 4-е 2-е 1-е 3-е 5-е
Таблица 2 Место в рейтинге моделей по значению ошибки
Показатель Модель
1 (MLP 12-3-1) 2 (MLP 12-8-1) 3 (MLP 12-8-1) 4 (MLP 12-7-1) 5(MLP 12-3-1)
Ошибка, % 7 8 14 5 11
Место в рейтинге 2-е 3-е 5-е 1-е 4-е
Таблица 3
Определение наилучшей модели по месту в рейтинге
Показатель Модель
1 (MLP 12-3-1) 2 (MLP 12-8-1) 3 (MLP 12-8-1) 4 (MLP 12-7-1) 5 (MLP 12-3-1)
Производительность 4-е 2-е 1-е 3-е 5-е
(место в рейтинге)
Ошибка (место в рейтинге) 2-е 3-е 5-е 1-е 4-е
Сумма мест в рейтинге 6 5 6 4 9
Таблица 4
Результаты прогноза на 2014 г., кВт' ч
Месяц Прогноз
Январь 15 320
Февраль 12 600
Март 14 375
Апрель 17 620
Май 15 250
Июнь 11 658
Июль 17 558
Август 13 854
Сентябрь 14 275
Октябрь 16 258
Ноябрь 17 554
Декабрь 19 584
Итого... 185 906
В ходе выполнения данной работы было выявлено, что в настоящее время самой популярной среди структурных моделей является модель на основе искусственных нейронных сетей.
Наряду с традиционными методами прогнозирования теория искусственных нейронных сетей бурно развивается. Нейросеть хорошо зарекомендовала себя в области управления, там, где необходимо применение человеческого интеллекта, в частности, при решении задач прогнозирования. Это научное направление родилось на стыке таких наук, как нейробиология, химия, физика, математика, информатика, философия и психология. Нейросети открыли возможности использования вычислений в сферах, которые до этого относились лишь к области человеческого интеллекта.
При помощи нейронных сетей возможно моделирование нелинейной зависимости будущего значения временного ряда от его фактических значений и от значений внешних факторов. Для получения прогноза того или иного показателя необходимо представить механизму переменные, которые подвергаются анализу, а затем предсказываются.
Список литературы
1. Автоматизированные системы управления в энергосбережении (опыт разработки): монография / под ред. Л.С. Казаринова. Челябинск: ЮУрГУ, 2010. 228 с.
2. Аксенов С.В., Новосельцев В.Б. Организация и использование нейронных сетей (методы и технологии). Томск: НТЛ, 2006. 128 с.
3. АфанасьевВ.Н., ЮзбашевМ.М. Анализ временных рядов и прогнозирование. М.: Финансы и статистика, 2001. 228 с.
4. Бир Э.C. Кибернетика и управление производством. М.: Наука, 1965. 392 с.
5. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. М.: Мир, 2009. 604 c.
6. Боровиков В.П. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных. М.: Горячая линия-Телеком, 2008. 392 с.
7. Боровиков В.П. Популярное введение в программу STATISTICA. М.: КомпьютерПресс, 2008. 267 с.
8. Галушкин А.И. Нейронные сети. Основы теории. М.: Горячая линия-Телеком, 2010. 496 с.
9. Каллан Р. Основные концепции нейронных сетей. М.: Вильямс, 2001, 287 с.
10. Кендел М. Временные ряды. М.: Финансы и статистика, 1981. 199 с.
11. Круг П.Г. Нейронные сети и нейрокомпьютеры. М.: МЭИ, 2002. 176 с.
12. Кудрин Б.И., Жилин Б.В., Лагуткин О.Е., Ошурков М.Г. Ценологическое определение параметров электропотребления многономенклатурных производств. Тула: Приокское книжное издательство, 1994.122 с.
13. КузнецовЮ.А., ПероваВ.И., ВоробьеваЕ.В. Нейросетевое моделирование финансово-экономической деятельности крупнейших компаний Поволжья // Экономический анализ: теория и практика. 2011. № 35. С. 25-36.
14. Нейронные сети. URL: http://www.statsoft. ru/home/textbook/modules/stneunet.html.
15. Нейронные сети и их устройство. URL: http://ap-economics.narod.ru/library/NLP.html.
16. Основы искусственных нейронных сетей. URL: http://neuronets.chat.ru/foundations.html/.
17. Первые шаги в STATISTICA Automated Neural Networks (SANN). URL: http://statsoft.ru/products/ STATISTICA_Neural_Networks/first-steps.php.
18. Прогнозирование продаж полуфабрикатов. URL: http://www.statsoft.ru/solutions/ExamplesBase/ tasks/detail.php?ELEMENT_ID=654.
19. Прогнозирование с помощью нейронных сетей. URL: http://apsheronsk.bozo.ru/Neural/Lec9.htm.
20. Россиев A.A. Моделирование данных при помощи кривых для восстановления пробелов в таблицах // Методы нейроинформатики. Красноярск: КГТУ, 1998. С. 6-22.
21. Рутковская Д. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия-Телеком, 452 с.
22. Тархов Д.А. Нейронные сети. Модели и алгоритмы. М.: Радиотехника, 2005. 256 с.
23. Уразбахтин И.Г., Рыков Н.И. Алгоритм предобработки данных для целей прогнозирования на базе технологии нейронных сетей // Современные инструментальные системы, информационные технологии и инновации. Курск: КурскГТУ, 2003. С.64-67.
24. УсковА.А., Кузьмин А.В. Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика. М.: Горячая линия-Телеком, 2004, 143 с.
25. Хайкин С. Нейронные сети. Полный курс. М.: Вильямс, 2006, 1104 с.
26. ХалафянА.А. STATISTICA. Статистический анализ данных: учебник. М.: Бином-Пресс, 2007. 512 с.
27. Шабонин П.В. Методы научного прогнозирования и их практическое применение // ТОР-MANAGER. 2006. № 3. С. 15-19.
28. Yufei Yuan, Shaw M.J. Induction of fuzzy decision trees // Fuzzy Sets and Systems. 1995. № 69. P. 125-139.
29. Wang L.X., Mendel J.M. Generating Fuzzy Rules by Learning From Examples // IEEE Transactions on Systems, Man and Cybernetics. 1992. Vol. 22. № 6. P. 1414-1427.
Economic Analysis: Theory and Practice Mathematical Methods and Models
ISSN 2311-8725 (Online) ISSN 2073-039X (Print)
METHODS OF STATISTICAL FORECASTING OF ECONOMIC INDICATORS: ELECTRICITY CONSUMPTION BY ENTERPRISE
Diana R. GRIGOR'EVA, Aigul' G. FAIZULLINA
Abstract
Subject Consumption by the population and enterprises depends on many factors: temperature, day time, weather conditions. The constant need to supply electricity to households and enterprises generates the need for protection against serious damage. Termination of energy supply to vital objects may cause accidents and lead to huge financial losses; therefore, in most cases it is advisable to spend money on crisis prevention. A possibility to solve this problem is to predict energy consumption. As a rule, experts are aware of the information about potential electricity consumption, and predicting potential damage by an expert will be sufficient. This entails little financial cost and considerable time to collect representative samples. As a rule, the information needed to predict is going to power sensors or utilities. The article discusses the application of the STATISTICA system to forecast energy consumption at enterprises. In addition to risk mitigation, forecasting is another important application. For businesses, the cost of energy bills accounts for a significant budget item. Forecasting enables to apply a more balanced approach to the formation of expenditure items. Objectives The main objective of the work is to analyze statistical methods and forecasting of electricity
consumption volume at a plant under the method of researching the time series with the help of the STATISTICA package using neural networks. In this paper, we consider the ARIMA model, which represents a whole class of stochastic processes used for time series analysis. In addition, the paper discusses the application of neural networks possibilities in the problem of forecasting. We set the following tasks: to forecast energy consumption under the ARIMA method; to make a forecast of electricity consumption using neural networks; to check the quality of the model for the recent year; to make a forecast for a longer period. Methods The paper discusses the theoretical basis of the analysis and forecasting, the basic concepts of time series and their types, the theory of the neural network model. We also used the ARIMA model, the indicators of the analysis of dynamics, and performed a comparative analysis of the dynamics of electricity consumption volume for the period of 2009-2013. Results We have made a forecast of a time series under the ARIMA method using the neural networks. Discussion Neural networks have many important properties, but the key one is learning capability. Training of neural networks involves, first of all, changing the 'strength' of synaptic connections between neurons. The
classification of neural networks in terms of the nature of learning divides them into neural networks using supervised learning and neural networks using unsupervised learning. The supervised learning implies that for each input vector there is a target vector representing the desired output. Together they are called a training pair. Typically, the training of a neural network is based on a certain number of training pairs, where the output vector is presented, the network output is calculated and compared to appropriate target vector. Further, the weight changes in accordance with the algorithm seeking to minimize the error. The vectors of the training set are presented sequentially, then errors are computed and the weights are adjusted for each vector as long as the error for the entire learning array reaches an acceptable level. The unsupervised learning is a much more plausible model of learning in terms of biological roots of artificial neural networks. Teuvo Kohonen and many other scholars developed the model. It does not need a target vector for output and, therefore, does not require any comparison with predetermined ideal responses. The training set only consists of input vectors. The learning algorithm adjusts the network weights so that to achieve agreed output vectors, i.e. the presentation of sufficiently close input vectors would produce the same outputs. The learning process is, therefore, highlights the statistical properties of the training set and groups similar vectors into classes. Conclusions and Relevance We conclude that when predicting energy consumption in conditions of limited resources and rising prices, the methods based on the use of neural networks turn out to be the most effective. This method allows detecting patterns of events, hidden levers pushing the studied parameters in either direction. Despite the apparent simplicity, this analysis has a number of nuances, which, if disregarded, lead to serious errors in the interpretation of results.
Keywords: neural networks, forecasting, ARIMA model, econometric method, economic analysis, indicators
References
1. Avtomatizirovannye sistemy upravleniya v en-ergosberezhenii (opyt razrabotki) [Automated control systems in energy saving (development experience)]. Chelyabinsk, SUSU Publ., 2010, 228 p.
2. Aksenov S.V., Novosel'tsev V.B. Organizatsiya i ispol'zovanie neironnykh setei (metody i tekhnologii) [Organization and the use of neural networks (methods and technologies)]. Tomsk, NTL Publ., 2006, 128 p.
3. Afanas'ev V.N., Yuzbashev M.M. Analiz vre-mennykh ryadov iprognozirovanie [Time series analysis and forecasting]. Moscow, Finansy i statistika Publ., 2001, 228 p.
4. Beer A.S. Kibernetika i upravlenie proizvod-stvom [Cybernetics and Management]. Moscow, Nauka Publ., 1965, 392 p.
5. Box G., Jenkins G. Analiz vremennykh ryadov. Prognoz i upravlenie [Time Series Analysis: Forecast and Control]. Moscow, Mir Publ., 2009, 604 p.
6. Borovikov V.P. Neironnye seti. STATISTICA Neural Networks: Metodologiya i tekhnologii sovre-mennogo analiza dannykh [Neural networks. STATISTICA Neural Networks: methodology and technology of modern data analysis]. Moscow, Goryachaya liniya-Telekom Publ., 2008, 392 p.
7. Borovikov V.P. Populyarnoe vvedenie v programmu STATISTICA [A popular introduc-tion to STATISTICA software package]. Moscow, Komp'yuterPress Publ., 2008, 267 p.
8. Galushkin A.I. Neironnye seti. Osnovy teorii [Neural networks. Basic theory]. Moscow, Goryachaya liniya-Telekom Publ., 2010, 496 p.
9. Callan R. Osnovnye kontseptsii neironnykh setei [The Essence of Neural Networks]. Moscow, Vil'yams Publ., 2001, 287 p.
10. Kendall M. Vremennye ryady [Time Series]. Moscow, Finansy i statistika Publ., 1981, 199 p.
11. Krug P.G. Neironnye seti i neirokomp'yutery [Neural networks and neurocomputers]. Moscow, MPEI Publ., 2002, 176 p.
12. Kudrin B.I., Zhilin B.V., Lagutkin O.E., Os-hurkov M.G. Tsenologicheskoe opredelenieparametrov elektropotrebleniya mnogonomenklaturnykh proizvodstv [Cenologic determination of parameters of electrical energy consumption by multiproduct manufactures]. Tula, Priokskoe knizhnoe izdatel'stvo Publ., 1994, 122 p.
13. Kuznetsov Yu.A., Perova V.I., Vorob'eva E.V. Neirosetevoe modelirovanie finansovo-ekonomicheskoi deyatel'nosti krupneishikh kompanii Povolzh'ya [Neural network modeling of financial and economic activity of largest companies in the Volga region]. Ekonom-icheskii analiz: teoriya ipraktika = Economic Analysis: Theory and Practice, 2011, no. 35, pp. 25-36.
14. Neironnye seti [Neural networks]. Available at: http://www.statsoft.ru/home/textbook/modules/stneu-net.html. (In Russ.)
15. Neironnye seti i ikh ustroistvo [Neural networks and their organization]. Available at: http://ap-econom-ics.narod.ru/library/NLP.html. (In Russ.)
16. Osnovy iskusstvennykh neironnykh setei [Fundamentals of artificial neural networks]. Available at: http://neuronets.chat.ru/foundations.html/. (In Russ.)
17. Pervye shagi v STATISTICA Automated Neural Networks (SANN) [First steps in STATISTICA Automated Neural Networks (SANN)]. Available at: http://statsoft.ru/products/STATISTICA_Neural_Net-works/first-steps.php. (In Russ.)
18. Prognozirovanieprodazhpolufabrikatov [Forecasting the sales of semi-finished products]. Available at: http://www.statsoft.ru/solutions/ExamplesBase/ tasks/detail.php?ELEMENT_ID=654. (In Russ.)
19. Prognozirovanie s pomoshch'yu neironnykh setei [Forecasting by using neural networks]. Available at: http://apsheronsk.bozo.ru/Neural/Lec9.htm. (In Russ.)
20. Rossiev A.A. Modelirovanie dannykh pri pomo-shchi krivykh dlya vosstanovleniya probelov v tablitsakh. Vkn.: Metody neiroinformatiki [Data modeling by using curves to repair gaps in tables. In: Methods of neuroin-formatics]. Krasnoyarsk, KSTU Publ., 1998, pp. 6-22.
21. Rutkovskaya D. Neironnye seti, geneticheskie algoritmy i nechetkie sistemy [Neural networks, genetic algorithms, and fuzzy systems]. Moscow, Goryachaya liniya-Telekom Publ., 452 p.
22. Tarkhov D.A. Neironnye seti. Modeli i algoritmy [Neural networks. Models and algorithms]. Moscow, Radiotekhnika Publ., 2005, 256 p.
23. Urazbakhtin I.G., Rykov N.I. Algoritm pre-dobrabotki dannykh dlya tselei prognozirovaniya na baze tekhnologii neironnykh setei. Vkn.: Sovremennye instrumental 'nye sistemy, informatsionnye tekhnologii i innovatsii [Data preprocessing algorithm for forecasting purposes based on the neural networks technology. In: Modern tooling systems, information technology and innovation]. Kursk, KurskSTU Publ., 2003, pp. 64-67.
24. Uskov A.A., Kuz'min A.V. Intellektual'nye tekhnologii upravleniya. Iskusstvennye neironnye seti i nechetkaya logika [Intelligent control technologies. Artificial neural networks and fuzzy logic]. Moscow, Goryachaya liniya-Telekom Publ., 2004, 143 p.
25. Haykin S. Neironnye seti. Polnyi kurs [Neural Networks and Learning Machines]. Moscow, Vil'yams Publ., 2006, 1104 p.
26. Khalafyan A.A. STATISTICA. Statisticheskii analiz dannykh [STATISTICA. Statistical analysis of data]. Moscow, Binom-Press Publ., 2007, 512 p.
27. Shabonin P.V. Metody nauchnogo prognozirovaniya i ikh prakticheskoe primenenie [Methods of scientific forecasting and their application]. TOPMANAGER, 2006, no. 3, pp. 15-19.
28. Yuan Y., Shaw M.J. Induction of Fuzzy Decision Trees. Fuzzy Sets and Systems, 1995, no. 69, pp.125-139.
29. Wang L.X., Mendel J.M. Generating Fuzzy Rules by Learning From Examples. IEEE Transactions on Systems, Man and Cybernetics, 1992, vol. 22, no. 6, pp. 1414-1427.
Diana R. GRIGOR'EVA
Branch of Kazan (Volga) Federal University in Naberezhnye Chelny, Naberezhnye Chelny, Republic of Tatarstan, Russian Federation [email protected]
Aigul' G. FAIZULLINA
Branch of Kazan (Volga) Federal University in Naberezhnye Chelny, Naberezhnye Chelny, Republic of Tatarstan, Russian Federation [email protected]