Научная статья на тему 'Применение регрессионного анализа для исследования процесса поставки и потребления энергетического ресурса'

Применение регрессионного анализа для исследования процесса поставки и потребления энергетического ресурса Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
383
98
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГРЕССИОННЫЙ АНАЛИЗ / ЭНЕРГЕТИЧЕСКИЙ РЕСУРС / ПРОЦЕСС ПОСТАВКИ И ПОТРЕБЛЕНИЯ / REGRESSION ANALYSIS / ENERGY RESOURCE / DELIVERY AND CONSUMPTION PROCESS

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Белов Дмитрий Борисович, Соловьев Сергей Игоревич

Рассмотрена возможность применения регрессионного анализа для исследования процесса поставки и потребления энергетического ресурса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Белов Дмитрий Борисович, Соловьев Сергей Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF THE REGRESSION ANALYSIS FOR RESEARCH OF PROCESS OF DELIVERY AND CONSUMPTION OF THE ENERGY RESOURCE

Possibility of application of the regression analysis for research of process of delivery and consumption of a power resource is considered.

Текст научной работы на тему «Применение регрессионного анализа для исследования процесса поставки и потребления энергетического ресурса»

CHECK OF UNIFORMITY OF SELECTIONS OF RESULTS OF THE ACCOUNTING OF THE CONSUMED AND PUT RESOURCE AT UNKNOWN DISTRIBUTIONS OF

PROBABILITY

D.B. Belov

Possibility of application of statistical criterion of Wilcoxon for check of uniformity of selections of results of the accounting of the consumed and put resource at unknown distributions of probability is considered.

Key words: resource, consumption and delivery volumes, results of the account, uniformity of selections, statistical criterion.

Belov Dmitry Borisovich, candidate of tehnical science, docent, [email protected], Russia, Tula, Tula State University

УДК 531.73

ПРИМЕНЕНИЕ РЕГРЕССИОННОГО АНАЛИЗА ДЛЯ ИССЛЕДОВАНИЯ ПРОЦЕССА ПОСТАВКИ И ПОТРЕБЛЕНИЯ ЭНЕРГЕТИЧЕСКОГО РЕСУРСА

Д.Б. Белов, С.И. Соловьев

Рассмотрена возможность применения регрессионного анализа для исследования процесса поставки и потребления энергетического ресурса.

Ключевые слова: регрессионный анализ, энергетический ресурс, процесс поставки и потребления.

В процессе снабжения каким-либо энергетическим ресурсом (природным газом, электрической энергией, нефтепродуктами и др.) довольно часто наблюдаются ситуации, когда результаты учета объемов потребления Vпотр и поставки Упост не соответствуют друг другу [1, 2]. Такое несоответствие может быть вызвано различными причинами, начиная от несанкционированного отбора ресурса, заканчивая наличием погрешностей в результатах измерения объемов потребленного и поставленного ресурсов. Поэтому исследование причинно-следственных отношений между указанными объемами является важнейшей задачей при выявлении признаков, оказывающих влияние на вариацию рассматриваемых величин.

Подходящим способом решения обозначенной выше задачи может служить проведение регрессионного анализа, который представляет собой статистический метод исследования влияния одной величины (факторного

призна) на другую величину (результативный признак). В рассматриваемом случае факторным признаком следует принять объем потребленного ресурса Употр, поскольку от него, как от аргумента, зависит значение объема поставленного ресурса Упост.

Целью регрессионного анализа является установление формы зависимости между исследуемыми признаками, т.е. между зарегистрированными объемами Употр и Упост. Тогда форму зависимости между ними

можно выразить в виде уравнения регрессии, которое в общем случае имеет вид Употр = / (Упост). Графическое выражение регрессионного уравнения называется линией регрессии, которая в самом простом случае представляет собой прямую линию, описываемую уравнением [3]:

^пост = а0 + а)Употр, (1)

где ао — свободный член (коэффициент сдвига); а\ — коэффициент регрессии или угловой коэффициент, который определяет наклон линии регрессии по отношению к осям координат.

Для нахождения коэффициентов уравнения регрессии используются следующие выражения [3]:

ао ^пост а\^потр , (2)

п _ _

X (Употр 1 — ^потр )(Упост 1 — ^пост ) 1=1

а = ^-, (3)

1 n — 2

^ ^потр i — Употр )

i=1

где Употр i , Упост i — текущие значения объемов У^тр и Упост ; Употр , Упост — средние арифметические значения объемов Употр и Упост; n — число зарегистрированных значений Употр i и Упост i; i — порядковый

номер значений Употр i и Упост i, * = l-n •

Следует заметить, что коэффициенты ai и aq в настоящее время легко определяются с помощью таких пакетов прикладных программ, как Excel, Statistica и др., в которых имеются стандартные функции, позволяющие достаточно быстро вычислить данные коэффициенты.

Поясним смысл коэффициентов ai и аq применительно к рассматриваемой задаче.

Значение коэффициента регрессии ai характеризует степень влияния величины Употр на величину Упост. Этот коэффициент также показывает, на сколько единиц изменится значение объема Упост при изменении значения объема Употр на одну единицу. На графике данный коэффициент

определяет тангенс угла наклона линии регрессии относительно положительного направления оси абсцисс (в нашем случае — это ось значений объема Vпоnlр). Чем ближе значение коэффициента к 1, тем сильнее влияние величины Vпоmр на величину Упост.

Коэффициент сдвига (свободный член) в уравнении линии регрессии определяет прогнозируемое значение объема Упост при значении объема Vпотр = 0. Значение данного коэффициента характеризует сдвиг

линии регрессии вдоль оси ординат (в нашем случае — это ось значений объема Упост) и соответствует точке пересечения прямой регрессии с этой осью.

Следует отметить, что коэффициент сдвига а0 не может быть надежным показателем для статистического анализа, поскольку его смысл заключается в том, насколько величина объема Упост сдвинута от нуля по оси ординат в точке Vпотр = 0. Однако, данная точка не входит в диапазон

экспериментальных данных объемов Vпоnlр и Упост, поскольку при объеме ресурса Vпотр = 0 объем ресурса Упост = 0. Никаких измерений в данной ситуации не производится. Поэтому данная точка является чисто теоретической и находится вне зоны исследуемого факторного пространства. Отсюда и следует, что значение коэффициента а0 не может достоверно характеризовать поведение процесса потребления и поставки ресурса.

Очевидно, что линия регрессии выражает наилучшее предсказание значения объема Упост в зависимости от значения объема Vпотр . На практике в силу действия причин случайного или неслучайного характера всегда будет наблюдаться некоторый разброс точек (Vпотр I, Vпост I) относительно прямой, т.е. будут иметь место так называемые остатки — отклонения отдельных точек от предсказанного значения (линии регрессии). Поэтому возникает необходимость в построении доверительного интервала для линии регрессии. С помощью доверительного интервала можно сделать уже достоверный прогноз значений объема Упост по уравнению регрессии.

Для этого определяется величина так называемого остаточного стандартного отклонения Sост по формуле [3]:

Sост

П 2 X (Упост У . — Упост I)

i =1 потр I

г".......2 - (4)

п — 2

где Упост„ — так называемая групповая средняя, отыскиваемая по

Употр I

уравнению регрессии путем подстановки каждого значения Употр 1.

С использованием параметра Sост определяется стандартные ошибки условного среднего и индивидуальных значений объема Упост.

Стандартная ошибка Sy условного среднего вычисляется следующим образом [3]:

пост

пост = Sост

— 2

1 + (Употр - Употр) (5)

п п

Х (Употр 1 Употр ) 1=1

Тогда доверительный интервал для прогнозов условного среднего значения (математического ожидания) объема Упост при каком-то определенном значении объема Употр будет выглядеть следующим образом:

Упост - Ч-а 12,к ' ^пост ; Упост + Ч-а /2,,к ' ^пост ] (6)

где /2 к — квантиль распределения Стьюдента для уровня значимости

а и числа степеней свободы к = п - 2.

Для индивидуальных значений объема Упост формула для определения стандартной ошибки SУ п имеет вид [3]:

' пост 0

Sy п = Sl

упост 0 '

ост

— 2

1 + 1 + (Употр - Употр) (7)

п п

Х (Употр 1 Употр ) 1=1

Тогда доверительный интервал для прогнозов конкретного индивидуального значения объема Упост в зависимости от какого-либо значения объема Употр будет определяться с помощью неравенства:

Упост 0 - ^1-а /2,к ■ ^пост 0;Упост 0 + Ч-а /2,к ■ ^пост 0 (8)

где Упост 0 — значение объема Упост, найденное по уравнению регрессии при подстановке в него какого-либо значения объема Употр.

Нетрудно заметить, что величины доверительных интервалов (6) и (8) являются непостоянными. При значениях Употр = Употр они будут минимальны, а по мере удаления значений Употр от среднего Употр — будут

увеличиваться. Графически границы доверительных интервалов для условных средних и индивидуальных значений представляют собой гиперболы, расположенные с двух сторон от линии регрессии, как это будет показано далее.

В идеальной ситуации ресурсораспределения значения объемов потребленного Употр и поставленного Упост ресурса совпадают, т.е.

Vпотр = Упост, между ними обязательно будет иметь место четкая линейная связь и линия регрессии будет выходить из начала координат под углом 45° к осям координат. В этом случае значения объемов, откладываемые по осям абсцисс и ординат окажутся одинаковыми и уравнение регрессии (1) примет вид Упост = Употр. Данное обстоятельство соответствует тому, что коэффициент регрессии (наклона) должен равняться единице ( «1 = 1), а свободный член (коэффициент сдвига) соответственно нулю (

ао = 0).

Однако в реальной ситуации точки на диаграмме рассеяния практически никогда не будут лежать на одной прямой в силу действия причин различного характера (случайного или неслучайного). Тогда и коэффициенты линии регрессии «1 и ао будут отличаться от идеальных значений и расположение самой линии будет отличаться от линии, описываемой уравнением Упост = Употр. Для примера на рис. 1 показаны идеальная и возможная реальная (представлена пунктиром) линии регрессии. Из рисунка видно, что реальная линия явно не совпадает с идеальной.

Рис. 1. Идеальная и реальная линии регрессии

На практике очень важно оценить степень случайности или неслучайности несовпадения реальной и идеальной линий регрессии. Для этого предлагается использовать следующий подход.

Если идеальная линия регрессии, подчиняющаяся уравнению Упост = Употр, будет находиться внутри доверительных границ для условных средних и соответственно для индивидуальных значений реальной

358

линии регрессии, то это с выбранным уровнем значимости будет свидетельствовать о том, что на несовпадение значений объемов Употр и Упост

оказывают влияние факторы случайного характера.

Если идеальная линия регрессии будет выходить за доверительные границы для условных средних значений, то это свидетельствует о том, что на формирование результатов учета объемов потребленного или поставленного ресурса оказывают влияние факторы неслучайного характера, например, нарушение условий измерений этих объемов или нелегальный отбор ресурса из сетей в непостоянных и, вполне возможно, что в небольших объемах.

Если же идеальная линия регрессии будет выходить за доверительные границы для индивидуальных значений, то это будет говорить о серьезных нарушениях, возникающих в процессе ресурсоснабжения, например, в нелегальном отборе ресурса из сетей в значительных объемах.

В качестве примера рассмотрим случай по поставке и потреблению природного газа (таблица).

Результаты ежедневного учета объемов потребленного и поставленного природного газа (в м3)

№ п/п 1 2 3 4 5 6 7 8 9 10

Vnomp i 4965 5044 5068 4956 4990 4925 4980 5000 5060 5063

Vnocm i 4976 5062 5072 4960 5003 4938 4986 5013 5061 5074

5100

5050

о 5000 >

4950

4900 -1

* -у*« F

Л>| У,., /Ш w *

/ & <ш '.w

ш •7* f *

4900 4950

5000 5050 Vnorp

5ID0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Значения

Реальная линия регр

Дов гр дня ср знач 1

Дсе гр для ср знач 2

■ Дсе гр дтя инд знач 1

■Дсе грД1Я инд знач 2

Идеальная линия регр

Рис. 2. Регрессионный анализ по данным таблицы

359

Уравнение линии регрессии для данных, представленных в таблице 1, выглядит следующим образом:

V = 141 275 + 0 973 • V

у пост 1 ^ / ^ ^ / ^ V потр ■

Коэффициент регрессии (угловой коэффициент) «1 для рассматриваемого случая имеет высокое значение («1 = 0,973), что говорит о сильной зависимости величины Vпост от величины Vпотр, т.е. эти величины фактически четко соответствуют друг другу.

Однако, из рисунка 2, на котором представлены идеальная и реальная линии регрессии, а также доверительные границы для прогнозов условных средних и индивидуальных значений видно, что идеальная линия регрессии выходит за доверительные границы для условных средних значений. Это говорит о возможных нарушениях в исследуемом процессе газоснабжения, в частности, о нелегальных отборах газа из сетей в небольших объемах.

В заключение следует отметить, что методика проведения регрессионного анализа, изложенная в данной статье, будет полезна организациям, занимающимся поставкой и реализацией различных ресурсов потребителям при анализе несовпадений результатов учета объемов потребления и поставки.

Список литературы

1. Белов Д.Б., Игнатьев А. А., Соловьев С.И. Проблема погрешности измерений при коммерческом учете ресурса (на примере поставки природного газа) // Методы оценки соответствия. 2012. № 9. С. 20-24.

2. Белов Д.Б., Соловьев С.И. Определение значимости различий в результатах наблюдений объемов потребленного и поставленного ресурса статистическими методами // Известия ТулГУ. Технические науки. Вып. 11. Тула: Изд-во ТулГУ. 2013. С. 110-115.

3. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. 2-е изд., перераб. и доп. М.: ЮНИТИ-ДАНА. 2004. 573 с.

Белов Дмитрий Борисович, тнд. техн. н«ук, доц, imsbelov@,mail. т, Россия, Ту-ло, Тульский госуд«рственный университет,

Соловьев Сергей Игоревич, тнд. техн. н«ук, доц, sergei59bk.ru, Россия, Тул Тульский госуд«рственный университет

APPLICATION OF THE REGRESSION ANALYSIS FOR RESEARCH OF PROCESS OF DELIVERY AND CONSUMPTION OF THE ENERGY RESOURCE

D.B. Belov, S.I. Solovyev

Possibility of application of the regression analysis for research of process of delivery and consumption of a power resource is considered.

Key words: regression analysis, energy resource, delivery and consumption

process.

Belov Dmitry Borisovich, candidate of tehnical science, docent, imsbelov@,mail. ru, Russia, Tula, Tula State University,

Solovyev Sergei Igorevich, candidate of tehnical science, docent, sergei59bk.ru, Russia, Tula, Tula State University

i Надоели баннеры? Вы всегда можете отключить рекламу.