Научная статья на тему 'Разработка многофакторных моделей прогнозирования грузооборота и объема перевезенных грузов'

Разработка многофакторных моделей прогнозирования грузооборота и объема перевезенных грузов Текст научной статьи по специальности «Математика»

CC BY
317
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ / FORECASTING / ГРУЗОВЫЕ ПЕРЕВОЗКИ / МНОГОФАКТОРНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ / MULTIVARIATE REGRESSION ANALYSIS / FREIGHT TRANSPORTATION

Аннотация научной статьи по математике, автор научной работы — Краковский Юрий Мечеславович, Давааням Тамир

Исследовано влияние различных факторов, характеризующих процесс перевозки грузов, на грузооборот и объем погрузки грузов. На первом шаге, используя значения парных коэффициентов корреляции, отобрали факторы, слабо коррелирующие между собой. Из 10 исследуемых факторов таких оказалось пять: х 1 статическая нагрузка, тн; х 2 оборот вагона, сут; х 4 средняя зарплата, тыс. тугр; х 9 среднесуточный пробег локомотива, км/сут; х 10 эксплуатационный парк локомотивов, лок./сут. На втором шаге, используя значения t-статистики, исключили незначимые факторы. В проведенном исследовании этими факторами для объема погрузки грузов оказались статическая нагрузка и оборот вагона, а для грузооборота статическая нагрузка, оборот вагона и эксплуатационный парк локомотивов. При практическом применении полученных моделей в задаче прогнозирования основных показателей необходимо в дальнейшем для каждого существенного фактора создать прогнозную модель как функцию времени (факторные модели прогнозирования). Используя эти модели, необходимо определить прогнозные значения по факторам, а далее, подставляя эти значения в многофакторные модели, вычислять прогнозные значения основных показателей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Краковский Юрий Мечеславович, Давааням Тамир

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF THE MULTIVARIATE MODEL FOR GOODS TURNOVER FORECASTING AND TRANSPORTED CARGO VOLUME

Influence of various factors characterizing the process of goods transportation on turnover and volume of cargo loading is studied. On the first step, using the double coefficient values of correlation factors weakly correlated with each other were selected. From 10 studied factors there were five: х 1 static load, tons; х 2 wagon turnover, days; х 4 average salary, thousand MNT; х 9 average mileage of locomotive, km/day; х 10 operational fleet of locomotives, loc/day. On the second step, using the values of t-statistics insignificant factors were excluded. In this study, these factors for turnover were static load and wagon turnover, and for the volume of cargo loading static load, wagon turnover and operational fleet of locomotives. In the practical application of models obtained in task prediction of the main indicators it is necessary to create predictive model in the future for each significant factor such as function of time (factors of predictive models). Using these models it is needed to determine the predicted value by factors, and then substituting these value in the multivariate models to calculate the predicted values of the main indicators.

Текст научной работы на тему «Разработка многофакторных моделей прогнозирования грузооборота и объема перевезенных грузов»

5. Контроль параметров контактной сети железной дороги дистанционным способом / Куценко С.М. т др. // Измерение, контроль, информатизация : материалы Междунар. науч.-техн. конф., 1-3 июня 2004 г. / под. общ. ред. А.Г. Якунина. Барнаул, 2004. С. 41-44.

6. Гуревич М.М. Фотометрия. 2 изд., Л. : Энергоатомиздат, 1983. 272 с.

7. Применение тепловизоров на железной дороге [Электронный ресурс] // «ЗАО» Евромикс [Сайт]. URL: http ://zaoeuromixru/primenenie-teplovizorov-na-zheleznoj-doroge.html. (Дата обращения 12.09.2014).

8. Плотников Ю.И., Федоришин Ю.М., Железнов Ф.Д. Методы и средства повышения достоверности ультрафиолетовой диагностики изоляции контактной сети [Электронный ресурс] // UVIRCO

tecnologies URL: http://www.corocam.su/static/article5. (Дата обращения: 18.05.2014).

9. Гейн Э. Э., Курганов Л. С. Техника измерения напряженности поля радиоволн. М. : Связь, 1967. 151 с.

10. Беляевский О.А., Курбатова А.Ф., Идиатуллов Р.М. Опыт применения СВЧ зонда для контроля высоковольтного оборудования [Электронный ресурс] // RLab [Сайт] // URL: http://rudy.user.s-and-b.ru/partial_discharges/use_uhf1/uhfusing1.htm (дата обращения: 01.09.2013).

11. Неразрушающий контроль : справ. Т. 6. Кн. 3. Радиоволновой контроль / В.И. Матвеев. ; под общ. ред. Клюева В.В. М. : Машиностроение, 2003.

УДК 519.6:311 Краковский Юрий Мечеславович,

д. т. н., профессор, профессор кафедры ИС и ЗИ, Иркутский государственный университет путей сообщения, e-mail: [email protected]

Давааням Тамир,

аспирант кафедры ИС и ЗИ, Иркутский государственный университет путей сообщения

РАЗРАБОТКА МНОГОФАКТОРНЫХ МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ ГРУЗООБОРОТА

И ОБЪЕМА ПЕРЕВЕЗЕННЫХ ГРУЗОВ

Y. M. Krakovskiy, D. Tamir

DEVELOPMENT OF THE MULTIVARIATE MODEL FOR GOODS TURNOVER FORECASTING AND TRANSPORTED CARGO VOLUME

Аннотация. Исследовано влияние различных факторов, характеризующих процесс перевозки грузов, на грузооборот и объем погрузки грузов. На первом шаге, используя значения парных коэффициентов корреляции, отобрали факторы, слабо коррелирующие между собой. Из 10 исследуемых факторов таких оказалось пять: х1 - статическая нагрузка, тн; х2 - оборот вагона, сут; х4 - средняя зарплата, тыс. тугр; х9 - среднесуточный пробег локомотива, км/сут; х10 - эксплуатационный парк локомотивов, лок./сут. На втором шаге, используя значения t-статистики, исключили незначимые факторы. В проведенном исследовании этими факторами для объема погрузки грузов оказались статическая нагрузка и оборот вагона, а для грузооборота - статическая нагрузка, оборот вагона и эксплуатационный парк локомотивов. При практическом применении полученных моделей в задаче прогнозирования основных показателей необходимо в дальнейшем для каждого существенного фактора создать прогнозную модель как функцию времени (факторные модели прогнозирования). Используя эти модели, необходимо определить прогнозные значения по факторам, а далее, подставляя эти значения в многофакторные модели, вычислять прогнозные значения основных показателей.

Ключевые слова: прогнозирование, грузовые перевозки, многофакторный регрессионный анализ.

Annotation. Influence of various factors characterizing the process of goods transportation on turnover and volume of cargo loading is studied. On the first step, using the double coefficient values of correlation factors weakly correlated with each other were selected. From 10 studied factors there were five: х1 - static load, tons; х2 - wagon turnover, days; х4 - average salary, thousand MNT; х9 - average mileage of locomotive, km/day; х10 - operational fleet of locomotives, loc/day. On the second step, using the values of t-statistics insignificant factors were excluded. In this study, these factors for turnover were static load and wagon turnover, and for the volume of cargo loading - static load, wagon turnover and operational fleet of locomotives. In the practical application of models obtained in task prediction of the main indicators it is necessary to create predictive model in the future for each significant factor such as function of time (factors ofpredictive models). Using these models it is needed to determine the predicted value by factors, and then substituting these value in the multivariate models to calculate the predicted values of the main indicators.

Keywords: forecasting, freight transportation, multivariate regression analysis.

Введение

Монголия занимает территорию 1531,0 тыс. кв. км, население составляет 2,3 млн чел. Нехватка автомобильных дорог объективно обусловливает ведущую роль железнодорожного транспорта в экономике страны. В настоящее время общая эксплуатационная длина Улан-Баторской железной дороги (УБЖД) составляет

1815 км, в том числе 1110 км составляет главная магистраль, соединяющая Россию и Китай.

В силу географического положения Улан-Баторская железная дорога играет важную роль в обеспечении транспорта, не только является надёжной транспортной сетью, но и в условиях динамичного развития мировой экономики имеет большой потенциал для транзитных перевозок в сообщении Европы и России с Китаем и страна-

Информатика, вычислительная техника и управление. Моделирование. Приборостроение. Метрология. Информационно-измерительные приборы и системы

ш

ми АТР, объективно являясь естественным сухопутным мостом в этом направлении.

Для повышения эффективности перевозочного процесса на Улан-Баторской железной дороге необходимо уметь проводить прогнозирование основных показателей на основе многофакторных моделей. Статистические данные для прогнозирования получены из Службы статистического учета и вычислительной техники УБЖД и Государственной статистики Монголии. Их значения приведены в работе [1]:

yi - грузооборот, млн ткм;

у2 - погрузка, тыс. т;

х1 - статическая нагрузка, т;

х2 - оборот вагона, сут;

х3 - простой вагонов под одной грузовой

операцией, вагоно-часов; х4 - средняя зарплата, тыс. тугр.; х5 - себестоимость, тыс. тугр./млн ткм; х6 - средний вес поезда, т брутто; х7 - техническая скорость, км/час; х8 - участковая скорость, км/час; х9 - среднесуточный пробег локомотива, км/сут;

х10 - эксплуатационный парк локомотивов, лок./сут.

Первые два показателя (у 1, у2) являются основными, именно эти значения необходимо прогнозировать. Остальные показатели (х1-х10) являются влияющими факторами.

Необходимость и важность математического моделирования процесса перевозки грузов железнодорожным транспортом отмечается в различных публикациях [2-4].

Постановка задачи

Создание многофакторной модели прогнозирования осуществляется в несколько этапов. Основными из них являются следующие:

1) отбор не коррелирующих между собой факторов;

2) выбор многофакторной модели прогнозирования;

3) определение значений параметров многофакторной модели прогнозирования;

4) проверка адекватности полученной многофакторной модели прогнозирования;

5) использование полученной многофакторной модели прогнозирования.

При реализации первого этапа на практике используют выборочные значения парного коэффициента корреляции между i-м и j-м факторами (rij). Если выполняется условие [5]

|ry|> (0,7-0,8) , (1)

то между этими факторами имеется существенная связь. В этом случае один из факторов рекомендуется исключить, чтобы одна и та же причина не учитывалась дважды.

В работе [1] приведены парные коэффициенты корреляции между выбранными в работе факторами.

Учитывая условие (1), были оставлены следующие пять факторов:

(Х1, Х2, Х4, Х9, Х10). (2)

В качестве прогнозной многофакторной модели рекомендована модель множественной линейной регрессии

у = а0 + аух1 + а^х2+ а4х4 + а9х9+а10х10. (3)

Для оценки параметров этой модели (3) выбран метод наименьших квадратов

А = (ЕТЕ}-1(ЕУ), (4)

где Е - матрица значений факторов, У - вектор статистических данных (временной ряд), Т - операция транспонирования, (-1) - операция нахождения обратной матрицы.

При проверке адекватности полученных моделей рекомендован их дополнительный статистический анализ, а именно: провести проверку значимости коэффициентов прогнозных моделей -Н0: Ъ7 = 0, И\. Ъ7ф0,7=1, 2, 4, 9, 10. В качестве критерия рекомендована /-статистика [6]

/ = а^(а-) ^ /(Уо) , (5)

где а/ - оценки коэффициентов Ъ/, полученные методом наименьших квадратов; 8(а-) - оценки сред-неквадратического отклонения коэффициентов а/, величина (5) при известных ограничениях [6] имеет /-распределение с числом степеней свободы у0, в нашем случае у0 = 7.

В качестве критериев адекватности выбраны ^-критерий Фишера, критерий Дарбина - Уотсона, критерий «восходящих» и «нисходящих» серий, критерий пиков.

Критерий Дарбина - Уотсона проверяет важнейшую предпосылку регрессионного анализа - отсутствие автокорреляции в последовательности остатков в(.

Значение критерия вычисляется по формуле

Z - ^-О2

d =

t=2

Z'

t=1

Эта величина сравнивается с двумя табличными уровнями: нижним ^ и верхним . Если

полученное значение d больше двух, то перед сопоставлением его нужно преобразовать: d ' = 4 - d.

2

Если d (или d') находится в интервале от нуля до ^, то значения остатков сильно автокор-релированы. Если значение d -критерия попадает в интервал от ^ до 2, то автокорреляция отсутствует.

Если ^ < d < ^, однозначного вывода об отсутствии или наличии автокорреляции сделать нельзя и необходимо использовать другой критерий, например коэффициент автокорреляции первого порядка.

Результаты исследования

Первоначально были получены многофакторные модели прогнозирования грузооборота (у1, млн ткм) и объема погрузки грузов (у2, тыс. т) относительно практически некоррелируемых факторов (2):

У1 = -7687,2990+41,3689x1+ 4,9205 x2+ 0,0061 x4 + +8,2880х + 178,7836^X10; (6)

У2 = 5528,0751+15,3742х - 0,1327х + +0,0126х - 2,3199-х9 + 7,3289^х10. (7)

Исходные данные по годам, необходимые для получения моделей (6, 7) по трем факторам, приведены в табл. 1 [1].

Т а б л и ц а 1 Значения основных показателей

и существенных ( акторов

Годы У1 У2 Х1 Х2 Х10

2000 4292,75 6783,37 55,98 5,50 26

2001 5287,27 7131,18 56,57 6,89 31

2002 6452,06 7511,82 55,66 5,57 41

2003 7254,76 7593,05 54,97 5,13 43

2004 8856,90 7886,42 53,13 6,07 51

2005 9929,09 9000,01 53,40 3,10 53

2006 9218,50 9057,08 52,55 3,04 45

2007 8360,65 9217,61 51,10 4,26 40

2008 8261,37 10455,79 51,06 3,83 44

2009 7852,10 10318,48 56,46 3,87 36

2010 10286,70 12783,98 55,92 5,03 43

2011 11418,75 14371,77 54,79 4,43 46

2012 12142,74 16221,75 55,54 3,59 42

Т а б л и ц а 2 Значения ^-статистики для коэффициентов

Р /1 /2 /4 /9 ¿■ю

У1 1,57 0,68 12,60 3,83 11,10

У2 0,61 0,12 24,10 -2,70 1,70

В результате проведенного статистического анализа для грузооборота значимыми оказались следующие факторы: Х4, Х9, Хю (средняя зарплата, среднесуточный пробег локомотива, эксплуатационный парк локомотивов); для погрузки грузов -х4 , х9 (средняя зарплата, среднесуточный пробег локомотива).

Используя статистические данные, методом наименьших квадратов (4) были получены следующие прогнозные модели: для грузооборота

у1 = -4786,1806+0,0062х4+7,5745-х9+171,5139-х10; (8)

для объема погрузки грузов

у2 = 6887,3590+0,0127 х4 - 2,8147х9. (9)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для модели (8) ^статистика равна 58,7; для модели (9) - 115,2. Эти значения подтверждают хорошую значимость полученных прогнозных моделей.

В табл. 3 приведены относительные отклонения в процентах по каждому году для у1 и у2: 1 - пятифакторные модели (6-7); 2 - трех- и двух-факторные модели (8-9);

О.О.у = 100-| у(набл) -у(расч)| /у(набл). (10)

Т а б л и ц а 3 Относительные отклонения в процентах (10)

Год О.О.у1(1) О.Оу2(1) О.О.у1(2) О.Оу2(2)

2000 6,10 1,36 5,54 0,21

2001 1,66 3,15 2,69 2,78

2002 1,62 1,25 1,08 1,22

2003 0,26 3,24 0,63 3,18

2004 1,73 6,29 1,48 5,83

2005 1,46 2,75 1,96 3,46

2006 3,94 2,07 3,80 2,21

2007 3,21 0,59 1,96 0,04

2008 7,99 0,95 9,56 1,57

2009 9,19 6,11 8,13 6,21

2010 0,35 3,02 0,58 3,08

2011 2,81 2,79 3,00 2,59

2012 1,71 1,33 1,92 1,70

В табл. 2 приведены полученные значения /-статистики (5), Р - исследуемый показатель.

На рис. 1 приведена графическая иллюстрация значений из табл. 3 для моделей (8-9).

Анализируя рис. 1 и данные табл. 3, можно сделать вывод о практической адекватности полученных многофакторных моделей для грузооборота (8) и объема погрузки грузов (9).

Информатика, вычислительная техника и управление. Моделирование. Приборостроение. Метрология. Информационно-измерительные приборы и системы

20000 набл.) расч.) набл.) расч.) 15

15000 10000 /

У 4

« Ir j Б у -

V Ч

1 À ? ir Y'

5000 F

19 95 20 00 №. 20 10 20

Рис. 1. Графическая иллюстрация адекватности моделей (8, 9)

Выводы

1. Показано, что грузооборот и объем погрузки грузов можно прогнозировать по небольшому числу факторов: а) грузооборот по трехфак-торной модели (8); б) объем погрузки грузов по двухфакторной модели (9).

2. Используя в дальнейшем факторные прогнозные модели, основные показатели рекомендуется прогнозировать в два этапа: а) по факторным моделям определять их прогнозные значения; б) подставляя эти значения в многофакторные модели, вычислять прогнозные значения основных показателей.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Давааням Тамир. Создание модели многофакторного прогнозирования основных показателей УБЖД // Транспортная инфраструктура Сибирского региона : материалы 5-й Всерос. науч.-практ. конф. с междунар. участием. Т. 1. Иркутск, 2014. C. 408-413.

2. Краковский Ю.М., Домбровский И.А. Вероятностный анализ безубыточности гру зовых перевозок на основе метода Монте-Карло // Изв. Трансиба. 2013. № 1 (13). С. 125-130.

3. Краковский Ю.М., Домбровский И.А. Прогнозирование грузооборота дороги на основе статистической и экспертной информации // Вестн. стипендиатов DAAD. 2013. Т. 1., № 1-1(10). С. 1825.

4. Бардушко В.Д. Формирование расчетных периодов имитационного моделирования работы системы тягового электроснабжения вероятностным методом // Изв. Транссиба. 2013. № 4 (16). С. 58-62.

5. Тихомиров Н.П., Дорохина Е.Ю. Эконометрика. М. : Экзамен, 2003. 512 с.

6. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. М. : ЮНИТИ. 1998. 1022 с.

УДК 004.42:519.246 Бородкин Дмитрий Константинович,

к. т. н., доцент кафедры «Промышленной электроники и информационно-измерительной техники», Ангарская государственная техническая академия, тел. 8-902-5-112-875, [email protected]

ПРОГРАММНЫЙ МОДУЛЬ ДЛЯ АНАЛИТИЧЕСКОЙ ЗАПИСИ СОВМЕСТНЫХ МОМЕНТОВ ЧЕРЕЗ КУМУЛЯНТЫ

D. K. Borodkin

A SOFTWARE MODULE FOR ANALYTICAL WRITING JOINT MOMENTS

IN TERMS OF CUMULANTS

Аннотация. Определение закона распределения случайных величин, подвергающихся нелинейному преобразованию, является важной задачей в таких областях, как метрология, приборостроение, радиотехника и радиофизика. Однако непосредственное определение плотности распределения или характеристической функции выходной величины встречает значительные трудности.

В большинстве случаев можно воспользоваться такими статистическими характеристиками, как моменты или кумулянты. Одним из ограничений моментного и кумулянтного анализов является отсутствие достаточно развитых соответствующих средств в современных математических пакетах. С этой целью автором разрабатывается пакет программ для поиска аналитических решений нелинейного преобразования случайных величин.

В данной работе представлен полностью формализованный способ (алгоритм) получения аналитической записи начальных моментов через кумулянты. Метод основан на теории разбиения чисел, множеств и мультимножеств. Также уделено внимание вопросу упрощения аналитической записи совместных моментов при отсутствии статистической связи между случайными величинами.

Ключевые слова: момент, кумулянт, система компьютерной алгебры, теория вероятностей.

Abstract. Determination of the distribution of random variables, subject to the non-linear transformation is an important task in the fields of metrology, instrument-building, radio and radiophysics. However, the direct determination of the density distribution or characteristic function of the output variable has considerable difficulties.

In most cases, we can use statistical characteristics such as moments or cumulants. One of the limitations of the moment and cumulant analysis is the lack of sufficiently developed appropriate tools in modern mathematical packages. To this end, the author is working out a software package to find analytical solutions of the nonlinear transformation of random variables.

i Надоели баннеры? Вы всегда можете отключить рекламу.