Научная статья на тему 'Построение модели авторегрессии и проинтегрированного скользящего среднего для прогнозирования количества звонков с использованием пакета Statistica 6'

Построение модели авторегрессии и проинтегрированного скользящего среднего для прогнозирования количества звонков с использованием пакета Statistica 6 Текст научной статьи по специальности «Математика»

CC BY
769
88
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Пасмарнова Наталья Сергеевна

Рассмотрено построение модели авторегрессии и проинтегрированного скользящего среднего в статистическом пакете STATISTICA 6 для процесса поступления звонков в центр обработки вызовов. Построен прогноз количества поступающих звонков на последующие 7 дней. Проведена оценка адекватности полученной модели.I

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n this article we describe autoregressive integrated moving average (ARIMA) model building for the process of call arrivals in a call center with use of statistical software package STATISTICA 6. We build a seven-days-ahead forecast of the number of incoming calls. We evaluated the adequacy of the received model.

Текст научной работы на тему «Построение модели авторегрессии и проинтегрированного скользящего среднего для прогнозирования количества звонков с использованием пакета Statistica 6»

на износостойкость, усталостную прочность, а также контактную и коррозионную стойкость.

Список литературы

1. Скрябин, В. А. Основы процесса субмикрорезания при обработке деталей незакрепленным абразивом / В. А. Скрябин. - Пенза : Изд-во ПВАИУ, 1992. - 120 с.

2. Мартынов, А. Н. Основы метода обработки деталей свободным абразивом, уплотненным инерционными силами / А. Н. Мартынов. - Саратов : Изд-во Сарат. гос. техн. ун-та, 1981. - 212 с.

3. Тарабрин, Г. В. К теории дислокационного упрочнения в процессе обработки деталей уплотненным абразивом / Г. В. Тарабрин, В. Д. Кревчик, В. А. Скрябин // Известия высших учебных заведений. Технические науки. Поволжский регион. -2007. - № 1. - С. 135-139.

УДК 004.67:311

ПОСТРОЕНИЕ МОДЕЛИ АВТОРЕГРЕССИИ И ПРОИНТЕГРИРОВАННОГО СКОЛЬЗЯЩЕГО СРЕДНЕГО ДЛЯ ПРОГНОЗИРОВАНИЯ КОЛИЧЕСТВА ЗВОНКОВ С ИСПОЛЬЗОВАНИЕМ ПАКЕТА STATISTICA 6

Н. С. Пасмарнова

Рассмотрено построение модели авторегрессии и проинтегрированного скользящего среднего в статистическом пакете STATISTICA 6 для процесса поступления звонков в центр обработки вызовов. Построен прогноз количества поступающих звонков на последующие 7 дней. Проведена оценка адекватности полученной модели.

In this article we describe autoregressive integrated moving average (ARIMA) model building for the process of call arrivals in a call center with use of statistical software package STATISTICA 6. We build a seven-days-ahead forecast of the number of incoming calls. We evaluated the adequacy of the received model.

STATISTICA 6 - это современный пакет статистического анализа, в котором реализованы основные математические методы и функции для статистической обработки данных. Пакет предоставляет возможность построения модели авторегрессии и проинтегрированного скользящего среднего (АРПСС). В данной работе модель АРПСС используется для решения задачи прогнозирования количества звонков, поступающих в центр обработки вызовов телекоммуникационной компании. Задача такого прогнозирования крайне важна для компаний, ежедневно принимающих тысячи вызовов от клиентов, ведь по составленному прогнозу определяется штатное расписание операторов call-центров.

Применение модели АРПСС (p, d, q) (Ps, Ds, Qs) Бокса-Дженкинса обосновано тем, что это одна из наиболее эффективных моделей для прогнозирования. Модель широко применяется в самых разнообразных предметных

областях [1-3]. Параметрами АРПСС являются: p - порядок авторегрессии, d - порядок конечной разности, q - порядок скользящего среднего, Ps - сезонный параметр авторегрессии, Ds - сезонная конечная разность, Qs - сезонный параметр скользящего среднего [4, 5].

Итак, приступим к построению модели. График исходного временного ряда представлен на рис. 1. По оси абсцисс отложены даты (с апреля по сентябрь 2011 г.), по оси ординат - количество звонков, поступающих в каждый конкретный день.

Lire Plot (данные.sta 10v*ia0c)

аоооз —,—,—,—,—,—,—,—,—,—,—,—,—,—,—,—,—,—,—,—,—,—,—

700ЭЭ

его:»

—■—■—■—■—■—■—■—■—■—■—■—■—■—■—■—■—■—■—■—■—■—■—

01.0+ 27.34 23. ОЕ- 10.00 14.07 38.-3в 0+.ЗЭ

14.0+ 1Э.35 05.00 01.37 27.37 22.3В -7.:.;

Рис. 1. График исходного временного ряда

Как видно из рис. 1, наблюдается несколько выбросов, обусловленных случайной составляющей временного ряда. С помощью сезонной декомпозиции определим нерегулярную составляющую ряда. Она выглядит следующим образом (рис. 2).

Plot of variable: VAR1 Irregular ramp. ia==sL>r=~.:

23 +з 63 ез юз i+з 100 1аз гго

Саве Numbers

Рис. 2. Случайная составляющая временного ряда

Теперь очистим исходный ряд от случайной составляющей, проведя преобразование «вычитание рядов». Получив очищенный ряд, построим модель АРПСС.

Вначале определим сезонный лаг с помощью спектрального анализа Фурье. Для этого построим график периодограммы (рис. 3).

Рис. 3. График периодограммы

На графике (рис. 1) четко выделен пик в точке 7. Данный пик определяет основной период сезонной компоненты нашего ряда.

Далее проведем исследование автокорреляционной и частной автокорреляционной функции очищенной переменной (рис. 4). Они показывают, что наш ряд не является стационарным.

Рис. 4. Графики автокорреляционной и частной автокорреляционной функции очищенного ряда

Также на данных графиках ярко выражена сезонность с периодом 7. Для того чтобы приблизить наш ряд к стационарному, перейдем к первой разности нашего ряда ^ = 1). Преобразованный ряд изображен на рис. 5.

Рис. 5. График преобразованного ряда

Теперь каждый член преобразованного ряда равен разностям между соседними членами очищенного ряда. Посмотрим на графики автокорреляционной и частной автокорреляционной функции преобразованного ряда (рис. 6).

Р=г[Ы Аи[осогге1э[юп ВлсЬоп

_ _ еггог;____ е АР. он

с;--

2Г 01 к- - ■

i5 о гг. 116 , 0 е. 47

375 1 0 47

з - 123 , 0 47

i 221 ,0 47

5 5с5 ,0 47

6 ,0 411

+ 370 ,0 47

+ 075 ,0 47

014 1 о 47

1с 03в ,0 47

11 С 25 ,0 47

12: с ее »0 47

13 250 , 0 47

14 + 051 ,0 47

15 + 072 ,0 47

16 + с 65 ,0 4г

17 + 074 1 0 47

1: + с13 #о 47

1е- + с 77 , 0 47

го с 77 ,0 47

21 + ::: ,0 47

+ 070 ,0 47

23 + 0в7 ,0 47

24: 000 , 0 47

25 + 025 1 о 47

26 035 ,0 47

с 53 ,0 47

021 »0 47

054 , 0 47

30 + 002 ,0 4г 0

---Сзг". _тИ

Рис. 6. Графики автокорреляционной и частной автокорреляционной функции преобразованного ряда

Как видно, после взятия разности исчезла корреляция не только на лаге 1, но также на большинстве других лагов, так как автокорреляции для последовательных лагов взаимозависимы.

Данные графики говорят о том, что наш ряд близок к стационарному, но у автокорреляции остались сезонные всплески с периодом, равным 7. Для того чтобы удалить их, возьмем разность от переменной с первой разностью с лагом 7. Теперь графики автокорреляционной и частной автокорреляционной функции показаны на рис. 7.

Autocorrelation Fl notion VAR1 : x-VARI {transf.); D{-1); [>{-7} (Standard errors are while-noise estimates)

Corr. -,323

-, oeo

+, 023 07 В t,»S +#0B4 45B +, OB 6 025 +, 015 +, 0B3 -,163 +,114 +, 031 +, 012 f, 005 +, 050

-, 046 +, 042 -, 055 -,032 +, 030 -, 052 +, 013 -. C£5

»756 ,0754 ,0751 ,0745 , 0747 , 0745 ,0743 ,0740 , 0735 , 0736 ,0733 ,0731 ,0725

,0713 ,0710 , 070E ,0706 ,0703 ,0701 , 0655 , 0656 , 0654 , 0651 ,06:5

Y//////S//s

1=?31 ,0000 Lag :стг. 323 S.E. , 0762

15 44 ,0001 £06 , 0762

15 53 ,0002 3 С , 0762

20 62 ,ССС4 4: lie , 0762

24 42 , 0002 5 076 , 0762

25 70 , 0003 6 172 , 0762

63 71 ,0000 4С4 , 0762

65 06 ,0000 265 , 0762

65 ,0000 150 , 0762

65 ,0000 10 105 , 0762

66 ,0000 11 030 , 0762

71 ,0000 12 , 0762

73 ,0000 13 + Iii , 0762

74 17 ,0000 14 152 , 0762

74 20 ,0000 15 150 , 0762

74 20 ,0000 16 141 , 0762

74 65 ,0000 17 + 055 , 0762

76 56 ,0000 15 03В , 0762

50 30 , со ОС 15 + 0 ЕЁ , 0762

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

SO 56 ,0000 20 + 15Е , 0762

во ,0000 21 + 001 , 0762

S1 33 ,0000 + 002 , 0762

S2 С4 ,0000 23 •Г" , 0762

52 , 0000 24 :: , 0762

52 43 ,0000 25 030 , 0762

53 50 ,0000 26 036 , 0762

53 54 ,0000 С 74 , 0762

55 65 ,0000 240 , 0762

65 74 ,0000 0-25 , 0762

7В ,0000 30 - 134 , 0762

Partial Autocorrelation Functran VAR1 : X-VAR1 {transf.}; D{-1>; D{-7} (Standard errors- assume AR order of fc-1)

F7777]

Гууу]

---Conf. Limit

---Conf. Limit

Рис. 7. Графики автокорреляционной и частной автокорреляционной функции разности преобразованного ряда с лагом 7

Большинство сильных автокорреляций теперь удалено. Хотя еще остались автокорреляции, большие двух стандартных ошибок, не нужно брать еще разности ряда, так как они могут исключить эффект скользящего среднего.

Из графиков видно, что полученные преобразования свели наш ряд к близкому стационарному ряду, и ряд готов для анализа с помощью АРПСС. Будем оценивать два параметра скользящего среднего модели АРПСС: один сезонный (Qs) и один несезонный (д). Параметры авторегрессии отсутствуют в модели. При таком количестве параметров в модели все переменные существенны. Это означает, что модель (0, 1, 1), (0, 1, 1) пригодна для практического использования. Конечная модель представлена на рис. 8.

F1 а га m et. Input: VAR1 : X-VAR1 (transf.) (данные-Sta) Transformations: D(1),D(7) Model:(0.1,1)(0,1,1) Seasonal lag: 7 MS Residual=5161E4

Param. Asympt. Std.Err. Asympt. tf 170) P Lower 95% Conf Upper 95% Conf

q(1) 0.507168 0.068031 7.45492 0.000000 0.372873 0.641463

Qs(1) 0.703214 0:056401 12.46801 0.000000 0.591876 0.814551

Рис. 8. Оценки параметров полученной модели

После нахождения значимой модели можно построить прогноз на 7 дней вперед.

Как показывает график (рис. 9), построенная модель весьма разумно прогнозирует ряд.

Теперь необходимо определить, насколько адекватно построена наша модель. Существует два стандартных метода анализа адекватности модели прогнозирования:

1. Визуальный анализ со сдвигом прогноза на несколько шагов назад. Приведем анализ прогноза со смещением на 7 дней назад (рис. 10).

Рис. 9. График прогноза на 7 последующих дней

Рис. 10. Визуальный анализ со сдвигом прогноза на 7 дней назад

Как видно, мы смогли довольно точно определить не только тенденцию, но и сами значения.

2. Анализ остатков. Имеются два предположения модели АРПСС:

1) остатки нормально распределены;

2) остатки независимы друг от друга, т. е. между ними нет остаточной корреляции.

Предположение о нормальности остатков может быть проверено с помощью гистограммы остатков, показанной ниже. Как видно, гистограмма подтверждает предположение о нормальности остатков (рис. 11).

Histogram: variable: VAR' X-VAR1 {transi.}; AR I MA p. 1,1>(-3,1,1) readiEfe; - Expected Normal

i

»

m

ж

■ J

Шк

-39000 -29000 -16300 -5000 8000 15000 25033 35333 45333 -3-3333 -23333 -10033 3 10(333 23333 33333 ФЗЗЗЗ

ШррЕГ Воигйагге= [х<=Ьош[к1агу)

Рис. 11. Гистограмма остатков

Теперь рассмотрим выполнение второго предположения АРПСС -остатки независимы друг от друга. Независимость остатков можно проверить с помощью графика автокорреляционной и частной автокорреляционной функции (рис. 12).

Partial Autocorrelation Fürtet ion : x-VARI {transi.); ARIMA (0.1. 1>{0. t. 1) resläuats: (Standard errors assume AR ordsr of k-1)

Lag Corr. S.Z.

1 , C'C'l ,07 62

, CSS , 07 62

з 022 , 07 62

4 > 020 »07 62

5 ,03-2 , 07 62

6 ,055 , 07 62

7 ,045 ,07 62

a 127 ,07 62

•Ii 4 ,07 62

10 , 058 ,07 62

1.1 ,065 ,07 62

1.2 ,031 ,07 62

1.3 ,11.2 ,07 62

14 ,053 ,07 62

15 ,053 ,07 62

16 , 007 ,07 62

17 ,155 ,07 62

Lfi

1.5 ,124 ,07 62

£0 , С 25 ,07 62

21 ,007 ,07 62

CEC ,07 62

£3 CS" ,07 62

£4 с: 4 ,07 62

,016 ,07 62

26 ,073 ,07 62

,070 ,07 62

£fi , OB 7 ,07 62

С: с ,07 62

3C ,005 ,07 62

Рис. 12. График автокорреляционной и частной автокорреляционной функции

Из графиков видно, что остатки не коррелированны друг с другом. Полученные результаты подтверждают адекватность построенной модели. Значит, по модели АРПСС (0,1,1), (0,1,1) можно достаточно точно строить прогнозы.

Список литературы

1. Большаков, П. С. Прогнозирование индекса цен алмазов в системе STATISTICA 5.5 / П. С. Большаков // StatSoft Russia Technical support department. - URL: http://www.statsoft.ru/home/portal/applications/ForecastingAdvisor/Examples/Example1.htm

2. Большаков, П. С. Прогнозирование индекса реального объема сельскохозяйственного производства в Российской Федерации в системе STATISTICA 6 / П. С. Большаков // StatSoft Russia Technical support department. - URL: http://www.statsoft.ru/home/portal/applications/ForecastingAdvisor/Examples/Example 2.htm

3. Исследование данных об авиаперевозках. - URL: http://www.statsoft.ru/statportal/ tabID_71/MId_330/ModeID_0/PageID_99/DesktopDefault.aspx

4. Айвазян, С. А. Прикладная статистика и основы эконометрики : учебник для вузов / С. А. Айвазян, В. С. Мхитарян. - М. : ЮНИТИ, 1998. - 1022 с.

5. Боровиков, В. П. Прогнозирование в системе STATISTICA в среде Windows. Основы теории и интенсивная практика на компьютере : учеб. пособие / В. П. Боровиков, Г. И. Ивченко. - М. : Финансы и статистика, 2000. - 384 с.

УДК 629.113

МУЛЬТИПЛЕКСНАЯ СИСТЕМА АВТОМОБИЛЬНОГО ТРЕНАЖЕРА

А. М. Савельев

Рассмотрена реализация мультиплексной системы комплексного автомобильного тренажера. Представлены результаты разработки мультиплексной системы на основе протокола CAN 2.0.

Is considered the implementation of an integrated multiplex system in the advanced driving simulator. Is presented the results of the development of multiplex systems based on protocol CAN 2.0.

В настоящее время датчики и исполнительные устройства систем управления агрегатами автомобиля подключаются к электронному блоку управления (ЭБУ) с помощью жгутов проводов. Однако с увеличением числа электронных систем управления возрастает количество датчиков и исполнительных механизмов. Соответственно растет и число соединительных проводов, что помимо всего прочего ведет к уменьшению надежности, увеличению массы автомобиля, ухудшению диагностики. Эффективным средством сокращения числа жгутов и повышения надежности является мультиплексная связь.

Комплексный автомобильный тренажер (КАТ) по своей информационной емкости [1] приближается к современному автомобилю. Поэтому целесообразно использовать мультиплексную систему и в тренажере. Учитывая однотипность большинства узлов тренажера и автомобиля, будет целесообразно в качестве протокола, регламентирующего работу мультиплексной системы КАТ, выбрать один из протоколов, используемых для организации мультиплексных систем в автомобилях.

Оптимальной архитектурой для передачи управляющих сигналов по мультиплексным сетям будет система, основанная на топологической схеме «шина», с децентрализованным доступом к сети. В некоторых случаях возможно функционирование узлов по заранее определенному расписанию, но этот метод накладывает свои ограничения на возможные скорости и расстоя-

i Надоели баннеры? Вы всегда можете отключить рекламу.