Научная статья на тему 'Моделирование прогноза объема продаж при различных вариантах учета сезонности'

Моделирование прогноза объема продаж при различных вариантах учета сезонности Текст научной статьи по специальности «Математика»

CC BY
2737
307
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОБЛЕМЫ ПРОГНОЗИРОВАНИЯ / МЕТОДЫ ВЫЯВЛЕНИЯ СЕЗОННОСТИ / ПРОГНОЗИРОВАНИЕ ОБЪЕМОВ ПРОДАЖ / ОЦЕНКА ТОЧНОСТИ ПРОГНОЗА

Аннотация научной статьи по математике, автор научной работы — Тихонов Дмитрий Владимирович, Микитчук Михаил Юрьевич

В статье рассмотрены методы прогнозирования при различных вариантах учёта сезонности, проблемы прогнозирования, а также вопросы определения точности прогноза при прогнозировании объема продаж. Предложен алгоритм выбора методов и моделей прогнозирования в зависимости от качества исходных данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Моделирование прогноза объема продаж при различных вариантах учета сезонности»

МОДЕЛИРОВАНИЕ ПРОГНОЗА ОБЪЕМА ПРОДАЖ ПРИ РАЗЛИЧНЫХ

ВАРИАНТАХ УЧЕТА СЕЗОННОСТИ TURNOVER FORECASTINF MODELS USING DIFFERENT METHODS OF

COUNTING SEASONALITY

Тихонов Дмитрий Владимирович

к.э.н., доцент

Санкт-Петербургский политехнический университет Петра Великого

[email protected]

Микитчук Михаил Юрьевич

Магистрант

Санкт-Петербургский политехнический университет Петра Великого

mikitchukm@ gmail. com

АННОТАЦИЯ

В статье рассмотрены методы прогнозирования при различных вариантах учёта сезонности, проблемы прогнозирования, а также вопросы определения точности прогноза при прогнозировании объема продаж. Предложен алгоритм выбора методов и моделей прогнозирования в зависимости от качества исходных данных. ABSTRACT

The article considers forecasting methods in different types of seasonality, forecasting problems, as well as the issues of determining forecast accuracy in forecasting sales. The algorithm for the choice of methods and prediction models depending on the quality of the source data is proposed. КЛЮЧЕВЫЕ СЛОВА

проблемы прогнозирования, методы выявления сезонности, прогнозирование объемов продаж, оценка точности прогноза KEY WORDS

forecasting problems, forecast accuracy, detection of seasonality, sales forecasting ВВЕДЕНИЕ

Одним из самых важных условий принятия верных управленческих решений в производственных и торговых организациях является прогнозирование спроса. Этот

параметр влияет на процессы закупки, производства, планирования рабочего времени, логистику и т.д.

При этом в настоящее время многие компании пытаются найти собственные подходы к прогнозированию спроса, адаптируя известные статистические и математические модели, внедряя модули прогнозирования в системы управления проектами и производством.

Это обусловлено, в первую очередь, стремлением найти точки экономии на различных этапах производственного и торгового цикла (например, снизить стоимость запасов на складах, оптимизировать перевозки и пр.).

В данной статье авторы попробовали на основе реальных данных рассмотреть преимущества и недостатки прогнозных моделей определенного класса.

В данной работе будет рассмотрена ситуация, когда потребитель уже свершил действие - приобрёл товар (услугу). Соответственно будет использован анализ временных рядов - разбиение данных на такие составляющие, как тренд, цикл, сезон и случайные компоненты, которые в последующем сводятся для прогнозирования спроса. Акцент в работе будет сделан на различные методы исследования сезонности.

Говоря о сезонном товаре, чаще всего мы имеем дело со среднесрочным планированием: как правило, это год. К этому году необходимо подготовиться, зная когда, кому, где, по какой цене, в каком количестве, по какому поводу продавать товар. И, собственно, анализ сезонной компоненты поможет ответить на вопросы: когда и в каком количестве должна происходить реализация товара.

ВЫБОР И ОПИСАНИЕ МЕТОДОВ ПРОГНОЗИРОВАНИЯ

В зависимости от характера имеющихся данных, имеется возможность применять те или иные методы прогнозирования для данных содержащих сезонную компоненту. Схема алгоритма выбора метода прогнозирования представлена в приложении 1.

В данной схеме нас интересуют данные не кросс-секционные, содержащие тренд, имеющие сезонную компоненту, но при этом данные собраны менее, чем за 5 лет (как в нашем случае, за 3 года).

Среди рассматриваемых методов будут рассмотрены модели, использующие в своей основе нестационарные ряды:

1) метод абсолютных и относительных разниц;

2) метод фиктивных переменных;

3) центрированная скользящая средняя;

4) ряды Фурье;

5) метод census II (сезонная корректировка).

Поговорим подробнее о методах и рассмотрим их преимущества и недостатки. Следует отметить, что при построении моделей преимущество отдавалось мультипликативным моделям как наиболее наглядным. Метод абсолютных и относительных разниц.

Пусть каждый член ряда представляет собой xt, где x - число проданной продукции; i - порядковый номер в ряду. Средняя за все 3 года равна

X =-,

п

где х — средняя арифметическая, n - количество членов ряда.

Индекс сезонности (1сез), %, при условии, что i - месяц продажи, j - год продажи, m - количество лет (1,2,...m), п - количество месяцев

X j Xij

j _ m

ез1 % '

Абсолютные разницы дадут наглядное представление об отклонении

среднегодовой продажи за месяц i от средней за весь период (х) [1].

Метод скользящей средней.

Для определения коэффициента сезонности используются скользящие средние, а для построения прогноза - функции.

Когда идёт речь о годах и имеются данные помесячно, принято брать период скольжения, равный 12 месяцам

^ Л, - 1 + Л, - 2 + Л, - 3 + ... + Л, - п

Ft =-,

п

где Ft -прогноз на будущий период; Ац - фактические значения в прошлом периоде; А^2, А^3, А^п - фактические значения два периода назад, три периода назад и т.д. до п периодов назад; п - интервал (число периодов) усреднения [3]. Метод фиктивных переменных.

Обычно при использовании метода фиктивных переменных используют поквартальное планирования для укрупнения динамического ряда. Это объясняется построением данного метода. Он основан на построении матрицы с помощью функции

у( = а0 + а, + с2 Z 2 + с3 Z3 + с4 Z 4 + £, Ц если_ наблюдение_ принадлежи_ тг - мук_ варталу

где Z^ = 1 п

[ 0, в _ остальных_ случаях

ао, , с 2, С3, С4 - коэффициенты модели.

В приведённой функции первый квартал взят в качестве базисного. Его регрессионная модель будет иметь вид линейной функции

Уг = ао + а1'£ Остальные наблюдения имеют вид

уг = а0 + аг-Ь + с2,

Уг = ао + а1'£ + с3, Уг = а0 + аг • Ь + с4. Фиктивные переменные позволят оценить разницу в уровнях сезонности между эталонным кварталом и остальными [4]. Ряды Фурье.

Для начала расскажем, как происходит построение такой модели. Динамический

ряд описывается с помощью уравнения вида

т

Ут(1) = а + ^ (Ък • cos Ы + • sin Ы)

к=1

где a, b, d - коэффициенты, вычисленные по формулам, m - количество гармоник ряда (компонент ряда),

£Г=1 vt

а =-,

п

2^?=1Vrcoskti

bk =---,

n

_ 2 • Ef=i Vj • sin kti dk~ ñ ' где V - объём продаж по месяцам. Учитывая, что периодические колебания, в частности сезонные, регулярно повторяются, из года в год, можно взять n=12.

В работе рассматриваются две волны. В связи с этим приведём уравнение первой и второй гармоник соответственно

V1(t) = а + b± • cos t + • sin t, V2(t) = a + b± • cos t + • sin t + b2 • cos 2t + d2 • sin 21,

По своей природы ряды Фурье представляют собой описание ряда нестационарного. Ввиду этого рассчитывается с помощью одной из «функций» прирост за каждый месяц

tí • 4,7751 j ____

ai ~ у12 t Zj¿ = 1 Ч

Явный плюс данного метода: достаточно иметь лишь последний период для прогнозирования. Он же и минус: прогноз будет составлен по последнему периоду. Думается, что данный метод предполагает, в таком случае, использование неколичественных методов прогнозирования, как скажем, оценку экспертов Метод census II с последующим прогнозированием по экспоненциальной функции.

Метод census II относится к классу ARIMA - моделей. Данный метод осуществляет полную декомпозицию исследуемого динамического ряда на составляющие тренда

y = f (TC, S ,s),

где ТС - тренд-циклическая (конъюнктурная) компонента; S - сезонная компонента; s - случайная компонента.

После данного разложения в следующем этапе сглаживанию подвергается тренд-циклическая компонента. В результате получается прогноз на год вперёд. Данный прогноз корректируется на сезонную составляющую, и получается итоговый прогноз.

Уравнение для однократного экспоненциального сглаживания имеет следующий вид

Ft = Ft -1 + (Л, -1 - Ft -1),

где Ft - экспоненциально сглаженный прогноз на период 1;; Ft-l - экспоненциально сглаженный прогноз, сделанный для предшествующего периода; А^ - фактический спрос в предшествующем периоде; а - константа сглаживания. Константа а определяет уровень сглаживания и скорость реакции на разницу между прогнозами и текущими событиями.

Недостатком метода экспоненциального сглаживания является лаговый эффект. Прогноз запаздывает в периоды роста или падения спроса и превышает фактические значения при его уменьшении.

При двукратном экспоненциальном сглаживании для преодоления лагового эффекта вводится трендовая составляющая. Для этого необходим, помимо константы сглаживания а, иной регулятор, который бы реагировал на спад и рост -константу сглаживания тренда 5, которая уменьшает влияние ошибки, т.е. разности между действительным значением и прогнозируемым:

FITt = Е+Т,;

Е = Е1Т -1 + а - (Л, -1 - Е1Т -1);

Т, = Т, -1 + а- у - (Л, -1 - Е1Т, -1);

0 < а <1;0 <у <1, где FITt - прогноз, включающий тренд в периоде 1; Ft - экспоненциально сглаженный прогноз на период 1; ^ - экспоненциально сглаженный тренд на период 1; FITt-1 - прогноз, включающий тренд предыдущего периода; А^ -фактический спрос в предыдущем периоде; а - константа сглаживания прогноза в конце каждого периода; у - константа сглаживания среднего роста тренда в конце каждого периода [6].

Возвращаясь к значениям констант, отметим, что выбор значения константы зависит от стабильности спроса и от скорости его изменения. Чем выше темп роста, тем выше должна быть скорость реагирования.

Отметим, что расчёты метода census II сложны. Довольно просто заметить, что на сегодняшний день ARIMA модели - передовые модели в области прогнозирования. И принципы, вложенные в проектирование данных моделей лучше реализовать с помощью специальных пакетов прикладных программ.

ОЦЕНКА СЕЗОННОСТИ И ПРОГНОЗИРОВАНИЕ

Данные, предоставленные компанией для исследования - реальны, наименование организации, а также наименование производимой продукции останутся безымянными в виде объектов var_1 и var_166.

Данные, по которым будет строиться прогноз с выявлением сезонной компонентой, представляют собой объёмы продаж в натуральном выражении за период с 2010 по 2013 гг. (рис.1-2). Следует отметить, что для прогноза необходим период хотя бы в 3 года. Ввиду этого данные 2013 года в построении прогнозных моделей задействованы не будут. Они выступят в качестве проверки полученных по моделям прогнозных значений на соответствие с фактическими данными.

месяцы, (янв 2010г. - 1)

Рис. 1. Динамика объёмов продаж по var_1

Рис. 2. Динамика объёмов продаж по var_166

Перед тем, как приступить к прогнозированию, необходимо идентифицировать выбросы. Выбросы - (нетипичные значения) элементы совокупности (выборки), значительно отличающиеся от остальных по изучаемому признаку. Здесь мы не будем останавливаться на проведенных расчетах по выявлению выбросов и их корректировке/замене. Отметим, что это тема для отдельной статьи, а в данном случае основная сложность заключалась в работе с переменной, не поддающейся нормализации.

Далее было осуществлен полный цикл расчетов по каждому методу для получения прогноза.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В качестве примера приведем примеры нескольких полученных моделей и их графического представления.

По методу центрированной скользящей средней уравнение трендовой компоненты имеет вид

18 000 000

16 000 000

14 000 000

12 000 000

10 000 000

8 000 000

6 000 000

4 000 000

2 000 000

0

-2 000 000

-4 000 000

1 3 5 7 9 11 13 15 17 19 21 23 25 27

Л /\/

29 31 33 35

месяцы, (янв 2010г. - 1)

Исходный ряд

Тренд

случайные значения

Рис. 3. Исходный ряд с сезонной компонентой, тренд, случайная компонента Модель для переменной var_1 с помощью метода фиктивных переменных имеет

вид

50 000 000

45 000 000

40 000 000

35 000 000

30 000 000

25 000 000

20 000 000

15 000 000

10 000 000

5 000 000

0

Факт

12

квартал(1-й - квартал 2010г.)

И Прогноз

Рис. 4. Прогноз методом фиктивных переменных, var_1

Функция с одной гармоникой, полученная с помощью рядов Фурье, будет иметь

вид

0

4

8

Функция с двойной гармоникой

18 000 000 16 000 000 14 000 000 12 000 000 10 000 000 8 000 000 6 000 000 4 000 000 2 000 000 0

0 1 2 3 4 5 6 -ф—V1(t) Гарм_1

7 8 9 10 11 12 13 14

месяц, 2013 год VI 2012

Рис. 5. Сглаженный ряд функцией с одной гармоникой

Рис. 6. Экспоненциальное сглаживание с прогнозом по методу census 2

ОЦЕНКА ТОЧНОСТИ ПРОНОЗА

Можно осуществлять оценку качества прогноза посредством сопоставления фактических и прогнозных значений, если имеются такие данные. Сопоставление можно осуществить с помощью коэффициента расхождения, числителем которого

является среднеквадратическая ошибка прогноза, а знаменатель равен квадратному корню из среднего квадрата фактических данных:

^(р-4)2 ■«

и _ 4) ■» " ЖА) ,

где Рг и Аг - соответственно предсказанное и фактическое (реализованное) изменения переменной.

Соответственно, коэффициент точности будет выглядеть как:

к = 1 — V.

Рассчитаем в качестве примера для одного из методов и сведем в таблицы. Таблица 1 - Оценка точности прогноза с использованием коэффициента расхождения для метода прогнозирования абсолютных относительных разниц для var 1

Период/ показатель Факт 2013 Прогноз 2013 Корень квадрата разности (109) квадрат фактических значений 109)

Январь 6 652 290 7 389 000 543 44 253

февраль 10 151 160 9 481 624 448 103 046

Март 11 697 575 11 688 920 0 136 833

Апрель 13 528 870 11 713 123 3 297 183 030

Май 15 674 415 15 337 891 113 245 687

Июнь 17 603 000 17 830 014 52 309 866

Сумма 66.73 1011.29

Ошибка 0.0660

Точность 0.9340

Таблица 2 - оценка точности прогноза с использованием коэффициента расхождения для метода прогнозирования абсолютных относительных разниц var 166

Корень квадрат

Период/ Факт Прогноз квадрата фактических

показатель 2013 2013 разности значений

(109) 109)

Январь 155 182 714 23 963

Февраль 451 314 18 881 203 581

Март 97 408 96 968 9 390

апрель 3 314 1 167 4 609 486 10 985 579

май 5 764 2 441 11 044 595 33 222 428

июнь 5 960 5 607 124 783 35 523 150

Сумма 3 987 8 942

Ошибка 0.4458

Точность 0.5542

Аналогично сформируем и таблицы для других методов и сведём полученные данные в таблицы 3,4

Таблица 3 - Выбор модели по точности прогноза для var_1

Метод Точность прогноза 1-(Ф- П)/Ф, % Статистическая точность прогноза, %

абсолютных

относительных 94.23 93.4

разниц

скользящая средняя 92.3 93.35

фиктивные переменные 87.08 87.02

ряды фурье 82.52 84.26

census II 93.57 93.55

Таблица 4 - Выбор модели по точности прогноза для var_166

Метод Точность прогноза 1-(Ф- П)/Ф, % Статистическая точность прогноза, %

абсолютных относительных разниц 28.82 55.41

скользящая средняя 48.16 57.42

ряды фурье 25.77 44.67

census 2 53.66 65.25

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ОСНОВНЫЕ ВЫВОДЫ

В ходе данной работы было осуществлено прогнозирование пятью разными методами. Особенность данных методов в том, что они способны давать прогноз по рядам, содержащим сезонную компоненту. Оказалось, что во всех методах при прогнозе по ряду с нестабильным спросом и сложными выбросами (var_166) можно принимать лишь управленческие решения ввиду статистической незначимости коэффициентов уравнения. Также это подтвердилось и средней величиной точности прогноза, где наибольшая точность прогноза и статистическая точность прогноза равны 54% и 65% соответственно. В то время как у продукта со стабильным спросом и ярко выраженной сезонностью (var_1) со статистически значимыми моделями для прогнозирования такая точность составляет по 94%. Это подтверждается не одним методом.

В ходе сопоставления моделей оказалось, что не всегда лучший метод по статистической оценке является действительно лучшим. С точки зрения эффективности использования ресурсов, в частности денежных при хранении перепроизведённой продукции или при неудовлетворении избыточного спроса, то более убыточным оказался метод абсолютных и относительных разниц. Хоть он чуть точнее метода census II, второй метод менее убыточен. Различия могли оказаться и куда более большими, в данном случае между методом абсолютных разностей и census II различие невелики: точность метода и статистическая точность отличаются соответственно на 0.7% и на 0.15%.

Таким образом, лучшим методом следует признать метод класса ARIMA моделей census II.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Бессонов, В. А., Петроневич, А. В. Сезонная корректировка как источник ложных сигналов: Нац. исслед. ун-т «Высшая школа экономики» // Изд. дом Высшей школы экономики. 2013. URL: http://www.hse.ru/data/2014/01/13/1340864201/HSE2013-4.pdf

2. Бушуева Л.И. Маркетинг в России и за рубежом [Электронный ресурс] // Методы прогнозирования объема продаж: URL: http://dis.ru/library/531/21984/.

3. Куприенко Н.В., Пономарёва О.А., Тихонов Д.В. Статистика. Анализ рядов динамики: учебное пособие. - СПб.: Изд-во Политехн. ун-та, 2015, 115 с.

4. Маринов В. П. Анализ сезонных колебаний [Электронный ресурс] // Индекс сезонности. Метод абсолютных относительных разниц: URL: http://helpstat.ru/2012/02/analiz-sezonnyih-kolebaniy-indeks-sezonnosti-metod-absolyutnyih-i-otnositelnyih-raznostey/.

5. Burke S. Missing values, Outliers, Robust statistics and Non Parametric methods. VAM Bulletin, 1998, Autumn, p. 22 - 27

6. Holt-Winters. Time series Forecasting using Exponential Smoothing. Kanwal Rekhi School of Information Technology Under the guidance of Prof. Bernard, 2004, p. 2 - 4.

Приложение 1

Алгоритм выбора метода прогнозирования

Выбор метода прогнозирования

Объём совокупности > 15

да

Многофакторные регрессионные модели

Данные относятся к кросс-секционным?

Данные содержат трендовую компоненту?

-да-

Объём данных > 10 лет

Однофакторные регрессионные модели

Да

Объём данных > 10 лет

Прогноз оперативный

Наивные методы

Содержат сезонную компоненту?

Наивные методы

АКМА(АШМА) модели

Экспоненциальное сглаживание

Данных больше, чем за 5 лет

Скользящие средние

Метод Хольта

Трендовые модели

Авторегрессионные модели

Да

АШМА модели

Да

Метод фиктивных переменных

Метод Винтерса

Метод фиктивных переменных

Ряды Фурье

АШМА модели

Центрированные скользящие средние

Метод абсолютных и относительных разниц

Модели_

Сезонной декомпозиции

Трендовые модели

Метод Хольта

Авто регрессионные модели

краткосрочный

Объём данных более, чем за 7 лет

Да

Объём данных наблюдений > 100

Сезонная корректи

ровка (СепзиБ II)

Трендовые модели

Наивные методы

Метод Хольта

Нейросетевые модели

Невозможно осуществить прогноз с помощью качественных методов

Авторегрессионные модели

АШМА модели

i Надоели баннеры? Вы всегда можете отключить рекламу.