УДК 519.86
Ю. И. Д и м и т р и е н к о, О. Ю. Д и м и т р и е н к о
ПРОГНОЗИРОВАНИЕ ДИНАМИКИ МАССОВЫХ ПРОДАЖ НА ОСНОВЕ МОДЕЛИ ЖЕСТКИХ КЛАСТЕРОВ ПОКУПАТЕЛЕЙ
На основе методов механики многомерных континуумов разработана модель жесткого кластера для прогнозирования динамики массовых продаж группы продавцов с учетом перехода покупателей от одного продавца к другому. Показано, что модель жесткого кластера обеспечивает лучшую точность прогнозирования по сравнению с моделями, основанными на методах наименьших квадратов, кубических сплайнов и спектральных методах.
E-mail: [email protected]
Ключевые слова: математика в экономике, механика многомерных сплошных
сред, модель жесткого кластера, прогнозирование динамики продаж.
В настоящее время для моделирования динамики микро-и макроэкономических процессов активно применяют методы нелинейной динамики, основанные на анализе особенностей решения систем обыкновенных дифференциальных уравнений [1]. Значительную трудность для этих методов представляют системы с большим числом участников, поскольку детальный анализ таких систем приводит к необходимости анализа систем уравнений очень большой размерности (тысячи и более), а также к необходимости вводить значительное число допущений относительно характера взаимодействия участников между собой. Для преодоления указанных трудностей обычно вводят (часто неявным образом) основное допущение об однотипном поведении всех участников системы и отсутствии взаимодействия их между собой. В этом случае задача моделирования динамики системы с большим числом участников сводится к задаче динамики одного типичного представителя системы. В качестве примера можно привести задачу о моделировании динамики массовых продаж на рынке с одним или двумя продавцами и большим числом покупателей [2, 3]. Как правило, эту задачу сводят к анализу динамики взаимодействия продавца и одного типичного покупателя. Фактически, к такому же результату приводят многочисленные статистические методы экономического анализа.
В работах [4-7] был предложен новый подход к динамическим задачам с большим числом участников. Для моделирования поведения большого числа покупателей на рынке массовых продаж продавца было предложено использовать методы механики многомерных сплошных сред. С помощью этих методов была разработана модель жестких кластеров, которая применялась для прогнозирования динамики поведе-
ния покупателей на рынке продаж продавца в различные моменты времени. Целью настоящей работы является применение этой модели для прогнозирования динамики продаж продавца и сравнение модели жестких кластеров с другими математическими методами, используемыми для подобных задач.
Основные положения модели многомерных сплошных сред в экономике. Согласно [4], рассматривается рынок массовых продаж продавца, реализующего номенклатуру из п товаров для большого числа N покупателей N >> 1). Для моделирования рынка вводится п-мерное Евклидово пространство Еп товаров, в котором координаты х1 каждой точки определяются как суммарное количество /-го товара, покупаемого или планируемого к покупке одним покупателем за время г, где / = 1, ..., п. Каждому отдельному покупателю в пространстве товаров Еп в момент времени г сопоставляется точка х = (х1 ... хп), а совокупности из N покупателей - множество точек в этом пространстве (группа единичных экономических агентов или экономический кластер). Поскольку N >> 1, то осуществляется переход к пределу - для каждого кластера вводится континуальная область V в пространстве Еп.
Введем закон накопления покупок отдельным покупателем: х = х(Х:, г), где х = х: е , е. — Декартов базис, х: — Декартовы (Эйлеровы) координаты точки, X1 — Лагранжевы координаты покупателя. Полагая функции х = х (X., г) дифференцируемыми, стандартным образом [8]
дх (X7, г)
введем локальные векторы базиса г = —-—:—1, вектор частоты поку-
дХ1
дх (Х:, г) ^ д
пок V = —--1, gi. = г - г. — метрическую матрицу и \ = г1 —- —
дг : 1 7 дХ1
набла-оператор. В пространстве Еп объем V параллелепипеда на векторах ах ... ап определим как V = Р(ах...ап) = ^ен г а1^...а1п, где а^ ... —
компоненты векторов ах ... ак в базисе гк, е. . — п-мерные символы Леви-Чивиты [7], g = giJ.; ориентированную площадку
введем как пХ = Р(ах...ап_х) = ^ен 1 а^.л1^г1п, а обобщенное векторное произведение векторов определим как а1 ха2 = Р(а1а2) = = ; а\а\тн ®... ® г1п — тензор (п - 2) ранга, где ® — знак операции тензорного умножения [8].
Будем полагать возможным существование нескольких таких продавцов с массовыми продажами, будем обозначать их индексом я = 1 ... 5. Для каждого из продавцов можно ввести свое пространство
товаров Еп различной размерности п, свои векторы накопления по-
дх (X' ¿)
купок хя = х^(ХД ¿), векторы частот V = —^^— и др-
Для кластеров V покупателей в рамках развиваемой модели введем следующие аксиомы: 1) общее количество покупателей М входящих в кластер V в пространстве Е 5-го продавца может изменяться только за счет перехода части покупателей в кластер Vp в пространстве Еп р-го продавца, описываемого скоростью перехода 2) изменение средней частоты покупок V в кластере V5 определяется суммарным вектором£ внешних экономических воздействий, вектором экономических взаимодействий с другими кластерами я-го продавца, а также вектором ряр — переноса товарного импульса (скорости изменения частоты покупок) при переходе покупателей от я-го к р-му продавцу; 3) изменение тензора момента частоты покупок кластера п-2тя определяется суммарными моментами внешних экономических воздействий п-2и и и моментом переноса товарного импульса п-2п :
' ' М=7- ■ " (1)
ш
= £ + £') + р яр, (2)
I, = | psхя ® хяdV = I'в'„® в'г (3)
V
Используя континуальное представление кластеров покупателей, эти уравнения можно записать в интегральной форме:
ш
d | P.dV = У., (4)
d | Р .v.dV = | pfdV + | f() dZ +1 PpdV, (5)
dt V V Z V
d
Ш I Р х5 х V,ШУ = | р!, х5 х Iшу + | х х £1)Ш2 + | xs х р^. (6)
Ш V V Ъ V
я я я я
Здесь введены: = ШМ / dV - плотность кластера (количество покупателей в локальной группе dVs), £ = Ш// ШМ — вектор плотности
внешних экономических воздействий, £1) = 1) / ШЪ — вектор напряжений (вектор плотности экономических взаимодействий с другими кластерами я-го продавца), ряр = Ш ряр / ШМ — вектор плотности переноса товарного импульса.
Модель жесткого кластера. Введем модель жесткого кластера в пространстве Еп подобно тому, как это было сделано в [4] для кластеров без перехода покупателей. Закон накопления покупок для покупателей жесткого кластера линейным образом отличается от закона
накопления х*0( типового покупателя кластера: х^ = х0 ) + О 5 (^) • х8' , где О* — ортогональный тензор, х8' = X* ег — локальный радиус-вектор точек, е'= О* • е1 — подвижный базис, движущийся вместе с кластером. Покупки в жестком кластере покупатели совершают согласованно: если какой-либо покупатель увеличивает частоту покупок по сравнению с типовым покупателем, то некоторый другой покупатель из кластера уменьшает частоту покупок. Вектор частоты покупок жесткого кластера удовлетворяет п-мерной формуле Эйлера:
= + хс8 • Ws, где Ws = О* • О, — кососимметричный тензор вращения кластера, а хс8 = х8 - х0 и = X0. Подставляя эту формулу в (5) и (6), получаем систему уравнений, описывающую движение кластера:
^ (7)
=/+/')+р *р, (8)
му = / + /о). = ж Л 7
| О, + w, • О* = о. (ю)
Здесь I* — тензор моментов инерции многомерного кластера, а также введены обозначения для моментов внешних экономических воздействий относительно типового покупателя кластера:
I, = f р, xs ® xsdV = I,i e 'Sl ® e , n-2 = f Ps xs x fdV,
V, V,
n-2 = J x x /(Ш, n-2 =f xs x ppdV.
Уравнение (9) можно представить следующим образом: I, • + W/ • I* = I, • Ws • W,т - W, • W,т • I, + ц, + ц« + П„, (12)
где W ^ — производная Яуманна [8], а также введены моменты — тензоры 2-го ранга
=J Ps(^ ® fs)KdV, ^) = J (^ ® f;>)KdS,
Vs f * (13)
П„ = J (X ® p„)KdV,
здесь (xs ® fs)^ = xs ® f - fs ® xs — операция кососимметрирования.
Модель внешних экономических воздействий. Для плотности внешних экономических воздействий, следуя [4], введем следующую
модель: f = dhs-, где hs = hs 0(1 + Asesrs) — вектор частоты приобретения s dt
товара покупателем для непосредственного потребления, hs0 = const — значение вектора в стабильном процессе, e(t) — финансовый индикатор нестабильного процесса (заданная функция). Стабильный процесс означает отсутствие кризисных явлений. Из (8) следует, что центр масс
кластера в стабильном процессе при отсутствии векторов f1), psp совершает равномерное прямолинейное движение в E .
Рис. 1. Динамика центра масс кластера (t. - моменты времени)
Сравнение с экспериментальными данными. Разработанная модель была применена для анализа экспериментальных данных рынка продаж on-line магазина по пяти ценовым классам товаров длительного пользования в течение 30 месяцев. Пространство товаров En было 5-мерным. Была проведена кластеризация покупателей в En в момент времени t = 0 с помощью иерархической кластеризации. Для анализа
движения кластеров покупателей была применена модель многомерного жесткого эллипсоида.
Исследование движения центров масс показало, что оно действительно носит линейный характер по всем осям товаров х1 в пространстве Е5 (рис. 1) при отсутствии воздействия внешних сил, как это и следует из разработанной модели (7)-(10). На рис. 2 показано изменение независимых компонент матрицы поворота QJi (t), рассчитанных по уравнениям (10). Начальные значения Q/(0) вычислены по собственным векторам матрицы инерции Р кластера при t = 0.
Рис. 2. Изменение независимых компонент матрицы поворота Qi■^ = Qa кластера, рассчитанные по модели жесткого кластера
г5
* * * •
< 1 й :
— • • и
0 2 4 6 8 10 12 14
Рис. 3. Сечение ^-мерного эллипсоида, построенного по модели жесткого кластера в момент ¿п
На рис. 3 показано сечение ^-мерного эллипсоида плоскостью х4х5 для момента t11, построенного по модели жесткого кластера, светлым
обозначены точки, попадающие внутрь аппроксимирующего эллипсоида, черным - не попадающие в него.
Сравнительный анализ с другими методами прогнозирования динамики продаж.
В целях анализа эффективности предложенной модели было проведено сравнение разработанного метода прогнозирования динамики продаж с тремя другими математическими методами, часто применяемыми на практике:
1) метод построения линейного тренда по методу наименьших квадратов;
2) метод прогнозирования с помощью кубического сплайна;
3) метод прогнозирования на основе тригонометрического ряда Фурье с применением методов спектрального анализа;
4) метод прогнозирования с помощью разработанной модели жесткого кластера.
Сравнение проводилось в рамках следующей тестовой задачи: известны данные о продажах в течение 11 временных периодов (суммарно 2,5 года) для двух групп покупателей (двух кластеров, условно обозначенных № 1 и № 2). Необходимо, используя для идентификации (вычисления необходимых параметров) методов только часть данных по т < 11 периодам, осуществить прогноз на оставшиеся 11 - т периодов. Число т варьировалось.
По имеющимся данным о продажах, были построены три типа прогноза для каждого метода прогнозирования:
- краткосрочный прогноз по истории данных: т = 9 (9 временных периодов были использованы для идентификации методов, и на 2 периода осуществлялось прогнозирование);
- среднесрочный прогноз по количеству периодов т = 6 (6 временных периодов использованы для идентификации методов, для 5 периодов осуществлено прогнозирование), сравнимому по длине с прогнозируемым периодом;
- долгосрочный прогноз по малому количеству исходных данных: т = 3 (3 временных периода использовались для идентификации методов, и для 8 периодов осуществлялось прогнозирование).
Для определения эффективности прогнозирования разных методов результаты, полученные для временных периодов прогнозирования, сравнивались с имеющимися реальными «экспериментальными» данными по продажам для двух групп покупателей (кластеры № 1 и № 2).
Краткое описание методов 1-3. Разработанный метод 4 - метод жесткого кластера - описан выше. Прогнозирование по методу 3 -методу наименьших квадратов (МНК) [9], подразумевало нахождение
коэффициентов в уравнении прямой, минимизирующей отклонение значений реальных данных от линейного тренда.
Кубический сплайн, построенный для целей прогнозирования по методу 2, представлял собой на каждом анализируемом отрезке полином третьей степени, коэффициенты которого определялись из анализируемых данных методом прогонки для трехдиагональной матрицы [9].
Использование тригонометрического ряда Фурье в методе 3 опиралось на определение коэффициентов ряда на основе многомерной регрессии, построенной по имеющимся данным [10]. Количество гармоник тригонометрического ряда определялось соответственно варианту тестовой задачи. Метод спектрального анализа позволил определить периодичность колебаний продаж.
Для всех трех методов была разработана программная реализация, программирование осуществлялось в среде Visual Basic, для графической визуализации данных расчетов использованы средства MS Excel.
Результаты сравнительного анализа. Результаты прогнозирования показаны на рис. 4-11. Суммарное количество накопленных покупок в каждой временной период для кластера № 1, рассчитанное с помощью всех трех методов для краткосрочного прогноза представлено на рис. 4. По результатам прогнозирования видно, что методы МНК, сплайна и модели жесткого кластера дают близкую точность. Различие экспериментальных и расчетных данных для них составляет не более 4 % (табл. 1). В то же время ряд Фурье дает большую погрешность, поскольку этот метод подразумевает периодический характер колебаний значений, что не соответствует имеющимся данным. Изучение характеристик данных с помощью метода спектрального анализа пока-
Рис. 4. Прогноз общей суммы накопленных покупок на 2 временных периода по данным за 9 временных периодов разными методами для кластера № 1
1400000
1200000 -1000000 800000 4 600000 400000 200000 о
Рт
9000 8000 7000 6000
3000 2000 1000 0
Рт
1
I
7
у
............1,.,, т
а
О) ф
б
Рис. 5. Периодограмма спектрального анализа временных данных за 9 временных периодов по покупкам кластеров № 1 (а) и № 2 (б) (Т - период колебаний данных, Рт - значение периодограммы для периода Т)
Рис. 6. Прогноз общей суммы накопленных покупок на 2 временных периода по данным за 9 временных периодов разными методами для кластера № 2
7000
6000 5000 4000 3000 2000 1000
- "Данные ---- Сплайн -Модель ЖК
/ '
.......МНК -----Ряд Фурье У ' f'
\ ч
8
10
12
Рис. 7. Прогноз общей суммы накопленных покупок на 5 временных периодов по данным за 6 временных периодов различными методами для кластера № 1
Рис. 8. Прогноз накопленных покупок по категориям товаров на 5 временных периодов по данным за 6 временных периодов различными методами для кластера № 1
Рис. 9. Прогноз общей суммы накопленных покупок на 5 временных периодов по данным за 6 временных периодов различными методами для кластера № 2
Рис. 10. Прогноз накопленных покупок по категориям товаров на 5 временных периодов по данным за 6 временных периодов различными методами для кластера № 2
Рис. 11. Прогноз общей суммы накопленных покупок на 8 временных периодов по данным за 3 временных периода различными методами для кластера № 1
зывает, что данные имеют период колебаний, равный 4 временным периодам, либо более длительный период — более 20 лет (рис. 2).
Таблица 1
Максимальная ошибка прогнозирования данных для кластера №1, получаемая при использовании различных методов прогноза
Метод прогноза Максимальная ошибка прогнозирования данных, %
Краткосрочный Среднесрочный Долгосрочный
МНК 2,2 9,4 24,6
Сплайн 3,7 83,2 187,9
Ряд Фурье 38,8 77,2 129,3
Модель ЖК 3,5 5,3 5,6
На рис. 6 показан краткосрочный прогноз общей суммы накопленных покупок, рассчитанный с помощью четырех методов прогнозирования для кластера № 2. Поскольку накопление суммарных покупок кластера № 2 имеет нелинейный характер, метод прогнозирования с помощью линейного тренда показывает большую ошибку - 16 % (табл. 2). Кубический сплайн и модель жесткого кластера оказываются достаточно точными: расхождение с экспериментальными данными составляет менее 6 %. Ряд Фурье дает большую ошибку из-за подразумевающейся периодичности данных. Как и для кластера № 1, спектральный анализ показывает, что значение периода колебаний суммарных покупок - 4 года, что следует из периодограммы, представленной на рис. 2.
Таблица 2
Максимальная ошибка прогнозирования данных для кластера №2, получаемая при использовании различных методов прогноза
Метод прогноза Максимальная ошибка прогнозирования данных, %
Краткосрочный Среднесрочный Долгосрочный
МНК 16,0 43,2 56,7
Сплайн 5,7 197,1 93,6
Ряд Фурье 47,2 74,8 115,3
Модель ЖК 2,0 1,6 9,9
Среднесрочный прогноз общей суммы накопленных покупок, рассчитанный с помощью всех используемых методов для кластера № 1 приведен на рис. 7. Погрешность прогнозирования для всех методов
показана в табл. 1. Заметно расхождение точности методов прогнозирования: метод сплайна дает большую погрешность прогноза - более 80 %, ряд Фурье также дает большую погрешность - более 77 %, в то время как для метода МНК и модели жесткого кластера погрешность не превышает 10 %.
Графики на рис. 8 показывают среднесрочный прогноз для накопленного количества каждого вида товара для кластера № 1. Прогноз по отдельным товарам также повторяет результаты для общей суммы покупок - погрешность сплайна в прогнозировании превышает погрешность для методов МНК и модели жесткого кластера.
На рис. 9 показан среднесрочный прогноз общей суммы накопленных покупок для кластера № 2. В табл. 2 приведена погрешность прогнозирования для всех трех используемых методов. Ввиду нелинейного характера покупок кластера метод МНК здесь дает большую погрешность, чем для кластера № 1 - более 40 %, метод сплайна не может быть рекомендован для использования в данном случае, поскольку ошибка прогноза превышает 150 %, ряд Фурье также дает большую погрешность — более 70 %. Наиболее точным методом для данного случая является модель жесткого кластера - погрешность не превышает 2 %.
На рис. 10 приведены графики среднесрочного прогноза по каждой из категорий товаров, рассчитанного для методов МНК, сплайна и модели жесткого кластера. По результатам прогнозирования для отдельных категорий товаров можно сказать, что модель жесткого кластера дает наиболее точный среднесрочный прогноз среди анализируемых методов.
Прогноз суммарного количества покупок кластера № 1 для долгосрочного прогноза с помощью четырех методов дан на рис. 11. Использование разработанной модели жесткого кластера дает наиболее точный прогноз, максимальная ошибка для нее составляет 5,6 %, в то время как для метода МНК - 24,6 %, а для ряда Фурье и метода сплайна -более 100 %. Поскольку покупки кластера № 1 имеют линейный характер, то вторая по точности модель - это линейный тренд. Кубический сплайн в данном виде прогноза не подходит для описания динамики данных, поскольку он дает максимальную погрешность прогнозирования (см. табл. 1).
На рис. 12 показан долгосрочный прогноз общих покупок для кластера № 2. Разработанная модель жесткого кластера показывает наибольшую точность по сравнению с другими методами прогнозирования, относительная ошибка не превышает 10 %. В то время как для метода МНК - 57 %, для ряда Фурье - более 100 %, для метода сплайна - 94 %. Линейный тренд может быть применен на участках данных, имеющих линейный характер, однако не способен предсказывать
800 700 600 500 400 300 200 100 0
Z х1
—— -Данные ----Сплайн -Модель ЖК у*
_. —" S
МНК -----Ряд Фурье s "" . - " ' ' f. '"
10
12
Рис. 12. Прогноз общей суммы накопленных покупок на 8 временных периодов по данным за 3 временных периода разными методами для кластера № 2
изменения направления тренда. Кубический сплайн в данной модели дает наихудшее качество прогнозирования.
Выводы. Разработана модель жесткого кластера для прогнозирования динамики массовых продаж, модель основана на применении методов механики многомерных континуумов в экономике.
Проведены сравнительные исследования разработанной модели с другими методами, применяемыми для прогнозирования динамики продаж, в результате которых установлено, что модель жесткого кластера в тестовом примере обеспечила наилучшую точность прогнозирования по сравнению с данными на основе методов МНК, кубического сплайна и ряда Фурье. Для более детального изучения эффективности прогноза с помощью этой модели жестких кластеров необходимы дальнейшие ее исследования.
СПИСОК ЛИТЕРАТУРЫ
1. П е т р о в А. А., П о с п е л о в И. Г., Ш а н а н и н А. А. Опыт математического моделирования в экономике. - М.:Энергоатомтиздат. - 1996. - 544с.
2. M a s-C o l e l l A., W h i n s t o n M. D., G r e e n J. R. Microeconomic Theory. - Oxfords University Press, USA. - 1995. - 1008 c.
3. В а с и н А. А., К р а с н о щ е к о в П. С., М о р о з о в В. В. Исследование операций // М.: Академия. - 2008. - 464 с.
4. Д и м и т р и е н к о Ю. И., Д и м и т р и е н к о О. Ю. Кластерно-континуальное моделирование в экономике на основе методов механики многомерных сплошных сред // Информационные технологии. - № 8. - 2010. - С. 54-62.
5. Д и м и т р и е н к о Ю. И., Д и м и т р и е н к о О. Ю. Кластерно-континуальное моделирование экономических процессов //Доклады Академии Наук. - М.: Изд-во «Наука». - Т. 435. - № 4. - 2010. - С. 466-469.
6. Д и м и т р и е н к о Ю. И., Д и м и т р и е н к о О. Ю. Модель деформируемых кластеров для анализа динамических данных в экономике // Информационные технологии. - М.: Изд-во «Новые технологии». - № 9. - 2010. - С. 43-50.
7. Д и м и т р и е н к о Ю. И., Д и м и т р и е н к о О. Ю. Обобщение законов механики сплошных сред на многомерный случай // Вестник МГТУ им. Н.Э. Баумана. Сер. Естественные науки. - № 3. - 2010. - С. 23-35.
8. Д и м и т р и е н к о Ю. И. Нелинейная механика сплошной среды. - М.: Физмат-лит. - 2009. - 624 с.
9. Р о д ж е р с Д., А д а м с Дж. Математические основы машинной графики -М.: Мир, 2001.
10. Ж у к В. В., Н а т а н с о н Г. И. Тригонометрические ряды Фурье и элементы теории аппроксимации - Л.: Изд-во Ленингр. ун-та, 1983. - 188 с.
Статья поступила в редакцию 27.10.2011.
Димитриенко Юрий Иванович родился в 1962 г., окончил в 1984 г. МГУ им. М.В. Ломоносова. Д-р физ.-мат. наук, профессор, заведующий кафедрой «Вычислительная математика и математическая физика» МГТУ им. Н.Э. Баумана, действительный член академии инженерных наук. Автор более 200 научных работ в области механики сплошной среды, вычислительной механики, науке о материалах, математического моделирования в экономике.
Димитриенко Ольга Юрьевна родилась в 1985 г., окончила в 2007 г. РЭА им. Г.М. Плеханова. Кандидат физ.-мат. наук, нучный сотрудник НИЧ НУК ФН МГТУ им. Н.Э. Баумана. Автор 15 научных работ в области математического моделирования в экономике.