Научная статья на тему 'Применение технологии data-mining при анализе функционирования торговой сети Rossman'

Применение технологии data-mining при анализе функционирования торговой сети Rossman Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
285
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / АНАЛИЗ / DATA MINING / CRISP-DM / ОБРАБОТКА ДАННЫХ / MATHEMATICAL MODEL / ANALYSIS / DATA PROCESSING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бежитский С. С., Савченко Л. М.

Рассматриваются особенности применения методологии CRISP-DM и Data Mining в задаче прогнозирования дохода розничной торговой сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLYING DATA-MINING TECHNOLOGY IN THE ANALYSIS OF ROSSMANN RETAIL NETWORK FUNCTIONING

The features of the application of crisp-dm methodology and Data Mining are investigated in the case of projecting the retail network income.

Текст научной работы на тему «Применение технологии data-mining при анализе функционирования торговой сети Rossman»

<Тешетневс^ие чтения. 2016

УДК 519.252

ПРИМЕНЕНИЕ ТЕХНОЛОГИИ DATA-MINING ПРИ АНАЛИЗЕ ФУНКЦИОНИРОВАНИЯ

ТОРГОВОЙ СЕТИ ROSSMAN

С. С. Бежитский, Л. М. Савченко

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: [email protected]

Рассматриваются особенности применения методологии CRISP-DM и Data Mining в задаче прогнозирования дохода розничной торговой сети.

Ключевые слова: математическая модель, анализ, Data Mining, CRISP-DM, обработка данных.

APPLYING DATA-MINING TECHNOLOGY IN THE ANALYSIS OF ROSSMANN RETAIL NETWORK FUNCTIONING

S. S. Bezhitsky, L. M. Savchenko

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]

The features of the application of crisp-dm methodology and Data Mining are investigated in the case of projecting the retail network income.

Keywords: mathematical model, analysis, Data Mining, CRISP-DM, data processing.

В настоящее время в секторе розничной торговли сложилась сильная конкуренция. Для того чтобы компания могла быть конкурентно способной, необходимо своевременно получать полную и адекватную информацию о состоянии рынка. Очевидно, что принимаемые решения о стратегии развития компании должны быть тщательно продуманы и обоснованы. Для выполнения этой задачи используются системы поддержки принятия решений (СППР). Любая СППР использует ту или иную модель поддержки принятия решений.

Немецкая розничная торговая сеть beauty-аптек Rossmann занимает 111 место в рейтинге 250 крупнейших ритейлеров мира на 2016 год [1]. Около 3 000 магазинов открыты в шести странах мира: Германии, Польше, Венгрии, Турции, Чехии и Албании. За 2015 год доход торговой сети приблизился к 8 млрд долл.

Rossmann поставила задачу прогнозирования ежедневных продаж магазинов-аптек, расположенных на территории Германии, на 6 недель вперед. В качестве входной информации предоставляются данные, собранные в две базы данных. Данная задача является сложной, потому что предоставленные данные являются реальными наблюдениями; факторы описаны с использованием разных шкал; над данными не проводилось никакой предварительной обработки, и данные имеют множество пропущенных значений. Не трудно догадаться, что доход любого магазина зависит от количества посетивших его покупателей. Очевидно, что никто не знает наперед, сколько людей посетит тот или иной магазин. Следовательно, цель

делится на две задачи: прогнозирование прибыли магазина, которое строится на основе спрогнозированного количества покупателей.

Решать такую задачу можно при помощи средств DM (Data Mining) или OLAP (Online Analytical Processing). OLAP проводит оперативную аналитическую обработку данных, в то время как DM осуществляет поиск закономерностей, правил или скрытых знаний. В силу постановки задачи, в работе используется технология DM [2; 3].

Исследование в работе проводилось в соответствии со стандартом CRISP-DM (The Cross-Industry Standard Process for Data Mining). Данный стандарт разработан консорциумом SIG (Special Interest Group), с целью помощи тем, кто использует Data Mining. Стандарт содержит рекомендации, не зависимые от предметной области или используемых методов [3; 4].

На первом шаге стандарт предлагает описать контекст решаемой задачи: сформулировать цель и требования исследования в понятиях бизнеса, сформулировать проблему добычи данных, подготовить предварительную стратегию достижения поставленной цели. На втором шаге собираются сами данные, исследуется их структура, проводится общий анализ, оценивается качество полученных данных. На третьем шаге собранные данные подготавливаются, приводятся в тот вид, с которым могут работать избранные методы. На четвертом шаге применяются техники моделирования, осуществляется калибровка методов моделирования. На пятом шаге оценивают качество и эффективность полученных моделей. Устанавливают, что модель действительно позволяет

Математические методы моделирования, управления и анализа данных.

достигнуть поставленной цели. Заключительным этапом является внедрение модели и получение отчета о её работе [5].

На данный момент выполнены первые два шага: сформулирована цель исследования и подготовлена стратегия её достижения; собраны данные, проанализирована их структура. Проводится работа по переводу некоторых значений из одних шкал в другие, определению влияния факторов на результат.

В качестве метода изучения исходных данных используется инструментарий факторного анализа, так как он позволил установить степень влияния различных атрибутов на выручку в магазинах и сократить размерность пространства переменных атрибутов [6].

В результате проведенного исследования ожидается построение модели прогнозирования выручки. Данная модель будет реализована с использованием программной системы с возможностью пользователю самостоятельно корректировать настройки модели прогнозирования. Программная система позволит пользователю, даже не обладающему исчерпывающими знаниями в области математического моделирования экономических процессов, использовать модель и получать применимый для практики результат. Таким образом, будет построена система поддержки принятия решений по прогнозированию покупательской активности.

Библиографические ссылки

1. Deloitte, Global Powers of Retailing. Navigating the new digital divide. 14 с.

2. Чубукова И. А. Data Mining. 63 с.

3. Методы и модели анализа данных: OLAP и Data mining / А. А. Барсегян [и др.] // СПб. : БХВ-Петербург, 2004. 218 с.

4. Стандарт CRISP-DM.

5. Богатырёв С., Симонова А. Введение в добычу данных (Data Mining). 8 с.

6. Рой О. М. Исследования социально-экономических и политических процессов. СПб. : Питер, 2004. 274 с.

References

1. Deloitte, Global Powers of Retailing. Navigating the new digital divide. 14 с.

2. Chubukova I. A., Data Mining. 63 с.

3. Methods and data mining models: OLAP and Data Mining / A. A. Barsegian, M. S. Kupriianov, V. V. Stepa-nenko // Saint Petersburg : BKhV-Peterburg, 2004. 218 с.

4. CRISP-DM Standard.

5. Bogatyrev S., Simonova A. Introduction to Data Mining (Data Mining). 8 с.

6. Roy O. M., Investigations of socio-economic and political processes, SPb. : Saint Petersburg, 2004. 274 c.

© Бежитский С. С., Савченко Л. М., 2016

УДК 004.09

МЕТОДЫ ПРОГНОЗИРОВАНИЯ РЫНКА ЦВЕТНЫХ МЕТАЛЛОВ

Е. В. Бурдина, С. В. Ефремова

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: [email protected]

Проблема прогнозирования, вследствие быстрых, порой плохо предсказуемых, изменений внешней среды, за последние десятилетия стала особенно важной. В условиях практически полной переориентации предприятий отечественной цветной металлургии на экспорт проблема прогнозирования изменения цен на цветные металлы на мировом рынке металлов приобретает особо острый характер.

Ключевые слова: временные ряды, прогнозирование, рынок, цветные металлы, нейронные сети.

FORECASTING MARKET OF NONFERROUS METAL METHODS E. V. Burdina, S. V. Efremova

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]

The problem of forecasting, sometimes due to poorly predictable changes in the external environment over the past decade has become significantly difficult. In the context of an almost complete reorientation of the domestic non-ferrous metallurgy enterprises to export the problem of forecasting changes in prices for non-ferrous metals on the world metals market has become extremely acute.

Keywords: Times series, forecasting, market, non-ferrous metals, neural networks.

i Надоели баннеры? Вы всегда можете отключить рекламу.