ВОЗМОЖНОСТИ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ АНАЛИЗА ДАННЫХ ДЛЯ ИССЛЕДОВАНИЯ КЛИЕНТСКОГО ПОВЕДЕНИЯ
FEATURES OF AN INTELLIGENT DATA ANALYSIS SYSTEM FOR CUSTOMER BEHAVIOR RESEARCH
УДК 004.043
Масленникова Екатерина Александровна, Студент, 2 курс, Департамент магистратуры ФГБОУ ВО Уральский государственный экономический университет. Россия, г. Екатеринбург
Maslennikova Ekaterina Aleksandrovna, Student 2nd year, master's Department Ural state University of Economics. Russia, Yekaterinburg
Аннотация: в статье рассмотрено понятие «Скоринг», а также виды скоринговых моделей. Приведен пример применения скоринговой модели на примере кредитного скоринга. Кроме этого в статье рассмотрение применения технологии интеллектуальной системы анализа данных SAS Enterprise Miner для исследования клиентского поведения.
Abstract: the article considers the concept of "Scoring", as well as the types of scoring models. An example of applying the scoring model to credit scoring is given. In addition, the article discusses the application of the technology of the intelligent data analysis system SAS Enterprise Miner for the study of client behavior.
Ключевые слова: интеллектуальный анализ данных, SAS Miner, исследование клиентского поведения.
Keywords: data mining, SAS Miner, customer behavior research.
ВВЕДЕНИЕ
Современная экономика немыслима без информации. Тысячи предприятий, миллионы налогоплательщиков, триллионы рублей, биржевые котировки, реестры акционеров - все эти информационные потоки необходимо оценить, обработать, сделать необходимые выводы, принять правильное решение.
Интеллектуальные технологии - один из последних этапов развития аналитических технологий. Аналитическими технологиями называют методики, которые на основе каких-либо моделей, алгоритмов, математических теорем позволяют по известным данным оценить значения неизвестных характеристик и параметров.
Аналитические технологии нужны в первую очередь людям, принимающим важные решения - руководителям, аналитикам, экспертам, консультантам. Доход компании в большой степени определяется качеством этих решений - точностью прогнозов, оптимальностью выбранных стратегий. Наиболее распространены аналитические технологии, используемые для решения следующих задач: для прогнозирования курсов валют, цен на сырье, спроса, дохода компании, уровня безработицы, числа страховых случаев, и т.д.
Как правило, для реальных задач бизнеса и производства не существует четких алгоритмов решения. Раньше руководители и эксперты решали такие задачи только на основе личного опыта. С помощью современных аналитических технологий строятся системы, позволяющие существенно повысить эффективность решений.
В данной статье будет рассмотрено применение интеллектуального анализа данных для исследования клиентского поведения с помощью возможностей SAS Enterprise Miner, для более точного определения отклика на продукты банка.
СКОРИНГОВЫЕ МОДЕЛИ SAS MINER
Скоринг (от англ. scoring - подсчет очков в игре) это модель классификации клиентской базы на различные группы, если неизвестна характеристика, которая разделяет эти группы, но известны другие факторы, связанные с интересующей нас характеристикой. [1]
Как правило, скоринговые модели делят на две большие группы: кредитные и поведенческие. Если первые дают возможность кредитным организациям оценить риски при выдаче кредитных продуктов клиенту, то вторые показывают вероятность отклика клиента на тот или иной банковский продукт, тем самым позволяют создавать для каждого клиента персонализированные предложения, повышая объем прибыли, а также удовлетворенность клиента.
Выделяют следующие основные модели поведенческого скоринга.
- Методы, аналогичные кредитному скорингу — классификация клиентов в зависимости от их предыдущего поведения (фактически, это тот же кредитный скоринг, только в анкету помимо данных о самом заёмщике добавлено описание его поведения).
- Статистические модели, не ставящие целью объяснить природу того или иного поведения заёмщиков, а лишь аппроксимирующие наблюдаемое поведение. Здесь преобладают модели, основанные на Марковских цепях. Последние могут быть использованы как для моделирования поведения одного заёмщика, так и для оценки потерь портфеля кредитов в целом.
- Структурные модели, описывающие динамику кредитоспособности и репутации заёмщика. Доступные статистические данные используются здесь для оценки параметров модели.
Системы поведенческого скоринга используют информацию о недавнем поведении заёмщика для оценки вероятности дефолта, при этом используется методология, сходная с применяемой в кредитном скоринге. Подготавливается выборка данных по существующим заёмщикам, включающая в себя информацию о трансакциях по их счетам за определённый период времени. Этот период разбивается на две части: период наблюдения и контрольный период, каждый примерно по одному году. На периоде наблюдения вычисляются различные численные характеристики поведения заёмщика: средний, максимальный и минимальный баланс, оборот по счетам, тренды в платежах и балансе и т.д.
Далее каждый заёмщик классифицируется как «плохой» или «хороший» в зависимости от состояния на конец контрольного периода. Далее теми же методами, что и в кредитном скоринге, строится модель, классифицирующая заёмщиков на «хороших» и «плохих». [2]
Автоматизация подобного классифицирования возможна благодаря программным продуктам, относящимся к категории средств интеллектуальной добычи данных, обеспечивающих поиск полезных данных в огромных массивах информации. Иными словами, такие программные продукты позволяют аналитику получить качественно новую информацию, не содержащуюся в источнике данных явным образом. Здесь используются популярные методы математического анализа данных: фильтрация, дерево решений, ассоциативные правила, генетические алгоритмы, нейронные сети, статистический анализ.
Таким образом, системы Data Mining помогают аналитику сформировать качественные выводы, которые обычный человек не в состоянии получить стандартными методами исследования данных. Как правило, функции интеллектуального извлечения данных встраиваются в OLAP-системы. Типичные представители фирм-разработчиков: SAS (SAS Institute), Hyperion Essbase (Hyperion Solutions Corporation), Oracle Data Mining (Oracle).
Пакет SAS Enterprise Miner предоставляет набор инструментов и алгоритмов прогностического и описательного моделирования, включающий деревья решений, нейронные сети, самоорганизующиеся нейронные сети, методы рассуждения, основанные на механизмах поиска в памяти
(Memorybased Reasoning), линейную и логистическую регрессии, кластеризацию, ассоциации, временные ряды и многое другое.
В пакете SAS Enterprise Miner реализован подход, основанный на создании диаграмм процессов обработки данных и позволяющий устранить необходимость ручного кодирования и ускорить разработку моделей благодаря методике Data Mining SEMMA. Среда для формирования диаграмм процессов обработки данных пакета SAS Enterprise Miner устраняет необходимость ручного кодирования, диаграммы выступают в качестве самоописательных шаблонов, которые можно изменять или применять для решения новых проблем, не повторяя анализ с самого начала. Существует возможность обмена диаграммами между аналитиками в масштабах предприятия. [6]
Графический пользовательский интерфейс пакета является интерфейсом типа "указать и щелкнуть". С его помощью пользователи могут выполнить все стадии процесса Data Mining от выбора источников данных, их исследования и модификации до моделирования и оценки качества моделей с последующим применением полученных моделей, как для обработки новых данных, так и для поддержки процессов принятия решений.
Блок-схема процессов в графическом пользовательском интерфейсе SAS Enterprise Miner представляет собой автоматически документируемый шаблон, который можно с легкостью обновлять, применять к новым задачам, передавать специалистам по моделированию и аналитикам.
Время построения данных моделей может занимать от недели до нескольких месяцев, так как скоринговые модели для маркетинга являются наиболее сложными, чем модели для кредитного скоринга, потому что для первых моделей используется большее количество показателей и, как правило, часть показателей являются социально-демографическими, к примеру, возраст, наличие детей, а также, как было сказано раннее, поведенческими. Полный процесс создания скоринговых моделей представлен на рисунке 1.
Рисунок 1 - Процесс создания скоринговых моделей
Время построения моделей зависит не только от количества «сырых» данных, но также от выбранного математического метода анализа данных, от времени обучения построенной модели и еще от ряда характеристик.
Отлаженные скоринговые модели позволяют более точно назначать вероятность покупки и отклика клиента (от 0 до 1) на определенный продукт, предлагаемый банком.
На основе полученных откликов и вероятностей клиентам назначаются персональные предложения, которые клиент может получить во время коммуникации с клиентом либо во время визита в отделение банка.
Кроме этого на основе полученных откликов возможно составить прогнозные воронки продаж для каждого продукта, предлагаемого банком.
ВЫВОДЫ
Таким образом, можно сделать вывод, что методы интеллектуального анализа данных прекрасный инструмент для исследования клиентского поведения. Также благодаря программным продуктам таким, как SAS Enterprise Miner, есть возможность автоматизировать данные методы, что позволит ускорить процесс принятия решений, а также повысить точность данных решений, что благотворно влияет на бизнес-показатели любого предприятия, не только банка.
СПИСОК ЛИТЕРАТУРЫ
1. [1] Скоринг. [Электронный ресурс]. - Режим доступа: http://statsoft.ru/solutions/tasks/scoring/
2. [2] Модели кредитного и поведенческого скоринга . [Электронный ресурс]. - Режим доступа: http://masters.donntu.org/2006/kita/shepeleva/library/metod%20scoring.pdf
3. [3] Интеллектуальный анализ данных: базовые понятия [Электронный ресурс]. - Режим доступа: https://www.intuit.ru/studies/courses/4416/612/lecture/13260
4. [4] Управление поведением клиента понятия [Электронный ресурс]. -Режим доступа: https://vuzlit.ru/2082659/upravlenie_povedeniem_klienta
5. [5] Analytics: The Basics [Электронный ресурс]. - Режим доступа: https : //www.sas .com/ru_ru/insights/analytics.html
6. [6] Инструменты Data Mining. SAS Enterprise Miner [Электронный ресурс]. - Режим доступа: https://www.intuit.ru/studies/courses/6/6/lecture/202
7. [7] SAS ENTERPRISE MINER [Электронный ресурс]. - Режим доступа: https://korusconsulting.ru/platforms/advanced-analytics/sas/sas-enterprise-miner/
8. [8] Интеллектуальный анализ данных в системах управления программами клиентской лояльности [Электронный ресурс]. - Режим доступа: https://elibrary.ru/item.asp?id=15230450
BIBLIOGRAPHY
1. [1] Scoring. [Electronic resource]. - Access mode: http://statsoft.ru/solutions/tasks/scoring/
2. [2] Credit and behavioral scoring models. [Electronic resource]. - Access mode: http://masters.donntu.org/2006/kita/shepeleva/library/metod%20scoring.pdf
3. [3] Data mining: basic concepts [Electronic resource]. - Access mode: https://www.intuit.ru/studies/courses/4416/612/lecture/13260
4. [4] Customer behavior management concepts [Electronic resource]. - Access mode: https://vuzlit.ru/2082659/upravlenie_povedeniem_klienta
5. [5] Analytics: The Basics. - Access mode: https : //www.sas .com/en_ru/insights/analytics.html
6. [6] Data Mining Tools. SAS Enterprise Miner [Electronic resource]. - Access mode: https://www.intuit.ru/studies/courses/6/6/lecture/202
7. [7] SAS ENTERPRISE MINER [Electronic resource]. - Access mode: https://korusconsulting.ru/platforms/advanced-analytics/sas/sas-enterprise-miner/
8. [8] Data mining in customer loyalty program management systems [Electronic resource]. - Access mode: https://elibrary.ru/item.asp?id=15230450