УДК 681.3
АРХИТЕКТУРА СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ И КОНТРОЛЯ ПРОЕКТНЫХ
РЕШЕНИЙ
А.А. Килина, М.В. Паринов, М.И. Чижов
В статье рассмотрена задача создания системы поддержки принятия и контроля производственных решений, предложена архитектура единой среды проведения оперативного анализа данных на основе информации из различных информационных систем
Ключевые слова: принятие решений, анализ данных, ОЬЛР, метаданные
Можно выделить три основные задачи, решаемые в системах поддержки принятия решений (СППР): ввод данных, хранение данных и анализ данных.
Основная задача СППР — предоставить аналитикам инструмент для выполнения анализа данных. Для эффективного использования СППР ее пользователь-аналитик должен обладать соответствующей квалификацией. Система не генерирует правильные решения, а только предоставляет аналитику данные в соответствующем виде (отчеты, таблицы, графики и т. п.) для изучения и анализа, именно поэтому такие системы обеспечивают выполнение функций поддержки принятия решений. Очевидно, что с одной стороны, качество принятых решений зависит от квалификации аналитика. С другой рост объемов анализируемых данных, а также сложность использования машинной формы представления данных стимулируют исследования и разработку интеллектуальных СППР. Для таких СППР характерно наличие функций, реализующих отдельные умственные возможности человека. [2]
По характеру реализуемых функций можно выделить три класса задач анализа. Информационно-поисковые СППР осуществляют поиск необходимых данных. Характерной чертой такого анализа является выполнение заранее определенных запросов. Оперативно-аналитические СППР производят группирование и обобщение данных в любом виде, необходимом аналитику. В отличие от информационно-поискового анализа в данном случае невозможно заранее предсказать необходимые аналитику запросы. Интеллектуальные СППР осуществляют поиск функциональных и
Килина Анастасия Анатольевна - ВГТУ, ст. преподаватель, тел. (473)255-42-48 Паринов Максим Викторович - ВГТУ, канд. техн. наук, доцент, тел. (473)255-42-48 Чижов Михаил Иванович - ВГТУ, д-р техн. наук, профессор, тел. (473)255-42-48
логических закономерностей в накопленных данных, построение моделей и правил, которые объясняют найденные закономерности и/или (с определенной вероятностью) прогнозируют развитие некоторых процессов.
Соответственно, к основным инструментам СППР можно отнести традиционное генерирование запросов и отчетов, OLAP и добычу данных.
Таким образом, обобщенная архитектура СППР может быть представлена следующим образом (рис. 1).
Первоначально в СППР применялась операционная (транзакционная) обработка данных — OLTP (On-line transaction
processing). Системы оперативной обработки транзакций характеризуются большим количеством изменений, одновременным обращением множества пользователей к одним и тем же данным для выполнения разнообразных операций — чтения, записи, удаления и модификации данных. Для нормальной работы множества пользователей применяются блокировки и транзакции.
Однако практика использования OLTP-систем показала неэффективность их применения для полноценного анализа информации. Подходы, связанные с наращиванием функциональности OLTP-систем, не дали удовлетворительных результатов. Основной причиной неудачи является противоречивость требований, предъявляемых к системам OLTP и СППР.
Также нужно учесть, что информация, с которой приходится иметь дело, кроме структурированных баз данных, содержится и в различных записках, электронной почте, факсах, документах текстовых редакторов и электронных таблицах, изображениях и моделях CAD-систем, веб-страницах, аудио- и видеоформатах.
s----------------------\
Оператор
Ч______________________✓
_____________'LZ.____________
Подсистема ввода (СУБД-OLTP)
_________________________________________________________________
Подсистема хранения информации (СУБД и/или хранилище данных)
Подсистема анализа
Подсистемы информационно-поискового анализа (СУБД, SQL) Подсистемы оперативного анализа (OLAP) Подсистемы интеллектуального анализа (Data Mining)
Аналитик
Рис. 1. Обобщенная архитектура системы поддержки принятия решений
Большинство промышленных СУРБД имеет в своем составе инструменты, обеспечивающие работу с определенными формами неструктурированных данных, но поддержка только хранения и извлечения данных не позволяет обеспечить все необходимые возможности: содержимое должно быть проиндексировано как корпоративный ресурс, но использоваться распределенно в подразделениях для уменьшения нагрузки и зависимости от сети; содержимое должно проходить по этапам жизненного цикла, в которых может переноситься на специальные устройства хранения, не подключенные к сети; доставка контента может быть специфической или требовать конвертации содержимого в зависимости от приложения; безопасность должна реализовываться на основании типа содержимого, а не объектов баз данных; поиск и запросы, нагружающие процессор, должны быть отделены от процедур извлечения, интенсивно использующих ввод-вывод; интеграция больших объек-
тов требует API более высокого уровня, чем SQL.
Наиболее популярным решением этой проблемы является подход, ориентированный на использование концепции хранилищ данных (ХД). В основе этой концепции лежит идея разделения данных, используемых для оперативной обработки и решения задач анализа. Это позволяет применять структуры данных, которые удовлетворяют требованиям их хранения с учетом использования в OLTP-системах и системах анализа. Такое разделение позволяет оптимизировать как структуры данных оперативного хранения (оперативные БД, файлы, электронные таблицы и т. п.) для выполнения операций ввода, модификации, удаления и поиска, так и структуры данных, используемых для анализа (для выполнения аналитических запросов). В СППР эти два типа данных называются соответственно оперативными источниками данных (ОИД) и хранилищем данных.
Многие источники содержат в себе элементы метаданных, но практически никогда не несут их полный набор.
Концепция ХД не обеспечивает эффективный анализ данных и доступ к ним. Эти задачи решаются подсистемами анализа. В процессе анализа данных, поиска решений часто возникает необходимость в построении зависимостей между различными параметрами. Число таких параметров может варьироваться в широких пределах. Измерение — это последовательность значений одного из анализируемых параметров. Множественность измерений предполагает представление данных в виде многомерной модели. По измерениям в многомерной модели откладываются параметры, относящие к анализируемой предметной области. Каждое измерение может быть представлено в виде иерархической структуры. На пересечениях осей измерений (Dimensions) располагаются данные, количественно характеризующие анализируемые факты, — меры (Measures).
OLAP (On-Line Analytical Processing) — технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решения. [3]
OLAP-система включает в себя два основных компонента: OLAP-сервер — обеспечивает хранение данных, выполнение над ними необходимых операций и формирование многомерной модели на концептуальном уровне; OLAP-клиент — предоставляет пользователю интерфейс к многомерной модели данных, обеспечивая его возможностью удобно манипулировать данными для выполнения задач анализа.
Основной задачей при проектировании решения является перенос максимального количества процессов на сервер. Это позволяет создать центральную точку управления, среду открытой БД и уменьшение зависимости от изготовителя при выполнении необходимых алгоритмов. Возникает единая достоверная версия данных и минимизируется риск, что изменения в вычислениях будут использоваться в одностороннем порядке. При этом возрастает значимость грамотно спроектированных ETL инструментов (извлечения, преобразования и загрузки).
OLAP-системе предоставляют аналитику средства проверки гипотез при анализе данных. При этом основной задачей аналитика
является генерация гипотез на основе своих знаний и опыта. Однако знания также содержатся в накопленных данных, которые подвергаются анализу («скрытые» знания). В связи с этим существует высокая вероятность пропустить гипотезы, которые могут принести значительную выгоду. Для обнаружения «скрытых» данных применяются специальные методы автоматического анализа (Data Mining).
Многие информационные системы имеют встроенные инструменты поддержки OLAP и бизнес-аналитики, то возможности этих компонентов ограничены бизнес-процессами конкретной системы, например управление поставками, производством или взаимодействие с потребителями. Это не позволяет осуществлять анализ сложных ситуаций, требующий учета многочисленных критериев и различных уровней организационной структуры и бизнес-процессов.
Для принятия сложных производственных решений требуется информация, рассредоточенная между различными информационными системами предприятия. Это требует создания инструментов проведения анализа в реальном времени, способных интегрироваться с другими системами и поддерживать открытые стандарты. В настоящее время основным способом реализации таких систем является технология корпоративных порталов, позволяющая создать единое информационное пространство предприятия. При этом встроенные в имеющиеся информационные системы порталы предпочтительнее самостоятельных решений. Для крупных машиностроительных предприятий в качестве базовой выступает система управления жизненным циклом изделия. Портальная архитектура позволяет свести разнородные данные для представления целостной картины работы предприятия. Использование браузера и стандартных инструментов просмотра снижает время, необходимое для обучения пользователей основным функциям.
[4]
Структура интегрированного OLAP-инструмента представлена на рис. 2.
Подобная архитектура позволяет повысить эффективность системы поддержки принятия решений за счет использования информации всех необходимых бизнес-процессов. При этом значительно снижаются затраты на внедрение, настройку и поддержку. Также обеспечивается гибкость системы, перенос на другие платформы или новые версии базовых систем.
Единая среда оперативного анализа
к
d
«
ей
Н
К
К
К
К
<и
*
ей
Он
Ю
О
н
О
__
API Построитель запросов и Тонкий
отчетов клиент
0 ф ф
Сервер анализа и отчетов
Ж
Драйвер взаимодействия с БД
А
А
Метадан-
ные
Хранилища информации
УЛ,
Базы Файлы
данных
К
иг
Адаптеры
А
Выходные
данные
Входные
данные
Приложения
PLM
EPM
CRM
ERP
Рис. 2. Архитектура единой среды оперативного анализа
Литература
1 .Бьер М. Интеллектуальное ведение и сопровождение бизнеса (Business Intelligence for Enterprise). Пер. с англ. - М.: КУДИЦ-ОБРАЗ, 2005. - 240 с.
2.Барсегян А. А., Куприянов М. С., Степаненко В. В., Холод И. И. Методы и модели анализа данных: OLAP
и Data Mining. — СПб.: БХВ-Петербург, 2004. — 336 с.: ил.
3.Davidson L. Pro SQL Server 2008 Relational Database Design and Implementation. Apress, 2008.
4.Teamcenter Reporting and Analytics. White Papper. Siemens PLM Software. 2010
Воронежский государственный технический университет
SYSTEM ARCHITECTURE SUPPORTING DECISION AND CONTROL PROJECT
MAKING
A.A. Kilina, M.V. Parinov, M.I. Chizhov
The article is devoted to the problem of a design decision support and control system. Architecture of on-line analysis environment based on information from different systems are given
Key words: decision making, data analysis, OLAP, metadata