Научная статья на тему 'Многомерный анализ данных: теория и практика'

Многомерный анализ данных: теория и практика Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1603
222
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Многомерный анализ данных: теория и практика»

Обработка и анализ данных

МНОГОМЕРНЫЙ АНАЛИЗ ДАННЫХ: ТЕОРИЯ И ПРАКТИКА

Т.Г. ШЕШУКОВА, доктор экономических наук, профессор, заведующая кафедрой учета, аудита и экономического анализа ГОУВПО «Пермский государственный университет» М.Л. БУТОРИНА, ведущий экономист ООО «ЛУКОЙЛ-Пермнефтепродукт»

Проведение оперативного анализа предполагает широкое использование для обработки первичной документации современной вычислительной техники, которая позволяет за один раз без повторного обращения к первичному документу получить всю вытекающую из него и необходимую для управления информацию.

Одним из таких мероприятий является создание информационного обеспечения для осуществления оперативного анализа. Создание аналитической системы имеет первостепенное значение, так как напрямую влияет на эффективность управления всеми бизнес-процессами предприятия.

С учетом реализации системного подхода при организации информационного обеспечения его можно определить как комплекс упорядоченной информации, необходимой и достаточной для обеспечения действительного оперативного анализа и эффективного управления, которые образуются путем изыскания, сбора, обработки и представления сведений о состоянии хозяйственной и финансовой деятельности.

Систему управления предприятием можно изобразить в виде трехслойной пирамиды (рис. 1). В нижнем слое располагаются модули, отвечающие за сбор первичной информации, его можно назвать слоем оперативного учета. На данных нижнего слоя строится работа модуля управленческого учета (УУ), задача которого -предоставление детальной отчетности о деятельности предприятия. На этом же уровне функционирует и подсистема бухгалтерского учета (БУ). Разница между УУ и БУ заключается в потребителях информации (данные бухгалтерского учета — для внешнего использования, данные управ-

ленческого учета — для внутреннего) и в степени детализации информации (данные УУ наиболее детализированы). Верхний слой — слой анализа и поддержки принятия решений. Информация на этом уровне является консолидированной из разных подсистем УУ для представления полной картины предприятия и принятия решений.

Рис. 1. Система управления предприятием

Основой верхнего слоя являются системы интерактивного анализа данных класса OLAP (Online Analytical Processing). Они опираются на многомерную модель данных и позволяют рассматривать параметры функционирования объекта управления в разных проекциях. Целью использования этих систем является построение гипотез относительно поведения предприятия при изменении значений различных параметров, затем проверка их на фактическом материале, а также выявление причинно-следственных связей

между изменениями параметров объектов управления. Пользователь получает естественную, интуитивно понятную модель данных, организуя их в виде многомерных кубов (рис. 2).

США Канада Мексика /

Напитки 10 000 2 000 1 000 /

Продукты питания 5 000 500 250 /

Прочие товары 5 000 500 250 /

Рис. 2. Пример куба

Осями многомерной системы координат служат основные атрибуты анализируемого бизнес-процесса. Например, для продаж это могут быть: товар, регион, тип покупателя. В качестве одного из измерений используется время. На пересечениях осей — измерений (Dimensions) — находятся данные, количественно характеризующие процесс — меры (Measures). Это могут быть объемы продаж в штуках или в денежном выражении, остатки на складе, издержки и т. п. Пользователь, анализирующий информацию, может «разрезать» куб по разным направлениям, получать сводные (например, по годам) или, наоборот, детальные (по неделям) сведения и пр. Кубами легко управлять, добавляя новые значения измерений. На практике чаще всего кубы данных имеют от 4 до 12 измерений [i, ii].

Преимущества систем, основанных на базе OLAP-технологий, заключаются в следующем:

■ естественно представлять деятельность компании многомерными измерениями (одно измерение — время, другое — продукция, третье — контрагент и т.д.);

■ большое число измерений;

■ гибкая система отчетов. Возможность манипулировать данными, анализировать, синтезировать, просматривать их любым образом;

■ многопользовательский режим — средства анализа могут размещаться в любом узле корпоративной сети;

■ ориентация на конечного пользователя. [1].

В ООО «ЛУКОЙЛ-Пермнефтепродукт» незаменимым инструментом экономического анали-

за является система «Метаплан», построенная на базе многомерных технологий, которые позволяют отображать информацию из хранилища данных, состоящих из предметно ориентированных витрин данных: «Продажи», «Затраты», «Результаты», «Персонал».

Технология многомерных баз данных — ключевой фактор интерактивного анализа больших массивов данных в целях поддержки принятия решения. Подобные базы данных трактуют данные как многомерные кубы, что очень удобно именно для их анализа.

Потребности управления предприятием приводят к необходимости анализировать большие срезы данных как во времени, так и по тематике. Хранилище данных позволяет собирать и внутренние данные из разных информационных систем (которые существовали на предприятии в разные моменты времени), и внешние (например, данные о конкурентах, средние экономические показатели по отрасли и т.п.)

Метаплан — это аналитический инструмент, который позволяет пользователям (экономистам, аналитикам, руководителям) проводить анализ и моделирование многомерной экономической информации, принимать управленческие решения, повышающие эффективность деятельности предприятия. Кроме того, метаплан осуществляет прозрачный и быстрый доступ к информации для ответа на многие вопросы бизнеса, позволяет моделировать изменение различных показателей деятельности.

Метаплан позволяет интуитивно анализировать различные представления данных, создаваемых одним щелчком мыши, определять тренды в развитии бизнеса и проводить контроль за исполнением целевых показателей.

Метаплан поддерживает работу с аналитическим сервером через Интернет и Интранет-соединения. Таким образом, решается проблема обеспечения работы в распределенной структуре современного предприятия.

Метаплан обеспечивает тесную интеграцию с Microsoft Excel — традиционный инструмент, с которым работают аналитики.

Интерфейс системы представляет собой таблицу с данными, срезы которых и расположение настраиваются визуально. Визуальный компонент состоит из нескольких сервисных панелей («Фильтр», «Строки», «Столбцы», «Селектор», «Настройка» и др.) и непосредственно таблицы данных. Панель «Фильтр» позволяет выбирать

Аналитическая подсистема {Продажи}

Вид показателя | Итог Канал | Период Подразделение Продукт

Выручка без н НДС в выручке НДФ в выручке НП в выручке Покупная с НДС в покупной НДФ в покупной Выручка Покупная с

Рис. 3. Интерфейс системы

конкретный срез данных, «Селектор» позволяет внутри среза ограничить выбор показателей, «Столбцы» и «Строки» позволяют детализировать или агрегировать выбранный срез данных, панель «Настройка» позволяет настроить отображение многомерного набора данных по строкам и столбцам (рис. 3).

Функции, поддерживаемые интерфейсом:

■ развертывание значений измерений;

■ отбор данных для анализа;

■ интерактивная настройка отображения информации;

■ выбор среза данных;

■ моделирование;

■ экспорт в другие системы.

Система поддерживает многодокументный интерфейс, каждый открываемый или вновь созданный файл отображается в отдельном окне с заголовком, соответствующим имени этого файла.

Пользователь может выполнять действия в системе путем выбора пунктов меню однократным щелчком мыши или с помощью клавиатуры. Наиболее часто употребляемым действиям сопоставлены значки, которые вынесены на панель инструментов. При наведении указателя мыши на значок панели инструментов выдается подсказка, описывающая действие, совершаемое при нажатии левой клавиши мыши на этом значке.

Для проведения анализа пользователем создаются представления. Представление (витрина данных) — это интерактивный аналитический отчет, который позволяет в зависимости от потребности пользователя просматривать агрегированную или детализированную информацию, различные срезы данных, проводить сравнения плановых и фактических показателей, рассчитывать отклонения, выявлять причинно-следственные связи.

В настоящей версии поддерживаются представления двух видов: в виде таблицы и в виде диаграммы, также поддерживается совмещенный тип в виде таблицы с диаграммой, расположенных вертикально либо горизонтально (рис. 4). Переключения вида представления возможно как для нового, так и для уже существующего представления.

Диаграммы являются средством наглядного представления данных и облегчают выполнение сравнений, выявление закономерностей и тенденций данных. Например, вместо анализа нескольких столбцов чисел в таблице можно, взглянув на диаграмму, узнать, падают или растут объемы продаж по кварталам или как действительные объемы продаж соотносятся с планируемыми. Диаграмма связана с данными, на основе которых она создана, и обновляется автоматически при изменении данных.

Одним из наиболее мощных средств для анализа информации является возможность создания вычислимых показателей. Например, можно создать показатель, который рассчитывает абсолютное или относительное отклонение плана от факта, после этого показатель будет доступен для представления как в табличном виде, так и в виде диаграммы. Для создания некоторых показателей может потребоваться знание языка MDX, однако многие показатели можно создать, используя простые математические выражения [2].

При создании вычислимого показателя первым шагом является определение измерения, в

Рис. 4. Форматы представлений

котором он должен быть создан. Так, для показателя «отклонения плана от факта» логично его расположить совместно с показателями «план» и «факт» в одном измерении.

Существует возможность группировать показатели. При этом запускается редактор, в строке выражения которого содержится формула для расчета суммы группируемых показателей (рис. 5), в

■ii Редактор MDX (Показатели)

|<Задайте наименование группы>

Наименование:

Расположение: ([Статьи издержек] Выражение MDX

Порядок: Формат:

Г

о

3

ЭиМЩСтатьи издержек].&[3],[Статьи издержек].&[19],[Статьи издержек].&[266],[Статьи издержек].&[215],[Статьи издержек].&[-13]})

Лета данные iyHKUHH

ЕЭЗ Издержки EO (All)

НВ Measures HQ Array

Вид показателя [+1 Pi Dimension

[-S % ЕЙ f+1 Pi Hierarchy

h-S % Итог 1+1 Pi Level

г—Ш Период 0 □ Logical

■■"Ш tu Подразделение 1+lPl Member

L-0 t4 Статьи издержек BD Numeric

EO Other

mn tipt

Рис.5. Редактор вычислимого показателя

большинстве случаев пользователю достаточно только указать наименование группы.

Кроме интерактивных представлений в системе поддерживается просмотр параметризованных отчетов.

Параметры в отчетах могут быть следующих типов: строковые, логические, денежные, даты, времени, числовые. После задания значений всех параметров происходит запуск отчета. Пример отчета показан на рис. 6.

Пользователем могут быть созданы следующие типы отчетов:

■ стандартный;

■ кросс-отчет;

■ аналитический отчет. Стандартный отчет позволяет размещать данные традиционным способом — по строкам с фиксированным числом столбцов. Данные в отчете могут группироваться, вычисляться итоги, вставляться диаграммы, созданные на базе данных отчета.

Кросс-отчет — это отчет с переменным числом столбцов, которые создаются из источника данных.

И

d

Э 8 7 !

6 5 4 •

3 2 1

0 X +

( ) { }

Проверить

Сохранить

Закрыть

d

Рис. 6. Пример параметризированного отчета

Аналитический отчет — это отчет по данным многомерного куба, который поддерживает ограниченные интерактивные возможности [3].

Вид, форма, источники данных отчетов настраиваются администратором, поэтому обо всех возможностях, реализованных в отчете, можно узнать только из сопроводительной документации к отчету

Система поддерживает гибкий интерфейс с Microsoft Excel. Каждый отчет системы может быть представлен в виде рабочей книги Microsoft Excel. Это удобно, так как Excel является привычным инструментом для управленческого персонала, кроме того, отчеты, экспортированные в Excel, можно пересылать пользователям, у которых нет доступа или не установлена система метаплан. На рис.7. представлено исходное представление и его вид в Microsoft Excel

Для пользователей Microsoft Excel XP и выше доступны интерактивные отчеты в виде сводной таблицы, раскладку которой и внешний вид можно менять в среде Excel (рис.8). Есть возможность также создавать связанные с этими данными диаграммы.

Таким образом, аналитическая система позволяет осуществить: постановку плановых финансово-экономических целей; контроль за

достижением плановых целей путем сопоставления факта и плана; анализ причин, вызвавших отклонения; корректировку планов; анализ дополнительной информации.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

При этом время исполнения любого, даже самого сложного, запроса не превышает 2 с.

Аналитическая система, базирующаяся на многомерной модели предметной области и технологии оперативной аналитической обработки данных (OLAP) и программных средствах пакета Microsoft SQL Server 2000, предоставляет недорогой, удобный и функциональный инструментарий для создания, загрузки и обработки хранилищ данных.

В связи с внедрением аналитической системы отметим качественные изменения системы управления:

■ создание координат бизнеса;

■ повышение оперативности управления;

■ создание прозрачной системы управления;

■ возможность релевантного управления;

■ повышение точности планирования;

■ возможность решения широкого круга аналитических задач, таких как анализ ключевых показателей деятельности, маркетинговый анализ, финансово-экономический анализ,

сценарный анализ, моделирование, прогнозирование;

непрерывный оперативный контроль за ходом выполнения плана на основе своевременной и достоверной информации о состоянии производства;

независимость аналитического приложения от специфики различных систем и возможность работы со всеми необходимыми данными, независимо от их источников.

S Microsoft Encel - Лист 1

Щ Файл Правка Вид Вставка Формат Сервис XLCubed

: □ & н й? ® а у

I Arial Cyr

а в ■ 9

fx Measures

Данные Окно Справка

% T. ■ 4i äi Ш В®™"'- - Э . IBIS

% ООО tig л ÏF Íf _ - л - А . .

А В С D Е F G

1 Measures Сумма

2 Период 2003

3 Подразделение Пермнефтепродукт

4 ЕИ Все

5 Итог Нет

6

7 план факт

8 Затраты 1 7В6 482 289,12 1 714 379 552,40

9 Материальные затраты 900 771 373,55 900 381 112,47

10 Затраты на оплату труда 374 013 128,66 302 366 049,44

11 Отчисления на соц нужды 118 152 232,60 92 849 539,59

12 Амортизация ОС 103 467 916,18 97 229 160,08

13 Прочие затраты 270 564 492,13 241 553 690,62

14

1С I I I

ЛИТЕРАТУРА

1. Торбен Бэч Педерсен, Кристиан Йенсен. Технология многомерных баз данных// Открытые системы. — 2002. — № 1.

2. Трофимова П., Шуленин А. Введение в MDX// КомпьютерПресс, 2005

3. Thomsen E, OLAP Solutions: Building Multidimensional Information Systems, John Wiley & Sons, New York, 2004.

Рис. 7. Представление данных в метаплан и его отображение в Microsoft Excel

Щ Файл Правка Вид Вставка формат Сервис ^СиЬей Данные Окно Справка

! Arial Cyr .10 -1 ж к ч | ш m ш Ш | Э % ODO täS л I it » I ta - * ■ 4. -.

AS - fx Затраты_

А В С D Е F G H 1

1 Период 2003

2 Подразделение Пермнефтепродукг Список полей сводной таблицы * X

3 ЕИ Все

4 Итог Нет

5 В- g Вид показателя

Б Сумма Вид показателя ж

7 Статьи издержек ~ план факт В" g Итог В" Д Период ±1 Д Подразделение ±1" Статьи издержек Количество [ff] Сумма Щ]Тариф

В Затраты 1766482209 1714879662

9

10

11

12

13

14

15

16

17

18

19

?п

21

22

23

24

2Ь Поместить в область строк ▼

2/ i i

Fl III

Рис. 8. Интерактивный отчет в Microsoft Excel XP

i Надоели баннеры? Вы всегда можете отключить рекламу.