Научная статья на тему 'Применение современных информационных технологий для анализа пространственно распределенных социально-экономических данных'

Применение современных информационных технологий для анализа пространственно распределенных социально-экономических данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY-NC-ND
1774
147
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОСТРАНСТВЕННАЯ OLAP-СИСТЕМА / АНАЛИЗ СОЦИО-ЭКОНОМИЧЕСКИХ ДАННЫХ / SPATIAL-OLAP-SYSTEM / ANALYSIS OF SOCIO-ECONOMIC DATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Латышев К. В., Сидоренко В. Н.

В статье описываются современные методы представления и анализа социально-экономических данных с использованием «пространственных» (spatial) OLAP-систем. Для комплексного анализа в режиме «реального времени» социо-экономических данных, привязанных к географическим объектам, предложено современное инновационное, недорогое в своем классе решение на основе широко распространённых, проверенных программных продуктов крупных изготовителей программного обеспечения. В настоящее время в академическом и бизнес-сообществе подобных решений пока нет.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF ADVANCED INFORMATION TECHNOLOGIES FOR OPERATIONAL ANALYSIS OF SOCIO-ECONOMIC DATA

The paper is devoted to modern methods of presentation and analysis of socio-economic data by means of Spatial-OLAP-systems. The modern innovative cost-effective solution, based on well-known software of leading software vendors, is proposed for complex analysis of «real time» socio-economic geo-referenced data. There are no analogous solutions in the academic and business communities at the present moment.

Текст научной работы на тему «Применение современных информационных технологий для анализа пространственно распределенных социально-экономических данных»

ПРИМЕНЕНИЕ СОВРЕМЕННЫХ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ ДЛЯ АНАЛИЗА ПРОСТРАНСТВЕННО РАСПРЕДЕЛЕННЫХ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ДАННЫХ

К.В. Латышев,

аспирант кафедры прикладной математики и аналитической поддержки принятия решений Московского городского университета управления Правительства Москвы

В.Н. Сидоренко,

кандидат экономических наук, кандидат физико-математических наук, кандидат юридических наук, доцент экономического факультета МГУ им. М.В. Ломоносова, доцент кафедры прикладной математики и аналитической поддержки принятия решений Московского городского университета управления Правительства Москвы

E-mail: [email protected], [email protected] Адрес: г. Москва, ул. Сретенка, д. 28

^ В статье описываются современные методы представления и анализа социально экономических данных с использованием «пространственных» (spatial) OLAP-систем. Для комплексного анализа в режиме «реального времени» социо-экономических данных, привязанных к географическим объектам, предложено современное инновационное, недорогое в своем классе решение на основе широко распространённых, проверенных программных продуктов крупных изготовителей программного обеспечения. В настоящее время в академическом и бизнес-сообществе подобных решений пока нет. ^

Ключевые слова: пространственная OLAP-система, анализ социо-экономических данных.

І.Введение

В настоящее время крупными государственными структурами и коммерческими компаниями достаточно активно используются современные системы поддержки принятия решений (постановка целей, планирование и под-

держка принятия управленческих решений), обладающие, как правило, средствами предоставления пользователю агрегатных данных для различных пространственно-временных выборок из исходного набора в удобном для восприятия и анализа виде. Какие же современные технологии лежат в основе таких систем? К таким технологиям в настоящее

время относятся OLAP, BI, GIS и ряд других технологий, обзор которых проводится в данной работе.

2. OLAP-технологии

Под OLAP-технологиями (On-Line Analytical Processing) понимают технологии комплексного многомерного анализа данных. OLAP — это ключевой компонент организации хранилищ данных. Концепция OLAP была описана в 1993 году Эдгаром Коддом, известным исследователем баз данных и автором реляционной модели данных (см. E.F. Codd, S.B. Codd, and C.T. Salley, Providing OLAP (on-line analytical processing) to user-analysts: An IT mandate. Technical report, 1993). В 1995 году на основе требований, изложенных Коддом, был сформулирован так называемый тест FASMI (Fast Analysis of Shared Multidimensional Information — быстрый анализ разделяемой многомерной информации), включающий следующие требования к приложениям для многомерного анализа:

♦ предоставление пользователю результатов анализа за приемлемое время (обычно не более 5 с), пусть даже ценой менее детального анализа;

♦ возможность осуществления любого логического и статистического анализа, характерного для данного приложения, и его сохранения в доступном для конечного пользователя виде;

♦ многопользовательский доступ к данным с поддержкой соответствующих механизмов блокировок и средств авторизованного доступа;

♦ многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий (это — ключевое требование OLAP);

♦ возможность обращаться к любой нужной информации независимо от ее объема и места хранения.

♦ OLAP-функциональность может быть реализована различными способами, начиная с простейших средств анализа данных в офисных приложениях и заканчивая распределенными аналитическими системами, основанными на серверных продуктах [1].

Как правило, агрегатные функции в OLAP-системах образуют многомерный (и, следовательно, нереляционный) набор данных (называемый гиперкубом или метакубом), оси которого содержат параметры, а ячейки — зависящие от них агрегатные данные. Вдоль каждой оси данные могут быть организованы в виде иерархии, представляющей различные уровни их детализации. Благодаря такой модели данных пользователи могут формулировать сложные запросы, генерировать отчеты, получать подмножества данных [1].

В ячейках OLAP-куба могут содержаться результаты выполнения иных агрегатных функций языка SQL, таких как SUMM, MIN, MAX, AVG, COUNT, а в некоторых случаях — и других (дисперсии, среднеквадратичного отклонения и т.д.). Для описания значений данных в ячейках используется термин summary (в общем случае в одном кубе их может быть несколько). С целью обозначения исходных данных, на основе которых они вычисляются, — термин measure. Для обозначения параметров запросов применяется термин dimension (переводимый на русский язык обычно как «измерение», когда речь идет об OLAP-кубах, и как «размерность», когда речь идет о хранилищах данных). Значения, откладываемые на осях, называются членами измерений (members) [2].

Говоря об измерениях, следует упомянуть о том, что значения, наносимые на оси, могут иметь различные уровни детализации. Возможность получения агрегатных данных с различной степенью детализации соответствует одному из требований, предъявляемых к хранилищам данных, — требованию доступности различных срезов данных для сравнения и анализа.

Современные системы OLAP поддерживают «историчность» любых измерений, кроме календарного, т.е. совмещают функции OLAP и хранилищ данных (Data Warehouse). Новейшая реализация OLAP от Microsoft: MS SQL Server 2012 Analysis Services.

3. BT-технологии

Под BI-технологиями (Business Intelligence, бизнес аналитика) чаще всего понимают информационные технологии, созданные для помощи менеджеру в анализе информации о своей компании и её окружении. Термин Business Intelligence впервые появился в 1958 году в статье исследователя из IBM Ханса Питера Луна (англ. Hans Peter Luhn). Он определил этот термин как: «Возможность понимания связей между представленными фактами.» [3] Говард Дреснер (аналитик Gartner) определил «Business intelligence» как общий термин, описывающий «концепции и методы для улучшения принятия бизнес-решений с использованием систем на основе бизнес-данных».

В настоящее время существует несколько вариантов понимания этого термина:

• Бизнес-аналитика (в узком смысле) — это методы и инструменты для построения информативных отчётов о текущей ситуации (например, консолидированная отчетность, возникающая в задачах общего менеджмента). Эта информация может оказать-

ся жизненно необходимой для принятия текущих управленческих решений.

• Бизнес-аналитика (в широком смысле) — это инструменты преобразования, хранения, анализа, моделирования, доставки и трассировки информации в ходе работы над задачами, связанными с принятием решений на основе фактических данных. С помощью этих средств лица, принимающие решения, должны получать нужные сведения в нужное время [4].

Таким образом, BI в узком смысле является лишь одним из секторов бизнес-аналитики в широком смысле. Помимо отчётности туда входят инструменты интеграции и очистки данных (ETL), DWH или OLAP и средства DataMining [5]. Согласно второму варианту понимания этого термина, BI-технологии позволяют анализировать большие объёмы информации, заостряя внимание пользователей лишь на ключевых факторах эффективности, моделируя исход различных вариантов действий, отслеживая результаты принятия тех или иных решений.

В 2011 г. появились методы анализа данных типа BIG Data на основе технологии Hadoop, которые можно отнести к BI в широком смысле [6], а первый стабильный релиз такой системы (Apache Software Foundation Hadoop) появился в конце 2011 г. В анализе данных типа BIG Data широко применяются методы Data Mining (Ителлектуальный анализ данных), причем модель данных не определяется точно.

4. GIS-технологии [7]

Под GIS-технологиями (GIS или геоинформа-ционные системы) часто понимаются технологии компьютерного кодирования (ввода), сохранения, трансформации, анализа и отображения пространственно-распределенной информации об объектах и событиях. Первые ГИС были разработаны в 1950-х и 60-х годах, первоначально в гражданском секторе. В 1970-х и 80-х годах развилась сильная и активная ГИС-индустрия.

В настоящее время ГИС-технологии объединяют традиционные операции работы с базами данных, такими как запрос и статистический анализ, с преимуществами полноценной визуализации и географического (пространственного) анализа, которые предоставляет карта. ГИС применяется в широком спектре задач, связанных с анализом и прогнозом явлений и событий окружающего мира, с осмыслением и выделением главных факторов и причин, а также их возможных последствий, с планированием стратегических решений и текущих последствий предпринимаемых действий.

Современная ГИС включает в себя пять ключевых составляющих:

♦ аппаратные средства,

♦ программное обеспечение,

♦ данные,

♦ методы обработки данных,

♦ исполнители.

Программное обеспечение ГИС содержит функции и инструменты, необходимые для хранения, анализа и визуализации географической (пространственной) информации. Ключевыми компонентами программных продуктов являются: инструменты для ввода и оперирования географической информацией; система управления базой данных (DBMS или СУБД); инструменты поддержки пространственных запросов, анализа и визуализации (отображения); графический пользовательский интерфейс или ГИП) для легкого доступа к инструментам.

Данные о пространственном положении (географические данные) и связанные с ними (геоко-дированные) табличные данные могут собираться и подготавливаться как самим пользователем, так и приобретаться у поставщиков на коммерческой или другой основе. В процессе управления пространственными данными ГИС интегрирует пространственные данные с другими типами и источниками данных, а также может использовать СУБД, применяемые многими организациями для упорядочивания и поддержки имеющихся в их распоряжении данных. ГИС хранит информацию в виде набора тематических слоев, которые объединены на основе географического положения.

Современные ГИС могут работать с двумя существенно отличающимися типами данных — векторными и растровыми. В векторной модели данных информация о точках, линиях и полигонах кодируется и хранится в виде набора координат Х,У Местоположение точки (точечного объекта) описывается парой координат (Х,У). Линейные объекты, такие как дороги, реки или трубопроводы, сохраняются как наборы координат Х^. Полигональные объекты, такие как земельные участки и др., хранятся в виде замкнутого набора координат. Векторная модель особенно удобна для описания дискретных объектов и меньше подходит для описания непрерывно меняющихся свойств, таких как типы почв или доступность объектов. В растровой модели данных изображение представляет собой набор значений для отдельных элементарных составляющих

(ячеек), оно подобно отсканированной карте или картинке. Растровая модель оптимальна для работы с непрерывными свойствами. Обе модели имеют свои преимущества и недостатки.

Современные ГИС подразделяются на ГИС общего назначения и специализированные ГИС. ГИС общего назначения обычно выполняет пять процедур (задач) с данными: ввод, манипулирование, управление, запрос и анализ, визуализацию. Остановимся более детально на двух последних задачах, имеющих отношение к рассмотренным выше OLAP и В1-технологиям.

Запрос и анализ. При наличии ГИС и географической информации можно получать ответы на простые так и более сложные вопросы. Примеры простых вопросов: «Кто владелец данного земельного участка?», «На каком расстоянии друг от друга расположены эти объекты?», «Где расположена данная промзона?). Более сложными вопросами, требующими дополнительного анализа, являются «Где есть места для строительства нового дома?», «Каков основный тип почв под еловыми лесами?», «Как повлияет на движение транспорта строительство новой дороги?». Ответы на поставленные вопросы выполняются с помощью запросов, которые можно задавать как путем выделения тех или иных объектов, так и посредством развитых аналитических средств. С помощью ГИС можно выявлять и задавать шаблоны для поиска, проигрывать сценарии по типу «что будет, если...». Современные ГИС имеют множество мощных инструментов для анализа, среди которых наиболее значимы два: анализ близости и анализ наложения. Для проведения анализа близости объектов относительно друг друга в ГИС применяется процесс, называемый буферизацией. Он помогает ответить на вопросы типа: Сколько домов находится в пределах 100 м от этого водоема? Сколько покупателей живет не далее 1 км от данного магазина? Процесс наложения включает интеграцию данных, расположенных в разных тематических слоях. В простейшем случае это операция отображения, но при ряде аналитических операций данные из разных слоев объединяются физически.

Визуализация. Для многих типов пространственных операций конечным результатом является представление данных в виде карты или графика. Карта — это эффективный и информативный способ хранения, представления и передачи географической (имеющей пространственную привязку) информации.

ГИС тесно связаны с рядом других типов информационных систем. Хотя и не существует единой общепринятой классификации информационных

систем, необходимо отличать ГИС от настольных картографических систем (Desktop Mapping), систем САПР (CAD), дистанционного зондирования (Remote Sensing), систем управления базами данных (СУБД или DBMS) и технологии глобального позиционирования (GPS).

Примером наиболее распространенной ГИС, ставшей мировым промышленным стандартом, является ESRI ArcGIS, использующая технологии управления реляционными базами данных ESRI SDE (Spatial Database Engine), основанными на MS SQL Server.

5. SOLAP-технологии

Естественным развитием OLAP, BI и ГИС-техно-логий для анализа и планирования «сверху-вниз» стала технология Spatial OLAP data engine, а рамках которой геоданные организованы в гиперкубы по нескольким иерархиям-измерениям (основная иерархия — географическая вложенность, затем следуют: организационное деление, иерархия временных отрезков, классификаторы и т.д.) [8]. Данные технологии активно развиваются в последнее десятилетие. Среди ведущих производителей программного обеспечения, таких как ESRI, Microsoft, IBM, Oracle подобные решения только разрабатываются, хотя, например у GeoMondrian [9] уже реализованы технологии построения SOLAP-кубов.

Какие же задачи могут быть решены при помощи SOLAP-технологий?

Задача 1: Создание визуального интерактивного представления срезов данных аналитического куба в виде матриц (Matrix) или сводных таблиц (Pivot Table) и синхронизированного с ним фрагмента ГеоКарты для аналитического куба, у которого одно из измерений может быть отображено на ГеоКарте в виде вложенных друг в друга слоев (Shapes). Осуществление на фрагменте Геокарты интерактивного выбора уровня иерархии по принципу «сверху-вниз» и выбирать нужные слои карты (Shapes), задавая тем самым фильтр для сопряженной матрицы (Matrix). Изменение при интерактивной работе с Matrix-компонентом позиционирования и масштаба отображения Геокарты, выделение цветом выбранных слоев (Shapes), соответствующих активным в данный момент элементам матрицы (Matrix). Данная задача в настоящий момент решена в продукте SAS Enterprise BI Server [10], а также в продукте SpotOn Vantage Maps [11]. Кроме того, данная задача может быть решена с использованием платформы и технологий Microsoft SQL Server 2012 SSAS и ESRI ArcMaps.

Задача 2: Создание многопользовательской системы комплексного визуального анализа геоданных с функциями прокрутки от целого к частному и обратно (Drill-up и Drill-down) и визуальным отображением результатов многомерных (MDX) запросов к ГеоГиперкубу на ГеоКарте и (или) в сводных таблицах (Pivot Table) (в Matrix). В настоящее время существует решение данной задачи на базе некоммерческой SOLAP-системы, которая является первой попыткой коллектива энтузиастов создать полнофункциональную OLAP систему для работы с Геоданными. Geomondrian SOLAP Server ориентирован на комплексный анализ Геоданных в режиме реального времени. В качестве набора мер ГеоГиперкуба системы GeoMondrian могут быть Геоданные (Geometry и Geography). Для отображения срезов и результатов MDX-запросов используется система PostGIS. Аналогичные решения также могут быть построены на платформе Microsoft SQL Server 2012 и ESRI ArcMaps.

Задача 3: Вычленение из массива данных, входящих в аналитические кубы, мастер-данных (согласно методике использования аналитических кубов часть измерений (часто — это классификаторы) трактуются как мастер-данные1), управление мастер-данными комплексной системы визуального анализа геоданных на основе «бизнес-правил» и строгих процессов согласования изменений». Данная задача еще не решалась для SOLAP-систем, но может быть решена с помощью технологии Microsoft SQL 2012 server MDS, появившейся в 2012 г. и позиционируемой как бесплатный компонент к Microsoft SQL 2012 Server.

6. Программные средства для решения SOLAP-задач

6.1. Microsoft SQL 2012 Server Analysis Services (SSAS) [12]

Службы Microsoft SQL 2012 Server Analysis Services позволяют проектировать, создавать и управлять многомерными структурами, которые содержат де-

тализирующие и статистические данные из нескольких источников данных, таких как реляционные базы данных, в одной унифицированной логической модели, поддерживаемой встроенными средствами проведения вычислений.

Службы Analysis Services обеспечивают возможность быстрого, доступного для понимания пользователя, нисходящего анализа крупных количеств данных, основанного на этой унифицированной модели данных, результаты которого могут доставляться пользователям на нескольких национальных языках, с пересчетом на несколько разных валют, с представлением дат в национальном формате. Они применяются для работы с хранилищами данных (DataWarehouse), витринами данных (DataMart), производственными базами данных OLTP и хранилищами оперативных данных, поддерживая анализ данных с предысторией и данных, поступающих в реальном времени.Они также позволяют анализировать большие объемы данных. С их помощью можно проектировать, создавать и управлять многомерными структурами, которые содержат подробные и статистические данные из нескольких источников данных.

Для управления кубами OLAP и работы с ними используется среда SQL Server Management Studio. Для создания новых кубов OLAP и моделей интеллектуального анализа данных в службах SQL Server Analysis Services используется среда Business Intelligence Development Studio (BIDS), представляющая собой среду Microsoft Visual Studio 2008 с расширениями, специфичными для решений бизнес-аналитики. Данный инструмент предоставляет ряд уникальных функций, позволяющих работать с проектами служб Analysis Services и интегрировать проекты служб Analysis Services со службами Reporting Services и Integration Services. К наиболее важным элементам BIDS следует отнести наличие различных конструкторов:

♦ конструктор представлений источников данных обеспечивает возможность добавления или удале-

1 Мастер-данные (Master Data) или НСИ — совокупность постоянной и условно-постоянной информации, необходимой в ИС автоматизации бизнес-процесса. Бизнес-процессом, в рамках которого определена данная НСИ, может быть любой процесс обработки пространственно-распределенной социально-экономической информации.Одна и та же информация может являться или не являться НСИ в зависимости от контекста ее использования. В самом процессе создания НСИ информация, являющаяся нормативно-справочной (например, классификатор ОКАТО т др.) для других процессов, собственно ни нормативной ни справочной не является. Система НСИ обеспечивает хранение, обработку и предоставление постоянной и условно-постоянной информации пользователям системы и предназначена для поддержания (больших) массивов данных в актуальном состоянии, обеспечению полноты, устранению ошибок, контролю целостности и непротиворечивости данных. Модификация хранимых в системе НСИ данных и их структуры допускается только экспертами системы. Все действия по модификации данных строго регламентируются. Пользователями информации выступают прочие ИС предприятия, получающие данные через заранее определенные интерфейсы. Исторически, системы НСИ появились в корпоративных хранилищах данных (DataWarehouse), являющихся источниками данных для OLAP систем, для поддержания корректности корпоративных справочников и классификаторов.

ния объектов, назначения логических первичных столбцов, определения отношений между таблицами, замены таблиц именованными запросами или другими таблицами и добавления именованных вычислений к существующим таблицам в представлении источника данных.

♦ конструктор кубов предоставляет среду для настройки куба и содержащихся в нем объектов. Для приложений на других языках можно добавлять переводы для объектов Analysis Services. При обработке кубов можно просматривать их структуру и данные.

♦ конструктор измерений предоставляет среду для настройки измерения и содержащихся в нем объектов. Для локализуемых приложений можно добавлять переводы для метаданных измерения. При обработке измерений можно просматривать их структуру и данные.

В SQL Server 2012 предусмотрены новые возможности бизнес-аналитики, обеспечивающие гибкую, но мощную аналитику в режиме самообслуживания, которая дополняет традиционный OLAP и решения интеллектуального анализа данных. В состав средств самостоятельно проводимой бизнес-аналитики (BI) входят следующие продукты:

■ф’ PowerPivot для Sharepoint. Новая версия служб Analysis Services, которая может храниться на ферме SharePoint. Экземпляр, который хранится в Sharepoint, является глубокой модификацией служб Analysis Services, в которой реализован новый метод хранения в памяти, позволяющий загружать данные по запросу и управлять использованием и потреблением ресурсов без настройки. Хранимый экземпляр имеет также веб-службу среднего уровня, управляющую обновлением данных, доступом к данным и мониторингом.

■ф- PowerPivot для Excel. Клиентская надстройка для Excel 2010, которая может устанавливаться вместе с Excel 2010. Эта надстройка предоставляет средства для построения многомерных наборов данных в Excel. Надстройка сочетает в себе хранилище сжатых данных, снабженное хранимым в памяти экземпляром служб Analysis Services и существующими средствами визуализации данных Excel, например сводные таблицы и сводные диаграммы.

■ф DAX. В состав PowerPivot для Excel входит новый язык выражений (выражения анализа данных, DAX), упрощающий построение сложных расчетов, использование логики операций со временем и выполнение поиска.

6.2. Microsoft SQL 2012 Server Master Data Services (MDS) [12]

Службы SQL Server Master Data Services являются источником основных данных организации. Интеграция разрозненных операционных и аналитических систем со службами Master Data Services (MDS) обеспечивает централизованный, точный источник данных для всех приложений организации. С помощью служб MDS создается единый источник основных данных, а также поддерживается доступная для аудита запись изменений данных со временем. MDS поддерживает гибкие настраиваемые иерархии, которые можно использовать для группировки и обобщения основных данных. При изменении потребностей бизнеса можно соответствующим образом обновить эти иерархии, меняя структуру формируемых отчетов и включая новые аспекты бизнеса. Эти изменения не приводят к потере данных или появлению дубликатов, что может произойти, если данные управляются несколькими системами, не сообщающимися друг с другом. Бизнес-правила позволяют обеспечить точность данных и уведомлять пользователей о ситуациях, когда данные не удовлетворяют правилам.

MDS включает следующие компоненты и инструментальные средства:

• диспетчер конфигурации службMDS — средство, используемое для создания и настройки баз данных MDS и веб-приложений.

• диспетчер основных данньх — веб-приложение, используемое для управления основными данными организации и выполнения других административных задач и позволяющее постоянно поддерживать точное представление об основных данных компании. (Любые изменения могут быть точно отражены во множестве иерархий, каждую из которых несложно обновить. Кроме того, имеется возможность сохранять версии данных и их структуру, позволяя пользователям работать с самой свежей информацией.). Диспетчер обеспечивает пользователя единым, точным источником для управления основными данными компании; гранулярным, безопасным доступом к основным данным за счет интеграции с Active Directory; гибким моделированием данных, позволяющим определить модель, точно отражающую структуру организации и гибко модифицируемую при изменении потребностей бизнеса; бизнес-правилами, обеспечивающими высокое качество данных; уведомлениями по электронной почте, оповещающими выбранных пользователей или группы об обнаружении несоответствия данных бизнес-правилам; поддержкой версий данных для соз-

дания журнальных моментальных снимков данных и модели; управлением иерархиями с поддержкой как уровневых иерархий, так и менее совершенных иерархий «родители-потомки»; созданием пакетов, применяемых для переноса моделей, бизнес-правил и данных из тестовых систем в производственные.

♦ веб-служба MDS, с помощью которой разработчик может расширять или создавать пользовательские решения MDS для конкретной среды.

♦ база данных MDS, содержащая все сведения, необходимые для системы MDS. Она является основой для развертывания MDS, в ней хранятся параметры, объекты базы данных и данные, необходимые системе MDS, она содержит промежуточные таблицы, используемые для промежуточного хранения данных из исходных систем, и предоставляет схему и объекты базы данных для хранения основных данных из исходных систем. База данных MDS поддерживает управление версиями, в том числе проверку бизнес-правил и уведомления по электронной почте. База данных MDS предоставляет представления для систем-подписчиков, которым надо извлекать данные из базы данных.

На верхнем уровне MDS обладает следующими функциями:

♦ Управление сущностями в стиле «один ответственный пользователь за один справочник или классификатор». Ответственный пользователь может добавлять, редактировать или удалять записи НСИ.

♦ Построение сложных моделей данных справочников и классификаторов НСИ с помощью «фирменного» визуального интерфейса MDS .

♦ Управление иерархиями трех возможных типов: сбалансированные иерархии на базе нескольких сущностей, произвольные конечные иерархии на основе одной сущности, рекурсивные иерархии — возможно загружать иерархии либо строить их в пользовательском интерфейсе.

♦ Управление версиями на уровне моделей данных. Сущности, иерархии и наборы группируются в «модели». Различные версии моделей независимы друг от друга.

♦ Бизнес-правила и «рабочие процессы согласования изменений НСИ» становятся доступными при сопряжении MDS с SharePoint Server 2010 . При наступлении определенных условий автоматически запускается «рабочий процесс согласования изменений». Рабочая версия «модели данных НСИ» обновляется только после согласования «ответственными пользователями».

6.3. ESRI ArcGIS Server [13]

ArcGIS Server предназначен для совместного использования географической информации неограниченным числом пользователей. ArcGIS Server используется на небольших, средних и крупных предприятиях для того, чтобы предоставлять географические информационные ресурсы в виде сервисов по интранет/интернет сетям, оптимизировать внутренние рабочие процессы, разрешать производственные проблемы, координировать деятельность различных служб.

ArcGIS Server предоставляет удобную платформу для создания корпоративной геоинформационной системы, позволяющей:

■ф Управлять всеми пространственными данными и картографическими службами централизованно.

■ф Увеличить производительность существующих картографических web-приложений и создать новые web-приложения, которые представляют собой не просто карты с изменяемым масштабом и получением информации об объектах на карте, но и дают возможность обработки и обновления представляемой информации.

■ф Создать web-приложения, обладающие функциональностью настольных ГИС ArcGIS Desktop.

Внедрить геоинформационную систему в существующую информационную структуру предприятия, объединяя ГИС сервер и пространственные данные с другими информационными системами предприятия, среди которых системы управления отношений с клиентами (CRM) или системы планирования и управления ресурсами предприятия (ERP).

■ф Быстро решать специализированные задачи, создавая приложения, объединяющие географическое содержание с функциональными возможностями ГИС.

■ф Создать корпоративный геопортал и сформировать инфраструктуру пространственных данных.

ArcGIS Server используется, как «коробочное» решение, не требующее специального программирования и серьезной настройки. ArcGIS Server поставляется с рядом готовых к использованию клиентских приложений и служб (программы-просмотровщики, основанные на web-браузере редакторы баз геоданных и т.д.) для картографирования, анализа, сбора, редактирования, распространения и администрирования пространственной информации. Для решения узкоспециализированных задач существуют развитые и хорошо документированные средства разработки

(платформы .NET и JAVA) с помощью которых можно создавать пользовательские приложения.

В рамках корпоративных ГИС, созданных на базе ArcGIS Server, обеспечивается следующая функциональность:

♦ на уровне ГИС-сервер администратора(ов) — управление и конфигурирование серверных объектов, используемых настольными и веб-приложениями, разработанными с использованием технологии ArcGIS Server. Данные функции администратор выполняет через свою локальную сеть с помощью ArcCatalog, настольного приложения ArcGIS. Администратор может управлять выходными каталогами сервера, просматривать статистические и выходные лог-файлы для поиска неисправностей в случае возникновения ошибок. Кроме того, администратор должен использовать инструменты операционной системы для контроля доступа пользователей к ГИС-серверу.

♦ на уровне разработчики приложений и вебслужб — создание и тиражирование .Net и Java веб-приложений, веб-служб и настольных приложений, включающих дополнительную ГИС-функциональность, используя при соединении с ГИС-сервером работающие на нем ArcObjects. Компонент ESRI ArcGIS Mapping for SharePoint позволяет работать с сервером ArcGIS сервер с помощью открытой в браузере страницы портала Microsoft Sharepoint 2010.

♦ на уровне пользователи ArcGIS Desktop — использование ArcMap и ArcCatalog для соединения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с ГИС-сервером через локальную сеть или через Internet. В обоих случаях пользователи могут пользоваться картами и службами геокодирования, опубликованными как объекты map server objects и geocode server objects.

♦ на уровне пользователи веб-приложений — использование соответствующей ГИС-функциональности через интернет-браузер, необходимый для связи с вебприложениями, опубликованными разработчиком.

7. Заключение

Таким образом, в данной статье были описаны современные методы представления и анализа социально-экономических данных с использованием «пространственных» (spatial) OLAP-систем (SOLAP). Показано, что хотя в последние годы данное направление информационных технологий активно развивается, в настоящее время мало технологических решений, позволяющих решать задачи SOLAP-анализа. Для комплексного анализа в режиме «реального времени» социо-экономических данных, привязанных к географическим объектам, в работе предложено современное инновационное, недорогое в своем классе решение на основе широко распространённых, проверенных программных продуктов крупных изготовителей программного обеспечения, причем в настоящее время в академическом и бизнес-сообществе подобных решений пока не отмечено. ■

Литература

1. Фёдоров А., Елманова Н. Введение в OLAP-технологии Майкрософт. — М.: Диалог-МИФИ, 2002. — 272 с.

2. Books Online for SQL Server 2012 — MSDN — Microsoft. — http://msdn.microsoft.com/en-us/library/ ms130214. aspx (режим доступа: декабрь 2012).

3. Luhn H.P A Business Intelligence System. // IBM Journal, Vol 2., 1958, pp. 314-319.

4. Колесов А. На смену Business Intelligence приходит Business Analytics? // PC Week/RE, № 41 (599), 6 ноября — 12 ноября, 2007. — http://www.pcweek.ru/idea/article/detail.php?ID=103694.

5. PC Week Review: бизнес-аналитика, октябрь 2009. — http://www.pcweek.ru/business/article/ detail. php?ID= 120748.

6. Winckler M. Apache Hadoop takes top prize at Media Guardian Innovation Awards. // The Guardian, 25 March, 2011. — http://www.guardian.co.uk/technology/2011/mar/25/media-guardian-innovation-awards-apache-hadoop.

7. http://www.dataplus.ru/Industries/100_GIS/GIS.htm.

8. Bedard Y., T. Merrett & J. Han, Fundamentals of Spatial Data Warehousing for Geographic Knowledge Discovery / Geographic Data Mining and Knowledge Discovery, Taylor & Francis, Vol. Research Monographs in GIS, 2011, No. Chap. 3, pp. 53-73.

9. http://www.spatialytics.org/projects/geomondrian.

10.http://www.sas.com/technologies/bi/tourext/olapviewer_itour_flash.html.

11. http: //www.spotonsystems.com/products/spoton-vantage-maps.

12.Books Online for SQL Server 2012 — MSDN — Microsoft. — http://msdn.microsoft.com/en-us/library/ ms130214.aspx (режим доступа: декабрь 2012).

13.http://www.dataplus.ru/Soft/ESRI/ArcGIS/ArcGISServer/Index.html.

i Надоели баннеры? Вы всегда можете отключить рекламу.