Научная статья на тему 'Разработка сервисов анализа данных веб-ориентированной геоинформационной системы'

Разработка сервисов анализа данных веб-ориентированной геоинформационной системы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
310
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОСТРАНСТВЕННЫЕ ДАННЫЕ / АНАЛИЗ / ПРОСТРАНСТВЕННОЕ ИЗВЛЕЧЕНИЕ ЗНАНИЙ. / СЕРВИС-ОРИЕНТИРОВАННАЯ АРХИТЕКТУРА. / ВЕБ-ГИС

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ощепков Сергей Сергеевич, Рыбалов Никита Борисович, Жуковский Олег Игоревич

Рассмотрены основные способы проведения пространственного анализа данных веб-ориентированных ГИС. Представлена сервис-ориентированная архитектура анализа пространственных данных в современных веб-ГИС.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ощепков Сергей Сергеевич, Рыбалов Никита Борисович, Жуковский Олег Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article presents the general ways of spatial analysis of data in web-based GIS. Service-oriented architecture of analysis of spatial data in modern web-GIS is stated.

Текст научной работы на тему «Разработка сервисов анализа данных веб-ориентированной геоинформационной системы»

5. McPeak S., Necula G. C. Elkhound: A Fast. Practical GLR Parser Generator // Proceedings of Conference on Compiler Constructor (CC04). 2004.

6. C/C++ Development Tools [Electronic Resource] / Eclipse Project, http://www.eclipse.org/cdt/

7. Dehydra [Electronic Resource] / Mozilla Corp. https://deveioper.mozilla.org/en/Dehydra

8. Elkhound and Elsa [Electronic Resource] / Scott McPeak et al. http://www.cs.berkeley.edu/~smcpeak/ elkhound

9. GCC. ihe GNU Compiler Collection [Electronic Resource] / GNU Project, http://gcc.gnu.org/

10. GNU Compiler Collection Internals [Electronic Document] / Richard M. Slallman et al. http://gcc.gnu. org/onlinedocs/gccint/. 2008

11. LALR parser generator [Electronic Resource] / SourceForge.net http://sourceforge.nct/projects/lpg/

12. NetBeans C/C++ Support (Electronic Resource] / Sun Microsystems, http://cnd.netbeans.org/

13. NetBeans IDE [Electronic Resource] / Sun Microsystems, http://www.netbeans.org/

14. Pork [Electronic Resource] / Mozilla Corp. https://devcloper.mozilla.org/en/Pork

С. С. Ощепков, Н. Б. Рыбалов, О. И. Жуковский Разработка сервисов анализа данных веб-ориентированной

геоинформационной системы

Технологии геоинформационных систем (ГИС) для управления и мониторинга деятельности предприятий либо административных структур используются давно. В связи с этим происходит накопление больших объемов данных, которые используются в основном для визуализации географических объектов и предоставления справочной и описательной информации о них. Несомненно эта информация представляет собой определенную ценность, но реальную пользу она принесет только при ее использовании для решения определенных прикладных задач. Одна из наиболее важных задач прикладного уровня в ГИС — задача пространственно-временного анализа накопленных данных, но. к сожалению. в современных веб-ориентированных ГИС данная задача ограничивается функциями измерения расстояния, построения буферных зон, нахождения маршрута между двумя заданными точками и просмотра тематических карт по имеющейся статистической информации.

На самом же деле анализ должен проводиться с целью выявления наличия, вида взаимосвязей и закономерностей в пространственном распределении отдельных объектов, их классов или характеристик [1].

При проектировании архитектуры современной веб-ориентированной ГИС авторами

статьи был сделан выбор в пользу сервис-ориентированного подхода (SOA-архитектура) [2]. В рамках концепции SOA (service-oriented arhi-tector) были рассмотрены функции пространственного анализа, расширяющие функциональные возможности ГИС, и затем представлены в виде отдельных сервисов.

На рисунке представлена сервис-ориентированная (SOA) архитектура блока анализа веб-ориентированной ГИС, сервисы в которой объединяются в группы по способу реализации и специфике анализа:

сервисы подготовки данных для анализа; базовые сервисы анализа; специализированные сервисы анализа; сервисы представления результатов анализа.

Сервисы подготовки данных для анализа

Для получения качественных результатов проводимого анализа необходимо правильно обработать и подготовить пространственные данные.

Начальный этап подготовки данных для использования их в веб-ориентированных ГИС извлечение знаний о пространственном распределении огромного набора географических объектов. Сервис пространственного извлечения знаний (spatial data mining) решает данную задачу, используя инструментарий spatial data mining. Извлечение знаний— это процесс

f Сервисы представления результатов анализа

Сервис визуализации результатов анализа

1Z

Базовые сервисы анализа

lz

Специализированные сервисы анализа

С

Сервисы оетевого анализа

Сервис тематического картофафировахия ^ ^Сервис построения пространственных загросоа

) С

Сервис классификации водопроводных колодцев

Сервис расчета распространения заболевания

3

Другие сервисы

подготовки данных д ля анализа

^ Сервис spatial data mining

Единое хранилище пространственных данных

lz

Пространственные данные

3

Сервис-ориентированная архитектура блока анализа веб-ориентированной ГИС

оонаружения в сырых данных ранее неизвестных. нетривиальных, практически полезных и доступных для интерпретации знаний или шаблонов, необходимых для принятия решений в различных сферах человеческой деятельности [3]. Различие же между классическим и пространственным извлечением состоит в том. что в классическом статистическом анализе элементы выборки получаются независимо, а в пространственном — предположение о независимости становится неприемлемым из-за наличия высокой степени автокорреляции в пространственных данных. При решении задач пространственного извлечения знаний необходимо рассчитывать эту величину и внедрять ее в классические методы извлечения знаний (data mining). Задача пространственного извлечения

знаний состоит в автоматизации обнаружения зависимостей между объектами или классами объектов и предоставлении полученных результатов для дальнейшего исследования.

В основу технологий классического и пространственного извлечения знаний положена концепция шаблонов (patterns), представляющих собой закономерности. В результате обнаружения этих скрытых от невооруженного глаза закономерностей решаются задачи извлечения знаний. Различным типам закономерностей, которые могут быть выражены в форме, понятной человеку, соответствуют определенные задачи. Наиболее часто решаемые задачи в пространственном извлечении знаний — задачи классификации, кластеризации и ассоциации [4].

Задача классификации — формализованная, в которой имеется множество объектов (ситуаций), разделенных некоторым образом на классы. Задано конечное множество объектов, для которых известно, к каким классам они относятся. Это множество называется выборкой. Классовая принадлежность остальных объектов неизвестна. Требуется построить алгоритм, способный классифицировать произвольный объект из исходного множества. Другими словами, необходимо оценить значение одного атрибута отношения на основе других атрибутов этого отношения. Частные случаи проблемы классификации — это задача определения местоположения тех или иных объектов (например, расположения станций технического обслуживания или магазинов в пределах города) и задача тематической классификации, которая тесно связана с анализом пространства, так как в большинстве ситуаций соседние объекты принадлежат одному и тому же классу.

Задача кластеризации — это разбиение заданной выборки объектов (ситуаций) на непересекающиеся подмножества, называемые кластерами. так. чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Другими словами, с помощью алгоритмов классификации можно из огромного числа разнородных географических объектов выделить группы или кластеры, которые формируются на основе критерия "сходства". используемого для определения связей между значениями характеристик объектов, и представить полученные результаты в качестве картографической основы для веб-ориентиро-ванной ГИС.

Задача ассоциации, или установления взаимодействия между атрибутами. Быстрый поиск-шаблонов в больших массивах данных — необходимое условие при формировании пространственной информации для ГИС. Один из самых простых и качественных приемов при этом — поиск закономерности между связанными событиями в наборе данных и выявление правил ассоциации. При решении задачи ассоциации устанавливается причинно-следственная связь между значениями характеристик объектов. Отличие задачи ассоциации от двух предыдущих задач извлечения знаний состоит в том, что поиск закономерностей осуществляется не на основе свойств анализируемого объекта, а между несколькими событиями, которые происходят одновременно [5].

Следующим этапом подготовки данных для веб-ориентированной ГИС необходимо считать способ организации хранения информации, полученной в результате проведенного анализа. Существует множество подходов к хранению пространственных данных, но самым удобным, наиболее защищенным и доступным, по мнению авторов, является единое хранилище пространственных данных [6].

Остальные сервисы пространственного анализа выступают в качестве определенных прикладных функций веб-ориентированной ГИС. причем данные сервисы могут решать как общие задачи для разных ГИС (базовые сервисы анализа), так и узкоспециализированные для каждой ГИС в отдельности (специализированные сервисы анализа).

Базовые сервисы анализа К общим сервисам анализа, используемым в ГИС, относятся сервисы: сетевого анализа:

тематического картографирования; построения прост ранственных запросов. Сервисы сетевого анализа. Сетевой анализ позволяет пользователю решать различные задачи на пространственных сетях связных линейных объектов (реки, дороги, трубопроводы, линии электропередач и т. п.) в зависимости от области применения ГИС. В классическом представлении сеть считается набранной из линий, которые могут иметь не более двух общих точек с другими линиями — начала и конца. Математически сети описываются теорией графов, а решение многих сетевых задач дает линейное программирование. Как правило. решением задач сетевого анализа является определение ближайшего, наиболее выгодного, кратчайшего пути, определения уровней нагрузки на сеть, определения зон влияния на объекты сети других объектов.

Сервис тематического картографирования. Основной целью реализации данного сервиса является выделение классов (тем) пространс-твенно-распределенных объектов, имеющих схожие значения параметров, по которым и проводится тематическая классификация объектов. При построении тем пользуются методами классификации и кластеризации. Если число тем известно, то необходимо только определить принадлежность того или иного географического объекта к определенному классу, т. е. воспользоваться методами классификации. В случае, когда число классов неизвестно, эти

классы и соответствующие им объекты выявляют применяя методы кластеризации. Результат работы данного сервиса — построение тематически окрашенной карты.

Сервис построения пространственных запросов. Основанием для реализации сервиса является то обстоятельство, что пространственным объектам свойственно находиться в топологическом отношении друг с другом и описываться теми или иными геометрическими характеристиками (длина, периметр, площадь).

Топологические операции включают установление отношений смежности, связности между объектами. При проведении анализа важной информацией является взаимное расположение объектов относительно друг друга. СУБД, являющиеся составной частью ГИС, поддерживают составление запросов на выборку объектов по определенным условиям. При создании таких запросов могут учитываться не только операторы отношений (равно, больше, меньше и др.), логические (и, или, не), арифметические (сложение, вычитание и др.). но и пространственные операторы (соприкасаются. пересекаются, не пересекаются, содержат, находятся внутри, покрывают, покрываются, равны). Пространственные операторы отображают межобъектные топологические отношения между объектами карты [7].

Геометрический анализ включает измерение пространственных характеристик, объектов. Данный тип анализа наиболее широко распространен, так как не требует сложных вычислений и включает в себя функции расчета площадей, длин, периметров объектов, измерения расстояний на карте.

Реализация сервиса подразумевает поиск объектов пространственной базы данных по различным критериям. Критериями в данном случае служат топологические и геометрические свойства объектов. Основным инструментом для поиска объектов является конструктор пространственных запросов, при помощи которого происходит определение условий поиска объектов. Результатом запроса является выборка объектов, представленная в виде таб-

лицы. отдельного слоя на электронной карте, либо выделения объектов, удовлетворяющих условиям поиска.

Специализированные сервисы анализа. Набор данных сервисов определяется теми задачами, которые решаются с помощью самой ГИС. Например, если ГИС применяется в здравоохранении. то важно знать и уметь выявлять области распространения того или иного заболевания в зависимости от различных факторов (социально-экономических. природных и т. п. ). При использовании ГИС для управления генеральным планом промышленного предприятия можно с помощью методов пространственного анализа рассчитать и определить местоположение водопроводных колодцев, затапливаемых талой водой весной и прочие условия. В зависимости от способа решаемой задачи узкоспециализированные сервисы могут использовать методы и алгоритмы как spatial data mining, так и базовых сервисов.

Сервисы представления результатов анализа.

Результаты выполнения функций пространственного анализа можно представлять в различном формате в зависимости от типа производимого анализа, но наиболее наглядны отображения в виде электронных карт. Операции зонирования могут быть основаны на формальных методах кластерного анализа в пространстве признаков и перенесения полученных результатов кластеризации в географическое пространство с последующим отображением на электронной карте в простом и наглядном виде. Результаты выполнения запросов к пространственной базе данных могут содержать десятки объектов, поэтому их лучше всего представить в табличном виде с возможностью отображения полученной выборки или ее части.

Предложенный набор сервисов для проведения пространственного анализа в среде веб-ориентированной ГИС будет включен в состав ГИС для ведения генерального плана крупных промышленных предприятий металлургической и нефтеперерабатывающей отраслей для решения задач управления, планирования, размещения и мониторинга подведомственных объектов и инженерных коммуникаций.

СПИСОК ЛИТЕРАТУРЫ

I. И. А. Чубукова. Dala Mining: Учеб. пособие. 2. Жуковский О.И., Рмбалов Н.Б. Архитектура

М.: Изд-во: "Интернет-университет информацион- корпоративной WEB-ориентированной ГИС // ных технологий". 2008. 384 с. Доклады ТУСУР. 2008. №2 (18). Ч. 2. С. 46-57.

3.Баргесян A.A., Куприянов М. С., Степаненко В. В.

и др. Технологии анализа данных: Data Mining. Visual Mining. Text Mining. OLAP. Изд. 2-е. СПб.: БХВ-Петербург. 2008. 384 с.

4. Капра.юв A.B., Кошкарев A.B., Тнкунов A.B. Основы геоинформатики: Учебное пособие для студенческих вузов. В 2 кн. Кн. 1. М.: Изд. центр "Академия", 2004. 352 с.

5. Шаши Шекхар. Санжей Чаула. Основы пространственных баз данных / Пер. с англ. М.: КУДИЦ-ОБРАЗ. 2004. 336 с.

6. Ехлаков Ю.П., Жуковский О.И., Рыбалов Н.Ь.

Принципы построения web-ориентированной ГИС промышленного предприятия // Изв. Томского политехи. ун-та. 2006. Т. 309. № 7. С. 146-152.

7. Ошепков С.С., Лакеев U.C., Жуковский О.И. Задачи пространственно-временного анализа в среде ВЕБ-ГИС сервера // Современные техника и технологии: Сб. тр. XIV междунар. науч.-практ. конф. студентов, аспирантов и молодых ученых, г. Томск. 24-28 марта 2008г. В 3 т. Т. 2. Томск: Изд-во Томск, политехи, ун-та, 2008. С. 364-365.

Л. В. Кулагина, Н. В. Кулагин Механизм управления информационной системой

на многосерверной платформе

При разработке информаш юнных систем (ИС), построенных на распределенной базе данных (БД), одна из наиболее сложных задач — организация взаимодействия входящих в состав системы функциональных элементов (ФЭ). представляющих собой функционально завершенные программные единицы приложений — процедуры, функции, объекты и серверов, которые хранят процедуры баз данных, команды Тгапвас^ОЬ.

Рассмотрим ИС как некоторый объект, который состоит из набора функциональных элементов /\,..., Рп и может находиться в конечном множестве точек абстрактного пространства состояний. Каждое из состояний ИС зависит от значений переменных общего поля данных и характеризуется признаками Рг .... Рт в абстрактном многомерном пространстве состояний. Рассмотрим один из них более подробно. Признак состояния — это логическая переменная, принимающая одно из двух значений—-нуль либо единицу. Пространство признаков представляет собой гиперпространство. Поскольку признак может принимать одно из двух значений, то функционирование ИС можно описать в виде переходов между вершинами /«-мерного гиперкуба. Значение конкретного признака зависит от условий данного признака, наложенных на общее поле данных ИС. Проверка условий и изменение признаков состояний осуществляются последовательным перебором этих признаков.

Управление функциональными элементами предлагается проводить на двух уровнях: при-

ложения (П) и базы данных. Управление ФЭ на уровне П рассматривалось в работах [1-3].

Для описания структуры приложения любого уровня сложности достаточно набора ФЭ и анализатора состояний. Создание анализатора состояний, использующего непосредственно проблемные данные, для каждого приложения является задачей уникальной и не менее сложной. чем разработка структуры взаимодействия ФЭ. Для упрощения данной задачи определим уровень абстрактного описания состояния приложения. Описывать данные состояния наиболее просто, если использовать приемы объектно-ориентированного программирования (ООП), однако при описании структуры программы можно и не использовать ООП. В рамках ООП введем еще один элемент, представляющий собой класс особых объектов — признаки состояния (ПС), которые принимают одно из двух значений: "Установлен" или "Сброшен". Структуру объекта ПС отражает табл. 1. Объект состоит из методов для изменения основного поля, принятия и проверки условий применительно к данным задачи. В ПС разные функциональные элементы можно включить тремя способами, которые отличаются условием запуска ФЭ. С каждым способом запуска будут связаны свои ФЭ. Пусть с первым способом запуска (назовем его "Пролог") связаны определенные ФЭ. которые полностью и последовательно срабатывают при каждом появлении значения "Установлен". С установкой значения "Сброшен" связан второй

i Надоели баннеры? Вы всегда можете отключить рекламу.