УДК.528.94 М.В. Спесивцев СГГ А, Новосибирск
МОДЕЛИ ДАННЫХ ДЛЯ ФОРМИРОВАНИЯ БАНКА ГЕОИНФОРМАЦИИ
На современном этапе развития общества принятие эффективных управленческих решений невозможно без анализа информации, полученной из различных источников. Сбор, систематизация и оперативный анализ такой информации невозможны без внедрения современных компьютерных технологий. С развитием ГИС-технологий появились новые запросы, которые стали требовать все более оперативной информации. В связи с этим возникла потребность в электронно-цифровой информации, которая обладает гибкостью, оперативностью, способностью быстро обновляться, обрабатываться и храниться в понятном для компьютера виде.
Необходимым условием ведения любой деятельности, связанной с принятием решений по управлению территориями, планированием и прогнозным моделированием, является наличие банка информации о конкретном географическом пространстве, то есть банка геоинформации. Геоинформация разделяется на геометрическую и семантическую части. Геометрическая часть - это информация о визуальном представлении объекта геопространства в пространственно-временной координатной системе. Семантическая часть - это атрибутивное описание объекта геопространства. Таким образом, геоинформация - это упорядоченная пространственно координированная информация об объектах геопространства в цифровой компьютерно-воспринимаемой форме, предназначенная в качестве исходного материала для моделирования геопространства в интересах конкретного потребителя, использующего геоинформационные системы [3].
Банк геоинформации дает возможность свободы и легкости доступа к данным со стороны государственных и коммерческих организаций и простых граждан.
Банк геоинформации предлагается формировать на основе распределенных баз данных. Это можно обосновать возможностью его логического разбиения на тематические модели, которые будут создаваться и вестись различными инженерными службами, что позволит уменьшить вероятность потери информации вследствие программных и аппаратных сбоев, то есть повысится автономность информационных блоков, как составляющих банка данных; позволит эффективно использовать имеющееся оборудование; рационально загрузить вычислительную сеть и повысить доступность к данным.
На фазе логического проектирования баз данных возник вопрос о выборе модели БД и их СУБД. В настоящее время наиболее распространенны модели [2]:
- Иерархическая;
- Сетевая;
- Реляционная;
- Объектно-ориентированная;
- Объектно-компонентная.
Иерархическая БД состоит из упорядоченного набора деревьев, более точно, из упорядоченного набора нескольких экземпляров одного типа дерева. Тип дерева состоит из одного «корневого» типа записи и упорядоченного набора из нуля или более типов поддеревьев (каждое из которых является некоторым типом дерева). Тип дерева в целом представляет собой иерархически организованный набор типов записи (рис. 1) [1].
Здесь «Отдел» является предком для «Начальник» и «Сотрудники», а «Начальник» и «Сотрудники» - потомки «Отдел». Между типами записи поддерживаются связи.
База данных с такой схемой могла бы выглядеть следующим образом (рис. 1) [1].
Отдел
310
25 I 1250000
т
Начальник I Сотрудники
1 846 Иванов 33 | 34 Иванов | 100000
83 Сидоров 100010
Рис. 1. Пример иерархической БД
Все экземпляры данного типа потомка с общим экземпляром типа предка называются близнецами. Для БД определен полный порядок обхода -сверху-вниз, слева-направо.
Примерами типичных операторов манипулирования иерархически организованными данными могут быть следующие:
- Найти указанное дерево БД (например, отдел 310);
- Перейти от одного дерева к другому;
- Перейти от одной записи к другой внутри дерева (например, от отдела - к первому сотруднику);
- Перейти от одной записи к другой в порядке обхода иерархии;
- Вставить новую запись в указанную позицию;
- Удалить текущую запись.
Автоматически поддерживается целостность ссылок между предками и потомками. Основное правило: никакой потомок не может существовать без своего родителя. Аналогичное поддержание целостности по ссылкам между записями, не входящими в одну иерархию, не поддерживается.
Иерархические модели хорошо подходят для задач с явно выраженной иерархически соподчиненной структурой информации и запросов. Они обладают низким быстродействием, трудно модифицируемы, но эффективны с точки зрения организации машинной памяти.
Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков [1].
В сетевых моделях каждая запись в каждом из узлов сети может быть связана с несколькими другими узлами; кроме данных, записи содержат в себе указатели, определяющие местоположение других записей, связанных с ними. Такие модели очень трудно редактировать, например, удалять и создавать записи, так как вместе с данными нужно редактировать и указатели. Подобные модели хорошо работают в случае решения сетевых, коммуникационных задач (рис. 2).
Тип связи определяется для двух типов записи: предка и потомка. Экземпляр типа связи состоит из одного экземпляра типа записи предка и упорядоченного набора экземпляров типа записи потомка.
В иерархической и сетевой моделях для поиска конкретной записи необходимо вначале определить путь поиска к записи, а затем просмотреть все записи, находящиеся на этом пути.
Реляционные базы данных завоевали самую широкую популярность. Они свободны от всех ограничений, связанных с организацией хранения данных и спецификой запоминающих устройств. Эти модели имеют табличную структуру, строки таблицы соответствуют одной записи сведений об объекте, а столбцы содержат однотипные характеристики всех объектов. Всевозможные способы индексации данных существенно сокращают время поиска и запроса к данным.
Реляционная модель данных позволяет разделить проблему управления пространственными данными на две части:
- Представление геометрии объектов, топология объектов;
- Работа с атрибутами объектов.
Основное преимущество данного метода хранения геоинформации состоит в следующем:
- Атрибуты и пространственная информация могут храниться в разных блоках банка данных;
- Атрибуты могут быть удалены, изменены без изменения пространственной базы данных;
- Атрибуты могут быть привязаны к пространственным единицам и представлены разными способами.
Одно из основных преимуществ реляционных баз данных - применение унифицированного языка запросов SQL.
В объектно-ориентированных базах данных отсутствует понятие таблиц и записей, вместо них выступают понятия класса и объекта класса. Любая сущность реального мира моделируется в виде объекта. Объекты характеризуются набором атрибутов (состояние объекта), которые определяют их текстовые, численные, графические, пространственные и иные размерности. Поведение объекта - набор методов, оперирующих над состоянием объектов. Объекты, имеющие одинаковый набор атрибутов, составляют класс объектов. Один и тот же объект не может принадлежать более одному классу [2].
Для создания ГИС, более тесно связанной с реальным миром, обеспечения самых широких возможностей для наращивания функциональности системы и ее настройки, в частности, поддержки собственных моделей данных со специфическими объектами, а также создания программного обеспечения более высокого качества - с точки зрения его использования и поддержки - за счет применения современных технологий разработки, целесообразно использовать объектно-компонентную модель. Это обусловлено тем, что на практике реализуется множество объектно-ориентированных принципов, общеприменимых при проектировании программного обеспечения.
Компонент - это двоичный программный код, который может использоваться повторно. Благодаря своей самодостаточности и автономности, компоненты являются строительными блоками, которые могут быть собраны в более крупные системы и способны обеспечить структурированную и безопасную работу системы. Поддерживается возможность наследования и полиморфизма.
Наследование - это возможность использовать существующий код в других компонентах.
Полиморфизм - некоторый процесс, при котором каждый объект имеет собственную реализацию для операций (создание, рисование, удаление и т. д.).
Объектно-компонентные структуры позволяют унифицировать хранение геометрии и атрибутики при отображении взаимосвязанных объектов. Огромный минус - отсутствие декларативного стандартного языка запросов, синхронизацией доступа и управлением транзакциями.
На основе перечисленных преимуществ и недостатков в каждой из моделей предлагается использовать комбинированный метод проектирования баз данных. Пространственный банк данных, в котором хранится информация о пространственной привязке объектов, следует проектировать на основе объектно-компонентного подхода, семантический банк, который
содержит атрибутивную информацию об объектах, - на основе реляционного подхода. В этом случае сохраняются основные преимущества каждой из моделей, а именно: хранение и гибкость оперирования сложными объектами (объектно-компонентная модель), использование структурированного языка запросов SQL (реляционная модель).
Каждая семантическая запись связывается с определенным для нее объектом через уникальный идентификатор, создаваемый автоматически вместе с объектом. Связь через идентификатор позволит привязать к объекту более одной записи через косвенную связь, создать сложную иерархию связей атрибутивных данных между собой с прямой или косвенной привязкой к объекту (рис. 3). Объектно-компонентный подход допускает существование объектов без атрибутивных данных, например, объектов, используемых в качестве условных знаков.
Таким образом, комбинированный метод позволяет исключить недостатки каждой из моделей и сохранить их преимущества.
Объект 1
Ло Улица Дом
1\ Алтайская 144
2 Калинина 80
Nr
Объект 2
ID Жильцы дома
r Иванов
1 Петров
1 Сидоров
Рис. 3. Пример сложной иерархии связей атрибутивной информации с прямой
и косвенной привязкой к объекту
Предлагаемый подход обеспечивает базовую структуру, обеспечивающую каждому пользователю возможность расширить собственную информационную модель, позволит гибко оперировать объектами моделируемого геопространства и наиболее близко отвечать основным коммерческим и не коммерческим целям и нуждам государственных и не государственных учреждений.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Глушаков С.В., Ломотько Д.В. Базы данных. - М., 2002. - 504 с.
2. Капралов Е.Г., Кошкарев А.В., Тикунов В.С. Основы геоинформатики. - М.: Издательский центр «Академия», 2004. - 352 с.
3. Карпик А.П. Методологические и технологические основы геоинформационного обеспечения территорий. - Новосибирск: СГГА, 2004. - 260 с.
© М.В. Спесивцев, 2005