Научная статья на тему 'Создание иерархической структуры данных в среде MS SQL Server'

Создание иерархической структуры данных в среде MS SQL Server Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
671
129
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Создание иерархической структуры данных в среде MS SQL Server»

необходимости иметь возможность освободить эти ресурсы. Существует возможность создавать batch (это группа различных DataStage job или одной DataStage job, но с разными параметрами, которые должны выполняться последовательно), определять входные параметры для группы или другие свойства. Контроль за работой группы производится аналогично контролю за DataStage job.

DataStage Manager - графический интерфейс для просмотра и редактирования содержания репозито-рия. Он используется для определения: структуры источников данных, структуры таблиц и колонок, через которые будет осуществляться доступ к источникам данных. Аналогичные параметры определяются для приемника данных.

DataStage Administrator - графический интерфейс для определения прав пользователей, создания проектов и перемещения проектов. При помощи данного модуля можно создавать новые проекты и определять свойства для этих проектов. Можно выполнять export и import вашего проекта для переноса его в другое место. Большинство задач по конфигурированию DataStage выполняется из модуля DataStage Administrator, однако для этого пользователь должен принадлежать к группе root или uvadm для Unix или Administrator group для Windows NT. Для предотвращения несанкционированного доступа к DataStage проекту можно связать пользовательские группы в системе (user group) с соответствующими правовыми категориями. В DataStage существует всего три категории:

• DataStage Developers - пользователи имеют полный доступ ко всем элементам и областям DataStage проекта;

• DataStage Operator - пользователи имеют право только запускать и управлять DataStage job;

• None - это пользователи которые не имеют права соединяться с DataStage проектом.

В заключение отметим, что DataStageXE успешно используется такими компаниями, как: SIEMENS, IBM, DEUTSCHE BANK, AMERICAN EXPRESS, MOTOROLA, DHL, AT&T, XEROX, LUFTHANSA, RENAULT, FRANCE TELECOM, WHIRLPOOL, BARCLAYS и многими другими.

В России DataStageXE применяется в ЛУКОИЛ (Пермь), а такие компании как Philip Morris, ИЛИМ ПАЛП, АвтоВАЗ, КОМСТАР уже планируют использовать DataStage.

Мы дали всего лишь краткий обзор DataStage и обозначили место этого продукта в технологии Informix по построению хранилищ данных. Informix широко признан в мире как лидер в области технологии корпоративных СУБД - от небольших рабочих групп до очень крупных приложений с параллельной обработкой. Инструментальные средства разработки приложений, серверы баз данных Informix позволяют компании быть на переднем крае информационных технологий, включая такие области, как хранилища данных, высокопроизводительная оперативная обработка транзакций (OLTP), OLAP и Web/электронная коммерция. Дополнительная информация по технологии Informix и DataStageXE находится на Web-сайтах http://www.Informix.com или http://www.Informix. ru.

Список литературы

1. Ardent DataStage "Server Job Developer's Guide" version

4.1.1.

2. Ardent DataStage "Core Developer's Guide" version 4.1.1.

3. Ardent DataStage "Operator's Guide" version 4.1.1.

4. Ardent DataStage "Server Job Tutorial" version 4.1.1.

5. Quality Manager "User's Guide" version 4.8.

6. MetaStage "User's Guide" version 2.1.

7. Quality Manager "Methodology and Application Guide" version 4.8.

СОЗДАНИЕ ИЕРАРХИЧЕСКОЙ СТРУКТУРЫ ДАННЫХ В СРЕДЕ MS SQL Server

Л.Н. Полякова

Реляционные базы данных, разделенные на логически связанные между собой составляющие, именуемые таблицами, способны хранить сложные структуры данных от линейных списков до иерархических и сетевых рекурсий.

Рассмотрим иерархическую рекурсию на примере базы данных для хранения и модификации информации о сотрудниках некоторой организации и об их руководителях, являющихся сотрудниками той же организации [1]. Информация как о самом сотруднике, так и о его руководителе содержится в одной и той же сущности emp_mgr. Чтобы сослаться на руководителя сотрудника, следует создать рекурсивную связь «руководит/подчиняется» (связь lead для сущности emp_mgr показана на рисунке 1).

5

Связь «руководит/подчиняется» позволяет хранить древовидную иерархию подчиненности сотрудников, когда руководитель (экземпляр родительской сущности) может иметь множество подчиненных (экземпляров дочерней сущности), но подчиненный имеет только одного руководителя

(рис. 2). При наличии рекурсивной связи одна и та же сущность является и родительской, и дочерней одновременно.

Для каждого сотрудника введем дополнительный атрибут No-OfReports - количество подчиненных.

На основе логической модели данных (рис. 1) в среде MS SQL Server может быть сгенерирована физическая модель путем выполнения следующих SQL-операторов: USE BASA

IF EXISTS ( SELECT TABLE_NAME

FROM INFORMATION_SCHEMA.TABLES WHERE TABLE_NAME='emp_mgr') DROP TABLE emp_mgr GO

CREATE TABLE emp_mgr

(emp CHAR(2) PRIMARY KEY, mgr CHAR(2) NULL, NoOfReports INT DEFAULT 0,

CONSTRAINT fk_emp FOREIGN KEY (mgr) REFERENCES emp_mgr (emp))

Обеспечение целостности данных

Целостность, непротиворечивость и достоверность информации в таблицах с рекурсивными связями обеспечиваются выполнением ряда правил, записанных посредством формул в языке исчисления предикатов первого порядка.

При формировании правил будем исходить из двух множеств данных: De ={x} - множество сотрудников и Dm ={y} - множество руководителей. Причем Dm с De. Введем отношение «руководит/подчиняется» R, которому отвечает некоторое подмножество R с De x Dm:

R={(x, y) I x e De , y e Dm OR y = NULL}, то есть элемент x подчиняется элементу y или элемент y является руководителем элемента x.

Правило 1. Каждый сотрудник имеет только одного руководителя:

Vx 3y ((x, y) e R, (y#z)) ^ (Vz (x, z)é R). (1) Правило 2. Каждый сотрудник не является сам себе руководителем:

Vx (x, x)g R. (2)

Правило 3. Каждый руководитель является в первую очередь сотрудником: Vy 3x ((x, y) e R,

y#NULL)^(3 z (y, z) e R). (3)

Правило 4. Имеется только один сотрудник (директор организации), который никому не подчиняется:

3y 3x ((x, y) e R, y = NULL, (z#x))^(Vz (z, y) É R). (4)

Правило 5. Правило 2 необходимо усилить. Каждый сотрудник не должен быть себе руководителем не только непосредственно, но и опосредствованно через других сотрудников.

Введем отношение Я' - транзитивно замкнутое относительно отношения Я: Я с Я', ((х, у) е Я', (у, г) е Я') ^ ((х, г) е Я', (х #г)). Тогда правило 5 имеет вид: Ух (х, х) е Я'. (5)

Правило 6. Для каждого сотрудника определена функция, возвращающая количество сотрудников, находящихся у него в непосредственном подчинении:

Ух ф(х)=к^(3у1; ..., ук (у , х) е Я,

Уг#у1; ..., ук (г, х)йК). (6)

Реализация правил целостности и достоверности информации при модификации данных в таблице с рекурсивными связями показана в таблице, где символ «*» означает, что правило при модификации данных в таблице не нарушается, а символ «-» говорит, что нарушение правила возможно.

_Таблица

INSERT UPDATE DELETE

Правило 1 PK PK *

Правило 2 - - -

Правило 3 FK FK FK

Правило 4 - - -

Правило 5 * - *

Правило 6 TR TR -

Управление целостностью осуществляется посредством ограничений первичного и внешнего ключа, а также за счет использования триггеров. Ограничение первичного ключа PK (PRIMARY KEY) и ограничение внешнего ключа FK (FOREIGN KEY) являются основным механизмом для поддержания ссылочной целостности между таблицами реляционной базы данных [2].

Ограничение первичного ключа PK делает каждую строку данных уникальной, обеспечивая тем самым выполнение правила 1 при добавлении и изменении записи в таблице emp_mgr. Удаление любой записи к нарушению правила 1 не приводит.

Правило 3 обеспечивается ограничением внешнего ключа FK, которое не позволит добавить запись о сотруднике, руководитель которого отсутствует в таблице emp_mgr. Удаление сотрудников, имеющих подчиненных, будет блокировано.

Как видно из таблицы, выполнение правил 2, 4, 5 и 6 не обеспечивается ограничениями первичного PK и внешнего FK ключа. Для проверки и обеспечения целостности данных в этом случае могут быть использованы триггеры, выполняемые всякий раз при вставке, замене или удалении записи в таблице.

Триггеры для добавления и изменения записи

Для реализации правила 6 в [3] представлены триггеры для добавления и изменения записи в таблице emp_mgr. Основная задача триггера, обрабатывающего вставку записей в таблицу emp_mgr, заключается в увеличении на 1 числа подчиненных у вышестоящего руководителя. Рассмотрим триггер emp_ins, выполняемый при добавлении записи в таблицу с рекурсивными связями emp_mgr:

Рис. 2. Пример иерархической структуры данных

6

IF EXISTS ( SELECT name FROM sysobjects WHERE name='emp_ins' AND type='TR') DROP TRIGGER emp_ins GO

CREATE TRIGGER emp_ins ON emp_mgr FOR INSERT AS

DECLARE @e CHAR(2), @m CHAR(2) DECLARE e1 CURSOR FOR

SELECT emp_mgr.emp FROM emp_mgr, inserted WHERE emp_mgr.emp=inserted.mgr OPEN e1

FETCH NEXT FROM e1 INTO @e WHILE @@FETCH_STATUS=0 BEGIN

UPDATE emp_mgr

SET emp_mgr.NoOfReports= emp_mgr.NoOfReports+1 WHERE emp_mgr.emp=@e FETCH NEXT FROM e1 INTO @e END

CLOSE e1 DEALLOCATE e1

Формирование таблицы emp_mgr, соответствующей структуре рисунка 2, показано в левом окне рисунка 6. Столбец NoOfReports - количество подчиненных - формируется триггером emp_ins.

Приведем из [3] текст триггера emp_upd, который выполняется при изменении записи в таблице emp_mgr:

IF EXISTS ( SELECT name FROM sysobjects WHERE name='emp_upd' AND type='TR') DROP TRIGGER emp_upd GO

CREATE TRIGGER emp_upd ON emp_mgr FOR UPDATE AS

IF UPDATE(mgr) BEGIN

UPDATE emp_mgr

SET emp_mgr.NoOfReports=emp_mgr.NoOfReports+1 FROM inserted WHERE emp_mgr.emp=inserted.mgr UPDATE emp_mgr

SET emp_mgr.NoOfReports=emp_mgr.NoOfReports-1 FROM deleted WHERE emp_mgr.emp=deleted.mgr END

В задачу триггера emp_upd входит увеличение на 1 числа подчиненных у нового руководителя и уменьшение на 1 числа подчиненных у прежнего руководителя. Пример изменения записи в таблице emp_mgr приведен в левом окне рисунка 7. Структура данных после преобразования показана на рисунке 3.

Разработка триггера для удаления записи

Отсутствие триггера для обработки последствий удаления записи из таблицы emp_mgr приведет к нарушению достоверности данных, поскольку удаление любого сотрудника, не имеющего подчиненных, должно сопровождаться уменьшением на 1 числа подчиненных у его руководителя.

Исправить данный недостаток можно созданием триггера, который будет выполняться при удалении записи о сотрудниках, не имеющих подчиненных. Задача такого триггера - уменьшить на 1 количество подчиненных у непосредственного руководителя удаленного сотрудника.

Но проблема удаления сотрудника, имеющего подчиненных остается нерешенной. Удаление таких сотрудников приведет к преобразованию древовидной структуры подчиненности по следующему алгоритму. При удалении некоторой записи в таблице emp_mgr необходимо переподчинить подчиненных удаляемого сотрудника его непосредственному руководителю, пересчитав одновременно количество его подчиненных.

Пример удаления из таблицы emp_mgr сотрудника «а» показан в правом окне рисунка 6. Иерархическая структура после удаления элемента «а» представлена на рисунке 4.

Рис. 6. Выполнение SQL-операторов вставки и удаления записи

Приведем триггер для обработки последствий удаления как сотрудников, не имеющих подчиненных, так и сотрудников, имеющих подчиненных. USE BASA

IF EXISTS ( SELECT name FROM sysobjects WHERE name='emp_del' AND type='TR') DROP TRIGGER emp_del GO

CREATE TRIGGER emp_del ON emp_mgr FOR DELETE AS

DECLARE @e CHAR(2), @m CHAR(2), @r INT SELECT @e=emp,@m=mgr,@r=NoOfReports FROM deleted IF @m IS NOT NULL BEGIN --удаляется не директор IF @r=0 --удаляется сотрудник, у которого нет подчиненных UPDATE emp_mgr SET NoOfReports=NoOfReports-1 WHERE emp=@m

7

ELSE

BEGIN --удаляется сотрудник, у которого есть подчиненные UPDATE emp_mgr SET NoOfReports=NoOfReports+@r-2 WHERE emp=@m UPDATE emp_mgr SET mgr=@m WHERE mgr=@e END END

ELSE --удаляется директор IF EXISTS(SELECT * FROM emp_mgr) BEGIN --в таблице имеются записи о сотрудниках ROLLBACK TRAN

RAISERROR('НЕЛЬЗЯ УДАЛЯТЬ ДИРЕКТОРА',16,10) RETURN END

Однако данный триггер не будет выполняться при удалении записи из таблицы emp_mgr, поскольку ограничение внешнего ключа будет блокировать данный процесс. С помощью оператора ALTER TABLE emp_mgr DROP CONSTRAINT fk_emp необходимо удалить ограничение внешнего ключа FK.

Удаление ограничения внешнего ключа fk_emp влечет за собой нарушение правила 3 при модификации данных в таблице emp_mgr. Для восстановления алгоритма, выполняемого ограничением внешнего ключа, а также для обеспечения правил 2 и 4 в триггеры emp_ins и emp_upd для добавления и изменения записи в таблице emp_mgr необходимо внести дополнительные SQL-операторы.

Признаки нарушения достоверности информации

Запишем признаки нарушения достоверности информации в таблице с рекурсивными связями посредством формул в языке исчисления предикатов первого порядка [4]. Поскольку структурированный язык запросов SQL является разновидностью языка исчисления предикатов, от формул будет очень легко перейти к реализации правил в среде MS SQL Server.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выполнение правила 1 обеспечивает ограничение первичного ключа и не требует дополнительных SQL-операторов.

Рассмотрим правило 2. При добавлении и изменении записи в таблице emp_mgr это требование предъявляется к новой записи, которая до подтверждения транзакции находится во временной таблице с именем inserted. Признаком ошибки будет нарушение правила. Для получения признака ошибки применим к формуле 2 операцию отрицания:

-(Vx (x, x)£ R)=3x (x, x)e R. (7)

Данной формуле соответствуют следующие SQL-операторы.

IF EXISTS (SELECT * FROM inserted WHERE mgr=emp)

BEGIN

ROLLBACK TRAN

RAISERROR('CAM СЕБЕ НАЧАЛЬНИК',16,10) RETURN

END

Для правила 3, представленного формулой 3, запишем признак ошибки:

-(Vy 3x ((x, y) e R,

y*NULL)^(3 z (y, z) e R)). (8)

Здесь отношение (x,y) соответствует новой записи, которая находится до подтверждения транзакции во временной таблице inserted, а отношение (y,z) -записи, имеющейся в таблице emp_mgr. В формуле

использована операция ЕСЛИ A ТО B: A^B. Тогда - (A^B) = -(A v B ) или - (A^B) = A & B. После преобразования формулы 8 признаком ошибки для правила 3 будет формула: (Vy 3x ((x, y) e R,

y*NULL), -(3 z (y, z) e R)) (9)

или формула

-(Vy 3x ((x, y) e R,y = NULL)v (3 z (y, z) e R)) (10)

Формулы 9 и 10 являются эквивалентными. Соответствующие им SQL-операторы представлены ниже.

Для формулы 9:

IF EXISTS(SELECT * FROM inserted WHERE mgr IS NOT NULL) AND

NOT EXISTS(SELECT * FROM inserted,emp_mgr WHERE emp_mgr.emp=inserted.mgr)

BEGIN

RAISERROR('HET НАЧАЛЬНИКА',16,10) ROLLBACK TRAN RETURN END

Для формулы 10:

IF NOT EXISTS(SELECT * FROM emp_mgr, inserted

WHERE emp_mgr.emp=inserted.mgr OR inserted.mgr IS NULL) BEGIN

RAISERROR('HET НАЧАЛЬНИКА',16,10) ROLLBACK TRAN RETURN END

Признаком ошибки для правила 4, представленного формулой 4, будет следующая формула: 3y 3x ((x, y) e R, y = NULL, (z*x), 3z (z, y) e R). (11)

Формуле 11 соответствуют SQL-операторы: IF EXISTS (SELECT * FROM inserted WHERE mgr IS NULL) AND

EXISTS (SELECT * FROM emp_mgr,inserted

WHERE emp_mgr.mgr IS NULL AND emp_mgr.emp<>inserted.emp)

BEGIN

ROLLBACK TRAN

RAISERROR('ОДИH ДИРЕКТОР УЖЕ ЕСТЬ',16,10) RETURN END

Рис. 7. Выполнение SQL-операторов изменения записи

Признаком ошибки для правила 5 (формула 5) является наличие транзитивного замыкания, что отображается формулой

-(Ух (х, х)е Я')=3х (х, х)е Я' (12)

8

или формулой

3x 3y (x = y, (x, y)eR'). (13)

В формуле 12 в отношении (x,y) x - идентификатор сотрудника из новой записи, находящейся до завершения транзакции в таблице inserted, y - идентификатор руководителя из таблицы emp_mgr.

Оператор UPDATE может изменить иерархическую структуру таким образом, что возникает транзитивное замыкание, проиллюстрированное на рисунке 5. Для исключения подобных преобразований используем SQL-операторы: IF UPDATE(mgr) BEGIN

DECLARE @x CHAR(2), @y CHAR(2), @xx CHAR(2) SELECT @xx=inserted.emp FROM inserted SELECT @x=@xx SELECT @y='*' WHILE @y IS NOT NULL BEGIN

SELECT @y=mgr FROM emp_mgr WHERE emp=@x IF @xx=@y BEGIN

RAISERROR('транзитивное замыкание',16,10) ROLLBACK TRAN

RETURN END ELSE

SELECT @x=@y END END

Пример блокирования нарушения иерархической структуры показан в правом окне рисунка 7.

SQL-операторы, построенные по формулам 7, 9 и 11, необходимо добавить в триггеры emp_ins и emp_upd после ключевого слова AS. В триггер emp_upd включается также и фрагмент, разработанный для исключения транзитивных замыканий.

Список литературы

1. Маклаков С.В. Bpwin и Erwin - CASE-средства разработки информационных систем. -М.: ДИАЛОГ-МИФИ, 1999.256 с.

2. Райан Стивен, Рональд Плю. SQL./ Пер. с англ. -М.: ЗАО «Издательство БИНОМ», 1998. - 400 с.

3. Microsoft SQL Server: Database Developer's Companion. - Microsoft Corporation, 1998. -709 p.

4. Грей П. Логика, алгебра и базы данных /Пер. с англ. Х.И. Килова, Г.Е. Минца; Под ред. Е.В. Орловского, А.О. Сли-сенко. - М.: Машиностроение, 1989.-368 с.

СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ НА БАЗЕ МОДЕЛЕЙ И МЕТОДОВ ВОЗМОЖНОСТНОЙ ОПТИМИЗАЦИИ

Статья выполнена при частичной финансовой поддержке РФФИ (проект №98-01-00212)

С.В. Сорокин, А.В. Язенин

Возросшая сложность задач принятия решений в управлении производством, финансами и в других отраслях человеческой деятельности, с одной стороны, и развитие вычислительной техники и математического аппарата теории принятия решений, с другой стороны, привели к возникновению и развитию программных систем поддержки принятия решений (СППР). Такие системы обеспечивают поддержку лицу, принимающему решения (ЛПР), на этапах сбора и хранения больших объемов информации, обработки полученной информации с использованием различных методов принятия решений в зависимости от класса поставленной задачи; выбора оптимальной альтернативы и выдачи рекомендаций по реализации полученного решения.

В последнее время выработались критерии, которым должны удовлетворять интеллектуальные СППР. Приведем основные из них [1]:

• интеллектуальные системы должны быть системами, основанными на знаниях;

• интеллектуальные системы должны быть мо-дельно-ориентированными, то есть они должны обеспечивать инструментарий для создания модели принятия решения;

• интеллектуальные системы поддержки принятия решений должны обеспечивать возможность работы с различными видами неопределенности, ис-

пользование и манипулирование нечеткими целями-ограничениями.

Многие практические задачи могут быть представлены моделями линейного программирования. В настоящее время теория классического линейного программирования хорошо разработана и реализована в различных программных системах. Однако в связи с недостатком информации или самой сутью проблемы может оказаться невозможным точное определение значения параметров задачи и применение аппарата линейного программирования. Часто диапазоны изменения параметров модели строятся по экспертным оценкам. Адекватным средством моделирования такой информации является современная теория возможностей. Ввиду этого многие практические задачи могут быть представлены моделями воз-можностного программирования. Практическое применение моделей возможностного программирования делает актуальной разработку соответствующих СППР.

Представленная в этой статье СППР FIESTA (Fuzzzy Intelligent System) является интеллектуальной в условиях нечетких данных.

Система FIESTA обеспечивает:

• выбор модели принятия решений;

• настройку системы принятия решений в соответствии с выбранной моделью принятия решений;

9

i Надоели баннеры? Вы всегда можете отключить рекламу.