Научная статья на тему 'Проблема межотраслевой интеграции данных и методы ее решения на основе концепции комплексной инфраструктуры территории'

Проблема межотраслевой интеграции данных и методы ее решения на основе концепции комплексной инфраструктуры территории Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
152
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕЖОТРАСЛЕВАЯ ИНТЕГРАЦИЯ ДАННЫХ / МЕЖОТРАСЛЕВАЯ БД / КОМПЛЕКСНАЯ ИНФРАСТРУКТУРА ТЕРРИТОРИИ / МОНИТОРИНГ / ОПЕРАТИВНЫЙ АНАЛИЗ ДАННЫХ / INTERBRANCH DATA INTEGRATION / INTERBRANCH DATABASES / COMPLEX INFRASTRUCTURE OF THE TERRITORY / MONITORING / ONLINE ANALYTICAL PROCESS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бождай А. С.

Статья посвящена обсуждению перспективного подхода к решению проблемы межотраслевой интеграции и использования разрозненной отраслевой статистики в рамках единой, тематически инвариантной, системы мониторинга. Вводится новое понятие комплексной инфраструктуры территории (КИТ). Для формализованного представления КИТ предлагается четырехуровневая информационно-математическая модель. Предлагается метод интеграции арсенала передовых информационных технологий (OLAP, Data Mining, ГИС).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The problem of interbranch data integration and methods for solving it on the basis of the concept of complex infrastructure of the territory

The paper considers the promising approach to solve the problem of interbranch data integration and the use of fragmented branch statistics within a unified, thematically invariant, monitoring system. It is suggested a new concept of complex infrastructure of the territory (CIT). Author offers a four-level mathematical model for the CIT formal description. It is considered method of integration the arsenal of advanced information technologies (OLAP, Data Mining, GIS).

Текст научной работы на тему «Проблема межотраслевой интеграции данных и методы ее решения на основе концепции комплексной инфраструктуры территории»

4. Holland J. H. Adaptation in Natural and Artificial Systems: An Introductory Analysis with Applications to Biology, Control, and Artificial Intelligence. - Massachusetts Institute of Technology, April 1992. ISBN-10: 0-262-58111-6.

Работа выполнена при поддержке РФФИ (проект №10-07-00672-а).

УДК 681.3

ПРОБЛЕМА МЕЖОТРАСЛЕВОЙ ИНТЕГРАЦИИ ДАННЫХ И МЕТОДЫ ЕЕ РЕШЕНИЯ НА ОСНОВЕ КОНЦЕПЦИИ КОМПЛЕКСНОЙ ИНФРАСТРУКТУРЫ ТЕРРИТОРИИ

А. С. Бождай, к.т.н., доцент тел. (8412) 36-82-47, e-mail: [email protected] Пензенский государственный университет, кафедра САПР http://www.pnzgu.ru

The paper considers the promising approach to solve the problem of interbranch data integration and the use of fragmented branch statistics within a unified, thematically invariant, monitoring system. It is suggested a new concept of complex infrastructure of the territory (CIT). Author offers a four-level mathematical model for the CIT formal description. It is considered method of integration the arsenal of advanced information technologies (OLAP, Data Mining, gis).

Статья посвящена обсуждению перспективного подхода к решению проблемы межотраслевой интеграции и использования разрозненной отраслевой статистики в рамках единой, тематически инвариантной, системы мониторинга. Вводится новое понятие комплексной инфраструктуры территории (КИТ). Для формализованного представления КИТ предлагается четырехуровневая информационно-математическая модель. Предлагается метод интеграции арсенала передовых информационных технологий (OLAP, Data Mining, ГИС).

Keywords: interbranch data integration, interbranch databases, complex infrastructure of the territory, monitoring, online analytical process.

Ключевые слова: межотраслевая интеграция данных, межотраслевая БД, комплексная инфраструктура территории, мониторинг, оперативный анализ данных.

1. Введение

Состояние и развитие современного общества определяется наличием ряда важных, но, тем не менее, малозаметных ранее, особенностей, которые обуславливают усиление взаимовлияния всех его составных частей на экономическом, политическом, социальном и духовном уровнях. Совокупная среда жизнедеятельности человека представляет сейчас такую резонансную среду, где любая незначительная в структурном плане подсистема может своим функционированием повлечь глобальные системообразующие последствия.

Любой процесс, протекающий как в социуме, так и в природе, возможно рассмотреть с двух основных позиций: вещественно-энергетической и информационной. В классической теории управления (теории автоматического регулирования) традиционно было принято выносить на первый план вещественную основу процессов. Технология управления рассматривалась в терминах передаточных функций, частотных характеристик, оценки устойчивости, качества переходных процессов, корректирующих устройств и т.п. Управление в социально-экономических системах

(СЭС), до недавнего времени, принадлежало другому полюсу науки, где основополагающую роль играл либо математический аппарат экономической теории, либо вообще чисто гуманитарный подход.

Ситуация начала меняться коренным образом на рубеже 80-ых и 90-ых годов XX века, когда общество стало претерпевать сквозную и всеохватывающую информатизацию. Это явилось резким качественным изменением всего облика социума после длительного количественного наращивания энергетических, производственных и вычислительных мощностей. Новые социальные реалии диктуют необходимость либо существенного пересмотра, либо смещения некоторых акцентов в общей теории управления СЭС.

Среда жизнедеятельности человека вошла в такую фазу развития, когда определяющую роль начали играть информационные ресурсы и взаимодействия. Многие видные ученые (В .И. Вернадский, Н.Винер, Э. Леруа, П. Тейяр де Шарден и др.) рассматривали и прогнозировали именно такой сценарий, предполагающий для дальнейшего устойчивого развития общества, формирование механизмов самоорганизации через воздействие на общее информационное поле цивилизации (называемое ноосферой). Осмысление процессов развития и самоорганизации общества необходимо вести в таком ключе, в котором информация, энтропия, коммуникации (связи и отношения) взаимодействующих субъектов (индивидуумов, социальных групп, социумов) являются основополагающими понятиями синтеза материальных и нематериальных структур.

В отличие от вещественно-энергетических категорий, информация обладает рядом важнейших уникальных свойств:

1. Свойство распространения. В современном мире, среда жизнедеятельности человека целенаправленно эволюционирует по направлению к «информационной сверхпроводимости». Эта среда пронизана информационными каналами, а также способна легко и быстро организовывать новые каналы, средства сбора, накопления и передачи информации. Объем циркулирующей в обществе информации достигает уже таких критических величин, что включаются механизмы саморегуляции и самоорганизации. Иными словами, информационное пространство среды жизнедеятельности человека функционирует по законам, нелинейным и хаотическим. Если признать высокую интенсивность информационного влияния на самые разнообразные процессы современного общества, то следует также признать, что и само общество становится подверженным различным сценариям хаотизации. Все это в крайней степени усложняет управление такой средой, все чаще и чаще заставляя отказываться от детерминистических моделей и методов.

2. Свойство накопления. Вполне очевидно, что информация не подчиняется физическим законам сохранения, подобно веществу или энергии. При потреблении информационного ресурса, ресурс этот не убывает, а напротив, экспоненциально множится и распространяется по мере увеличения количества владельцев информации. Общее количество информации неизбежно увеличивается пропорционально числу ее непосредственных и косвенных потребителей (носителей).

3. Свойство субъективной ценности. Влияние информации на те или иные процессы нельзя прогнозировать с определенной однозначностью, поскольку ценность информации (и, следовательно, сила ее влияния) во многом зависит от субъективных качеств воспринимающей стороны. Самые незначительные тонкости во внутреннем состоянии воспринимающего субъекта или во внешней среде могут привести к непредсказуемо большим различиям в реакции на восприятие одной и той же информации.

По своей сути, информация есть, с одной стороны описывающая, а с другой - формообразующая категория. Два этих аспекта неразрывно связаны с живым сознанием, которое является основной причиной возникновения и основным «потребителем» информации.

Таким образом, проблема оперативного принятия управленческих решений в различных сферах жизнедеятельности человека вышла сегодня на новый уровень сложности. Это обусловлено, в первую очередь, непрерывным увеличением объемов и динамики информационных потоков, требующих тщательного анализа со стороны лица принимающего решения (ЛПР). Очевидно, что ЛПР нуждаются в таком инструментарии, который, в масштабах определенного территориального охвата, позволил бы эффективно анализировать и наблюдать за управляемыми системами с учетом новых реалий информационного общества. Необходимо не просто учитывать фактологию происходящего, но и иметь средства для реализации следующих управленческих задач:

1. Установка информационных связей, зависимостей и влияний между различными сегментами антропогенной и природной сред, отраслями экономики и промышленности. Определение каналов, по которым происходят эти влияния. Такую задачу можно назвать задачей построения коммуникативного пространства с последующим ранжированием информационных коммуникаций по уровням эффективности.

2. Построение аналитических срезов и выборок для любого сочетания тематических слоев. Информационное пространство многомерно и адекватно воспринять его целиком для дальнейшей выработки каких-либо локальных управленческих решений, зачастую, просто невозможно и нецелесообразно. В этом случае разумнее предоставить ЛПР средства для решения экспертных проблем абстрагирования, генерализации, классификации, и тем самым предельно минимизировать информационное пространство, в котором рассматривается управляемый процесс. Однако, следует иметь ввиду, что в условиях резонансной среды, исключая из рассмотрения какие-либо малозначимые на первый взгляд процессы, возникает риск тем самым упустить важные факторы и закономерности. Одним из вариантов решения этой проблемы является одновременное построение нескольких аналитических срезов с различных субъективных точек зрения на один и тот же процесс. Последующее сопоставление результатов анализа и принятых решений повышает вероятность нахождения системообразующих закономерностей.

3. Нахождения скрытых тенденций, резонансов и взаимосвязей между различными процессами жизнедеятельности человека (выявление нелинейностей высокого порядка). Владение такими взаимосвязями позволит вырабатывать управляющие решения, которые в некоторых случаях позволят эффективно достигать поставленных целей при достаточно мягкой реакции объекта управления (это происходит в силу малозаметности таких управляющих воздействий и их малой интенсивности).

4. Построение отчетов, наглядных и оптимально насыщенных полезной информацией.

5. Обеспечения аналитических работ самой различной специфики. Причем у ЛПР должна быть возможность построить свою индивидуальную картину подведомственных ему инфраструктур, куда можно было бы включить личный опыт (свое понимание ситуации, знания о взаимодействиях, опыт принятия решений в сходных ситуациях и т.п.). Таким образом, речь идет о формализованном средстве для накопления знаний и управленческого опыта.

Еще одним важнейшим фактором, определяющим характер жизнедеятельности человека, выступает территория. Многочисленные системы, образуемые в результате этой деятельности, жестко привязаны к территориально-географическому аспекту. Отдельно взятый пространственный участок, даже не большой протяженности, может одновременно включать значительное количество антропогенных систем, как взаимосвязанных, так и разрозненных. Таким образом, территориальный аспект позволяет ЛПР рассматривать в системном единстве всю совокупность естественно-природных, антропогенных и техногенных систем, объединяя их в единую целостность.

2. Проблема межотраслевой интеграции данных

Все перечисленные свойства современной среды жизнедеятельности человека и связанные с ними проблемы управления актуализируют необходимость постановки задачи, связанной с разработкой общих принципов, моделей и методов мониторинга с учетом факторов географического местоположения, информатизации и самоорганизационных проявлений. Важнейшей характеристикой таких методов является тематическая инвариантность к отраслям мониторинга. Это обусловлено тем, что практически в любой СЭС можно выделить, зафиксировать и использовать общие (с точки зрения принятия управленческих решений) структурные и поведенческие свойства. К таким свойствам можно отнести:

• Преимущественно, стратегический характер управления и планирования;

• Ежегодная периодика сбора отраслевой отчетной статистики;

• Четкая пространственно-географическая привязка отраслевой статистики;

• Схожие требования к результатам информационно-аналитической деятельности для поддержки принятия управленческих решений;

• Схожий класс технических средств, используемых для сбора и обработки отраслевой статистики.

Подобная схожесть обусловливает и ряд общих проблем, связанных со сбором, хранением и обработкой отраслевых данных. Решение этих проблем в разных отраслевых ведомствах происходит, зачастую, совершенно различными способами. Головные управляющие организации,

занимаясь аналитикой работы своих подведомственных иерархий, производят сбор и анализ отраслевой статистики обособленным друг от друга образом, не пытаясь осуществлять корреляцию форм первичной отчетности, не учитывая текущих состояний и тенденций смежных социально-экономических систем (СЭС).

Это приводит к общей проблеме межотраслевой несовместимости форматов и способов обработки данных, что особенно критично при современных требованиях к электронному документообороту в процессах управления. Например, активно внедряемая в настоящее время на всех уровнях государственной власти концепция Электронного Правительства, должна использовать в качестве информационной основы единую межотраслевую базу данных (БД).

Даже оставив пока в стороне проблему достоверности первичной информации, предоставляемой учреждениями низших уровней иерархии, можно сделать заключение о том, что рассмотренный подход позволяет лишь констатировать общее текущее состояние СЭС, достигнутое за отчетный период. Важнейшие вопросы, связанные с учетом межотраслевых взаимодействий, остаются за пределами видимости. В результате происходит потеря многих причинно-следственных связей, что может привести к неверным оценкам текущей ситуации, ошибочным прогнозам и, в конечном итоге, к принятию неэффективных управленческих решений.

Очевидно, что любая СЭС регионального масштаба является открытой системой, входящей в состав общей инфраструктуры, более обширной как по территориальному, так и тематическому охвату. Административно-хозяйственные границы СЭС не могут препятствовать явным или косвенным воздействиям со стороны смежных подсистем инфраструктуры. Иными словами, инфраструктура жизнедеятельности человека в рамках выбранного территориального охвата является единым системным организмом и многие причинно-следственные закономерности следует искать именно в масштабах всей инфраструктуры.

Таким образом, особую актуальность и важность приобретает проблема межотраслевой интеграции и использования разрозненной отраслевой статистики в рамках единой многомерной БД.

3. Концепция комплексной инфраструктуры территории

Для терминологической идентификации системного единства различных социально-экономических отраслей предлагается использовать понятие комплексной инфраструктуры территории (КИТ) [1, 2], определяемое как совокупность антропогенных, техногенных и при-родно-географических систем, представляющих собой системную целостность в рамках выбранного пространственно-временного масштаба.

Концепция неразрывной связи между природными и антропогенными системами неоднократно обсуждалась учеными в рамках различных научных дисциплин (география, геоэкология, физика, социология, информатика, нелинейная динамика, синергетика и др.). Проведенный анализ всего терминологического многообразия данной концепции показал, что можно соотнести с КИТ два наиболее близких по сути понятия - геосистема и природно-техническая система (ПТС) [3]. Принципиальным отличием понятия КИТ является установка первостепенного акцента на информационной составляющей социально-экономических инфраструктурных процессов, что имеет особую важность для задач информатизации управления, поддержки лиц, принимающих решения, и в соответствующих информационно-аналитических исследованиях.

В качестве основных структурных компонент КИТ предлагается выделить: участок территории, слой инфраструктуры, информационное пространство. Под участком территории в структуре КИТ понимается участок земной поверхности, вмещающий всю материальную основу подсистем КИТ и ограниченный их пространственной протяженностью.

Классификация социально-экономических функций в привязке к территориальным, информационным и организационным аспектам, позволяет определить понятие слоя инфраструктуры. Под слоем инфраструктуры предлагается понимать тематически обособленную сферу жизнедеятельности человека, неразрывно связанную с соответствующим участком территории, взаимодействующую с другими слоями КИТ и внешней средой, обладающую собственной материально-информационной структурой и органами управления. Типичными слоями инфраструктуры являются: различные общественные и социально-экономические отрасли (такие как образование, здравоохранение, экономика и т.п.); производственные отрасли как базис существования социально-экономических слоев; отрасли взаимодействия человека с естественно-природными ресурсами и комплексами. Каждый такой слой может содержать большое количество подсистем, имеющих разветвленную сеть связей с подсистемами других слоев, объектами участка территории и внешней среды.

Информационное пространство КИТ образуется из трех взаимосвязанных типов информационных множеств: собственной информации (описывающей внутреннее состояние КИТ: структуру, функции, цели, пространственно-временные характеристики, ключевые состояния), внешней информации (сведений о состоянии окружающей по отношению к внешним границам КИТ среде), управляющей информации (сведений об управляющих решениях).

В итоге, можно определить ряд базовых принципов, на которых строится концепция межотраслевого мониторинга КИТ:

1) Принцип тематической инвариантности к сфере мониторинга. Методы наблюдения, контроля и управления за процессами в рамках различных слоев инфраструктуры являются инвариантными за счет использования единой модели для описания всей инфраструктуры. В ходе мониторинга, КИТ рассматривается не как набор разрозненных тематических слоев, а как их неделимая системная целостность.

2) Принцип открытости и взаимозависимости слоев инфраструктуры КИТ. Единое информационное пространство КИТ, вмещающее информационные процессы каждой отдельной отрасли обеспечивает целостное межотраслевое изучение обширных сред жизнедеятельности человека.

3) Принцип неразрывной связи с территориальным аспектом. Структурные границы инфраструктуры определяются протяженностью соответствующего участка территории, который является интегрирующим фактором, обеспечивающим системное единство всего множества исследуемых материальных и информационных процессов КИТ.

4. Многоуровневая информационно-математическая модель КИТ

Для моделирования в реальном режиме времени специфики различных точек зрения, критериев и целей управления, необходима гибкая математическая модель, позволяющая формализовать связи между критериями принятия управленческих решений, шаблонами выборки данных из межотраслевой БД, входными данными для модулей интеллектуального и пространственного анализа.

Перечисленные требования к информационно-математической модели затрагивают четыре различных аспекта описания КИТ [3]:

1) Общесистемный аспект - КИТ рассматривается с инфологической точки зрения, направленной на гетерогенную структуру информационных и организационных связей между отраслевыми подсистемами.

2) Логический аспект - КИТ рассматривается с точки зрения датологических отношений между отраслевыми БД.

3) Пространственный аспект - КИТ рассматривается с учетом вмещающей ее пространственно-географической среды и соответствующих координатных привязок данных.

4) Физический аспект - КИТ рассматривается с точки зрения присущих ее отраслевым подсистемам программно-аппаратных платформ, протоколов обмена, прав доступа к информации, телекоммуникационной среды.

Перечисленные аспекты КИТ позволяют сформировать многоуровневую математическую модель, в которой выделяются четыре уровня: модель абстрактно-математического уровня, модель логического уровня, модель пространственного уровня, модель физического уровня.

Главной особенностью модели абстрактно-математического уровня является представление КИТ в виде единой модели, включающей все структурные элементы и динамику связей (различного рода взаимодействий) между ними. Для описания данного уровня модели предлагается использовать гиперграф, структура гиперребер которого является результатом классификации элементов КИТ в зависимости от конкретных задач мониторинга (рис. 1).

Каждое гиперребро образует класс совместимых по каким-либо признакам элементов КИТ. Под слоями гиперребер понимаются классы гиперребер, образуемых в силу различных классификационных факторов на одном и том же множестве вершин гиперграфа. Такая система слоев является удобным средством классификации элементов КИТ по различным семантическим признакам. На разных стадиях и в разных процедурах мониторинга классификация может существенно изменяться, вызывая динамическую реструктуризацию как самих гиперребер, так и их слоев.

Слой 1

V = {А, В, С, ...,/,...} - множество вершин гиперграфа (подсистемы КИТ); и = {[а,(А, Е, Е, ..., Н), ЫС, I, У), с,(А, В, С, ...,£>)]ь ША, Е, ^ Я), /, 7),/г(А, 5, С, ..., />)]2} -множество гиперребер (классов подсистем КИТ) двух слоев в момент времени ?

V — (W, I — 1,2,..., N,

(1) (2)

Рис. 1 Модель абстрактно-математического уровня (пример с двумя слоями гиперребер)

Зададим в качестве модели абстрактно-математического уровня гиперграф AMG, состоящий из двух множеств и предиката: AMG — (V, U, P),

Множество V описывает структуру гиперграфа на уровне вершин:

где N - общее количество вершин, соответствующее числу элементов КИТ; (x, y) - весовой кортеж вершины, определяющий пространственную привязку элемента КИТ (пространственные координаты).

Множество U имеет переменную мощность и описывает многослойную структуру гиперграфа на уровне гиперребер:

где Kt - количество гиперребер в момент времени t в слое

ТТ_сл _1о Z7 f Ft - количество слоев. Порядок взаимодействия элемен- ч

U — (Ui \f; 1 — 1, 2, ..., Kt; f — 1, 2, ..., Ft, (3)

i j >j>j ' ' ' ' ' ' " тов может существенно меняться, поэтому мощность v '

множества U переменная.

Предикат P - определяет инцидентность вершин и гиперребер каждого слоя. P определен на множестве всех пар (ve V, ue U). Областью истинности предиката P является множество R переменной мощности Bt # const:

F(P) = {(v, u) | P(v, u)r}, где veV, ueU, re R — (1, 2, ..., Bt}. (4)

Рассмотренное теоретико-множественное представление модели абстрактно-математического уровня позволяет определить матричное представление этой модели, удобное для создания программно-алгоритмического обеспечения системы мониторинга КИТ. Матричное представление (матрица инцидентности) гиперграфа, на слое гиперребер f, будет иметь вид

(5):

где:

I 1, если (vit Uj) eF(P), veV, ueU

Mf — II mij\\N x Kt, f, m — 1

I 0, если (v, uj) g F(P), veV, ueU

(5)

В некоторых случаях удобнее использовать матрицу связности вершин гиперграфа (формула 6), которая отражает попарные отношения связности вершин через инцидентные гиперребра.

где:

П, если для (у, у,) 3 ик, (у, и¡) е¥(Р), (у,, иу) е¥(Р), уе¥, иеи

Мс = II ш1Мк х д , ш) 1 (6)

1 0, если для (у, у) ^(3 ик), (у,, ик) е Е(Р), (у, Щ) е Р(Р), уеУ, иеЦ

Полное матричное представление гиперграфа будет представлять собой множество матриц инцидентности для каждого слоя гиперребер:

М = {М},/= 1, 2, ..., Я., (7)

Таким образом, для целей описания КИТ на абстрактно-математическом уровне предлагается расширить свойства гиперграфа такими особенностями, как динамическая реструктуризация гиперребер и множественность слоев структуры гиперребер.

В целях учета и анализа информационного обмена между подсистемами КИТ необходимо преобразовать полную гетерогенную модель (1) в строго ранжированную структуру. Классы подсистем КИТ (гиперребра), определенные на абстрактно-математическом уровне, логически объединяются в домены. Вся совокупность доменов объединяется в единую информационную модель - многомерный куб и соответствует осям его измерений (рис. 2).

Теоретико-множественное представление модели логического уровня БМ выглядит следующим образом:

пл где Б - множество доменов, образованных исходя из текущей структуры гипер-

БМ = Рё)Г, ребер ЛМО на слое/ (8)

Б = Щ, I = 1, 2, ..., К, (9)

Рё - предикат, определенный на множестве всех пар ё), где I #у,

I = 1, 2, ..., К; у = 1, 2, ..., Кь Его истинность определяет наличие междоменного взаимодействия между доменами ¿/¿и ¿/7.

Домен с1Ь{

Домен (1а,

Домен с1с

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

•С®/в/

7 5 1 7 8 7 8

а,, Ьг, сге и - классы подсистем КИТ в момент Ь, логически представленные в виде доменов;

А, В, С, ..., / е V - подсистемы КИТ; а, (3, у, 8, Х- массивы данных, предоставляемые подсистемами КИТ в ходе взаимодействия;

- междоменные связи через инцидентные подсистемы КИТ.

Рис. 2 Модель логического уровня и соответствующий многомерный куб

Основным назначением модели логического уровня является строгая классификация элементов КИТ и присущих им информационных массивов, определение иерархической структуры вовлеченных в мониторинг организаций, снятие проблем гетерогенности и децентрализации. Однако модель логического уровня не учитывает динамику информационных потоков, соотнесенную с пространственным аспектом КИТ. В связи с этим вводится пространственный уровень модели, позволяющий использовать аппарат геоинформационных технологий.

Каждому домену логического уровня ставится в соответствие объект пространственного уровня, обладающий пространственной привязкой (например, реальными географическими координатами), которая однозначно увязывает домен и все его содержимое (подсистему КИТ и присущую ему информацию) с другими смежными социально-экономическими системами и прочими слоями территориальной инфраструктуры. Пространственная привязка доменов и вложенной в них информации осуществляется к цифровой картографической основе территории, соответствующей КИТ. Для представления потоков данных в модели пространственного уровня снова осуществляется переход к графовому представлению (рис. 3).

ISG = (V \U '),

(10)

А, В, ..., Н- подсистемы КИТ; л', у - пространственная привязка элемента;

{Р,} - данные, которые описывают подсистему г; ец - поток данных от элемента г к элементу у;

<8> - инцидентные подсистемы.

Рис. 3 Модель КИТ пространственного уровня

В теоретико-множественном представлении модель КИТ пространственного уровня будет иметь вид:

где У = {Vкх,у)(Р)}, I = 1, 2, ..., N - множество вершин, каждой из которых соответствует пространственно-географическая привязка (х, у) и некоторый набор данных Р; N - количество вершин; и = {^-(е)}, - = 1, 2, ..., М - множество ориентированных ребер, каждое из которых имеет вес е, соответствующий объему передаваемых данных между инцидентными вершинами: М - количество ребер (взаимосвязей между подсистемами КИТ).

Граф 1БО является взвешенным, ориентированным графом с пространственной привязкой. Его вершины отображают подсистемы КИТ и их территориальное положение, а ребра - потоки данных между ними. На рис. 3 граф ШО разбит на три подграфа а: А, Е, Е, Н; Ь: С, I, с(: А, В, С, В. Эти подграфы отражают доменную структуру модели логического уровня и ранжируют гетерогенные вершины модели абстрактно-математического уровня. Вершины А и С играют роль «шлюзов», обеспечивая возможность передачи потоков данных между гетерогенными подграфами.

Главной особенностью модели пространственного уровня является координатная привязка статистики, обрабатываемой в ходе мониторинга. Это обеспечивает возможность обработки информации без отрыва от того пространственно-географического окружения, которому она соответствует.

Объекты пространственного уровня на физическом уровне позволяют рассматривать физические коммуникации между подсистемами КИТ. Например, они могут ассоциироваться с узлами телекоммуникационной сети, сохраняя свою доменную принадлежность логического уровня. Предложенные на логическом уровне инцидентные подсистемы устанавливают порядок междоменного шлюзования гетерогенных участков физической сети и политику информационной безопасности.

В теоретико-множественном представлении модель физического уровня будет иметь вид где: У/ = (№)}> ^ = 1, 2, ..., N - множество вершин, каждая из которых моделирует программно-аппаратную платформу подсистемы КИТ; N - количество вершин; Wi -совокупность данных, предоставляемая узлом у!/; П// = {Ц//-(к)}, ] = 1, 2, ..., М - множе- (11) ство ориентированных ребер, каждое из которых имеет вес И, соответствующий харак- ^ ' теристикам коммуникационной связи между инцидентными подсистемами КИТ; М -количество ребер (коммуникационных взаимосвязей между элементами КИТ).

Таким образом, в обобщенном виде многоуровневая математическая модель КИТ имеет

PhG = (V ' ,U '' ),

вид:

CM = (AMG, DM, ISG, PhG),

где: АМО - модель абстрактно-математического уровня (формула 1); ЭМ - модель логического уровня (формула 8); 1БО - модель информационно-пространственного уровня (формула 10); РИО - модель физического уровня (формула 11).

(12)

5. Метод межотраслевой интеграции данных на основе системного взаимодействия технологий OLAP, DataMining, ГИС

Для обеспечения тематической инвариантности и территориальной масштабируемости процесса мониторинга КИТ предлагается метод межотраслевой интеграции данных на основе системного взаимодействия технологий OLAP, DataMining, ГИС. Реализация такого взаимодействия происходит по следующей схеме (рис. 4): построение межотраслевой многомерной БД реализуется средствами подсистемы статистического и OLAP-анализа, после чего средствами подсистемы математического моделирования (на основании критериев, задаваемых ЛПР) строится гиперграфовая модель абстрактно-математического уровня.

Автоматизированный сбор данных и управление МБД (OLAP)

отраслевая статистика

С * S- -И

Многомерная БД

Интеллектуальный анализ данных (DataMining)

результаты анализа

Выборка данных

Пространственный анализ (ГИС) и представление результатов

критерии

структура ' доменов

пространственная

коммуникации и взаимодействия

Абстрактно-математический уровень (гиперграф) Логический уровень Информационно-пространственный уровень Физический уровень

Математическая модель КИТ

->■ потоки данных;---► взаимодействие с уровнями модели.

Рис. 4 Схема метода межотраслевой интеграции данных на основе системного взаимодействия технологий OLAP, DataMining, ГИС

Полученная модель используется в качестве шаблона для формирования многомерной выборки данных, которая передается для последующего анализа в подсистемы DataMining и ГИС. Таким образом, предлагаемый метод обеспечивает существенное повышение производительности (в среднем, на 60-70 % [3]) при анализе данных по сравнению с традиционными OLAP-системами за счет использования компактных выборок данных (размещаемых в оперативной памяти), оперативно отражающих динамику критериев и точек зрения на принятие управленческих решений.

Предлагаемый метод взаимодействия технологий OLAP, DataMining и ГИС определяет структурную схему системы мониторинга КИТ (рис. 5), отличительные особенности и научная новизна которой заключаются: в инвариантности структуры к специфике отдельных отраслей мониторинга или социально-экономических проблем управления; в обеспечении возможности интегрировать передовые технологии мониторинга в рамках единой системы; в удобстве территориального масштабирования системы.

Рис. 5 Структурная схема системы мониторинга КИТ

В результате генерируется гиперграф AMG: AMG = (V, U, P); V = {уг}, i = 1, 2, ..., N ; U = {uj}f; j = 1, 2, KSf ; f = 1, 2, F; KSf< |uf ;

Mf = [Zmax(k) - ZmJmiKSf, (13)

Dj = [(ZUkf) + Mf (j - 1)) ^ (Zmin(kf) + Mf j], (14)

где: KSf - коэффициент классификационной сложности для каждого f-го критерия из числа выбранных (коэффициент задается пользователем и определяет количество классов, на которые будет разбито все множество объектов мониторинга по каждому критерию kf); \uf - мощность множества вершин, инцидентных гиперребру uj, Zmax(kf), Zmin(kf) - максимальное и минимальное из множества значений, соответствующих критерию f M f - шаг, определяющий диапазон значений объектов в критериальном множестве Z(kf), попадающих в гиперребра f-го слоя; Dj -диапазон значений объектов в критериальном множестве Z(kf), попадающих в гиперребро ujf.

Уравнения (13), (14) определяют линейный способ классификации объектов мониторинга по критерию kf. Однако если распределение значений имеет сильно нелинейный характер и количество объектов (вершин гиперграфа) относительно велико, то проблема критериального распределения вершин по гиперребрам сводится к задаче кластер-анализа [3]. В этом случае используется алгоритм средней связи, который основывается на методе построения дерева последовательных объединений (дендрограммы), а также на понятии меры близости d между критериальными значениями объектов, т.е.:

d = \ Z(kf) - ZUk) \.

6. Заключение

Основные положения, определяющие научную новизну и практическую значимость идей, изложенных в статье, можно сформулировать следующим образом:

1. Предлагается понятие комплексной инфраструктуры территории (КИТ) как совокупности антропогенных, техногенных и природно-географических систем, представляющих собой управляемую, системную целостность в рамках выбранного пространственно-временного масштаба. Первоочередную важность в понятии КИТ в отличие от существующих понятий, отражающих связь между природными и антропогенными системами, имеет информационная составляющая в социально-экономических инфраструктурных процессах, что имеет особое значение для задач информатизации управления, поддержки ЛПР и в соответствующих информационно-аналитических исследованиях.

2. Предлагается концепция мониторинга КИТ, основанная на принципах тематической инвариантности к сфере мониторинга, открытости и взаимозависимости различных социально-экономических отраслей и их связи с территориальным аспектом.

3. Рассмотрен подход к решению практической проблемы межотраслевой интеграции разрозненной отраслевой статистики, различных подходов к сбору, хранению и обработке первичных данных в рамках единой многомерной БД, построенной на основе концепции КИТ.

4. Разработана многоуровневая информационно-математическая модель КИТ, использующая предложенные, принципиально новые виды операций над гиперграфами: динамическую реструктуризацию структуры гиперребер и установку множественности слоев структуры гиперребер, что позволяет формализовать и учитывать в реальном режиме времени мониторинга специфику различных точек зрения, критериев и целей управления.

5. Предлагается метод интеграции технологий OLAP, DataMining, ГИС, обеспечивающий возможность создания и использования межотраслевой многомерной БД, а также тематическую и пространственную инвариантность мониторинга. Данный метод определяет структурную схему типовой системы межотраслевого мониторинга КИТ.

Предложенная концепция позволила решить ряд важных практических задач, таких как:

- информационно-аналитическая поддержка принятия управленческих решений и мониторинг состояния системы общего образования на различных территориально-иерархических уровнях (район, город, субъект Федерации и т.д.) с учетом обстановки в смежных социально-экономических отраслях и территориальной специфики [3];

- оценка качества подготовки специалистов (выпускников вузов) с учетом формализованных потребностей и специфики региональных рынков труда [4];

-информационно-аналитическая поддержка принятия управленческих решений и мониторинг деятельности российской системы послевузовского образования с учетом критических технологий и приоритетных направлений развития науки и технологий в РФ, а также факторов отраслевой специфики научных специальностей [2];

-мониторинг готовности государственных и муниципальных служащих, а также населения субъектов Федерации к внедрению технологий электронного правительства в деятельность органов государственной власти [5];

-сбор и аналитическая обработка данных для поддержки процессов управления инженерно-техническими коммуникациями в сферах регионального жилищно-коммунального хозяйства [6].

Литература

1. Бождай А.С. Комплексная инфраструктура территории: методы и модели информационного мониторинга // Информационные технологии. - 2009. - №9, стр. 57 - 63

2. Бершадский А.М., Бождай А.С. Мониторинг эффективности деятельности системы послевузовского профессионального образования в вузах Российской Федерации с учетом социально-экономических факторов // Открытое образование. - 2010. - № 2. - С. 24-32.

3. Бершадский А.М., Бождай А.С. Концепция мониторинга комплексной инфраструктуры территории: монография - Пенза : Изд-во ПГУ, 2010. - 242 с.

4. Бождай А.С., Бершадский А.М. Методика оценки качества подготовки специалистов в системе высшего профессионального образования с учетом их востребованности на рынке труда // Информационная среда вуза XXI века : материалы III Междунар. науч.-практ. конф. - Петрозаводск, 2009. - С. 2527.

5. Бершадский А. М., Бождай А.С., Осипова Н.В. Разработка методики мониторинга состояния информатизации органов государственной власти региона // Известия Волгоградского государственного технического университета. Серия: Актуальные проблемы управления, вычислительной техники и информатики в технических системах - 2009. - Вып. 7. - № 12 (60).- С. 92-95

6. Бершадский А. М., Финогеев А.Г., Бождай А.С. Разработка и моделирование гетерогенных инфраструктур для беспроводного информационного обеспечения процессов мониторинга // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2010. - № 1. - С. 36-46.

УДК 002.53:004.89 ВАК 05.25.05 ГРНТИ 12.41.55, 20.23.25

ОБЩЕСИСТЕМНЫЕ И ТЕХНОЛОГИЧЕСКИЕ ОСНОВЫ УПРАВЛЕНИЯ ЗНАНИЯМИ

О. Л. Голицына, доц., к. т. н., доцент кафедры системного анализа Тел.: (495) 323-93-65, e-mail: [email protected] Н. В. Максимов, проф., д. т. н., профессор кафедры системного анализа Тел.: (495) 323-93-65, e-mail: [email protected] Национальный исследовательский ядерный университет «МИФИ»

http://www.mephi.ru

In the context of system analysis the basic principles of designing information environment, oriented toward the system of knowledge control support are considered. For organizing information space, oriented towards obtainment and preservation of knowledge, the structure of classification type, dynamically reflecting the similarity and differences of available and new knowledge on sign, concept and documentary levels is offered to use.

С позиций системного анализа обсуждаются основы построения информационной среды, ориентированной на поддержку систем управления знаниями. Для организации информационного пространства, ориентированного на получение и сохранение знаний, предлагается использовать структуру классификационного типа, динамически отражающей сходство и различия состоявшегося и нового знания на знаковом, понятийном и документальном уровне.

Ключевые слова: информационная среда; знания; информация; информационный поиск; системы представления знаний.

Keywords: Information environment; knowledge; information; information search; knowledge representation systems

i Надоели баннеры? Вы всегда можете отключить рекламу.