Вычислительные технологии
Том 3, № 5, 1998
ПРОЕКТ ИНТЕГРИРОВАННОЙ ГЕОИНФОРМАЦИОННОЙ СИСТЕМЫ ИНЦ СО РАН ДЛЯ ПОДДЕРЖКИ ФУНДАМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ*
И. В. Бычков, С. Н. Васильев, В. А. Кузьмин, Г. В. Ступин Институт динамики систем и теории управления СО РАН
Иркутск, Россия e-mail: [email protected]
The paper is devoted to assessing the scientific support for multidisciplinary fundamental and applied research of the Baikal region based on state-of-the-art informational technologies such as Web-technologies, CORBA-technologies for the development of software systems, data warehouse technology for data processing, GIS-technologies for processing 3D-information in Irkutsk Research Center of the SB RAS (IRC SB RAS). The problems of integrating informational, computational and telecom systems of the IRC SB RAS institutes resulting in the unified informational space with an access to global Russian and international networks are considered.
Развитые страны мира за последнее 10-15 лет создали мощную информационную инфраструктуру и сформировали единое информационное пространство. Россия и, в частности, сфера ее фундаментальной науки, в настоящее время активно включаются в этот процесс информатизации; не является в этом плане исключением и Байкальский регион. В институтах Иркутского научного центра (ИНЦ) СО РАН накоплена уникальная информация о природном комплексе, ресурсах, экологической обстановке и пр. Байкальского региона.
Мультидисциплинарные фундаментальные и прикладные исследования Байкальского региона нуждаются в территориально распределенной кооперации на основе новых информационных технологий, таких как Web-технологии и CORBA-технологии для создания программных систем, технологии “склада данных” (Data warehouse) для обработки данных, ГИС технологий для обработки пространственной информации и т. д. Таким образом, на первый план выходит интеграция информационно-вычислительных и телекоммуникационных систем институтов ИНЦ СО РАН - создание единого информационного пространства с выходом в глобальные российские и международные сети. Заметим, что создаваемая корпоративная Intranet сеть будет важным информационным ресурсом СО РАН, а внедряемые информационные технологии станут средством ускорения научного
* Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, грант №98-07-90314.
© И. В. Бычков, С.Н. Васильев, В. А. Кузьмин, Г. В. Ступин, 1998.
прогресса. В первой части статьи рассмотрено состояние работ, проводимых в этом направлении в ИНЦ СО РАН.
1. Информационно-вычислительные
и телекоммуникационные ресурсы институтов ИНЦ СО РАН для проведения междисциплинарных фундаментальных исследований
В настоящее время институты ИНЦ СО РАН имеют разнообразные региональные тематические базы данных и знаний, созданные на различных программных и аппаратных платформах и обеспечивающие фундаментальные и прикладные исследования в различных областях знаний. Для них характерна локальная обработка информации, включающая следующие элементы:
набор программ для обработки информации в локально-вычислительных сетях института (СУБД, БД, АРМы, электронные таблицы, прикладные программные системы, например, локальные ГИС АгеШо, МарШо, программы моделирования и расчетов и др.);
электронная почта для передачи информации;
файл-серверы для хранения информации.
Ни один из перечисленных компонентов не предназначен для создания и распространения информации по интегрированной информационно-вычислительной сети (ИИВС) ИНЦ СО РАН. Проведение же комплексных работ предусматривает интеграцию как разнотипных и разноформатных данных, так и информационных систем, рассредоточенных в институтах ИНЦ. Только корпоративная сеть институтов ИНЦ, использующая в качестве транспортной основы существующую ИИВС, позволит решить проблему информационной поддержки мультидисциплинарных исследований. В этом случае для организации эффективной работы с БД требуется применение новых информационных технологий, инструментальных средств формирования и ведения БД, обладающих достаточно мощным языком запросов для создания интегрированной информационной системы ИНЦ.
В институтах ИНЦ СО РАН пока отсутствуют подробные, синхронизированные электронные тематические карты природных ресурсов Байкальского региона, которые можно использовать в практической деятельности. Это обусловлено, во-первых, сложностью наполнения, структурирования и анализа территориально-тематических баз данных, во-вторых — слабым внедрением ГИС в силу ограниченных финансовых ресурсов (до последнего времени каждый институт ИНЦ проводил работы по геоинформатике на собственные средства, вне кооперации). Создание в 1995 г. Геоинформационного центра ИНЦ СО РАН предопределило формирование концепции единой геоинформационной системы институтов — ГИС ИНЦ, призванной повысить отдачу имеющихся программно-аппаратных средств и эффективность совместных научно-исследовательских и прикладных работ институтов научного центра. Особенностью ГИС ИНЦ СО РАН является существование сетевой инфраструктуры — ИИВС. Это позволяет сконцентрировать аппаратные средства и программное обеспечение с целью одновременного использования вычислительных, дисковых, коммуникационных и других ресурсов центрального сервера с любого компьютера, подключенного к ИИВС, а также дорогостоящих программных и информационных ресурсов (инструментальных геоинформационных систем, SQL-сервера баз данных, электронной топоосновы, тематических алфавитно-цифровых и графических баз).
Выделим актуальные задачи, которые имеют междисциплинарный характер и будут реализовываться в рамках создаваемой интегрированной информационной системой ИНЦ СО РАН:
создание электронного атласа оз. Байкал, включающего картографическую информацию географического, геологического, геохимического содержания, multi-media информацию о флоре и фауне, о памятниках природы, эндемиках и т. п.;
создание картографической базы данных территориальных кадастров, включая кадастры земельных, водных, лесных, рыбных ресурсов, недр т. е. (минерально-сырьевых ресурсов) и т. п.;
аэрокосмический мониторинг состояния окружающей среды, включая задачи приема, обработки спутниковой телеметрической и видеоинформации;
создание баз данных и экологического атласа региона, в том числе вопросов состояния окружающей среды (загрязнение воздушного и водного бассейнов, прогноз распространения загрязнений, прогноз паводков и других стихийных бедствий, управление природными ресурсами, лесопатологическое состояние лесов);
прогноз сейсмической опасности и управление сейсмическим риском.
К настоящему времени ИДСТУ СО РАН при поддержке Министерства науки, Президиума СО РАН, РФФИ и совместно с учреждениями Иркутского регионального научнообразовательного комплекса реализовал первую очередь проекта ИИВС ИНЦ СО РАН. Были объединены локально-вычислительные Ethernet сети большинства институтов и Президиума ИНЦ СО РАН, а также Байкальского учебного комплекса при Иркутском государственном университете. Вхождение осуществляется с помощью конверторов из оптоволокна в витую пару. Эта архитектура обеспечивает гарантированную пропускную способность 100 Мбит/с до центрального сервера для каждого из институтов. Обмен информацией между компьютерами в ИИВС проводится на базе протоколов TCP/IP и IPX. В качестве рабочих мест в ИИВС используются различные средства от простейших компьютеров и алфавитно-цифровых терминалов до мощных рабочих станций и Х-терминалов.
При конструировании данной сети были использованы конструкторско-технологические решения, оптимальные по набору определяющих эксплуатационно-технических и техникоэкономических характеристик (скорость формационного транспорта, надежность, помехозащищенность, стоимость, эксплуатационные расходы, открытость архитектуры и др.).
В частности, были внедрены самые современные технологии (оптоволоконный кабель, Switched Ethernet, Fast Ethernet), определяющие мировой уровень сетей подобного класса.
Сейчас в ИДСТУ функционирует локальная сеть в составе файл-сервера, коммуникационного сервера, сервера-вычислителя и 55 распределенных по институту ЭВМ (SPARCserver 1000Е под управлением ОС Solaris; SparcClassic и ПЭВМ IBM/PC Pentium).
Созданный специалистами института (узла Internet) WWW сервер был первым в Восточной Сибири, в настоящее время проработаны связи через WWW сервер с программными оболочками на языке C, pht и miniSQL под операционными системами FreeBSD и Linux.
Таким образом, анализ существующих ресурсов подтверждает необходимость создания интегрированной ГИС, направленной на решение проблем комплексного информационного обеспечения фундаментальных мультидисциплинарных исследований институтов ИНЦ СО РАН в области геоэкологии и природопользования в Байкальском регионе, используя при этом существующую ИИВС ИНЦ СО РАН в качестве полномасштабной транспортной основы. Рассмотрим концепцию создания корпоративной системы ИНЦ более подробно.
2. Построение корпоративной системы ИНЦ
Различные программные и аппаратные платформы, большие объемы и рассредоточенность БД институтов для построения корпоративной Intranet-сети институтов ИНЦ требуют внедрения Web-технологии. Intranet стирает границы между платформами, архитектурами, операционными системами, языками программирования, локальными и глобальными сетями, а технология Intranet, основанная на протоколе TCP/IP, языке гипертекстов, поддерживает статический и динамический доступ к БД, обеспечивает функционирование приложений, интеграцию и обработку данных из множества источников.
Корпоративная система ИНЦ (рис. 1) должна состоять из нескольких узлов институтов, иметь открытую модульную архитектуру клиент — сервер, обеспечивать динамический навигационный интерфейс, посредством программ-сценариев с другими приложениями (такими как БД, информационные системы) рассматривать их с нужной степенью точности, управлять информационным наполнением, осуществлять защиту информации.
Среди компонент системы выделим основные: WWW сервер (HTML-страницы, HTTP Web-сервер, апплеты, сервер приложений, хранимые процедуры, SQL-сервер баз данных), навигатор (browser), редактор гипертекста HTML-страниц, программы для организации дискуссий и документооборота.
Задача WWW сервера — распределение ресурсов сети ИНЦ и контроль прав доступа к ним, хранение общих БД. Основные функции — считывание файлов, запуск программы и передача гипертекстового документа клиентским программам (навигаторам). Для этого в URL содержится следующая информация для сервера:
Рис. 1. Информационная корпоративная система ИНЦ СО РАН. является ли файл программой или документом;
язык, на котором написана программа, и параметры, необходимые для ее выполнения.
Применение унифицированного указателя — CGI позволит интегрировать в сеть любую программу. WWW сервер предполагается установить на SparcStation 1000E под управлением OS FreeBSD, что обеспечит простой и надежный контроль за действиями пользователей.
Навигатор обеспечивает интерфейс с пользователями (клиентами), получая от различных серверов документы в формате HTML, выводит их на экран или принтер, поддерживает различные протоколы для связи с серверами — HTTP, FTP, NNTP и SMTP, а также запускает программы для просмотра документов, представленных в разных форматах.
Менеджер транзакций позволит серверу приложений одновременно обмениваться данными с несколькими серверами баз данных.
SQL-сервер (на базе СУБД ORACLE v.8.0) для обслуживания БД обеспечит преобразование формата файла, выдавая навигатору HTML-версию документа.
Среди программ, обеспечивающих обсуждение каких-либо проблем и проведение дискуссий, выделим Lotus Notes и Collabra Share. Использование этих инструментов делают совместную работу более удобной и наглядной, позволяет отслеживать вложенные темы, организовывать поиск по отдельным частям дискуссии, включает картинки, звук и мультипликацию. В отличие от NNTP, данные программные средства обеспечивают дополнительное ограничение доступа к дискуссии.
Система документооборота повысит эффективность работ при проведении и оформлении совместных исследований; здесь предполагается создание централизованной БД документов на WWW сервере сети, что позволит снизить затраты на их поиск и использование в сети, а также постоянно отслеживать этап обработки документа.
Основными источниками информации будут выступать институты, создавая для этого общие тематические базы данных на WWW сервере корпоративной сети ИНЦ, формируя уникальные (с ограниченным доступом) БД на WWW серверах институтов, а использование языков Java, Perl, Delhy позволит создавать независимые от платформ приложения.
Основные функции корпоративной системы ИНЦ:
обеспечение информационного объединения и трудоемких вычислений на мощных рабочих станциях пользователей (институтов ИНЦ), работающих на разных программноаппаратных платформах;
осуществление распределения выполнения приложений между клиентами и сервером, обеспечивающего сокращение общего времени вычислений, уменьшение использования клиентом памяти, сокращение сетевого трафика;
проведение трудоемких вычислений на мощных рабочих станциях;
формирование тематических баз данных и знаний институтов ИНЦ;
обеспечение защиты и целостности информации;
поддержка функционирования современных систем документооборота;
обеспечение доступа к уникальным БД Байкальского региона институтов ИНЦ и к другим отечественным и зарубежным тематическим WWW серверам;
публикация в электронной форме результатов работы институтов ИНЦ, что позволит сократить путь к их практическому внедрению;
создание тематических WWW страниц и наполнение FTP-серверов институтов ИНЦ;
поддержка электронной почты, доски объявлений, видеоконференций.
3. Интегрированная геоинформационная система ИНЦ СО РАН
Корпоративная система ИНЦ позволяет в качестве одного из приложений создать интегрированную ГИС (ИГИС) для поддержки фундаментальных исследований в области геоэкологии и природопользования. Одпим из элементов корпоративной сети является ГИС сервер, установленный в ГИС центре ИНЦ и поддерживающий все необходимые режимы обработки географической информации — запуск ГИС (ArcInfo, MapInfo и т.д.), преобразование и унификацию данных, формирование HTML-страниц и т. д.
ГИС сервер планируется установить па сервер ALR REVOLUTION 2XL Model H-300 с процессором Pentium II (в настоящее время используется Pentium Pro) под управлением OS Windows NT, что обеспечит простой и надежный контроль за действиями пользователей и встроенную систему защиты информации от несанкционированного доступа.
Инструментальные геоинформационные системы ArcInfo для Windows NT, Erdas Imagine 8.3 для Windows NT, ArcView 3.0, КАМАТ, электронная топооснова общего назначения размещаются па ГИС сервере, а корпоративные БД — па SQL-сервере корпоративной сети ИНЦ под управлением СУБД Oracle v7.0.
Для повышения эффективности ИГИС высококачественное периферийное оборудование общего назначения, функционирующее в рамках ГИС центра ИНЦ СО РАН (плоттер, сканеры, дигитайзер, цветные принтеры, CDR), подключается к ГИС серверу, работающему в рамках ИИВС и имеющему доступ из Internet (рис. 2). Созданный ГИС сервер позволяет обеспечить:
растровое моделирование;
моделирование топографических поверхностей и пространственных сетей; использование геодезии и координатной геометрии; ввод картографических данных со сканера и дигитайзера; непрерывность картографической БД;
Рис. 2. Структура программно-аппаратного обеспечения ГИС центра ИНЦ СО РАН.
эффективное управление БД;
реализацию архитектуры клиент — сервер;
единый метод обработки транзакций и управление ими на основе картографических объектов;
создание макетов тематических карт;
блокировку на уровне объектов и отслеживание изменений картографической БД.
ИГИС обеспечивает импорт — экспорт данных между сервером и клиентами с помощью страниц, причем только небольшие графические БД могут быть переданы
клиентами для обработки ГИС сервером. Каждый институт ИНЦ, в свою очередь, при наличии соответствующего разрешения может иметь доступ к уникальным базам данных других институтов, находящимся на их серверах.
В настоящее время в рамках ГИС центра ИНЦ подготовлено три пилотных проекта совместных исследований в области геоинформатики:
ГИС “Редкие, эндемичные и реликтовые виды животных и растений бассейна оз. Байкал” (Сибирский институт физиологии и биохимии растений СО РАН, Институт динамики систем и теории управления СО РАН, Байкальский музей ИНЦ СО РАН, Госкомитет по охране окружающей среды Иркутской области);
ГИС “Биоразнообразие толщи вод оз. Байкал” (Лимнологический институт СО РАН, Институт динамики систем и теории управления СО РАН);
ГИС “Рекреационные территории Байкальского региона” (Институт географии СО РАН, Институт динамики систем и теории управления СО РАН).
При разработке ИГИС наряду с рассмотренной ШвЬ-технологией предполагается использовать методы и средства проектирования и создания распределенных информационных систем и баз данных; инструментальные методы обработки и анализа изображений; средства совместной обработки больших информационных потоков (алфавитно-цифровых и графических баз данных), а также создать и адаптировать разнообразные картометрические и другие алгоритмы, поддерживающие процедуру анализа графической информации.
Поступила в редакцию 15 мая 1998 г.