АТЛАС
"АТМОСФЕРНЫЕ АЭРОЗОЛИ СИБИРИ"*
А. Е. Гуськов, Ю. И. Молородов
Институт вычислительных технологий СО РАН, Новосибирск, Россия e-mail: [email protected], [email protected]
И. А. Сударикова Новосибирский государственный университет, Россия e-mail: [email protected]
In this paper an atmospheric aerosol data-processing system is described. Facilities for data storage, processing and representation are discussed, some areas of further development are identified.
Введение
Современные науки об окружающей среде не могут быть сведены к традиционной географии с ее устоявшимися разделами и понятийным аппаратом. Нельзя ограничиваться химией, физикой, гидро- и газодинамикой, биологией и экологией. Развитие математических и вычислительных моделей показало явную недостаточность имеющейся информации о состоянии окружающей среды и стимулировало интенсивное накопление временных рядов пространственно-распределенных данных инструментальных наблюдений. Эти обстоятельства предопределили особую роль информационных технологий в этой области [1].
На сегодняшний день существует ряд информационных систем, предназначенных для решения различных задач из области наук об окружающей среде и экологии: HYSPLIT (http://www.arl.noaa.gov/ready/hysplit4.html) — обширная база данных наблюдений, позволяющая определить перенос воздушных масс за определенный период времени; GISS (http://www.giss.nasa.gov/data/rsp_air/) комбинирует и сравнивает результаты набора данных космических наблюдений с глобальными моделями атмосферы, земной поверхности и океанических процессов; PANGAEA (www.pangea.de) — библиотека данных и публикаций в области геофизики; мультимедийный информационный ресурс, открывающий интерактивный доступ к собранной информации по оценке влияния атмосферных примесей на окружающую среду (http://www.ess.co.at/AIR-EIA). Аналогичным примером такой системы можно назвать научный портал для атмосферных наук ATMOS (http://atmos.iao.ru), который представляет собой интегрированный набор множества распределенных, но координируемых предметных сайтов, содержащих типовую мультимедийную информацию с исследовательскими базами данных, моделями и аналитическим
* Работа выполнена при частичной финансовой поддержке Президента РФ (грант № НШ 2314.2003.1) и интеграционного проекта СО РАН (грант № 169).
© Институт вычислительных технологий Сибирского отделения Российской академии наук, 2005.
инструментарием для прямого использования и визуализации. Перед проектом "Аэрозоли Сибири" поставлен особый круг задач, не решенный системами, известными авторам, вследствие чего создается новая информационно-вычислительная система "Атмосферные аэрозоли Сибири". Науки об окружающей среде основаны в значительной степени на огромных массивах данных, и одна из ключевых задач информатизации этих наук состоит в организации коллективной работы с архивами данных. С развитием Интернет-технологий появилась возможность по-новому организовывать хранилища данных и доступ к ним [2].
Атмосферные аэрозоли (АА) оказывают существенное влияние на качество окружающей среды, климат, химию и физику атмосферы. Специалистам, занимающимся прогнозированием, моделированием и анализом процессов, происходящих в окружающей среде, необходимо вовремя получать информацию о характеристиках и химическом составе АА. Международным сообществом уже накоплен огромный и разнообразный материал о пространственно-временной изменчивости атмосферных аэрозолей [4].
Следует отметить еще одно обстоятельство. При измерении характеристик атмосферных аэрозолей в течение каждой измерительной кампании, как правило, используется особый набор измерительного оборудования, охватывающий разные диапазоны размеров, поэтому получаемые данные трудно сопоставимы друг с другом. Этим обусловлена необходимость решения задач сбора данных о различных характеристиках АА, опубликованных в разнообразных изданиях и в Интернете, и их анализа по единой методике. Для этого требуется спроектировать и разработать информационную систему, в которой информация будет структурирована и собрана в виде, доступном для понимания пользователю любой степени подготовки. Необходимость такого подхода диктуется современным состоянием дел прежде всего в экологии, проблемы которой актуальны для всех слоев населения. Совместные усилия профессионалов, занимающихся изучением аэрозолей, и специалистов в области информационных технологий позволят повысить эффективность использования всего объема экспериментальных данных.
Таким образом, при проектировании информационно-вычислительной системы, предназначенной для получения теоретических и практических сведений в области химии атмосферы и экологии, необходимо:
— объединить и систематизировать экспериментальные данные, отличающиеся нерегулярностью их измерений, и разнородные библиографические, литературные данные и Интернет-ресурсы по атмосферному аэрозолю;
— организовать доступ широкого круга пользователей к имеющейся информации, ограничив права на изменение, редактирование, добавление данных, организовав тем самым средства для своевременной актуализации информации;
— предоставить возможность для математической обработки хранимой информации и поддерживать различные способы визуализации исходных данных и результатов вычислений;
— реализовать поддержку двух языков как на уровне интерфейса, так и на уровне самих данных.
1. Данные об аэрозолях
Атмосферный аэрозоль является сложной структурой, состоящей из различных химических элементов и их соединений. Сбор исходного материала АА осуществляется на стационарных точках наблюдений (станциях) с периодичностью несколько раз в год. Полу-
ченные пробы разделяют на элементные, ионные и углеродные фракции, определяют их количественное и качественное содержание.
Элементный состав аэрозоля включает в себя отдельные химические элементы, такие как, например, Са, Вг, К и т. д. (в настоящее время имеющаяся аппаратура способна выделить более 60 элементов). В ионном составе выделяют катионы (МН+, К+, Н+, Ка+) и анионы (НСО", С1", Г", N0-), так как только эти химические структуры определяемы на современном оборудовании. Для углеродного состава определяют содержание органического и неорганического углерода на фильтре, которым берут пробы. По общей массовой концентрации аэрозоля система вычисляет и другие значимые углеродные характеристики: суммарную относительную концентрацию и соотношение органического и неорганического углеродов.
Наиболее важными для дальнейшей обработки и моделирования являются полная массовая концентрация покомпонентного состава и концентрация грубодисперсной фракции, а также субмикронная массовая концентрация и полная счетная концентрация аэрозолей, особенно отличающиеся нерегулярностью измерений. Физико-химический анализ проб осуществляется в научно-исследовательских институтах (ИХКиГ, ИЯФ и ИНХ СО РАН), после чего все полученные данные экспортируются в хранилище Атласа.
В то же время данные поступают не только с измерительных станций, существует информация с данными в электронных журналах, в ранее опубликованных статьях. Одной из уникальных особенностей системы является то, что она собирает разнородную информацию в одно хранилище, приводя все описанные выше данные к единому формату.
Еще одним источником данных могут быть сведения, имеющие косвенное отношение к химии и физике атмосферы. Например, Институтом космических исследований РАН (г. Москва) производится сбор данных, представляющих собой спутниковые снимки различных участков Земли. По этим снимкам можно вычислить характеристику отражения света от земной поверхности — альбедо, равную отношению отраженного потока к падающему. Далее выявляется влияние АА на способность поверхности отражать падающий на нее поток электромагнитного излучения или частиц. Таким образом, система предусмотрена не только для решения задач, непосредственно касающихся АА, но и проблем экологии и науки об окружающей среде.
2. Обработка данных
Система предоставляет не только средства хранения данных, визуализацию их зависимостей от времени в табличном и графическом виде (рис. 1), но и возможность обработки данных вычислительными алгоритмами для решения различных задач исследования окружающей среды. При проектировании Атласа было выделено несколько классов задач, каждый из которых порождает собственные модели хранения и обработки данных.
2.1. Статистическая обработка данных
Для интерпретации полученных данных используются различные статистические методы: корреляционный, факторный, дискриминантный, кластерный и фурье-анализ временных рядов. На данный момент в информационно-вычислительной системе реализованы следующие функции:
Рис. 1. Табличное и графическое представление данных.
Рис. 2. Обработка данных: корреляционный и факторный анализ данных.
— подсчет наиболее значимых статистических характеристик покомпонентного химического состава аэрозолей: коэффициентов обогащения, геометрического и среднего арифметического отклонений;
— корреляционный анализ, показывающий взаимосвязь химических элементов и их влияние друг на друга;
— факторный анализ временных рядов, основанный на корреляционном анализе и позволяющий выделить ряд факторов, которые обусловливают присутствие тех или иных химических соединений в составе аэрозоля.
В процессе дальнейшей эволюции системы в существующую модель обработки данных будут добавлены и другие статистические функции (рис. 2).
2.2. Построение функции "Спектр размеров"
Так как в процессе создания базы данных стоит задача унификации характеристик атмосферных аэрозолей с целью их дальнейшего использования для климатического и иного моделирования, предлагается приводить все получаемые характеристики к виду стандартного нормального распределения по размерам [5].
Для описания характеристик атмосферных аэрозолей необходимо знать распределение аэрозольных частиц по размерам, химический состав, форму частиц, коэффициент преломления вещества. Спектр размеров является предпочтительным описанием для включения атмосферного аэрозоля в какие-либо модельные расчеты. Основанием для этого служит то обстоятельство, что дифференциальные характеристики атмосферного аэрозоля, как правило, представляются в виде функции, зависящей от приведенного размера частиц, называемого радиусом. Соответственно, для получения интегральных характеристик атмосферного аэрозоля, имеющих дальнейшее прикладное значение, необходимо проводить интегрирование дифференциальных характеристик с учетом спектра размеров. В большинстве случаев определение спектра размеров атмосферного аэрозоля сводится к решению некорректной обратной задачи [6].
На данный момент в рамках Атласа реализован алгоритм, приводящий следующие характеристики к виду гауссова распределения по размерам: счетную полную, массовую полную, субмикронную концентрации аэрозоля и концентрацию крупных частиц. По этим характеристикам восстанавливается функция "спектр размеров".
2.3. Теория Ми
Мониторинг состояния и поведения аэрозоля ведется, как правило, оптическими методами, поэтому сведения об оптических свойствах и характеристиках аэрозоля в зависимости от углов наблюдения являются актуальными. Для сферических частиц сечения поглощения и рассеяния, а также функции, описывающие зависимость коэффициентов рассеяния от угла, можно рассчитать, если использовать теорию Ми [3]. Она позволяет найти ответ на вопрос о том, как поглощает и рассеивает свет сферическая частица данного радиуса с известными оптическими свойствами. Теория Ми широко используется для интерпретации экспериментальных данных об оптических свойствах атмосферных аэрозолей, а в первом приближении и для несферических частиц.
В рамках Атласа для расчета различных оптических характеристик атмосферных аэрозолей используются алгоритмы, основанные на теории Ми. Используются подпрограммы расчета различных характеристик рассеяния на однородном шаре (ВНМ1Е), на
шаре в оболочке (BHCOAT) и на бесконечном освещенном по нормали цилиндре (BHCYL) и программы обращения к ним.
Реализованные программы теории Ми необходимы для интерпретации экспериментальных данных по различным оптическим свойствам АА: рассеяния, поглощения и ослабления солнечного излучения аэрозольными частицами в атмосфере, что влияет на видимость, радиационный обмен и пр.
3. Результаты
Созданная нами информационно-вычислительная система Атлас "Атмосферные аэрозоли Сибири" доступна по адресу: (http://web.ict.nsc.ru/aerosol/). Можно выделить основные функциональные характеристики системы:
• Хранилище предусматривает все аспекты управления данными: добавление и редактирование, авторизацию пользователей и разграничение доступа к различным информационным структурам, возможность гибкого изменения информационной модели хранилища; реализован сервис импортирования данных.
• Система предусматривает отображение хранимых данных и получаемых результатов, включая табличное и графическое представление.
• Реализован подсчет наиболее значимых характеристик покомпонентного химического состава аэрозолей, необходимых для многоцелевого анализа и обработки данных.
• В web-интерфейсе Атласа полностью поддерживаются два языка: русский и английский.
• Реализован сервис отображения географического распределения экспедиций на базе GIS-приложения Jmapper [7].
Построение системы выполнено на базе программного продукта SMART [8] (System for Managing Applications Based on RDF Technology), использующего технологии RDF, XML, XSLT, Java Servlets. В качестве хранилища данных системы используется СУБД — MySQL 3.23.55. Конечное представление информации пользователю реализовано при помощи клиентских технологий JavaScript, HTML и стилевых таблиц CSS.
4. Заключение
В 2004 году был проведен ряд мероприятий по модернизации Атласа: усовершенствована и формализована схема данных, реализован интерфейс доступа к данным наблюдений на основе GIS-технологии, который в дальнейшем позволит организовать работу с данными космических наблюдений, проводимых Институтом космических исследований РАН (г. Москва).
Предполагаются дальнейшее увеличение математического аппарата обработки данных с применением "аэрозольного калькулятора", предназначенного для вычисления различных характеристик атмосферного аэрозоля, внедрение в систему теории Ми, моделирующей рассеяние света в атмосферном аэрозоле.
На данный момент выработана концепция сервисной архитектуры с возможностью интеграции с внешними информационно-вычислительными системами из области физики атмосферы [9]. Для этого необходимо добавить к существующей технологической платформе среду исполнения web/grid-сервисов и организации их совместной работы, на основании которых планируется создание распределенной информационно-вычислительной
системы, предназначенной для проведения исследований в области физики и химии атмосферы.
Система должна обеспечивать интеграцию разнородных массивов данных, полученных в результате измерений физико-химических характеристик атмосферы независимо от их географического расположения и административной принадлежности. Ее функциональность направлена на обработку, хранение, извлечение и визуализацию данных о состоянии атмосферы через Интернет. В целом система должна позволить оценить влияние антропогенных и естественных источников на изменение характеристик АА, решив тем самым многие вопросы и задачи экологии.
Поставленная задача является началом предложенной концепции создания корпоративной информационно-вычислительной системы Сибирского отделения РАН (базы данных об окружающей среде, модели, алгоритмы обработки и информационные ресурсы) как распределенной информационной инфраструктуры "Интегрированная распределенная система по наукам об окружающей среде" для междисциплинарных исследований окружающей среды.
Список литературы
[1] РодимовА О.Б., Фазлиев А.З. Атмосферно-оптические процессы: простые нелинейные модели. Гл. 5. Томск: Изд-во Ин-та оптики атмосферы СО РАН, 2003.
[2] Фазлиев А.З. Информационные ресурсы и Интернет-технологии для наук об окружающей среде // Вычисл. технологии. 2004. Т. 9. Специальный выпуск: Тр. междунар. конф. "Вычислительно-информационные технологии для наук об окружающей среде" (CITES 2003). Томск, 1-11 сент. 2003. Ч. 1. С. 11-20.
[3] Борен К., Хафмен Д. Поглощение и рассеяние света малыми частицами. M.: Мир, 1986. 660 с.
[4] Куценогий К.П., Куценогий П.К., Молородов Ю.И., Федотов А.М. Разработка структуры метаданных по атмосферным аэрозолям на основе информационной модели // Тр. Междунар. конф. "Математические методы в геофизике". Ч. II. Новосибирск, 2003. С. 438-444.
[5] Молородов Ю.И., Куценогий П.К., Сударикова И.А. Содержательное наполнение атласа "Атмосферные аэрозоли Сибири" // География и природные ресурсы. Специальный выпуск. 2004. С. 86-90.
[6] Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. M.: Наука, 1979.
[7] GIS-приложение Jmapper. http://www.uiggm.nsc.ru/uiggm/geology/
[8] Шрайвман В.Б., Гуськов А.Е. Разработка информационных систем на основе RDF-технологии // Тр. XLI Междунар. научной студен. конф. "Студент и научно-технический прогресс", НГУ. Новосибирск, 2003. Ч. 1. C. 153.
[9] Ковалев С.П Архитектура распределенной информационно-вычислительной системы для исследования свойств атмосферного аэрозоля // Тр. XII Междунар. объединенного симп. "Оптика атмосферы и океана. Физика атмосферы". Томск, 2005. (В печати).
Поступила в редакцию 18 марта 2005 г.