вила её построения. Автоматическая публикация позволяет поддерживать в актуальном состоянии версии онтологий на общедоступном хранилище. Таким образом, проблема коллективной поддерж-
ки онтологических моделей может быть решена с помощью предложенной системы. Её эффективность обусловлена снижением затрат времени на создание и поддержку онтологической модели.
СПИСОК ЛИТЕРАТУРЫ
1. Du W Corporate Semantic Web: Towards the Deployment of Semantic Technologies in Enterprises // Canadian Semantic Wfeb: Technologies and Applications. - Berlin: Springer, 2010. - 217 p.
2. Noy N.F., Chugh A., Liu W, Musen M.A. A framework for ontology evolution in collaborative environments // The Semantic Wfeb: Proc. 5th Intern. Conf. - Athens: Springer, 2006. - P. 544-558.
3. Sure Y., Staab S., Studer R. Ontology Engineering Methodology // Handbook on Ontologies. - Berlin: Springer, 2009. - 811 p.
4. Тузовский А.Ф., Чириков С.В., Ямпольский В.З. Системы управления знаниями (методы и технологии) / под общ. ред. В.З. Ямпольского. - Томск: Изд-во НТЛ, 2005. - 260 с.
5. RCO Fact Extractor SDK. Лингвистический анализатор текста. Общая информация // Технологии анализа и поиска текстовой информации. 2011. URL: http://www.rco.ru/product.asp? ob_no=5047 (дата обращения: 05.03.2011).
6. Horridge M., Bechhofer S. The OWL API: A Java API for Working with OWL 2 Ontologies // OWL Experiences and Directions: Proc. 6th Intern. Workshop. - Chantilly, 2009. - V. 529. - P. 53-62.
7. Motik B., Patel P.F., Parsia B. OWL 2 Web Ontology Language structural specification and functional style syntax // World Wide Web Consortium. 2009. URL: http://www.w3.org/TR/owl2-syntax/ (дата обращения: 05.03.2011).
8. Sirin E., Parsia B., Grau B.C., Kalyanpur A., Katz Y. Pellet: A practical OWL-DL reasoner // Journal of Web Semantics. - 2007. -V. 5. - № 2. - P. 51-53.
9. Orlink O. Implementing a SPARQL compliant RDF Triple Store using a SQL-ORDBMS. 2010. URL: http://virtuoso.open-linksw.com/dataspace/dav/wiki/Main/VOSRDFWP (дата обращения: 05.03.2011).
10. Torres E., Feigenbaum L., Clark K.G. SPARQL Protocol for RDF // World Wide Web Consortium. 2008. URL: http://www.w3.org/TR/rdf-sparql-protocol/ (дата обращения: 05.03.2011).
Поступила 09.03.2011 г.
УДК 004.415;551.46;551.52;553.361
web-ресурс для атмосферной коррекции спутниковых данных
М.В. Энгель1, С.В. Афонин12, В.В. Белов12
'Институт оптики атмосферы им. В.Е. Зуева СО РАН, г. Томск 2Томский государственный университет E-mail: [email protected]; [email protected]; [email protected]
Дается описание Web-ресурса, позволяющего на основе физического подхода удаленно осуществлять атмосферную коррекцию спутниковых измерений. В качестве информационных источников для задания оптико-метеорологического состояния атмосферы используются локальные и пространственно распределенные информационные ресурсы. Web-ресурс на первом этапе ориентирован на обработку спутниковых данных EOS/MODIS и NOAA.
Ключевые слова:
Web-ресурс, атмосферная коррекция, спутниковые данные. Key words:
Web-resource, atmospheric correction, satellite data.
Введение
Наблюдения земной поверхности с помощью спутниковых систем осуществляются через атмосферу, которая является многокомпонентной средой, искажающей результаты дистанционного зондирования Земли (ДЗЗ). Характер и степень атмосферных искажений зависит от спектрального диапазона и оптико-метеорологического состояния атмосферы в момент проведения зондирования. В этой связи атмосферная коррекция (АК) спутниковых измерений является необходимым условием успешного решения широкого спектра задач. Атмосферная коррекция используется в штатных алгоритмах тематической обработки спутниковых
изображений системы глобального мониторинга EOS/MODIS, возможность её проведения для других спутниковых систем предоставляют различные коммерческие программные продукты (ERDAS, ENVI, FLAASH, ATCOR, ATREM, ACORN). В то же время, в большинстве случаев атмосферная коррекция производится приближенно, иногда с точностью, недостаточной для решения конкретной тематической задачи. Например, в задаче спутниковых измерений температуры поверхности Земли [1] учитывается только поглощение излучения водяным паром, но нет учета искажающего влияния аэрозоля и облачности. В задаче детектирования высокотемпературных источников (обнаруже-
ния лесных пожаров) [2] совершенно не рассматривается влияние атмосферы. При восстановлении коэффициентов отражения подстилающей поверхности отсутствует учет бокового подсвета [3].
Исправить эту ситуацию можно на основе последовательного физического метода, где используется теория переноса оптического излучения земной поверхности через многокомпонентную среду совместно с оперативной информацией о параметрах оптико-метеорологического состояния атмосферы в момент проведения зондирования из космоса. Однако применение физического метода является безусловно нетривиальной задачей, и реализация соответствующего программного обеспечения в центрах приема и обработки спутниковых данных потребует определенных временных и финансовых затрат, достаточного объема специальных знаний, решения ряда организационных вопросов.
Путь решения данной проблемы видится в возможности объединения пространственно распределенных информационных и вычислительных ресурсов. Этот подход положен в основу Web-ресур-са, позволяющего удаленно осуществлять процедуру атмосферной коррекции. Такой Web-ресурс в настоящий момент разрабатывается в ИОА СО РАН и будет ориентирован на обработку данных спутниковой аппаратуры EOS/MODIS, NOAA/POES, SPOT, LANDSAT, а также в перспективе данных и других спутниковых систем. На начальном этапе развития Web-ресурса реализована возможность атмосферной коррекции данных каналов инфракрасного диапазона спутниковой системы EOS/MODIS. Методические вопросы проведения АК изложены в работах [1-9].
Web-ресурсы, сочетающие информационные
и вычислительные возможности
Крупные центры приема и обработки данных ДЗЗ уже давно интегрированы в мировую сеть и распространяют свои данные в основном с использованием Web-технологий, что, безусловно, расширяет круг потенциальных пользователей спутниковой информации. Нельзя не отметить тот факт, что уже существуют Web-ресурсы, с помощью которых можно не только получить данные ДДЗ, но и провести анализ этих данных. В качестве примера такого ресурса можно назвать портал GIOVANNI (GES-DISC - Goddard Earth Sciences Data and Information Services Center - Interactive Online Visualization ANd aNalysis Infrastructure) [10], предназначенный для визуализации и статистического анализа данных различных спутниковых систем.
Примером сайта, имеющего возможности для проведения анализа представленной на нем информации, является сайт программы AERONET (AERONET - AErosol RObotic NETwork) [11]. Ресурс предоставляет доступ к результатам измерений параметров аэрозоля, полученных на станциях всемирной сети AERONET. Данные имеют три уровня обработки. Пользователь может произвести поиск информации по временным и географиче-
ским критериям, получить графическое представление данных, произвести траекторный анализ измерений. Также предоставлена возможность получить данные в формате Google Earth [12].
Функционирующий в сети Интернет Web-каль-кулятор [13] для учета молекулярного поглощения в тепловом канале прибора ETM+ спутниковой системы Landsat [14, 15] является единственным примером осуществления атмосферной коррекции с помощью пространственно удаленного ресурса. Web-ресурс для атмосферной коррекции, разрабатываемый в Институте оптики атмосферы СО РАН, г. Томск, безусловно, предназначен для решения более широкого круга задач при тематической обработке спутниковых данных.
Архитектура Web-ресурса
Для создаваемого Web-ресурса выбрана трехуровневая архитектура, характерная для приложений баз данных (БД), применяющих Web-техноло-гии. Такая архитектура подразумевает наличие цепочки «сервер базы данных - Web-сервер - клиентский компьютер и браузер». Сервер базы данных поддерживает СУБД и выполняет всю работу с данными. В базах данных хранятся метаданные спутниковых снимков, а также служебная информация, включающая данные о пользователях и данные о работе комплекса. Web-сервер выполняет функции http-сервера, сценарного интерпретатора и обработчика представлений экземпляров баз данных. Браузер выполняет функции по представлению информации на компьютере клиента.
Для обеспечения функциональности ресурса разрабатывается оригинальное программное обеспечение, включающее модуль, реализующий функции поиска и получения необходимой априорной оптико-метеорологической информации из удаленных источников; расчетные модули; специальную программу-диспетчер, предназначенную для связи между различными блоками ресурса и управления серверными приложениями, выполняющими тематические задачи. Разработка программ, обеспечивающих работу Web-ресурса, основывается нали-цензионно-чистых, открытых (open-source) программных средствах. Разработка ведется в среде операционной системы Linux. Для создания Web-интерфейса и программ, управляющих работой ресурса, используется высокоуровневый язык Python. Web-интерфейс создается на основе свободно распространяемого фреймворка для создания Web-при-ложений Django [16], реализованного также на языке Python. Базы данных разрабатываются на основе объектно-реляционной СУБД PostgreSQL. Расчетные модули написаны преимущественно на языках C++ и Fortran и реализованы с использованием программного обеспечения GCC и Intel Fortran.
В качестве модели процесса переноса излучения предлагается использовать программу MODTRAN, хорошо зарекомендовавшую себя для решения задач атмосферной коррекции данных ДЗЗ из космоса.
Рис. 1. Архитектура \еЬ-ресурса
Источники информации
В качестве информационных источников для задания оптико-метеорологического состояния атмосферы используют локальные и пространственно распределенные информационные ресурсы, содер-
Задание условий поиска априорной оптико-метеорологической _информации_
жащие наземные и спутниковые измерения параметров атмосферы, прогностические метеоданные.
Информационной основой ресурса на первом этапе разработки являются локальные базы данных, содержащие метаданные измерений спутни-
Имя файла
Для проведения АК
Задание географических и временных параметров
Определение ключей для поиска в БД
I
Поиск в локальных БД
Контр ОЛЬ
А к
Расчет
Получение результата
Запись априорной информации в директорию для расчета
Получение данных из удаленных БД
Формирование
запроса к удаленным БД
Получение прогностической модели
Нет
Поиск в удаленных БД
Рис. 2. Алгоритм работы \еЬ-ресурса
ковой системы NOAA/POES и данные о параметрах атмосферы (метеопараметры, аэрозоль, облачность), полученные на основе измерений спектро-радиометра MODIS спутников EOS. Файлы со спутниковой информацией хранятся на дисках сервера. Первичный поиск метеоинформации о состоянии атмосферы, требуемой для проведения атмосферной коррекции, производится в локальных базах данных. Поиск может быть расширен за счет
обращения к удаленным источникам. В настоящий момент в качестве удаленного источника определен ftp-сайт [17] сервера LAADS Web (Level 1 and Atmosphere Archive and Distribution System) [18], который предоставляет доступ к огромным архивам разнообразной спутниковой информации. На данном этапе предусматривается поиск и получение атмосферных спутниковых данных MODIS второго уровня (Level 2) коллекции 51.
Рис. 3. Web-интерфейс для задания входных параметров и фрагмент обрабатываемого снимка для указанного региона
При отсутствии спутниковых данных о состоянии атмосферы в качестве априорной информации используются прогностические модели, источником которых является сайт National Weather Service [19].
Организация взаимодействия различных модулей ресурса
Организацию работы ресурса и взаимодействие различных модулей осуществляет программа-диспетчер, построенная по принципу конечного автомата. Пользователь формирует задание с помощью Web-интерфейса, параметры задания записываются в таблице базы данных. Строка таблицы с параметрами задания содержит также поля, фиксирующие признаки выполнения задания. Возможные значения признаков выполнения задания соответствуют возможным состояниям автомата, соответственно, число состояний конечного автомата равно числу возможных признаков выполнения задания. Программа-диспетчер работает в фоновом режиме и с заданной периодичностью считывает записи с признаком «не выполнено» из таблицы базы данных, содержащей параметры заданий. Далее программа диспетчер запускает модули выполнения задания в зависимости от состояния последовательности признаков выполнения задания.
Вычислительные модули реализуются на основе программ для решения задач переноса оптического излучения через атмосферу (MODTRAN, 6S).
Использование Web-ресурса
Принцип использования Web-ресурса достаточно прост. Пользователь делает запрос на проведение атмосферной коррекции, указывая ключевые атрибуты (временные и пространственные) файла телеметрической информации (снимка) и требуемые спектральные каналы. В соответствии с заданными атрибутами производится поиск необходимой априорной оптико-метеорологической информации. Если требуемых данных в определенных информационных источниках нет, используются оптические модели атмосферы. Затем для заданного снимка осуществляется расчет требуемых характе-
СПИСОК ЛИТЕРАТУРЫ
1. Wan Z. MODIS Land-Surface Temperature Algorithm Theoretical Background Document (LST ATBD), version 3.3 // MODIS Wfeb. 1999. URL: http://modis.gsfc.nasa.gov/data/atbd/atbd_mod11.pdf (дата обращения: 01.12.2010).
2. Giglio L., Descloitres J., Justice C., Kaufman Y. An Enhanced Contextual Fire Detection Algorithm for MODIS // Remote Sens. Environ. - 2003. - V.87. - P. 273-282.
3. Vermote E.F., Vermeulen A. Atmospheric correction algorithm: spectral reflectances (MOD09). Algorithm Theoretical Background Document, version 4.0 // MODIS Web. 1999. URL: http://mo-dis.gsfc.nasa.gov/data/atbd/atbd_mod08.pdf (дата обращения: 01.12.2010).
4. Афонин С.В., Белов В.В., Соломатов Д.В. Разработка программного обеспечения для атмосферной коррекции аэрокосмических ИК-измерений температуры подстилающей поверхности. // Оптика атмосферы и океана. - 2006. - Т. 19. - № 1. -C. 69-76.
ристик искажающего влияния атмосферы. Результаты расчета пользователь получает по сети Интернет вместе со специально разработанной утилитой для атмосферной коррекции спутниковых изображений, полученных в инфракрасном диапазоне. Схема работы Web-ресурса приведена на рис. 2.
На рис. 3 приведен пример Web-интерфейса, используемого при задании входных параметров для проведения атмосферной коррекции в 31 канале MODIS. Определен регион 74...90° в.д., 54...62° с.ш. Время измерений 23 июня 2009 г., 05:00 GMT. В качестве априорной информации выбраны спутниковые метеоданные MODIS. Снизу приведен фрагмент обрабатываемого снимка для указанного региона. Изображение синтезировано как композиция измерений трех каналов (длины волн 0,646, 0,553, 0,466 мкм).
Заключение
Разработано и проходит тестирование программное обеспечение Web-ресурса для проведения атмосферной коррекции спутниковых изображений земной поверхности. Первая версия позволяет производить обработку спутниковых данных EOS/MODIS с использованием априорной информации о состоянии атмосферы из локальных баз данных и удаленных источников. В дальнейшем предполагается развитие Web-ресурса в следующих направлениях:
• Разработка «быстрой» модели процесса переноса излучения поверхности через атмосферу. Разработка методики и программных средств контроля качества атмосферной коррекции спутниковых данных.
• Разработка и апробация программных средств для решения посредством Web-ресурса задачи атмосферной коррекции (и контроля её качества) для спутниковых данных в видимом спектральном диапазоне.
• Расширение возможностей проведения посредством Web-ресурса для атмосферной коррекции данных систем высокого пространственного разрешения Landsat, SPOT и др.
5. Афонин С.В., Соломатов Д.В. Методика учета оптико-метеорологического состояния атмосферы для решения задач атмосферной коррекции спутниковых ИК-измерений // Оптика атмосферы и океана. - 2008. - Т. 21. - № 2. - С. 147-153.
6. Афонин С.В., Белов В.В., Соломатов Д.В. Решение задач температурного мониторинга земной поверхности из космоса на основе RTM-метода // Оптика атмосферы и океана. -2008. - Т. 21. - № 12. - C. 1056-1063.
7. Соломатов Д.В. Алгоритмы и программные средства атмосферной коррекции спутниковых ИК-измерений на основе RTM-метода: Автореф. дис. ... канд. тех. наук. - Томск, 2010. -21 с.
8. Афонин С.В. Результаты тестирования двух методов атмосферной коррекции спутниковых ИК-измерений температуры земной поверхности // Оптика атмосферы и океана. - 2010. -Т. 23. - № 4. - С. 308-310.
9. Афонин С.В. К вопросу о применимости восстановленных из космоса метеоданных MODIS для атмосферной коррекции
спутниковых ИК измерений // Оптика атмосферы и океана. -2010. -Т. 23. -№8. -C. 684-690.
10. Giovanni - The Bridge Between Science and Data. 2007. URL: http://disc.sci.gsfc.nasa.gov/giovanni (дата обращения: 01.12.2010).
11. AERONET Data Synergy Tool - Access Earth Science data sets for AERONET sites. 2007. URL: http://aeronet.gsfc.nasa.gov (дата обращения: 01.12.2010).
12. Google Планета Земля. 2010. URL: http://www.goo-gle.com/intl/ru/earth/index.html (дата обращения: 01.12.2010).
13. Atmospheric Correction Parameter Calculator. 2009. URL: http://atmcorr.gsfc.nasa.gov (дата обращения: 01.12.2010).
14. Barsi J.A., Barker J.L., Schott J.R. An Atmospheric Correction Parameter Calculator for a Single Thermal Band Earth-Sensing Instrument // Atmospheric Correction Parameter Calculator. 2009. URL: http://atmcorr.gsfc.nasa.gov/Barsi_IGARSS03.pdf (дата обращения: 01.12.2010).
15. Barsi J.A., Schott J.R., Palluconi F.D., Hook S.J. Validation of a Web-Based Atmospheric Correction Tool for Single Thermal Band Instruments // Atmospheric Correction Parameter Calculator. 2009. URL: http://atmcorr.gsfc.nasa.gov/Barsi_AtmCorr_SPIE05.pdf (дата обращения: 01.12.2010).
16. Django Software Foundation. 2005. URL: http://www.djangoproj-ect.com (дата обращения: 01.12.2010).
17. LAADS FTP site. 2007. URL: ftp://ladsweb.nascom.nasa.gov (дата обращения: 01.12.2010).
18. LAADS Web - Level 1 and Atmosphere Archive and Distributiuon System. 2007. URL: http://ladsweb.nascom.nasa.gov/index.html (дата обращения: 01.12.2010).
19. National Weather Service. 2005. URL: http://www.weather.gov (дата обращения: 01.12.2010).
Поступила 17.12.2010 г.
УДК 002.53:004.89
обеспечение содержательного многоязычного доступа к лингвистическим информационным ресурсам на основе технологии порталов знаний
Ю.А. Загорулько, О.И. Боровикова, И.С. Кононенко
Институт систем информатики им. А.П. Ершова СО РАН, г. Новосибирск Новосибирский государственный университет E-mail: [email protected]
Рассматривается интернет-портал знаний, обеспечивающий систематизацию и интеграцию знаний и информационных ресурсов по компьютерной лингвистике на основе онтологии, а также содержательный многоязычный доступ к ним: управляемую онтологией навигацию и поиск информации в терминах предметной области портала знаний.
Ключевые слова:
Портал знаний, компьютерная лингвистика, информационные ресурсы, онтология, содержательный доступ, управляемая онтологией навигация. Key words:
Knowledge portal, computational linguistics, Information resources, ontology, content-based access, ontology-driven navigation.
Введение
В настоящее время наблюдается бурный рост потребности в средствах автоматической обработки документов и естественно-языковых, в том числе речевых, интерфейсах. Это ставит на повестку дня проблему организации эффективного доступа не только к публикациям, описывающим методы и подходы к пониманию текста и речи, но и разного рода словарям, программным компонентам и алгоритмам, обеспечивающим решение различных задач по их обработке. И хотя в Интернете представлен большой объем информационных ресурсов по этой тематике, доступ к ним весьма затруднен, т. к. они плохо систематизированы и рассредоточены по различным Интернет-сайтам, каталогам и электронным архивам.
Для решения этой проблемы разрабатываются различные интернет-ресурсы. Самым известным из них является англоязычный каталог LINGUIST List [1], созданный для обмена знаниями между лингвистами и содержащий информацию о публи-
кациях, персоналиях, научных учреждениях, грантах, конкурсах, проектах, фондах, конференциях и семинарах лингвистической тематики.
Российским аналогом LINGUIST List является портал «Лингвистика в России: ресурсы для исследователей» [2], организованный в виде иерархического каталога ссылок, тематические категории которого представлены разделами по компьютерной, теоретической и прикладной лингвистике и их приложениям.
Из других разработок стоит отметить созданный в Германском Исследовательском Центре Искусственного Интеллекта информационный портал «Language Technology World» [3]. Тематические разделы этого портала содержат информацию о лингвистических технологиях, продуктах и информационных системах в области обработки естественного языка, а также о проектах, организациях и персонах. В основу портала положена онтология [4, 5], благодаря чему возможно установление связей между его разделами. К сожалению, на этом