УДК 517:556
Методика применения карт Кохонена для выделения линии уреза воды по спутниковым данным*
О.В. Журенков
Алтайская академия экономики и права (Барнаул, Россия)
Using Kohonen Maps for Water Boundary Line Identification with Satellite Data
O. V. Zhurenkov
Altai Academy of Economics and Law (Barnaul, Russia)
Дается понятие и описание самоорганизующихся карт Кохонена (SOM), принципов отображения исходного многомерного пространства данных на двумерную SOM. Также описываются особенности ПО ScanEx NeRIS, в первую очередь, связанные с встроенным инструментом, использующим SOM для анализа и визуализации спутниковых данных. В качестве исходных данных взяты снимки высокого разрешения (в формате GeoTIFF), полученные радиометром Landsat (Landsat 5). В результате проведенных исследований получена методика выделения линии уреза воды по спутниковым данным в NeRIS, позволяющая проводить качественную оценку затоплений. Выявлен критический параметр методики (порог вероятности принадлежности к тематическому классу), влияющий на выделение линии уреза. В качестве объекта апробации методики выбраны данные о затопленных пойменных участках Верхней Оби в июне 2010 года. Получены векторные карты распознанных с помощью SOM-областей, на основе которых в Quantum GIS получен образец конечного продукта в виде векторной карты затоплений. Сделан вывод о том, что для дальнейшего (количественного) анализа необходима калибровка параметров распознавания по наземным измерениям.
Ключевые слова: спутниковые данные, самоорганизующиеся карты Кохонена, SOM, линия уреза воды.
DOI 10.14258/izvasu(2016)1-20
This paper provides a description of Kohonen's self-organizing maps (SOM) and principles of original multidimensional data space transformation into a two-dimensional SOM. Also, features of ScanEx NeRIS software designed for analysis and visualization of satellite data with built-in SOM tool are presented. High-resolution images (in GeoTIFF format) obtained by Landsat (Landsat 5) radiometer are utilized as the input data. A NeRIS-based technique for water boundary line identification with satellite data for further qualitative flooding evaluation is elaborated. It is found out that class belonging probability threshold is a critical parameter of the proposed technique that affects the identification. Satellite data of flooded floodplain areas of the Upper Ob in June 2010 are processed. Vector maps of areas with data processed by SOM-based technique are obtained and exported to Quantum GIS for building a vector map of flooded areas. It is concluded that further quantitative analysis requires calibration of the identification technique parameters with ground data.
Key words: satellite data, self-organizing maps,
SOM, water boundary line.
Введение. Русловые водохранилища относятся к динамичным водным объектам, что обусловлено равнинным характером рельефа и сложным режимом колебания уровня водоема за счет многолетних, сезонных и суточных изменений. Чем крупнее водохранилище, тем значитель-
* Научная работа проводилась по договору №63/2012 в ФГБОУ ВПО «Алтайский государственный университет».
нее его влияние на окружающую среду, а следовательно, тяжелее негативные последствия и сложнее комплекс природоохранных мероприятий [1, с. 523].
За последние годы природная стихия все чаще стала проявляться в различных частях Земли, и оперативная оценка ущерба от таких стихийных бедствий носит актуальный характер. Паводки и наводнения являются одним из самых частых
и масштабных бедствий [2, с. 29]. Такие стихийные бедствия превосходят по площади и наносимому ущербу все другие чрезвычайные ситуации [3,4].
Именно поэтому весомую часть одной из программ фундаментальных исследований РАН «Новые ГИС и веб-технологии, включая методы искусственного интеллекта, для поддержки междисциплинарных научных исследований сложных природных, технических и социальных систем с учетом их взаимодействия» (координаторы — ак. Ю.И. Шокин, чл.-корр. РАН И.В. Бычков) составляет изучение процесса затопления пойменных территорий во время половодий и паводков (в частности, поймы р. Оби в районе г. Барнаула) [5, с. 38].
С другой стороны, данные спутникового зондирования Земли становятся более доступными для применения в народном хозяйстве, в муниципальном управлении, для прогнозирования чрезвычайных ситуаций. Так, данные высокого разрешения спутников Ьа^за! имеются в свободном доступе и представляют наибольший практический интерес в подобных исследованиях [1, 3, 4, 6-8].
Однако спутниковые данные, получаемые от спектрорадиометров, представляют собой поток «сырых данных», полезную информацию из которых надо еще суметь добыть [9]. Для конечного пользователя, для лиц, принимающих решения, важна тематическая интерпретация данных, на основе которой может быть выделена линия уреза воды, проведена оценка площадей подтоплений [3,4].
NeRIS. Для определения линии уреза воды на затопленных пойменных участках была использована программа тематической интерпретации данных дистанционного зондирования БсапЕх МеШБ. Эта программа позволяет совместно обрабатывать векторную и растровую информацию. При этом используются векторные цифровые нетопологические карты, предназначенные для хранения геометрической и атрибутивной информации о векторных картографических объектах.
МеШБ предоставляет большой комплекс функциональных возможностей как для обработки и тематической интерпретации данных дистанционного зондирования, так и для создания и обновления на их основе векторных цифровых тематических карт [10]. Данный программный продукт позволяет использовать при обработке данных наряду с традиционными методами (визуализация, фильтрация, получение новых изображений расчетными методами) использовать прогрессивные методы, использующие адаптивные алгоритмы на основе искусственных нейронных сетей.
Главной отличительной особенностью этого программного продукта является использование
искусственных нейронных сетей Кохонена (точнее, самоорганизующихся карт Кохонена, — Self-Organizing Map, SOM) для тематической классификации.
Самоорганизующиеся карты Кохонена.
Нейронные сети Кохонена — класс нейронных сетей, основным элементом которых является слой Кохонена. Слой Кохонена состоит из адаптивных линейных сумматоров («линейных формальных нейронов»). Выходные сигналы слоя Кохонена формируются по правилу «победитель забирает все»: наибольший сигнал превращается в единичный, остальные обращаются в ноль.
Идея сети Кохонена принадлежит финскому ученому Тойво Кохонену (1982 год). Основной принцип работы таких сетей — введение в правило обучения нейрона информации относительно его расположения.
По способам настройки входных весов сумматоров и по решаемым задачам различают много разновидностей сетей Кохонена. Наиболее распространенная — самоорганизующиеся карты Кохо-нена (SOM). Они представляют собой соревновательную нейронную сеть с обучением без учителя, выполняющую задачу визуализации и кластеризации.
SOM являются методом проецирования многомерного пространства в пространство с более низкой размерностью (чаще всего двумерное). Самоорганизующиеся карты Кохонена служат, в первую очередь, для визуализации и первоначального («разведывательного») анализа данных [11, с. 322]. Сеть Кохонена представляет собой два слоя: входной и выходной.
Сигнал в сеть Кохонена поступает сразу на все нейроны, веса соответствующих синапсов интерпретируются как координаты положения узла, и выходной сигнал формируется по принципу «победитель забирает все» — то есть ненулевой выходной сигнал имеет нейрон, ближайший (в смысле весов синапсов) к подаваемому на вход объекту. В процессе обучения веса синапсов настраиваются таким образом, чтобы узлы решетки «располагались» в местах локальных сгущений данных, то есть описывали кластерную структуру облака данных, с другой стороны, связи между нейронами соответствуют отношениям соседства между соответствующими кластерами в пространстве признаков.
Удобно рассматривать такие карты, как двумерные сетки узлов, размещенных в многомерном пространстве (рис. 1). Изначально самоорганизующаяся карта представляет из себя сетку из узлов, соединенных между собой связями.
Сеть Кохонена обучается методом последовательных приближений. В процессе обучения таких сетей на входы подаются данные, но сеть при этом подстраивается не под эталонное значение
Расстояние по Хеммингу (мера относительно нормы Ь1):
В2(хг , Х^ )
\
N
N
ВН (Хг ,Хз ) = ^ \х.ц - ХЦ |
Рис. 1. Самоорганизующаяся карта Кохонена с прямоугольной топологией
выхода, а под закономерности во входных данных. Начинается обучение (шаг ¿о) с выбранного случайным образом выходного расположения центров (обозначенных кругами на рис. 1) и/или их весов. На очередном шаге г
N
Ю (г + 1) = тг(г) + п(г) ^ Х - (¿)], (1)
3=1
где хз — входное значение а'-го нейрона первого слоя (а-ая компонента вектора входного образа), N — размерность вектора входного образа, юг (г) и юг (г + 1) — весовой коэффициент синапса, соединяющего эти нейроны, на итерациях г и г + 1, соответственно, п(г) — функция скорости обучения.
Полный алгоритм самоорганизации нейронных сетей Кохонена состоит из следующих шагов:
1. На стадии инициализации всем весовым коэффициентам присваиваются небольшие случайные значения.
2. На входы сети подается входной образ, и для каждого нейрона рассчитывается взвешенная сумма его входов, к которой затем применяется активационная функция нейрона, в результате чего получается его выходное значение у(М), где М — число нейронов в слое Кохонена.
3. Вводится некоторая функция близости, по которой выбирается «победитель». Виды функции близости:
• Евклидово расстояние:
1=1
• Расстояние Чебышева:
, Хз) = ^тах \хц - ХЦ \ •
Нейрон, для которого значение функции близости между входным вектором, характеризующим некоторый образ, и вектором весовых коэффициентов минимально (максимально, если в качестве функции близости используется скалярное произведение), объявляется «победителем».
4. После определения нейрона-победителя его весовые коэффициенты, а также весовые коэффициенты нейронов, находящихся в некоторой его окрестности в топологической решетке, подстраиваются по формуле (1).
5. Цикл с шага 2, пока выходные значения сети не стабилизируются с заданной точностью.
На втором шаге цикла попеременно предъявляются все образы из входного набора.
При обучении образ, характеризующийся входным вектором, относится к классу, который представляется «нейроном-победителем». В результате осуществляется преобразование ^мерного входного пространства на р-мерную сетку слоя Кохонена. Отличительная особенность этого отображения — формирование кластеров или классов. По завершении процесса самообучения на стадии использования сети неизвестные входные образы относятся к одному из выявленных классов.
При использовании обучения по алгоритму Кохонена существует практика нормализации начальных значений весовых коэффициентов входных образов на стадии инициализации.
N -1
Х(х3! - ХИ )2
1=1
где хг — г-ая компонента вектора входного образа или вектора весовых коэффициентов, а N — его размерность. Это позволяет сократить длительность процесса обучения.
Для наглядного представления выявленной в результате обучения структуры многослойного изображения часто используется отображение Сэммона (см. рис. 2) при котором классы в исходном ^мерном пространстве изображения отображаются на плоскость так, что расстояния между образами классов равны расстояниям между самими классами. После нормировки полученных
Х
в результате отображения координат Сэммона получается инвариантное представление структуры исходного изображения.
для передачи с целью дальнейшего использования в другие геоинформационные системы.
Методика определения площадей затопления. Для определения и анализа области затопления был выбран летний период 2010 года, территория вблизи г. Барнаула. Проследить динамику затопления можно по данным МОВК/Тегга (см. рис. 3).
Рис. 2. Представление Сэммона обученной ЯОМ: а — со всеми связями; б — в виде остовного дерева, построенного с учетом матрицы расстояний; в — в виде остовного дерева, построенного с учетом соседства в ЯОМ
Уникальность метода самоорганизующихся карт состоит в топологическом (2-мерном) отображении многомерных данных (в данном случае — наборов пикселей во всех слоях изображения) , которое строится на основе структуры изображения, выявленной нейронной сетью Кохонена.
Эта особенность является уникальной функциональной возможностью программы МеШБ, обеспечивающей широкие возможности тематической интерпретации данных дистанционного зондирования, отсутствующие в других программах. В МеШБ искусственные нейронные сети используются как при выделении тематической информацию, так и при ее переводе в векторный вид
д
е
Рис. 3. Динамика затопления (по данным Мо^): а — 06.06.10; б — 06.08.10; в — 06.10.10; г — 06.15.10; д — 06.17.10; в — 06.18.10
В качестве первичных данных были использованы снимки высокого разрешения (в формате СеоТШЕ), полученные радиометром Ьа^эа! сканером ТМ (Ьа^эа! 5). Для разработки методики определения линии уреза воды на затопленных пойменных участках Оби в окрестностях г. Барнаула была выбрана сцена 20 июля 2010 г. На снимке визуально были выбраны области затопления, которые затем использовались для обучения БОМ.
а
б
в
Размер БОМ — 15 х 15 нейронов (в программе используется прямоугольная сетка), метрика — евклидова, мера близости — распределение Гаусса. Такие параметры были выбраны в результате предыдущих исследований [12, с. 50; 13, с. 107-109]. Далее, используя обученную БОМ, выполнили тематическую классификацию: были выделены и векторизованы участки затопления, границы этих участков соответствуют линиям уреза воды.
В данной модели главным параметром, влияющим на синтез тематической палитры, является «порог» для нейронов: все классы, соответствующие нейронам и расположенные справа от порогового, считаются принадлежащими выбранному тематическому классу, а расположенные слева — не принадлежащими. Оптимальное порого-
вое значение можно установить только после проведения полевых измерений (периметра некоторой затопленной области). Тем не менее, основываясь на предыдущем опыте [13, с. 108-109], для моделирования линий уреза воды был выбран порог 75%.
Для составления векторной карты затопления использовались ограничения (минимальные значения): для площади — 10 000 м2, для периметра — 20 000 м. Полученная таким образом векторная карта (в формате .mif) доступна для просмотра и анализа в программном продукте NeRIS и других геоинформационных системах (например, Quantum GIS, см. рис. 4), а также для машинной обработки в пакетном режиме.
Как видно на рисунке 3, основная область затопления приходится на правый берег реки, вбли-
жюю ¿зоога
Рис. 4. Карта затоплений пойменных участков р. Оби в окрестности г. Барнаула (20 июня 2010 г.)
зи основного русла и протоков. В результате применения адаптивного алгоритма БОМ было распознано несколько типов водной поверхности.
На рисунке 4 изображен результат тематической классификации. На карте представлены три типа водной поверхности:
• проточная вода и мелкие затопления с песчаным дном;
• почвы с высоким содержанием влаги (мелкие острова, болота);
• стоячая вода — затопленные участки лугов и лесов.
Заключение. Предложенная в работе методика позволяет построить модель линии уреза
воды по спутниковым данным с помощью программного комплекса МеШБ. Однако такое моделирование линии не может быть выполнено полностью без полевых измерений и калибровки пороговых значений нейроэлементов. Только после проведения таких измерений возможна апробация данной методики.
Автор выражает признательность Институту водных и экологических проблем Сибирского отделения Российской академии наук (Барнаул, Россия) в лице И.А. Суторихина за постановку задачи и благодарность А.А. Лагутину за консультации и поддержку в работе.
Библиографический список
1. Курбатова И.Е. Космический мониторинг береговой зоны Краснодарского водохранилища // Современные проблемы дистанционного зондирования Земли из космоса. — 2008. — Т. 2.
2. Куссуль Н.Н., Лупян Е.А., Шелестов А.Ю., Скакун С.В., Саворский В.П., Тищенко Ю.Г. Нейросетевой метод мониторинга затопленных территорий с использованием радиолокационных спутниковых данных // Исследование Земли из космоса. — 2008. — №4.
3. Шагаев М.П. Мониторинг паводковой обстановки методом ДЗЗ и оценка возможностей использования для мониторинга данных прибора MODIS на примере паводка на реке Чулым весной 2014 г. // Региональные проблемы дистанционного зондирования земли : материалы II Междунар. науч. конф., 22-25 сентября 2015, г. Красноярск / науч. ред. Е.А. Ваганов; отв. ред. М.В. Носков; Сибирский федеральный университет. — Красноярск, 2015.
4. Третьякова И.А., Мисиров С.А., Мага-ева А.А. Применение ГИС-технологий для оценки зон затопления в дельте Дона // Экология, экономика, информатика : сб. статей — 2015. — T. 3.
5. Основные результаты научно-исследовательской и научно-организационной деятельности за 2012 год : технический отчет / под ред. Ю.И. Винокурова, А.В. Пузанова, Д.М. Безматерных, В.В. Кириллова. — Барнаул, 2012.
6. Архипова О.Е. Методы распознавания зон прибрежной растительности при помощи данных дистанционного зондирования (на примере исследования притоков озера Маныч-Гудило) //
Третья международная конференция «Земля из космоса — наиболее эффективные решения», 4-6 декабря 2007 г. — М., 2007.
7. Геоинформационные методы в картографировании островов северо-западной части Каспийского моря / Б.М. Курамагомедов, Г.М. Абдурахманов, А.Г. Абдурахманов и др. // Юг России: экология, развитие. — 2013. — №1.
8. Лурье И.К., Сакиркина М.А. Геоинформационные технологии эколого-географической оценки земельных ресурсов в пределах водосборных бассейнов (на примере присоединенных территорий новой Москвы) // Экология, экономика, информатика : сб. статей : в 3 т. — 2015. — Т. 3.
9. Лурье И.К., Косиков А.Г. Теория и практика цифровой обработки изображений. — М., 2003.
10. Программа тематической интерпретации данных дистанционного зондирования ScanEx NeRIS version 4.0 (Нейро-сетевая растровая интерпретационная система). Руководство оператора. — М., 2004.
11. Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям. — М., 2010.
12. Журенков О.В. Применение нейронных сетей Кохонена для распознавания типов подстилающей поверхности // Материалы Сибирского научно-практического семинара. — Барнаул, 2009.
13. Журенков О. В., Чикалин Е. Н. Применение нейронных сетей Кохонена для распознавания типов объектов на снимках ASTER/TERRA // Вестник Алтайской академии экономики и права. — 2010. — №2(15).