Научная статья на тему 'Выделение оползнеопасных территорий на основе методов нейронных сетей'

Выделение оползнеопасных территорий на основе методов нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
378
85
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННЫЕ СЕТИ / ОПОЛЗНЕВЫЕ ПРОЦЕССЫ / МЕТОДЫ ЗОНИРОВАНИЯ / ГИС / БАЗА ДАННЫХ / МОДЕЛИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузин А. А.

Рассмотрен метод обратного распространения ошибки нейронных сетей, определены параметры исходных данных для зонирования и структура нейронной сети, приведены результаты и дана оценка точности выявления оползнеопасных участков на территории пос. Красная Поляна, сделано предложение о применении цифровой модели рельефа, полученной с помощью высокоточных геодезических методов, для повышения достоверности результатов моделирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кузин А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Выделение оползнеопасных территорий на основе методов нейронных сетей»

УДК 911.6:551.435.627

А.А.КУЗИН, аспирант, [email protected]

Национальный минерально-сырьевой университет «Горный», Санкт-Петербург

A.A.KUZIN, post-graduate student, [email protected]

National Mineral Resources University (Mining University), Saint Petersburg

ВЫДЕЛЕНИЕ ОПОЛЗНЕОПАСНЫХ ТЕРРИТОРИЙ НА ОСНОВЕ МЕТОДОВ НЕЙРОННЫХ СЕТЕЙ

Рассмотрен метод обратного распространения ошибки нейронных сетей, определены параметры исходных данных для зонирования и структура нейронной сети, приведены результаты и дана оценка точности выявления оползнеопасных участков на территории пос. Красная Поляна, сделано предложение о применении цифровой модели рельефа, полученной с помощью высокоточных геодезических методов, для повышения достоверности результатов моделирования.

Ключевые слова: нейронные сети, оползневые процессы, методы зонирования, ГИС, база данных, моделирование.

THE ISOLATION OF LANDSLIDE-PRONE TERRITORY USING THE NEURAL NETWORK METHOD

The method neural networks of back propagation is discussed in this paper. Parameters of the original data for zoning and structure of the neural network are defined. It shows the results and assessments of accuracy landslide areas identification within Krasnaya Polyana. Proposal on the use of digital elevation models produced with high-precision geodetic techniques to improve the reliability of the simulation results is made.

Keywords, neural networks, landslide processes, zoning methods, GIS, database, modeling.

В связи с интенсивным освоением значительных территорий все большее значение приобретает исследование оползней -одного из распространенных экзогенных геологических процессов, нередко наносящего значительный ущерб народному хозяйству. Возрастает практическое значение зонирования территорий по признаку оползневой опасности, так как разработка проектов и строительство противооползневых и защитных инженерных сооружений на участках, где не учитывались факторы развития оползневых процессов, являются сложной и весьма дорогостоящей операцией. Для предотвращения негативных последствий оползневых процессов целесообразно прогнозировать ситуацию на начальных этапах хозяйственного освоения терри-

тории. Одним из способов выявления оползнеопасных территорий является зонирование территорий на основе применения искусственных нейронных сетей.

Методы исследований. Применяются три основные группы методов оценки устойчивости склонов и прогноза развития обвалов и оползней: 1) расчетные; 2) инженерно-геологическое моделирование; 3) геологических аналогий. Общим для всех этих традиционных методик является исследование и оценка оползневой опасности на основе геоморфологических, инженерно-геологических, гидрогеологических и геотехнических факторов. По результатам инженерно-геологической съемки, расчетов устойчивости склонов, математического и физического моделирования составляют карту райониро-

вания (зонирования) территории по степени опасности оползневых процессов. Но оценка прогнозируемых показателей во многом субъективна и опирается на опыт инженера-геолога. Поэтому очень важно использовать передовые информационные технологии, когда участие человека в прогнозе сведено к минимуму, например нейросетевой подход. В основу метода положены принципы обучения нейросетевого автомата процедурам стохастического распознавания и выявления взаимосвязей в группе показателей, харак-теризирующих условия развития и параметры оползневого процесса, путем анализа комплекса данных на оползнеопасной территории.

Существует множество алгоритмов обучения искусственной нейронной сети. Самым распространенным считается алгоритм обратного распространения ошибки обучения (backpropagation algorithm), называемый также методом обучения многослойного перцептрона. Он использовался в данной работе.

Нейронная сеть при этом является многослойной, состоящей из входного слоя, скрытых слоев и выходного слоя. Обучение алгоритмом обратного распространения ошибки предполагает два прохода по всем слоям сети - прямого и обратного. При прямом проходе входной вектор подается на входной слой нейронной сети, после чего распространяется по сети от слоя к слою. В результате генерируется набор выходных сигналов, который и является фактической реакцией сети на данный входной образ. Во время прямого прохода все синаптические веса сети фиксированы. Во время обратного прохода все синаптические веса настраиваются в соответствии с правилом коррекции ошибок, а именно: фактический выход сети вычитается из желаемого, в результате чего формируется сигнал ошибки. Этот сигнал впоследствии распространяется по сети в направлении, обратном направлению синапти-ческих связей. Синаптические веса настраиваются с целью максимального приближения выходного сигнала сети к желаемому [2].

В конце этого этапа обучения нейронная сеть представляет собой выходную мо-

дель, которая должна быть в состоянии предсказать выходные значения по заданному входному значению. Фактически мы пользуемся методом геомеханических аналогий, когда на основе статистики предыдущих оползневых обрушений в аналогичных природных условиях пытаемся прогнозировать характеристики зоны оползневого поражения конкретного участка с использованием нейросетевого метода.

Исходные данные. Образование оползней представляет собой сложный процесс, на который влияет целый ряд взаимосвязанных факторов: геологические условия, рельеф, климатические и антропогенные факторы. Для активизации оползневых процессов в большинстве случаев необходимо особое сочетание природных факторов. Отдельные же предпосылки и факторы не всегда оказывают существенное влияние на процесс развития оползней. Поэтому для крупномасштабного анализа оползневой опасности целесообразно комплексное изучение этих факторов. В соответствии с этим основной задачей является сбор как можно большего количества данных, по которым впоследствии строятся карты вероятности образования оползней на изучаемой территории.

В качестве изучаемой рассматривалась территория поселка Красная Поляна - уникального горнолыжного курорта России в районе г.Сочи, Краснодарский край.

Для выявления оползнеопасных территорий рассматривались девять факторов:

- геологическое строение склона (определяет предрасположенность склона к пластическим оползневым деформациям);

- крутизна склона (характеризует степень равновесия сил, которые удерживают оползневые массы от скольжения);

- экспозиция склона (определяет условия его увлажненности, что влияет на ход экзогенных склоновых процессов);

- суммарный сток и расстояние до рек и озер (способствует увеличению трещино-ватости и степени выветривания для водораздельных участков и соответственно увеличению степени инфильтрации и уменьшению прочности горных пород);

- высота местности (уменьшение силы тяжести горных пород с высотой);

- наличие дорог (подрезка склона, влияние микросейсмики на устойчивость горных пород);

- наличие населенных пунктов (изменение режима подземных вод, увеличение нагрузки на склон, подрезка склона).

Для моделирования оползневой опасности была создана база данных цифровых материалов при помощи функциональных возможностей ГИС ArcGIS. Данные, собранные из открытых источников, подготавливались и вводились в геоинформационную среду с созданием баз данных. Процесс подготовки данных включал:

- конвертацию форматов (если требовалось), перепроецирование (или установку проекции);

- обрезку изображений и подбор оптимальных сочетаний каналов;

- подготовку георастра (высокоточное полноцветное сканирование, геопривязка, перепроецирование в необходимую систему координат и экспорт в формате GeoTiff).

Материалы, обработанные и загруженные в базу данных:

1) ASTER GDEM - глобальная цифровая модель рельефа с разрешением 30 м/пиксель, полученная при помощи спутникового радиометра теплового излучения и отражения (данные бесплатны и доступны в сети Интернет через http://reverb.echo.nasa.gov);

2) геологическая карта масштаба 1 : 200 000;

3) топографическая карта масштаба 1 : 50 000.

На следующем этапе формирования базы данных были выполнены работы по:

1) оцифровке, созданию топологических покрытий и атрибутивных таблиц для элементов моделирования (геологического строения, населенных пунктов, дорог, рек и оползней);

2) расчету морфометрических показателей рельефа - крутизны и экспозиции склона, суммарного стока;

3) расчету расстояний до водоразделов, дорог и шоссе, населенных пунктов и застроенных территорий, до границы леса.

Структура и формат цифровых материалов, включенных в базу данных:

- геологическое строение (полигональный слой с присвоением каждому оцифрованному полигону числового индекса согласно возрасту различных стратифицированных образований);

- крутизна склона (значения угла наклона дневной поверхности от 0 до 55° разделяются на интервалы в 5° с присвоением числового индекса 1, 2, 3, ..., 11 каждому интервалу; значениям угла наклона более 55° присваивается индекс 12);

- экспозиция склона (значения экспозиции по сторонам света, например, при значении 0° склон направлен на север, при 90° - на восток и т.д., всего девять значений, включая плоские склоны);

- суммарный сток - совокупность всех составляющих стока в русле водотока, все значения от 0 до 30000 делятся на два интервала, граница выясняется опытным путем (в данном случае 200), интервалам присваиваются индексы 1 и 2;

- расстояние до рек и озер, расстояние до населенных пунктов, расстояние до дорог (все построенные модели делятся на интервалы 100 м, каждому интервалу присваивается индекс 1, 2, 3, ..., n).

После формирования базы данных все тематические слои преобразуются в GRID-растры в полутоновом цветовом режиме (grayscale) с размером ячейки 5 х 5 м для применения в нейронной сети.

Перед обучением нейросети процесс подготовки данных заключается в присвоении числовых значений всем вышеперечисленным параметрам и нормализации полученных данных. Исходные значения признаков (количественные показатели факторов) изменяются в очень большом диапазоне, и работа нейронных сетей с такими данными может оказаться некорректной. Так, в одном входном параметре могут содержаться значения, отличающиеся друг от друга на несколько порядков (например, угол наклона дневной поверхности и расстояние до застроенной территории имеют разные единицы и разные интервалы значений). Такой дисбаланс между значениями признаков

может вызвать неустойчивость работы модели, ухудшить результаты обучения и замедлить его. После нормализации все значения входных признаков будут приведены к узкому диапазону [0...1], что позволит моделям работать с ними более корректно [3].

Методика выявления оползнеопас-ных областей с применением искусственных нейронных сетей. В исследовании в качестве инструмента анализа рассматривался метод обратного распространения ошибки обучения в программном пакете Stuttgart Neural Network Simulator (SNNS).

Применяя искусственные нейронные сети для выявления оползнеопасных участков, данные обычно распределяют на два подмножества: обучающие (тренировочные) и тестовые. Тренировочные данные должны содержать известные выходные значения, в нашем случае таковыми является растровый слой оползней. Исследуемая территория делится на два класса: класс территории с существующими оползнями и класс территории без оползней. С помощью тренировочных данных проводят обучение нейронной сети по схеме, изображенной на рис.1. Количество скрытых слоев и количество узлов в скрытом слое, необходимые для решения задачи классификации, подбиралось опытным путем. Наилучшая классификация достигнута при трехслойной структуре нейронной сети (персептрон 8 х 7 х 1 с сигмои-дальной функцией активации), т.е. с восемью входными, семью скрытыми и одним выходным слоями.

Входной набор данных, на котором сеть должна быть обучена, подается на входной слой сети, и сеть функционирует в нормальном режиме (т.е. вычисляет выходные данные). Полученные данные сравниваются с известными выходными данными (растровый слой оползней) для рассматриваемого входного набора. Разница между полученными и известными (опытными) данными -вектор ошибки. Вектор ошибки используется для модифицирования весовых коэффициентов выходного слоя с тем, чтобы при повторной подаче того же набора входных данных вектор ошибки уменьшался. Затем таким же образом модифицируются весовые коэффициенты скрытого слоя, на этот раз сравниваются выходные сигналы нейронов скрытого слоя и входные сигналы нейронов выходного слоя. Целью данного сравнения является формирование вектора ошибки для скрытого слоя [3].

Вектор ошибки корректируется при помощи коэффициента скорости обучения -параметра нейронной сети, который позволяет корректировать вес на каждой итерации. В алгоритме обратного распространения ошибки коэффициент скорости обучения вводится в диапазоне от 0 до 1. При значении коэффициента, равном нулю, корректировка весов производиться не будет. Выбор параметра противоречив. Большие значения (0,7-1) будут соответствовать большому значению шага коррекции. При этом алгоритм будет работать быстрее (для поиска минимума функции ошибки потре-

Геологическое строение Крутизна склона Экспозиция склона Суммарный сток Высота Наличие дорог Наличие населенных пунктов Наличие водоемов

Входные Скрытые Выходной узлы слои узел

Оползневая опасность

Рис.1. Структура тренировочной сети для выявления оползнеопасных территорий в программном пакете БМШ

буется меньше шагов), однако может снизиться точность настройки на минимум, что потенциально увеличит ошибку обучения. Малые значения коэффициента (0,1-0,3) соответствуют меньшему шагу коррекции весов. Коэффициент скорости обучения для методики выявления оползнеопасных областей был равен 0,5 при количестве циклов, равном 3000.

Сеть обучается путем предъявления каждого входного набора данных и последующего распространения ошибки. Этот цикл повторяется много раз (в нашем случае 3000). На каждом цикле алгоритма обратного распространения весовые коэффициенты нейронной сети модифицируются так, чтобы улучшить решение одного примера. Таким образом, в процессе обучения циклически решаются однокритериальные задачи оптимизации.

Следующим шагом является визуализация данных обученной сети - комплекс методов представления результатов анализа данных в наиболее удобной для восприятия и интерпретации форме - растровой. Итоговый растр представляет собой выявленные в процессе обучения сети и анализа исходных данных области, где наиболее вероятно образование оползней. При этом итоговый растр необходимо нормализовать таким же образом, как нормализовались исходные данные (входные признаки). Значения в диапазоне от 0 до 1 делятся на два интервала: [0; 0,1] и (0,1; 1]. Граница диапазонов пода

бирается опытным путем. Первый интервал соответствует территориям, где нет вероятности возникновения оползней, второй интервал - собственно оползнеопасные территории. Сравнивая полученный результат с тренировочными данными (территории, где уже зафиксированы оползни), проводится оценка достоверности обучения сети.

Когда обучение системы закончено и проверена достоверность обучения, сеть применяют для распознавания оползней на тестовой территории неизвестных образов с использованием тех значений параметров, которые были установлены в процессе обучения.

Результаты исследований. В качестве тренировочного участка, на котором проводилось обучение нейронной сети, была выбрана территория площадью 56,25 км2 с известными случаями оползней, суммарная площадь которых составила 12,75 км2 (т.е. пораженность оползнями ~23 %).

По итогам обучения нейронной сети с помощью инструментария БЫЫБ был создан растровый файл, показывающий местоположение оползнеопасных территорий (рис.2). Этот растровый файл был импортирован в ГИС-среду АгсС18 для последующего анализа полученных результатов.

Площадь оползнеопасной территории, выявленной с помощью нейросетевого анализа, составляет 13,76 км2, что несколько больше, чем площадь оползнеопасной территории, подсчитанной другими методами.

б

Рис.2. Оползни на тренировочном участке: а - оцифрованные с топографической карты; б - полученные по результатам нейросетевого анализа

Однако подсчитанная площадь наложения оползнеопасных областей двух растров составляет 6,08 км2, или ~ 47,6 % от истинной площади поражения. То есть примерно половина всех уже случившихся оползней в результате анализа входных данных была утеряна.

Используя обученную сеть для тестового участка (пос. Красная Поляна), мы выявили ряд оползнеопасных территорий. Общая площадь тестового участка составляет 24 км2, а площадь территории, склонной к проявлению оползневых процессов, 0,74 км2, или 3 %. Однако точность выявления этих оползнеопасных территорий на тестовом участке равна точности выявления на тренировочном участке, т.е. ~ 47,6 %.

Выводы. Проведенные исследования показывают, что выделение оползнеопасных территорий с применением нейронных сетей является неудовлетворительным. Улучшение результатов, получаемых с помощью нейронных сетей, возможно за счет повышения качества входных данных:

- цифровая модель рельефа должна быть создана более высокоточными геодезическими методами, например по результатам воздушного лазерного сканирования;

- для получения геологических данных следует использовать карты более крупного масштаба либо получать данные по инженерно-геологическим скважинам.

Результаты исследований можно использовать для качественной оценки территории, для сравнения с результатами выделения оползнеопасных территорий традиционными методами. Нейросетевой подход дает более широкие возможности для анализа данных, что, в свою очередь, позволяет выстраивать соответствующие прогнозы по поводу возможных оползней, однако для его применения необходимы высококачественные данные.

ЛИТЕРАТУРА

1. Рассел С. Искусственный интеллект: современный подход / С.Рассел, П.Норвиг. М.: ООО «И.Д.Вильямс», 2006. 1424 с.

2. Хайкин С. Нейронные сети: полный курс: Пер. с англ. М.: ООО «И.Д.Вильямс», 2006. 1104 с.

3. Pradhan B. Landslide susceptibility assessment and factor effect analysis: backpropagation artificial neural networks and their comparison with frequency ratio and bivariate logistic regression modeling / B.Pradhan, S.Lee. // Environmental Modelling & Software, 2010. Р.747-759.

REFERENCES

1. Russell S., Norvig P. Artificial Intelligence: A Modern Approach. Moscow: Ltd «I.D.Williams», 2006. 1424 p.

2. Haykin S. Neural networks: a complete course: Translation from English. Moscow: Ltd «I.D.Williams», 2006. 1104 p.

3. Pradhan B., Lee S. Landslide susceptibility assessment and factor effect analysis: backpropagation artificial neural networks and their comparison with frequency ratio and bivariate logistic regression modeling // Environmental Modelling & Software. 2010. P.747-759.

i Надоели баннеры? Вы всегда можете отключить рекламу.