ЭКОЛОГИЯ
УДК 622
НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ ЗАГРЯЗНЕНИЯ ПОЧВ НА ТЕРРИТОРИИ ГОРНОПРОМЫШЛЕННОГО РЕГИОНА
И.А.Басова, А.А. Миненко, Д.А. Белоусов
Показано, что при комплексной обработке неоднородной и многоуровневой геохимической информации мониторинга почв идеальным условием является единая парадигма построения различных эмпирических моделей, решающих задачу прогнозирования геоэкологического состояния территории. Нейросетевое моделирование позволяет создавать адекватные математические модели в условиях ограниченности информации.
Ключевые слова: территория, почвенный покров, геохимическая информация, загрязнение, нейросетевое моделирование, модель, прогноз.
Для решения задач построения геоэкологических моделей в системе мониторинга почвенного покрова используются различные эмпирические (статистически не достоверные) методы обработки информации. Единая парадигма построения различных эмпирических моделей является естественным требованием для решения задач прогнозирования, не привязанных к конкретной проблемной области. Такой подход унифицирует процедуры решения типовых проблем, возникающих при анализе неоднородной и многоуровневой геоэкологической информации [1].
Методы нейросетевого моделирования позволяют строить эмпирические зависимости в условиях недостаточности информации. Одной из основных задач, решаемых в нашей работе, является определение границ применимости методов нейросетевого моделирования к обработке геоэкологических данных, базовым блоком которых является таблица экспериментальных геохимических показателей [2].
Исследование полученных экспериментальных данных проводилось с использованием метода нейронных сетей. В работе применялось стандартное программное обеспечение Statistica NN 4.0.
На основе матрицы экспериментальных данных выполнены расчеты по прогнозированию и глобальному моделированию загрязнения почвенного покрова территории горнопромышленного региона с применением искусственных нейронных сетей. Решалась задача заполнения пропусков в значениях двух параметров загрязнения почвенного покрова по г.Туле: концентрации марганца (Мд) и концентрации цинка ^д). Мд и Zn представляют собой два разных по поведению металлов. Для 3744 дискрет пространственной сетки (матрицы) имелись значения 4 параметров, у остальных в различных комбинациях отсутствовали значения от одного до трех параметров. Целью работы являлось прогнозирование отсутствующих значений в слое ёде1_1 (>200000) по всей территории г. Тулы. На первом этапе оценивалась точность прогнозирования известных данных при помощи нейросетевых методов обработки информации. Использовалась нейросетевая регрессия. Определение точности прогноза проводилось в режиме скользящего экзамена на основе данных по 1872 значениям параметров. Тестовая выборка составляла из 936 значений, а проверочная из 935. Регрессионные модели строились на основе четырех типов сетей: линейной, многослойного пер-цептрона, сети на основе радиальной функции и байесовой сети (ОКЫЫ), так называемой нейросетевой (НС) обобщенной регрессии [3].
На этой обучающей выборке было обучено 32 нейронных сети с различными параметрами, из них выбрано 5 (табл. 1). Процент правильных ответов на тестовой выборке колебался в диапазоне от 88 до 93 %. Для сети с наилучшей точностью прогноза ошибка распределяется так: на обучающей выборке 13,78 (8,2 %), на проверочной 12,9 (7,6 %), на тестовой 12,2 (7,3%). Наилучшие результаты показали ОКЫЫ сети. Для лучшей сети ге§.га1:юд=0,9338939 (93 % прогнозных значений), корреляция=0,465043, ошибка=13,78 (табл. 2).
Основная цель регрессионной задачи - прогнозирование выходного значения переменной. В общем случае задачи регрессии могут решаться методами нейросетевого моделирования посредством многослойного пер-цептрона, сети на основе радиальной функции, Байесовой регрессионной сети и линейной сети (рис. 1).
Рис. 1. Структурные схемы нейронных сетей (слева направо):
GRNN, RBF, MLP
Таблица 1
Основные параметры нейросетевых моделей
ТИП НС-МОДЕЛИ ОШИБКА ВХОДЫ
1 Linear (Линейная) 34,5964 2 СКРЫТЫЕ СЛОИ КАЧЕСТВО МОДЕЛИ
3 MLP (многослойный перцептрон) 29,3603 4 - 0,8892869
2 MLP (многослойный перцептрон) 28,3166 4 2 0,8965146
4 RBF (на базе радиальной функции) 24,1165 4 8 0,9281369
5 GRNN (обобщенная регрессия) 13,78 4 13 0,9303472
1872/2 0,9338939
Таблица 2
Наилучшие нейросетевые модели
Type TError VError TeError TPerf TPerf VPerf TePerf
01 Linear 34.314 32.3603 32.2003 0.8892869 0.8892869 0.8965146 0.9022219
02 MLP 28.0073 28.3166 28.127 0.8965146 0.8965146 0.8892869 0.9016435
03 MLP 27.9744 27.9006 27.1881 0.9281369 0.9281369 0.9156559 0.917551
04 RBF 24.9415 24.6045 23.6102 0.9303472 0.9303472 0.9235695 0.9263109
05 GRNN 13.6479 12.1046 11.7734 0.9338939 0.9338939 0.9389328 0.948039
Регрессионная (Байесова) сеть (часто называемая сеть обобщенной регрессии или GRNN) имеет только четыре слоя: входной, слой радиальных центров, слой регрессионных элементов и выходной слой. Этот тип сетей был открыт Speckt (1991) как статистический метод аппроксимации функций.
Слой радиальных элементов представляет центры кластеров обучающей выборки. Этот слой необходимо обучить при помощи алгоритмов кластеризации, таких как sub-sampling, K-means or Kohonen training. Количество нейронов в нем обычно велико.
Регрессионный слой должен иметь на один элемент больше, чем выходной слой. Регрессионный слой содержит линейные элементы. В нем используются два типа элементов: тип A - элементы, вычисляющие условную регрессию для каждой переменной на выходе и простой тип B - элементы, вычисляющие плотность вероятности.
Выходной слой выполняет специальную функцию: каждый элемент просто делит значение ассоциированного с ним элемента A на значение элемента B предыдущего слоя.
Радиальные элементы регрессионной сети могут быть обучены стандартными средствами и алгоритмами, такими как ИББ-методы или метод Кохонена. Регрессионный и выходной слои обучаются очень быстро.
Основное свойство сетей обобщенной регрессии - быстрая обучаемость при большом количестве элементов.
В табл. 3 представлены основные статистические показатели регрессионной модели ОКЫЫ (5) на всех трех выборках. Коэффициент среднеквадратичного отклонения в данном случае - это отношение прогнозируемого среднеквадратичного отклонения к фактическому.
Таблица 3
Статистики регрессии
ОБУЧАЩАЯ ПРОВЕРОЧНАЯ ТЕСТОВАЯ
Среднее (Data Mean) 168.0169 168.8818 167.3763
Ср.кв. отклонение (Data S.D.) 13.5176 14.1958 17.6331
Коэффициент ср.кв. отклонения (S.D. Ratio) 0.1710275 0.1856559 0.187551
Корреляция (Correlation) 0.4912468 0.4850434 0.4829395
Самыми информативными параметрами для лучшей нейросети оказались Н1 (коэффициент плотности застройки), Н2 (ландшафтный коэффициент), Z (рельефный коэффициент) (табл. 4). Ранжируя входные признаки по показателям значимости можно количественно оценивать исследуемые зависимости.
Таблица 4
Анализ чувствительности
Z H1 H2
Rank 2 1 3
Error 121,7236 133,7965 97,3533
Ratio 1,037135 1,053455 1,002725
Таблица 5
Достоверность результатов
Метод построения регрессионной зависимости Mn Zn
Max, Avg, % Max, % Avg,
Линейная регрессия 29,9 9,7 38,3 9,0
Нейросетевая регрессия 11,8 7,3 9,9 6,2
Чтобы сравнить полученную точность прогноза с точностью, достигаемой классическими методами построения зависимостей, в табл. 5 приведена точность прогноза классической линейной регрессии и кусоч-
нолинейной. Для каждого параметра загрязнения представлены максимальная и средняя ошибки, выраженные в процентах от диапазона изменения соответствующего параметра [4].
На рис.2 в графическом виде представлены результаты построения прогнозной модели распределения загрязнений по марганцу и цинку, указывающие на ее адекватность
Рис. 2. Результаты прогнозной модели распределения загрязнений марганца (слева) и цинка (справа)
Точность прогноза, достигнутая нейросетевыми методами, оказалась достаточной и позволила провести работу по прогнозированию неизвестных значений параметров загрязнения по всей территории города Тулы. При этом в большинстве случаев прогнозные значения, получаемые на модели, были достаточно близки к экспертным заключениям, выполнявшимся с привлечением дополнительной информации (рис. 3).
Применение геоинформационной системы позволило провести количественной сравнение данных полученной модели с экспериментальными данными ТулНИГП по двум произвольным профилям в районе города Тулы, подтвердив качество применяемой математической модели (рис. 4).
Рис. 3. Сопоставление экспериментальных (изолинии) и расчетных (цветовая заливка) данных в геоинформационной оболочке
Рис. 4. Количественное сопоставление экспериментальных и расчетных данных по марганцу (слева) и цинку (справа), шаг
опробования 100 м
Исследование вопроса о достаточном объеме обучающей выборки позволили сделать следующие выводы:
1. Нейросетевое моделирование позволяет адекватно строить прогнозные модели в условиях недостаточности исходной информации. Изложенные выше результаты были получены еще на меньших выборках.
2. В случае отсутствия теоретически обоснованных моделей единственным способом проверки адекватности построенной модели является прогноз точности модели на тестовой выборке.
3. Геоинформационные технологии позволяют наглядно провести количественное сравнение данных получаемых моделей с экспериментальными данными, подтверждая достоверность математической модели.
Список литературы
1. Качурин Н.М., Ефимов В.И., Воробьев С.А. Методика прогнозирования экологических последствий подземной добычи угля в России// Горный журнал. 2014. №9. С. 138-142.
2. Качурин Н.М., Воробьев С.А., Факторович В.В. Теоретические положения и модели воздействия на окружающую среду подземной добычи полезных ископаемых// Известия ТулГУ. Науки о Земле. 2013. Вып. 3. С. 126 - 134.
3. Ланкин Ю.П., Лалетин А.П. Моделирование изменений экологических объектов с помощью нейронных сетей // Сибирский экологический журнал. Новосибирск: Изд-во СО РАН, 1999. Т.6. № 4. C.449-452.
4. Ланкин Ю.П., Хлебопрос Р.Г. Нейроинформатика: самоадаптирующиеся нейронные сети в экологии (возможности сетей с поисковым поведением). М.: Инженерная экология. №2. 1999. С.28-37.
Басова Ирина Анатольевна, д-р техн. наук, проф., зав. кафедрой, ecology@tsu. tula.ru, Россия, Тула, Тульский государственный университет,
Миненко А.А., канд. техн. наук, директор, galina_stas@,mail.ru, Россия, Тула, МАУ «МФЦ»,
Белоусов Д.А., канд. техн. наук, доц., [email protected] , Россия, Тула, Тульский государственный университет
NEURONET MODELING POLLUTING SOILS IN MINING-INDUSTRIAL
REGION TERRITORY
I.A. Basova, A.A. Minenko, D.A. Belousov
It's shown that ideal condition is integrated paradigm of creating different empirical models, which solving problem of forecasting territorial environmental condition by complex processing heterogeneous and multilevel geochemical information of monitoring soils. Neu-ronet modeling allows creating adequate mathematical models at conditions of information limitation.
Key words: territory, soil, geochemical information, polluting, neuronet modeling, model, forecasting.
Basova I.A., Doctor of Technical Science, Professor, Chief of a Department, [email protected] , Russia, Tula, Tula State University,
Minenko A.A., Candidate of Technical Science, Director, galina_stas@,mail. ru, Russia, Tula, MAU "MFC",
Belousov D.A., Candidate of Technical Science, Docent, [email protected] , Russia, Tula, Tula State University