УДК 631.4
гА.Т. Симбатова, 2С.С. Рязанов, И.А. Сахабиев
1 Казанский (Приволжский) федеральный университет, [email protected] 2Институт проблем экологии и недропользования АН РТ, [email protected]
МОДЕЛИРОВАНИЕ ПРОСТРАНСТВЕННОГО РАСПРЕДЕЛЕНИЯ ОРГАНИЧЕСКОГО ВЕЩЕСТВА ПОЧВ:
ОБЗОР СОВРЕМЕННЫХ ПОДХОДОВ
Выполнен обзор статистических и геостатистических методов, используемых для прогнозного моделирования содержания органического вещества в почвах, проведена сравнительная оценка их эффективности. Составлен перечень параметров окружающей среды, потенциально влияющих на распределение органического вещества в почвах.
Ключевые слова: органическое вещество; геостатистика; пространственное моделирование.
Введение
Активная сельскохозяйственная деятельность ведет к истощению запасов почвенного органического вещества (ОВ) и усилению эрозионных процессов. На современном этапе развития земледелия значительная часть урожая формируется за счет мобилизации естественного плодородия почв без компенсации выносимых с урожаем элементов питания, что и приводит к отрицательному балансу питательных веществ и потерям гумуса. Среднегодовой дефицит гумуса в пахотном слое за последние годы в среднем по России составляет 0.52 т/га, по отдельным регионам - от 0.25 до 0.72 т/га (Янюк et al., 2014).
Одной из важнейших задач на сегодняшний день является мониторинг антропогенного воздействия на почвы, который позволяет определить направленность его изменения, как в региональном, так и локальном масштабе. Современные методы пространственного моделирования предоставляют широкий перечень методов моделирования, различающихся по сложности реализации, требованиям к исходным данным, точности конечного результата.
В настоящей статье выполнен обзор работ, в которых используются статистические и геостатистические методы для моделирования пространственного распределения ОВ почв. Рассматриваются условия окружающей среды, влияющие на распределение ОВ, сопоставляются методы моделирования по точности пространственного прогноза.
Факторы, влияющие на распределение ОВ в почве
Пространственное распределение содержания ОВ в почвах характеризуются большой неопределенностью, которая может быть результа-
том: 1) пространственных изменений почвенных свойств, 2) несовершенством знаний о связях между условиями окружающей среды и содержанием ОВ, и 3) ограничения региональных наборов данных для представления мелкомасштабной вариабельности почвенных свойств (Homann et al., 1995).
Температурные различия идентифицируются как господствующий элемент, контролирующий содержание ОВ в почвах на региональном масштабе (Djukic et al., 2010), локальные топографические изменения, почвенные свойства и растительность могут отвечать за сильную вариабельность ОВ в локальных масштабах (Egli et al., 2009).
Часть рассматриваемых методов пространственного моделирования содержания ОВ в почве подразумевают использование вторичных переменных для повышения точности прогноза и установления существующих зависимостей. В таблице 1 представлен перечень переменных-предикторов, использованных авторами в своих работах. Все вторичные переменные можно разделить на несколько групп: 1) климатические переменные (температура, суммарное и месячное количество осадков, солнечная радиация и др.) - отвечают за условия почвообразования; 2) рельефные (наклон, кривизна, высота, угол экспозиции склона и др.) - в основном представляют собой производные цифровой модели рельефа и отвечают за распределение солнечной энергии, эрозионные процессы и пр.; 3) данные дистанционного зондирования - относительно новый и продолжающий набирать популярность источник информации; 4) карты почвенного покрова, типов землепользования и пр. Стоит отметить, что для большинства рельефных предикторов, представ-
ленных в таблице, существуют готовые решения расчета в специализированных ГИС пакетах (SAGA GIS, Whitebox GAT и пр.).
Методы пространственного моделирования Цифровые методы почвенного картирования широко используются для моделирования распределения ОВ в почве. McBratney et al. (2003) сформулировали представление цифрового почвенного картирования, известное как модель scorpan:
S = f(s, c, o, r, p, a, n) + e, (1)
где, s - это почвенные свойства, f - это функция, которая включает следующие компоненты: почва (s), климат (c), организмы (o), рельеф (r), почвообразующая порода (p), время (t), и пространство (n) и e - (в некоторых случаях) не коррелируемые остатки от модели.
В своей сути, модель scorpan соответствует концепции В.В. Докучаева о почвообразующих факторах. Многочисленные методы моделирования используются для установления функцио-
Таблица 1. Перечень вспомогательных переменных, используемых для пространственного
моделирования ОВ
Наименование Использовано в работе
Климат
Водный баланс Rodriguez-Lado, Martinez-Cortizas, 2015
Потенциальное суммарное испарение Rodriguez-Lado, Martinez-Cortizas, 2015; Martin et al., 2014
Солнечная радиация Ballabio, 2012; Karunaratne et al., 2014
Среднегодовая температура Rodriguez-Lado, Martinez-Cortizas, 2015; Martin et al., 2014
Суммарное кол-во осадков Rodriguez-Lado, Martinez-Cortizas, 2015; Martin et al., 2014
Тепловой эффект Rodriguez-Lado, Martinez-Cortizas, 2015
Рельеф
Цифровая модель рельефа Rodriguez-Lado, Martinez-Cortizas, 2015; Ceddia et al., 2015; Dorji et al., 2014; Zhang et al., 2012; Hoffmann et al., 2014; Moore et al., 1993
Flow path lengths Moore et al., 1993
Length-slope factor LS Zhang et al., 2012
Multi-resolution ridge top flatness index Karunaratne et al., 2014
Multi-resolution valley bottom flatness index Karunaratne et al., 2014
SAGA Wetness Index Dorji et al., 2014
Sediment transport capacity index Moore et al., 1993
Specific catchment area Moore et al., 1993
Stream power index Zhang et al., 2012; Moore et al., 1993
Terrain ruggedness index Dorji et al., 2014
Индекс континентальности Rodriguez-Lado, Martinez-Cortizas, 2015
Кривизна поверхности Ceddia et al., 2015; Hoffmann et al., 2014
Максимальный уклон Moore et al., 1993
Уклон склонов Ceddia et al., 2015; Karunaratne et al., 2014; Hoffmann et al., 2014; Zhang et al., 2012; Ballabio, 2012; Moore et al., 1993
Составной топографический индекс Ceddia et al., 2015
Топографический индекс влажности Karunaratne et al., 2014; Moore et al., 1993; Zhang et al., 2012
Экспозиция склона Karunaratne et al., 2014; Ceddia et al., 2015; Hoffmann et al., 2014; Dorji et al., 2014
Данные Дистанционного Зондирования
Landsat 7 ETM+ Karunaratne et al., 2014; Ballabio, 2012
Разные
Геологическая карта Rodriguez-Lado, Martinez-Cortizas, 2015; Hoffmann et al., 2014; Ceddia et al., 2015
Карта типов землепользования Rodriguez-Lado, Martinez-Cortizas, 2015; Hoffmann et al., 2014; Martin, 2015; Zhang et al., 2012; Dorji et al., 2014
Карта растительного покрова Ceddia et al., 2015; Dorji et al., 2014; Hoffmann et al., 2014
Карта кислотности Martin et al., 2014
Почвенная карта Hoffmann et al., 2014; Zhang et al., 2012
Таблица 2. Методы пространственного моделирования ОВ почв
Методы Площадь исследуемого участка n Использовано в работе
Статистические
Multiple linear regression (MLR) - 12 Малышевский и др., 2013
6 га 86 Lopez-Granados et al., 2005
- 463 Rodriguez-Lado, Martinez-Cortizas, 2015
5.4 га Moore et al., 1993
2229.5 км2 469 Zhang et al., 2012
Partial lest squares regression (PLS) - 463 Rodriguez-Lado и Martrnez-Cortizas, 2015
Principal component regression (PCR) - 463 Rodriguez-Lado, Martinez-Cortizas, 2015
Regression tree model (RTM) 1014 км2 100 Dorji et al., 2014
Boosted regression tree (BRT) - 2166 Martin et al., 2014
Геостатистические
Inverse Distance Weighting (IDW) 8.6 км2 1384 Hoffmann et al., 2014
Ordinary kriging (OK) 2229.5 км2 469 Zhang et al., 2012
8.6 км2 1384 Hoffmann et al., 2014
6 га 86 Lopez-Granados et al., 2005
80 км2 96 Ceddia et al., 2015
Cokriging (COK) 80 км2 96 Ceddia et al., 2015
Block kriging(BK) 8.6 км2 1384 Hoffmann et al., 2014
Regression kriging (RK) 1014 км2 100 Dorji et al., 2014
8.6 км2 1384 Hoffmann et al., 2014
2229.5 км2 469 Zhang et al., 2012
2 км2 83 Ballabio, 2012
6 га 86 Lopez-Granados et al., 2005
нальных зависимостей, соответствующих модели scorpan, на локальном, региональном, континентальном и глобальном масштабах.
Методы пространственного моделирования ОВ почв, используемые различными авторами (табл. 2), можно разделить на следующие условные группы: (1) статистические - ключевая концепция этой группы основана на использовании линейных статистических моделей; (2) геостатистические - основаны на применении регионализированных моделей с учетом пространственной зависимости изучаемых параметров; также широкую популярность набирают смешанные методы - представляющие собой комбинацию статистики и геостатистики, применяются в целях повышения точности прогнозирования.
Статистические методы пространственного моделирования
Multiple linear regression (MLR) - один из самых распространенных методов, применяемых для моделирования независимой переменной Y через набор переменных-предикторов X. Общее уравнение:
Y = р0 + PiXi + ... + РпХ (2)
где, P;(i = 0, ., п) - параметры, как правило, вычисленные с использованием метода наименьших квадратов и Xi(i = 0, ..., п) - предикторы. Метод MLR может приводить к переобучению модели и к нереалистичной оценке статистической значимости предикторов в случае присутствия мультиколлинеарности среди независимых переменных.
Partial lest squares regression (PLS) - это статистический метод, комбинирующий особенности метода главных компонент (principal component analysis, PCA) и множественной линейной регрессии для определения зависимой переменной из набора независимых переменных. Задача PLS - упростить информацию, содержащуюся в матрице ковариатов X в несколько новых компонентов, представляющих собой линейные комбинации оригинальных ковариатов при сохранении большей части изменчивости предикторов и максимизировать ковариацию между всеми линейными комбинациями ковариатов X и зависимой переменной Y. Как результат, набор новых ортогональных факторов, так называемых латентных векторов (latent vector, LV), вычисляется из начального набора предикторов, обеспечивающих отсутствие мультиколлинеарности в итоговой модели. Модель PLS эффективно решает проблему мультиколлинеарности, но осложняет задачу интерпретации, поскольку в модели участвуют линейные комбинации исходных предикторов.
Principal component regression (PCR) - этот метод похож на PLS. Вспомогательные данные сначала трансформируются в новые некорелли-рованные главные компоненты. Эти компоненты представляют собой линейные комбинации оригинальных ковариатов и сохраняют максимальное количество их изменчивости. Затем оценки результата PCA используются в регрессионном анализе. Главное отличие от PLS в том, что в PLS, ковариация между зависимыми и независимыми переменными учитывается при создании компонент (латентных векторов); а в PCR учитывается только ковариация составляющих переменных. Модель PCR обладает теми же достоинствами и недостатками, что и модель PLS.
Regression tree model (RTM) - непараметрический метод, который решает проблему мультиколлинеарности, и, вместе с тем, сохраняет простоту интерпретации результатов. Деревья регрессии дают лучший результат, чем MLR, в присутствии нелинейных отношений и взаимодействий между предикторами.
Построение модели происходит в два этапа:
1) пространство предикторов X1, X2, ..., Xp делится на J отдельных и неперекрывающихся регионов R1, R^, ., Rj. Разделение на регионы происходит при минимизации RSS функции:
Еу =1 ZiERj (У;-Ук;- )2, (3)
где Уд;- - среднее зависимой переменной j-го региона. Для разделения используется метод ре-
курсивного бинарного разделения (подробнее процесс построения дерева регрессии описан (James et al., 2013).
2) после определения регионов R значения прогнозируются как среднее всех значений попадающих в соответствующий регион.
Boosted regression trees (BRT) - метод последовательного построения деревьев регрессии, когда каждое дерево строится на основе информации, полученной предыдущим деревом. Каждое последующее дерево регрессии строится на остатках предыдущей модели, а не на оригинальной зависимой переменной Y. Полное описание метода предоставляется у Friedman (2001).
Геостатистическое моделирование
Геостатистика включает набор методов, которые используют алгоритм кригинга для оценки континуальных характеристик. Кригинг - обобщенное название семейства регрессионных алгоритмов, используемое в знак признания работ D. Krige (1951).
Основным инструментом геостатистики является вариограмма, которая представляет собой график значений полудисперсий, вычисленных по формуле (5) в зависимости от расстояния между точками.
YОг- *о) = YО) = \ var[Z(жг) - Z(x0)] (4)
где, h - расстояние между точками x. и х0 и у(И) - полудисперсия.
Подробнее концепция геостатистики рассмотрена в статье Сахабиева и Рязанова (2015). Вариограмма описывает пространственную структуру значений и её моделирование является весьма важным для пространственной интерполяции.
Inverse Distance Weighting (IDW). Строго говоря, не относится к геостатистическим методам, поскольку при интерполяции не учитывается пространственная структура исследуемого параметра. Целевое значение оценивается как взвешенное по обратной функции от расстояния до соседних значений:
2 _ 1МР
SUi/df (5)
где, di - расстояние между х0 и xi, p - показатель степени, n представляет собой количество точек выборки, используемых для оценки.
Ordinary kriging (OK) - самый часто используемый метод кригинга. Он служит для оценки значения в точке области, для которой известна вариограмма, используя данные соседних точек. Прогноз значений основан на модели:
Z(S) = /Л + £'(s) (6)
где, ц - стационарное среднее локальной области, и s'(s) - пространственно коррелированная стохастическая часть вариабельности (McBratney et al., 2003).
Cokriging (COK) - многомерное расширение кригинга, в котором вспомогательная информация участвует в оценке значений неизвестных участков путем учета пространственной корреляции целевой переменной со вторичной переменной. Кокригинг не требует, чтобы вторичная информация была доступна для всей исследуемой области. Влияние вторичной информации на оценку Z зависит от: корреляции между основной и вспомогательной переменными, пространственной континуальности атрибутов, плотности расположения образцов и пространственной структуры главной и вторичной переменных.
Block kriging (BK) - общее название методов оценки среднего значения главной переменной по сегментам и областям разного размера или формы. BK является расширением OK и вычисляет значение блока вместо значения отдельной точки, заменяя ковариацию «точка-точка» ковариацией «точка-блок».
Regression kriging (RK) - техника, схожая с ОК. Главное отличие в том, что стационарное среднее заменено линейной функцией от вторичных переменных:
Z(s) = m(s) + £(s), (7)
где m(s) - модель, определяющая детерминистическую часть, s(s) - интерполированные остатки модели.
В RK вторичные переменные должны быть доступны для всей исследуемой области. Главное превосходство RK над любой другой техникой интерполяции состоит в том, что RK возможно комбинировать со статистическими техниками моделирования. Методика использования регрессионного кригинга детально описана Hengl et al. (2004).
Оценка точности пространственного моделирования
Любой метод прогноза значений подвержен ошибкам, обусловленным тем, что переменная на оцениваемом участке несколько отличается от оценочного значения. Перекрестная проверка (cross-validation) - это статистический метод проверки прогнозной модели, который подразумевает многократное создание двух наборов данных (обучающий и проверочный). Обучающий набор используется для построения прогнозной модели,
в то время как проверочный нужен для оценки точности модели. Усредненная точность прогнозов для проверочных наборов дает общую оценку точности прогнозирования.
Разница между наблюдаемыми значениями и их оценками используется для вычисления коэффициентов ошибок:
• Среднее ошибок (ME):
ME = 1 zr=1( Pi-Oi) (8)
• Среднее абсолютных ошибок (MAE):
МАЕ = IHt=1\Pi-Oi | (9)
• Корня среднего квадратов ошибок (RMSE):
RMSE = [1- Ot)2f5 (10)
• Среднее стандартизированных квадратов отклонений (MSDR)
MSDR - 1 ХГ-1(Р‘~ 2°‘)2 (11)
n 1 a?
• Коэффициент согласования корреляции Лина (Lin’s concordance correlation coefficient, CCC)
2 pov Oyj
Pc = 2 2 ( ---T2 (12)
где, Pi - прогнозируемые значения, Oi - измеренные значения, цх и цу - значения для измеренных и спрогнозированных значений, ох2 и оу2 - соответствующие дисперсии измеренных и прогнозируемых значений, р - коэффициент корреляции Пирсона между измеренными и предсказанными фракциями.
ME используется для определения степени смещения. Согласно C.J. Willmott (1982), MAE и RMSE - лучшие оценки общей точности модели, так как они суммируют среднюю разницу между известными значениями и их оценками в их же единицах. По сравнению с MAE, RMSE более чувствителен к экстремальным значениям. Идеальная модель имеет значения ME и RMSE равные 0. Значение MSDR близкое 1 означает, что спрогнозированная дисперсия повторяет ошибки наблюдений.
Коэффициент согласования корреляции показывает, как график измеренных значений в зависимости от спрогнозированных совпадает с линией в 450. Если значение CCC близко к 1, то измеренные в сравнении с прогнозируемыми величинами тесно соответствуют друг другу.
Таблица 3. Перечень работ по моделированию почвенного ОВ
Работа Методы Точность прогноза
Moore et al., 1993 MLR -
Lopez-Granadoset al., 2005 MLR, OK, RK RK >OK >MLR
Zhang et al., 2012 OK, MLR, RK RK >MLR >OK
Ballabio, 2012 RK -
Малышевский и др., 2013 MLR -
Dorji et al., 2014 RTM, RK RK >RTM
Hoffmann et al., 2014 IDW, OK, BK1, BK2, RK OK >BK1 >RK >BK2 >IDW
Martin et al., 2014 BRT -
Rodriguez-Lado, Martinez-Cortizas, 2015 PLS, MLR, PCR PLS >MLR >PCR
Ceddia et al., 2015 OK, ICOK, HCOK COK >OK
*BK1 - размер блока 250 м. BK2 - размер блока 500 м.
Сравнительная оценка методов моделирования
Многие авторы в своих работах используют несколько методов моделирования с одинаковыми наборами входных параметров в поисках наиболее точного результата прогнозирования. Здесь рассмотрено 10 научных публикаций зарубежных и отечественных авторов, посвященных изучению пространственного распределения почвенного ОВ (табл. 3).
D.I. Moore c соавт. (1993) исследовали содержание ОВ северо-восточной части штата Колорадо площадью 5,4 га; в качестве вторичных данных использованы рельефные параметры: индекс влажности, индекс силы потока, и индекс мощности транспорта осадков.
В ходе исследования F. Lopez-Granados et al. (2005) получена карта распределения ОВ для поля размером 40 га, расположенного в Каракол (Севилья, юг Испании). В работе приведено сравнение методов MLR, OK и RK. Авторы отмечают, что использование вторичных переменных (данные дистанционного зондирования) при интерполировании значений, повышает точность, по сравнению с методами, которые оперируют только пространственной структурой данных.
В работе S. Zhang et al. (2012) исследовали пространственное распределение ОВ на территории провинции Миюн (Китай) площадью 2229.5 км2 с использованием рельефных индексов (length-slope factor, wetness index и stream power index). Авторы отмечают сглаживающий эффект OK и превосходство RK в точности прогноза.
В работе В.А. Малышевского et al. (2013) использован MLR для расчета содержания гумуса в почвах с использованием данных дистанционного зондирования (ДДЗ). Отмечается, что на функциональную зависимость гумуса и данных дистанционного зондирования влияет размер
почвенных частиц, содержание почвенной влаги, присутствие растительности в момент съемки; точность определения содержания гумуса по ДДЗ составила ±0.41%.
В работе T. Dorji et al. (2012) при прогнозировании распределения ОВ в долине долина р. Паро (Бутан, площадь 1014 км2) с использованием рельефных переменных (SAGA wetness index, terrain ruggedness index и multi-resolution index for valley bottom flatness) статистический метод RTM уступил в точности смешанному регрессионному кригингу.
Т. Hoffmann и соавт. (2014) применяли методы IDW, OK, BK, RK для картографирования запасов содержания ОВ на участке площадью 8.6 км2 в долине р. Лютшина (Швейцария). Интерполяция IDW генерирует нереалистичные «овальные формы» (эффект «бычьего глаза») на местах отбора проб. В данной работе IDW и BK значительно уступали в точности интерполяции регрессионному кригингу.
В ходе исследования L. Rodriguez-Lado et al. (2015) использовали статистические подходы для моделирования содержания ОВ в почвах для части территории Испании. Был сделан вывод, что метод PLS (RMSE = 3.48, ME = 0.05, MAE = 2.51) превзошел по точности методы MLR (RMSE = 3.73, ME = 0.06, MAE = 2.67) и PCR (RMSE = 4.36, ME = -0.24, MAE = 3.15), хотя t-тест не показал существенных различий между PLS и MRL.
М.В. Ceddia et al. (2015) воспользовались методами геостатистики для интерполяции содержания ОВ в центральной части Амазонки. Результат показал, что COK является более точным методом прогноза (ME = 0.209, RMSE = 1.913, MAE = 1.538), чем OK (ME = 0.299, RMSE = 1.986, MAE = 1.595).
Заключение
Рассмотренные методы пространственного моделирования не ограничены лишь задачей картографирования ОВ, они также успешно применяются для пространственного моделирования физических и химических почвенных свойств. В приведенных работах можно выделить следующие тенденции:
- множественная линейная регрессия, несмотря на менее точные результаты прогнозирования, остается наиболее популярным методом моделирования благодаря простоте расчетов и высокой интерпретируемости результатов;
- среди геостатистических методик картирования по популярности лидируют ординарный и регрессионный кригинг. В тоже время авторы отмечают, что регрессионный кригинг выигрывает в точности и выявлении локальных деталей вариации, что достигается за счет привлечения вторичных данных.
В целом, на основании проанализированных работ, можно выстроить следующую последовательность методов геостатистического моделирования по убыванию точности: RK>COK>OK>BK>IDW. Включение в модель климатических и геоморфометрических данных позволяет существенно увеличить точность итоговой карты распределения ОЛВ на любых масштабах.
Список литературы
1. Малышевский В.А., Федулов Ю.П., Островский Н.В., Лебедовский И.А. Расчет содержания гумуса с использованием данных дистанционного зондирования земли // Научный журнал КубГАУ 2013. № 92(08). С. 671-681.
2. Сахабиев И.А., Рязанов С.С. Исследование пространственной изменчивости свойств почв с использованием геостатистического подхода // Российский журнал прикладной экологии. 2015. №2. С. 32-37.
3. Янюк М.В., Тарбаев В.М., Верина Л.К. Обоснование расчетной модели баланса гумуса для агроэкологической оценки организации севооборотов // Аграрный научный журнал. 2014. № 12. С. 47-50.
4. Ballabio С. A plant ecology approach to digital soil mapping, improving the prediction of soil organic carbon content in alpine grasslands // Geoderma. 2012. V. 187-188. P. 102-116.
5. Breiman L., Friedman J.H., Olshen R.A., Stone C.J. Classification and Regression Trees // Monterey, Calif., U.S.A.: Wadsworth, Inc., 1984. 368 p.
6. Ceddia M.B., Villela A., Pinheiro M., Wendroth O. Spatial variability of soil carbon stock in the Urucu river basin, Central Amazon-Brazil // Science of the Total Environment. 2015. V. 526. P. 58-69.
7. Djukic I., Zehetner F., Tatzber M,. Gerzabek M.H Soil organic-matter stocks and characteristics along an Alpine elevation gradient // J. Plant Nutr. Soil Sci. 2010. V 173. P. 30-38.
8. Dorji T., Odeh I.O.A., Field D.J., Baillie C. Digital soil mapping of soil organic carbon stocks under different land use and land cover types in montane ecosystems, Eastern Himalayas // Forest Ecology and Management. 2014. V 318. P. 91-102.
9. Egli M., Sartori G., Mirabella A., Favilli F., Giaccai D., Delbos E. Effect of north and south exposure on organic matter in high Alpine soils // Geoderma. 2009. V. 149. P. 124-136.
10. Friedman J.H. Greedy function approximation: a gradient boosting machine // Ann. Stat. 2001. Vol. 29 (5). P 1189-1232.
11. Hengl T., Heuvelink, G., Stein, A. A generic framework for spatial prediction of soil variables based on regression-kriging // Geoderma. 2004. № 20. P. 75-93.
12. Hoffmann T., Glatzel S., Dikau R. A carbon storage perspective on alluvial sediment storage in the Rhine catchment // Geomorphology. 2009. V 108. P. 127-137.
13. Homann PS., Sollins P, Chappell H.N., Stangenberger A.G. Soil organic carbon in a mountainous, forested region: relation to site characteristics // Soil Sci. Soc. Am. J. 1995. V. 59. P. 1468-1475.
14. James G., Witten, D., Hastie, T., Tibshirani, R. An introduction to Statistical Learning with Applications in R. // New York Heidelberg Dordrecht London: Springer, 2013. 440 p.
15. Karunaratne S., Bishop T., Baldock J., Odeh I. Catchment scale mapping of measureable soil organic carbon fractions // Geoderma. 2014. Vol. 219-220. P. 14-23.
16. Krige D.G. A statistical approach to some mine valuations problems at the Witwatersrand // Journal of the Chemical, Metallurgical and Mining Society of South Africa. 1951. V 52. P. 119-139.
17. Lopez-Granados F., Jurado-Exposito M., Pena-Barragan J.M., Garcia-Torres L. Using geostatistical and remote sensing approaches for mapping soil properties // Europ. J. Agronomy. 2005. V 23. P. 279-289.
18. Martin M.P., Orton T.G., Lacarce E., Meersmans J., Saby N.P.A., Paroissien J.B., Jolivet C., Boulonne L., Arrouays D. Evaluation of modeling approaches for predicting the spatial distribution of soil organic carbon stocks at the national scale // Geoderma. 2014. V 223-225. P. 97-107.
19. McBratney B.A., Mendonja Santos M.L., Minasny B. On digital soil mapping // Geoderma. 2003. V. 117. P. 3-52.
20. Moore D.I., Turner A.K., Wilson J.J.P, Jenson S.K., Band L.E. GIS and land surface-subsurface process modeling // Environmental modeling and GIS. Oxford: Oxford Univ. Press, 1993.
21. Rodriguez-Lado L., Martinez-Cortizas A. Modelling and mapping organic carbon content of topsoils in an Atlantic area of southwestern Europe (Galicia, NW-Spain) // Geoderma. 2015. V 245-246. P. 65-73.
22. Willmott C.J. Some comments on the evaluation of model performance // Bull. Am. Meteorol. Soc. 1982. V 63. P. 1309-1313.
23. Zhang S., Huang Y, Shen C., Ye H., Du Y Spatial prediction of soil organic matter using terrain indices and categorical variables as auxiliary information // Geoderma. 2012. V 171172. P. 35-43.
A.T. Simbatova, S.S. Ryazanov, I.A. Sahabiev. Modeling of spatial distribution of a soil organic matter: a current state review.
A review of statistical and geostatistical methods used for predictive modeling of a soil organic matter content was applied. A comparative assessment of the observed methods was carried out. A list of environmental factors that potentially affect the organic matter distribution was compiled.
Keywords: organic matter; geostatistics; spatial modeling.