УДК 510.66
НЕЧЕТКАЯ СИСТЕМА ДЛЯ ОЦЕНКИ ВЕЛИЧИНЫ ПРИРОСТА ДРЕВЕСИНЫ С УЧЕТОМ РАЗЛИЧНЫХ ПОЧВЕННО-КЛИМАТИЧЕСКИХ УСЛОВИЙ
Т.М. Леденева, А.Б. Беляев, А.А. Дубинин
В статье рассматривается задача прогнозирования величины прироста древесины на основе методики нечеткого моделирования
Ключевые слова: нечеткая система, нечеткий логический вывод, база правил, прирост древесины
Введение . Одной из актуальных задач в лесоведении является задача по определению величины прироста древесины для различных пород деревьев на основе количественных показателей ряда почвенных и климатических факторов, характеризующих почвенно-климатическую обстановку. Решение данной задачи позволит обосновать рациональный выбор тех древесных пород, которые можно выращивать в данном регионе с целью получения качественной древесины для промышленных нужд. Кроме того, актуальность данной задачи связана и с исследованием возможности выращивания в данном регионе древесных пород, произрастающих в других регионах (страны или мира) - интродуцентов [4]. Сложность данной задачи обусловлена следующими факторами:
а) на прирост древесины влияет множество почвенно-климатических факторов, которые определенным образом взаимодействуют между собой, причем для различных древесных пород набор наиболее существенных факторов может быть разнообразным;
б) исследования показывают, что степень влияния различных факторов на прирост древесины различна, причем статистическими методами восстановить такую зависимость достаточно сложно, поскольку она подвержена многим случайным воздействиям во времени, поэтому необходимы такие подходы, которые основаны не только на количественных данных, но и на тенденциях, отражающих зависимость изменения величины прироста древесины от данного фактора.
Учитывая сложность задачи, нами предлагается подход к решению задачи прогнозирования величины прироста древесины, включающий два этапа: на первом - на основе анализа почвенноклиматических факторов данного региона выделяются такие, которые существенным образом влияют на величину прироста (это необходимо делать для каждой породы); на втором этапе - решается задача прогнозирования путем построения нечеткой системы, которая является универсальным аппроксима-
Леденева Татьяна Михайловна - ВГУ, д-р техн. наук, профессор, e-mail: dean@amm.vsu.ru Беляев Анатолий Борисович - ВГУ, д-р биол. наук, профессор, e-mail: akspy@mail.ru
Дубинин Алексей Анатольевич - ВГТУ, аспирант, e-mail: akspy@mail.ru
тором и на качественном уровне отражает существующие связи между величиной прироста древесины исследуемой породы и наиболее значимыми почвенно-климатическими показателями. Преимущество нечетких систем заключается в том, что строится эвристическое описание зависимости в виде набора условных нечетких высказываний -базы продукционных правил. Именно база правил учитывает специфику конкретной прикладной задачи, поэтому ее разработка - важнейший этап нечеткого моделирования [5].
1. Выбор значимых почвенно-
климатических показателей для прогнозирования величины прироста древесины.
В общем случае почвенно-климатическая обстановка региона может быть оценена с помощью 75 показателей. Необходимо заметить, что, во-первых, с таким большим числом показателей работать сложно, а, во-вторых, не все показатели оказывают значимое влияние на величину прироста древесины. Поэтому необходим этап предварительного анализа, который позволит выделить наиболее существенные показатели для каждой породы. Для его реализации нами использовался подход [3], в основу которого положено представление об измеримости информации.
Пусть А - некоторый показатель, а1,...,ак -его значения, которые будем называть рангами. Не зная закономерностей изменения А , можно считать, что появление а{ есть случайное событие. Известно, что оценкой вероятности случайного события является относительная частота появления этого события в эксперименте, причем, чем больше проведено испытаний, тем эта оценка точнее. Таким образом, за вероятность появления события а1 можно принять частоту = Р(а1), где па - число случаев
появления а1, N - общее число наблюдений.
Наше суждение о появлении того или иного значения а1 показателя А неопределенно. Известно, что величину этой неопределенности можно оценить количественно с помощью энтропии
Н(А)=-£Р() Р(), (1)
/
максимальное значение
Н(а) = -X—log2 — = log2 К которой достигается
к к к
при равных значениях вероятностей
Р(а,. )= ... = Р(ак )= -1.
Если изучается зависимость показателя А от другого показателя (фактора) В, то необходимо учесть также и неопределенность фактора В . Предположим, что число рангов фактора В отличается от числа рангов показателя А . Для каждого ранга Ь. показателя В существует свое распределение
рангов показателя А , поэтому для каждого значения bJ можно определить энтропию по условному
распределению
Н(А/bJ)= -XР(а,- /bJ)^2 Р(а, /Ь.), (2)
I
при этом для практических расчетов вместо вероят-
ности
Р(а / ь. )
ческая оценка
может использоваться ее статисти-
где пшЬ - количество наблю-
дений, в которых совместно встречаются значения а{ и Ь., пь - общее количество наблюдений, в которых встречается значение Ь. фактора В . Условное распределение, по существу, устанавливает область значений фактора В , в пределах которых параметр (явление) А ведет себя устойчиво, то есть его изменения незначительны.
Заметим, что если между А и В существует зависимость, то Н (а)* н (а / ь. ), а разность
(Н (А)-Н (А / Ь. )) этих величин может служить мерой того, насколько наше суждение об А при данном значении Ь. становится более определенным.
Введем обозначение 3(А/Ь.)= Н(а)-Н(а/Ь.), и величину 3 (а / ь. ) назовем величиной информации об А , содержащейся в Ь.. Величина информации
равна уменьшению общей неопределенности параметра (явления), которое происходит, если известно состояние фактора. Величина 3(а / Ь. ), передаваемая каждым состоянием Ь., тем больше, чем более
определенно, зная состояние параметра, можно судить о состоянии явления. Имея величину информации для каждого ранга, характер связи явления с параметром в целом можно оценить как сумму средневзвешенных частных значений информативности - обобщенной информативностью, которая оценивает количество информации, поступающей от фактора В к исследуемому показателю А , определяется формулой
Т (А, В) = Х р(ь. 3 (А / Ь.), (3)
в которой суммируются произведения вероятностей каждого значения Ь . фактора В на количество ин-
формации о показателе А , содержащейся в этом ранге.
Заметим, что значение Т(А,в) зависит не только от связи между А и В , но и от величины их неопределенности. Чем больше неопределенность фактора В , тем большее количество информации передается к показателю А . Для оценки этого влияния введем коэффициент эффективности передачи информации от фактора В к показателю А в виде
к (а, в) = ТМ.
Н (В )
(4)
Таким образом, связь есть величина измеримая, и ее значение в каждом частном случае зависит от величин неопределенностей сопоставляемых явлений. Поэтому при определении значимости фактора В для показателя А необходимо определить величину коэффициента эффективности передачи информации.
Заметим, что к (А, В) < Н (а) + Н (в) , то есть величина к (А, В) не может быть больше минимального значения одной из составляющих неопределенностей, поэтому величина коэффициента эффективности передачи информации к (А, в) максимальна, когда от параметра передается к фактору (явлению) количество информации, равное минимальной неопределенности. Наибольшее значение имеет параметр с наибольшим значением к (А, в) -ведущий фактор. Таким образом, при помощи данного коэффициента можно установить степень влияния каждого параметра на изучаемое явление и расположить их в строгой последовательности относительно друг друга.
Заметим, что помимо фактора (явления) параметры могут быть связаны каким-либо образом между собой, поэтому необходимо выявить размеры информации, поступающей по совместным каналам связи. Для построения двухфакторного канала связи, по существу, рассматривается передача информации от всех наблюдавшихся сочетаний состояний (рангов) двух факторов 3(А / Ь , с1), а совместная
информации Т (А; В, С) определяется по формуле
Т (А; В, С ) = X р(ь. , С )3 (а / Ь. , с,), (5)
где 3 - информативность связи А с В и С , Т -количество информации, поступающей к А от В и С одновременно.
Определение непосредственного прямого влияния фактора В на изучаемый показатель А основывается на сопоставлении частных информаций, передаваемых каждым фактором, с величиной информации, передаваемой ими совместно. Можно рассматривать следующие ситуации:
1. Т(А; В) + Т(А; С) = Т(А;В, С) тах{Т (А; в), Т (А; С )}= Т (А; В, С) - информация, передаваемая от фактора с наименьшим значением функции Т , косвенна и есть результат зависимости этого фактора от второго;
п
ар.
п
ь
2. T(A; b)+T(A; C)< t(A;B, C) - каждый из факторов в рамках анализируемой трехкомпонентной системы имеет относительно изучаемого показателя (явления) прямую информацию, однако некоторая часть ее имеет косвенный характер и есть продукт их взаимной связи;
3. T(A;B)+T(A;C)> T(A;B,C) - каждый из факторов содержит прямую информацию, косвенная информация или полностью отсутствует или незначительна;
4. min{T(A;B),T(A;C)}> T(A;B,C) - совместная информация меньше каждой частной - этот случай указывает, что существуют другие факторы, оказывающие большее влияние на изучаемый показатель или влияние факторов прямо противоположное.
На основе условных распределений можно установить взаимную специфичность состояний, выявить состояние (ранг) фактора, наиболее характерное для каждого состояния (ранга) параметра. Для этого определяется коэффициент связи t \ P(ai / bf)
K'=K( •b )=-P^a:r • <6)
Связь от P{bj) признается направленной в
сторону того состояния (ранга), для которого коэффициент наибольший. Если величины этих коэффициентов для соседних рангов близкие, то решение задачи неопределенное, так как оба ранга в равной степени соответствуют данному параметру. Если два таких состояния изолированы одно от другого состоянием с меньшим значением K , то специфично именно это промежуточное состояние. Распределение этих специфичных состояний в совместных каналах связи показывает характер взаимодействия параметров.
Таким образом, можно сформулировать следующий алгоритм:
1. Для каждого i = 1, n и bj определить P(a:),
P(a / bj).
p(a:/ bj P(at)
i = 1, n .
3. Найти argmax Ku = a,. .
i : 1
4. Если индекс :' единствен, то связь направлена от bj к a.,; если для i" и (i■ +1) выполняется K(a.,,bj ) « K(a., +l,bj ), то имеем неопределенность; если для i' и (" + г) с приблизительно одинаковыми значениями коэффициентов информативности K (a.,, bj ) и K (ai,+r, bj) существует такой номер I,
что
K (al, bj) < max {k (ai> ^ bj)и K (ai>+г ^ bj)} (7)
тогда связь направлена от bj к at, и at является
специфичным состоянием.
На основе информационного анализа можно решать следующие задачи:
- построение оптимальных «классификаций» явлений и параметров для данного исследования (величина шага ранга, количество рангов);
- выявление области значений параметра, где фактор ведет себя устойчиво;
- определение меры зависимости фактора (явления) от каждого состояния параметра, от параметра в целом и от совокупности параметров;
- исключение параметров, связанных с явлением косвенно.
В нашей задаче почвенные факторы, измеренные в пяти различных горизонтах: А, А+В, КОС, 0100см, профиль, представлены следующими параметрами: мощность горизонта (см), плотность сложения (г/см3), порозность (%), гранулометрический состав (%), рН солевой, гумус ( %), запасы гумуса в слое 0-100см (т/га), обменные катионы (ммоль/100г почвы), запасы обменных катионов в слое 0-100см (т/га), степень насыщенности основаниями (%), запасы подвижного фосфора (кг/га), запасы обменного калия (кг/га), влажность (ранги). К климатическим факторам относятся следующие: осадки за год (мм), осадки за вегетацию (мм), относительная влажность воздуха (%), гидротермический коэффициент (ГТК), сумма активных температур > +10 С (С), абсолютный минимум температур (С), абсолютный максимум температур (С), безморозный период (дни), вегетационный период (дни), среднегодовая температура (С).
В качестве исследуемых пород рассматривались интродуценты: сосна веймутовая, сосна Муррея, псевдотсуга Мензиса, дуб северный. С помощью коэффициента к (А, в) исследовалась степень влияния почвенных и климатических факторов на прирост древесины каждой породы [3]. Самый существенный фактор имеет максимальное значение коэффициента к (А, В). Упорядочивая факторы по значениям к (А, В), получим ранжирование показателей с учетом влияния на величину прироста. Введение порогового значения позволило сократить количество почвенно-климатических факторов, учитываемых при построении нечеткой системы. Такие совокупности значимых факторов были сформированы для каждой из пород интродуцентов. В табл. 1 приведены наиболее значимые почвенноклиматические показатели с рассчитанной величиной к (А, В) для сосны веймутовой; в табл. 2 - для псевдотсуги Мензиса.
Таким образом, коэффициент к (А, В) позволяет упорядочить по степени влияния на прирост данной породы почвенно-климатических показателей и выявить наиболее значимые из них.
С помощью сформулированного выше алгоритма были решены следующие задачи: выявлены области значений величины прироста древесины, где каждый из факторов ведет себя устойчиво; определены меры зависимости исследуемого показателя от каждого значимого состояния фактора в целом и от совокупности факторов.
для всех
)
2. Найти K = K (ai ^ bj)
Почвенные факторы K (a, B )
Степень насыщенности основаниями КОС G,265
Влажность в КОС G,2G9
Физическая глина (<0,01мм) в КОС G,i73
Сумма Са и Мд в КОС G,16B
Запасы Са и Мд в слое 0-100см G,161
Плотность сложения в КОС G,156
Запасы подвижного фосфора в слое 0100см G,i55
Климатические факторы K (a, b )
Осадки за год G,3BB
Среднегодовая температура G,2BB
Безморозный период G,262
Осадки за вегетационный период G,245
Абсолютный тіп температур G,236
Таблица 2
Почвенные факторы k (a, b)
Физическая глина(<0,01мм) в слое 0100см G,37i
pH солевой в профиле G,35B
Запасы обменного калия в КОС G,3iB
Порозность в гор.Л+В(ЛВ) G,3Gi
Мощность горизонта Л G,2B7
Степень насыщенности основаниями в горизонте Л G,277
Сумма Са и Mg в горизонте Л+В(ЛВ) G,257
Климатические факторы к (a, b)
Осадки за год G,357
Абсолютный тш температур G,357
Сумма активных температур>+10С G,3G9
Гидротермический коэффициент (ГТК) G,3G3
Осадки за вегетационный период G,255
Относительная влажность воздуха G,24
Вегетационный период G,22i
2. Разработка нечеткой системы для прогно-
зирования величины прироста древесины.
Нечеткое моделирование - это методология,
согласно которой совокупность правил вида
Я,: если х есть А, то у есть В, (/' = 1, п),
где посылка (условие) х есть А, и заключение у есть В, являются нечеткими высказываниями, переводят-
ся в четкую модель, то есть функцию /: X ^ У,
которая описывает связь между множествами X и У.
Совокупность нечетких правил {Я}, предназначенных для формального представления эмпирических знаний или знаний экспертов в некоторой проблемной области, образует базу правил. Заметим, что в случае причинной связи между входными и выходными переменными Я1 = А1 ^ В1, где символом ^ обозначена импликация, иначе Я1 = А1 х В{.
Нечеткая интерпретация классической схемы правильных рассуждений modus ponens позволяет перейти к обобщенному modus ponens, который составляет основу нечеткого логического вывода [1] условие если x есть A, то у есть B
факт x есть A
заключение у есть B'
где A, A',B, B' - нечеткие числа, определяемые своими функциями принадлежности на множестве действительных чисел R . Заключение B' определяется на основе операции композиции в виде
B’ = A' o (A ^ B) (8)
или в терминах функции принадлежности нечетких множеств в виде
Vy е Y [^{У ) = sup (x) Ma^b (x• У)} I • (9)
V xeX J
Заметим, что вместо (sup- min) -композиции можно рассматривать (sup- T ) -композицию, где T представляет собой треугольную норму. В этом случае
Vy е Y[Mb' (У) = sup T{Ma (x) Ma^b (x У)} .(10)
V xeX J
Выбор конкретных представлений нечетких логических связок, методов фазификации и дефазификации позволяет сформулировать конкретный алгоритм, согласно которому по заданным значениям входных переменных вычисляется значение выходной переменной. Обобщенная схема алгоритма представлена на рис. 1.
Рис. 1. Структурная схема
Описанный выше подход использовался для построения нечеткой системы, осуществляющей
прогнозирование прироста древесины на основе заданных значений почвенно-климатических показателей. По сути такую систему пришлось строить для каждой древесной породы, поскольку множества почвенно-климатических показателей для рассматриваемых пород существенно различаются не только по составу, но и по значениям для отдельных регионов. Остановимся на основных этапах исследования.
1. Формирование лингвистических шкал для входных и выходных переменных.
В результате предварительного исследования для каждой древесной породы был сформирован перечень наиболее значимых почвенноклиматических факторов, упорядоченных в соответствии с коэффициентами к ^, х1) к (г, у.), где г -
величина прироста древесины, х, - почвенный, у . -
климатический показатели. Каждому показателю и величине прироста ставится в соответствие лингвистическая переменная с одноименным названием. Затем для каждой лингвистической переменной строится лингвистическая шкала, как упорядоченное множество термов. Для представления термов были выбраны гауссовы нечеткие числа с функций
принадлежности /иА (х) = ехр<! -
а
(рис. 2). В
[2] отмечается, что такой выбор обеспечивает более высокую точность аппроксимации, чем треугольные и трапециевидные нечеткие числа. Заметим, что для задания гауссова числа достаточно задать параметры а и а . Это делалось на основе экспертной про-
цедуры, в рамках которой также определялось количество термов (от 3 до 7) для каждой лингвистической шкалы. В результате каждому почвенноклиматическому показателю была сопоставлена лингвистическая шкала. На рис. 3 представлены термы для показателя «степень насыщенности основаниями» для сосны веймутовой.
Рис. 2. Функция принадлежности Гаусса
Рис. 3. Лингвистическая шкала
х-а
Рис. 4. Экспертная база правил
Почвенные показатели Сосна веймуто- вая
Степень насыщенности основаниями в КОС, % 65
Влажность в КОС, % 2
Физическая глина (<0,01мм) в КОС, % 34
Сумма Са и Mg в КОС, ммоль/100г почвы 40375
Запасы Са и Mg в слое 0-100см, м/га 54.4
Плотность сложения в КОС, г/см3 13150
Запасы подвижного фосфора в слое 0-100см, кг/га 18
Почвенные показатели Псевдотсуга Мен-зиса
Физическая глина(<0,01мм) в слое 0100см, % 21
pH солевой в профиле 3.83
Запасы обменного калия в КОС, кг/га 1250
Порозность в гор.Л+В(ЛВ), % 53
Мощность горизонта Л, см 12
Степень насыщенности основаниями в гор. Л, % 18
Сумма Са и Mg в гор. Л+В(ЛВ), ммоль\100г почвы 2.4
Почвенные показатели Сосна Мурея
Мощность горизонта Л, см 21
Порозность в гор. Л, % 57
pH солевой в КОС 4.75
Запасы подвижного фосфора в гор Л+В(ЛВ), кг\га 150
Запасы обменного калия в КОС, кг\га 230
Среднее содержание гумуса в профиле, % 0.31
Плотность сложения в КОС, г/см3 1.25
Сумма Са и Mg в КОС, ммоль/100г почвы 5
Степень насыщенности основаниями в слое 0-100см, % 56
Почвенные показатели Дуб северный
pH в КОС 4.75
Степень насыщенности основаниями в гор.Л+В(ЛВ), % 50
Сумма Са + Mg в гор. Л+В(ЛВ), ммоль/100г почвы 1.09
Плотность сложения в гор. Л, г/см3 63
Мощность гор. Л+В(ЛВ), см 150
Запасы подвижного фосфора в гор. Л+В(ЛВ), кг/га 57
Влажность в КОС, ранги 2
Порозность в КОС, % 47
2. Формирование базы продукционных правил, описывающих на качественном уровне зависимость величины прироста от значений почвенноклиматических показателей.
Заметим, что база правил содержит основную информацию о моделируемой зависимости. Умение правильно ее формировать является важнейшим условием качественного функционирования нечеткой системы, обусловливающим качество решения прикладной задачи. В настоящее время проблема разработки, анализа и оптимизации баз правил, являющихся компонентой баз знаний интеллектуальных систем, является актуальнейшей проблемой нечеткого моделирования [2]. Большое значение здесь имеют экспертные методы. В нашем исследовании база правил формировалась с помощью экспертов для каждой древесной породы. На рис. 4 представлена база правил для сосны веймутовой (здесь учтено несколько самых важных факторов).
3. Решение задачи прогнозирования нами осу-
ществлялось с помощью приложения Fuzzy Logic Toolbox пакета MatLab. В данном приложении реализован метод Мамдани, в рамках которого конъюнкция - min, дизъюнкция - max, импликация -min, агрегирование - max, дефазификация - метод центра тяжести (COG). Помимо предсказания величины прироста древесины, мы можем, меняя входные значения почвенно-климатических показателей, определить при каких значениях почвенноклиматических показателей будет получен высокий, средний или низкий уровень прироста древесины или его заданное количественное значение. В рамках исследования было проведено сравнение величины прироста древесины на примере данных по Калининградской области. В табл. 3 и табл. 4 приведены наборы существенных почвенно-
климатических показателей для исследуемых древесных пород. На рис. 5 изображена гистограмма для величин прироста древесных пород, которая показывает, что в Калининградской области наиболее продуктивными породами являются псевдотсуга Мензиса и сосна веймутовая.
Таблица 4
Климатические показатели Значе- ние
Осадки за год, мм 7iG
Осадки за вегетацию, мм 559
Влажность, % 7i
ГТК ^б
Сумма активных температур 1>+10, С 22G6
Абсолютный минимум температур, С -39, i
Абсолютный максимум температур, С +3б
Безморозный период, дни ^5
Вегетационный период, дни ^б
Среднегодовая температура, С +7,2
Заключение. Разработанная нечеткая система позволяет решать два типа задач, во-первых, возможно определить «плохие» и «хорошие» условия для посадки различных типов пород деревьев, во-вторых, по имеющимся почвенно-климатическим
условиям можно рассчитать ожидаемую величину
прироста древесины.
Сосна
ееймутоеая
Сосна
Муррея
Псевдотсуга
Мензиса
Дуб
северный
Литература
1. Леденева Т.М. Обработка нечеткой информации
- Воронеж: ВГУ, 2006. - 232с.
2. Пегат А. Нечеткое моделирование и управление
- М.: БИНОМ. Лаборатория знаний, 2009. - 798с.
3. Беляев А.Б. Лесорастительные свойства почв лесостепных районов русской равнины: Автореф. дис. на соискание уч. ст. канд. биол. наук, М.: ВГУ, 2010. - 123с.
4. Болотов Н.А. Лесная интродукция. (Экология, лесоводственные особенности, районирование, перспективы внедрения лесообразующих экзотов) / Н. А. Болотов, Д. И. Щеглов, А. Б. Беляев. Воронеж: ВГУ, 2005. - 496 с.
5. Алексеев А.А., Кораблев Ю.А., Шестопалов М.Ю. Идентификация и диагностика систем - Москва: Издательский центр Академия, 2009. - 351с.
Рис. 5. Гистограмма величин прироста
Воронежский государственный университет Воронежский государственный технический университет
ESTIMATING FUZZY SYSTEM OF GROWTH OF WOOD GIVEN THE DIFFERENT SOIL
AND CLIMATIC CONDITIONS
T.M. Ledeneva, A.B. Belyaev, A.A. Dubinin
A problem of forecasting value growth of wood based on fuzzy modeling is describing in this article
Key words: fuzzy system, fuzzy logic conclusion, rule base, growth of wood