Научная статья на тему 'Разработка математической модели метода прогнозирования газодинамических явлений по геологическим данным для условий Верхнекамского месторождения калийных солей'

Разработка математической модели метода прогнозирования газодинамических явлений по геологическим данным для условий Верхнекамского месторождения калийных солей Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
129
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КАЛИЙНЫЕ РУДНИКИ / ГАЗОДИНАМИЧЕСКИЕ ЯВЛЕНИЯ / ГЕОЛОГИЧЕСКИЕ ДАННЫЕ / ОБУЧАЮЩАЯ ВЫБОРКА / МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / ДИСКРИМИНАНТНЫЙ АНАЛИЗ / СТАТИСТИЧЕСКИЕ ПРОЦЕДУРЫ / РОБАСТНЫЕ ОЦЕНКИ / РЕШАЮЩИЕ ПРАВИЛА / ПРОГНОЗНЫЕ КАРТЫ / POTASH MINES / GAS-DYNAMIC PHENOMENA / GEOLOGICAL DATA / LEARNING SAMPLE / MATHEMATICAL MODEL / DISCRIMINANT ANALYSIS / STATISTICAL PROCEDURES / ROBUST ESTIMATION / DECISION RULES / FORECAST MAPS

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Андрейко Сергей Семенович

Предложен статистический подход при прогнозировании газодинамической опасности в калийных рудниках, который позволяет существенно снизить зависимость конечных результатов прогнозирования от субъективных факторов путем введения в модель строго определенных информативных критериев. Получение наиболее адекватных действительности моделей прогнозирования возможно только с помощью комплексного подхода, отображающего факторы генерации, миграции, аккумуляции и сохранения в течение длительного геологического времени газовых скоплений и очагов газодинамических явлений в соляном породном массиве. При разработке математической модели метода прогнозирования газодинамических явлений по геологическим данным использовалась параметрическая математическая модель метода прогнозирования, основанная на дискриминантном анализе, которая является мощным статистическим методом и по глубине анализа данных и ценности получаемых результатов относится к самым эффективным методам статистического анализа. В случае соблюдения условий нормальности распределения многомерных данных и равенства ковариационных матриц параметрическая модель приводит к оптимальным результатам при прогнозировании. При невыполнении указанных ограничений применение в модели робастных оценок позволяет компенсировать рост вероятности ошибочного прогноза. Выполнен статистический анализ геологической информации в местах развития газодинамических явлений (ГДЯ) в калийных рудниках. Сформированы обучающие выборки, разработана математическая модель метода прогноза зон, опасных по ГДЯ, на основе многомерного дискриминантного анализа с использованием классических и робастных статистических процедур. Получены решающие правила для прогнозирования по геологическим данным зон, опасных по ГДЯ, для условий Верхнекамского месторождения калийных солей. Построены прогнозные карты зон, опасных по газодинамическим явлениям, для условий шахтного поля строящегося Усть-Яйвинского рудника ПАО «Уралкалий» и Половодовского участка Верхнекамского месторождения калийных солей. Дана оценка адекватности метода прогнозирования практике ведения горных работ на калийных пластах, опасных по ГДЯ, в условиях шахтных полей калийных рудников ПАО «Уралкалий».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Андрейко Сергей Семенович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Development of Mathematical Model of Gas-Dynamic Phenomena Forecasting Method According to Geological Data in Conditions of Verkhnekamskoie Potash Salt Deposit

Article proposes a statistical approach in predicting the gas-dynamic danger in potash mines, which can significantly reduce the dependence of the final prediction results on subjective factors by introducing a model of informative strictly defined criteria. Obtaining the most appropriate forecasting models of reality is only possible through an integrated approach, displaying factors of generation, migration, accumulation and preservation for a long period of geological time gas clusters and centers of gas-dynamic phenomena in the salt rock mass. In the mathematical model development for of gas-dynamic phenomena`s prediction method on geological data a parametric mathematical model of forecasting method was used based on discriminant analysis, which is a powerful statistical method and in depth of data analysis and the results significance is among the most effective methods of statistical analysis. In case of compliance with conditions of multidimensional data normal distribution and equality of covariance matrices the parametric model leads to optimal results in forecasting. In case of non-compliance with these restrictions in the use of robust evaluation model allows to compensate the incorrect prediction`s probability growth. A statistical analysis of geological information in the field of gas-dynamic phenomena (GDP) in the potash mines was performed. Learning samples were formed, the mathematical model of forecasting method for zones dangerous because of GDP was developed based on multivariate discriminant analysis with classical and robust statistical procedures. Decision rules to predict the geological data of areas dangerous because of GDP were obtained for conditions of Verkhnekamskoie potash salt deposit. Forecast maps were created for zones dangerous because of GDP for the Ust-Yaivinskii mine field conditions on the base of PJSC "Uralkali" and Polovodovskii area of Verkhnekamskoie potash salt deposit. The adequacy estimation was given for the method of forecasting mining operations` practice on potash layers dangerous because of GDP in conditions of potash mine fields PJSC "Uralkali".

Текст научной работы на тему «Разработка математической модели метода прогнозирования газодинамических явлений по геологическим данным для условий Верхнекамского месторождения калийных солей»

ВЕСТНИК ПНИПУ. ГЕОЛОГИЯ. НЕФТЕГАЗОВОЕ И ГОРНОЕ ДЕЛО BULLETIN OF PNRPU. GEOLOGY. OIL & GAS ENGINEERING & MINING

ISSN 2224-9923

Том / Volume 15 №21 2016

http://vestnik.pstu.ru/geo/

УДК 622.831.332

Статья / Article © ПНИПУ / PNRPU, 2016

РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ МЕТОДА ПРОГНОЗИРОВАНИЯ

ГАЗОДИНАМИЧЕСКИХ ЯВЛЕНИЙ ПО ГЕОЛОГИЧЕСКИМ ДАННЫМ

ДЛЯ УСЛОВИЙ ВЕРХНЕКАМСКОГО МЕСТОРОЖДЕНИЯ КАЛИЙНЫХ СОЛЕЙ

С.С. Андрейко

Горный институт Уральского отделения Российской академии наук (614007, Россия, г. Пермь, ул. Сибирская, 78а)

DEVELOPMENT OF MATHEMATICAL MODEL OF GAS-DYNAMIC PHENOMENA FORECASTING METHOD ACCORDING TO GEOLOGICAL DATA IN CONDITIONS OF VERKHNEKAMSKOIE POTASH SALT DEPOSIT

S.S. Andreiko

Mining Institute of the Ural Branch of the Russian Academy of Sciences (78a Sibirskaia str., Perm, 614007, Russian Federation) Получена / Received: 23.11.2015. Принята / Accepted: 27.10.2016. Опубликована / Published: 02.12.2016

Ключевые слова: калийные рудники, газодинамические явления, геологические данные, обучающая выборка, математическая модель, дискриминантный анализ, статистические процедуры, робастные оценки, решающие правила, прогнозные карты.

Предложен статистический подход при прогнозировании газодинамической опасности в калийных рудниках, который позволяет существенно снизить зависимость конечных результатов прогнозирования от субъективных факторов путем введения в модель строго определенных информативных критериев. Получение наиболее адекватных действительности моделей прогнозирования возможно только с помощью комплексного подхода, отображающего факторы генерации, миграции, аккумуляции и сохранения в течение длительного геологического времени газовых скоплений и очагов газодинамических явлений в соляном породном массиве. При разработке математической модели метода прогнозирования газодинамических явлений по геологическим данным использовалась параметрическая математическая модель метода прогнозирования, основанная на дискриминантном анализе, которая является мощным статистическим методом и по глубине анализа данных и ценности получаемых результатов относится к самым эффективным методам статистического анализа. В случае соблюдения условий нормальности распределения многомерных данных и равенства ковариационных матриц параметрическая модель приводит к оптимальным результатам при прогнозировании. При невыполнении указанных ограничений применение в модели робастных оценок позволяет компенсировать рост вероятности ошибочного прогноза. Выполнен статистический анализ геологической информации в местах развития газодинамических явлений (ГДЯ) в калийных рудниках. Сформированы обучающие выборки, разработана математическая модель метода прогноза зон, опасных по ГДЯ, на основе многомерного дискриминантного анализа с использованием классических и робастных статистических процедур. Получены решающие правила для прогнозирования по геологическим данным зон, опасных по ГДЯ, для условий Верхнекамского месторождения калийных солей. Построены прогнозные карты зон, опасных по газодинамическим явлениям, для условий шахтного поля строящегося Усть-Яйвинского рудника ПАО «Уралкалий» и Половодовского участка Верхнекамского месторождения калийных солей. Дана оценка адекватности метода прогнозирования практике ведения горных работ на калийных пластах, опасных по ГДЯ, в условиях шахтных полей калийных рудников ПАО «Уралкалий».

Key words:

potash mines, gas-dynamic phenomena, geological data, learning sample, mathematical model, discriminant analysis, statistical procedures, robust estimation, decision rules, forecast maps.

Article proposes a statistical approach in predicting the gas-dynamic danger in potash mines, which can significantly reduce the dependence of the final prediction results on subjective factors by introducing a model of informative strictly defined criteria. Obtaining the most appropriate forecasting models of reality is only possible through an integrated approach, displaying factors of generation, migration, accumulation and preservation for a long period of geological time gas clusters and centers of gas-dynamic phenomena in the salt rock mass. In the mathematical model development for of gas-dynamic phenomena's prediction method on geological data a parametric mathematical model of forecasting method was used based on discriminant analysis, which is a powerful statistical method and in depth of data analysis and the results significance is among the most effective methods of statistical analysis. In case of compliance with conditions of multidimensional data normal distribution and equality of covariance matrices the parametric model leads to optimal results in forecasting. In case of non-compliance with these restrictions in the use of robust evaluation model allows to compensate the incorrect predictions probability growth. A statistical analysis of geological information in the field of gas-dynamic phenomena (GDP) in the potash mines was performed. Learning samples were formed, the mathematical model of forecasting method for zones dangerous because of GDP was developed based on multivariate discriminant analysis with classical and robust statistical procedures. Decision rules to predict the geological data of areas dangerous because of GDP were obtained for conditions of Verkhnekamskoie potash salt deposit. Forecast maps were created for zones dangerous because of GDP for the Ust-Yaivinskii mine field conditions on the base of PJSC "Uralkali" and Polovodovskii area of Verkhnekamskoie potash salt deposit. The adequacy estimation was given for the method of forecasting mining operations' practice on potash layers dangerous because of GDP in conditions of potash mine fields PJSC "Uralkali".

Андрейко Сергей Семенович - доктор технических наук, профессор, заведующий лабораторией геотехнологических процессов и рудничной газодинамики (тел.: +007 342 216 58 42, e-mail: [email protected]).

Sergei S. Andreiko - Doctor of Technical Sciences, Professor, Head of the Laboratory of Geotechnological Processes and Mine Gas Dynamics (tel.: +007 342 216 58 42, e-mail: [email protected]).

Введение

В настоящее время в мире подземным способом разрабатывается около 30 месторождений калийно-магниевых солей. В процессе подземной добычи на всех разрабатываемых месторождениях сталкиваются с проблемой интенсивных выделений горючих и ядовитых газов, а также с проблемой газодинамических явлений (ГДЯ) различного вида. Интенсивные газовыделения приводят к загазованию горных выработок, вспышкам и взрывам горючих газов, которые часто сопровождаются одиночными и групповыми несчастными случаями, в том числе и с летальным исходом. Газодинамические явления в виде внезапных выбросов соли и газа, разрушений пород кровли и почвы горных выработок, сопровождающихся газовыделениями, и явлений комбинированного типа в силу своей внезапности и большой мощности (до 6000 т разрушенной горной массы) угрожают жизни шахтеров, выводят из строя дорогостоящее горное оборудование и нарушают ритмичность работы калийных рудников [1-4].

Проблема прогнозирования газодинамических явлений при подземной разработке калийных месторождений исследуется достаточно давно. Как правило, для ее решения применялись геолого-математические методы прогнозирования. Статистический подход при прогнозировании газодинамической опасности позволяет существенно снизить зависимость конечных результатов прогнозирования от субъективных факторов путем введения в модель строго определенных информативных критериев. Однако следует отметить, что получение наиболее адекватных действительности моделей прогнозирования возможно только с помощью комплексного подхода, отображающего факторы генерации, миграции, аккумуляции и сохранения газовых скоплений и очагов ГДЯ в соляном породном массиве.

Исследования в области построения математических моделей локализации участков газодинамической опасности в калийных рудниках традиционно сводились к применению параметрических моделей, основанных на линейных дискриминантных функциях. Исследования показали, что параметрическая математическая модель метода прогнозирования зон, опасных по ГДЯ, основанная на дискриминантном анализе, является мощным статистическим методом и по глубине анализа данных и ценности получаемых результатов относится к самым эффективным методам статистического анализа. Модель отличается

достаточной простотой, лаконичностью, хорошей интерпретируемостью, удобна для рассмотрения геометрических иллюстраций разделения областей массива на опасные и неопасные по ГДЯ зоны. Параметрическая модель метода прогнозирования позволяет производить отбор наиболее информативных показателей, что дает возможность снизить размерность исходного пространства признаков, отбросить неинформативные и малоинформативные переменные. В случае соблюдения условий нормальности распределения многомерных данных и равенства ковариационных матриц параметрическая модель приводит к оптимальным результатам при прогнозировании. При невыполнении указанных ограничений применение в модели робастных оценок позволяет компенсировать рост вероятности ошибочного прогноза. Таким образом, при решении прикладных задач прогнозирования зон, опасных по ГДЯ, параметрическая математическая модель, основанная на линейном дискриминантном анализе с применением робастных оценок, является наиболее предпочтительной среди других известных параметрических моделей.

Постановка задачи

Поставленная задача заключается в отнесении на основе комплекса геологических показателей к зоне, опасной или неопасной по газодинамическим явлениям, конкретного участка месторождения или шахтного поля. В соответствии с поставленной задачей математической моделью метода прогнозирования будет решающее правило, при подстановке значений геологических показателей в которое можно будет с максимально возможной вероятностью дать оценку рассматриваемому участку с позиций газодинамической опасности.

В математической постановке получение решающего правила сводится к определению конечного набора геологических показателей, интервалов их значений, присущих как опасным, так и неопасным по ГДЯ зонам, а также нахождению наиболее эффективных с точки зрения вероятности правильного прогнозирования статистических процедур.

Формально каждая запись имеющихся геологических данных представляет собой многомерное наблюдение в Р-мерном пространстве с конечным набором признаков Х. Совокупность наблюдений, относящихся к одному классу Д, образует «облако» в этом же пространстве. Поэтому для успешного прогнозирования необходимо, чтобы «облако» из Д было сконцентривано в некоторой области Я г пространства Х и в область Я г попала

незначительная часть Д, соответствующая другому классу. В общем случае построение решающего правила для отнесения многомерного наблюдения к тому или иному классу можно рассматривать как задачу поиска к непересекающихся областей Яг (г = 1, к), удовлетворяющих указанным условиям.

Если Р-мерное наблюдение пространства Х попадает в область Яг, то будем считать, что принимается решение о принадлежности объекта к Д. При использовании подобного правила прогнозирования в некоторых случаях объект может быть отнесен к другому классу. Поэтому обозначим вероятность неправильной классификации объектов через Р(г/-), тогда критерий средней вероятности ошибочного прогноза имеет следующий вид:

е=Е ¿«лг/ -), (1)

1=1

где аг - априорная вероятность появления объекта из области Д.

Решение данной задачи проводится при наличии обучающей выборки, которая должна состоять из наблюдений, относящихся к обоим классам (к зонам, опасным и неопасным по ГДЯ). Поэтому считаем, что обучающая выборка для класса Д представляет собой выборку из некоторой генеральной совокупности объектов с плотностью распределения Р (X). Правило прогнозирования, минимизирующее функцию потерь е, будет следующим:

х е Д, если таха Р(X/j) = аР(X/г). (2)

1<-<к ]

Чтобы выяснить вероятностный смысл выражения (2), предположим, что Р( X) =

к

= £а-Р(Х/-). Величина Р(-/X) = а-Р(X/-) х

г=1

х[Р( X)] представляет собой условную

вероятность того, что Р-мерное наблюдение X принадлежит Д. Поэтому выражение (2) называется правилом прогнозирования по максимуму условной вероятности, так как дает наименьшую величину функции потерь (1). В реальной ситуации точное расположение «облаков» объектов и их плотности Р(X) неизвестны, а имеются обучающие выборки, которые дают об этом приближенное представление. Обучающая выборка представляет собой совокупность многомерных наблюдений, полученных в результате исследований. В матрицу исходных данных также включаются наблюдения, принадлежность к какому-либо классу которых точно не установлена.

В настоящее время известно большое число методов распознавания образов для построения решающих правил по обучающей выборке или так называемой статистической классификации, которые подразделяются на две группы: параметрические и непараметрические методы [5-11]. В параметрических методах получения решающих правил для прогнозирования традиционно используются предположения об однородности обучающих выборок для каждого класса, измерении всех компонент векторов признаков X, принадлежности условных вероятностных распределений к многомерному гауссовскому семейству, независимости выборочных значений. Наиболее известным из параметрических методов является линейный дискриминантный анализ, основанный на линейных дискриминантных функциях (ЛДФ). Дискриминантный анализ на основе ЛДФ характеризуется строгим математическим обоснованием, физической интерпретируемостью, наглядным представлением результатов. Недостатками данного метода являются требования к однородности выборок, принадлежности к многомерному нормальному распределению и независимости выборочных значений.

Непараметрические методы получения решающих правил для прогнозирования игнорируют априорные исходные предположения об однородности выборки каждого класса, наличие измерений всех компонент вектора признаков, гауссовость условных вероятностей распределения признаков. Наиболее известными непараметрическими методами являются метод «к-ближайших соседей» и метод Розенблатта-Парзена [12-14]. Эти методы отличаются относительной простотой, хорошо работают при прогнозировании, но требуют постоянного запоминания обучающих выборок и характеризуются высокой чувствительностью к малым объемам обучающих выборок, при которых риск ошибочной классификации резко возрастает. При этом коэффициент робастности (устойчивости), представляющий собой относительное увеличение вероятности ошибки классификации, при объеме обучающей выборке больше 20 для непараметрических методов в 2-4 раза больше, чем для линейного дискриминантного анализа на основе ЛДФ [14]. Для получения решающих правил прогнозирования зон, опасных по ГДЯ, используются обучающие выборки, объемы которых намного превышают 20, что позволяет отдать при прогнозировании зон, опасных по ГДЯ, предпочтение параметрической модели получения решающих правил.

Суть построения решающего правила на основе линейных дискриминантных функций сводится к следующему. Обозначив через Ху значение переменной с номером г в точке наблюдений с номером у, взятой из выборки, характеризующей опасные по ГДЯ зоны, получаем матрицу V порядка рхщ результатов наблюдений над этой выборкой:

V -

X11 X12 у у

21 22

1«j

у

2 n

(3)

ХР, ХР2 "' ХРПЧ

Обозначим через Ху результат измерения переменной с номером г в точке с номером у, взятой из выборки, характеризующей неопасные по ГДЯ зоны. В результате получим матрицу Ж порядка рхп2:

W -

X11 X1: X 21 X

22

X1

X

2n?

X р

рпг

(4)

ХР1 ХР2

где р - число переменных (показателей); пь п2 - объемы выборок показателей.

Затем, используя эти данные, для каждой группы вычисляются средние и суммы взаимных произведений отклонений от средних. Средние вычисляются по формуле

- (* Л 1

Хк =ЁХ,к {пк)", (5)

Vг=1 У

где к - число групп (к = 2); пк - размер выборки в к-й группе; у = 1, 2, ..., р - переменные.

Далее находится сумма взаимных произведений отклонений от средних:

Sk - X (Xijk ~ Xjk )(Xilk ~ Xlk ),

(6)

где у = 1, 2, ..., р; I = 1, 2, ..., р.

Следующим этапом идет вычисление объединенной дисперсионной матрицы

D-IS Sk X пк - q

Л-1

(7)

где q - число групп (д = 2).

Рассчитываются общие средние для обеих групп:

Xj -IS пк • Xjk

k-1

(8)

где Ху - средние у-й переменной в к-й группе; пк - размер выборки в к-й группе; у = 1, 2, ., р - переменные.

Затем для каждой группы вычисляются обратные элементы объединенной дисперсионной матрицы О:

& ]- D-1.

(9)

Коэффициенты дискриминантных функций находятся по формуле

-S dj ■ Xk,

(10)

j-1

где г = 1,2, ..., р; к - число групп.

Затем вычисляются константы дискрими-нантных функций:

Ъок =-0,5]^• Хук • Хк. (11)

у=1 I =1

Для случая двух классов и О2 (опасные и неопасные по ГДЯ зоны) получаем две линейные дискриминантные функции вида

S a • Xt - bok - 0.

(12)

i-1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вычитая меньшую дискриминантную функцию из большей, можем перейти к одной линейной дискриминантной функции вида

(13)

a1 X1

- a2 X2

-apXp - b - 0.

Для случая двух классов использование линейных дискриминантных функций основывается на двух предположениях. Первое предположение состоит в том, что области и Я2, где сконцентрирована основная часть объектов, соответствующих классам и О2 (опасные и неопасные по ГДЯ зоны), могут быть разделены (р-1)-мерной гиперплоскостью. Уравнение такой гиперплоскости и представляет собой выражение (13). Здесь а1, а2, ... ар -коэффициенты, характеризующие наклон гиперплоскости к координатным осям, а Ь - параметр, характеризующий расстояние гиперплоскости до начала координат. Гиперплоскость (13) разбивает р-мерное пространство на два полупространства Я1 и Я2, которые определяются неравенствами

Ri/z(X) < b и R2/z(X) >b,

(14)

где z(X) -S ar • X.

Следовательно, неравенство (14) дает нам решающее правило для отнесения многомерного вектора наблюдений к одной из двух зон - опасной или неопасной по ГДЯ.

i-1

Условимся относить наблюдение к Д, если г(Х) < Ь, и к О2 - в противном случае. Соотношение (14) позволяет перейти от ^-мерных случайных величин к классификации одномерных величин г(ХХ). Обозначим через г,-случайную величину г(Х), когдаХеО.

Второе предположение дает метод определения коэффициентов разделяющей гиперплоскости таким образом, чтобы разделение было наилучшим. Предположим, что разделение будет тем лучше, чем дальше отстоят средние значения случайных величин г1 и г2, причем расстояние измеряется в единицах дисперсии:

hl) = (mi -mi)DD

i

z '

(15)

где т I = Е г; - дисперсия гг (г = 1, 2), полагается одинаковой для обоих классов.

Вектор А, доставляющий максимум к2(Л), определяется уравнением

А„ =

[X( 2 Я-

(16)

где ц - вектор средних значений для D; Е -ковариационная матрица, полагаемая одинаковой для обоих классов.

Максимальное значение h2(a) носит название расстояния Махалонобиса между классами Di и D2 и равно

D2 = 1 tdj (( - X )(( - ). (17)

i=1 j=1 k=1

Статистика Махалонобиса может быть использована для проверки значимости полученной дискриминантной функции. Если многомерное расп2ределение предположить нормальным, то D -статистика распределена как х2 с p(q-1) степенями свободы. Сравнивая расчетное значение D2 с х2 при 5%-ном уровне значимости, если D2 > х2, можно говорить о том, что полученные линейные дискрими-нантные функции имеют смысл и могут использоваться как решающие правила при прогнозировании. На стадии разведочного анализа устанавливаем, что объекты из Di (i = 1,2) распределены согласно многомерному нормальному закону с одинаковой ковариационной матрицей. Следовательно, решающие правила (14) на основе линейных дискрими-нантных функций (10) и (11) являются наилучшими, т.е. доставляют функционалу Q (1) наименьшее возможное значение.

Необходимо отметить еще один весьма важный момент при нахождении решающих правил посредством линейных дискрими-

нантных функций. Если на стадии разведочного анализа установлено «засорение» обучающих выборок «выбросами» и эти аномальные наблюдения могут представлять определенный интерес при исследованиях, то целесообразно использовать процедуры оценки параметров распределения, не чувствительные к структуре данных. Такие процедуры оценивания называются робастными, или устойчивыми [6, 15-22]. Могут использоваться следующие робастные процедуры в подстановочном дискриминантном анализе при получении устойчивых решающих правил: винзоризованные оценки, усеченные оценки, весовые оценки Хьюбера, кусочно-линейные М-оценки Хампеля. При наличии искажений в обучающих выборках и использовании в решающих правилах классических оценок параметров распределений вероятность ошибочного прогноза значительно увеличивается, поэтому необходимо использовать устойчивые оценки.

Если в обучающей выборке присутствуют «выбросы», то можно использовать любую из приведенных устойчивых оценок. Если обучающая выборка сформирована из распределений с «тяжелыми хвостами» или отличных от нормального, то лучше применять весовые оценки Хьюбера или Хампеля. Робастные итерационные оценки Хьюбера определяются следующими соотношениями:

s= х

j, k=1

= X XjWj / X

j=1 j=1

( л; V Л; V

w w,

J k

x. - x

j

xk Xk

/ X w,

j=1

1, если d < d0

w. = j

j | d0 / d , если d > d0

dj =

Л л Л

XJ - Xi Ei XJ - Xi

V У V У

= 4p + 2V2, (18)

(j = 1, n ; i = 1,L).

Здесь х ,, Е г - оценки параметров, вычисленные на предыдущем шаге;х1,...,хи - обучающая

выборка для г-го класса; пг - объем обучающей выборки для -го класса. В качестве начального приближения используются классические оценки параметров.

В целом параметрическая математическая модель метода прогнозирования зон, опасных по ГДЯ, основанная на дискриминантном анализе, является мощным статистическим методом и по глубине анализа данных и ценности получаемых результатов относится к самым эффективным

*

методам статистического анализа. Модель отличается достаточной простотой, лаконичностью, хорошей интерпретируемостью, удобна для рассмотрения геометрических иллюстраций разделения областей массива на опасные и неопасные по ГДЯ зоны. Параметрическая модель метода прогнозирования позволяет производить отбор наиболее информативных показателей, что дает возможность снизить размерность исходного пространства признаков, отбросить неинформативные и малоинформативные переменные. В случае соблюдения условий нормальности распределения многомерных данных и равенства ковариационных матриц параметрическая модель приводит к оптимальным результатам при прогнозировании. При невыполнении указанных ограничений применение в модели робастных оценок позволяет компенсировать рост вероятности ошибочного прогноза.

Процедура получения решающих правил

В процессе получения решающих правил учитывались существующие представления о механизме образования очагов газодинамических явлений в соляном породном массиве Верхнекамского месторождения калийных солей [23, 24]. Формирование обучающей выборки проводилось следующим способом. Все зафиксированные случаи ГДЯ при отработке пласта АБ в южной части Верхнекамского месторождения калийных солей на шахтных полях рудников БКПРУ-2 и БКПРУ-4 и соответствующие им геологические показатели априори отнесены в опасную по ГДЯ зону (группа 2). Остальная часть общей выборки отнесена к зоне, неопасной по ГДЯ (группа 1). Всего исследовано 658 наблюдений, из них отнесенных к неопасным по ГДЯ (группа 1) 478, к опасным по ГДЯ (группа 2) -180. Для получения решающих правил использовались следующие показатели: Х1 -мощность пласта Б, м; Х2 - содержание в пласте Б хлористого калия (KCl), %; Х3 - содержание в пласте Б хлористого магния (MgCl2), %; Х4 -содержание в пласте Б хлористого натрия (NaCl), %; Х5 - содержание в пласте Б брома (Бг), %; Х6 - содержание в пласте Б сульфата кальция (CaSO4), %; Х7 - содержание в пласте Б нерастворимого остатка (н.о.), %; Х8 - глубина залегания кровли пласта Б, м; Х9 - абсолютная отметка кровли пласта Б, м.

Разведочный анализ исходных данных показал неоднородность общей выборки, отклонение распределения от нормального и наличие в выборке «тяжелых хвостов». В связи с тем что

не все используемые показатели в равной степени полезны для разделения пласта на опасные и неопасные по ГДЯ зоны, необходимо было выявить такое подмножество показателей, по которому можно построить «наилучшее» разделение между группами. Для решения этой задачи был реализован пошаговый дискрими-нантный анализ (ПДА) с использованием следующих оценок: классические оценки, весовые оценки Хьюбера и усеченные оценки с уровнем усечения 0,1. В ПДА для отбора наиболее информативных показателей использовалась ^-статистика, основанная на критерии однофакторного дисперсионного анализа. В сущности, логика ПДА такова: вначале определяется показатель, для которого средние значения в двух группах «наиболее различны». Для каждого показателя Х\, Х2, Х3, ... Х9 различие измеряется с помощью ^-статистики и выбирается (включается) тот показатель, которому соответствует большее значение К На каждом шаге процедуры рассматривается условное распределение каждого показателя, не включенного в подмножество, при заданных включенных показателях. Затем из числа невключенных показателей вновь определяется показатель, для которого средние значения в двух группах «наиболее различны». Это различие определяется с помощью ^-статистики. Процесс завершается, когда ни один из оставшихся показателей не вносит значимого вклада в разделение групп. В процессе реализации ПДА принимались стандартные значения минимума ^-включения переменных, не вошедших в искомое подмножество, и ^-удаления выбранных переменных при уровне значимости 0,05. На шаге 8 значение статистики ^-удаления оказалось меньше принятого минимума, равного 3.0, следовательно, «наилучшие» дискриминантные уравнения задаются на шаге 7. Таким образом, показатели Х1, Х2, Х3, Х4, Х5, Х6 и Х7 вошли в искомое подмножество, а показатели Х8 и Х9 -нет. Анализ матриц классификации при реализации процедуры ПДА с использованием классических оценок, весовых оценок Хьюбера и усеченных оценок с уровнем усечения 0,1 показал следующее. При применении классических оценок правильно классифицировано 62,3 % исходных сгруппированных наблюдений. В случае использования весовых оценок Хьюбера и усеченных оценок с уровнем усечения 0,1 правильно классифицировано соответственно 61,7 и 61,5 % исходных сгруппированных наблюдений.

Правильность первичной классификации с использованием как классических, так и робастных процедур практически одинакова и превышает 60 %. Поэтому окончательный

выбор решающего правила был проведен после повторной классификации. При этом исходные данные были перегруппированы, а затем проводилась процедура повторной классификации, в результате которой уточнялись коэффициенты линейных дискриминантных функций для каждой из групп, а также давалась оценка правильности классификации. Для каждого наблюдения с использованием полученных дис-криминантных функций и .02-статистики Маха-лонобиса вычислялись апостериорные вероятности его принадлежности к группе, опасной или неопасной по ГДЯ. На основании этих вероятностей каждое наблюдение классифицировалось как принадлежащее одной из групп и составлялась матрица классификации. В табл. 1 представлены результаты классификации с применением классических процедур, с использованием весовых оценок Хьюбера, усеченных оценок (уровень усечения -0,1).

Как видно из табл. 1, с использованием классических статистических процедур линейного дискриминантного анализа правильно классифицировано 92,86 % повторно сгруппированных наблюдений.

При использовании линейного дискрими-нантного анализа с весовыми оценками Хьюбера вероятность правильной классификации составляет 96 %.

Таблица 1

Матрица классификации по результатам линейного дискриминантного анализа

Группа Результаты классификации Всего

неопасные по ГДЯ Опасные по ГДЯ

абс. | % абс. | %

C использованием классических статистических процедур

Неопасные по ГДЯ (1) 323 91,76 29 8,24 352

Опасные по ГДЯ (2) 18 5,88 288 94,12 306

Всего 341 51,82 317 48,18 658

C использованием весовых оценок Хьюбера

Неопасные по ГДЯ (1) 334 94,89 18 5,11 352

Опасные по ГДЯ (2) 8 2,61 298 97,39 306

Всего 342 51,98 316 48,02 658

C использованием усеченных оценок с уровнем усечения 0,1

Неопасные по ГДЯ (1) 319 90,63 33 9,37 352

Опасные по ГДЯ (2) 24 7,84 282 92,16 306

Всего 343 52,13 315 47,87 658

При применении в линейном дискриминантном анализе усеченных оценок с уровнем усечения 0,1 вероятность правильной классификации составляет 91,34 %. По критерию наибольшей вероятности правильной классификации принимаем для прогнозирования зон, опасных по ГДЯ, решающее правило, полученное с использованием весовых оценок Хьюбера. В табл. 2 представлены константы и коэффициенты дискриминантных функций, найденные с использованием весовых оценок Хьюбера.

Таблица 2

Константы и коэффициенты дискриминантных функций, полученные с использованием весовых оценок Хьюбера

Группа Константы дискриминантных функций Значения коэффициентов дискриминантных функций

* Х2 X3 X4 X5 X6 X7

Неопасные по ГДЯ (1) -385755,60 998,66 7678,37 16092,34 7734,02 -11769,6 7829,14 7715,20

Опасные по ГДЯ (2) -385444,89 978,68 7677,20 16123,52 7730,39 -12516,62 7836,01 7710,63

Так как в нашем случае имеется две группы, то можно перейти от двух дискриминантных функций к одной, вычитая коэффициенты и константы меньшей функции из большей. После вычитания получаем линейную дискриминантную функцию следующего вида:

F = - 19,98X1 - 1,16X2 + + 31,18X3 - 3,64X4 - 747,02X5 + (19) + 6,87X6 - 4,57X7 + 310,72 > 0, где Xi - мощность пласта Б, м; X2 - содержание KCl в породах пласта Б, %; X3 - содержание MgCl2 в пласте Б, %; X4 - содержание NaCl в пласте Б, %; X5 - содержание Бг в пласте Б, %; X6 - содержание CaSO4 в пласте Б, %; X7 - содержание нерастворимого остатка в пласте Б, %.

Выражение (19) является искомым решающим правилом для отнесения участков пласта АБ к зонам, опасным или неопасным по ГДЯ. При Ff > 0 точка наблюдения относится к зоне, опасной по ГДЯ, в противном случае -к неопасной. Для вероятностной интерпретации

полученных дискриминантных функций, которая более удобна при построении прогнозных карт, целесообразно использовать выражение

P = 1/£exp(/k - /),

(20)

k=1

где Рг - вероятность, соответствующая наибольшей дискриминантной функции; q - число групп (д = 2); /, / - значение к-й и наибольшей дискриминантной функции соответственно.

Подставляя значения показателей в дискрими-нантные функции, константы и коэффициенты которых представлены в табл. 2, получим некоторые значения дискриминантных функций. Затем, подставляя полученные значения дискриминантных функций в выражение (20), найдем значение вероятности отнесения точки наблюдения к той зоне, значение дискриминантной функции для которой больше. Значение Р1 изменяется от 0 до 1, граничным является значение вероятности, равное 0,5.

Оценка адекватности решающих правил и прогнозные карты зон, опасных по ГДЯ

Для оценки адекватности полученных решающих правил практике ведения горных работ на прогнозных картах зон, опасных по ГДЯ, были отмечены места, где при ведении подготовительных и очистных горных работ произошли газодинамические явления. При отработке пласта АБ шахтного поля рудника БКПРУ-2 из 98 случаев ГДЯ в прогнозируемые зоны, опасные по ГДЯ, не вошли 8 ГДЯ (7,8 % от их общего числа). Таким образом, адекватность результатов прогнозирования зон, опасных по газодинамическим явлениям, на сильвинитовом пласте АБ шахтного поля рудника БКПРУ-2 практике ведения горных работ составляет соответственно 92,2 %. С целью проверки работоспособности полученных решающих правил прогноза зон, опасных по ГДЯ, в исходную выборку были добавлены данные по шахтным полям рудников БКПРУ-1 и БКПРУ-4, первоначально не вошедшие в исходные данные. Далее была проведена экзаменационная классификация новых исходных данных, правильность которой для пласта АБ составила 96,7 %. Подстановка значений геологических показателей, полученных по результатам бурения скважин, детальной разведки с поверхности, подземных геолого-разведочных скважин и данных бороздового опробования в подземных горных выработках, в решающие правила позволила построить прогнозные карты зон, опасных по газодинамическим явлениям.

На рисунке приведена карта зон, опасных по газодинамическим явлениям, из кровли горных выработок при отработке пласта АБ в условиях Половодовского участка Верхнекамского месторождения калийных солей.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Заключение

В результате проведенного научного исследования создана математическая модель метода прогнозирования зон, опасных по газодинамическим явлениям, на основе линейного дискриминантного анализа с использованием робастных (устойчивых) процедур, позволяющая повысить надежность многофакторного прогнозирования. Разработан метод прогнозирования зон, опасных по газодинамическим явлениям, при разведке и разработке сильвинитового пласта АБ, использующий в решающих правилах комплекс

Список J

1. Проскуряков Н.М. Внезапные выбросы породы и газа в калийных рудниках. - М.: Недра, 1980. -264 с.

2. Ковалев О.В., Ливенский В.С., Былино Л.В. Особенности безопасной разработки калийных месторождений. - Минск: Полымя, 1982. - 96 с.

Рис. Карта зон, опасных по ГДЯ из кровли горных выработок при отработке пласта АБ в условиях Половодовского участка Верхнекамского месторождения калийных солей

следующих геологических параметров: мощность пласта, содержание хлористого калия, хлористого магния, хлористого натрия, брома, сульфата кальция и нерастворимого остатка в породах пласта. Вероятность правильной дискриминации участков сильвинитового пласта АБ на зоны, опасные и неопасные по ГДЯ, составляет 0,96. Адекватность результатов прогнозирования зон, опасных по газодинамическим явлениям, практике ведения горных работ на сильвинитовом пласте АБ составляет соответственно 92 %. Построены прогнозные карты зон, опасных по газодинамическим явлениям, сильвинитового пласта АБ для условий строящегося Усть-Яйвинского рудника ПАО «Уралкалий» и Половодовского участка Верхнекамского месторождения калийных солей.

3. Долгов П.В., Полянина Г.Д., Земсков А.Н. Методы прогноза и предотвращения газодинамических явлений в калийных рудниках. - Алма-Ата: Наука, 1987. - 176 с.

4. Проскуряков Н. М., Ковалев О. В., Мещеряков В. В. Управление газодинамическими процессами в пластах калийных руд. - М.: Недра, 1988. - 239 с.

5. Классификация и кластер. - М.: Мир, 1980. - 389 с.

6. Афифи А., Эйзен С. Статистический анализ: подход с использованием ЭВМ. - М.: Мир, 1982. - 488 с.

7. Горелик А. Л., Скрипкин В. А. Методы распознавания. - М.: Высшая школа, 1984. - 207 с.

8. Абусев Р.А., Лумельский Я.П. Статистическая групповая классификация. - Пермь, 1987. - 190 с.

9. Гирко В. Л. Многомерный статистический анализ. -Киев: Выща шк.,1988. - 320 с.

10. Фомин А.Я., Тарловский Г.Р. Статистическая теория распознавания образов. - М.: Радио и связь, 1988. - 264 с.

11. Классификация и снижение размерности / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д. Ме-шалкин. - М.: Финансы и статистика, 1989. - 606 с.

12. Parzen E. On estimation of a probability density function and mode // Annals of Mathematical Statistics. -1962. - Vol. 33. - P. 1065-1076.

13. Епаненчиков В.А. Непараметрическая оценка многомерной плотности вероятностей // Теория вероятностей и ее применение. - М., 1969. - Т. 14, вып. 1. - С. 156-160.

14. Фукунага К. Введение в статистическую теорию распознавания образов. - М.: Наука, 1979. - 367 с.

15. Huber P.J. Robust statistics: a review // Ann. Mah. Statist. - 1972. - Vol. 43. - P. 1041-1067.

16. Hampel F.R A general gualitative definition of robustness // Ann. Math. Statist. - 1971. - Vol. 42, № 6. - P. 1887-1896.

17. Huber P.J. Robust statistics procedures. -Philadelphia: SIAM, 1977. - 56 p.

18. Huber P.J. Robust statistics. - N.Y.: Wiley. - 308 p.

19. Tiku M.L., Balakrishan N.A. Robust test for testing the correlation coefficient // Commun. Statist. - 1986. -15(4). - P. 946-971.

20. Харин Ю.С. Робастность в статистическом распознавании образов. - Минск: Университетское, 1992. - 232 с.

21. Титаренко Б.П., Харин Ю.С., Степанова М.Д. Робастное оценивание: методы, алгоритмы и программы. -М.: Финансы и статистика, 1992. - 256 с.

22. Хампель Ф., Рончетти Э., Рауссеу П. Робастность в статистике. - М.: Мир, 1989. - 512 с.

23. Андрейко С. С., Калугин П. А., Щерба В.Я. Газодинамические явления в калийных рудниках: генезис, прогноз и управление. - Минск: Высшая школа, 2000. - 355 с.

24. Андрейко С. С. Механизм образования очагов газодинамических явлений в соляном породном массиве. - Пермь: Изд-во Перм. гос. техн. ун-та, 2008. - 196 с.

References

1. Proskuriakov N.M. Vnezapnye vybrosy porody i gaza v kaliinykh rudnikakh [Sudden emissions of rock and gas in the potash mines]. Moscow: Nedra, 1980, 264 p.

2. Kovalev O.V., Livenskii V.S., Bylino L.V. Osobennosti bezopasnoi razrabotki kaliinykh mestorozhdenii [Features of safe development of potash deposits]. Minsk: Polymia, 1982, 96 p.

3. Dolgov P.V., Polianina G.D., Zemskov A.N. Metody prognoza i predotvrashcheniia gazodinamicheskikh iavlenii v kaliinykh rudnikakh [Method to forecast and prevent the gas-dynamic phenomena in potash mines]. Alma-Ata: Nauka, 1987, 176p.

4. Proskuriakov N.M., Kovalev O.V., Meshcheriakov V.V. Upravlenie gazodinamicheskimi protsessami v plastakh kaliinykh rud [Management of gas-dynamic processes in potash ore seams]. Moscow: Nedra, 1988, 239 p.

5. Klassifikatsiia i klaster [Classification and cluster]. Moscow: Mir, 1980, 389 p.

6. Afifi A., Eizen S. Statisticheskii analiz: podkhod s ispol'zovaniem EVM [Statistical analysis: an approach using computers]. Moscow: Mir, 1982, 488 p.

7. Gorelik A.L., Skripkin V.A. Metody raspoznavaniia [Detection methods]. Moscow: Vysshaia shkola, 1984, 207 p.

8. Abusev R.A., Lumel'skii Ia.P. Statisticheskaia gruppovaia klassifikatsiia [Statistical group classification]. Perm', 1987, 190 p.

9. Girko V.L. Mnogomernyi statisticheskii analiz [Multivariate statistical analysis]. Kiev: Vysshaia shkola, 320 p.

10. Fomin A.Ia., Tarlovskii G.R. Statisticheskaia teoriia raspoznavaniia obrazov [Statistical theory of image recognition]. Moscow: Radio i sviaz', 1988, 264 p.

11. Aivazian S.A., Bukhshtaber V.M., Eniukov I.S., Meshalkin L.D. Klassifikatsiia i snizhenie razmernosti [Classification and reduction of dimension]. Moscow: Finansy i statistika, 1989, 606 p.

12. Parzen E. On estimation of a probability density function and mode. Annals of Mathematical Statistics, 1962, vol. 33, pp.1065-1076.

13. Epanenchikov V.A. Neparametricheskaia otsenka mnogomernoi plotnosti veroiatnostei [Non-parametric estimation of a multidimensional probability density]. Teoriia veroiatnosti i ee primenenie, 1969, vol.14, no.1, pp.156-160.

14. Fukunaga K. Vvedenie v statisticheskuiu teoriiu raspoznavaniia obrazov [Introduction to statistical image recognition theory]. Moscow: Nauka, 1979, 367 p.

15. Huber P.J. Robust statistics: a review. Ann. Mah. Statist, 1972, vol. 43, pp.1041-1067.

16. Hampel F.R. A general gualitative definition of robustness. Ann. Math. Statist, 1971, vol. 42, no.6, pp.1887-896.

17. Huber P.J. Robust statistics procedures. Philadelphia: SIAM, 1977, 56 p.

18. Huber P.J. Robust statistics. N.Y.: Wiley, 308 p.

19. Tiku M.L., Balakrishan N.A. Robust test for testing the correlation coefficient. Commun. Statist. Simulu., 1986, 15 (4), pp.946-971.

20. Kharin Iu.S. Robastnost' v statisticheskom raspoznavanii obrazov [Robustness in statistical image recognition]. Minsk: Universitetskoe, 1992, 232 p.

21. Titarenko B.P., Kharin Iu.S., Stepanova M.D. Robastnoe otsenivanie: metody, algoritmy i programmy [Robust estimation: methods, algorithms and programs]. Moscow: Finansy i statistika, 1992, 256 p.

22. Khampel' F., Ronchetti E., Rausseu P. Robastnost' v statistike [Robustness in statistics]. Moscow: Mir, 1989, 512 p.

23. Andreiko S.S., Kalugin P.A., Shcherba V.Ia. Gazodinamicheskie iavleniia v kaliinykh rudnikakh: genezis, prognoz i upravlenie [Gas-dynamic phenomena in potash mines: genesis, prognosis and management]. Minsk: Vysshaia shkola, 2000, 355 p.

24. Andreiko S.S. Mekhanizm obrazovaniia ochagov gazodinamicheskikh iavlenii v solianom porodnom massive [Mechanism of the gas-dynamic phenomena centers' formation in salt rock mass]. Perm': Izd-vo Perm. gos. tekhn. un-ta, 2008, 196 p.

Просьба ссылаться на эту статью в русскоязычных источниках следующим образом:

Андрейко С.С. Разработка математической модели метода прогнозирования газодинамических явлений по геологическим данным для условий Верхнекамского месторождения калийных солей // Вестник Пермского национального исследовательского политехнического университета. Геология. Нефтегазовое и горное дело. - 2016. - Т.15, №21. - С.345-353. DOI: 10.15593/2224-9923/2016.21.6

Please cite this article in English as:

Andreiko S.S. Development of mathematical model of gas-dynamic phenomena forecasting method according to geological data in conditions of Verkhnekamskoie potash salt deposit. Bulletin of PNRPU. Geology. Oil & Gas Engineering & Mining, 2016, vol.15, no.21, рр.345-353. DOI: 10.15593/2224-9923/2016.21.6

i Надоели баннеры? Вы всегда можете отключить рекламу.