Научная статья на тему 'МОДЕЛЬ ОЦЕНКИ ВЛИЯНИЯ МЕТЕОРОЛОГИЧЕСКИХ ПАРАМЕТРОВ НА УРОВЕНЬ ПРИРОДНОЙ ПОЖАРНОЙ ОПАСНОСТИ'

МОДЕЛЬ ОЦЕНКИ ВЛИЯНИЯ МЕТЕОРОЛОГИЧЕСКИХ ПАРАМЕТРОВ НА УРОВЕНЬ ПРИРОДНОЙ ПОЖАРНОЙ ОПАСНОСТИ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
234
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛЕСНЫЕ ПОЖАРЫ / ПРИРОДНАЯ ПОЖАРНАЯ ОПАСНОСТЬ / МОДЕЛЬ ПРОГНОЗИРОВАНИЯ / ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ / МЕТЕОРОЛОГИЧЕСКИЕ ПАРАМЕТРЫ / FOREST FIRES / NATURAL FIRE HAZARD / FORECASTING MODEL / LOGISTIC REGRESSION / METEOROLOGICAL PARAMETERS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Мазаник Александр Иванович, Рыбаков Анатолий Валерьевич, Белоусов Роман Леонидович, Араштаев Афанасий Иванович

В статье предложен подход к построению модели оценки уровня природной пожарной опасности для малых территорий. В основу подхода положена модель логистической регрессии. Исходными данными для настройки параметров модели являются кумулятивные значения метеорологических параметров и данные о возникновении пожаров на территории Республики Татарстан за период 2007-2015 гг. Оценка качества модели проводилась на аналогичных данных за период 2016-2017 гг. Качество предложенного подхода проверялось на территориях площадью 15×27 км2, что соответствует 0,25∘ по широте и 0,25∘ по долготе. Предложенный подход позволил получить более адекватные оценки природной пожарной опасности по сравнению с комплексным показателем пожарной опасности Нестерова и другими показателями.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Мазаник Александр Иванович, Рыбаков Анатолий Валерьевич, Белоусов Роман Леонидович, Араштаев Афанасий Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODEL FOR ASSESSING THE INFLUENCE OF METEOROLOGICAL PARAMETERS ON THE NATURAL FIRE HAZARD LEVEL

The article proposes an approach to building a model for assessing the level of natural fire danger for small territories. The approach is based on a logistic regression model. The initial data for configuring the model parameters are cumulative values of meteorological parameters and data on the occurrence of fires on the territory of the Republic of Tatarstan for the period 2007-2015. The model quality was evaluated based on similar data for the period 2016-2017. The quality of the proposed approach was tested in areas of 15 × 27 𝑘𝑚2, which corresponds to 0.25∘ in latitude and 0.25∘ in longitude. The proposed approach made it possible to obtain more adequate estimates of the natural fire hazard compared to the Nesterov complex fire hazard indicator and other indicators.

Текст научной работы на тему «МОДЕЛЬ ОЦЕНКИ ВЛИЯНИЯ МЕТЕОРОЛОГИЧЕСКИХ ПАРАМЕТРОВ НА УРОВЕНЬ ПРИРОДНОЙ ПОЖАРНОЙ ОПАСНОСТИ»

УДК 504.05

МОДЕЛЬ ОЦЕНКИ ВЛИЯНИЯ МЕТЕОРОЛОГИЧЕСКИХ ПАРАМЕТРОВ НА УРОВЕНЬ ПРИРОДНОЙ ПОЖАРНОЙ ОПАСНОСТИ

А.И. Мазаник

доктор военных наук, профессор, главный научный сотрудник научно-исследовательского центра Академия гражданской защиты МЧС России Адрес: 141435, Московская обл., г.о. Химки, мкр. Новогорск E-mail: agz.u.sQyandex.ru

P.JI. Белоусов

кандидат технических наук, научный сотрудник научно-исследовательского отдела (по проблемам ГО и ЧС)

Академия гражданской защиты МЧС России Адрес: 141435, Московская обл., г.о. Химки, мкр. Новогорск E-mail: scilabQamchs.ru

A.B. Рыбаков

доктор технических наук, профессор, начальник научно-исследовательского центра Академия гражданской защиты МЧС России Адрес: 141435, Московская обл., г.о. Химки, мкр. Новогорск

E-mail: anatoll rubakovQmail.ru

А.И. Араштаев

заместитель начальника командно-инженерного факультета Академия гражданской защиты МЧС России Адрес: 141435, Московская обл., г.о. Химки, мкр. Новогорск E-mail: vfnshjjkQmail.ru

Аннотация. В статье предложен подход к построению модели оценки уровня природной пожарной опасности для малых территорий. В основу подхода положена модель логистической регрессии. Исходными данными для настройки параметров модели являются кумулятивные значения метеорологических параметров и данные о возникновении пожаров на территории Республики Татарстан за период 2007-2015 гг. Оценка качества модели проводилась на аналогичных данных за период 2016-2017 гг. Качество предложенного подхода проверялось на территориях площадью 15x27 км2, что соответствует 0,25° то широте и 0,25° по долготе. Предложенный подход позволил получить более адекватные оценки природной пожарной опасности по сравнению с комплексным показателем пожарной опасности Нестерова и другими показателями.

Ключевые слова: лесные пожары, природная пожарная опасность, модель прогнозирования, логистическая регрессия, метеорологические параметры.

Цитирование: Мазаник А.И., Рыбаков A.B., Белоусов Р.Л., Араштаев А.И. Модель оценки влияния метеорологических параметров на уровень природной пожарной опасности // Научные и образовательные проблемы гражданской защиты. 2020. № 2 (45). С. 12 - 24.

Введение

Экономический ущерб от лесных пожаров в России за последние годы составил почти 70 миллиардов рублей. По данным специалистов в период с 2016 по 2018 годы число пожаров в России выросло на 12% (с 10,2 тысяч до 11,4 тысяч). Пройденная огнем площадь возросла в три раза (с 2,7 миллиона гектаров до 8,5 миллиона гектаров) [1].

Эффективное проведение превентивных мероприятий по предупреждению природных пожаров невозможно без прогнозирования (предсказания) их возникновения и распространения.

В работе [2] авторы отмечают тот факт, что основной проблемой практического использования известных моделей прогнозиро-

вания природных пожаров является отсутствие карт растительных горючих материалов (далее — РГМ), в которых отражаются пирологические характеристики растительности. Все слои РГМ делятся на 7 групп, которые учитывают не только их местоположение в биогеоценозе, но и выполняемую ими функцию при пожаре. Также их можно разделить на три категории: 1) проводники горения, 2) поддерживающие горение, 3) задерживающие горение [3]. Таким образом, модели, наполнение которых на практике не обеспечено необходимыми данными, в том числе данными о пирологических характеристиках растительности, могут иметь лишь ограниченное применение или не иметь его вовсе.

Для прогнозирования возникновения природных пожаров в условиях отсутствия карт РГМ представляется целесообразным использование статистических методов прогнозирования и ретроспективной информации о пожарах в сходных природно-климатических условиях [2] или на определенной территории, например, на территории субъекта Российской Федерации или муниципального района. Эти методы могут быть дополнены метеорологическими данными, данными о хозяйственной деятельности человека, о транспортной инфраструктуре и др.

В основе Российской системы прогнозирования природных пожаров лежит комплексный показатель пожарной опасности Нестерова (далее — КПО), его использование определяет ГОСТ Р 22.1.09-99 «Мониторинг и прогнозирование лесных пожаров. Общие требования» [4]. В работе [5] авторами установлено, что для Центрального региона России значение КПО не является абсолютным предиктором. Одним из основных недостатков КПО является весьма грубая поправка на осадки [6]. Для преодоления некоторых недостатков КПО, связанных с учетом осадков, были предложены следующие показатели: ПВ1 (показатель влажности надпочвенного покрова), ПВ2 (показатель влажности лесной подстилки) и ПВГ (показатель влажности с учетом гигроскопичности) [6].

В настоящей работе предложен подход к оценке уровня природной пожарной опасности, основанный на построении модели логистической регрессии, где на вход модели поступают кумулятивные значения метеорологических параметров, а на выходе получается значение показателя природной пожарной опасности (далее — ППО) в интервале [0, 1]. Предложенный подход повышает точность оценки уровня ППО: чем выше значение показателя ППО, тем чаще происходят природные пожары.

Анализ существующих методик оценки ППО

1. Комплексный показатель пожарной опасности Нестерова

КПО Нестерова рассчитывается по следующей формуле [6]

КПО, = КПОг_1 ■ крс + и ■ (и - (1)

где КПОг — значение коэффициента в г-ый день наблюдений;

и — температура воздуха в г-й день наблюдений в интервале 12:00-15:00 часов, °С;

— температура точки росы в г-й день наблюдений в интервале 12:00-15:00 часов, °С;

Крс — коэффициент поправки на осадки в г-й день (равен 1, если в г-й день выпало менее 3 мм осадков, иначе равен 0).

Идея данного показателя заключается в том, чтобы оценить высыхание лесогорючих материалов с последнего дня, когда выпало более 3 мм осадков. Высыхание происходит тем быстрее, чем выше температура окружающей среды и чем больше разница между этой температурой и температурой точки росы.

КПО начинают рассчитывать с того дня, как на рассматриваемой территории окончательно сходит снежный покров. Полученное значение КПО используют для того, чтобы определить класс и степень пожарной опасности. Шкала пожарной опасности (таблица 1) имеет пять классов пожарной опасности. Для некоторых регионов границы значений КПО могут уточняться [7]. Это обусловлено тем, что шкала пожарной опасности может не в полной мере учитывать особенности отдельных регионов.

Таблица 1 — Шкала пожарной опасности по условиям погоды

Значение КПО Класс пожарной опасности Степень пожарной опасности

<300 I _

301-1000 II Малая

1001-4000 III Средняя

4001-10000 IV Высокая

>10000 V Чрезвычайная

2. Показатель влажности надпочвенного покрова (ПВ1)

где КрспВ1 — коэффициент поправки на осадки в г-й день. Значение крСПВ1 определяется в зависимости от количества осадков,

Показатель ПВ1 рассчитывается по формуле [6]

(2)

выпавшего с момента наблюдений в (г-1)-й день, в соответствии с таблицей 2.

ПВ1г = [ПВ1г_1 + и-1 ■ (и-1 - 1^-1) ■ кгоспВ1],

Таблица 2 — Соответствие среднесуточного количества осадков величине коэффициента поправок на осадки_

Осадки, мм <0,5 0,6-2 3-5 6-12 13-19 >19

СПВ1 г 1 0,8 0,4 0,2 0,1 0

3. Показатель влажности лесной подстилки (ПВ2)

где К'спв2 — коэффициент поправок на осадки в (г — 1)-ый день;

К'спв2 — коэффициент поправок на осадки в г-ый день. Коэффициент К"СПВ2 равен нулю в случае, если суммарное количество осадков г

Показатель ПВ2 рассчитывается по формуле [6]

(3)

более, и равен единице, когда их сумма менее 1,6 мм [8].

4- Показатель влажности с учетом гигроскопичности (ПВГ)

Показатель ПВГ рассчитывается по формуле [6]

ПВ2г — ПВ2г_1 ■ Кжпв2 + ti_l ■ (Ьг_1 ¿¿_1) ' ■^ocпв2,

ПВГ, — [ПВГг_1 + (и + 10) ■ (и —^ — 5)] ■ кгвг,

где К°спш — коэффициент поправки на гигроскопичность в г-ый день. Для расчета К°савг существуют две методики [9].

Представленные методики учитывают минимальное число метеорологических параметров, не учитывается влагосодержание в почве, влажность лесной подстилки, количество дней со дня последнего выпадения осадков и др. Предлагаемый в работе подход с использованием модели логистической регрессии позволяет улучшить качество оценки уровня природной пожарной опасности с использованием большего числа метеорологических параметров.

(4)

Исходные данные

В качестве исходных данных были взяты погодные условия на территории Республики Татарстан в период 2007-2017 гг. и данные о лесных пожарах. Погодные условия представляют собой значения метеорологических параметров за каждый день в узлах сетки с размером ячейки 0,25° по широте и 0,25° по долготе. Для Республики Татарстан такой ячейке соответствует участок территории размером 15x27 км.

На рисунке 1 показаны места возникновения природных пожаров на территории Республики Татарстан за период 2007-2017 гг.

Рисунок 1 Природные пожары на территории Республики Татарстан в период 2007 2017 гг.

Формальный вид исходных данных: А = {щ} — множество всех рассматриваемых участков территории;

Т = {и} — множество всех дней с 1 января 2007 года по 31 декабря 2017 года;

X = А х Т — декартово произведение множеств А и Т\

Р = (/ъ/2,..., 1т) — множество метеорологических параметров. К множеству метеорологических параметров относятся: температура воздуха, температура точки росы, влажность воздуха, количество осадков, облачность, атмосферное давление, влажность почвы, температура почвы, скорость ветра и

др;

Д (х^) — среднее значение к-го метеороло-

гического параметра на участке территории <ц в день ¿.у, где х^ € X. Значение Д(х^), где

х.

V

= ) при йг € А И ^ € Т,

вычисля-

ется как среднее арифметическое значение величины Д в четырёх точках (углах) участка территории (ячейки) в день

у(хц) — зависимая переменная, которая принимает значение 1 при возникновении природного пожара на участке территории а^ в день и значение 0 — в противном случае.

Исходные данные могут быть представлены в виде таблицы 3, где первые т столбцов представляют собой значения свободных переменных метеорологи чееких параметров Д, ¡2,..., ¡т, а,(т + 1)-й столбец представляет собой значение зависимой переменной у.

Таблица 3 Исходные данные

ХгЗ /1 /2 /т у

ХЦ /1(^11) ¡2(Хц) ¡т(Хц) У11

Х12 /1(^12) /2(^12) ¡т(х 12) У12

х1АЦТ | ЬШИТ |) /2ШЦТ |) /шШЦТ |) утт |

Здесь |A| ш |Т| — мощности множеств А и Т соответственно.

Постановка задачи

Пусть Н = {Ь1,к2,к3,к4:} — множество функций, соответствующих выражениям (1) (4): КПО, ПВ1, ПВ2 и ПВГ соответственно. При этом, Л : X ^ Д+. Здесь В+

множество действительных положительных чисел, включая пуль. Значениям функций Л^ соответствуют значения бинарной переменной у, которая принимает значение 1 при возникновении природного пожара (-ов) и значение 0 в противном случае.

Д.ля оценки деекринтивной (описательной) способности функции Нг применяется величина взаимной информации М[10].

Таким образом, формальная постановка задача имеет следующий вид. Необходимо разработать функцию д^ : X ^ [0,1] таким образом, чтобы

агдтах^енп{д}Му) — д, (5)

т. е. разработать (подобрать) такую функцию д, у которой значение взаимной информации с величиной у будет максимальным. При этом для лучшей интерпретации множество значений функции ограничено интервалом [0, 1].

Математическая модель Шаг 1. Фильтрация объектов множества А Не для каждого объекта х^ € X, где хгз — (аг,^з) при (ц € А и £^ € Т, имеет смысл говорить о природной пожарной опасности.

Во-первых, нецелесообразно рассматривать зимнее время года, когда лесные пожары практически не происходят из-за низких тем-

ператур и наличия снежного покрова. Будем рассматривать такие х^ € X, что после дня ^ на территории щ температура в течение суток положительна. Таким образом, рассматриваются промежутки времени с первого весеннего дня, когда температура воздуха стала положительной и не опускается ниже нуля до последнего осеннего дня этого же года, после которого начинаются заморозки.

Во-вторых, не все рассматриваемые территории А2 € А подвержены лесным пожарам. Не будем рассматривать территории, на которых за период 2007 2017 гг. не произошло ни одного лесного пожара.

Введенные ограничения позволяют получить подмножество X' С X.

Шаг 2. Разделение объектов подмножества X' На рисунке 2 представлены усредненные частоты возникновения пожаров в течение пожароопасного сезона. Анализ полученных частот позволяет сделать вывод о том, что в пожароопасный сезон наблюдается две «волны» пожарной опасности в лесах.

Рисунок 2 Распределение средних частот пожаров по дням года

Первая волна пожаров (более сильная) приходится на апрель-май, вторая (существенно слабее) на июль-август. К аналогичному выводу пришли авторы в [5]. В указанные промежутки времени в лесах происходят процессы, которые имеют различную природу. С

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

учетом наблюдаемой закономерности целесообразно строить математические модели природной пожарной опасности отдельно для весеннего периода и летнего периода.

Разделим множество X' следующим образом.

Пусть Хвесна — Ка^-) € X' : tj < 1 июня|, ^лето — X \ Хвесна.

Шаг 3. Формирование пространства признаков

Каждый из рассматриваемых коэффициентов природной пожарной опасности (КПО, ПВ1, ПВ2 и ПВГ) обладает кумулятивным, т. е. накопительным эффектом, при котором значения каждого метеорологического параметра суммируются. Это позволяет учитывать погодные условия за определенный промежуток в прошлом. Например, КПО представляет собой кумулятивную сумму произведения температуры воздуха на разность температур воздуха и точки росы, вычисляемую для отдельного пункта и конкретного времени [6]. Этот факт позволяет сделать вывод о том, что значения метеорологических параметров в рассматриваемый день малоинформативны для оценки уровня природной пожарной опасности [11].

Следовательно, для каждого х'^ € X', где х'^ — (щ,^)ири сц € Аж^- € Т, необходимо сформировать признаки кумулятивного характера, которые дают представление о погодных условиях па территории сц в дни, предшествующие

Сформируем из множества метеорологических параметров Р — (/1, ¡2,..., /т) множество кумулятивных признаков следующим образом. Пусть — среднее значение метеорологического параметра /г за к дней, предшествующих дню наблюдения, к — 1,60. Получившееся множество кумулятивных признаков обозначим Р'. Таким образом, исходное множество метеорологических параметров ^ — (Л, Ь,..., /т) увеличилось в 60 раз.

Шаг 4. Устранение мультиколлинеарности

Множество признаков Р' является избыточным: каждый признак в отдельности несет мало уникальной информации по отношению к остальным. Например, зная среднюю температуру за последние 30 дней и за последние 32 дня, можно с большой точностью «угадать» среднюю температуру за последний 31 день. Такой подход в формировании признаков приводит к следующим проблемам:

а) автокорреляция, обусловленная тем, что признаки с меньшим количеством дней содержатся в признаках с большим количеством

дней. Этот эффект может порождать автокорреляцию, что делает кумулятивные признаки одного метеорологического параметра зависимыми друг от друга;

б) мультиколлинеарность, основной причиной которой является как корреляция признаков одного метеорологического параметра между собой, так и корреляция признаков разных метеорологических параметров. Мультиколлинеарность признаков множества Р' может привести к неопределенности значений параметров разрабатываемой (подбираемой) функции д и неустойчивости их оценок. Неустойчивость выражается в увеличении дисперсии оценок. Для различных однородных выборок конкретные результаты оценки могут сильно различаться;

в) вычислительная сложность, выражающаяся в том, что количество вычислений растет нелинейно с увеличением количества признаков.

Для решения этих проблем целесообразно избавиться от тех признаков, которые сильно коррелируют с другими. С одной стороны, это позволит избавиться от мультиколлинеарности, с другой — уменьшить количество вычислений.

Для устранения мультиколлинеарности применяется У/^-критерий [12]. Пусть имеется таблица данных (вид таблицы 3), в которой т признаков и п наблюдений. Для каждого признака (столбца) ,] — 1,т, строится модель линейной регрессии [13] — а0 + а1 ■ /1+

+ «2 ■ /2 +-----+ а>]_1 ■ !]_1 + ■ /+1 +.. . <%т ■ /т

и вычисляется коэффициент линейной детерминации Гу.

Далее необходимо для каждого признака (столбца) найти величину

1

(1 - г3 )'

(6)

Величины Vj называют VIF (Variance Inflation Factor). Согласно V/F-критерию, если максимальное Vj не превышает 5 [12], то мультиколлинеарность признаков незначительна. В противном случае следует удалить признак, которому соответствует максимальное значение Vj, и повторить процедуру заново.

j

При практической реализации изложенного алгоритма устранения мультиколлинеарно-сти возникает следующая проблема: время работы (сложность) этого алгоритма растет пропорционально N2, где N — количество признаков. В нашем случае N = 72О (I F| = 12, |F'| = = 12 ■ 60 = 720), т. е. на первой итерации будет построена 720 моделей линейной регрессии, на второй итерации — 719, на третьей — 718 и т.д. При таком количестве признаков их отбор V/^-критерием становится непрактичным, т.к. его невозможно завершить в разумные сроки.

Для преодоления этой трудности целесообразно воспользоваться следующим приемом. Пусть ff — среднее значение метеорологического параметра /¿за к дней, предшествующих дню наблюдения, к = 1,60. Сначала будем производить отбор некореллирующих между собой признаков /f при фиксированном г, т. е. признаков для одного метеорологического параметра, при помощи следующего

итеративного алгоритма.

Пусть Si — множество отобранных признаков, к — количество «просмотренных» признаков. На первой итерации Sí = {//} и к = 1. Рассчитаем У1Р для ■ Если рассчитан-

ный У1Р менее 5, то добавляем в Si. По-

вторяем данную процедуру для всех к = 1, 59.

Объединяем все S¿ в множество И. Мощность множества И меньше ста, что позволяет провести отбор признаков обычным У1Р-критерием. Безусловно, что результаты работы такого алгоритма не тождественны результатам, которые бы получились при выполнении У/^-критерия на полном наборе признаков (Ы = 720).

Поскольку значения признаков могут существенно отличаться между Хвесна и Хлет0, представленный процесс устранения мульти-коллинеарности признаков был проведен независимо для летнего и весеннего периодов. Отобранные признаки представлены в таблице 4.

Таблица 4 — Отобранные признаки для весеннего и летнего периодов

Весенний период Летний период

Признак Количество дней усреднения признака Признак Количество дней усреднения признака

Влажность воздуха 1, 10 Влажность воздуха 1, 42

Облачность 1, 2, 7, 17, 60 Облачность 1,4

Температура воздуха 1, 7, 18, 56 Температура воздуха 1, 4, 15, 47

Температура точки росы 1, 7, 18, 56 Температура точки росы 1, 4, 15, 47

Количество осадков 1, 4, 25 Количество осадков 1, 2, 12, 33, 57

Мощность солнечного излучения 1,40 Мощность солнечного излучения 1

Шаг 5. Обучение модели логистической регрессии

На основе отобранных признаков может быть построено отображение (функция) д : X' ^ [0, 1], которая представляет собой модель логистической регрессии. Модель логистической регрессии каждому х'^ € X', х[] = (аг, ^) при сц € А и ^ € Т позволяет ставить в соответствие число в интерва-

ле [0, 1], характеризующее степень пожарной опасности на заданной территории в заданный день. Это число, в строгом смысле, не является вероятностью возникновения пожара(-ов), но его более высокие значения характеризуют более высокое значение вероятности возникновения пожара. Необходимо отметить, что КПО, ПВ1, ПВ2 и ПВГ работают как отображения Л : X' ^ К+.

При построении модели необходимо принять во внимание тот факт, что данные несбалансированы. Количество наблюдений, когда пожар(-ы) возникали, равно 2006, т. е. 1хц € X' : у(хг^) = 1| = 2006, и наоборот, когда пожар(-ы) не возникали 1хц € X'' : у(хгэ) — 0| — 790275. Таким образом, количество наблюдений одного класса в 400 раз больше, чем наблюдений другого. Для многих моделей учет несбалансированности данных представляет трудность, поскольку они в той или иной форме максимизируют точность предсказаний [14]. При сильно несбалансированных классах тривиальная модель д : X' ^ 0 даст точность предсказаний, близкую к 100 %. Очевидно, что практической пользы такая модель не имеет. Есть два спо-

соба разрешения данной проблемы:

а) искусственно сбалансировать классы, т.е. сделать объем выборки наблюдений, когда пожар(-ы) не возникали, равный объему выборки наблюдений, когда пожар(-ы) возникали;

б) для модели логистической регрессии существует способ взвесить обучающую выборку так, чтобы устранить несбалансированность классов [14].

В первом случаем уменьшится объем полезных данных и необходимо будет сохранить репрезентативность выборки. Поэтому воспользуемся вторым способом.

Модель обучения логистической регрессии имеет следующий вид

9(xij) =

1 + е-

(7)

-г = во + e1f1(x'ij) + Ö1/2 ) + ■ ■ ■ + Bmfm(x\1)

1

где ) — значение г-го признака из множества И (множество отобранных признаков) для объекта х'^ € X', где х'^ — (а^ ^) при а% € А и ^ € Т] вг — параметры модели.

где С — вес положительных экземпляров обучающей выборки, рассчитываемый по формуле

С — К € X' : у(х'г1) — 0|

К, €Х' :у(4) —1| 1 ]

Оценка качества полученной модели

Для подбора оптимальных параметров логистической регрессии, а также оптимальных параметров регуляризации были использованы подмножества Х'есш и Х^ет0, включающие данные только за 2007-2015 гг. Оценка качества полученной модели проводилась на данных, которые не использовались при настрой-

Значения параметров в^ подбираются в соответствии с методом максимального правдоподобия, при этом максимизируется функционал

(8)

ке параметров модели, т.е. за 2016-2017 гг.

Для оценки качества предсказаний использовалась мера взаимной информации, которая описывает количество информации, содержащееся в одной случайной величине относительно другой. Чем выше эта мера, тем лучше качество оценивания уровня природной пожарной опасности.

В таблице 5 представлены значения взаимной информации [15] между случайной величиной «Уровень природной пожарной опасности» (КПО, ПВ1, ПВ2, ПВГ и логистическая регрессия) и случайной величиной «Возникновение пожара(-ов)».

L(9) = ' у(х'и) ' 9в(x'n) + (1 - у(х'а)) ' (1 - 9в(xij))] ^ max,

Таблица 5 Результаты сравнения оценки уровня ППО но взаимной информации (для

Как для весеннего, так и для летнего периодов модель логистической регрессии имеет большее значение коэффициента взаимной информации. Можно предположить, что это свидетельствует о большей прогностической способности модели. Также необходимо отметить, что значение взаимной информации летом стабильно ниже, чем весной. Скорее всего, это объясняется тем, что летние пожары обусловлены не только действием метеорологических факторов, но и других: антропогенная нагрузка, лееораетительной формацией, географическими условиями [11]. Указанные факторы оказывают большее влияние в лет-

ний период, но они не включены в модель. Этим объясняется системное снижение значений взаимной информации.

Интерпретировать значения взаимной информации в таблице 5 можно следующим образом. Разделим данные, на которых проводилась оценка качества модели, на две группы: первую кшда пожары не возникали и вторую когда пожары возникали. Для каждой группы данных рассчитываются значения показателей (КПО, ПВ1, ПВ2, ПВГ и логистическая регрессия). Затем строится распределение показателя в группе данных без пожаров и в группе с пожарами. Таким образом, взаимная информация это то, насколько сильно отличается распределение показателя в группе, когда пожары не возникали от распределения в группе, когда пожары возникали. В действительности, такое определение взаимной информации будет строгим, если в качестве степени различия двух распределений взять расстояние Кульбака-Лейблера.

На рисунке 3 представлены указанные распределения для каждого из рассматриваемых показателей пожарной опасности на весеннем периоде.

непрерывных значений показателей)

Коэффициент Взаимная информация

Весна Лето

КПО 7,7 2,4

ПВ 1 10,0 3,7

ПВ 2 8,1 3,0

ПВ 3 7,3 3,5

Логическая регрессия 13,6 5,0

о»«

а)

Рисунок 3 Распределение показателей (синий цвет группа данных, где пожаров не было, красный цвет группа данных, где пожары были): а) КПО, б) логистическая регрессия,

в) ПВ1, г) ПВ2, д) ПВГ

С практической точки зрения абсолютные значения каждого из коэффициентов пожарной опасности не так полезны, как их отображения на дискретную шкалу степени пожарной опасности.

По аналогии с КПО (таблица 1) такая шкала может включать пять уровней ППО: «О» отсутствие опасности, «1» малая опасность, «2» средняя опасность, «3» высокая опасность, «4» чрезвычайная опасность.

Необходим единый подход получения дискретных значений всех показателей. Для дискретизации значений каждого показателя целесообразно использовать квантили (процен-

тили): 20 %, 40 %, 60 % и 80 %. Например, «20 % процентиль показателя ППО» означает, что найдется такое значение показателя ППО, для которого 20 % всех значений показателя будут ниже либо равным этому значению. Идея с квантилями (процентилями) состоит в том, что чем выше значение квантиля, т.е. чем выше значение показателя ППО, тем выше должна быть вероятность возникновения пожара(-ов).

Значения квантилей для каждого показателя пожарной опасности представлены в таблице 6.

Таблица 6 Квантили показателей пожарной опасности

Показатель Значения показателей ППО для разных значений квантилей

Весна Лето

20% 40% 60%. 80%. 20%. 40% 60%. 80%.

КПО 60 221 600 1422 156 458 1192 3679

ПВ1 64 243 567 1131 141 414 1118 2738

ПВ2 30 170 496 1202 105 317 875 2481

ПВГ 42 249 620 1286 78 331 1076 2841

Логиети чеекая регрессия 0,04 0,14 0,31 0,52 0,11 0,21 0,4 0,59

В таблице 7 представлены значения взаимной информации дискретных показателей ППО.

Таблица 7 Результаты сравнения оценки уровня ППО по взаимной информации (для дискретных значений показателей)

Взаимная

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Коэффициент информация, %

Весна Лето

КПО 8 1,8

ПВ1 8,4 2,7

ПВ2 7,9 2,3

ПВГ 8,2 2,6

Логиетичеекая 8 8 4 4

регрессия

Таким образом, после дискретизации показателей взаимная информация разработанного показателя также выше, чем у КПО, ПВ1, ПВ2 и ПВГ. Предложенный способ получения дискретных величин, когда каждый квантиль соответствует классу, не может претендовать на правильность разбиения абсолютных значений показателя по классам ППО, но такой

способ дает равные конкурентные возможности всем показателям. Задача «подгонки» значений показателей к уровню ППО требует дополнительного исследования.

На рисунке 4 представлена частота возникновения пожаров в зависимости от уровня природной пожарной опасности для каждого показателя. Здесь «0» отсутствие опасно...

Рисунок 4 Частота возникновения пожаров в зависимости от уровня природной пожарной опасности в весенний период

Анализ графика, представленного на рисунке 4, позволяет сделать следующие выводы. Для модели логистической регрессии (синий столбик) частота возникновения пожаров тем выше, чем выше уровень ППО. Из этого следует, что чем выше уровень ППО, тем выше вероятность возникновения пожаров. Такой вывод нельзя сделать, например, для КПО: для уровня «4» частота возникновения пожаров снижается. Это может быть обусловлено тем, что уровень «4» ППО наблюдается реже, чем уровень «3». Вопрос оценки вероятности возникновения пожара в зависимости от уровня ППО требует проведения отдельного исследования.

Выводы

В настоящей статье представлен метод оценки уровня природной пожарной опасности по погодным условиям на малых территориях, размер которых, в частности, для Рес-

х2

соответствует 0,25° по широте и 0,25° по долготе. В основу метода положена модель логистической регрессии, в которой учитывается большее количество метеорологических параметров, чем в существующих моделях, базирующихся на КПО. Оценка качества модели проводилась по значению взаимной информации между непрерывными случайными величинами, характеризующими значения показателей ППО (КПО, ПВ1, ПВ2, ПВГ и логистическая регрессия), с одной стороны, и дискретной бинарной случайной величиной «Возникновение пожаров», с другой стороны. На данных для Республики Татарстан разработанная модель показывает более высокое качество оценки уровня ППО.

Дальнейшие исследования будут направлены на оценку влияния антропогенной нагрузки и других факторов на уровень ППО, а также на оценку вероятности возникновения пожаров в зависимости от уровня ППО.

Литература

1. В Счетной палате РФ оценили ущерб от лесных пожаров. [Электронный ресурс] — Режим доступа: https://tvzvezda.ru/news/vstrane_i_mire/content/201983327-Y4Vjp.html (дата обращения: 01.04.2020).

2. Доррер Г. А., Якимов С. П., Васильев С. А. Прогнозирование динамики распространения лесных пожаров в России // Научно-аналитический журнал «Вестник Санкт-Петербургского университета Государственной противопожарной службы МЧС России». 2010. № 4. URL: https: / / cyberleninka.ru / article/п/prognozirovanie-dinamiki-rasprostraneniya-lesnyh-pozharov-v-rossii (дата обращения: 01.04.2020).

3. A.B. Волокитина, Т.М. Софронова. Картографирование растительных горючих материалов. [Электронный ресурс] — Режим доступа: http://sibran.ru/upload/iblock/702/702c44a8d836elbf5721bad4b230a932.pdf (дата обращения: 01.04.2020).

4. ГОСТ Р 22.1.09-99. Государственный стандарт Российской Федерации. Безопасность в чрезвычайных ситуациях. Мониторинг и прогнозирование лесных пожаров. Общие требования. Москва: ГОССТАНДАРТ РОССИИ. 1999. 9 с. [Электронный ресурс] — Режим доступа: https://meganorm.ru/Data/85/8512.pdf (дата обращения: 01.04.2020).

5. Зейнетдинова О.Г., Шарабанова ILIO.. Шипилов P.M., Данилов П.В. Особенности прогнозирования пожарной опасности лесных массивов центральной части России / / Современные проблемы гражданской защиты. 2018. № 2 (27). [Электронный ресурс] — Режим доступа: https://cyberleninka.ru/article/п/osobennosti-prognozirovaniya-pozharnoy-opasnosti-lesnyh-massivov-tsentralnoy-chasti-rossii (дата обращения: 01.04.2020).

6. И.М. Губенко, К.Г. Рубинштейн. Сравнительный анализ методов расчёта индексов пожарной опасности. [Электронный ресурс] — Режим доступа: http://method.meteorf.ru/publ/tr/tr347/gubenko.pdf (дата обращения: 01.04.2020).

7. Среднесрочный прогноз степени пожарной опасности в лесах по метеорологическим условиям. [Электронный ресурс] — Режим доступа: http://method.meteorf.ru/danger/fire2/fire2.html (дата обращения: 01.04.2020).

8. Долгов A.A., Сумина E.H., Цомаева Д.С. Методология оценки лесопожарных рисков // Материалы научно-практической конференции. М.: Московский государственный университет природообу-стройства. 2008. С. 12-21.

9. Софропова Т.М., Волокитипа A.B., Софропов М.А. Оценка пожарной опасности по условиям погоды с использованием метеопрогнозов. М.: Институт леса. СО РАН. 2015. С. 31-32.

10. Габидулин Э.М., Пилипчук Н.И. Лекции по теории информации. МФТИ. 2007. 214 с.

11. Белоусов Р.Л., Араштаев А.И., Вологдин В.А., Трофлянин В.В. Анализ факторов природной пожарной опасности лесной территории Республики Татарстан / / Научные и образовательные проблемы гражданской защиты. 2018. № 1 (36). С. 69-81.

12. Шитиков В.К., Мастицкий С.Э. Статистический анализ и визуализация данных. М.: ДМК Пресс. 2015. 496 с.

13. Магнус Я.Р., Катышев П.К., Пересецкий A.A. Эконометрика. Начальный курс: Учеб. 6-е изд., пе-рераб. и доп. М.: Дело. 2004. 576 с.

14. Воронцов К.В. Математические методы обучения по прецедентам (теория обучения машин). [Электронный ресурс] — Режим доступа: http://www.machinelearning.ru/wiki/images/6/6d/Voron-ML-l.pdf (дата обращения: 01.04.2020).

15. Ross ВС (2014) Mutual Information between Discrete and Continuous Data Sets. PLoS ONE 9(2): e87357. [Электронный ресурс] — Режим доступа: https://doi.org/10.1371/journal.pone.0087357 (дата обращения: 01.04.2020).

MODEL FOR ASSESSING THE INFLUENCE OF METEOROLOGICAL PARAMETERS ON THE NATURAL FIRE HAZARD LEVEL

Alexander MAZANIK

doctor of military sciences, professor,

chief Researcher, Research Center

Civil Defence Academy EMERCOM of Russia

Address: 141435, Moscow region, city Khimki,

md. Novogorsk

E-mail: agz.u.sQyandex.ru

Anatoly RYBAKOV

Doctor of Technical Sciences, Professor, Head of Research Center Civil Defence Academy EMERCOM of Russia Address: 141435, Moscow Region, Khimki, md. Novogorsk

E-mail: anatoll rubakovQmail.ru

Roman BELOUSOV

Candidate of Technical Sciences,

Researcher research department

(on issues of civil defense and emergency)

Civil Defence Academy EMERCOM of Russia

Address: 141435, Moscow Region, Khimki,

md. Novogorsk

E-mail: scilabQamchs.ru

Afanasiy ARASHTAEV

deputy head of the faculty of engineering Civil Defence Academy EMERCOM of Russia Address: 141435, Moscow Region, Khimki, md. Novogorsk E-mail: vfnshjjkQmail.ru

Abstract. The article proposes an approach to building a model for assessing the level of natural fire danger for small territories. The approach is based on a logistic regression model. The initial data for configuring the model parameters are cumulative values of meteorological parameters and data on the occurrence of fires on the territory of the Republic of Tatarstan for the period 2007-2015. The model quality was evaluated based on similar data for the period 2016-2017. The quality of the proposed approach was tested in areas of 15 x 27 km2, which corresponds to 0.25° in latitude and 0.25° in longitude. The proposed approach made it possible to obtain more adequate estimates of the natural fire hazard compared to the Nesterov complex fire hazard indicator and other indicators. Keywords: forest fires, natural fire hazard, forecasting model, logistic regression, meteorological parameters.

Citation: Mazanik A.I., Rybakov A.V., Belousov R.L., Arashtaev A.I. Model for assessing the impact of meteorological parameters on the level of natural fire hazards // Scientific and educational problems of civil protection. 2020. No. 2 (45). p. 12 - 24.

References

1. The accounting chamber of the Russian Federation assessed the damage from forest fires. [Electronic resource] — access Mode: https://tvzvezda.ru/news/vstrane_i_mire/content/201983327-Y4Vjp.html (accessed: 01.04.2020).

2. Dorrer G.A., Yakimov S.P., Vasiliev S.A. Forecasting the dynamics of forest fire propagation in Russia // Scientific and analytical journal «Bulletin of the Saint Petersburg University of The state fire service of the EMERCOM of Russia». 2010. N4. URL: https://cyberleninka.ru/article/ii/prognozirovanie-dinamiki-rasprostraneniya-lesnyh-pozharov-v-rossii (accessed: 01.04.2020).

3. A.V. Volokitina, T.M. Sofronova. Mapping of plant fuels. [Electronic resource] — access Mode: http://sibran.ru/upload/iblock/702/702c44a8d836elbf5721bad4b230a932.pdf (accessed: 01.04.2020).

4. GOST R 22.1.09-99. State standard of the Russian Federation. Safety in emergency situations. Monitoring and forecasting of forest fires. General requirements. Moscow: GOSSTANDART of RUSSIA. 1999. 9 p. [Electronic resource] — access Mode: https://meganorm.ru/Data/85/8512.pdf (accessed: 01.04.2020).

5. Zainetdinova O.G., Sharabanova I.Yu., Shipilov R.M., Danilov P.V. Features of fire hazard forecasting of forests in the Central part of Russia // Modern problems of civil protection. 2018. № 2 (27). [Electronic resource] — access Mode: https://cyberleninka.ru/article/n/osobennosti-prognozirovaniya-pozharnoy-opasnosti-lesnyh-massivov-tsentralnoy-chasti-rossii (accessed: 01.04.2020).

6. I.M. Gubenko, K.G. Rubinstein. Comparative analysis of methods for calculating fire hazard indices. [Electronic resource] — access Mode: http://method.meteorf.ru/publ/tr/tr347/gubenko.pdf (accessed: 01.04.2020).

7. medium-Term forecast of the degree of fire danger in forests based on meteorological conditions. [Electronic resource] — access Mode: http://method.meteorf.ru/danger/fire2/fire2.html (accessed: 01.04.2020).

8. Dolgov A.A., Sumina E.N., Tsomaeva D.S. Methodology for assessing forest fire risks // Materials of scientific-practical conference. M.: Moscow state University of environmental engineering. 2008. P. 12-21.

9. Sofronova T.M., Volokitina A.V., Sofronov M. A. Assessment of fire hazard by weather conditions using weather forecasts. Moscow: forest Institute. SB RAS, 2015, Pp. 31-32.

10. Gabidulin E.M., Pilipchuk N.I. Lectures on information theory. MIPT. 2007. 214 p.

11. Belousov R.L., Arashtaev A.I., Vologdin V.A., Troflyanin V.V. Analysis of natural fire hazard factors in the forest territory of the Republic of Tatarstan // Scientific and educational problems of civil protection. 2018. No. 1 (36). Pp. 69-81.

12. Shitikov V.K., Mastitsky S.E. Statistical analysis and data visualization. Moscow: DMK Press. 2015. 496 p.

13. Magnus Ya.R., Katyshev P.K., Peresetsky A. A. Econometrica. Initial course: 6th ed., pererab. and add. M.: Delo. 2004. 576 p.

14. Vorontsov K.V. Mathematical methods of teaching by precedents (theory of machine learning). [Electronic resource] — access Mode: http://www.machinelearning.rU/wiki/images/6/6d/Voron-ML-l.pdf (accessed: 01.04.2020).

15. Ross ВС (2014) Mutual Information between Discrete and Continuous Data Sets. PLoS ONE 9(2): e87357. [Электронный ресурс] — Mode of access: https://doi.org/10.1371/journal.pone.0087357 (date accessed: 01.04.2020).

i Надоели баннеры? Вы всегда можете отключить рекламу.