Научная статья на тему 'АНАЛИЗ ДАННЫХ О ЛЕСНЫХ ПОЖАРАХ В РЕСПУБЛИКЕ КОМИ С ПОМОЩЬЮ EXCEL И PYTHON'

АНАЛИЗ ДАННЫХ О ЛЕСНЫХ ПОЖАРАХ В РЕСПУБЛИКЕ КОМИ С ПОМОЩЬЮ EXCEL И PYTHON Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
28
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
анализ данных / Python / кластеризация k-means / кластеризация DBSCAN / лесные пожары / data analysis / Python / k-means clustering / DBSCAN clustering / forest fires

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Бабикова Надежда Николаевна, Котелина Надежда Олеговна, Тентюков Фёдор Николаевич

В статье представлены результаты анализа данных о лесных пожарах в Республике Коми за 2010–2023 годы. Исследование проводилось при помощи табличного процессора Excel, библиотек Python: Scikit-learn, Pandas, Numpy, Openpyxl, Folium. Исследованы пространственно-временные особенности распределения пожаров по различным сочетаниям при знаков: количество и площадь пожаров по месяцам и годам, средняя площадь пожара по лесничеству, причина пожара, уязвимость к пожарам, плотность пожаров в разрезе 32-х лесничеств республики. Для выявления лесничеств со схожими характеристиками использовался метод кластеризации k-means. Для определения зон с высокой плотностью пожаров, вызванных грозами, использовался метод пространственной кластеризации DBSCAN. На основе проведенного исследования разработаны лабораторные работы, которые используются в процессе обучения студентов на правления "Прикладная информатика" по дисциплинам "Интеллектуальный анализ данных", "Эконометрика: многомерный анализ данных"

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Бабикова Надежда Николаевна, Котелина Надежда Олеговна, Тентюков Фёдор Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of data on forest fires in the Komi Republic using Excel and Python

The article presents the results of data analysis on forest fires in the Komi Republic for 2010–2023. The study was carried out using the Excel spreadsheet processor and Python libraries: Scikit-learn, Pandas, Numpy, Openpyxl, Folium. The spatiotemporal features of the distribution of fires according to various combinations of characteristics were studied: number and area of fires by month and year, average area of fire in the forest district, cause of the f ire, vulnerability to fires, density of fires in the context of 32 forest districts of the republic. To identify forest districts with similar characteristics, the k-means clustering method was used. The DBSCAN spatial clustering method was used to identify areas with a high density of fires caused by thunderstorms. Based on the research, laboratory works has been developed. Laboratory works are used in the process of training students of “Applied Informatics” department in the disciplines “Data Mining” and “Econometrics: Multidimensional Data Analysis”.

Текст научной работы на тему «АНАЛИЗ ДАННЫХ О ЛЕСНЫХ ПОЖАРАХ В РЕСПУБЛИКЕ КОМИ С ПОМОЩЬЮ EXCEL И PYTHON»

ИНФОРМАТИКА

INFORMATICS

Вестник Сыктывкарского университета.

Серия 1: Математика. Механика. Информатика. 2023.

Выпуск 4 (49)

Bulletin of Syktyvkar University.

Series 1: Mathematics. Mechanics. Informatics. 2023; 4 (49)

Научная статья УДК 004.021,630.431

https://doi.org/10.34130/1992-2752_2023_4_29

АНАЛИЗ ДАННЫХ О ЛЕСНЫХ ПОЖАРАХ В РЕСПУБЛИКЕ КОМИ С ПОМОЩЬЮ EXCEL

И PYTHON

Надежда Николаевна Бабикова, Надежда Олеговна Котелина, Фёдор Николаевич Тентюков

Сыктывкарский государственный университет им. Питирима Сорокина, [email protected]

Аннотация. В статье представлены результаты анализа данных о лесных пожарах в Республике Коми за 2010-2023 годы. Исследование проводилось при помощи табличного процессора Excel, библиотек Python: Scikit-learn, Pandas, Numpy, Openpyxl, Folium. Исследованы пространственно-временные особенности распределения пожаров по различным сочетаниям признаков: количество и площадь пожаров по месяцам и годам, средняя площадь пожара по лесничеству, причина пожара, уязвимость к пожарам, плотность пожаров в разрезе 32-х лесничеств республики. Для выявления лесничеств со схожими характеристиками использовался метод кластеризации k-means. Для определения зон с высокой плотностью пожаров, вызванных грозами, использовался метод пространственной кластеризации DBSCAN. На основе проведенного исследования разработаны лабораторные

© Бабикова Н. Н., Котелина Н. О., Тентюков Ф. Н., 2023.

работы, которые используются в процессе обучения студентов направления «Прикладная информатика» по дисциплинам «Интеллектуальный анализ данных», «Эконометрика: многомерный анализ данных».

Ключевые слова: анализ данных, Python, кластеризация k-means, кластеризация DBSCAN, лесные пожары

Для цитирования: Бабикова Н. Н., Котелина Н. О., Тентюков Ф. Н. Анализ данных о лесных пожарах в Республике Коми с помощью Excel и Python // Вестник Сыктывкарского университета. Сер. 1: Математика. Механика. Информатика. 2023. Вып. 4 (49). C. 29-46. https://doi.org/10.34130/1992-2752_2023_4_29

Article

Analysis of data on forest fires in the Komi Republic using Excel

and Python

Nadezhda N. Babikova, Nadezhda O. Kotelina, Fyodor N. Tentyukov

Pitirim Sorokin Syktyvkar State University, [email protected]

Abstract. The article presents the results of data analysis on forest fires in the Komi Republic for 2010-2023. The study was carried out using the Excel spreadsheet processor and Python libraries: Scikit-learn, Pandas, Numpy, Openpyxl, Folium. The spatiotemporal features of the distribution of fires according to various combinations of characteristics were studied: number and area of fires by month and year, average area of fire in the forest district, cause of the fire, vulnerability to fires, density of fires in the context of 32 forest districts of the republic. To identify forest districts with similar characteristics, the k-means clustering method was used. The DBSCAN spatial clustering method was used to identify areas with a high density of fires caused by thunderstorms. Based on the research, laboratory works has been developed. Laboratory works are used in the process of training students of "Applied Informatics" department in the disciplines "Data Mining" and "Econometrics: Multidimensional Data Analysis".

Keywords: data analysis, Python, k-means clustering, DBSCAN clustering, forest fires

For citation: Babikova N. N., Kotelina N. O.,

Tentyukov F. N. Analysis of data on forest fires in the Komi Republic using Excel and Python. Vestnik Syktyvkarskogo universiteta. Seriya 1: Matematika. Mekhanika. Informatika [Bulletin of Syktyvkar University, Series 1: Mathematics. Mechanics. Informatics], 2023, no 4 (49), pp. 29-46. (In Russ.) https://doi.org/10.34130/1992-2752_2023_4_29

1. Введение

Государственное бюджетное учреждение Республики Коми «Территориальный фонд информации Республики Коми» (ГБУ РК «ТФИ РК») является региональным оператором инфраструктуры пространственных данных Республики Коми, держателем картографического фонда и государственных геоинформационных ресурсов автоматизированной геоинформационной кадастровой системы Республики Коми. Одним из проектов ГБУ РК «ТФИ РК» является отраслевая геоинформационная система регионального значения - платформа «Атлас», которая обеспечивает хранение, поиск, визуализацию, обработку и анализ пространственных данных на основе геоинформационных и телекоммуникационных технологий. В состав платформы «Атлас» входит информационно-аналитическая система «Лесные пожары». ГБУ РК «ТФИ РК» предоставил Сыктывкарскому государственному университету описание API к ИАС «Лесные пожары» для использования в учебном процессе и научно-исследовательской работе.

Лесные пожары причиняют существенный ущерб окружающей среде и народному хозяйству. На количество и площадь лесных пожаров влияет множество факторов: характер и структура растительного покрова, геоморфологические условия, густота гидрологической и дорожной сети, плотность населения, погодно-климатические условия, качество систем мониторинга и тушения пожаров. Сочетание факторов индивидуально для каждого региона. Выявление региональных особенностей динамики лесных пожаров позволяет разрабатывать более эффективные противопожарные мероприятия [1; 2].

В статье представлены результаты анализа пространственно-временных особенностей динамики лесных пожаров на территории Республики Коми с помощью табличного процессора Excel и библиотек языка Python.

2. Материалы и методы

Анализ динамики лесных пожаров Республики Коми проведен на основе данных ИАС «Лесные пожары» за 2010-2023 годы [3]. Данные были извлечены с помощью библиотеки Requests для выполнения HTTP-запросов на языке Python и сохранены в файле Excel.

В данном исследовании использованы показатели: id пожара (целое число), широта (WGS-84, вещественное число), долгота (WGS-84, вещественное число), дата обнаружения (строка в формате «DD.MM.YYYY»), причина возникновения пожара (строка), метод обнаружения (строка), площадь пожара в га (вещественное число), класс плотности населения (целое число от 0 до 4), название лесничества (строка), площадь лесничества в га (вещественное число). Были также рассчитаны дополнительные показатели: дата обнаружения пожара переведена в формат даты, месяц обнаружения (целое число), год обнаружения (целое число), уязвимость лесничества к пожарам (отношение площади пожаров к площади лесничества), плотность пожаров для лесничества (отношение количества пожаров к площади лесничества). Уязвимость к пожарам и плотность пожаров были рассчитаны на 100 га для повышения наглядности, так как без этого значения близки к 0.

В сформированном наборе данных показатель «класс плотности населения» содержал три пропуска. Они были заполнены методом ближайшего соседа: проставлено значение показателя ближайшего по географическим координатам пожара.

Для выявления лесничеств со схожими характеристиками использовался метод кластеризации k-means [4]. Для определения зон с высокой плотностью пожаров, вызванных грозами, — метод пространственной кластеризации DBSCAN [5].

Исследование проводилось при помощи табличного процессора Excel, библиотек Python Pandas, Scikit-learn, Numpy, Openpyxl, Matplotlib и Folium.

3. Результаты и обсуждение

За 2010-2023 годы в Республике Коми произошло 3553 пожара общей площадью 190671 га, средняя площадь пожара составила 54 га (рис. 1). Пики количества пожаров приходятся на 2010, 2011, 2013 и 2022 годы. Это объясняется в первую очередь погодными условиями: жарким летом с незначительным количеством осадков.

еоо

500

400

300

200

юо

70000

60000

50000

400 00 зоо оо 20000

10000

2010 20)1 2012 2013 2014 2015 201« 20)7 2013 2019 2020 2021 2022 2023 кол ичество # площэдь

Рис. 1. Количество и площадь лесных пожаров в Республике Коми по годам

Между количеством пожаров и площадью пожаров нет прямой зависимости. Распределение пожаров по площади очень неравномерное: на 10 % от числа самых крупных пожаров приходится около 88 % общей площади пожаров (рис. 2).

Рис. 2. Кривая Лоренца, характеризующая распределение площади пожаров

За редким исключением, пожары в Республике Коми происходят с мая по сентябрь. Чаще всего пики количества пожаров и общей площади пожаров приходятся на июль, но в жаркие 2010, 2013 и 2022 годы максимальные площади пожаров пришлись на август. В целом за 20102023 годы больше всего пожаров произошло в июле — 48 %, на июль приходится и максимальная доля площади пожаров — 51,3 % (рис. 3).

Рис. 3. Распределение количества и площади пожаров по месяцам

В Республике Коми действуют 32 лесничества (табл. 1). Жирным шрифтом в таблице выделены значения, которые относятся к первым 15 % наибольших значений в каждом столбце (площадь лесничества не рассматривается).

Таблица 1

Показатели лесничеств

Лесничество Площадь пожаров Площадь лесничества Уязвимость на 100 га Количество пожаров Плотность пожаров на 100 га Средняя площадь пожара

1 2 3 4 5 6 7

Айкинское 813,9 390350 0,2085 42 0,010760 19,38

Вуктыльское 2547,2 1308375 0,1947 79 0,006038 32,24

Ёртомское 6840,4 1109374 0,6166 110 0,009916 62,19

Железнодорожное 7583,5 1449543 0,5232 205 0,014142 36,99

Ижемское 10255,4 1754321 0,5846 168 0,009576 61,04

Каджеромское 10699,0 1295425 0,8259 132 0,010190 81,05

Кажимское 943,1 408776 0,2307 49 0,011987 19,25

Койгородское 464,3 620625 0,0748 67 0,010796 6,93

Комсомольское 3876,7 1134176 0,3418 138 0,012167 28,09

Корткеросское 345,8 475915 0,0727 76 0,015969 4,55

Летское 74,3 434432 0,0171 8 0,001841 9,29

Локчимское 1935,1 405668 0,4770 76 0,018735 25,46

Междуреченское 19221,4 958415 2,0055 106 0,011060 181,33

Окончание табл. 1

1 2 3 4 5 6 7

Мещурское 17729,0 1162197 1,5255 108 0,009293 164,16

Печоро-Илычское 1433,6 1179556 0,1215 87 0,007376 16,48

Печорское 4622,7 4256779 0,1086 111 0,002608 41,65

Помоздинское 456,0 680942 0,0670 58 0,008518 7,86

Прилузское 948,2 810252 0,1170 64 0,007899 14,82

Пруптское 3249,5 483075 0,6727 87 0,018010 37,35

Сосногорское 14803,2 1618531 0,9146 241 0,014890 61,42

Сторожевское 360,4 835940 0,0431 80 0,009570 4,51

Сыктывдинское 274,2 478891 0,0573 59 0,012320 4,65

Сыктывкарское 630,0 195628 0,3221 117 0,059807 5,38

Сысольское 149,4 579101 0,0258 31 0,005353 4,82

Троицко-Печорское 2219,4 951119 0,2333 219 0,023026 10,13

Удорское 35660,2 1475043 2,4176 214 0,014508 166,64

Усинское 6759,2 2990489 0,2260 155 0,005183 43,61

Усть-Куломское 327,3 426848 0,0767 157 0,036781 2,08

Усть-Немское 3534,0 1001218 0,3530 155 0,015481 22,80

Усть-Цилемское 21767,2 4037099 0,5392 151 0,003740 144,15

Ухтинское 8509,1 1280133 0,6647 160 0,012499 53,18

Чернамское 45,4 83587 0,0544 23 0,027516 1,98

Абсолютным лидером по высоким показателям является Удорское лесничество, только плотность пожаров в лесничестве на среднем уровне. Лидером по низким показателям является Летское лесничество: за 14 лет в нем произошло всего восемь пожаров.

Для выявления лесничеств, схожих по своим характеристикам, применялась кластеризация методом k-means с помощью библиотеки Scikit-learn.

Разделение лесничеств на три кластера по площади пожаров, числу пожаров, средней площади пожара (листинг 1) представлено на рис. 4. Для визуализации результатов кластеризации построена интерактивная карта с помощью библиотеки Folium (рис. 5).

Центр кластера — это среднее арифметическое значений показателей всех лесничеств, вошедших в кластер. Кластер с центром (23593,9; 145; 164,1) состоит из четырех лесничеств на северо-западе республики, отмечен на карте вертикальной штриховкой. Эти лесничества характеризуются большой площадью пожаров, средним количеством пожаров, большой средней площадью пожара. Кластер с центром (6669,8; 163; 42,0) состоит из 13 лесничеств, отмечен на карте диагональной штри-

ховкой. Эти лесничества характеризуются средней площадью пожаров, большим количеством пожаров, умеренной средней площадью пожара. Кластер с центром (918,0; 63; 13,4) состоит из 15 лесничеств на юге республики, отмечен на карте горизонтальной штриховкой. Эти лесничества характеризуются относительно низкими показателями.

Листинг 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Кластеризация лесничеств при помощи алгоритма k-means

# импорт библиотек

from sklearn.cluster import KMeans

import numpy as np

from openpyxl import load_workbook

import matplotlib.pyplot as plt

import seaborn as sns; sns.set()

from mpl_toolkits import mplot3d

plt.style.use('seaborn-whitegrid')

# загружаем файл Excel

wb = load_workbook(filename='tab1.xlsx') sheet = wb.worksheets[0]

data = np.array([row for row in sheet.iter_rows(min_row=1, max_row= 32, min_col=2, max_col= 4, values_only=True)], dtype=np.float32)

# нормализуем данные

from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()

lesn = scaler.fit_transform(data)

# кластеризуем

km = KMeans(n_clusters=3,init = 'random',n_init=5,

max_iter = 15,random_state=21) res = km.fit(lesn) centers = km.cluster_centers_

# записываем номера кластеров в массив res = np.array(res.labels_)

# отображаем на данные на графике ax = plt.axes(projection='3d')

ax.scatter3D(data[:,0], data[:,1], data[:,2], alpha=1.,

s=25*res+15, c=res)

plt.show()

Окончание листинга 1

# преобразовываем центры кластеров в исходный масштаб

c = centers*(np.max(data,axis=0)-np.min(data,axis=0))+\

np.min(data,axis=0) print(res) print(c)

# сохраняем массив с номерами кластеров for i in range(32):

sheet.cell(i+1, 7, value=res[i]) wb.save('tabl.xlsx')

Рис. 4. Кластеризация лесничеств по площади пожаров, количеству пожаров и средней площади пожара

Рис. 5. Карта Республики Коми с лесничествами, разделенными на три кластера по площади пожаров, количеству пожаров и средней площади пожара

На рисунках 6 и 7 представлено разделение лесничеств на три кластера по уязвимости к пожарам и плотности пожаров, т. е. с учетом площади лесничеств. Уязвимость находится в диапазоне от 0,0171 до 2,4176, плотность — от 0,00184 до 0,05981. Большинство лесничеств попадает в кластер (горизонтальная штриховка) с центром (0,3196; 0,0107). Три лесничества — Междуреченское, Мещурское и Удорское — образуют кластер (вертикальная штриховка) с центром (1,9828; 0,0116): при сравнимой плотности пожаров уязвимость к пожарам этих лесничеств значительно выше. Три лесничества — Сыктывкарское, Усть-Куломское и Чернамское - характеризуются высокой плотностью пожаров и образуют кластер (диагональная штриховка) с центром (0,1510; 0,0414).

Можно сказать, что с точки зрения уязвимости и плотности шесть лесничеств находятся в несколько более сложной ситуации, чем остальные.

Рис. 6. Кластеризация лесничеств по уязвимости к пожарам и плотности пожаров

Рис. 7. Карта Республики Коми с лесничествами, разделенными на три кластера по уязвимости к пожарам и плотности пожаров

За период 2010-2023 годов причиной 49 % лесных пожаров в Республике Коми являлись грозы, 27 % пожаров случилось по вине местного населения, причины возникновения 22 % пожаров не были выявлены, 2 % пожаров произошли по прочим причинам.

Начиная с 2016 года причины всех пожаров установлены, далее анализ причин пожаров произведен за период 2016-2023 годов. Грозы стали причиной 65,5 % пожаров, по вине местного населения случилось 33,7 % пожаров, 0,8 % пожаров произошли по иным причинам. Площадь «грозовых» пожаров составила 95,8 % от общей площади пожаров. Средняя площадь пожара, вызванного грозами, составляет 86 га. А средняя площадь пожара, произошедшего по вине людей, в 11,8 раз меньше — 7,3 га.

Разделение лесничеств на три кластера по доле «грозовых» пожаров в общем количестве пожаров по лесничеству и разделение лесничеств на три кластера по доле площади, пройденной «грозовыми» пожарами, в общей площади пожаров по лесничеству представлено в табл. 2. В 12 лесничествах в общей площади пожаров с 2016 по 2023 год более 95 % приходится на пожары, вызванные грозами. В двух лесничествах — Летском и Чернамском — за этот период не произошло ни одного «грозового» пожара.

Таблица 2

Кластеризация лесничеств по доле пожаров, вызванных грозами

Кластеры по доле количества пожаров Кластеры по площади пожаров

Лесничество Доля Центр кластера Лесничество Доля Центр кластера

Летское 0,000 Летское 0,000

Чернамское 0,000 Чернамское 0,000

Сыктывкарское 0,059 Сыктывкарское 0,002 0,068

Усть-Куломское 0,127 0,148 Сторожевское 0,083

Айкинское 0,154 Айкинское 0,096

Сыктывдинское 0,235 Усть-Куломское 0,226

Железнодорожное 0,273 Пруптское 0,431

Корткеросское 0,333 Помоздинское 0,461

Троицко-Печорское 0,426 Корткеросское 0,491

Койгородское 0,467 Сыктывдинское 0,539

Помоздинское 0,467 Усть-Немское 0,553 0,565

Кажимское 0,500 Сысольское 0,618

Сторожевское 0,500 Троицко-Печорское 0,637

Пруптское 0,538 Ухтинское 0,670

Усть-Немское 0,592 0,565 Кажимское 0,689

Печоро-Илычское 0,615 Койгородское 0,819

Сосногорское 0,616 Каджеромское 0,821

Прилузское 0,636 Прилузское 0,837

Ухтинское 0,638 Печоро-Илычское 0,844

Сысольское 0,667 Сосногорское 0,896

Удорское 0,680 Комсомольское 0,952

Междуреченское 0,724 Усинское 0,966

Каджеромское 0,758 Мещурское 0,971

Локчимское 0,783 Междуреченское 0,971 0,939

Вуктыльское 0,800 Железнодорожное 0,971

Мещурское 0,813 Локчимское 0,977

Комсомольское 0,854 0,841 Удорское 0,982

Печорское 0,857 Ёртомское 0,984

Усинское 0,890 Вуктыльское 0,989

Ёртомское 0,917 Печорское 0,992

Усть-Цилемское 0,925 Усть-Цилемское 0,993

Ижемское 0,932 Ижемское 0,994

Метод кластеризации k-means относится к разделительным методам, основанным на поэтапном улучшении разбиения исходных данных на непересекающиеся группы. Для группировки пространственных данных больше подходят алгоритмы кластеризации на основе плотности. Для выявления размещения зон, в которых чаще всего случаются «грозовые» пожары, был использован алгоритм DBSCAN библиотеки Scikit-learn. В этом алгоритме количество кластеров определяется в процессе кластеризации.

Алгоритм DBSCAN (Density-based spatial clustering of applications with noise, пространственная кластеризация приложений с шумом) рассматривает кластеры как области высокой плотности, разделенные областями низкой плотности. В алгоритме есть два параметра: min_samples и eps. Более высокие значения min_samples или более низкие значения eps указывают на более высокую плотность, необходимую для формирования кластера.

За период 2010-2023 годов произошло 1746 пожаров, для которых установлена причина «от гроз». Координаты пожаров размещены в файле f-geo.xlsx. Значения параметров min_samples и eps определяются эмпирически (табл. 3). Значение eps = 0,05 соответствует приблизительно 5,5 км.

Таблица 3

Результаты кластеризации DBSCAN при различных значениях параметров

Параметры Номера кластеров и количество элементов в них

eps min samples

1 2 3

0,05 20 {-1: 1746}

0,05 10 {-1: 1725, 1: 11, 0: 10}

0,1 10 {-1: 1657, 1: 20, 3: 16, 4: 16, 0: 15, 2: 14, 5: 8}

0,1 20 {-1: 1746}

0,2 20 {-1: 1586, 0: 62, 3: 27, 2: 25, 1: 23, 4: 23}

0,2 30 {-1: 1746}

0,3 30 {-1: 1519, 0: 137, 3: 30, 1: 30, 2: 30}

0,3 40 {-1: 1672, 0: 74}

0,4 40 {-1: 1484, 0: 175, 1: 87}

Окончание табл. 3

1 2 3

0,4 50 {-1: 1591, 0: 155}

0,5 50 {-1: 1225, 0: 270, 2: 131, 1: 120}

0,5 100 {-1: 1746}

0,6 50 {-1: 633, 0: 389, 1: 251, 2: 204, 3: 198, 4: 71}

0,6 100 {-1: 1551, 0: 195}

0,9 100 {-1: 517, 0: 513, 2: 481, 1: 235}

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Кластеризация при eps = 0,5, min_samples = 50 (листинг 2) определила три кластера (270, 131, 120 пожаров), 1225 пожаров трактуются как шум (рис. 8). Кластеризация при eps = 0,6, min_samples = 100 (рис. 9) выделила один участок с высокой плотностью «грозовых» пожаров — для каждого из 195 пожаров в окрестности радиуса eps = 0,6 находится не менее 100 пожаров. Если снизить требование к количеству пожаров в заданной окрестности eps = 0,6 до 50, получим пять кластеров (рис. 10).

Листинг 2

Кластеризация при помощи алгоритма DBSCAN при eps = 0,5, min_samples = 50

# импорт библиотек import numpy as np

from openpyxl import load_workbook import matplotlib.pyplot as plt import seaborn as sns; sns.set() from sklearn.cluster import DBSCAN

# загружаем файл Excel

wb = load_workbook(filename='f-geo.xlsx') sheet = wb.worksheets[0]

data = np.array([row for row in sheet.iter_rows(min_row=2, max_row= 1747, min_col=2, max_col= 3, values_only=True)], dtype=np.float32)

Окончание листинга 2

# кластеризуем

clusters = DBSCAN(eps = 0.5, min_samples = 50).fit(data)

# получаем метки кластеров cl_labels = clusters.labels_

# выводим номера кластеров, значение -1 соответствует точкам шума print('cluster numbers',set(cl_labels))

from collections import Counter print(Counter(clusters.labels_))

# выводим результаты кластеризации

sns.scatterplot(data = data, x = data[:,0], y =data[:,1],

plt.show()

# сохраняем массив с номерами кластеров for i in range(1746):

sheet.cell(i+2, 5, value=cl_labels[i]) wb.save('f-geo.xlsx')

hue = cl_labels, size = cl_labels

sizes=(10, 200), legend = "full" palette = "deep")

ii

yjO 560 SIS 0>0 «2 i

СТЛ 500 SIS SSI SIS №0

Рис. 8. Выделение участков высокой плотности «грозовых» пожаров (ерБ = 0,5, тт_8атр1ев = 50)

Рис. 9. Выделение участков высокой плотности «грозовых» пожаров (ерБ = 0,6, тт_8атр1ев = 100)

ВТ

. -1

• О

* 1

* г

* з

* 4

47.5 50 0 52. Б 55.0 57.5 60.0 62.5

Рис. 10. Выделение участков высокой плотности «грозовых» пожаров (ерв = 0,6, тт_8атр1ев =50)

4. Заключение

Грозы стали причиной 65,5 % пожаров в 2016-2023 годах. Площадь «грозовых» пожаров составила 95,8 % от общей площади пожаров. При этом 91 % «грозовых» пожаров произошел в местностях с нулевой плотностью населения.

В коллективной монографии 2012 года Института глобального климата и экологии Федеральной службы по гидрометеорологии и мониторингу окружающей среды и Российской академии наук указывается: «На пожары, вызванные грозами, в среднем по России приходится 10 % общего числа лесных пожаров. . . . Проявляется значительная зависимость интенсивности грозовой деятельности и пожарной активности от широты. ... Наибольшая доля пожаров, вызванных молниями, в общем числе пожаров приходится на интервал широт 60-65° с. ш., она составляет около 39 %» [6, с. 268]. Территория Республики Коми простирается между 59° 12' и 68° 25' северной широты. Таким образом, значительное количество «грозовых» пожаров в Республике Коми является нормой.

Предсказать, куда ударит молния, и сократить количество «грозовых» пожаров — затруднительно. Уменьшить площадь «грозовых» пожаров можно за счет совершенствования систем раннего обнаружения пожаров в труднодоступных местностях.

На основе проведенного исследования разработаны лабораторные работы, которые используются в процессе обучения студентов направления «Прикладная информатика» по дисциплинам «Интеллектуальный анализ данных», «Эконометрика: многомерный анализ данных». Опыт работы с реальными данными в процессе обучения повышает интерес студентов и мотивацию к более глубокому изучению предмета.

Благодарности

Авторы выражают благодарность за сотрудничество Государственному бюджетному учреждению Республики Коми «Территориальный фонд информации Республики Коми» в лице директора Терентьева Алексея Витальевича и заведующего отделом программирования Ложкина Виктора Владимировича.

Список источников

1. Колеров Д. А. Совершенствование методов мониторинга и реагирования на лесные пожары в Республике Коми (на примере искусственного интеллекта) // ОБЖ: Основы безопасности ж^изни. 2022. № 1. С. 56-59.

2. Волокитина А. В., Софронова Т. М., Корец М. А. Региональные шкалы оценки пожарной опасности в лесу: усовершенствованная методика составления // Сибирский лесной журнал. 2017. № 2. С. 52-61. DOI: 10.15372/SJFS20170206.

3. Геоинформационный портал Республики Коми [Электронный ресурс]. URL: https://gis.rkomi.ru/ (дата обращения: 11.11.2023).

4. Котелина Н. О., Матвийчук Б. Р. Кластеризация изображения методом k-средних // Вестник Сыктывкарского университета. Серия 1: Математика. Механика. Информатика. 2019. Вып. 3 (32). С. 101-112.

5. Scikit-learn documentation [Электронный ресурс]. URL: https://scikit-learn.org/stable/modules/clustering.html#hdbscan (дата обращения: 11.11.2023).

6. Анисимов О. А., Борщ С. В., Георгиевский В. Ю. и др. Методы оценки последствий изменения климата для физических и биоло-

гических систем / Институт глобального климата и экологии Федеральной службы по гидрометеорологии и мониторингу окружающей среды и Российской академии наук. М.: Научно-исследовательский центр космической гидрометеорологии «Планета», 2012. 512 с.

References

1. Kolerov D. A. Improving methods for monitoring and responding to forest fires in the Komi Republic (using the example of artificial intelligence). OBZH: Osnovy bezopasnosti zhizni [FLS. Fundamentals of Life Safety]. 2022. No 1. Pp. 56-59. (In Russ.)

2. Volokitina A. V., Sofronova T. M., Korec M. A. Regional Scales of Fire Danger Rating in the Forest: Improved Technique. Sibirskij lesnoj zhurnal [Siberian Journal of Forest Science]. 2017. No 2. Pp. 52-61. DOI: 10.15372/SJFS20170206. (In Russ.)

3. Geoinformatsionnyy portal Respubliki Komi [Geoinformation portal of the Komi Republic] [Electronic resource]. Available at: https://gis.rkomi.ru/ (accessed: 11.11.2023). (In Russ.)

4. Kotelina N. O., Matvijchuk B. R. Image clustering by the k-means method. Vestnik Syktyvkarskogo universiteta. Seriya 1: Matematika. Mekhanika. Informatika [Bulletin of the Syktyvkar University. Ser. 1: Math. Mechanics. Informatics]. 2019. No 3 (32). Pp. 101-112. (In Russ.)

5. Scikit-learn documentation [Electronic resource]. Available at: https://scikit-learn.org/stable/modules/clustering.html#hdbscan (accessed: 11.11.2023).

6. Anisimov O. A., Borsch S. V., Georgievsky V. Yu. et al. Metody ocenki posledstvij izmeneniya klimata dlya fizicheskih i biologicheskih sistem [Methods for assessing the effects of climate change on physical and biological systems]. Institute of Global Climate and Ecology of the Federal Service for Hydrometeorology and Environmental Monitoring and the Russian Academy of Sciences. Moscow: Scientific Research Center of Space Hydrometeorology «Planet», 2012. 512 p. (In Russ.)

Сведения об авторах / Information about authors Бабикова Надежда Николаевна / Nadezhda N. Babikova к.пед.н., доцент, доцент кафедры прикладной информатики / PhD (Pedagogy), Associate Professor, Associate Professor of Applied Informatics Department

Сыктывкарский государственный университет им. Питирима Сорокина / Pitirim Sorokin Syktyvkar State University

167001, Россия, г. Сыктывкар, Октябрьский пр., 55 / 167001, Russia, Syktyvkar, Oktyabrsky Ave., 55

Котелина Надежда Олеговна / Nadezhda O. Kotelina к.ф.-м.н., доцент кафеды прикладной математики и компьютерных наук / Ph.D. in Physics and Mathematics, Associate Professor of Department of Applied Mathematics and Computer Science

Сыктывкарский государственный университет им. Питирима Сорокина / Pitirim Sorokin Syktyvkar State University

167001, Россия, г. Сыктывкар, Октябрьский пр., 55 / 167001, Russia, Syktyvkar, Oktyabrsky Ave., 55

Тентюков Фёдор Николаевич / Fyodor N. Tentyukov обучающийся бакалавриата/ undergraduate student

Сыктывкарский государственный университет им. Питирима Сорокина / Pitirim Sorokin Syktyvkar State University

167001, Россия, г. Сыктывкар, Октябрьский пр., 55 / 167001, Russia, Syktyvkar, Oktyabrsky Ave., 55

Статья поступила в редакцию / The article was submitted 27.11.2023 Одобрено после рецензирования / Approved after reviewing 01.12.2023 Принято к публикации / Accepted for publication 06.12.2023

i Надоели баннеры? Вы всегда можете отключить рекламу.