Kotov Vladislav Viktorovich, doctor of technical sciences, professor, [email protected]. Russia, Tula, Tula State
University
УДК 004.021
DOI: 10.24412/2071-6168-2024-10-352-353
МОДЕЛИ И МЕТОДЫ АНАЛИЗА ПОГОДНЫХ ИЗМЕНЕНИЙ ПОД ВОЗДЕЙСТВИЕМ ОКРУЖАЮЩИХ
ФАКТОРОВ
Ю.А. Леонов, Р.А. Филиппов, Г.В. Царева, А.А. Курдин
В данной статье рассматриваются модели и методы анализа погодных изменений под воздействием окружающих факторов. Прогнозирование погоды начинается с наблюдения за текущим состоянием атмосферы и знания основных погодных параметров, таких как температура, давление, влажность, ветер, осадки и так далее. Для их измерения используются метеостанции, которые могут быть как обслуживаемыми, так и полностью автоматизированными. Прогнозирование погоды является наиболее развитой областью метеорологии. Выделяют три основных метода прогнозирования: синоптический, численный и статистический. Цель данной статьи заключается в исследовании моделей и методов анализа погодных изменений, под воздействием окружающими факторами.
Ключевые слова: прогноз погоды, атмосферные параметры, метеостанции, синоптическое прогнозирование, численные методы, статистическое прогнозирование, автоматизированные системы.
Введение. В современных условиях прогнозирование погоды остается сложным и актуальным вызовом для научного сообщества и общества в целом. Несмотря на наличие обширных данных от метеостанций и разнообразных методов прогнозирования, точность прогнозов под воздействием окружающих факторов остается недостаточной. Проблема заключается не только в повышении точности прогнозов, но и в эффективном анализе погодных изменений с учетом сложных взаимосвязей между различными атмосферными параметрами.
Одним из ключевых аспектов является ограниченное количество метеостанций в различных регионах и их неравномерное распределение. Это влияет на точность и полноту данных, что приводит к ограничениям в предсказании погоды в некоторых областях. Кроме того, существующие методы прогнозирования могут быть недостаточно адаптированы к сложным изменениям в атмосфере, вызванным внешними воздействиями.
Проблема также заключается в необходимости более эффективного использования современных технологий, включая методы машинного обучения, для анализа обширных объемов данных и повышения точности прогнозов. В среднем, точность прогноза для краткосрочных периодов (несколько дней вперед) может достигать 90% и выше. Однако для долгосрочных прогнозов точность может снижаться, особенно при попытке предсказания погодных изменений на более длительные периоды. Недостаток систем, способных в реальном времени адаптироваться к динамике погоды и учитывать окружающие факторы, представляет собой значительное ограничение в сфере прогнозирования погоды.
Таким образом, проблемой, требующей внимания и решения, является не только улучшение методов прогнозирования, но и разработка современных систем, способных более эффективно анализировать погодные изменения под воздействием окружающих факторов, что потенциально приведет к более точным и адаптивным прогнозам в различных регионах.
Теоретический анализ. Существует три основных подхода к прогнозированию погоды: синоптические, численные и статистические методы. Каждый из них представляет собой уникальный подход к анализу атмосферных процессов и предсказанию будущих изменений. Рассмотрим, в чем заключается их различия, с целью выбора, наиболее подходящего для последующего анализа.
Синоптический метод. Описание: Синоптический метод прогнозирования основан на наблюдении за текущими атмосферными условиями и их интерпретации с использованием синоптических карт [1]. Синоптики анализируют распределение атмосферных параметров, таких как давление, температура, влажность, ветер, и на основе этого делают выводы о будущих изменениях погоды.
Принцип работы: Синоптики используют метеорологические карты, на которых отображаются изобары (линии равного давления) и другие линии, представляющие различные атмосферные параметры. Они ищут паттерны и корреляции между различными элементами карты для предсказания движения циклонов, антициклонов и других атмосферных явлений.
Численный (гидродинамический) метод. Описание: Численный метод прогнозирования основан на математических моделях, описывающих движение атмосферы [2]. Эти модели решают систему уравнений гидродинамики, учитывая множество параметров и начальные условия. Результаты численных вычислений предсказывают состояние атмосферы в будущем.
Принцип работы: Модели численного прогнозирования используют компьютерные алгоритмы для решения уравнений, описывающих физические процессы в атмосфере. Они разбивают атмосферу на трехмерную сетку и обновляют значения параметров на каждом шаге по времени.
Статистический метод. Описание: Статистический метод прогнозирования основан на анализе статистических связей между текущими и прошлыми атмосферными условиями и будущими изменениями погоды [3]. Модели строятся на основе статистических закономерностей, выявленных из исторических данных.
Принцип работы: Статистические модели используют методы регрессии, корреляции и другие статистические методы для анализа данных. Они могут использовать информацию о том, какие атмосферные условия в прошлом приводили к определенным изменениям погоды, чтобы делать предсказания для будущих событий.
После проведенного анализа был выделен синоптический метод прогнозирования, в качестве наилучшего
варианта.
Также после анализа предметной области были выделены следующие критерии, по которым будет производиться прогнозирование погодных изменений. Критерии:
дата и время полученных данных;
вид облаков;
тип осадков;
температура;
кажущаяся температура;
влажность;
скорость ветра;
направление ветра;
видимость;
облачное покрытие;
давление;
прогноз.
Разработана структура данных (табл. 1). Каждый из вышеперечисленных критериев имеет несколько вариантов ответа. Каждому варианту ответа соответствует своё значение.
Таблица 1
Метеорологические данные_
Критерий Значения
1 Дата и время Год, месяц, число, время.
2 Вид облаков 27 уникальных текстовых значений, таких как: переменная облачность, преимущественно облачно, пасмурно и т.д.
3 Тип осадков Дождь, снег.
4 Температура Числовое значение (градусы Цельсия).
5 Кажущаяся температура Числовое значение (градусы Цельсия).
6 Влажность Числовое значение (проценты).
7 Скорость ветра Числовое значение (км/ч).
8 Направление ветра Числовое значение (градусы).
9 Видимость Числовое значение (километры).
10 Облачное покрытие Числовое значение.
11 Давление Числовое значение (миллиметры ртутного столба).
12 Прогноз 215 уникальных текстовых значений, таких как: пасмурно в течение всего дня, ночь туманная, переменная облачность до ночи и т.д.
В результате анализа сайта kaggle.com, на наличие информации о предметной области, был выбран набор данных, основанный на погодных параметрах с 2006 по 2016 г., содержит в себе 96 тыс. записей и состоит из 12 характеристик. Данные характеристики представляют собой числовые, строковые и временные значения на рисунке 1 и 2.
Дата и время Вид облаков Тип осадков Температура Кажущаяся температура Влажность Скорость ветра
2006-04-01 00:00:00.000 +0200 Partly Cloudy rain 0.47 7.30 0.80 14.12
2005-04-01 01:00:00.000 +0200 Partly Cloudy rain 0.35 7.23 0.86 14.25
2005-04-01 02:00:00.000 +0200 Mostly Cloudy rain 038 9.38 0.80 3.03
2005-04-01 03:00:00.000 +0200 Partly Cloudy rain 829 5.04 0.83 14.10
2005-04-01 04:00:00.000 +0200 Mostly Cloudy rain 8.75 5.08 0.83 11.04
2005-04-01 05:00:00.000 +0200 Partly Cloudy rain 022 7.11 0.85 13.05
2005-04-01 05:00:00.000 +0200 Partly Cloudy rain 7.73 5.52 0.95 12.35
Рис. 1. Первая часть фрагмента данных
Направление ветра Видимость Облачное покрытие Давление Прогноз
251 15.826 0 1015.13 Partly cloudy throughout the day.
250 15.826 0 1015.63 Partly cloudy throughout the day.
204 14.057 0 1015.94 Partly cloudy throughout the day.
250 15.826 0 1016.41 Partly cloudy throughout the day.
250 15.826 0 1016.51 Partly cloudy throughout the day.
258 14.057 0 1016.66 Partly cloudy throughout the day.
250 9.982 0 1016.72 Partly cloudy throughout the day.
Рис. 2. Вторая часть фрагмента данных
1) На этапе первичного исследования данных был проведен анализ предметной области, в результате которого было выяснено, какие параметры зависят больше друг от друга, а также определены главные поля, по которым будет проводится анализ.
2) Обработка и анализ были проведены в открытой среде Google Colab с помощью языка программирования Python [4]. Основным инструментом аналитики стала библиотека skleam, которая предоставляет большое разнообразие методов для анализа данных.
3) Также была проведена очистка набора данных от выбросов и нулевых значений. Обработка включала в себя следующие этапы:
4) Замена нулевых значений в категориальных признаках и удаления нулевых строк представлена на рисунке 3.
df.set_axis(col_name, axis = "columns", inplace = True) df .dropna()
df = df .drop_duplicates( ) .re5et_index{drop=True) df.duplicated().sum{)
Рис. 3. Замена нулевых значений и удаление
Все строки и столбцы были проверены на дублирование и отсутствия значений. В обоих случаях удалялись либо найденный дубликат, либо строка с отсутствующим значением.
5) Вывод информации о данных и переименование столбцов представлен на рисунке 4. К выбросам были отнесены следующие данные:
cf=pd.read_excel("randomueatherclass.xlsx")
df.head()
df .irfoQ
col_narae = ['Sumary', 'Precip_Type1Л 'Temperature', "Apparent_Temperature', 'Humidity'., j 'lfJind_Speed1 , 'Wind_Bearing' , 'Visibility' , 'Pressure'., 'Daily_Sunimary' ]
Рис. 4. Переименование столбцов
Был проведен анализ линейной регрессии. Проведение анализа в рассматриваемом наборе данных производится относительно ключевого поля «Прогноз». С помощью корреляционного анализа была установлена зависимость от этого поля, представленная на рисунке 5.
Name: DailySummary, dtype: float&4
Mean Absolute Error: 19.544552997437265 Mean Squared Error: 93 3.4687238885914 Root Mean Squared Error: 30.5S173S55754S157
Accuracy on training set:0.165 Accuracy on test set:0.167
ypaBHeHfa: y = xl * 119.101 + x2 • 5.087 + x3 * 10.604 +- x4 * ['Summary1 'Precip_Type' 'Temperature 'Apparent_Temperature ' l,.'ind_Speed ' 'Hind_Bearing' 'Visibility' 'Pressure']
-24.131 + : " Humidity"
-14.772 + хб * 55.297 + X7 * 1.930 + X8
Рис. 5. Результат анализа с полем «Прогноз»
Перед началом создания и обучения моделей начальные данные были разбиты на обучающую и тестовую выборку случайным образом. Обучающая выборка составляет 80% от исходной и используется для обучения моделей. Оставшаяся часть используется для оценки эффективности созданных моделей.
Структура нейронной сети имеет 2 скрытых слоя. В качестве основной функции активации используется гиперболический тангенс:
tanh(x) =
sinh(x)
(1)
cosh(x)'
где x - взвешенную сумму входных значений для конкретного нейрона.
На выходном слое используется функция активации производная гиперболического тангенса:
tanh(x) =1 — tanh2(x), (2)
Разработка структуры нейронной сети
Многослойный перцептрон. Данный модуль реализован на языке программирования Python, с помощью библиотеки sklearn и соответствующих классов для реализации используемых формализованных методов. Результата работы нейронной сети на языке Python (рис. 6).
На языке программирования С# загрузка происходит из csv файла, полученные данные хранятся в List<double> и List<double[]>[5].
Нейронная сеть была декомпозирована на несколько классов:
• Layer - класс описывающий скрытый слой нейронной сети;
• Neuron - класс описывающий нейрон;
• NeuronType - перечисление, хранящее в себе статус объекта нейрона (нейроны входного и выходного
слоя);
• Topology - класс, описывающий настройки нейронной сети (количество слоев, нейронов, эпох и точность обучения);
• NeuralNetwork - класс, хранящий в себе узлы и настройки нейронной сети, и имеющий реализацию обучения и прогнозирования на основе входного набора данных.
В результате обучения, полученная точность составляет 70 % (рис. 7).
145 0.00 0.00 0.00 1
146 e.00 0.00 0.00 12
147 0.00 0.00 0.00 5
14 S 0.00 0.00 0.00 5
1Б0 0.00 0.00 0.00 3
153 0.00 0.00 0.0Э 1
accuracy 0.73 19291
macro avg 0.69 0.70 0.62 19291
weighted avg 0.71 0.73 0.95 19291
Рис. 6. Точность нейронной сети на Python
Обучающая:
9,5784 9,1793 9,1793 8,3811 8,7802 9,1793 7,5829 8,7802 10,7757 13,9685 15,964 17,1613 17,9595 17,1613 18,7577 18,75
Тестовая:
9,1793 8,7802 10,3766 7,982 8,7802 8,7802 6,7847 7,982 11,973 14,3676 16,3631 17,5604 17,9595 17,9595 19,5559 19,156
Обучить
Рис. 7. Точность нейронной сети на языке с#
Результаты и их обсуждение. Обучение проводилось с заданными параметрами. Слои представлены в виде 10, 8, 4, 1, скорость обучения 0.001, количество эпох равно 20. Время выполнения полного обучения на языке C# с текущими параметрами равняется 2 минуты, в то время как обучение с теми же параметрами на языке Python равняется 6 секунд. Точность обучения на обоих языках приблизительно равна 70% (C#), 73% (Python). Также в результате работы были обнаружены преимущества языка Python в скорость чтения, отображения данных и создания самой программы. Исходя из вышеперечисленных данных можно сделать вывод, что с текущей задачей лучше справится язык программирования Python. Статистический анализ результатов обучения нейронной сети с выбранными параметрами оказался достаточно точным и информативным.
Заключение. В рамках проведенного исследования был выполнен обзор и сравнительный анализ основных моделей и методов, применяемых для прогнозирования погодных изменений с учетом влияния внешних факторов окружающей среды.
Были рассмотрены три подхода к прогнозированию: синоптический, основанный на анализе текущего состояния атмосферы, численный, использующий компьютерное моделирование физических процессов, и статистический, базирующийся на выявлении закономерностей в исторических данных.
Для практической реализации прогнозирования был выбран статистический подход как наиболее гибкий и позволяющий учитывать различные факторы окружающей среды. Были определены основные критерии и структура входных данных на основе реального набора погодных параметров.
Для прогнозирования погоды по имеющимся данным были разработаны нейронные сети с использованием языков программирования Python и C#. Экспериментальное тестирование продемонстрировало более высокую эффективность нейросетевой модели на Python для решения поставленной задачи прогнозирования.
Полученные в исследовании результаты свидетельствуют о перспективности применения статистических и нейросетевых алгоритмов для анализа и моделирования сложных погодных явлений с учетом многофакторных воздействий. Разработанные модели могут быть положены в основу автоматизированных систем мониторинга, прогнозирования и раннего предупреждения опасных погодных условий.
Список литературы
1. Методы географического прогнозирования. [Электронный ресурс] URL: https://cyberleninka.rU/article/n/metody-geograficheskogo-prognozirovaniya (дата обращения: 10.05.2024).
2. Численные методы прогноза погоды. [Электронный ресурс] URL: https://meteoinfo.ru/images/media/books-docs/special/BelovBorPanin.pdf (дата обращения: 10.01.2024).
3. Методы прогнозирования погоды. [Электронный ресурс] URL: https://geo.bsu.by/images/pres/oz/metprogn/metprogn 1.pdf (дата обращения: 10.01.2024).
4. Соков И.А. Быстродействие обучения нейронной сети в реальном времени на python // ФГБОУ ВО «Тольяттинский государственный университет». Тольятти, 2022. С. 79-80.
5. Ларина В.А. Разработка нейронной сети на объектно-ориентированном языке программирования с# // Поволжский государственный университет телекоммуникаций и информатики. Тольятти, 2021. С. 82-85.
6. Багдади М.А. Обзор возможностей и сравнение языков программирования python и r в области анализа данных / М.А. Багдади, Б.А. Мархабаев // Инновационные механизмы управления цифровой и региональной экономикой. Москва, 2023. С. 282-294.
7. Технология трехмерного моделирования и текстурирования объектов в Blender 3d и 3d Max : Учебное пособие / А. А. Кузьменко, А. Д. Гладченков, В. А. Шкаберин [и др.]. Москва: ООО "ФЛИНТА", 2019. 142 с. EDN YWRBTT.
8. Kuzmenko A.A. Neural Network Analysis of Ecological and Floristic Classification as a Basis for Protection of Regional Biodiversity / A. A. Kuzmenko, A. V. Averchenkov, A. S. Sazonova // IOP Conference Series: Materials Science and Engineering : International Science and Technology Conference "FarEastCon 2019". Vol. 753, 4, Chapter 3. Vladivostok: Institute of Physics Publishing, 2020. P. 042029. DOI 10.1088/1757-899X/753/4/042029. EDN EAYYPM.
9. Sazonova A.S. Calculation of a Complex Indicator of the Innovation Potential / A. S. Sazonova, A. A. Kuzmenko, M. V. Terekhov // IOP Conference Series: Materials Science and Engineering : International Science and Technology Conference "FarEastCon 2019". Vol. 753, 4, Chapter 3. Vladivostok: Institute of Physics Publishing, 2020. P. 042028. DOI 10.1088/1757-899X/753/4/042028. EDN UVCPYJ.
10. Development and study of the model for epidemic spread / A. V. Ivanova, A. S. Sazonova, A. A. Kuzmenko, L. B. Filippova // III International Workshop on Modeling, Information Processing and Computing (MIP: Computing-2021). Vol. 2899. Krasnoyarsk, Russia: CEUR-WS, 2021. P. 9-16. DOI 10.47813/dnit-mip3/2021-2899-9-16. EDN XTBWGO.
Леонов Юрий Алексеевич, канд. техн. наук, доцент, [email protected], Россия, Брянск, Брянский государственный технический университет,
Филиппов Родион Алексеевич, канд. техн. наук, доцент, [email protected]. Россия, Брянск, Брянский государственный технический университет,
Царева Галина Вячеславовна, канд. пед. наук, доцент, заведующий кафедрой, [email protected], Россия, Брянск, Брянский государственный технический университет,
Курдин Артем Алексеевич, студент, libv88@yandex. ru, Россия, Брянск, Брянский государственный технический университет
MODELS AND METHODS FOR ANALYZING WEATHER CHANGES UNDER THE INFLUENCE OF ENVIRONMENTAL
FACTORS
Yu.A. Leonov, R.A. Filippov, G. V. Tsareva, A.A. Kurdin
This article discusses models and methods for analyzing weather changes under the influence of environmental factors. Weather forecasting begins with observing the current state of the atmosphere and knowing the main weather parameters such as temperature, pressure, humidity, wind, precipitation, and so on. To measure them, weather stations are used, which can be either serviced or fully automated. Weather forecasting is the most developed field of meteorology. There are three main forecasting methods: synoptic, numerical and statistical. The purpose of this article is to study models and methods for analyzing weather changes influenced by environmental factors.
Key words: weather forecast, atmospheric parameters, weather stations, synoptic forecasting, numerical methods, statistical forecasting, automated systems.
Leonov Yuri Alekseevich, candidate of technical sciences, docent, yorleon@yandex. ru, Russia, Bryansk, Bryansk State Technical University,
Filippov Rodion Alekseevich, candidate of technical sciences, docent, [email protected], Russia, Bryansk, Bryansk State Technical University,
Tsareva Galina Vyacheslavovna, candidate of pedagogical sciences, docent, head of the department, [email protected], Russia, Bryansk, Bryansk State Technical University,
Kurdin Artyom Alekseevich, student, libv88@yandex. ru, Russia, Bryansk, Bryansk State Technical University