УДК 502.7:502.55
Э.В. Рощупкин, канд. техн. наук, доц., докторант, (4872) 35-37-60, roeduardo@mail .ru (Россия, Тула, ТулГУ)
НЕЙРОСЕТЕВАЯ МОДЕЛЬ ПРОГНОЗА ЗАГРЯЗНЕНИЯ АТМОСФЕРНОГО ВОЗДУХА
Приводится описание результата прогноза распространения оксида углерода в атмосфере города с помощью нейронной сети. Обучение нейронной сети производилось в профессиональной аналитической платформе DEDUCTOR STUDIO ACADEMIC.
Ключевые слова: прогноз, пост наблюдения, временной ряд, мониторинг, моделирование, нейронная сеть, обучение, ошибка.
Основной проблемой прогнозирования временных рядов является выявление неточности прогноза. Большинство задач прогнозирования можно свести к предсказанию временного ряда с помощью процедуры погружения ряда в многомерное пространство, т. е. к решению задачи интерполяции функции многих переменных. Нейросеть можно использовать для восстановления этой неизвестной функции по набору примеров, заданных историей данного временного ряда.
Особенностью временных рядов концентраций токсичных газов является определенная повторяемость характеризующих их выборок в зависимости от различных факторов, таких как время суток, метеорологических условий, количества автотранспорта на улицах города, дня недели и месяца.
Процесс прогнозирования с помощью нейронных сетей состоит из следующих этапов: подбора архитектуры нейронной сети; выбора обучающих данных и структуры входных векторов; обучения нейронной сети; тестирования сети на контрольном множестве данных и при необходимости ее дообучения; использования сети в качестве средства прогнозирования с возможностью дообучение сети по истечении определенного времени.
Построим нейронную сеть прогноза концентрации оксида углерода на базе многослойного персептрона, являющегося хорошим средством для предсказания временных рядов [1]. На рис.1 представлена схема многослойной персептронной нейроной сети прогноза концентрации вредного вещества в момент времени (n+1) по информации об n значениях в предшествующие моменты времени.
Для прогнозирования используем сигмоидалъную сеть с одним скрытым слоем. Объем входного слоя выбран равным размерности входного вектора x. Количество выходных нейронов определяется количеством прогнозируемых периодов. Подбор количества нейронов скрытого слоя определяется практически методом подбора по наступлению наибо-
лее достоверного результата. Слишком большое их количество приводит к росту погрешности обобщения.
Рис. 1. Обобщенная структура многослойной сети (с одним скрытым слоем)
Построим прогноз концентрации вредных веществ следующего значения ряда по информации о предыдущих пяти значениях концентраций. Прогнозирующая нейронная сеть должна иметь всего один выход и столько входов, сколько предыдущих значений необходимо использовать для прогноза, например, 5 последних значения. Составить обучающий пример очень просто - входными значениями нейронной сети будут значения концентраций за 5 последовательных замеров, а желаемым выходом нейронной сети - известная концентрация в следующий момент времени за этими пятью.
Задача подготовки исходных данных состоит в приведении всех значений временного ряда х к «общему знаменателю», т. е. применение к каждому из них такого преобразования, в результате которого область возможных значений ограничится отрезком [0;1]. При этом нулевое значение преобразованных данных должно соответствовать минимальному значению исходной выборки, а единичное - максимальному. После данных преобразований получим временной ряд в диапазоне, ограниченном отрезком [0;1]. Далее необходимо вычислить среднее значение ряда и вычесть это значение из полученной выборки. В результате получим временной ряд с математическим ожиданием среднего равного нулю.
В обучающем примере первые 5 чисел строки (Х1,Х2,Х3,Х4,Х5) являются входными значениями нейронные сети, а шестое число (У) - желаемое значение выхода нейронной сети. Столбцы Х1-Х5 являются концентрациями в пять последних отсчетов времени, а столбец У - желаемое значение выхода нейронной сети.
Объем обучающей выборки зависит от выбранного количества входов нейронной сети. Принимая во внимание огромную базу данных стационарного поста наблюдения автоматизированной системы экологического мониторинга [2], было решено ограничиться избранными днями измерения с 18 января 2007 года по 29 января 2007 года. В данном случае обучающая выборка содержит 15832 строки. Для создания и обучения сети используем свободно распространяемую версию программного продукта Deductor Studio Academic 5.2 Российской фирмы «BaseGroup Labs», профессионального поставщика программных продуктов и решений в области анализа данных [3].
Настраиваем в программе Deductor столбцы выборки X1, X2, X3, X4, X5 как входные для обучения нейронной сети, столбец Y настраиваем как желаемый выход сети. Разбиваем исходную выборку на обучающее множество и тестовое в процентном содержании 90 и 10 % соответственно.
Обучаем сеть по алгоритму обратного распространения ошибки со скоростью обучения 0,1 и моментом обучения 0,9.
Обученная модель должна выдавать достаточно точные результаты не только на обучающих, но и на любых других примерах. Чтобы проверить наличие обобщающей способности у обученной модели, необходимо протестировать ее на примерах, не использовавшихся ранее для обучения.
Максимальная ошибка для обучающего множества составила
0,00508, а для тестового 0,00381.
Обычно точность характеризуется ошибкой между истинным и полученным значениями. При этом могут использоваться различные типы ошибок: абсолютные, относительные, среднеквадратические и т.д. Низкая точность в большинстве случаев является проблемой, поскольку не позволяет получать достоверные результаты, необходимые для приобретения знаний об объекте исследования. Это, в свою очередь, может привести к принятию неправильных решений.
Далее применим обученную сеть к выборке из временного ряда концентрации оксида углерода с 2 по 3 февраля 2007 года, не знакомую нейронной сети. Над выборкой с новыми данными необходимо провести все преобразования, что и над обучающей выборкой. Для применения обученной сети к новым данным временного ряда в программе Deductor есть специальный механизм «Скрипт». Применяем механизм «Скрипт» к новой выборке, указываем в качестве модели модель обученной нейронной сети. В итоге получаем результат обработки обученной сети новых данных.
На рис. 2 представлена копия экрана результатов прогноза значений концентраций оксида углерода в табличном виде с 2 по 3 февраля 2007 года, с помощью нейронной сети, обученной по данным с 18 по 29 января 2007 года.
Рис. 2. Копия экрана результатов прогноза значений концентраций оксида углерода в табличном виде с помощью обученной
нейронной сети
На рис. 2 приводится таблица значений входных сигналов Х1-Х5 о предыдущих концентрациях оксида углерода, о реальной концентрации У, прогнозном значении У_ОиТ и ошибке прогноза У_БЯК. Таблица отсортирована по уменьшению ошибки прогноза. Из таблицы видно, что максимальная ошибка прогноза составляет 0,0064, что соответствует приблизительно 10,7 %.
На рис.3 представлен увеличенный фрагмент диаграммы сравнения истинного и спрогнозированного значений концентраций оксида углерода с максимальной ошибкой в точке 176.
Черным цветом изображено истинное значение концентрации из тестовой выборки с 2 по 3 февраля 2007 года, а белым цветом -прогнозируемое нейронной сетью значение концентрации оксида углерода. Максимальная ошибка прогноза, равная приблизительно 10,7 %, свидетельствует о хорошем результате. Полученные результаты можно использовать в качестве настраиваемых нейронных сетей локальных прогнозов концентраций вредных веществ в районах измерений стационарных и мобильных постов наблюдения. Для повышения точности прогноза в будущем целесообразно привязать значения концентраций вредных веществ к
метеопараметрам, дням недели, периоду года, числу автотранспорта на улицах города и другим параметрам, от которых зависит концентрация вредных веществ в атмосфере.
Рис. 3. Увеличенный фрагмент диаграммы сравнения истинного и спрогнозированного значений концентраций
Сеть обратного распространения ошибки успешно применяется многими авторами для решения задачи прогнозирования. При этом результаты прогнозов оказываются правдоподобными. Это дало толчок к использованию нейронных сетей в сфере бизнеса для предсказания изменений курсов валют, в сфере прогноза потребления электроэнергии и т. д. Существует множество коммерческих нейросетевых программных продуктов для построения прогнозов.
Список литературы
1. Рощупкин Э.В. Система распределенного автоматизированного мониторинга загрязнения атмосферного воздуха промышленных регионов// Безопасность жизнедеятельности. №5. 2010. С. 46-52.
2. Оссовский С. Нейронные сети для обработки информации/ пер. с польского И. Д. Рудинского. М.: Финансы и статистика. 2002. 344 с.
3. Фирма BaseGroup. URL.: http://www.basegroup.ru/ (дата обращения 20.01.11).
E. Roshchupkin
Neural-network forecasting model ofpollution of atmospheric air
The description of result of the forecast of distribution carbon oxigen in atmosphere of a city by means of a neural network is resulted. Training of a neural network was made in professional analytical platform deductor studio academic.
Key words: the forecast, a post of supervision, a time number, monitoring, modeling, a neural network, training, an error.
Получено 02.11.10
УДК 502.7:502.55
Э.В. Рощупкин, канд. техн. наук, доц., докторант, (4872) 35-37-60, гоеёиагёо@шай .ги (Россия, Тула, ТулГУ)
ПРОВЕРКА АДЕКВАТНОСТИ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ РАССЕИВАНИЯ ВРЕДНЫХ ВЕЩЕСТВ В АТМОСФЕРЕ
Приводится описание результата проверки адекватности математических моделей системы экологического мониторинга атмосферного воздуха города.
Ключевые слова: прогноз, мониторинг, моделирование, источники выбросов, карта рассеивания вредных веществ.
С целью проверки адекватности математических моделей рассевания вредных веществ в атмосфере системы экологического мониторинга атмосферного воздуха города Тулы был проведен эксперимент сравнения теоретических данных (рассчитанных с помощью программных продуктов) и практических данных (измеряемых с помощью мобильных газоанализаторов) [1]. В качестве компонента загрязняющего вещества был выбран токсичный газ оксид углерода (СО). С помощью программного модуля «Призма город» были рассчитаны карты рассеивания вредных веществ в центральной части города Тулы. При расчетах в качестве исходных данных использовались тома ПДВ нескольких котельных, расположенных в непосредственной близости к проезжей части, по который двигался мобильный пост экологического контроля. В программном комплексе «Призма город» были выбраны для расчета параметры источников выброса - котельных и перекрестки с долевым участием автотранспорта. В качестве исходных данных были взяты следующие параметры (на примере