УДК 536.24
DOI 10.21685/2307-4205-2018-1-13
А. Д. Шумилин, Н. Н. Вершинин, А. Е. Вершинин, А. С. Волкова ИСПОЛЬЗОВАНИЕ НЕЙРОСЕТЕЙ
ДЛЯ ПРОГНОЗИРОВАНИЯ ВЛИЯНИЯ АВТОТРАНСПОРТА НА ЭКОЛОГИЧЕСКУЮ ОБСТАНОВКУ ГОРОДА
A. D. Shumilin, N. N. Vershinin, А. Е. Vershinin, A. S. Volkova
THE USE OF NEURAL NETWORKS TO PREDICT THE INFLUENCE OF VEHICLES ON THE ENVIRONMENT OF THE CITY
Аннотация. Актуальность и цели. Показано, что автотранспорт порождает экологические проблемы в крупных городах, поскольку особенностью автотранспорта как подвижного источника загрязнения является низкое расположение (на уровне дыхания детей), распределение на неопределенные территории, непосредственная близость к жилым районам. Необходимо получить полную информацию об экологической обстановке в городе. Материалы и методы. Показано, что использование искусственных нейронных сетей является одним из наиболее перспективных методов, используемых при проведении исследований социологических, биологических, финансовых, экономических и других сложных систем. Предложено использовать технологии искусственного интеллекта для прогнозирования негативных факторов влияния автотранспорта на городскую среду. Результаты. Рассматривается технология прогнозирования с помощью искусственных нейронных сетей. Описаны этапы выявления факторов и построения моделей для применения нейросетевого прогнозирования. В качестве примера рассмотрен процесс прогнозирования влияния автотранспорта на экологическую обстановку города. Определены временные ряды для выявления повторяемости характеризующих их выборок в зависимости от факторов. Описан способ прогнозирования временных рядов нейронной сетью обратного распространения ошибки. С помощью ошибки обобщения выявлялся эффект переобучения. При обучении происходило постоянное уменьшение ошибки обучения до минимального значения, после этого обучение прекращалось. Предложены возможные варианты применения искусственных нейронных сетей в сфере контроля за экологической обстановкой. Показаны возможности аналитической платформы Deductor Studio, используемой при обучении нейронной сети. Выводы. Результаты представленного прогноза могут использоваться на практике при формировании локальных прогнозов количества единиц автотранспорта в районах с установленными камерами наблюдения. Чтобы повысить точность прогноза, целесообразно осуществить привязку количества единиц автотранспорта к дням недели, периоду года. Показано, что с помощью нейросетей может
Abstract. Background. It is shown that motor transport generates environmental problems in large cities, since the peculiarity of motor transport as a mobile source of pollution is a low location (at the level of children's breathing), distribution to indeterminate territories, immediate proximity to residential areas. It is necessary to obtain full information about the environmental situation in the city. Materials and methods. It is shown that the use of artificial neural networks is one of the most promising methods used in conducting studies of sociological, biological, financial, economic and other complex systems. It is suggested to use artificial intelligence technologies for forecasting negative factors of motor transport influence on the urban environment. Results. The article considers the technology of forecasting using artificial neural networks. The stages of identifying factors and constructing models for the application of neural network forecasting are described. As an example, the process of predicting the impact of vehicles on the ecological situation of the city is considered. Time series are determined to determine the repeatability of the samples characterizing them, depending on the factors. A method for predicting time series by a neural network of back propagation of an error is described. With the help of the generalization error, the effect of retraining was revealed. During the training, there was a constant reduction in the learning error to a minimum, after which training ceased. Possible options for the use of artificial neural networks in the sphere of environmental control are proposed. The capabilities of the analytic platform Deductor Studio, used in training a neural network, are shown. Conclusions. The results of the presented forecast can be used in practice when forming local forecasts of the number of vehicles in areas with installed surveillance cameras. To improve the accuracy of the forecast, it is advisable to link the number of vehicles to the days of the week, the period of the year. It is shown that a satisfactory model can be constructed with the help of neural networks, even with insufficient data, which can be further refined as new data become available.
быть построена удовлетворительная модель даже при недостаточном количестве данных, которая может в дальнейшем уточняться по мере поступления новых данных.
Ключевые слова: нейронная сеть, прогнозирование, обучение нейронной сети, обучение на примерах, искусственные нейроны, обучающая выборка, экология города, экологическая безопасность.
Keywords: neural network, forecasting, neural network training, learning by example, artificial neurons, learning sample, city ecology, ecological safety.
Введение
Экологическая обстановка в современных городах зависит от техногенных воздействий, обусловленных наличием большого количества предприятий промышленности, энергетики, транспорта. Острее всего экологические проблемы проявляются в крупных городах. Учитывая тот факт, что крупные города являются транспортными узлами, экологическая обстановка в них достаточно неблагоприятна [1].
Доля автотранспорта в числе основных источников загрязнения атмосферного воздуха достигает 70-90 %. Это приводит к тому, что возникают достаточно устойчивые и обширные зоны с превышением санитарно-гигиенических нормативов загрязнения воздуха в несколько раз.
Особенностью автотранспорта как подвижного источника загрязнения является низкое расположение (на уровне дыхания детей), распределение на неопределенные территории, непосредственная близость к жилым районам.
С отработавшими газами автомобилей в городскую атмосферу попадает: 80 % свинца, 59 % оксида углерода, 32 % оксида азота, бензапирен и летучие углеводороды. Тип двигателя, режим работы, техническое состояние автотранспорта и качество топлива влияют на состав выхлопных газов.
Так, в составе отработанных газов автотранспорта содержится более 200 компонентов (оксид углерода, оксиды азота, несгоревшие углеводороды, альдегиды, сажа) [2].
Использование технологии искусственного интеллекта для прогнозирования негативных факторов влияния автотранспорта на городскую среду
Комплексная оценка негативных факторов влияния автотранспорта на городскую среду позволяет получить более полную информацию об экологической обстановке в городе. В настоящее время решение вопросов, связанных с экологической безопасностью, осуществляется на основе широкого внедрения в практику природоохранной деятельности новейших информационных технологий.
Так, например, использование традиционных методов прогнозирования не всегда позволяет обеспечить удовлетворительный результат. В связи с этим широкое распространение получили информационные технологии, позволяющие получать необходимую аналитическую прогнозную информацию. К одному из наиболее перспективных направлений относятся технологии искусственного интеллекта. Наилучшие результаты при прогнозировании показывают технологии, основанные на использовании искусственных нейронных сетей.
К числу первых попыток создания и исследования искусственных нейронных сетей относят работу Дж. Маккалока и У. Питтса «Логическое исчисление идей, относящихся к нервной деятельности» (1943).
В данном труде учеными были сформулированы главные принципы построения искусственных нейронов и нейронных сетей, которые актуальны и сегодня. В основе технологий нейронных сетей принципы строения и функционирования нейронов человеческого мозга, используемых при распознавании каких-либо событий или предметов, а также позволяющих воспроизводить многочисленные связи между множеством объектов.
Центральная нервная система человека состоит из нервных клеток - нейронов, состоящих из тела и отростков, соединяющих их с внешним миром (рис. 1).
Возбуждение поступает к нейрону по отросткам, называемым дендритами. Аксон представляет отросток, передающий нейрону возбуждение, при этом каждый нейрон имеет один аксон. У дендритов и аксона довольно сложная ветвистая структура. Место, в котором соединяется аксон нейрона с дендритом, называется синапсом.
Синапс
-I
Рис. 1. Биологический нейрон (модель)
Основной функцией нейрона является передача возбуждения из дендритов в аксон. Однако сигналы, поступающие из разных дендритов, могут оказывать влияние на сигнал в аксоне. Выдача сигнала нейроном происходит, если суммарное возбуждение превышает предельное значение, изменяющееся в определенных границах, если же суммарное возбуждение ниже предельного значения, аксон сигнал не будет выдан: нейрон не ответит на возбуждение. Несмотря на то, что в данной схеме много осложнений и исключений, большинством нейронных сетей моделируются именно эти простые свойства.
Использование искусственных нейронных сетей признано одним из наиболее перспективных методов, предназначенных для проведения исследований социологических, биологических, финансовых, экономических и других сложных систем. Такие системы представляют собой результат влияния множества факторов, в том числе и человеческого, поэтому считается практически невозможным создание полной математической модели, которая бы учитывала все существующие ограничения и условия [3].
Нейронные сети используются для решения неформализованных или плохо формализованных задач применительно к нелинейным и адаптивным системам, они устойчивы к частым изменениям среды, показывают хороший результат при работе с неполными данными.
Искусственная нейронная сеть представляет собой математический аппарат, который позволяет строить алгоритмы обработки информации и обладает уникальной способностью к обучению «узнаванию» в потоке «зашумленной» и противоречивой информации.
Нейронные сети дают возможность нахождения скрытых зависимостей между входными и выходными данными. Они являются системой, в которой соединены и осуществляют взаимодействие между собой простые процессоры (искусственные нейроны). В данной сети каждый процессор взаимодействует только с периодически получаемыми и посылаемыми им другим процессорам сигналами. Процессоры, соединенные в большую сеть с управляемым взаимодействием, обладают способностью совместного выполнения предельно сложных задач.
Нет необходимости в программировании нейронных сетей, предусмотрена только работа по обучению нейронной сети на специально подобранных примерах. Сети способны самостоятельно настраиваться (обучаться) тому, что необходимо для пользователя. Они меняют свое поведение (обучаются) в зависимости от изменений, происходящих во внешней среде, находя скрытые закономерности в потоке данных. В процессе этого алгоритмам обучения не требуются какие-либо предварительные знания о существующих в предметной области взаимосвязях, необходимо только наличие достаточного числа примеров, которые описывают поведение моделируемой системы в прошлом.
Помимо способности к обучению, нейросетевая технология способна распознавать, прогнозировать новые ситуации с высокой степенью точности, даже при внешних помехах, таких как противоречивые или неполные значения в потоках данных.
Главным отличием нейронных сетей от традиционных моделей прогнозирования является учет большого объема информации за несколько десятилетий, что позволяет увеличить точность прогноза.
Этапы нейросетевого прогнозирования
При построении прогноза загрязнения атмосферы используют системы экологического мониторинга. Карта рассеивания строится на данных о количестве единиц автотранспорта на городских улицах. Необходимый прогноз может быть получен при использовании способности нейросетей обобщать исходные данные и выявлять скрытые закономерности. Обычно основной задачей прогнозирования является предсказание временного ряда (интерполяция функции многих переменных) [4].
Нейронная сеть используется для восстановления этой неизвестной функции посредством набора примеров, которые заданы историей данного временного ряда.
Особенность временных рядов (количество единиц автотранспорта) - определенная повторяемость характеризующих их выборок в зависимости от таких факторов, как время суток, метеорологические условия, дни недели и месяца. Прогнозирование с помощью нейросетей состоит из нескольких этапов (рис. 2).
г
5 И со О О Л
ЕС «
[-и о
О щ
6
Подбор архитектуры нейронной сети
Выбор обучающих данных и структуры входных
векторов
Обучение нейронной сети
Тестирование сети на контрольном множестве данных
Использование сети в качестве средства прогнозирования
Рис. 2. Этапы нейросетевого прогнозирования
Для прогнозирования количества автотранспорта нейронная сеть может быть построена на основе многослойного персептрона (MLP - MultiLayer Perceptron), предсказывающего временные ряды. MLP базируется на нейронах сигмоидального типа.
Процесс обучения MLP осуществляется с учителем. Обучение заключается в подборе кортежей <x,d>, в которых x является входным вектором, a d - соответствующим ему ожидаемым выходным вектором сети.
Если x Ф d , сеть называется гетероассоциативной, если же x = d , сеть - автоассоциативная. В данных сетях будут использоваться персептронные модели нейронов или их обобщенная форма в виде сигмоидальной модели [5].
В данной сети количество входных нейронов будет определяться размерностью входного вектора x, а количество выходных нейронов будет определяться размерностью вектора d. Процесс обучения такой сети будет осуществляться, как правило, с учителем и будет представлять собой точную копию обучения одиночного нейрона.
Многослойная сеть состоит из нейронов, которые находятся на разных уровнях, при этом, кроме входного и выходного слоев, существует как минимум один внутренний (скрытый) слой.
При прогнозировании может использоваться сигмоидальная сеть, имеющая один скрытый слой. По своему объему входной слой будет равным размерности входного вектора х. Число выходных нейронов будет определяться количеством прогнозируемых периодов. Сложность будет заключаться в подборе количества нейронов скрытого слоя. Это связано с тем, что при их минимальном количестве будет невозможно уменьшить погрешность обучения до требуемого уровня. При большом количестве нейронов будет отмечаться рост погрешности обобщения. Таким образом, подбор количества скрытых нейронов может осуществляться либо экспериментально с целью уменьшения погрешности обобщения до минимума, либо с использованием одного из методов построения оптимальной структуры сети.
Оценить качество прогнозирования можно с помощью показателя процентной погрешности МАРЕ (Mean Absolute Percentage Error), который определяется в виде
1 n Ct — Ct
MAPE = - £ 100, (1)
n1=T Ct
где EMBED С будет являться прямо спрогнозированным значением количества единиц автотранспорта; C будет представлять собой фактическое значение количества единиц автотранспорта; n будет являться числом часов, на которые делался прогноз [5].
Прогнозирование количества автотранспорта будет осуществляться по данным о предыдущих пяти значениях количества единиц автотранспорта. У прогнозирующей нейронной сети должен быть всего один выход и столько входов, сколько предыдущих значений необходимо использовать для прогноза (к примеру, пять последних значений).
При составлении обучающего примера в качестве входных значений нейросети будут значения количества единиц автотранспорта за пять последовательных замеров, в качестве желаемого выхода нейронной сети будет известное количество единиц автотранспорта в следующий момент времени за этими пятью.
Данные с камер наблюдения за автомобильными потоками будут являться исходными данными, из которых необходимо выбрать непрерывные фрагменты временного ряда (к примеру, за пять дней).
Подготовка исходных данных будет заключаться в приведении всех значений временного ряда х к «общему знаменателю» (преобразование, в результате которого область возможных значений будет ограничиваться отрезком [0;1]).
В преобразованных данных нулевое значение должно соответствовать минимальному значению исходной выборки, а единичное - максимальному. Унифицированная переменная х подсчиты-вается по формуле
X = х - х™ , (2)
х — х
max min
где хть, хтах являются наименьшим и наибольшим значениями исходного временного ряда.
В результате преобразований получается временной ряд в диапазоне, который ограничен отрезком [0;1]. Затем вычисляется среднее значение ряда, которое вычитается из полученной выборки. Таким образом, получается временной ряд с математическим ожиданием среднего, которое будет равно нулю.
Обучающая выборка подготавливается с помощью Microsoft Office Excel. В программе выполняются следующие операции:
- копируется столбец преобразованных данных в соседние пять столбцов;
- второй столбец сдвигается на одну ячейку вверх, третий - на две ячейки вверх и т.д.
Получается таблица, которая представляет собой обучающий пример, в котором первые пять
чисел строки (X1, X2, X3, X4, X5) будут входными значениями нейронной сети, а шестое число (Y) будет желаемым значением выхода нейронной сети.
Столбцы Х1—Х5 - значения количества автотранспорта в пять последних отсчетов времени, столбец Y - желаемое значение выхода нейронной сети. От выбранного количества входов нейронной сети будет зависеть объем обучающей выборки. С учетом объема исходных данных в описываемом примере будут использованы пять дней измерений.
Обучающая выборка будет содержать 720 строк. Нейросеть, имеющая 720 входов, построила бы лучший прогноз, чем сеть, с пятью входами, но тогда будет всего один обучающий пример, поэтому обучение будет бессмысленным.
Это важно учитывать, осуществляя выбор числа входов нейронной сети, необходимо выбирать между глубиной предсказания (число входов нейронной сети) и качеством обучения нейронной сети (объем тренировочного набора) [4].
Создание и обучение сети может осуществляться с помощью аналитической платформы Deductor Studio.
В данной программе столбцы выборки X1, X2, X3, X4, X5 настраиваются как входные, которые будут использованы для обучения нейронной сети, столбец Y настраивается в качестве желаемого выхода сети. Исходная выборка разбивается на обучающее множество (90 %) и тестовое (10 %). После чего выбирается структура сети и функция активации.
При краткосрочном прогнозировании используется трехслойная нейронная сеть, во входном слое которой пять нейронов, в скрытом слое два нейрона и в выходном слое один нейрон. Количество нейронов во входном слое будет определяться тем, какое количество переменных содержится в обучающей выборке. Подбор количества нейронов скрытого слоя осуществляется экспериментально по минимальной ошибке работы сети.
Определение количества нейронов выходного слоя будет определяться глубиной прогноза. Функция активации, которая реализуется каждым из нейронов - сигмоида. Затем выбирается алгоритм и задаются параметры обучения. Алгоритм обратного распространения ошибки содержит следующие параметры:
- скорость обучения - данным параметром определяется величина шага при итерационной коррекции весов в нейронной сети (данный параметр рекомендовано задавать в интервале 0.. .1);
- момент - данным параметром учитывается величина последнего изменения веса при коррекции весов (интервал составляет 0.1).
В описываемой сети выбирается алгоритм обратного распространения ошибки со скоростью обучения 0,1 и моментом обучения 0,9.
Далее определяются условия, при выполнении которых прекращается обучение: при условии, что рассогласование между эталонным и реальным выходом сети становится меньше заданного значения; по количеству циклов обучения, по достижении которых обучение будет остановлено независимо от величины ошибки. Затем осуществляется обучение сети.
Обученная модель должна давать точные результаты не только на обучающих примерах, но и на любых других. Для проверки наличия в обученной модели обобщающей способности модель тестируется на примерах, которые не использовались при обучении.
Таким образом, из исходного набора данных, помимо обучающего множества, создается и тестовое, ошибка на котором будет являться показателем оценки обобщающей способности.
Оценка обобщающей способности нейросети
С помощью ошибки обобщения выявляется эффект переобучения. При обучении происходит постоянное уменьшение ошибки обучения до минимального значения, после этого обучение прекращается.
При параллельном отслеживании ошибки обобщения видно, что она сначала будет также уменьшаться, но с определенного этапа обучения она увеличивается в результате эффекта переобучения. Таким образом, пытаясь добиться максимальной точности на обучающем множестве, модель будет терять часть обобщающей способности, в результате чего ухудшается качество работы с реальными данными. В связи с этим процесс обучения должен останавливаться, как только начинается возрастание ошибки обобщения. После обучения сети получается максимальная ошибка для обучающего множества 0,0163, а для тестового - 0,0110 [5].
Следует отметить, что точность будет характеризоваться ошибкой между истинным значением и полученным. Могут быть использованы различные типы ошибок. Чаще всего снижение точности является проблемой, из-за чего невозможно получение достоверных результатов, необходимых для приобретения знаний об объекте исследования. В результате этого могут быть приняты неверные решения. В программе Deductor существует возможность графического представления нейронной сети со всеми нейронами входного, скрытого и выходного слоя (рис. 3).
Граф нейросети
\
\
КЗ Ж Y
/
» /
-12,0707383029392 ■0,571738568261093 10,3272611EG37G
Рис. 3. Экран программы «Граф нейросети» в программе Deductor
Обученная сеть применяется к выборке из временного ряда количества единиц автотранспорта за пять дней другого временного интервала, которая не знакома нейронной сети. При использовании выборки с новыми данными проводятся все мероприятия, которые проводились и над обучающей выборкой: приведение к диапазону [0;1] и вычитание из полученной выборки среднего значения, чтобы математическое ожидание среднее было равно нулю. Затем формируется массив из пяти столбцов с входными значениями и одного столбца с выходными значениями, значения столбцов сдвигаются вверх.
Заключение
Полученная выборка подключается с помощью мастера импорта, настраиваются столбцы Х1—Х5 в качестве входа сети, а столбца У - в качестве выхода. Программа Deductor позволяет применить обученную сеть к новым данным временного ряда с помощью специального механизма «Скрипт» [6]. При его использовании к новой выборке в качестве модели указывается модель обученной нейронной сети. Это позволяет получить результат обработки новых данных обученной сетью. Сеть почти точно осуществляет прогнозирование следующего значения количества единиц автотранспорта по пяти предыдущим значениям. При прогнозировании максимальная ошибка прогноза составляет около 116 %, а среднее значение ошибки - около 7 % [5].
Результаты прогноза могут использоваться на практике при формировании локальных прогнозов количества единиц автотранспорта в районах с установленными камерами наблюдения. Чтобы повысить точность прогноза, целесообразно осуществить привязку количества единиц автотранспорта к дням недели, периоду года [7].
Использование нейронных сетей для прогнозирования имеет и недостатки. Обычно необходимо не менее 100 наблюдений, чтобы создать приемлемую модель, что является достаточно большим числом данных и чаще всего получить такие данные нет возможности. Но, несмотря на это, с помощью нейросетей может быть построена удовлетворительная модель даже при недостаточном количестве данных. Созданная модель может в дальнейшем уточняться по мере поступления новых данных.
Библиографический список
1. Иванов, Н. И. Инженерная экология и экологический менеджмент / Н. И. Иванов, И. М. Фадин. - М. : Логос, 2011. - 528 с.
2. Шумилин, А. Д. Мониторинг и прогнозирование влияния автомобильного транспорта на воздушный бассейн города Пенза / А. Д. Шумилин, Н. Н. Вершинин, Л. А. Авдонина // Надежность и качество сложных систем. - 2016. - № 2 (14). - С. 97-103.
3. Ясницкий, Л. Н. Системный анализ алгоритмов нейросетевого детектирования лжи / Л. Н. Ясницкий,
A. М. Петров, З. И. Сичинава // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2010. - № 1 (13). - С. 64-72.
4. Волчихин, В. И. Перспективы использования искусственных нейронных сетей с многоуровневыми квантователями в технологии биометрико-нейросетевой аутентификации / В. И. Волчихин, А. И. Иванов,
B. А. Фунтиков, Е. А. Малыгина // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2013. - № 4 (28). - С. 86-96.
5. Рощупкин, Э. В. Прогноз количества автотранспорта на улицах города с помощью нейронных сетей / Э. В. Рощупкин // Известия ТулГУ. Технические науки. - 2010. - Вып. 4. - Ч. 2. - С. 178-187.
6. BaseGroupLabs. Технологии анализа данных. - URL: https://basegroup.ru/ (дата обращения - 20.02.2017).
7. Гришко, А. К. Синтез тестовых образов для оценки стойкости нейросетевых преобразователей в системах биометрической идентификации / А. К. Гришко, В. С. Лукин, Н. К. Юрков // Надежность и качество сложных систем. - 2017. - № 2 (18). - С. 32-40.
Шумилин Алексей Дмитриевич
аспирант,
Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]
Вершинин Николай Николаевич
доктор технических наук, профессор, заведующий кафедрой техносферной безопасности, Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]
Вершинин Алексей Евгеньевич
магистрант,
Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]
Волкова Алиса Сергеевна
аспирант,
Пензенский государственный университет (440026, Россия, г. Пенза, ул. Красная, 40) E-mail: [email protected]
Shumilin Alexey Dmitrievich
postgraduate student,
Penza State University
(440026, 40 Krasnaya street, Penza, Russia)
Vershinin Nikolay Nikolaevich
doctor of technical sciences, professor,
head of sub-department of technospheric safety,
Penza State University
(440026, 40 Krasnaya street, Penza, Russia)
Vershinin Aleksey Evgen'evich
undergraduate student, Penza State University (440026, 40 Krasnaya street, Penza, Russia)
Volkova Alisa Sergeevna
postgraduate student,
Penza State University
(440026, 40 Krasnaya street, Penza, Russia)
УДК 536.24 Шумилин, А. Д.
Использование нейросетей для прогнозирования влияния автотранспорта на экологическую обстановку города / А. Д. Шумилин, Н. Н. Вершинин, А. Е. Вершинин, А. С. Волкова // Надежность и качество сложных систем. - 2018. - № 1 (21). - С. 100-107. DOI 10.21685/2307-4205-2018-1-13.