УДК 004.942:62-50:519-714
DOI: 10.18698/0236-3933-2018-1-49-58
НЕИРОАДАПТИВНОЕ УПРАВЛЕНИЕ ТРАНСПОРТНЫМИ ПОТОКАМИ В СЕТИ ГОРОДСКИХ ДОРОГ
A.И. Дивеев1 [email protected] Е.А. Софронова1 [email protected]
B.А. Михалев2 [email protected]
1 Федеральный исследовательский центр «Информатика и управление» РАН, Москва, Российская Федерация
2 Инженерная академия, РУДН, Москва, Российская Федерация
Аннотация
Рассмотрена задача адаптивного управления транспортными потоками в сети городских дорог. Использована расширяемая модель транспортных потоков, построенная на основе теории управляемых сетей. Для уточнения параметров сети, пропускных способностей участков дорог и распределений потоков применена искусственная нейронная сеть. Разработана специальная структура нейронной сети. Обучение сети выполнено алгоритмом обратного распространения ошибки. Приведен пример работы адаптивной системы оптимального управления транспортными потоками в сети дорог, состоящей из четырех перекрестков
Ключевые слова
Нейроадаптивное управление, оптимальное управление, транспортный поток, искусственная нейронная сеть, теория управляе-мьх сетей
Поступила в редакцию 22.06.2017 © МГТУ им. Н.Э. Баумана, 2018
Работа выполнена при финансовой поддержке РФФИ (грант № 16-08-00639-а)
Введение. Эффективное управление транспортными потоками в загруженной сети городских дорог заключается в определении оптимальных значений длительностей рабочих фаз светофоров на близко расположенных перекрестках.
Для решения задачи расчета оптимальных значений длительностей фаз светофоров необходима как можно более точная модель движения транспортных потоков в сети городских дорог. Известные математические модели дорожного движения [1-7] учитывают только средние значения потоков на участках сети, а не точное число машин на каждом участке в конкретный момент времени.
Наиболее точная модель управления транспортными потоками, построенная на основе теории управляемых сетей [8-10], позволяет находить значения транспортных потоков с точностью до числа машин на каждом участке дороги. Такая математическая модель представляет собой систему рекуррентных уравнений, которые описывают изменение числа машин на каждом участке дороги в каждый такт времени.
Модель расширяемой сети, позволяющая использовать объединение нескольких моделей для нескольких перекрестков, приведена в работе [10]. Основной недостаток модели — необходимость точно знать параметры сети,
в частности пропускную способность каждого перекрестка, которая задает число машин, способных совершить конкретный маневр на конкретном перекрестке за один такт, и параметры распределения потока, которые указывают долю потока на участке дороги, совершающего этот маневр.
В реальной сети оценку числа транспорта на определенных участках дорог осуществляют с помощью регистраторов. Параметры пропускных способностей и распределений зависят от времени суток, погоды, непредвиденных обстоятельств и дорожно-транспортных происшествий. Если параметры сети отличаются от парамеров модели, то рассчитанные по модели длительности фаз светофоров не будут оптимальными, поэтому реальные значения транспортных потоков на выходных участках дорог будут отличаться от ожидаемых значений.
Для уточнения модели в работе предложено использовать нейроадаптив-ное управление [11, 12]. Искусственная нейронная сеть (ИНС) настраивает параметры модели так, чтобы ожидаемые выходы модели и реального объекта управления совпадали.
Для уточненной модели решаем задачу поиска оптимальных длительностей фаз светофоров. Обучение ИНС выполняем методом обратного распространения ошибки [13].
Математическая модель транспортных потоков на основе теории управляемых сетей. Рассмотрим несколько моделей транспортных потоков.
Модель одной сети. Для описания параметров потоков введем временной интервал Дt, который назовем тактом управления. Будем полагать, что длительности всех фаз светофоров измеряются целыми числами, At. Допустим, что все светофоры синхронизированы так, что отсчет тактов на каждом перекрестке происходит одинаково для всех. Для определения численных характеристик транспортного потока в каждый такт времени на каждом участке дороги используем вектор состояний
х(£) = [%1(£),..., хь(к)]\ где хг(к) определяет число автомобилей на участке дорог г в такт к, Х{(к)еЛ1, г = 1,...,Ь, к = 0,...,Ы, N — число тактов управления.
Модель транспортных потоков на основе управляемых сетей [8-10] описывается следующей системой рекуррентных уравнений:
х(к) = х(к -1) - ((х(к - 1)1Ь) 0 Л(ц(к)) 0 Б --((х(к - 1)1Ь) О Л(ц(к)) 0 Б - Л(ц(к)) © В))1ь + +((х(к - 1)1Ь) О Л(ц(к)) 0 Б --((х(к - 1)1Ь) О Л(ц(к)) © Б - Л(ц(к)) © В))т 1ь + ё(к). (1)
Здесь 1Ь = [1,... ,1]; Ь — число участков дорог; © — адамарово произведение
Ь
матриц, Л 0В = Н, Н = [Н^], кг^ = • Ьг^, г,] = 1,...,Ь; - — натуральное вычитание,
I a - Ь, если a > Ь, a - Ь = \
I 0, если иначе;
A — матрица смежности, Л = [иг,у],иг,у е {0,1}, г,у = 1,...,L. Если иу =1, то существует маневр с участка г на участок у; и — вектор управления, и = [м1,...,им]т, иг е {0,..., и -1}; и — номер рабочей фазы светофора на перекрестке г; и — число рабочих фаз светофоров на перекрестке г, г = 1,...,М; Л(и) — матрица конфигураций, которая является матрицей смежности частичного подграфа графа сети, Л(и) = [иг,у(и)]; иг,у(и)е{0,1}, г,у = 1,...,L. Матрица конфигураций Л(и) получается заменой нулем некоторых единиц матрицы смежности Л графа сети; Б — матрица распределений, Б = №,у], ^,у е[0,1], ,у определяет, какая часть потока, находящегося на участке г, собирается совершить маневр на участок у сети; В — матрица пропускных способностей, В = [Ьг,у], Ьг,у е и {0}, Ьг,у определяет максимально возможный поток с участка г на участок у сети;
ё(к) = [51(к),...,5L(к)]т; 5г(к) — число дополнительных автомобилей, прибывающих на участок/убывающих с участка г = 1,.., Ь; к — номер такта.
Матрицы обладают одинаковой размерностью и структурой: Ьг,у > 0, ,у > 0, если и,у =1, иначе Ьг,у = 0, у = 0.
Ь
Для всех участков сети должно соблюдаться ограничение ^ ,у =1, г = 1,..., Ь.
у=1
Модель расширяемой сети. При добавлении новых участков дорог в модель (1) изменяются размерности матриц, так как в графе сети увеличивается число узлов, поэтому модель необходимо переписывать заново. Для того чтобы объединить несколько моделей в одну, используем расширяемую модель [9], в которой для объединения графов вводятся дополнительные матрицы соединений.
Рассмотрим сеть дорог, состоящую из нескольких подсетей. Модели подсетей (1) представляем в виде наборов матриц:
Ш = (Л1(и(к)), В1,Б1: I = 1,...,К), (2)
где I — номер подсети.
В каждой модели подсети I определим целочисленные векторы, элементы которых являются номерами входных и выходных участков дорог:
V1 =
где V1 — индекс входной дороги в подсеть I; wli — индекс выходной дороги из подсети; «0 — число входных дорог в подсеть; « — число выходных дорог из подсети.
Для объединения моделей всех подсетей в одну сеть введем матрицы соединений для каждой подсети
- - т - -
vi. -Vlt n0 _ > wl = wi . ,wll "1 _
и1 = [г1}], г = 1,..,п1,), I = 1,...,к.
Здесь г,— номер элемента в векторе входных участков дорог для участка ).
(3)
Использование матриц соединений позволяет моделировать динамику потоков во всех подсетях одновременно. На каждом интервале Лt пересчитываем вектор потока в соответствии с матрицами соединений:
Нейроадаптивное управление потоками транспорта. Модели (2), (4), (7) существенно зависят от значений параметров матриц В и Б. Для уточнения параметров модели, матриц В и Б в каждой подсети дорог используем двухслойную ИНС. В целях повышения эффективности обучения структуру нейронной сети свяжем с архитектурой подсети дорог.
Обозначим через у(к) число автомобилей, совершивших маневр за такт управления к по модели (2), (3), а реальное число автомобилей, совершивших маневр, через у (к), и оценим точность модели 8 =|| у (к) - у(к)||2, где у(к) — подвектор х(к) модели (2), (3); у (к) — наблюдаемый подвектор состояний х (к) транспортного потока в реальной сети.
Подстройку параметров с помощью ИНС включаем при нарушении условия в > 8+, 8+ — заданная положительная величина.
Искусственную нейронную сеть включаем в случае отклонения значений моделируемого вектора транспортных потоков от реального. В качестве входа ИНС используем полный вектор реальных транспортных потоков х (к) и вектор управления ц(к) настраиваемой подсети дорог. Выходами ИНС являются значения элементов матриц В1 и Б1 для подсети I.
Рассмотрим структуру используемой ИНС. Введем матрицу весов
т(к) = Б © Л(ц(к)) 0 В © Л(ц(к)), где 0 — поэлементное матричное деление,
а / Ь, если Ь > а,
Матрица т является матрицей Ь х Ь весов первого слоя. Матрица весов второго слоя п совпадает с элементами искомой матрицы В:
В качестве функции активации между первым и вторым слоями используем функцию насыщения
Vr/,j = у*0, xL(k) = Xß(k), где i = 1,..,«1; j,l = 1,...,K; а = vi,; ß = w\.
0, если иначе.
n(k ) = B © A(u(k)).
1, если 1 < 2; /(г) = < г, если 0 < 2 < 1; 0, если иначе.
Структура ИНС изменяется в соответствии с изменением конфигурации подсети городских дорог.
Схема прямого распространения сигнала в сети показана на рисунке, а, схема нейроадаптивного управления в сети городских дорог — на рисунке, б.
Вход
Выход
б
Схемы прямого распространения сигнала в ИНС (а) и нейроадаптивного управления
в сети городских дорог (б)
Сформулируем очевидное утверждение. Если в модели (2) и в ИНС матрицы A(u), B, D и 11 совпадают, то этого достаточно, чтобы выходы ИНС и модели совпадали х(к) = ъ(к).
Для настройки матриц m и п ИНС используем метод обратного распространения ошибки [13], метод обучения многослойного перцептрона на основе итеративного градиентного алгоритма.
Вычислительный эксперимент. В качестве примера рассмотрим управление транспортными потоками в сети городских дорог вблизи станции метро «Тульская» (Москва).
Сеть дорог состоит из четырех подсетей. Размерности матриц A, B, D для первой подсети — 3 х3, для второй — 6 х 6, для третьей — 13 х13, для четвертой — 6 х 6.
Первоначально было рассчитано число автомобилей, которые покидают сеть дорог при неизменном управлении и неизменных параметрах распределе-
ний потоков и пропускных способностей перекрестков. Затем было проведено четыре вычислительных эксперимента, каждый 16 раз.
Первый эксперимент заключался в следующем: рассчитывали число автомобилей, которые покинули рассматриваемую сеть дорог при неизменном управлении и одном изменении параметров распределений потоков и пропускных способностей перекрестков.
Во втором эксперименте проводился расчет числа автомобилей, которые покинули рассматриваемую сеть дорог, при этом каждый раз генетическим алгоритмом находили новое оптимальное управление. На этом этапе значения параметров распределений потоков и пропускных способностей оставались неизменными.
Третий эксперимент начинался так же, как и второй. Рассчитывали новое управление и число автомобилей, которые покинули транспортную сеть. Отличался он тем, что в процессе управления единожды изменяли параметры распределений потоков и пропускных способностей сети.
Четвертый эксперимент начинался как третий: рассчитывали управление, затем в процессе управления изменяли параметры распределений потоков и пропускных способностей перекрестков. На этом этапе использовался нейро-адаптивный подход для уточнения изменившихся параметров модели и расчета нового управления.
В каждом эксперименте проводили равнозначное изменение параметров распределений потоков и пропускных способностей участков сетей, в которых подобные изменения имели место. На двух из четырех перекрестках приблизительно на 50 % изменились значения параметров.
Результаты эксперимента представлены в таблице, в которой использованы следующие обозначения: А — среднее отклонение пропускной способности сети от значения, полученного при неизменном управлении и параметрах сети,
г — номер эксперимента, г =1,...,4; N — число измерений, N = 16; М — число тактов моделирования, М = 1000; q — вектор-индикатор выходных дорог сети,
Оптимальное управление во втором эксперименте позволило получить наибольший прирост пропускной способности рассматриваемой сети дорог (14 %), применение ИНС — новые значения параметров для расчета оптимального управления, которое увеличило пропускную способность измененной сети. По результатам эксперимента можно сделать следующие выводы: - алгоритм расчета отимального управления стабилен и для рассмотренной сети городских дорог дает постоянный прирост пропускной способности;
А* = — X Xxi(k)qт "Xx*(k)q
N j=1 k=1 k=1
1 NM M
1, если i e w, 0, если иначе;
Л — дисперсия [14]; а — среднеквадратичное отклонение, с = л!~0.
- разработанная ИНС успешно решает задачу идентификации параметров модели транспортных потоков в сети городских дорог.
Результаты экспериментов
Номер эксперимента i А D а
1 0,07 0 0
2 0,14 4,5 2,1
3 0,05 16,3 4,0
4 0,0005 10,5 3,2
Заключение. Рассмотрена нейроадаптивная система управления транспортными потоками для расширяемой модели, построенной на основе теории управляемых сетей. Проведен эксперимент по увеличению пропускной способности реальной сети дорог. Точность идентификации изменившихся параметров сети дорог позволяет решить задачу оптимального управления длительностями фаз светофоров для увеличения пропускной способности сети.
ЛИТЕРАТУРА
1. Ligthill M.J., Whitham F.R.S. On kinetic waves II. A theory of traffic flow on crowded roads // Proc. of the Royal Society Ser. A. 1955. Vol. 229. Iss. 1178. P. 317-345. DOI: 10.1098/rspa.1955.0089
2. Mauro V. Road network control // Concise Encyclopedia of Traffic and Transportation Systems. Advances in Systems, Control in Information Engineering. Pergamon Press, 1991. P. 361-366.
3. Ardekani S.A., Herman R. Urban network-wide variables and their relations // Transportation Science. 1987. Vol. 21. No. 1. P. 1-16.
4. Assad A.A. Multicommodity network flows — a survey // Networks. 1978. Vol. 8. Iss. 1. P. 37-91. DOI: 10.1002/net.3230080107
5. Peter T. Modeling nonlinear road traffic networks for junction control // Int. J. of Applied Mathematics and Computer Sciences. 2012. Vol. 22. Iss. 3. P. 723-732.
DOI: 10.2478/v10006-012-0054-1
URL: https://www.degruyter.com/view/j/amcs.2012.22.issue-3/v10006-012-0054-1/ v10006-012-0054-1.xml
6. Chao K.-H., Lee R.-H., WangM.-H. An intelligent traffic light control based on extension neural network // Proc. 12th Int. Conf. KES 2008. Part I. 2008. Springer-Verlag. P. 17-24.
7. Hu J., Zhao D., Zhu F. Neural network based online traffic signal controller design with reinforcement training // Proc. 14th Int. IEEE Conf. on Intelligent Transportation Systems (ITSC). 2011, IEEE. P. 1045-1050.
8. Дивеев А.И. Управляемые сети и их приложения // Журнал вычислительной математики и математической физики. 2008. Т. 48. № 8. С. 1510-1525.
9. Diveev A.I., Sofronova E.A. Synthesis of intelligent control of traffic flows in urban roads based on the logical network operator method // Proc. European Control Conf. (ECC 2013). 2013, IEEE. P. 3512-3517.
10. Diveev A.I., Sofronova E.A., Mikhalev V.A. Model predictive control for urban traffic flows // Proc. 2016 IEEE Int. Conf. on Systems, Man, and Cybernetics (SMC 2016). 2016, IEEE. P. 3051-3056.
11. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981. 448 с.
12. Терехов В.А., Ефимов Д.В., Тюкин И.Ю. Нейросетевые системы управления. М.: Высшая школа, 2002. 183 с.
13. Каллан Р. Основные концепции нейронных сетей. М.: Вильямс, 2003. 288 с.
14. Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения. М.: Академия, 2003. 464 с.
Дивеев Асхат Ибрагимович — д-р техн. наук, профессор, заведующий сектором проблем кибернетики отдела нелинейного анализа и проблем безопасности Федерального исследовательского центра «Информатика и управление» РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 44, корп. 2).
Софронова Елена Анатольевна — канд. техн. наук, доцент, старший научный сотрудник отдела нелинейного анализа и проблем Федерального исследовательского центра «Информатика и управление» РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 44, корп. 2).
Михалев Василий Андреевич — аспирант, Инженерная академия, Российский университет дружбы народов (Российская Федерация, 117198, Москва, ул. Миклухо-Маклая, д. 6).
Просьба ссылаться на эту статью следующим образом:
Дивеев А.И., Софронова Е.А., Михалев В.А. Нейроадаптивное управление транспортными потоками в сети городских дорог // Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение. 2018. № 1. С. 49-58. БО!: 10.18698/0236-3933-2018-1-49-58
NEUROADAPTIVE CONTROL OF TRAFFIC FLOWS IN URBAN ROAD NETWORK
A.I. Diveev1 [email protected]
E.A. Sofronova1 [email protected]
V.A. Mikhalev2 [email protected]
1 Federal Research Center Computer Science and Control, Russian Academy of Sciences, Moscow, Russian Federation
2 Engineering Academy, RUDN University, Moscow, Russian Federation
Abstract
The article deals with a neuroadaptive control problem for urban traffic flows. In our research we used an expandable mathematical model of traffic flows. To adjust network parameters, traffic capacity of road sections and flow distributions, we introduced an artificial neural network. Moreover, we developed a special structure of the neural network. Neural network training was performed by backpropagation. Finally, we gave example of adaptive optimal control system performance for four crossroads
Keywords
Neuroadaptive control, optimal control, traffic flow, artificial neural networks, controlled network theory
Received 22.06.2017 © BMSTU, 2018
This work was supported by the Russian Foundation for Basic Research (grant no. 16-08-00639-a)
REFERENCES
[1] Ligthill M.J., Whitham F.R.S. On kinetic waves II. A theory of traffic flow on crowded roads. Proc. of the Royal Society Ser. A, 1955, vol. 229, iss. 1178, pp. 317-345. DOI: 10.1098/rspa.1955.0089
[2] Mauro V. Road network control. In: Concise Encyclopedia of Traffic and Transportation Systems. In: Advances in Systems, Control in Information Engineering. Pergamon Press, 1991. Pp. 361-366.
[3] Ardekani S.A., Herman R. Urban network-wide variables and their relations. Transportation Science, 1987, vol. 21, no. 1, pp. 1-16.
[4] Assad A.A. Multicommodity network flows — a survey. Networks, 1978, vol. 8, iss. 1, pp. 37-91. DOI: 10.1002/net.3230080107
[5] Peter T. Modeling nonlinear road traffic networks for junction control. Int. J. of Applied Mathematics and Computer Sciences, 2012, vol. 22, iss. 3, pp. 723-732.
DOI: 10.2478/v10006-012-0054-1
Available at: https://www.degruyter.com/view/jVamcs.2012.22.issue-3/v10006-012-0054-1/ v10006-012-0054-1.xml
[6] Chao K.-H., Lee R.-H., Wang M.-H. An intelligent traffic light control based on extension neural network. Proc. 12th Int. Conf. KES 2008. Part I, 2008, Springer-Verlag, pp. 17-24.
[7] Hu J., Zhao D., Zhu F. Neural network based online traffic signal controller design with reinforcement training. Proc. 14th Int. IEEE Conf. on Intelligent Transportation Systems (ITSC), 2011, IEEE, pp. 1045-1050.
[8] Diveev A.I. Controlled networks and their applications. Computational Mathematics and Mathematical Physics, 2008, vol. 48, iss. 8, pp. 1428-1442. DOI: 10.1134/S0965542508080125
[9] Diveev A.I., Sofronova E.A. Synthesis of intelligent control of traffic flows in urban roads based on the logical network operator method. Proc. European Control Conf. (ECC 2013), 2013, IEEE, pp. 3512-3517.
[10] Diveev A.I., Sofronova E.A., Mikhalev V.A. Model predictive control for urban traffic flows. Proc. 2016 IEEE Int. Conf. on Systems, Man, and Cybernetics (SMC 2016), 2016, IEEE, pp. 3051-3056.
[11] Fomin V.N., Fradkov A.L., Yakubovich V.A. Adaptivnoe upravlenie dinamicheskimi ob''ektami [Adaptive control on dynamic objects]. Moscow, Nauka Publ., 1981. 448 p.
[12] Terekhov V.A., Efimov D.V., Tyukin I.Yu. Neyrosetevye sistemy upravleniya [Neural control systems]. Moscow, Vysshaya shkola Publ., 2002. 183 p.
[13] Callan R. The essence of neural network. Prentice Hall, 1998. 248 p.
[14] Venttsel E.S., Ovcharov L.A. Teoriya veroyatnostey i ee inzhenernye prilozheniya [The probability theory and its engineering applications]. Moscow, Akademiya Publ., 2003. 464 p.
Diveev A.I. — Dr. Sc. (Eng.), Professor, Head of Sector of Cybernetics Problems, Nonlinear Analysis and Safety Problem Department, Federal Research Center Computer Science and Control, Russian Academy of Sciences (Vavilova ul. 44, Moscow, 119333 Russian Federation).
Sofronova E.A. — Cand. Sc. (Eng.), Assoc. Professor, Senior Researcher, Nonlinear Analysis and Safety Problem Department, Federal Research Center Computer Science and Control, Russian Academy of Sciences (Vavilova ul. 44, Moscow, 119333 Russian Federation).
Mikhalev V.A. — post-graduate student, Engineering Academy, RUDN University (Mi-klukho-Maklaya ul. 6, Moscow, 117198 Russian Federation).
Please cite this article in English as:
Diveev A.I., Sofronova E.A., Mikhalev V.A. Neuroadapive Control of Traffic Flows in Urban Road Network. Vestn. Mosk. Gos. Tekh. Univ. im. N.E. Baumana, Priborostr. [Herald of the Bauman Moscow State Tech. Univ., Instrum. Eng.], 2018, no. 1, pp. 49-58 (in Russ.). DOI: 10.18698/0236-3933-2018-1-49-58
Биорадиолокация
В Издательстве МГТУ им. Н.Э. Баумана вышла в свет монография (2-е издание) под редакцией A.C. Бугаева, С.И. Ивашова
«Биорадиолокация»
Освещены вопросы радиолокации биологических объектов (биорадиолокации) — метода, который может быть использован для обнаружения живых людей, находящихся за преградами, и дистанционного определения параметров их дыхания и сердцебиения. Биорадиолокация может найти применение в различных областях: спасательных операциях; антитеррористической борьбе; медицине и др. Описаны физические основы процесса биорадиолокации, особенности биорадиолокаторов с непрерывным и импульсным зондирующими сигналами, а также методы расчета и моделирования процессов в биорадиолокации. Для научных работников, аспирантов и студентов старших курсов.
По вопросам приобретения обращайтесь:
105005, Москва, 2-я Бауманская ул., д. 5, стр. 1 +7 (499) 263-60-45 [email protected] www.baumanpress.ru