НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ январь-февраль 2019 Том 19 № 1 ISSN 2226-1494 http://ntv.i1mo.ru/
SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS January-February 2019 Vol. 19 No 1 ISSN 2226-1494 http://ntv.ifmo.ru/en
УДК 004.75
ОПТИМИЗАЦИЯ ПРОЕЗДА ОПАСНЫХ УЧАСТКОВ ДОРОГ
БЕСПИЛОТНЫМИ ТРАНСПОРТНЫМИ СРЕДСТВАМИ
И.А. Зикратов% И.И. Викснинь, Т.В. Зикратова''
''Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича, Санкт-Петербург, 193232, Российская Федерация
ьУниверситет ИТМО, Санкт-Петербург, 197101, Российская Федерация
сВоенный институт (военно-морской политехнический) ВУНЦ ВМФ «Военно-морская академия», Пушкин, 197045, Российская Федерация
Адрес для переписки: igzikratov@yandex.ru Информация о статье
Поступила в редакцию 04.11.18, принята к печати 19.12.18 doi: 10.17586/2226-1494-2019-19-1-155-165 Язык статьи - русский
Ссылка для цитирования: Зикратов И.А., Викснин И.И., Зикратова Т.В. Оптимизация проезда опасных участков дорог беспилотными транспортными средствами // Научно-технический вестник информационных технологий, механики и оптики. 2019. Т. 19. № 1. С. 155-165. doi: 10.17586/2226-1494-2019-19-1-155-165
Аннотация
Предмет исследования. Рассмотрена задача оптимизации управления наземными беспилотными транспортными средствами в сложных дорожных условиях. Показано, что при централизованном способе управления транспортными средствами на участках дорог с сужением проезжей части возможно минимизировать время преодоления опасного участка, соблюдая требования безопасности для участников дорожного движения. Метод управления движением беспилотных транспортных средств основан на модели динамического программирования. Метод обладает потенциально высокой скоростью по сравнению с простым перебором вариантов проезда опасного участка. Такой результат достигается за счет приведения задачи управления к классу экстремальных задач, решение которых основывается на рекуррентном соотношении Беллмана. В рамках предлагаемого метода участок дороги с находящимися на ней автомобилями рассматривается как система с дискретным временем, которая обладает конечным множеством состояний. После нахождения оптимального решения центральное устройство передает команды управления на транспортные средства об изменении скорости и направления движения таким образом, чтобы выполнялись заданные критерии и ограничения. Основные результаты. Работоспособность метода проиллюстрирована на примере управления транспортными средствами на двухполосной дороге, одна из полос которой перекрыта для движения. Доказано, что существует решение, позволяющее за минимальное время всем автомобилям покинуть опасный участок с обеспечением мер безопасности. Практическая значимость. Разработанный метод применим для управления беспилотными транспортными средствами, имеющими радиосвязь с центральным процессором, входящим в состав дорожной инфраструктуры в условиях изолированной среды, когда в составе транспортных средств отсутствуют автономные транспортные средства. Ключевые слова
беспилотные транспортные средства, динамическое программирование, дорожное движение, уравнение Беллмана
OPTIMIZATION OF DANGEROUS SECTION PASSAGE FOR UNMANNED VEHICLES I.A. Zikratova, I.I. Viksninb, T.V. Zikratovac
aBonch-Bruevich Saint Petersburg State University of Telecommunications, Saint Petersburg, 193232, Russian Federation bITMO University, Saint Petersburg, 197101, Russian Federation
cMilitary Institute (Naval Politechnic) Naval Military Educational and Scientific Center "Naval Academy", Pushkin, 197045, Russian Federation
Corresponding author: igzikratov@yandex.ru Article info
Received 04.11.18, accepted 19.12.18 doi: 10.17586/2226-1494-2019-19-1-155-165 Article in Russian
For citation: Zikratov I.A., Viksnin I.I., Zikratova T.V. Optimization of dangerous section passage for unmanned vehicles. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2019, vol. 19, no. 1, pp. 155-165 (in Russian). doi: 10.17586/2226-14942019-19-1-155-165
Abstract
Subject of research. The research is focused on optimization management tasks of the ground unmanned vehicles in difficult conditions. We showed that it is possible to minimize passage time of road sections with narrowing and maintain security requirements in case of the centralized management. Method. A method of the unmanned cars movement is based on the dynamic programming model. The method provides faster movement than by full search of all possible variants for dangerous road section passage. Such result is achieved by the reorganization of the control task to the class of extreme tasks and the solution of such tasks is based on the Bellman recurrence equation. According to the proposed method a road section is considered as a system with discrete time and finite set of the end positions. Optimal plan of the cars movement is prepared by the central computing device, which has gathered information about road infrastructure and vehicles. The central device is sending control commands to the cars about the change of speed and movement direction in such a way that given criteria and restrictions are satisfied. Main results. The efficiency of the method is demonstrated by the example of driving on a two-lane road. One of the road lanes is blocked for traffic. It is proved that there is a solution that enables all cars to leave the dangerous road section in the shortest time with safety measures. Practical relevance. The proposed method is applicable for control of unmanned vehicles communicating with the central control device by wireless radio. The central control device is a part of the road infrastructure in conditions of isolated environment when there are no any fully autonomous vehicles in the group. Keywords
unmanned vehicles, dynamic programming, traffic, Bellman equation
Введение
Технологии управления наземными беспилотными транспортными средствами развиваются по нескольким направлениям. К их числу можно отнести создание разнообразных парктроников и помощников парковки с использованием технологий «дополненной реальности», выбора корректной траектории движения [1], адаптивных круиз-контроля и автопилотов, комплексов экстренного торможения перед препятствием [2] и объезда препятствий [3], алгоритмов безопасного и быстрого разворота, проезда перекрестка дорог [4-8] и т.д. Однако в последние годы все больше внимания уделяется разработке предназначенных для решения комплекса взаимосвязанных задач алгоритмов управления автомобилем [9-12], позволяющих полностью исключить человека из процесса управления беспилотным транспортным средством (БТС). Разработка таких алгоритмов направлена на достижение двух взаимосвязанных целей:
1) повышение эффективность перевозок;
2) обеспечение безопасности на дорогах.
Первая цель достигается за счет использования современных алгоритмов оптимального управления БТС. В настоящей работе представлен алгоритм, позволяющий решать одну из типовых задач организации дорожного движения - нахождение оптимального плана безопасного проезда опасного участка дороги беспилотными транспортными средствами.
В работе рассматриваются возможные подходы к решению задач оптимизации управления БТС. Вводятся ограничения и допущения. В качестве методологической основы решения выбраны «клеточная модель» транспортной сети [13] и метод динамического программирования, базирующийся на рекуррентном соотношении Беллмана. Решение задачи проиллюстрировано элементарным примером.
Подходы к моделированию транспортных потоков
При моделировании транспортных потоков принято выделять три уровня детализации: макроскопический, мезоскопический, микроскопический [14]. Макромодели описывают движение транспортных средств на высоком уровне агрегирования - изучаются характеристики потока: плотность, средняя скорость, интенсивность. Отдельные транспортные средства в этих моделях не учитываются, а описываются процессы изменения транспортного потока во времени и пространстве с помощью математического аппарата, например, дифференциальных уравнений, для составления которых применяют законы гидродинамики.
Микромоделирование позволяет описывать поведение и взаимодействие отдельных транспортных средств, составляющих транспортный поток. В микромоделировании каждый автомобиль является отдельным объектом, свойства которого позволяют описывать взаимодействие автомобилей друг с другом и с дорожной сетью [15]. Модель позволяет изучать процессы, происходящие в транспортном потоке при ускорении, замедлении, перестроении автомобилей, а также при изменении маршрута следования.
Мезоскопические модели находятся на среднем уровне детализации: например, описаны отдельные транспортные средства, но не их взаимодействие.
Можно выделить класс моделей, которые позволяют описывать взаимодействие отдельных систем, узлов и агрегатов автомобилей при выполнении ими тех или иных действий. Для оптимизации дорожного движения такие модели не используются.
Таким образом, для решения задачи оптимизации взаимодействия БТС в различных условиях дорожной обстановки целесообразно использовать микромодели. Следует отметить, что к этому классу относятся модели, построенные на клеточных автоматах, которые хорошо зарекомендовали себя при моде-
лировании системы управления БТС на перекрестках [16].
В качестве центра управления (ЦУ) системой могут использоваться специально созданные элементы дорожной инфраструктуры, оснащенные вычислительными комплексами и системами связи, или распределенные вычислительные системы, базирующиеся на вычислительных комплексах и средствах обмена информацией БТС.
Постановка задачи и выбор метода решения
Одной из причин образования заторов и дорожно-транспортных происшествий (ДТП) на дорогах является сужение проезжей части вследствие ремонтных работ, стоящего автомобиля и т.д. Это приводит к необходимости перестроения автомобилей на свободную полосу движения, что вынуждает соседей по потоку снижать скорость движения и сокращать безопасную дистанцию. В настоящее время водители осуществляют эти действия, порой не понимая замысла соседей по потоку, что нередко приводит к ДТП и еще большим затруднениям для дорожного движения.
В случае беспилотного транспорта возможно организовать управление отдельными БТС таким образом, чтобы обеспечить максимально возможную скорость преодоления опасного участка при соблюдении заданных требований по безопасности дорожного движения. Для этого воспользуемся моделью транспортной системы, основанной на клеточных автоматах с дискретным временем и состоянием. Будем рассматривать систему «группа БТС-участок дороги» и процессы в ней как дискретные, т.е. ограничившись их значениями в фиксированные моменты времени tk,tk + ^к +В каждый момент времени tk + f система может находиться в одном из состояний 5 е £, где £ - множество всех состояний системы. Под состоянием системы будем понимать совокупность элементарных участков местности (ЭУМ) и находящихся на них БТС, характеризующихся скоростью и направлением движения, информацию о которых получает ЦУ В состоянии 8 каждый беспилотник может занимать (двигаться или стоять) один или несколько ЭУМ в зависимости от скорости движения и осуществляемого маневра. Тогда при наличии в группе N автомобилей, намеревающихся проехать в данном направлении, в какие-то моменты времени возможна ситуация, когда на один и тот же ЭУМ могут претендовать несколько БТС. Рассмотрим пример (рис. 1).
Рис. 1. Участок двухполосной дороги с расположенными на нем беспилотными транспортными средствами и препятствием в левой полосе
На рис. 1 представлен участок дороги из двух полос, который условно разделен на ЭУМ. По дороге двигаются в попутном направлении три автомобиля - зеленый, красный и синий. На левой полосе, по которой двигается синий автомобиль, находится препятствие. Для его преодоления синий автомобиль вынужден перестраиваться на правую полосу. Однако в момент перестроения на ЭУМ правой полосы могут находиться зеленый и красный автомобили. Необходимо найти такие управляющие воздействия для этих трех БТС, чтобы они покинули этот участок дороги в кратчайшее время при соблюдении мер безопасности.
Тогда целью управления является перевод системы роботизированных БТС из некоторого начального состояния (рис. 1) в заданное конечное так, чтобы некий функционал f (х) достигал экстремального значения с учетом принятых ограничений при условии, что переменные х принадлежат некоторой области О:
| Г(х )=> ехи, (1)
[ х е О.
Сформулированная задача может решаться с использованием как метода перебора возможных вариантов преодоления группой БТС опасного участка, так и методов решения экстремальных задач. Очевидно, что при всей простоте метода перебора размерность задачи критически возрастает при увеличении плотности транспортного потока. Этого недостатка лишены известные методы оптимизации.
В зависимости от вида функции f (х) и области О используют квадратичное, выпуклое,
динамическое или целочисленное программирование и т.д. Для системы «группа БТС-участок дороги» как системы с дискретным временем и состояниями задачи решаются методом динамического программирования (ДП). ДП характеризуется тем, что позволяет найти оптимальное решение «-мерной задачи путем ее декомпозиции на п этапов, каждый из которых представляет подзадачу относительно одной переменной [17]. Общая задача оптимизации, чтобы ее можно было описать моделью ДП, должна
удовлетворять следующим условиям:
1) задача должна интерпретироваться как «-шаговый процесс;
2) целевая функция должна быть аддитивной, т.е. представляться в виде суммы показателей эффективности на каждом шаге;
3) структура задачи должна быть определена для любого п и не зависеть от этого числа (принцип вложенности);
4) на каждом шаге система определяется конечным числом параметров состояния и управляется конечным числом переменных управления.
Сформулируем целевую функцию и систему ограничений задачи оптимального управления из
следующих соображений.
- Для нашего примера введем следующие ограничения и допущения:
1) БТС могут двигаться с одной из трех фиксированных скоростей - v1, v2 и v3. Первая скорость - БТС за один отрезок времени проезжает один ЭУМ; вторая - БТС за один отрезок времени проезжает два ЭУМ; третья - БТС проезжает три ЭУМ за один отрезок времени;
2) при наборе скорости или торможении БТС за один отрезок времени может изменять скорость от v1 до v2, или от v2 до v3 (рис. 2);
ti
2 3 4
t2
1 2 3 4 5
t3
2 3 4
5 6 7
vl
v3
Рис. 2. Равномерное движение с v1 (БТС1), и движение с набором скорости - ускорение от v1 до v3 за три отрезка времени (БТС2)
3) в зависимости от скорости движения при выполнении перестроения на другую полосу движения БТС проходит различное количество ЭУМ за отрезок времени (рис. 3).
1 2 3 4
1 2 3 4
1
vl
v2
2 3 4
I
v3
Рис. 3. Перестроение БТС из правого ряда в левый при разных скоростях движения
Для оценки безопасности маневрирования БТС при переходе из одного состояния s е S в другое s' е S введем понятие штрафа. Для простоты введем двоичную систему штрафования. Штраф mulct равен нулю, если в результате маневра выполняются условия:
1) при следовании автомобилей в одной полосе движения скорость заднего автомобиля не превышает скорость переднего (ограничение по разности скоростей в потоке);
2) автомобиль не занимает один или несколько ЭУМ, которые в предыдущем состоянии занимал БТС, следующий впереди (ограничение по дистанции).
При невыполнении этих условий состоянию присваивается штраф. При невыполнении условий несколькими БТС штрафы состояния суммируются (рис. 4).
1 2 3 4 5 6 7
1 2 3 4 5 6 7
МИМ
■ Пи
I I |*П I
ш Ги
Si
S2 mulct=0
i 2 3 4 5 6 7
б
l 2 3 4 5 6 7
В
mulct=2
Рис. 4. Переход системы «группа БТС-участок дороги» из состояния si в s2: без штрафа (а) и со штрафами (б)
На рис. 4, а автомобили БТС2 и БТС3 при переходе системы в s2 сокращают дистанцию до БТС1, но БТС3 следует по свободной полосе, а БТС2 не занимает ЭУМ, который БТС1 занимал в состоянии si. Штраф не назначается (mulct = 0).
На рис. 4, б БТС2 и БТС3 в результате маневрирования занимают ЭУМ, которые были заняты в предыдущем состоянии. Начислено два штрафа (mulct = 2).
1
5
1
а
Введенные допущения и ограничения позволяют рассматривать задачу (1) оптимального управления БТС на опасном участке дороги как задачу динамического программирования. Управление в задаче ДП представляет совокупность решений Lk, принимаемых на каждом шаге k и переводящих систему из состояния 5к-1 в текущее sk. Качество управления количественно оценивается с помощью функций fk (Lk, sk_1), являющихся слагаемыми аддитивной целевой функции, характеризующей общую эффективность управления. Оптимальное управление сводится к выбору такого оптимального воздействия L, при котором достигается максимум суммы значений fk (k = 1,2,...,и - 1) на соответствующей траектории в предположении об оптимальности всех последующих шагов. В данной задаче под управлением понимается совокупность решений по выбору для каждого автомобиля, находящегося на рассматриваемом участке дороги, траектории и скорости движения из перечня возможных, согласно введенным ограничениям.
Обозначим через Zk (sk) максимальное значение функций fk на k-м шаге, при условии, что
объект в начале шага k находится в состоянии sk_1. Тогда функция Zk (sk) должна удовлетворять рекуррентному соотношению Беллмана:
Zk (sk) = max { fk (Lk, sk_1) + Zk_1 (sk_1)}. (2)
Предположим, что результатом управления системой «группа БТС-участок дороги» должна являться максимальная пропускная способность участка дороги с препятствием при условии обеспечения заданного уровня безопасности, тогда: 1 N Х /
f = N Ъ "А , (3)
где N - число БТС на участке дороге на k-м шаге; Xi - число ЭУМ, которое необходимо преодолеть г-му БТС для преодоления участка дороги; xi k - число ЭУМ, которое преодолевает г-й БТС на k-м шаге при
x.
выбранном варианте управления Ь . Отношение 'ух. показывает «успешность» действий /'-го БТС на
к-м шаге. Например, если очередность проезда выбрана так, что для преодоления опасного участка все БТС, находящиеся на нем, за один отрезок времени преодолели все ЭУМ этого участка, то qk =1.
Кроме функций /к на к-м шаге можно вычислять штрафы, соответствующие состоянию при выборе управляющего воздействия. Накопленные в этом случае штрафы могут использоваться как ограничения по выбору оптимальной траектории управления.
Способ оптимального управления БТС на опасном участке дороги
Проиллюстрируем работу системы управления БТС методом ДП на элементарном примере (рис. 5).
Рис. 5. Участок двухполосной дороги с движущимися с разными скоростями БТС и препятствием в левой полосе
На рис. 5 представлено исходное состояние системы 50, в которой имеется три автомобиля - БТС1
двигается со скоростью 1, БТС2 - со скоростью 3 и БТС3 - со скоростью 2. Рассматриваемый участок включает 10 ЭУМ, один из которых занят препятствием. Необходимо, используя соотношения (2) и (3), предложить оптимальный план проезда данного участка дороги.
Для того чтобы БТС покинули участок дороги с препятствием, им необходимо преодолеть: БТС1 -три ЭУМ, включая тот, на котором он находится в состоянии б0 , БТС2 и БТС3 - по пять ЭУМ.
С учетом скоростей движения БТС и принятых ограничений на следующем отрезке времени система из 50 может быть переведена в одно из состояний, представленных на рис. 6.
■УЦ ^12 Д'п ____ -Ун ^15 _____
М ДШ I В1 II I I Ш I I ' IP] I j I I I Ш
\шч и дч [ i ^ICTPI lieze i gi ign итв
Рис. 6. Возможные состояния БТС
Из кинематики перемещений видно, что при переходе из 50 в 511 БТС1 преодолеет один из трех ЭУМ, БТС2 два из пяти, и БТС3 - один из пяти. Тогда, согласно (3), функция качества управления при переходе от состояния s0 в 511 будет равна:
к = 3 (>3+%+К)=0
= 0,311.
По аналогии рассчитаем значения функции /к для остальных состояний после первого этапа управления и сведем результаты в табл. 1.
Таблица 1. Значения функции качества для возможных состояний БТС
/««° Г«0 «12 Г«0 «13 г«0 «14 Г«0 У «15 Г«0 Аб
0,311 0,378 0,311 0,422 0,489 0,556
Далее рассмотрим, в какие состояния может перейти система на втором этапе управления (на втором отрезке времени). Так, из «п система может перейти в два состояния (рис. 7).
«21
«22
Рис. 7. Возможные состояния перехода из состояния «0
В состояние «21 система переходит путем снижения скорости БТС2 до 1, при этом он занимает ЭУМ, на котором находился проехавший вперед БТС1. В состояние «22 система переходит, если БТС1 увеличит скорость движения на единицу (в принятой трехуровневой классификации скорости движения БТС). Следует отметить, что в состояние «22 система «группа БТС-участок дороги» может также перейти (при соответствующих командах управления БТС) из состояний «13 и «14.
Рассуждая подобным образом, можно определить состояния, в которые может перейти система, находящая в «11- «16 (рис. 8).
«21
«23
^Ы | | | цд
«22
«24
«25
«26
Щ
ЕЗ
«27
«28
«29
Рис. 8. Возможные состояния системы на втором этапе управления
Возможные переходы из одного состояния системы в другое удобно представить в виде графа, узлами которого являются состояния системы, а дугами - возможные варианты перехода в эти состояния из предыдущих состояний (рис. 9).
Рис. 9. Граф возможных переходов системы из одного состояния в другое для двух этапов управления
Значения функции /к для второго этапа сведем в табл. 2.
Таблица 2. Значения функции качества для БТС системы на втором этапе
«к «к-1 /к ши1й «к «к-1 А ши1й
«0 «11 0,31 1 «14 «22 0,64 2
«0 «12 0,38 2 «14 «24 0,53 1
«0 «13 0,31 2 «14 «25 0,72 3
«0 «14 0,42 2 «15 «26 0,75 1
«0 «15 0,49 2 «15 «27 0,83 2
«0 «16 0,56 3 «16 «28 0,78 2
«11 «21 0,36 1 «16 «29 0,89 3
«11 «25 0,72 3 «26 «28 0,33 0
«11 «22 0,64 2 «26 «29 0,67 0
«24 «28 0,67 1
«24 «29 0,83 2
«13 «21 0,36 3
«13 «22 0,64 3
«13 «24 0,53 2
«13 «25 0,72 4
На третьем этапе управления система может быть переведена в одно из следующих состояний (рис. 10).
«32 «33
Рис. 10. Возможные состояния системы на третьем этапе управления Граф возможных переходов системы на третьем этапе управления будет иметь вид (рис. 11).
Рис. 11. Полный граф переходов системы
Табл. 2 дополнится следующими значениями (табл. 3).
Таблица 3. Значения функции качества для БТС системы на третьем этапе
sk Sk-1 fk mulct sk Sk-1 fk mulct
s0 S11 0,31 1 S24 S31 0,42 1
s0 S12 0,38 2 S24 S28 0,67 1
s0 S13 0,31 2 S24 S29 0,83 2
s0 S14 0,42 2 S25 S32 0,75 1
s0 S15 0,49 2 S25 S33 1,00 2
s0 S16 0,56 3 S26 S28 0,33 0
s11 S21 0,36 1 S26 S29 0,67 0
s11 S25 0,72 3 S27 S32 0,50 0
s11 S22 0,64 2 S27 S33 1,00 0
S12 S23 0,67 3 S28 S32 0,50 0
S13 S21 0,36 3 S28 S33 1,00 0
S13 S22 0,64 3 S29 S33 1,00 0
s13 S24 0,53 2 S31 S33 1,00 1
s13 S25 0,72 4 S32 s33 1,00 0
S14 S22 0,64 2 S21 s31 0,61 2
S14 S24 0,53 1 S21 S29 0,89 3
S14 S25 0,72 3
S23 S32 0,75 1
S15 S26 0,75 1 S23 S33 1,00 2
S15 S27 0,83 2
S16 S28 0,78 2
S16 S29 0,89 3
S22 S28 0,67 0
S22 S29 0,83 1
После построения графа переходов, вычисления значений f и mulct можно осуществлять поиск оптимальной траектории управляющих воздействий по переводу системы «группа БТС-участок дороги» из s0 в конечное состояние s33, используя рекуррентное соотношение (2), соответствующее «прямой прогонке» в терминах ДП. Так как на первом шаге каждому состоянию su- s16 соответствует единственный (оптимальный) вариант перехода от состояния s0 , перейдем ко второму шагу.
Рассматривая узел s21 графа перехода (рис. 11), замечаем, что есть два способа достижения этого узла - из узла s11 и узла s13:
10,31 + 0,36] 10,671 = max < max < ^ = 0,67,
[0,31 + 0,36[0,67 J
где числовые значения взяты из табл. 3.
Можно выбрать любой способ. Будем полагать, что оптимальный путь от состояния s0 к состоянию s21 через s11. Таким образом, оптимальный путь к s21 найден, независимо от того, какие варианты управления окажутся более подходящими в дальнейшем.
По аналогии находим оптимальные пути к состояниям s12 - s16:
I s0 + s11, s11 + s2: (opt s21) = max <
s0 + s11 S11 + S22 0,31 + 0,64
( 0Pt S22 = max s0 + s13 S13 + S22 > = max 0,31 + 0,64
s0 + s14 S14 + S22 0,42 + 0,64
( 0Pt S23 = max { S0 + S12, S12 + S23 } = max {0,38 + 0,67}
= 1,06 (^0 ^ s14 ^ S22);
( opt S24 ) = max< S0 Л + s13 + s14 513 514 + S24 + S24 ■ = max 0,31 + 0,53 0,42 + 0,53 = 0,95 (s0 ^ s14 ^ s24
S0 + S11 S11 + S25 0,31 + 0,72'
( opt S25 ) = max S0 + S13 S13 + S25 > = max 0,31 + 0,72 ' =1,14 (s0 ^ s14 - s25);
s0 + S14 S14 + S25 0,42 + 0,72
( opt S26 ) = max • s0 + S15 S15 + S26 } = max {0,49 + 0,75} = 1,24 (s0 ^ S15 - s26 );
( opt S27 = max •s0 + S15 S15 + S27 , = max {0,49 + 0,83} = 1,32 (s0 ^ S15 - S27 ).
= max
= max
При поиске оптимального пути к s28 примем во внимание следующее. К этому узлу ведут дуги из узлов s22, s24, s26, и s16. Для s22, s24, s26 оптимальные решения уже найдены - opt s22, opt s24 и opt s26. Тогда
0,56 + 0,78' 1,06 + 0,67 0,95 + 0,67 1,24 + 0,33
Заметим, что полученные значения достигаются за различное число этапов (отрезков времени). Для траектории s0 + s16 + s28 состояние s28 достигается за два отрезка времени, в то время как для остальных - за три. Исходя из этого выполним нормировку полученных значений на количество отрезков времени:
(opt s28) = max
opt s22 + s28
opt s24 + s28 opt S26 + S28
1,34 1,73 1,62 1,57
(opt s28) = max
Для s2i
(opt s29) = max
1,34/
1,73/
1,62/
1,57/
= max
0,67 0,58 0,54 0,52
= 0,67 (s0 ^ s16 ^ S28 ) .
S0 + S16 , S16 + S29 0,72
opt s21 + s29 0,52
opt s22 + s29 ■ = max 0,63
opt s24 + s29 0,64
opt s26 + s29 0,72
= 0,72 (s0 ^ s16 ^ S29 ).
Аналогичные расчеты выполним для состояний s31 и s32
fopt s + s 1 f0 43l
(opt s31) = max<^
(opt s32) = max
opt S21 + S31 J 0,43
= max ^
opt S24 + S31 „ 1 0, 46
opt S23 + S32 0,59
opt S25 + S32 0,63
> = max
opt s27 + s32 0,60
opt s28 + s32 0,61
° 63 (s0 ^ s14 ^ s25
^ S32)
Теперь можно определить оптимальное управление для достижения системой конечного состояния 533:
(opt s33) = max
opt s23 + s33 0,68
opt S25 + S33 0,71
opt s27 + s33 0,76
opt S28 + S33 ■ = max 0,77
opt s29 + s33 0,81
opt s31 + s33 0,59
opt s32 + s33. 0,72
= 0,81(s0 ^ s16 ^ S29 ^ S33 ) .
Таким образом, для того чтобы автомобили с наименьшими потерями времени преодолели опасный
участок дороги, команды управления направлением и скоростью, передаваемые с ЦУ, последовательно переводили систему «группа БТС-участок дороги» из состояния s0 в s16, s29 и, наконец, в s33.
Очевидно, что управление по данной схеме предусматривает, с одной стороны, относительно высокие скорости объектов управления, с другой - минимальные дистанции между БТС. Это приводит к увеличению риска возникновения аварийной ситуации. Для контроля безопасности управления используется система штрафов: на искомые решения могут накладываться ограничения либо применяются методы многокритериальной оптимизации.
В первом случае необходимо определить некое пороговое значение допустимого штрафа mulct,,, с которым сравнивается текущее значение. Величина mulctп может быть определена, например, путем моделирования аварийных ситуаций.
В нашем примере для opt s33 суммарное значение:
mulct s = mulct s + mulct s + mulct s = 3+3+0=6,
s33 s0 ~'s16 ' 29 i29_*s33
где числовые значения взяты из табл. 3.
Если mulcts < mulctп, решение opt s33 принимается. В противном случае в качестве оптимального
рассматривается opt s33 = 0,77 (s0 ^ s16 ^ s28 ^ s33), для которого, в свою очередь, вычисляется mulct и сравнивается с порогом mulctп. Перечисленные процедуры применяются до тех пор, пока не будет выполнено неравенство mulct < mulctп.
Заключение
Таким образом, использование принципов динамического программирования для управления беспилотными транспортными средствами в области организации дорожного движения позволяет повысить среднюю скорость движения на загруженных участках дорог, что приводит к увеличению пропускной способности дорожной сети при соблюдении требований безопасности. Представление ситуации на дороге в виде дискретных состояний и поэтапное решение задачи позволяет снизить размерность задачи по сравнению с методом прямого перебора. Кроме того, при возникновении на каком-либо этапе управления состояний, для которых уже найдены оптимальные траектории, центральное устройство может использовать соответствующие команды управления без дополнительных вычислений.
Литература
Carlino D., Boyles S.D., Stone P. Auction-based autonomous intersection management // Proc. 1641 Int. IEEE Conf. on Intelligent Transportation Systems (ITSC 2013). Hague, Netherlands, 2013. P. 529-534. doi: 10.1109/ITSC.2013.6728285 Wuthishuwong C., Traechtler A. Vehicle to infrastructure based safe trajectory planning for Autonomous Intersection Management // Proc. 13th Int. Conf. on ITS Telecommunications (ITST). Tampere, Finland, 2013. P. 175-180. doi: 10.1109/ITST.2013.6685541 Vahidi A., Eskandarian A. Research advances in intelligent collision avoidance and adaptive cruise control // IEEE Transactions on Intelligent Transportation Systems. 2003. V. 4. N 3. P. 143-153. doi: 10.1109/TITS.2003.821292 Ho C., Reed N., Spence C. Multisensory in-car warning signals for collision avoidance // Human Factors: The Journal of the Human Factors and Ergonomics Society. 2007. V. 49. N 6. P. 1107-1114. doi: 10.1518/001872007X249965 Au T., Zhang S., Stone P. Autonomous intersection management for semi-autonomous vehicles / In: Handbook of Transportation. Taylor & Francis, 2015. P. 88-104. Dresner K., Stone P. A multiagent approach to autonomous intersection management // Journal of Artificial Intelligence Research. 2008. V. 31. P. 591-656.
Wu J., Abbas-Turki A., El Moudni A. Cooperative driving: an ant colony system for autonomous intersection management // Applied Intelligence. 2012. V. 37. N 2. P. 207-222. doi: 10.1007/s10489-011-0322-z
Zohdy I.H., Kamalanathsharma R.K., Rakha H. Intersection management for autonomous vehicles using iCACC // Proc. 15th Int. IEEE Conf. on Intelligent Transportation Systems (ITSC). Anchorage, USA, 2012. P. 1109-1114. doi: 10.1109/ITSC.2012.6338827
Varaiya P. Smart cars on smart roads: problems of control // IEEE Transactions on Automatic Control. 1993. V. 38. N 2.
References
Carlino D., Boyles S.D., Stone P. Auction-based autonomous
intersection management. Proc. 16th Int. IEEE Conf. on Intelligent
Transportation Systems, ITSC 2013. Hague, Netherlands, 2013,
pp. 529-534. doi: 10.1109/ITSC.2013.6728285
Wuthishuwong C., Traechtler A. Vehicle to infrastructure based safe
trajectory planning for Autonomous Intersection Management. Proc.
13th Int. Conf. on ITS Telecommunications, ITST. Tampere, Finland,
2013, pp. 175-180. doi: 10.1109/ITST.2013.6685541
Vahidi A., Eskandarian A. Research advances in intelligent
collision avoidance and adaptive cruise control. IEEE
Transactions on Intelligent Transportation Systems, 2003, vol. 4,
no. 3, pp. 143-153. doi: 10.1109/TITS.2003.821292
Ho C., Reed N., Spence C. Multisensory in-car warning signals
for collision avoidance. Human Factors: The Journal of the
Human Factors and Ergonomics Society, 2007, vol. 49, no. 6,
pp. 1107-1114. doi: 10.1518/001872007X249965
Au T., Zhang S., Stone P. Autonomous intersection management
for semi-autonomous vehicles. In Handbook of Transportation.
Taylor & Francis, 2015, pp. 88-104.
Dresner K., Stone P. A multiagent approach to autonomous intersection management. Journal of Artificial Intelligence Research, 2008, vol. 31, pp. 591-656.
Wu J., Abbas-Turki A., El Moudni A. Cooperative driving: an ant colony system for autonomous intersection management. Applied Intelligence, 2012, vol. 37, no. 2, pp. 207-222. doi: 10.1007/s10489-011-0322-z
Zohdy I. H., Kamalanathsharma R. K., Rakha H. Intersection management for autonomous vehicles using iCACC. Proc. 15th Int. IEEE Conf. on Intelligent Transportation Systems, ITSC. Anchorage, ' USA, 2012, pp. 1109-1114. doi: 10.1109/ITSC.2012.6338827
Varaiya P. Smart cars on smart roads: problems of control. IEEE Transactions on Automatic Control, 1993, vol. 38, no. 2, pp. 195-207.
2.
3
3.
4
4
5.
5.
6
6
7.
7.
8
8.
9
9
P. 195-207.
10. Bazzan A.L.C. A distributed approach for coordination of traffic signal agents // Autonomous Agents and Multi-Agent Systems. 2005. V. 10. N 1. P. 131-164. doi: 10.1007/s10458-004-6975-9
11. Beeson P. O'Quin J., Gillan B. et. al. Multiagent interactions in urban driving // Journal of Physical Agents. 2008. V. 2. N 1. P. 15-29. doi: 10.14198/JoPha.2008.2.1.03
12. Halle S., Chaib-draa B. A collaborative driving system based on multiagent modelling and simulations // Transportation Research Part C: Emerging Technologies. 2005. V. 13. N 4. P. 320-345. doi: 10.1016/j.trc.2005.07.004
13. Cremer M., Ludwig J. A fast simulation model for traffic flow on the basis of Boolean operations // Mathimatics and Computers Simulation. 1986. V. 28. N 4. P. 297-303. doi: 10.1016/0378-4754(86)90051-0
14. Ахмадинуров М.М., Завалищин Д.С., Тимофеева Г.А. Математические модели управления транспортными потоками. Екатеринбург: УрГУПС, 2011. 120 с.
15. Alvarez I., Poznyak A., Malo A. Urban traffic control problem via a game theory application // Proc. 46th IEEE Conference on Decision and Control. New Orleans, 2007. P. 2957-2961. doi: 10.1109/cdc.2007.4434820
16. Зикратов И.А., Викснин И.И., Зикратова Т.В. Мультиагентное планирование проезда перекрестка дорог беспилотными транспортными // Научно-технический вестник информационных технологий, механики и оптики. 2016. Т. 16. № 5. С. 839-849. doi: 10.17586/22261494-2016-16-5-839-849
17. Таха Х.А. Введение в исследование операций. 7-е изд. М: Вильямс, 2005. 912 с.
Авторы
Зикратов Игорь Алексеевич - доктор технических наук, профессор, декан факультета, Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича, Санкт-Петербург, 193232, Российская Федерация, Scopus ID: 56321572700, ORCID ID: 0000-0001-9054-800X, igzikratov@yandex.ru
Викснин Илья Игоревич - научный сотрудник, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, Scopus ID: 57191359693, ORCID ID: 0000-0002-3071-6937, wixnin@cit.ifmo.ru
Зикратова Татьяна Викторовна - преподаватель, Военный институт (военно-морской политехнический) ВУНЦ ВМФ «Военно-морская академия», Пушкин, 197045, Российская Федерация, ORCID ID: 0000-0001-8365-658X, ztv64@mail.ru
10. Bazzan A.L.C. A distributed approach for coordination of traffic signal agents. Autonomous Agents and Multi-Agent Systems, 2005, vol. 10, no. 1, pp. 131-164. doi: 10.1007/s10458-004-6975-9
11. Beeson P. O'Quin J., Gillan B. et. al. Multiagent interactions in urban driving. Journal of Physical Agents, 2008, vol. 2, no. 1 pp. 15-29. doi: 10.14198/JoPha.2008.2.1.03
12. Halle S., Chaib-draa B. A collaborative driving system based on multiagent modelling and simulations. Transportation Research Part C: Emerging Technologies, 2005, vol. 13, no. 4, pp. 320-345. doi: 10.1016/j.trc.2005.07.004
13. Cremer M., Ludwig J. A fast simulation model for traffic flow on the basis of Boolean operations. Mathimatics and Computers Simulation, 1986, vol. 28, no. 4, pp. 297-303. doi: 10.1016/0378-4754(86)90051-0
14. Akhmadinurov M.M., Zavalishchin D.S., Timofeeva G.A. Mathematical Models of Traffic Management. Ekaterinburg UrSURT Publ., 2011, 120 p. (in Russian)
15. Alvarez I., Poznyak A., Malo A. Urban traffic control problem via a game theory application. Proc. 46h IEEE Conference on Decision and Control. New Orleans, 2007, pp. 2957-2961. doi: 10.1109/cdc.2007.4434820
16. Zikratov I.A., Viksnin I.I., Zikratova T.V. Multiagent planning of intersection passage by autonomous vehicles. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2016, vol. 16, no. 5, pp. 839-849. doi: 10.17586/2226-1494-2016-16-5-839-849
17. Taha H.A. Operations Research: An Introduction. 8th ed. Prentice Hall, 2006, 838 p.
Authors
Igor A. Zikratov - D.Sc., Professor, Dean, Bonch-Bruevich Saint Petersburg State University of Telecommunications, Saint Petersburg, 193232, Russian Federation, Scopus ID: 56321572700, ORCID ID: 0000-0001-9054-800X, igzikratov@yandex.ru
Ilya I. Viksnin - Scientific researcher, ITMO University, Saint Petersburg, 197101, Russian Federation, Scopus ID: 57191359693, ORCID ID: 0000-0002-3071-6937, wixnin@cit.ifmo.ru
Tatyana V. Zikratova - lecturer, Military Institute (Naval Politechnic) Naval Military Educational and Scientific Center "Naval Academy", Pushkin, 197045, Russian Federation, ORCID ID: 0000-0001-8365-658X, ztv64@mail.ru