УДК 004.67 Карпова А.А., Роменко Е.Д.
Карпова А.А.
студент
Российский университет транспорта (МИИТ) (г. Москва, Россия)
Роменко Е.Д.
студент
Российский университет транспорта (МИИТ) (г. Москва, Россия)
ОБЩИЙ АНАЛИЗ И АНАЛИТИЧЕСКАЯ МОДЕЛЬ РАСЧЕТА СТОИМОСТИ ПРОЕЗДА ПО ПЛАТНЫМ ДОРОГАМ МОСКОВСКОГО РЕГИОНА
Аннотация: в настоящий момент в Российской Федерации наблюдается активное развитие дорожной деятельность. Одним из аспектов этого развития, в соответствии с ФЗ-157, является формирование платных дорог. Можно выделить два крупных вида таких дорог: внутригородские магистрали, и федеральные трассы. Строительство и управление платными магистралями осуществляется разными компаниями-концессионерами, что приводит к различиям в тарифах и способах их расчета. Тарифная информация зачастую хранится в различных источниках, что создает значительные трудности для автомобилистов при планировании маршрутов, проходящих через несколько платных участков, принадлежащих разным операторам. В связи с этим возникает необходимость в создании унифицированного инструмента, который позволит упростить процесс расчета стоимости проезда для пользователей автомобильных дорог. В данной статье предлагается выведение аналитической модели для сервиса для расчета стоимости проезда по платными дорогами города Москва, который интегрирует данные о тарифах различных концессионеров и предоставляет пользователям возможность быстро оценить общую стоимость проезда по нескольким платным дорогам. Подобный сервис не только упростит планирование маршрутов, но и повысит прозрачность тарифной политики, что будет способствовать более комфортному использованию платных дорог.
Ключевые слова: платные дороги, аналитическая система, анализ данных, тарифы, стоимость проезда, геоданные.
Формирование списка дорог для построения дата-сета.
Для формирования единого набора данных, описывающих стоимость проезда по платным дорогам необходимо обозначить предметную область. Так предлагается сформировать дата-сет для участков дорог, которыми пользуются жители Москвы, попадающих в площадь Центральной Кольцевой Автомобильной Дороги (ЦКАД).
Под выбранные критерии попадают следующие автомобильные дороги из общего списка платных дорог России [10]:
1. М-1 «Беларусь» (участок 33км - 66км),
2. М-4 «Дон» (участок 21км - 93км),
3. М-11 «Нева» (участок от МКАД до Солнечногорска»),
4. М-12 «Восток» (участок от МКАД до ЦКАД),
5. МСД,
6. Проспект Багратиона (СДКП),
7. Северный объезд Одинцова (СОО),
8. ЦКАД.
Операторами взимания оплаты дорог осуществляют четыре концессионера, а именно:
ООО «Автодор - Платные дороги»: М-1 «Беларусь», М-4 «Дон», М-12 «Восток», ЦКАД.
ГКУ «АМПП»: МСД.
ООО «ОССП»: М-11 «Нева».
АО «НКД»: Проспект Багратиона (СДКП), Северный объезд Одинцова
(СОО).
Создание структуры дата-сета.
После изучения тарифной сетки (тарифная сетка платных дорог — это набор тарифов, который позволяет определить стоимость проезда по платной
магистрали) каждой автодороги [1][2][3][4], было начато создание структуры таблицы.
Для унификации информации всех автомобильных дорог в ходе процесса структурирования данных таблица приняла следующий оптимальный вид по столбцам (рисунок 1):
«Дорога» - обозначение конкретной дороги.
«День недели» - указание дня недели, в который действует данная цена.
«Временной диапазон» - временной промежуток, в который действует данный тариф.
«Время начала действия» - время начала действия промежутка (берется из столбца «Временной диапазон»).
«Время окончания действия» - время окончания действия промежутка (берется из столбца «Временной диапазон»).
«Тип ТС» - тип транспортного средства, используемого для проезда по платной дороге.
«Зона» - конкретная зона дороги (с указанием дороги в скобках), в которой действует данный тариф.
«Транспондер» - наличие транспондера для данного тарифа.
«Тип транспондера» - тип транспондера для данного тарифа (если транспондера нет - указывается «-»).
«Цена» - цена за проезд по данному участку дороги, с учетом транспондера и его типа, времени, направления и дня недели.
«Тариф» - тариф для оплаты проезда. Может быть базовый (без транспондера), по транспондеру и с оплатой по госномеру (проспект Багратиона).
«Направление» - направление движения: из Москвы, в Москву, все направления, по часовой и против часовой стрелке (ЦКАД).
«Время постоплаты» - для тарифов с оплатой по госномеру (проспект Багратиона).
<аё» - идентификатор дороги и зоны для сопоставления в БД.
«name» - отображаемое название отрезка при визуализации на карте. «color» - цветовой HEX-код пути на карте, относящегося к той или иной
дороге.
«geodata» - линия в GeoJSON формате, отрисовывающая положение дороги на карте.
Рисунок 1. Фрагмент таблицы со структурой данных.
Формирование дата-сета с данными о стоимости проезда.
Для формирования дата-сета с данными о стоимости проездапотребовалось ознакомиться с сеткой тарифов каждого концессионера и заполнить таблицу (рисунок 1) в соответствии с вышеперечисленной оптимальной структурой.
Сложность заполнения состоит в том, что у каждого концессионера разные промежутки времени с разными тарифами для разных типов транспортных средств. Так, например, у концессионеров ООО «Автодор -Платные дороги»[1] и ГКУ «АМПП» [4] тариф не меняется в течение суток, а у ООО «ОССП» [2] и АО «НКД» [3] - меняется в зависимости от времени проезда по трассе, причем, промежутков внутри одного дня может быть несколько, и при этом они могут чередоваться для одного и того же участка дороги (зоны) в зависимости от дня недели (например, будни и выходные дни) или типа транспортного средства (легковые автомобили - 1 класс - и грузовые автомобили - 4 класс) (рисунки 2, 3). Соответственно, необходимо учитывать эту несогласованность во временных промежутках при формировании дата-сета.
Тарифы за проезд ло участку от МКАД до Солнечногорска автомобильной дороги М-11 «Москва -Санкт-Потербург»
(стопместь проезда дгя пользователей, осуществляющих проезд бе: использования транспондера Секции 15-58. в рублях)
Тарифы денггаительиы с 19 апреля 2024 года
Группа 1: Мотоцикл ы с прицепом (коллегой! и без них; легковые автомобили с прицелом» без них; фургоны, микроавтобусы с числом мест дли сидения да 11: грузовые автомибилк высотой не более 2 м. с двумя и более оелляи.
маршруты в« Дим Л OU ML* пдет- СуббО**
01:00-Di:D0 0fc№01:00* 06:00 14:0« Z2:№OUKr 14:00-ilOO 06:0в-10?э0 ияиняо* 10:00-ie:oo оьяо-1200 12:00-17:00 £1:0D-41:KT 17:00-21:HJ
Москва - Шереметьево-2 100 430 43C 410 430 420 430 430 430
Москва - Шереметъ?во-1 200 5SQ 580 SRO 580 580 5S0 SSO 580
Москва - Зеленоград 200 530 730 730 730 730 530 S30 530
Москва ЦКАД 100 740 1 02U 1 100 1020 1 100 790 790 790
.:..,,-.- 300 740 1020 1 100 1020 1100 790 790 790
Москва Солисчжэгорс! 630 950 1 300 1 400 1300 1400 1 060 1060 1 0€0
Шереметьево-./ - М-псисэ ion 420 420 420 420 4JO 410 420 420
-Le. tr.ieibeBij-2 - LLrfptrn- iteöu 1 20 100 100 100 20 20 20 20 20
Шереметьево 2 Зеленоград 50 240 250 2S0 150 1Ш 150 150 ISO
шереметьево-2 - цидд SO 200 320 340 270 290 50 50 50
Шереметьево-2 - ММК (A1Q71 SO 200 320 340 270 290 100 100 100
! иереметьево- J -t елнечыогаргк lüü 420 560 ьоо 560 600 430 430 430
Шереметьево l - Москва 200 580 580 5Ä0 580 580 580 580 580
Шереметьево 1 Шереметьево 2 20 20 20 20 20 20 20 20 20
Шереметьево 1 Зеленоград SO 200 250 2.SO 160 ieo ISO 150 150
Шереметьева-! - ЦП АД 50 240 450 480 320 340 ISO 180 180
Шереметьево 1 ММК (А107> SO 240 450 4&0 370 400 ISO 180 ISO
Шереметьево 1 - Сслчечногорск 300 470 790 850 790 850 420 420 420
Рисунок 2. Фрагмент тарифной сетки проезда по трассе М-11 от МКАД до Солнечногорска [2].
Рисунок 3. Фрагмент тарифной сетки проезда по трассе Северный обход Одинцова [3].
Также необходимо определить правила применения собственных и интероперабельных (функционально-совместимых, интероперабельность -услуга, при которой пользователь одного транспондера может безостановочно
проезжать по платным дорогам, эксплуатируемым различными операторами -участниками системы межоператорского взаимодействия [5]) транспондеров других эмитентов на каждой дороге. Так, например, на Северном обходе Одинцова скидка за проезд по транспондеру применяется только при использовании транспондера «Главная дорога», в случае же использования транспондеров других эмитентов стоимость проезда равняется стоимости проезда без транспондера. А на трассах М-1 «Беларусь», М-12 «Восток», М-4 «Дон», МСД, ЦКАД скидка за оплату проезда с использованием транспондера применяется как при использовании транспондера оператора концессионера, так и других операторов.
Всего в России существует 4 модели транспондеров, эмитируемых ООО «ОССП» - транспондер «М11 15-58» [6], ООО «Автодор - Платные дороги» -транспондер «Т-раББ» [7], ООО «Магистраль северной столицы» - транспондер «ЗСД» [8], АО «Новое качество дорог» - транспондер «Главная дорога» [9].
Для оптимизации количества строк в дата-сете и улучшения дальнейшего пользовательского опыта было принято решение группировать промежутки с одинаковой ценой внутри одной зоны для каждого типа транспортного средства.
Таким образом, если мы посмотрим на подгруппу 1 тарифной группы 1, то можно увидеть, что в рабочие дни стоимость проезда в промежутке с 05:00 до 07:00, с 07:00 до 13:00, с 13:00 до 16:00, с 16:00 до 22:00, с 22:00 до 01:00 -неизменна и составляет 350 рублей. Соответственно, для оптимизации проводится группировка, и вместо 5 строк - на каждый временной интервал - в дата-сете получается 1 строка «Рабочий день, с 05:00 до 01:00 - 350 рублей», что также согласуется с ценой проезда в выходной день, благодаря этому вместо 6 временных промежутков на каждый рабочий день (5 уже перечисленных + ночной с 01:00 до 05:00) и 2 временных на каждый выходной/праздничный день (в сумме получается 6 * 5 + 2 * 2 = 34 промежутка для одной подгруппы одного участка пути) мы получаем 2 временных промежутка на каждый рабочий день и 2 временных промежутка на каждый выходной/праздничный день (в сумме
получается 2 * 7 = 14 промежутков для одной подгруппы одного участка пути) -что дает уменьшение количества строк в 2.4 раза.
При экстраполировании данного количества строк на все подгруппы в каждой группе внутри данной зоны (так как внутри одной зоны мы можем гарантировать однородность заполнения) мы получаем 34 (промежутка) * 4 (подгруппы) * 4 (тарифные группы) = 544 строки с учетом одного типа транспондера (или его отсутствием). При наличии в дата-сете строки тарифа на каждый тип транспондера, а также на тариф проезда без транспондера (базовый тариф), получается 544 (строки) * 5 (вариаций тарифов с транспондером и без) = 2720 строк.
Еще один вариант оптимизации - группировка по направлениям движения (из/в Москву, по/против часовой стрелки). На большинстве автомобильных дорог цена проезда по участку не меняется в зависимости от направления движения, поэтому смысла в таком дифференцировании на каждой дороге нет. Но при этом необходимо учитывать направление движения на трассах М-11 «Нева» и Северном обходе Одинцова, так как там есть разница в стоимости проезда в зависимости от направления.
Рисунок 4. Карта ЦКАД.
Отдельно стоит рассмотреть участок ЦКАД от ПК-5 до М-10 «Россия» (рисунок 4). Особенность его состоит в том, что при движении от М-10 «Россия» до ПК-5 против часовой стрелки или от ПК-5 до М-10 «Россия» по часовой стрелке - проезд по трассе бесплатный.
ЦКАД поделен на 15 участков (с учетом вышеупомянутого ПК-5 - М-10 «Россия»), соответственно, на 14 из них вместо дифференцирования по/против часовой стрелки использовать вариант «Все направления» (по аналогии с трассами М-1 «Беларусь», М-4 «Дон», МСД, М-12 «Восток», проспект Багратиона), это также позволить оптимизировать количество строк в дата-сете.
Отдельное внимание стоит уделить строкам с тарифами на МСД. Так как дата-сет формируется в первую очередь для жителей Москвы и Московской области, то данные внутри нашего массива сфокусированы именно на них. На данный момент (июль 2024 года) проезд по МСД для автомобилей с номерами Москвы (коды региона 77, 97, 99, 177, 197, 199, 777, 797, 799, 977) и Московской области (коды региона 50, 90, 150, 190, 550, 750, 790), в соответствии с этим стоимость проезда в дата-сете приравнивается к нулю. Это позволит в будущем, в случае изменения правил тарификации, быстро изменить стоимость проезда без изменения остальной структуры таблицы.
Для изучения важности признаков были проведены обучения трех моделей - Gradient Boosting, Random Forest и линейной регрессии. По показаниям метрик R2 и MSE наилучшие результаты дал Random Forest (MSE: 7035.173541250366, R2: 0.9843198403015805). Среди всех признаков выделяется как наиболее значимые данные признаки: зона действия тарифа - столбец zone, направление движения - столбец direction, тип автомобиля - столбец car_type (рисунок 5, 6).
Важность признаков в модели Random Forest
car_type time_start time_end
s s:
g road
s
û.
tra nspo nder_ty pe day_of_week
transponder moscow_plate
0.0 0.1 0.2 0.3 0.4 0.5
Важность признака
Рисунок 5. Важность признаков в модели Random Forest.
Feature Importance
ъ zone 0. . 546498
18 direction 0. .173361
4 car_type 0. . 151656
2 timestart 0. .037727
3 timeend 0. .022135
0 road 0. .021977
7 transpondertype 0. .019886
1 dayofweek 0. .011678
8 tariff 0. .005121
6 transponder 0. .005008
9 ■05C0w_plate 0. .004953
Рисунок 6. Оценка важности признаков в модели Random Forest.
Как итог, с помощью проведенной выше аналитики были выявлены наиболее важные признаки для выведения итоговой цены на определенный участок платной дороги, а так же была собрана и оптимизирована единая база данных с тарифами, посредством SQL-запросов к которой, указав все необходимые важные признаки, такие как день и время проезда, класс автомобиля, наличие транспондера и его тип, возможно комбинировать участки различных дорог и рассчитывать итоговую стоимость.
СПИСОК ЛИТЕРАТУРЫ:
1. Тарифы на проезд по платным дорогам // Автодор - платные дороги URL: https://avtodor-tr.ru/road/tariffs/ (дата обращения: 10.07.2024);
2. Тарифы // М11 «Нева» URL: https://m11-neva.ru/rate/ (дата обращения: 10.07.2024);
3. Стоимость проезда на проспекте Багратиона и Северном обходе Одинцова // Главная Дорога URL: https://m-road.ru/tariffs/ (дата обращения: 10.07.2024);
4. Московский скоростной диаметр // МСД URL: https://msd.mos.ru/ (дата обращения: 10.07.2024);
5. Интероперабельность // Автодор - платные дороги URL: https://avtodor-tr.ru/transponder/interoperability/ (дата обращения: 10.07.2024);
6. Транспондер // М-11 «Нева» URL: https://m11-neva.ru/transponder/ (дата обращения: 10.07.2024);
7. О транспондере // Автодор - платные дороги URL: https://avtodor-tr.ru/transponder/about/ (дата обращения: 10.07.2024);
8. Транспондер // Магистраль северной столицы https://nch-spb.com/transponder/ (дата обращения: 10.07.2024);
9. Транспондер // Главная дорога URL: https://m-road.ru/transponder/ (дата обращения: 10.07.2024);
10. Платные дороги // Автодор - платные дороги URL: https://avtodor-tr.ru/road/ (дата обращения: 10.07.2024);
11. Оплата платных дорог // Главная // Дополнительно // Московский паркинг URL: https://parking.mos.ru/extra/oplata-msd/ (дата обращения: 10.07.2024)
Karpova A.A., Romenko E.D.
Karpova A.A.
Russian University of Transport (MIIT) (Moscow, Russia)
Romenko E.D.
Russian University of Transport (MIIT) (Moscow, Russia)
GENERAL ANALYSIS AND ANALYTICAL MODEL FOR CALCULATING THE COST OF TRAVEL ON TOLL ROADS OF THE MOSCOW REGION
Abstract: currently, the Russian Federation is experiencing active development of road activities. One of the aspects of this development, in accordance with Federal Law 157, is the formation of toll roads. Two large types of such roads can be distinguished: intracity highways and federal highways. The construction and management of toll highways is carried out by different concessionaire companies, which leads to differences in tariffs and methods of their calculation. Tariff information is often stored in different sources, which creates significant difficulties for motorists when planning routes that pass through several toll sections belonging to different operators. In this regard, there is a need to create a unified tool that will simplify the process of calculating the cost of travel for road users. This article proposes the development of an analytical model for a service for calculating the cost of travel on toll roads in Moscow, which integrates data on tariffs from various concessionaires and provides users with the ability to quickly estimate the total cost of travel on several toll roads. Such a service will not only simplify route planning, but also increase the transparency of the tariff policy, which will contribute to a more comfortable use of toll roads.
Keywords: toll roads, analytical system, data analysis, tariffs, cost of travel, geodata.