Intellectual Technologies on Transport. 2015. No 4
Оценка параметров модели транспортных корреспонденций по данным сотовых операторов
Теселкин А. А., Теселкина К. В. Новосибирский государственный технический университет (НГТУ) Новосибирск, Россия [email protected]
Аннотация. Рассматриваются вопросы оптимальной статистической оценки матрицы транспортных корреспонденций с использованием гравитационного метода. Предлагается итерационный метод оценки параметров гравитационной модели на основе наблюдаемых корреспонденций. Разработанный метод исследуется на модели транспортной сети г. Новосибирска. Исходные данные о корреспонденциях базируются на информации, предоставленной сотовыми операторами. Сравниваются различные функции предпочтения гравитационной модели.
Ключевые слова: матрица корреспонденции, гравитационный метод, метод наименьших квадратов, нелинейное оценивание, транспортная модель, функции предпочтения, группированные данные.
Введение
В реалиях нынешнего дня стратегическое управление транспортным комплексом крупных городов и агломераций становится все более сложной задачей. Это вызвано не только ростом количества транспорта, развитием транспортной сети и связанной с ней инфраструктуры, но и возросшим уровнем качества транспортного обслуживания населения. Из-за этого разработка эффективной системы стратегического управления транспортным комплексом является приоритетной задачей для многих мегаполисов России. Ее создание невозможно без математической модели транспортной системы, которую необходимо точно идентифицировать.
Ключевой характеристикой модели транспортной системы является матрица корреспонденции, которая отражает общее число человек, переместившихся из одной точки транспортной сети в другую за определенное время. Известными в литературе методами построения таких матриц являются гравитационные и энтропийные методы [1, 2], которые предполагают использование априорной информации об объемах транспортного потока на основе социально-экономической статистики [3] и отличаются от статистических методов восстановления матриц [4, 5]. Наиболее распространен гравитационный метод [6], представленный в большинстве современных транспортных моделей.
В данной работе основное внимание уделено проблеме оценки параметров гравитационной модели на основе объективных наблюдаемых данных, в частности, информации от сотовых операторов.
Гравитационная модель
МАТРИЦЫ КОРРЕСПОНДЕНЦИИ
Гравитационная модель оценки корреспонденций является аналогом физического закона всемирного тяготения: все тела притягиваются друг к другу с силой, прямо пропорциональной произведению масс этих тел и обратно пропорциональной квадрату расстояния между ними. В случае транспортной сети аналогом тел выступают транспортные районы [7], порождающие/поглощающие потоки, за массу тела принимается суммарный объем выезжающего/въезжаю-щего потока, в качестве расстояния взяты затраты на проезд (например, временные). Обозначим р„ как размер корреспонденции из i-го в j-й район и запишем гравитационную модель для оценки транспортных корреспонденций [7]:
Pj = к ■ si ■ dj ■ f(u j X (1)
где s — общий объем выезжающих из транспортного района i; d- общий объем въезжающих в транспортный район j; Uy - удельные затраты на передвижение из i в j; к > 0 - калибровочный коэффициент. При этом f (u. ) есть функция «предпочтения», зависящая от затрат. Также требуется учесть следующие ограничения:
П
Е pij = si;
j=1
Ер. = dy; (2)
i =1
Pij > °.
Уравнения считаются системой только тогда, когда суммарные объемы по выезду и въезду равны:
X Si = X dj. (3)
i j
Поскольку Vi, j величины si, dj определяются априорными данными, то для построения адекватной матрицы корреспонденции необходимо правильно выбрать функцию f (Uj). Выбор этой функции можно разделить на два этапа. На первом необходимо определить вид функции, на втором -идентифицировать ее параметры.
Интеллектуальные технологии на транспорте. 2015. № 4
10
Intellectual Technologies on Transport. 2015. No 4
В общем, в качестве функции предпочтения f может быть выбрана любая функция, удовлетворяющая следующим условиям [8]:
1) f неотрицательно определена для всех неотрицательных значений аргумента;
2) lim f U) = 0;
uij
3) на всей области определения f (и j) < 1.
Далее приведем некоторые основные функции предпочтения, которые применяются в большинстве мировых программных комплексов [9, 10], используемых для решения задач построения равновесных моделей. Параметры этих функций 9 = (01,02,..., ) далее обозначены латинскими
буквами a,b,c,..:
1) Logit-функция
f (Uij) = e'Uij; (4)
2) функция Кирхгоффа
f (uij) = Uijb; (5)
3) функция Box-Cox
j-1
c—---
f (uij) = e b ; (6)
4) комбинированная функция
f (Uij ) = a • Ujb • ecuj. (7)
Первые две функции являются частными случаями комбинированной функции. Их применяют на практике только для получения некоего начального варианта матрицы корреспонденций в отсутствие необходимой исходной информации.
Очевидным недостатком функции Box-Cox является условие монотонного убывания на всей области определения. Это означает, что функция предпочтения принимает максимальное значение при затратах, равных нулю.
Комбинированная функция наиболее точно описывает распределение корреспонденций в зависимости от времен-нь1х затрат, что будет показано ниже. Данный факт обусловлен тем, что в крупных городах наиболее часты поездки с ненулевыми затратами, соответственно, функция предпочтения имеет экстремум в ненулевой точке.
Метод оценки параметров
ГРАВИТАЦИОННОЙ МОДЕЛИ
Оцениваются параметры функции предпочтения. Согласно следующей формуле, вытекающей из формулы (1), для каждой корреспонденции вычисляются значения gj:
*>=f (Uj>=трт. ■ (8)
1 J
где
n
si = X Pij;
dj =±Pj.
j=1
Для исследования стоит брать лишь те gj, для которых si >> n и dj >> n . В противном случае распределение корреспонденций будет статистически незначимо.
Можно считать, что gj зависят от и^. Все пары значений (gj, Uj) образуют точечную выборку. Поскольку затраты на передвижение между точками неотрицательны и конечны, разобьем [0, Umax ] на m равновеликих интервалов р = {[щ,щ+1]|l = 0,...,m-1}. Тогда Vi,j сгруппируем выборку по интервалам р. Вопросы оптимального группирования в данной статье не рассматриваются. Группированные данные заносятся в табл. 1.
Таблица 1
Пример результата обработки матриц
Интервал р Gk = £ gj U £Pk Доля G от максимума, G
Начало Конец Середина (щ )
0 10 5 0,04325896 0,447
10 20 15 0,0087757 0,091
Доля G от максимального числа вычисляется простым соотношением
Gk =—G—
max(Gk)
k
(9)
Gk были нормированы, чтобы привести их в соответствие функции предпочтения f, которая, как было сказано выше, меньше либо равна 1 на всей области определения.
Тогда вектор параметров гравитационной модели 9 = (01,02,...,9n) можно оценить по сгруппированным данным по методу наименьших квадратов (МНК для нелинейной регрессии):
Исходными данными к предлагаемому методу является некоторая выборка р1, р2,..., pn наблюдений за размером корреспонденции. Поскольку корреспонденция осуществляется между двумя точками, обозначим элементы выборки как Pij; i, j =1,...,n. Pj может быть образована лишь некоторой репрезентативной выборкой, а не всей генеральной совокупностью поездок. Будем считать, что для каждой рассматриваемой корреспонденции известны априорные затраты на передвижение между точками и^ (могут быть рассчитаны на основе предварительной модели транспортной системы).
||Gk - f (Uk^ ^ min. (10)
В качестве Uij перед первым шагом необходимо выбрать некоторое исходное приближение, которое соответствует затратам при начальном наборе параметров. Интервалы выбирают в зависимости от количества полученных данных и временных затрат между районами. Таким образом, итерационный процесс оценки параметров выглядит так:
1) для всех пар районов Vi, j и i Ф j вычисляют значения gij;
Интеллектуальные технологии на транспорте. 2015. № 4
11
Intellectual Technologies on Transport. 2015. No 4
2) выбирают начальное приближение вектора параметров
е = е(0);
3) для набора параметров е( q) вычисляют матрицу корреспонденций в соответствии с выбранной функцией предпочтения, а затем перераспределяют на сеть с помощью некоторой процедуры (например, обучающей [9]). Для полученного распределения потоков рассчитывают затраты Uj;
4) группируют данные по выбранным интервалам. Вычисляют Gк;
5) вектор параметров е(q) оценивают по методу наименьших квадратов (10);
це( ?) _ e(q-1) и
6) если -—р——- < е , где q - шаг итерации, а е - наперед заданное маленькое число, то выход из итерационного процесса, иначе переход на шаг 3.
ИСХОДНЫЕ ДАННЫЕ
Исследование проводили на сети г. Новосибирска. Вся транспортная сеть была разделена на 397 транспортных районов [11], т. е. размерность оцениваемых матриц корреспонденций равна 397 на 397. Распределение транспортных потоков рассчитывали в комплексной транспортной модели г. Новосибирска, созданной в программном комплексе PTV Vision Visum.
Выборка, состоящая из объемов корреспонденций между районами, получена на основе исходных данных, предоставленных сотовыми операторами и описанных ниже.
Для некоторого периода наблюдения разбивали время наблюдения на интервалы T1, T2,..., TN. Сотовый оператор предоставил следующую выборку: номер абонента; в течение временного интервала Tk номер района, в котором абонент пробыл большую часть времени. Заметим, что интерес представляют только те наблюдения, в которых район абонента менялся (т. е. совершалась корреспонденция). Таким образом, если абонент в интервал времени Tk принадлежал району i,
а в интервал Tk+1 - району j, значит, в некий момент времени
[T T ]
[Tk , Tk+1 ] элемент матрицы корреспонденции Mj k’ k+1 J увеличился на единицу. Таким образом, после обработки выборки всех абонентов можно получить множество матриц корреспонденций для каждого момента времени [Tk , Tk+1].
Для исследования были выбраны утренние часы пик с
7.00 до 10.00. Общий объем выборки (количество абонентов) составил 200 000 абонентов. Для данной работы взят временной интервал для группирования данных 10 мин.
Исследование оценки параметров модели
Исследование проводили только для комбинированной функции предпочтения (7) и функции Box-Cox (6). Функции (4) и (5) не рассматривали, так как они являются частными случаями комбинированной функции. Стоит отметить, что для перераспределения матриц корреспонденции на транспортную сеть использовали обучающую процедуру программного комплекса PTV Vision Visum [9], для оценки параметров гравитационной модели - программный пакет SPSS компании IBM [12]. Всё остальное исследование проводили на разработанном авторами ПО [13].
По оси абцисс отложены значения затрат йк, по оси ординат - значения Gк. Красным цветом на рисунках отмечена аппроксимация комбинированной функции, зеленым - аппроксимация Box-Cox; фиолетовым - значения Gк. В качестве критерия близости функции к измеренным значениям использовали скорректированный коэффициент детерминации Radj [14]. Результат оценки параметров на первой итерации представлен на рис. 1 и в табл. 2.
Ш Комб. A Box-Cox К Оист Рис. 1. Оценка функции предпочтения на первой итерации
Таблица 2
Значения группированных данных на первой итерации
щ Gk
5 0,796210
15 1
25 0,687598
35 0,487424
45 0,341071
55 0,220324
65 0,143156
75 0,085177
85 0,042535
95 0,023692
105 0,010749
115 0,004612
125 0,002117
135 0,000967
145 0,000267
155 0,000222
Для комбинированной функции: a = 0,307;
Интеллектуальные технологии на транспорте. 2015. № 4
12
Intellectual Technologies on Transport. 2015. No 4
b = 0,83; c = -0,071;
R]dj = 0,994
Для функции Box-Cox:
b = 1,498; c = -0,006;
RldJ = 0,965.
Таким образом, на первой итерации немного предпочтительнее комбинированная функция с оцененными параметрами. Далее было проведено 23 итерации. На рис. 2 и в табл. 3 приведены результаты последней итерации.
И Комб. л Box-Cox 1 1 g2 Рис. 2. Оценка функции предпочтения на последней итерации
Для комбинированной функции:
а = 0,176; b = 0,893; c = -0,05;
^ = 0,957
Для функции Box-Cox:
b = 0,87; c = -0,03;
^ = 0,595.
Полученные результаты позволяют сделать вывод, что комбинированная функция точнее описывает параметры модели по собранным наблюдениям.
Для корректной оценки параметров необходима репрезентативная выборка наблюдаемых корреспонденций для каждого транспортного района города. Также важен адекватный набор параметров на нулевом шаге, в противном случае количество итераций может быть велико.
Заключение
Были исследованы различные виды функции предпочтения гравитационной модели. Оценены параметры этих
Таблица 3
Значения группированных данных на последней итерации
uk Gk
5 0,370654
15 1
25 0,995466
35 0,792444
45 0,549566
55 0,430661
65 0,356619
75 0,232622
85 0,181297
95 0,167158
105 0,152223
115 0,122436
125 0,080007
135 0,059730
145 0,041242
155 0,036322
функций на основе данных, предоставленных сотовыми операторами. Новый метод оценки параметров был протестирован на существующей сети г. Новосибирска.
Литература
1. Гасников А. В. Введение в математическое моделирование транспортных потоков : учеб. пособие / А. В. Гасников,
С. Л. Кленов, Е. А. Нурминский и др. ; под ред. А. В. Гасни-кова. - М. : МФТИ, 2010. - 360 с.
2. Вильсон А. Дж. Энтропийные методы моделирования сложных систем / А. Дж. Вильсон. - М. : Наука, 1978. -248 с.
3. Ortuzar J. D. Modeling Transport / J. D. Ortuzar, L. G. Wil-lumsen. - John Wiley & Sons Ltd, 2001. - 594 p.
4. Хабаров В. И. Марковская модель транспортных корреспонденций / В. И. Хабаров, Д. О. Молодцов, С. В. Хомяков // Доклады ТУСУР. - 2012. - № 1, ч. 1. - С. 113-117.
5. Хабаров В. И. Планирование экспериментов для оценки матрицы транспортных корреспонденций / В. И. Хабаров, А. А. Теселкин, К. П. Косолапов // Докл. АН ВШ РФ. -2015. - № 3 (28). - C. 109-116.
6. Васильева Е. М. Нелинейные транспортные задачи на сетях / Е. М. Васильева, Б. Ю. Левит, В. Н. Лившиц. - М. : Финансы и статистика, 1981. - 104 с.
7. Швецов В. И. Математическое моделирование транспортных потоков / В. И. Швецов // Автоматика и телемеханика. - 2003. - № 11. - С. 3-46.
8. Якимов М. Р. Транспортное планирование: создание транспортных моделей городов : моногр. / М. Р. Якимов. -М. : Логос, 2013. - 188 с.
Интеллектуальные технологии на транспорте. 2015. № 4
13
Intellectual Technologies on Transport. 2015. No 4
9. VISUM 11.0 Основы : Руководство пользователя. -СПб. : Изд-во политехнич. ун-та, 2010. - 858 с.
10. Якимов М. Р. Транспортное планирование: практические рекомендации по созданию транспортных моделей городов в программном комплексе PTV Vision® VISUM : моногр. / М. Р. Якимов, Ю. А. Попов. - М. : Логос, 2014. -200 с.
11. Теселкин А. А. Методы восстановления матриц корреспонденций по данным натурных обследований / А. А. Те-селкин, В. И. Хабаров // Политранспортные системы : материалы VIII Междунар. науч.-техн. конф. в рамках года науки Россия - ЕС. - Новосибирск, 2015. - С. 418-423.
12. Бююль А. SPSS : Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей / А. Бююль, П. Цёфель ; пер. с нем. - СПб. : ДиаСофтЮП, 2005. - 608 с.
13. Еремин С. В. Интеллектуальная система для стратегического управления пассажирским комплексом Красноярска и агломерации / С. В. Еремин, А. А. Теселкин, К. В. Хабарова, В. И. Хабаров // Бюл. транспортной информации. - 2013. -№ 2 (212). - С. 9-13.
14. Электронный учебник по статистике. - М. : StatSoft,
2012. - URL : http://www.statsoft.ru/home/textbook/default.htm (дата обращения 10.10.2015).
Интеллектуальные технологии на транспорте. 2015. № 4
14